[Ilugc] Webpage layout analyzer

  • From: jaganadhg@xxxxxxxxx (JAGANADH G)
  • Date: Fri Mar 19 09:59:53 2010

On Fri, Mar 19, 2010 at 9:53 AM, Shrinivasan T <tshrinivasan@xxxxxxxxx>wrote:

Hi,


Is there any webpage layout detection tool available in FOSS !!

What do you mean by this?



A web page will be having left pane, right pane etc.. . As like a wiki pedia
article page. I have to extract the article only . Not the content from left
pane etc. I downloaded the Tamil wikipedia html dump and some blog pages. I
have to extract content from this .

-- 
**********************************
JAGANADH G
http://jaganadhg.freeflux.net/blog

Other related posts: