[Ilugc] [ANN] call for student foss fellows

  • From: mbchandar@xxxxxxxxx (balachandar muruganantham)
  • Date: Wed Jul 12 15:04:37 2006

hi

On 7/11/06, R Hariram Aatreya <rhariram@xxxxxxxxx> wrote:

hi Mugunth,

Just had a look at one of the centre's research project (I am not sure if
its world class).
http://au-kbc.org/research_areas/nlp/projects/sengine.html

This page talks about creating a search engine for tamil. Already google is
there and we can do searching using unicode tamil (or any other encoding -
but our google interface should be changed accordingly to show the encoding
correctly ). I find google does this job very effectively.
For example,
You please enter this tamil text ??????????? (just cut and paste) in your
google search and enter.
You will find more than 30K search results coming for thirukural !!!!


If the centre is planning to do something more efficient than google search
for tamil then we can appreciate it. In that case the project page should
atleast mention how its going to be better than existing google tamil text
search.

The USP of this search engine (Kazhugu) is the ability
to search content in 24 major encodings.
Tamil content on the web is in 50 different encodings.
(unicode being only a minor subset)
Google can search Unicode content only.


I read an article about a web search engine that is developed by IIIT
which searches indian languages content. probably u could see that in
economic times. i think developing kazhugu is reinventing?

take a look at it in todays economic times
also here is the link
http://search.iiit.ac.in/webkhoj/index.jsp

Or the centre can reuse opensoure Nutch project(
http://lucene.apache.org/nutch/) to produce a better tamil search.

Is there any projects/products of this centre released to the public use ?
if so can somebody give some pointers to it.

Watch out this list for announcements on releases.
Tamil Wordnet being one of them.

hari.


Regards,
Mugunth

_______________________________________________
To unsubscribe, email ilugc-request@xxxxxxxxxxxxx with
"unsubscribe <password> <address>"
in the subject or body of the message.
http://www.ae.iitm.ac.in/mailman/listinfo/ilugc





-- 
<name> balachandar muruganantham</name>
<Yahoo!> mbchandar</Yahoo!>
<Hotmail>  mbchandar</Hotmail>
<blog> http://www.balachandar.net/blog</blog>
<web>http://www.balachandar.net</web>
<talk> http://www.expertstalk.org</talk>
<shop>http://www.chennaishopping.com</shop>

Other related posts: