[sanniolug] lemmi (un po' OT)

  • From: Marco Baroni <baroni@xxxxxxxxxxxxxxx>
  • To: scuola@xxxxxxxxxxxxxx
  • Date: Wed, 13 Oct 2004 09:52:17 +0200

Ciao a tutti.

Un collega e io stiamo finendo un lemmario elettronico dell'italiano.

Un lemmario e' una lunga lista di forme flesse con lemma e tratti morfologici (centinaia di migliaia di forme). Per esempio:

cantano cantare VER:ind+pres+3+p
cantavo cantare VER:ind+imp+1+s
melanzana       melanzana       NOM:f+s
melanzane       melanzana       NOM:f+p
...

Una risorsa di questo genere e' utile in varie applicazioni di natural language processing (per esempio, traduzione automatica, estrazione automatica di keywords, eccetera). Per quello che ne sappiamo, i lemmari esistenti per l'italiano sono tutti chiusi/commerciali.

Avrei due domande:

1) Vogliamo rendere il lemmario disponibile usando una licenza tipo GPL. Tuttavia, il lemmario non e' ne' un programma (anche se verra' sempre utilizzato all'interno di programmi), ne' un documento nel senso in cui, non so, un romanzo e' un documento... Che licenza dobbiamo usare? Esiste una licenza per le ``risorse'' o qualcosa del genere?

2) Che voi sappiate, a progetti liberi tipo OO, ispell e simili potrebbe interessare il nostro lemmario, con le dovute modifiche? In tal caso, avete suggerimenti su chi contattare?

Molte grazie.

Saluti,

Marco


--- Marco Baroni University of Bologna http://sslmit.unibo.it/~baroni


Other related posts: