[korpusne] Re: Standardy anotacji nazw wlasnych

  • From: Agata SAVARY <agata.savary@xxxxxxxxxxxxx>
  • To: korpusne@xxxxxxxxxxxxx
  • Date: Fri, 28 Oct 2005 09:53:41 +0200

Kuba,
Dzieki za odpowiedz.

Kilka osob na liscie (miedzy innymi ja) jest zainteresowanych automatycznym
rozpoznawaniem nazw wlasnych w tekstach, plus dodatkowo utozsamianiem
odwolan do tych samych obiektow, bytow, czy jak je tam zwa. Ogolnie
chodzi o ekstrakcje informacji. Maly korpusik moze byc wystarczajacy do
Z utozsamianiem odwolan do tych samych obiektow, to nie jestem ekspertem, ale ma to chyba, poza zaimkami, cos wspolnego z relacjami, np.:
"Amerykanie sa przeciwni. Waszyngton oznajmil wczoraj..."
Czy w tym przypadku chcesz utozsamiac "Amerykanow" z "Waszyngtonem", czy tez na razie byloby to zbyt ambitne ?


W pierwszej linii, powinnismy jednak stworzyc korpusik, z mozliwie prosta
anotacja, co do ktorej chyba juz prawie jestesmy zgodni, tzn. typ z Waszej
ontologi + podtyp, ktory bedzie powiedzdmy podobny do waszych, ale byc moze
zdecydowalbym, sie na jakies dodatkowe podkategorie o czym byla mowa w innych
mailach (Magdy bodajze) + kwestia deskryptorow.
Rozumiem i nie mam nic przeciwko.
Co do typow i nadtypow, to u nas nadtyp mozna automatycznie wydedukowac z typu, np. wszystkie organizacje sa antroponimami, ergonimami i toponimami jednoczesnie.


Co do reszty, to mimo wszelkich opisanych wczesniej watpliwosci, nadal jestem gotowa uzcestniczyc. Od czegos trzeba zaczac...

Pozdrawiam

Agata

Other related posts: