[korpusne] Re: Standardy anotacji nazw wlasnych

  • From: Agata SAVARY <agata.savary@xxxxxxxxxxxxx>
  • To: korpusne@xxxxxxxxxxxxx
  • Date: Wed, 26 Oct 2005 18:15:12 +0200

To jeszcze raz ja, mala uwaga dodatkowa w odpowiedzi na mail Kuby,
Karola i Magdy.

No wiec ja poswiecilem sie tej lekturze i mam nastepujaca refleksje. Wasza
hierarchia typow pokrywa sie w duzym stopniu z tym co zrobil Sekine, z
Istotna roznica polega na tym, ze nasza ontologia jest zorientowana na
konstrukcje bazy danych. Z uwagi na to nie istnieja w niej typy o duzym
poziomie produktywnosci, ktore pojawiaja sie u Sekine, na przyklad
adresy, numery telefonow, emaile, id number. Poza tym hierarchia
Sekine'a jest jednak duzo szczegolowsza.

Poniewaz jednak rozpoznawanie dat i wyr. monetarnych w tekstach niekoniecznie nas interesuje
(jest to relatywnie proste)
Nie tak, jak by sie to moglo wydawac. Moj szef zrobil doktorat i kawalek
habilitacji na temat rozpoznawania dat. Ale oczywiscie mozna sie
ograniczyc do jakiegos ich podzbioru latwego do rozpoznawania.

Co do propozycji Karola to opis zagniezdzony w stylu:

<position>Dyrektor Generalny</position> <title>dr.</title>
<person><firstname>Jan</firstname> <surname>Kowalski<surname></person>

wydaje mi sie ciekawy, bo szkoda byloby rozpoznajac osobe nie rozpoznac
jednoczesnie imienia i nazwiska z osobna. To odpowiada tez na pytanie
Magdy o "chorobe Alzheimera".

Co do fleksji, to nie wiem czy chcemy zakladac, ze mamy do dyspozycji
narzedzia, ktore potrafia dana nazwe np. zlematyzowac. Na przyklad jesli
w tekscie wystapi

"Polskiej Akademii Nauk niewiele juz zadowala..." ;-)

to czy w systemie pytanie-odpowiedz bedziemy umieli powiedziec, ze
chodzi o instytucje o nazwie "Polska Akademia Nauk" a nie "Polska
Akademia Nauka". W zwiazku z tym, czy myslicie, ze nalezaloby anotowac
przypadek, liczbe i rodzaj dla kazdego czlonu, zeby potem systemy uczace
mogly z tego korzystac, czy tez zakladamy, ze systemy te skadinad beda
wiedziec...?

Co do EuroVoca, to jego zawartosc jest interesujaca, ale nazw wlasnych malo i malo dla nich typow, np. jedyne nazwy geograficzne to panstwa i jednostki podzialu administracyjnego. Chyba, ze cos zle rozumiem.

Jak przeczytalam inne odnosniki nadeslane przez Magde (Getty Thesaurus itd.), znowu byle tego strasznie duzo, troche glowa od tego peka, wiec przekazuje paleczke ;-)

Pozdrawiam

Agata

Other related posts: