[korpusne] Re: Korpus: Co chcemy anotowac ?

  • From: Dawid Weiss <dawid.weiss@xxxxxxxxxxxxxxxx>
  • To: korpusne@xxxxxxxxxxxxx
  • Date: Sat, 24 Sep 2005 11:59:28 +0200


4) Format anotacji:

Propozycja:

plik tekstowy, w ktorym kazdy wiersz odpowiada pojedynczej anotacji i zawiera 4 pola:

start_character
end_character
kategoria
ID

Czy to nie bedzie zbyt trudne (jesli dobrze rozumiem start_character i end_character to offsety w zrodlowym pliku tekstowym)? Ja tam bym byl za anotowaniem bezposrednio na zrodle. Np. w postaci osadzonego XMLa (ktory mozna zignorowac aby dostac wersje zrodlowa dokumentu). Ma to takze te zalete, ze po dodaniu DTD albo Schema ma sie podpowiedzi tagow i atrybutow (np. edytujac w JEdicie). Mysle o czyms takim:


<doc>
Na koncercie <person type="unnamed" id="lm">Leszka Mozdzera</person> w <facility type="institution">Akademii Muzycznej w Poznaniu</facility> pianista
bisowal szesciokrotnie. Trudno uznac <personref id="lm">jego</personref> koncert za nieudany.
</doc>


D.

Other related posts: