[freedict] Re: Case inflections, verb and adjective forms

  • From: Sebastian Humenda <shumenda@xxxxxx>
  • To: freedict@xxxxxxxxxxxxx
  • Date: Tue, 8 Sep 2020 17:07:34 +0200

Hi Piotr, Karl and others,

Piotr Bański schrieb am 08.09.2020, 15:10 +0200:

The advantages of what you suggest would be relatively obvious. A minor
disadvantage would be that Lex0 was created to handle "retrodigitized
dictionaries", as a kind of pivot format for which the various OCR tools and
human encoders could aim, and from which it would be straightforward to
continue the processing. That is why Lex0 forbids e.g. <pos> in favour of
<gram type="partOfSpeech"> -- to keep everything as generic as possible.

If the scope is really digitized dictionaries, I think this Lex0 is not the
right thing to go. Especially if it is in some respects less too generic.

What I think would be ideal for Freedict is a customization of another (but
related) standard, namely ISO LMF-4. However, the publicly available

documentation for that standard is not there yet, and I am not allowed to
[…]

Is there any chance that this will be public?

My reasoning is as follows: we haven't seen an update of our schemas for
around 10 years now. I personally find the ODD-approach of TEI, if this is
still used, a bit strange. Several attempts have been made to tighten or
improve the DTD's/RNG's, but since they are auto-generated from the ODD (I
hope I don't get this wrong), these attempts were not successful. If Lex0 has
a different scope than our dialect, we should not undergo the migration to it,
given our limited resources. If there is a different standard around or, if
you can confirm that there will be one in the foreseeable future, we should
should choose this one instead.
Regarding tooling: sure, we can certainly benefit from what other projects
use. But we always need customisations for our project and this will likely
not be handled by these tools. We would also need to update Pyglossary,
Tei2slob and our XSLT style sheets.

Thanks
Sebastian

Attachment: signature.asc
Description: PGP signature

Other related posts: