[freedict] Re: AW: Re: New project: Dictionary German-Lithuanian/Lithuanian-German

  • From: Sebastian Humenda <shumenda@xxxxxx>
  • To: freedict@xxxxxxxxxxxxx
  • Date: Wed, 8 Jul 2020 22:53:14 +0200

Hi Alexandra,

thanks for this detailled information! I am sorry that my answered got
delayed.

We have a HOWTO at <https://de.wikipedia.org/wiki/Text_Encoding_Initiative>.
It might not be the ideal resource for you because of its technical
background,   therefore I will briefly summarise what some of the sections
discuss.
If you have any questions, please don't hesitate to ask. Also, if you find
that the HOWTO lacks information or is too technical, we would appreciate your
feedback!

We store our dictionaries in a format called TEI. TEI is a format readable by
both humans and machines and is a plain text format. That means you need a
capable text editor to write it, for instance, Notepad++ or Microsoft XML
Notepad <https://www.microsoft.com/en-us/download/details.aspx?id=7973> on
Windows (and many more). It will probably need some experimentation on your
side to find a tool that you like.

Before you dive in, you should figure out whether your dictionary sources can
be converted automatically from a text file into our dictionary format. Imagine 
this
simple word list:

buy,verb,kaufen
sell,verb,verkaufen
bread,noun,Brot

Though being very basic, it would be easy to write a script to convert it
automatically into our format. If you have less structured data, that is, if
you have data that cannot be interpreted by a machine as easy as the example
above, you might want to write the dictionary by hand. If you are unsure, it
would be good if you could provide us with examples.

It is helpful to read up the Wikipedia article about what the TEI format is, 
because it forms the basis for our dictionaries:
https://de.wikipedia.org/wiki/Text_Encoding_Initiative
If you are not familiar with XML, you might want to read a brief introduction
about this
first.
I know that this can  be overwelming, please let us know if any of these would
be already too technical and we find a different solution.

Our format is described on this page:

https://github.com/freedict/fd-dictionaries/wiki/FreeDict-HOWTO-%E2%80%93-Writing-Text-Encoding-Initiative-XML-Files

For the start, it would be enough to read the introductory section and proceed
with the TEI Body section. The examples should help you getting started. If
they don't, please come back to us.

Thanks!
Regards
Sebastian

Attachment: signature.asc
Description: PGP signature

Other related posts: