[freedict] Re: freedicts - REST and GraphQL APIs

  • From: Francisco Mondaca <f.mondaca@xxxxxxxxxxxx>
  • To: Sebastian Humenda <shumenda@xxxxxx>, freedict@xxxxxxxxxxxxx
  • Date: Thu, 14 Nov 2019 13:55:17 +0100

Hi Sebastian,


The setup that I would recommend would be to deploy Kosh with
docker.
We also have a container (https://github.com/cceh/kosh_sync) that
executes pull requests from a git repo at a certain time lapse. For
instance, we could set it up, to 'pull' each 24 hours from the main
git
repo.

FreeDict dictionaries are only partly in a Git, we need to find a
different
solution here. We've got a static API though from which you could
pull:

https://github.com/freedict/fd-dictionaries/wiki/FreeDict-API

I have not looked in detail how are the non-TEI dicts formatted. In the
case of 'pol-rus' the format is SLOB. I have not worked with it
previously. Probably the first step would be to create a list of the
freedicts and their format. And then plan how to transform them into
TEI. If it is in P5 or Lex-0 format is another question.



What other purposes other than word lookup would come to mind?

We use Kosh for our Sanskrit dictionaries encoded in TEI: 
https://cceh.github.io/c-salt_sanskrit_data/

What is the licence of this data?
I do not fully understand their encoding, but as far as I understand,
you have
Sanskrit-German and Sanskrit-English there. Do you think there is
achance we
could import these dictionary into FreeDict?


These dictionaries are of public domain. So you can do whatever you
want with them. The idea of hosting these dictionaries ourselves is to
have control of the corrections that are made to them as also not to do
double work. They are all digitized dictionaries, and most of the
errors are typos. We have Sanskrit experts working with us, so the idea
is to offer curated data. Users can propose modifications via GitHub
and these are accepted/rejected by our team. Just like with the fd-
dictionaries GitHub repo. While they could be probably more visible to
some people at the fd-dictionaries repo, I do not see any benefit of
hosting them twice. If you plan to have any dict of our collection as
basis to extend them with new entries, this is not a problem. But I do
not know if it makes that much sense. 

Best,

Francisco



-- 
FreeDict — Free And Open Dictionaries
Manage your subscription at //www.freelists.org/list/freedict
Wiki: https://github.com/freedict/fd-dictionaries/wiki
Web: http://freedict.org

Other related posts: