[freedict] Re: Fwd: a Tibetan verb dictionary I have written

  • From: Nathan Hill <nh36@xxxxxxxxxx>
  • To: freedict@xxxxxxxxxxxxx
  • Date: Fri, 14 Feb 2020 07:21:12 +0000

Dear Piotr,

My verb dictionary was created by hand using note cards between about 2000
and 2005. The point was to see what different morphological stems of the
Tibetan verbs are attested in the native Tibetan lexicographical tradition.
I typed up the notecards into an MS word file, but knew that I would want
to convert it to xml so tried to be careful with formatting consistency. I
used CLaRK to change it from .rtf to .xml while I was a researcher at
Universität Tübingen in 2005-6.

I also get a lot of rubbish if I try to open it in a text editor, but if
you open it in Open Office it works fine. I think that some of the formats
at the Github will maybe be better than the file I attached to my email.
Here is the Github link again--

https://github.com/tibetan-nlp/lexicon-of-tibetan-verb-stems

I am happy to license it in whatever license is most open. I thought I had
uploaded it to Zenodo, but it seems maybe I hadn't. Oh, I did! It is here,
but I think this is a stripped down version that includes only POS
categories with no definitions.

https://zenodo.org/record/574876

By the way, here is the digitized version of Das' 1902 Tibetan dictionary.
It needs a bit of cleanup to be made lovely.

https://raw.githubusercontent.com/nh36/soas-lexicons/patch-1/Das-dictionary

best,
Nathan




--
Dr Nathan W. Hill
Reader in Tibetan and Historical Linguistics
Research Coordinator, East Asian Languages and Cultures
UK Director, London Confucius Institute
SOAS, University of London
Thornhaugh Street, Russell Square, London WC1H 0XG, UK
Tel: +44 (0)20 7898 4512
Room 456
--
Profile -- http://www.soas.ac.uk/staff/staff46254.php
Tibetan Studies at SOAS -- http://www.soas.ac.uk/cia/tibetanstudies/
--


On Fri, Feb 14, 2020 at 1:54 AM Piotr Bański <bansp@xxxxx> wrote:

Dear Nathan,

This is big -- thank you very much!

Would you kindly specify the license under which you would like to place
the dictionary? Without a free license attached, we can't do much with a
dataset, because its legal status isn't clear -- in particular, it is
not clear that we are allowed to distribute it.

It would also be great to have a few sentences about how the dictionary
was created, if only to put them in the header (= description of /
introduction to the dictionary) for the interested users to understand
some lexicographic choices and possibly to be able to turn to you for
discussion.

Also, I found it curious that you have used the BulTreeBank/CLaRK to
create or at least render the dictionary -- was that a choice dictated
by e.g. a cooperation between SOAS and BTB, or a more or less random move?

I have tried to open the dictionary with my default XML editor, but it
was a bit of a disaster, the editor got totally confounded by
'non-standard' characters and long lines. I don't have any others handy
because I'm travelling with only a small notebook. At the same time, a
browser signalled to me that the XML is not fully well-formed. Hence my
question: does this dataset exist in a different form, which could be
more sympathetic to standard XML tools? Maybe we could (re)start there?

Thanks again for the generous donation and best wishes,

    Piotr

On 14/02/2020 00:59, Nathan Hill wrote:

Dear Colleagues,

I have just signed up to this list and don't really know what I am
doing. Anyhow, I am a technically inept person with a keen interest in
lexicography. I have myself compiled a Tibetan verb dictionary that I
would like to donate to you.

https://github.com/tibetan-nlp/lexicon-of-tibetan-verb-stems

It is already available in xml, but not in TEI. I attach it to this
message. I also have a digitized version of Sarat Chandra Das'
Tibetan-English dictionary, which is in the public domain.

best,
Nathan


--
Dr Nathan W. Hill
Reader in Tibetan and Historical Linguistics
Research Coordinator, East Asian Languages and Cultures
UK Director, London Confucius Institute
SOAS, University of London
Thornhaugh Street, Russell Square, London WC1H 0XG, UK
Tel: +44 (0)20 7898 4512
Room 456
--
Profile -- http://www.soas.ac.uk/staff/staff46254.php
Tibetan Studies at SOAS -- http://www.soas.ac.uk/cia/tibetanstudies/
--

--
FreeDict - Free And Open Dictionaries
Manage your subscription at https://www.freelists.org/list/freedict
Wiki: https://github.com/freedict/fd-dictionaries/wiki
Web: http://freedict.org


Other related posts: