Hallo! In bin/korpus2db.py war ein Fehler, der dazu fuehrte, dass bestimmte Token auf der englischen Seite mit falschem Tagset in die Datenbank eingetragen wurden. Der Bug betrifft nur englische Token, die im Deutschen den gleichen Wort-POS-Lemma String haben, also z.B. ".\tSATZ-P\t.". Alle im Projekt entwickelten KoKS-Komponenten sind, soweit ich das ueberblicke, nicht betroffen. Sobald ich den neuen Hilfsindex align/DatabaseAPI/sindex.py, der auf korrekte tagset-IDs angewiesen ist, in KoKS integriert habe, baue ich eine neue Datenbank auf. Viele Gruesse, Joachim