KallimachosEngines

Aus Kallimachos
Wechseln zu:Navigation, Suche

KallimachosEngines

Das Repositorium KallimachosEngines stellt eine Sammlung von NLP-Tools zur Verfügung, die im Rahmen des Projekts KALLIMACHOS entwickelt und erprpobt wurden. Diese Tools nutzen eine integrierte Apache UIMA analysis engine, um das Annotieren von Texten zu erleichtern bzw. überhaupt erst zu ermöglichen. Die im Rahmen von KALLIMCHOS entwickelten Komponenten können bei Bedarf über die Integration einer Typumwandlung mit DkPro-Core kompatibel gemacht werden.

Zu den im Repositorium enthaltenen Kompenenten gehört u.A. der DROC-Tagger für Named Entities (Eigennamen, Pronomen etc.). Dieser nutzt zur Analyse die Word Embedding features von über 160.000.000 Tokens aus deutschsprachigen Erzähltexten. Bis zum Ende der laufenden Projektförderzeit (3. Quartal 2017) werden noch weitere Komponenten dem Repositorum hinzugefügt.