Tutorial ATHEN

Aus Kallimachos
Version vom 5. September 2017, 10:05 Uhr von Jonathan (Diskussion | Beiträge)

(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu:Navigation, Suche

Tutorial zur Verwendung des Auszeichnungseditors ATHEN

Im Rahmen von KALLIMACHOS wurde für die Teilgruppe Leserlenkung im Bezug auf Romanfiguren ein eigener Auszeichnungseditor entworfen. Unter dem Namen ATHEN (Annotation and Text Highlighting Environment) entstand eine Desktopanwendung, basierend auf Eclipse RCP 4 und Apache UIMA. Ein ausführliches Tutorial sowie den Zugang zum Sourcecode und zur Anwendung finden Sie hier.

 Collage von Screenshots des Auszeichnungseditors ATHEN


ATHEN besticht insbesondere durch die Skalierbarkeit auf Romangröße sowie dadurch, dass beliebige Analysis-Engines zur Laufzeit dem Programm hinzugefügt werden können, womit der eigentliche Annotationsprozess einem Verbessern von automatisch generierten Vorschlägen entspricht. ATHEN ermöglicht es dem Benutzer, sein eigenes Annotationsschema in Form eines UIMA-Typsystems zu definieren und danach zu annotieren. Alternativ kann das Schema auch in OWL entworfen und genutzt werden.

ATHEN besitzt neben dem Annotieren von textuellen Dokumenten noch weitere Features:

  • OWL-Support zum Erstellen und Annotieren von Ontologien
  • Apache Lucene-Support, um effizient Suchanfragen über zuvor erstellte Annotationen (egal ob manuell oder automatisch) zu beantworten.
  • Die Erstellung von Figurennetzwerken
  • Das Annotieren von Bilddaten durch spezielle Annotationen in Apache UIMA
  • Die Möglichkeit Annotationen (etwa mehrerer Annotatoren) gegenüber zu stellen, mit automatischer Anzeige der Übereinstimmung.
  • Eine vollständige Unterstützung des Prozessmodells medizinischer, ontologiebasierter Informationsextraktion.
  • Konfigurierbare, automatische Vorverarbeitung und Anwendung UIMA-basierter Analysis Engines
  • Das Konvertieren zwischen verschiedenen Formaten
  • Eine Erweiterbarkeit, ohne den eigentlichen Code verändern zu müssen durch sein flexibles OSGI-Design
  • Eine selbst konfigurierbare Oberfläche durch das Einstellen der sichtbaren Views.


Darüber hinaus unterstützt ATHEN in besonderer Weise das Annotieren folgender Vorhaben:

  • Named Entities
  • Koreferenzen
  • Relationen
  • Direkte Reden inklusive Sprecher und angesprochener Entität
  • Szenen
  • Konstituenzgrammatiken
  • Dependenzgrammatiken


Language: Union Jack  Flagge der BRD