Tutorial ATHEN: Unterschied zwischen den Versionen
Kinner (Diskussion | Beiträge) (Änderung 3782 von Kinner (Diskussion) rückgängig gemacht.) |
Kinner (Diskussion | Beiträge) |
||
Zeile 31: | Zeile 31: | ||
</div> | </div> | ||
+ | {{Sprachauswahl|Tutorial_ATHEN (en)|Usage of the annotation editor ATHEN}} |
Version vom 24. August 2017, 11:42 Uhr
Tutorial zur Verwendung des Auszeichnungseditors ATHEN
Im Rahmen von KALLIMACHOS wurde für die Teilgruppe Leserlenkung im Bezug auf Romanfiguren ein eigener Auszeichnungseditor entworfen. Unter dem Namen ATHEN (Annotation and Text Highlighting Environment) entstand eine Desktopanwendung, basierend auf Eclipse RCP 4 und Apache UIMA. Ein ausführliches Tutorial sowie den Zugang zum Sourcecode und zur Anwendung finden Sie hier.

ATHEN besticht insbesondere durch die Skalierbarkeit auf Romangröße sowie dadurch, dass beliebige Analysis-Engines zur Laufzeit dem Programm hinzugefügt werden können, womit der eigentliche Annotationsprozess einem Verbessern von automatisch generierten Vorschlägen entspricht. ATHEN ermöglicht es dem Benutzer, sein eigenes Annotationsschema in Form eines UIMA-Typsystems zu definieren und danach zu annotieren. Alternativ kann das Schema auch in OWL entworfen und genutzt werden.
ATHEN besitzt neben dem Annotieren von textuellen Dokumenten noch weitere Features:
- OWL-Support zum Erstellen und Annotieren von Ontologien
- Apache Lucene-Support, um effizient Suchanfragen über zuvor erstellte Annotationen (egal ob manuell oder automatisch) zu beantworten.
- Die Erstellung von Figurennetzwerken
- Das Annotieren von Bilddaten durch spezielle Annotationen in Apache UIMA
- Die Möglichkeit Annotationen (etwa mehrerer Annotatoren) gegenüber zu stellen, mit automatischer Anzeige der Übereinstimmung.
- Eine vollständige Unterstützung des Prozessmodells medizinischer, ontologiebasierter Informationsextraktion.
- Konfigurierbare, automatische Vorverarbeitung und Anwendung UIMA basierter Analysis Engines
- Das Konvertieren zwischen verschiedenen Formaten
- Eine Erweiterbarkeit, ohne den eigentlichen Code verändern zu müssen durch sein flexibles OSGI-Design
- Eine selbst konfigurierbare Oberfläche durch das Einstellen der sichtbaren Views.
Darüber hinaus unterstützt ATHEN in besonderer Weise das Annotieren folgender Vorhaben:
- Named Entities
- Koreferenzen
- Relationen
- Direkte Reden inklusive Sprecher und Angesprochener Entität
- Szenen
- Konstituenzgrammatiken
- Dependenzgrammatiken