Tutorial ATHEN: Unterschied zwischen den Versionen
Keine Bearbeitungszusammenfassung |
Keine Bearbeitungszusammenfassung |
||
| Zeile 1: | Zeile 1: | ||
<div class="notab"> | <div class="notab"> | ||
=Tutorial zur Verwendung des Auszeichnungseditors ATHEN= | =Tutorial zur Verwendung des Auszeichnungseditors ATHEN= | ||
Im Rahmen von KALLIMACHOS wurde für die Teilgruppe [[Romanfiguren:Main| Leserlenkung im Bezug auf Romanfiguren]] ein eigener Auszeichnungseditor entworfen. Unter dem Namen ATHEN ('''A'''nnotation and '''T'''ext '''H'''ighlighting '''En'''vironment) entstand eine Desktopanwendung, basierend auf Eclipse RCP 4 und Apache UIMA. Ein ausführliches Tutorial sowie den Zugang zum Sourcecode und zur Anwendung finden Sie '''[https://gitlab2.informatik.uni-wuerzburg.de/kallimachos/Athen hier]'''. | Im Rahmen von KALLIMACHOS wurde für die Teilgruppe '''[[Romanfiguren:Main| Leserlenkung im Bezug auf Romanfiguren]]''' ein eigener Auszeichnungseditor entworfen. Unter dem Namen ATHEN ('''A'''nnotation and '''T'''ext '''H'''ighlighting '''En'''vironment) entstand eine Desktopanwendung, basierend auf Eclipse RCP 4 und Apache UIMA. Ein ausführliches Tutorial sowie den Zugang zum Sourcecode und zur Anwendung finden Sie '''[https://gitlab2.informatik.uni-wuerzburg.de/kallimachos/Athen hier]'''. | ||
<br clear=all> | <br clear=all> | ||
[[File:ScreenshotsATHEN.png | 600px |center| link= | alt= Collage von Screenshots des Auszeichnungseditors ATHEN]] | [[File:ScreenshotsATHEN.png | 600px |center| link= | alt= Collage von Screenshots des Auszeichnungseditors ATHEN]] | ||
| Zeile 14: | Zeile 14: | ||
*Die Möglichkeit Annotationen (etwa mehrerer Annotatoren) gegenüber zu stellen, mit automatischer Anzeige der Übereinstimmung. | *Die Möglichkeit Annotationen (etwa mehrerer Annotatoren) gegenüber zu stellen, mit automatischer Anzeige der Übereinstimmung. | ||
*Eine vollständige Unterstützung des Prozessmodells medizinischer, ontologiebasierter Informationsextraktion. | *Eine vollständige Unterstützung des Prozessmodells medizinischer, ontologiebasierter Informationsextraktion. | ||
*Konfigurierbare, automatische Vorverarbeitung und Anwendung UIMA basierter Analysis Engines | *Konfigurierbare, automatische Vorverarbeitung und Anwendung UIMA-basierter Analysis Engines | ||
*Das Konvertieren zwischen verschiedenen Formaten | *Das Konvertieren zwischen verschiedenen Formaten | ||
*Eine Erweiterbarkeit, ohne den eigentlichen Code verändern zu müssen durch sein flexibles OSGI-Design | *Eine Erweiterbarkeit, ohne den eigentlichen Code verändern zu müssen durch sein flexibles OSGI-Design | ||
| Zeile 25: | Zeile 25: | ||
*Koreferenzen | *Koreferenzen | ||
*Relationen | *Relationen | ||
*Direkte Reden inklusive Sprecher und | *Direkte Reden inklusive Sprecher und angesprochener Entität | ||
*Szenen | *Szenen | ||
*Konstituenzgrammatiken | *Konstituenzgrammatiken | ||
Aktuelle Version vom 5. September 2017, 10:05 Uhr
Tutorial zur Verwendung des Auszeichnungseditors ATHEN
Im Rahmen von KALLIMACHOS wurde für die Teilgruppe Leserlenkung im Bezug auf Romanfiguren ein eigener Auszeichnungseditor entworfen. Unter dem Namen ATHEN (Annotation and Text Highlighting Environment) entstand eine Desktopanwendung, basierend auf Eclipse RCP 4 und Apache UIMA. Ein ausführliches Tutorial sowie den Zugang zum Sourcecode und zur Anwendung finden Sie hier.

ATHEN besticht insbesondere durch die Skalierbarkeit auf Romangröße sowie dadurch, dass beliebige Analysis-Engines zur Laufzeit dem Programm hinzugefügt werden können, womit der eigentliche Annotationsprozess einem Verbessern von automatisch generierten Vorschlägen entspricht. ATHEN ermöglicht es dem Benutzer, sein eigenes Annotationsschema in Form eines UIMA-Typsystems zu definieren und danach zu annotieren. Alternativ kann das Schema auch in OWL entworfen und genutzt werden.
ATHEN besitzt neben dem Annotieren von textuellen Dokumenten noch weitere Features:
- OWL-Support zum Erstellen und Annotieren von Ontologien
- Apache Lucene-Support, um effizient Suchanfragen über zuvor erstellte Annotationen (egal ob manuell oder automatisch) zu beantworten.
- Die Erstellung von Figurennetzwerken
- Das Annotieren von Bilddaten durch spezielle Annotationen in Apache UIMA
- Die Möglichkeit Annotationen (etwa mehrerer Annotatoren) gegenüber zu stellen, mit automatischer Anzeige der Übereinstimmung.
- Eine vollständige Unterstützung des Prozessmodells medizinischer, ontologiebasierter Informationsextraktion.
- Konfigurierbare, automatische Vorverarbeitung und Anwendung UIMA-basierter Analysis Engines
- Das Konvertieren zwischen verschiedenen Formaten
- Eine Erweiterbarkeit, ohne den eigentlichen Code verändern zu müssen durch sein flexibles OSGI-Design
- Eine selbst konfigurierbare Oberfläche durch das Einstellen der sichtbaren Views.
Darüber hinaus unterstützt ATHEN in besonderer Weise das Annotieren folgender Vorhaben:
- Named Entities
- Koreferenzen
- Relationen
- Direkte Reden inklusive Sprecher und angesprochener Entität
- Szenen
- Konstituenzgrammatiken
- Dependenzgrammatiken