Projektbeschreibung: Unterschied zwischen den Versionen
Aus Kallimachos
Keine Bearbeitungszusammenfassung |
|||
| Zeile 16: | Zeile 16: | ||
==OCR-Modul== | ==OCR-Modul== | ||
Das Modul soll eine automatisierte Vorverarbeitung für die Volltexterstellung bieten. Auf der Grundlage der Arbeiten und Softwarebausteine des DFKI wird die Arbeit im Projekt aus folgenden Schritten bestehen: | Das Modul soll eine automatisierte Vorverarbeitung für die Volltexterstellung bieten. Auf der Grundlage der Arbeiten und Softwarebausteine des DFKI wird die Arbeit im Projekt aus folgenden Schritten bestehen: | ||
| Zeile 24: | Zeile 23: | ||
*Weiterentwicklung der nichtparametrischen Methoden für die Bildvorverarbeitung, Layoutanalyse und Sprachmodellierung. | *Weiterentwicklung der nichtparametrischen Methoden für die Bildvorverarbeitung, Layoutanalyse und Sprachmodellierung. | ||
==Modul Synoptischer Editor== | |||
Unter Fortentwicklung einer bereits als Präsentationswerkzeug in der Virtuellen Bibliothek Würzburg bzw. Franconica Online in mehreren Projekten erprobten Dreifachlupe mit synchronisierten, zoombaren Bildstreifen für Scan, Transkription und Übersetzung werden Komponenten des CK-Editors eingebaut, der mit Plugin Version 4.1.1 nun XML-Unterstützung bietet. Die entsprechend erweiterte WÜsyphus-Dreifachlupe wird so angepasst, dass sie ebenso wie der CK-basierte XML-Editor auch in der TextGrid-Weboberfläche verwendet werden kann: Neben den deutlich mächtigeren TextGrid-XML-Editor für den Spezialanwender tritt damit ein intuitives Web-Editionswerkzeug, das voraussetzungsloser eine manuelle Nachkorrektur der Resultate des automatischen Bildanalyse- und OCR-Moduls formatkonform ermöglicht. Damit wird u.a. die Einbeziehung von Hilfskräften in Editionsprojekte erleichtert. | |||
Wiki-Modul | |||
== Wiki-Systeme== | |||
In ähnlicher Perspektive wird ein auf der Open Source Software JAMWiki beruhendes moderiertes Wiki-System, das bereits im UB-Projekt Libri Sancti Kiliani digital operationell ist, für weitere Medientypen und für die Verwendung in TextGrid angepasst und funktional erweitert. Mit dieser Web-2.0-Komponente wird ein weiteres sehr einfach be�nutzbares Werkzeug bereitgestellt, das den Stamm potentiell Beitragender zu einem Projekt ortsunabhängig vergrößert. TextGrid wird damit um ein System für Beiträge Dritter, die nicht unmittelbar auf den Originaldaten arbeiten sollen, erweitert. | |||
==Schnittstelle Repositories-Datenanalyse== | |||
Dieses Modul unterstützt anhand der Textanalyse-Use-Cases | |||
*die Zusammenstellung eines Korpus zu analysierender Texte aus dem TextGrid-Repository bzw. WÜsyphus u.a. anhand ihrer Metadaten, | |||
*die Aufbereitung der gewählten Texte mit ihren Metadaten für ihre Analyse mit UIMA, | |||
* die Ausführung der Analyse und schließlich | |||
* eine Einbindung der Analyseergebnisse in TextGrid, etwa durch die Rückübertragung von Annotationen durch UIMA nach TEI. | |||
Diese Teilschritte können, ggf. in angepasster Form, auch allgemeiner von anderen Projekten nachgenutzt werden. | |||
=Dienstleistungen= | =Dienstleistungen= | ||