Tutorial Transkriptionseditor
Inhaltsverzeichnis
Einsatzgebiet des Transkriptionseditors
Egal, ob ein Text von Grund auf neu transkribiert werden oder ein per OCR erzeugter Text von Fehlern bereinigt werden muss: Gerade historische Texte stellen besondere Ansprüche an die Arbeit menschlicher Transkriptoren und Korrektoren. Diese sind vor allem in den in historischen Handschriften und Drucktexten verbreiteten Sonder- und Abkürzungszeichen begründet, die auf herkömmlichen Computertastaturen fehlen. Hier müssen die benötigten Unicode-Entsprechungen und die geeigneten digitalen Schrifttypen im Vorfeld bestimmt und händisch in den Transkriptionstext übertragen werden. Fehler und Unregelmäßigkeiten sind hier vorprogrammiert, wenn diese nicht durch eine sinnvoll aufgebaute Arbeitsumgebung und einen gut definierten Arbeitsablauf verhindert werden. Darüber hinaus erfordern die personellen Hierarchien vieler Transkriptionsprojekte eine Benutzerverwaltung, die z.B. eine „Korrektur der Korrektur“ durch geschultes Fachpersonal erlaubt. Der für das Kallimachos-Teilprojekt Narragonien digital entwickelte Transkriptionseditor bedient diese Anforderungen in einer intuitiv verwendbaren und betriebssystem-unabhängigen Weboberfläche.
Der Transkriptionseditor ermöglicht die Erstellung von zeichengetreuen Transkriptionen in einer kontrollierten Umgebung, inklusive der Gewährleistung des korrekten Encodings, voller Kontrolle über die Daten (Scans und Texte) und die konsequente Anwendung von MUFI-Fonts zur Sonderzeichencodierung. Ein hierarchisches Benutzerrechtesystem ermöglicht die Miteinbeziehung von studentischen Mitarbeitern und Seminarteilnehmern.
Technische Informationen
- Webanwendung
- Technologie: Java EE mit GlassFish-Server
- Oberfläche basierend auf CKEditor
- MUFI-Unicodes und -Fonts für Transkriptionen
- Benutzerkontensteuerung mit Rechteverwaltung
Zugriff auf den Editor
Nach der Anpassung und Freischaltung für das jeweilige Projekt steht der Transkriptionseditor als eigene Webanwendung zur Verfügung. Zur Arbeit mit dem Editor benötigen Sie einen per Passwort geschützten Account. Ihrem Account können verschiedene Sicherheitsrollen zugewiesen werden:
- Gäste können zugewiesene Seiten im Editor betrachten, aber nicht bearbeiten (derzeit nicht aktiv)
- Mitarbeiter können Werke und einzelne Textseiten im Editor ansehen und bearbeiten, die Ihnen von Koordinatoren zugewiesen wurden.
- Koordinatoren können beliebig Texte bearbeiten, sowie Werke und einzelne Textseiten ausgewählten Mitarbeitern zur Bearbeitung zuweisen. Anschließend können Sie deren Fortschritte kontrollieren und die finale Version für die Transkription auswählen. Sie können außerdem neue Mitarbeiter und Koordinatoren hinzufügen.
- Administratoren haben die gleichen Rechte wie Mitarbeiter und haben zusätzlich Zugriff auf weitere Systemeinstellungen des Editors und der gesamten Webumgebung.
Nutzerwaltung
Die Benutzer- und Rechteverwaltung ist nur für Administratoren und Koordinatoren zugänglich. Per Klick auf Administration -> Benutzerverwaltung öffnet sich die Ansicht aller eingetragenen Nutzer.
Jeder Eintrag kann durch Klicken auf Bearbeiten bearbeitet werden oder durch Klicken auf Entfernen wieder aus der der Datenbank gelöscht werden. Neue Nutzer können über den Button Hinzufügen eingetragen werden.
Dokumentenverwaltung
Auch die Dokumentenverwaltung ist nur für Administratoren und Koordinatoren zugänglich. Das Hinzufügen neuer Werke ist darüber hinaus nur für Administratoren möglich und erfordert schreibenden Zugriff auf das Datenverzeichnis auf dem Server.
Mithilfe der Dokumentenverwaltung können Nutzer mit der entsprechenden Befugnis die zu transkribierenden (bzw. zu korrigierenden) Werke und ihre Metadaten bearbeiten. Hierbei können den Werken auch passende Drucktypen-Inventare zugewiesen werden. So können die für die Arbeit mit Editor zur Verfügung stehenden Sonderzeichen individuell an jedes Werk angepasst werden.
Durch Klicken auf Hinzufügen öffnet sich die Eingabemaske zum Anlegen eines neuen Werks. Die mit Sternchen gekennzeichneten Metadatenfelder müssen zum Speichern des Datensatzes befüllt werden, alle anderen Felder sind optional. Falls Drucktypen und Aufbewahrungsorte schon beim Anlegen mit dem Werk verknüpft werden sollen, müssen diese zuvor unter den Reitern Drucktypen bzw. Aufbewahrungsorte angelegt worden sein.
Werke
- Tabellenansicht: Unter diesem Menüpunkt finden Sie eine tabellarische Übersicht aller Werke. Die angezeigten Spalten können Sie per Klick auf die Schaltfläche Spalten selbst konfigurieren: Wenn Sie ein wichtiges Metadatum in der Ansicht vermissen, können Sie dieses hier einblenden.
- Metadaten bearbeiten: Ansonsten können Sie die vollständigen Metadaten eines Werks über die Schaltfläche Bearbeiten ansehen und nach Bedarf verändern. Hierbei können Sie auch die für die Transkriptionsarbeit benötigten Typeninventare (s.u.) auswählen.
- Scans zuweisen: Wenn sie über die Befugnisse eines Koordinators verfügen, können Sie rechts neben der Bearbeiten-Schaltfläche die Scanliste aufrufen. Hier können Sie den einzelnen Projektmitarbeitern Scans zur Bearbeitung zuweisen. Dazu markieren Sie die entsprechenden Scans und klicken auf die Schaltfläche Mitarbeiter zuweisen. Eine Liste der Projektmitarbeiter öffnet sich. Wählen Sie den gewünschten Mitarbeiter aus und bestätigen Sie Ihre Auswahl mit Zuweisung. Bereits erstellte Zuweisungen können sie per Klick auf Zuweisung entfernen wieder lösen. Anschließend sichern Sie ihre Änderungen per Klick auf Speichern.
Drucktypen
Diese Ansicht zeigt einer Übersicht aller Drucktypen, die sich aktuell im System befinden.
Per Klick auf den Button Hinzufügen öffnet sich die Eingabemaske zum Anlegen einer neuen Drucktype. Die mit Sternchen gekennzeichneten Metadatenfelder müssen zum Speichern des Datensatzes befüllt werden, alle anderen Felder sind optional. Glyphen können sowohl beim Anlegen einer Drucktype als auch im Nachhinein einer Drucktype hinzugefügt werden.
Glyphensatz:
Das Anlegen und verknüpfen eines Glyphensatzes mit einer Drucktype erfolgt in 2 Schritten:
- Zunächst muss eine CSV-Datei erstellt werden, die alle zu verknüpfenden Glyphen als Unicode enthält. Bei Symbolen, die aus zwei Unicodes bestehen, müssen die beiden Unicodes in einer Zeile durch Tabulator getrennt voneinander angegeben werde.
- Die CSV-Datei kann nun in der Eingabemaske zum Erstellen eines neuen Drucktype im Abschnitt Glyphensatz ausgewählt und hochgeladen werden.
Bearbeiten einer vorhandene Drucktype:
Durch Klicken auf den Button Bearbeiten öffnet sich die Eingabemaske zum Bearbeiten der gewählten Drucktype. Die hier angezeigten Felder und Funktionen gleichen denen der Eingabemaske beim Erstellen der Drucktype.
Entfernen einer vorhandenen Drucktype: Durch Klicken auf das Split-Button-Menü Entfernen öffnet sich der Bestätigungsdialog zum Entfernen der gewählten Drucktype.
Anzeigen und Bearbeiten der Glyphenliste: Durch Klicken auf das Split-Button-Menü Glyphenliste öffnet sich der Dialog zur Anzeige der Glyphen, die der Type zugewiesen sind.
Bearbeiten der Glyphen: Die Unicodes der Glyphen können, getrennt voneinander, durch ein Klicken auf den betreffenden Unicode bearbeitet werden.
Als Sonderzeichen markieren: Die Checkbox in der Spalte „Sonderzeichen“ gibt an, ob die Glyphe in der Sonderzeichen-Tabelle eines Werks, dem die Type zugewiesen ist, angezeigt werden soll oder nicht.
Glyphe entfernen: Der Abfalleimer in der letzten Spalte ermöglicht das Löschen der jeweiligen Glyphe.
Arbeit mit dem Editor
Glyphenauswahl
Für die Auswahl der benötigten Spezialglyphen stehen derzeit zwei Schaltflächen mit unterschiedlichem Layout zur Verfügung – die eine als vertikale Auswahl am Rand, die andere als tastaturähnliche Überblendung. Sie können selbst entscheiden, mit welcher Schaltfläche Sie komfortabler arbeiten können; die Funktionsweise ist in beiden Fällen gleich: Durch einen Klick auf die entsprechende Glyphe wird diese an der aktuellen Position des Cursors in den Text eingefügt. Die hierbei zur Verfügung stehenden Glyphen können zuvor in den Metadaten des Werks angepasst werden.
Vom Entwurf zum Release
Die Arbeit mit dem Editor ist für die Zusammenarbeit von Mitarbeitern (z.B. studentischen Hilfskräften) und Koordinatoren als Kontrollinstanz ausgelegt: Mitarbeiter können die Ihnen zugewiesenen Transkriptionen im Editor bearbeiten, als Entwurf zwischenspeichern oder diesen abschließend als Release-Kandidaten an die zuständigen Koordinatoren weiterleiten. Diese können den Vorschlag annehmen oder zur erneuten Bearbeitung zurückschicken.

Per Klick auf Speichern oder Entwurf können sie Ihre Bearbeitungen speichern. Wenn Sie glauben, den Text korrekt transkribiert oder alle Fehler gefunden zu haben, können Sie ihre Bearbeitung als Release-Kandidat festlegen. Der Status der Transkription ändert sich in diesem Fall zu Release-Kandidat. Wenn Sie Mitarbeiter sind, wird der Scan für die weitere Bearbeitung gesperrt, bis ein Koordinator die Arbeit begutachtet hat.
Als Koordinator können Sie sich entscheiden, den Release-Kandidat wieder abzulehnen. In diesem Fall wird der Text als Abgelehnt gekennzeichnet und erneut zur Bearbeitung vorgelegt. Wählen sie die Option Abbrechen, wird der Text dagegen nicht erneut vorgelegt. Wenn Sie mit der Bearbeitung des Textes zufrieden sind, können Sie den Release-Kandidaten als korrekte Version bestätigen.
Egal, ob Sie den Text abgelehnt, abgebrochen, oder bestätigt haben: Als Koordinator können Sie den Text jederzeit erneut als Entwurf einstufen. Darüber hinaus besitzen Koordinatoren alle Bearbeitungsrechte, die auch Mitarbeiter besitzen, und können Korrekturen jederzeit auch in Eigenregie vornehmen.