OCR-Workflow: Unterschied zwischen den Versionen

Aus Kallimachos
Wechseln zu:Navigation, Suche
Gaede (Diskussion | Beiträge)
Gaede (Diskussion | Beiträge)
Keine Bearbeitungszusammenfassung
Zeile 1: Zeile 1:
<div class="notab">
<div class="notab">
[[File:Datentunnel.jpg | |link=| alt= Bilder und Texte auf dem Weg ins digitale Zeitalter]]
[[File:Datentunnel.jpg | |link=| alt= Bilder und Texte auf dem Weg ins digitale Zeitalter]]
<br clear=all>
<br clear=all>
<br clear=all>
==Teilprojekt ''OCR-Workflow''==
==Teilprojekt ''OCR-Workflow''==
Schon innerhalb ersten Förderphase wurde für das Teilprojekt [[Narragonien:Main|Narragonien Digital]] durch den Lehrstuhl für künstliche Intelligenz und Angewandte Informatik das interaktive Segmentierungstool [http://www.is.informatik.uni-wuerzburg.de/research-tools-download/larex/ '''LAREX'''] entwickelt, mit dem auf einer gescannten Buchseite Bildregionen und weitere, benutzerdefinierbare Typen von Textregionen (z.B. Fließtext, Überschriften, Mariginalien, Seitenzahlen, ...) erkannt und ausgezeichnet werden können. Die Darstellung der Typen erfolgt intuitiv durch farbliche Markierung auf den gescannten Seiten. Die segmentierten Textausschnitte werden in einer vorher definierten Lesereihenfolge abgelegt. Im Rahmen der zweiten Förderphase werden die Algorithmen zur Segmentierung verbessert und die Bedienbarkeit des Tools weiter vereinfacht, vor allem wird LAREX aber auch in das neue Webtool [https://gitlab2.informatik.uni-wuerzburg.de/chr58bk/OCR4all_Web '''OCR4all'''] integriert. Das neue Tool bietet damit einen vollständigen, auf [https://github.com/Calamari-OCR/calamari Calamari] basierenden OCR-Workflow, das neben der LAREX-Segmentierung und Texterkennung auch die Produktion von ''Ground Truth'' in einem intuitiv zu bedienenden Transkriptions- und Korrekturtool, das Training neuer OCR-Modele und die abschließende Evaluation der Ergebnisse ermöglicht.  
Schon innerhalb ersten Förderphase wurde für das Teilprojekt [[Narragonien:Main|Narragonien Digital]] durch den Lehrstuhl für künstliche Intelligenz und Angewandte Informatik das interaktive Segmentierungstool [http://www.is.informatik.uni-wuerzburg.de/research-tools-download/larex/ '''LAREX'''] entwickelt, mit dem auf einer gescannten Buchseite Bildregionen und weitere, benutzerdefinierbare Typen von Textregionen (z.B. Fließtext, Überschriften, Mariginalien, Seitenzahlen, ...) erkannt und ausgezeichnet werden können. Die Darstellung der Typen erfolgt intuitiv durch farbliche Markierung auf den gescannten Seiten. Die segmentierten Textausschnitte werden in einer vorher definierten Lesereihenfolge abgelegt. Im Rahmen der zweiten Förderphase werden die Algorithmen zur Segmentierung verbessert und die Bedienbarkeit des Tools weiter vereinfacht, vor allem wird LAREX aber auch in das neue Webtool [https://gitlab2.informatik.uni-wuerzburg.de/chr58bk/OCR4all_Web '''OCR4all'''] integriert. Das neue Tool bietet damit einen vollständigen, auf [https://github.com/Calamari-OCR/calamari Calamari] basierenden OCR-Workflow, das neben der LAREX-Segmentierung und Texterkennung auch die Produktion von ''Ground Truth'' in einem intuitiv zu bedienenden Transkriptions- und Korrekturtool, das Training neuer OCR-Modele und die abschließende Evaluation der Ergebnisse ermöglicht.  
</div>
</div>

Version vom 18. März 2019, 18:36 Uhr

Bilder und Texte auf dem Weg ins digitale Zeitalter

Teilprojekt OCR-Workflow

Schon innerhalb ersten Förderphase wurde für das Teilprojekt Narragonien Digital durch den Lehrstuhl für künstliche Intelligenz und Angewandte Informatik das interaktive Segmentierungstool LAREX entwickelt, mit dem auf einer gescannten Buchseite Bildregionen und weitere, benutzerdefinierbare Typen von Textregionen (z.B. Fließtext, Überschriften, Mariginalien, Seitenzahlen, ...) erkannt und ausgezeichnet werden können. Die Darstellung der Typen erfolgt intuitiv durch farbliche Markierung auf den gescannten Seiten. Die segmentierten Textausschnitte werden in einer vorher definierten Lesereihenfolge abgelegt. Im Rahmen der zweiten Förderphase werden die Algorithmen zur Segmentierung verbessert und die Bedienbarkeit des Tools weiter vereinfacht, vor allem wird LAREX aber auch in das neue Webtool OCR4all integriert. Das neue Tool bietet damit einen vollständigen, auf Calamari basierenden OCR-Workflow, das neben der LAREX-Segmentierung und Texterkennung auch die Produktion von Ground Truth in einem intuitiv zu bedienenden Transkriptions- und Korrekturtool, das Training neuer OCR-Modele und die abschließende Evaluation der Ergebnisse ermöglicht.