OCR-Workflow

Aus Kallimachos
Wechseln zu:Navigation, Suche


Segmentierung mit LAREX

Teilprojekt OCR-Workflow

Schon innerhalb ersten Förderphase wurde für das Teilprojekt Narragonien Digital durch den Lehrstuhl für künstliche Intelligenz und Angewandte Informatik das interaktive Segmentierungstool LAREX entwickelt, mit dem auf einer gescannten Buchseite Bildregionen und weitere, benutzerdefinierbare Typen von Textregionen (z.B. Fließtext, Überschriften, Mariginalien, Seitenzahlen, ...) erkannt und ausgezeichnet werden können. Die Darstellung der Typen erfolgt intuitiv durch farbliche Markierung auf den gescannten Seiten. Die segmentierten Textausschnitte werden in einer vorher definierten Lesereihenfolge abgelegt.

Korrektur von OCR-Ergebnissen und Erzeugung neuer Ground Truth in OCR4all.

Im Rahmen der zweiten Förderphase werden die Algorithmen zur Segmentierung verbessert und die Bedienbarkeit des Tools weiter vereinfacht, vor allem wird LAREX aber auch in das neue Webtool OCR4all integriert. Das neue Tool bietet damit einen vollständigen, auf Calamari basierenden OCR-Workflow, das neben der LAREX-Segmentierung und Texterkennung auch die Produktion von Ground Truth in einem intuitiv zu bedienenden Transkriptions- und Korrekturtool, das Training neuer OCR-Modele und die abschließende Evaluation der Ergebnisse ermöglicht.

Förderphase II

Eine eingehende Darstellung der Ergebnisse der zweiten Förderphase finden Sie hier.