OCR-Workflow: Unterschied zwischen den Versionen

Aus Kallimachos
Wechseln zu:Navigation, Suche
Gaede (Diskussion | Beiträge)
Gaede (Diskussion | Beiträge)
 
(21 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
<div class="notab">
<div class="notab">
<br clear=all>
[[File:OCRall_LAREX.png | 800px  |link=| alt=Segmentierung mit LAREX]]
<br clear=all>
==Teilprojekt ''OCR-Workflow''==
==Teilprojekt ''OCR-Workflow''==
[[File:Datentunnel.jpg | |link=| alt= Bilder und Texte auf dem Weg ins digitale Zeitalter]]
Schon innerhalb ersten Förderphase wurde für das Teilprojekt [[Narragonien:Main|Narragonien Digital]] durch den Lehrstuhl für künstliche Intelligenz und Angewandte Informatik das interaktive Segmentierungstool [http://www.is.informatik.uni-wuerzburg.de/research-tools-download/larex/ '''LAREX'''] entwickelt, mit dem auf einer gescannten Buchseite Bildregionen und weitere, benutzerdefinierbare Typen von Textregionen (z.B. Fließtext, Überschriften, Mariginalien, Seitenzahlen, ...) erkannt und ausgezeichnet werden können. Die Darstellung der Typen erfolgt intuitiv durch farbliche Markierung auf den gescannten Seiten. Die segmentierten Textausschnitte werden in einer vorher definierten Lesereihenfolge abgelegt.
 
[[File:OCR4all_GT.png|thumbnail|Korrektur von OCR-Ergebnissen und Erzeugung neuer ''Ground Truth'' in OCR4all.| link=]]
Im Rahmen der zweiten Förderphase werden die Algorithmen zur Segmentierung verbessert und die Bedienbarkeit des Tools weiter vereinfacht, vor allem wird LAREX aber auch in das neue Webtool [https://gitlab2.informatik.uni-wuerzburg.de/chr58bk/OCR4all_Web '''OCR4all'''] integriert. Das neue Tool bietet damit einen vollständigen, auf [https://github.com/Calamari-OCR/calamari Calamari] basierenden OCR-Workflow, das neben der LAREX-Segmentierung und Texterkennung auch die Produktion von ''Ground Truth'' in einem intuitiv zu bedienenden Transkriptions- und Korrekturtool, das Training neuer OCR-Modele und die abschließende Evaluation der Ergebnisse ermöglicht.
<br clear=all>
<br clear=all>
===Förderphase II===
Eine eingehende Darstellung der Ergebnisse der zweiten Förderphase finden Sie [[Kallimachos_II_(Eingehende_Darstellung)#AP1: OCR-Optimierung|'''hier''']].
<br clear=all>
<br clear=all>
Schon innerhalb ersten Förderphase wurde für das Teilprojekt [Narragonien:Main|'''Narragonien Digital'''] durch den Lehrstuhl für künstliche Intelligenz und Angewandte Informatik das interaktive Segmentierungstool [http://www.is.informatik.uni-wuerzburg.de/research-tools-download/larex/ '''LAREX'''] entwickelt, mit dem auf einer gescannten Buchseite Bildregionen und weitere, benutzerdefinierbare Typen von Textregionen (z.B. Fließtext, Überschriften, Mariginalien, Seitenzahlen, ...) erkannt und ausgezeichnet werden können. Die Darstellung der Typen erfolgt intuitiv durch farbliche Markierung auf den gescannten Seiten. Die segmentierten Textausschnitte werden in einer vorher definierten Lesereihenfolge abgelegt. Im Rahmen der zweiten Förderphase werden die Algorithmen zur Segmentierung verbessert und die Bedienbarkeit des Tools weiter vereinfacht, vor allem wird LAREX aber auch in das neue Webtool [https://gitlab2.informatik.uni-wuerzburg.de/chr58bk/OCR4all_Web OCR4all] integriert. Das neue Tool bietet damit einen vollständigen, auf [https://github.com/Calamari-OCR/calamari Calamari] basierenden OCR-Workflow, das neben der LAREX-Segmentierung und Texterkennung auch die Produktion von ''Ground Truth'' in einem intuitiv zu bedienenden Transkriptions- und Korrekturtool, das Training neuer OCR-Modele und die abschließende Evaluation der Ergebnisse ermöglicht.
</div>
</div>

Aktuelle Version vom 15. Mai 2020, 14:11 Uhr


Segmentierung mit LAREX

Teilprojekt OCR-Workflow

Schon innerhalb ersten Förderphase wurde für das Teilprojekt Narragonien Digital durch den Lehrstuhl für künstliche Intelligenz und Angewandte Informatik das interaktive Segmentierungstool LAREX entwickelt, mit dem auf einer gescannten Buchseite Bildregionen und weitere, benutzerdefinierbare Typen von Textregionen (z.B. Fließtext, Überschriften, Mariginalien, Seitenzahlen, ...) erkannt und ausgezeichnet werden können. Die Darstellung der Typen erfolgt intuitiv durch farbliche Markierung auf den gescannten Seiten. Die segmentierten Textausschnitte werden in einer vorher definierten Lesereihenfolge abgelegt.

Korrektur von OCR-Ergebnissen und Erzeugung neuer Ground Truth in OCR4all.

Im Rahmen der zweiten Förderphase werden die Algorithmen zur Segmentierung verbessert und die Bedienbarkeit des Tools weiter vereinfacht, vor allem wird LAREX aber auch in das neue Webtool OCR4all integriert. Das neue Tool bietet damit einen vollständigen, auf Calamari basierenden OCR-Workflow, das neben der LAREX-Segmentierung und Texterkennung auch die Produktion von Ground Truth in einem intuitiv zu bedienenden Transkriptions- und Korrekturtool, das Training neuer OCR-Modele und die abschließende Evaluation der Ergebnisse ermöglicht.

Förderphase II

Eine eingehende Darstellung der Ergebnisse der zweiten Förderphase finden Sie hier.