Tutorial Abby Recognition Server: Unterschied zwischen den Versionen
Aus Kallimachos
Keine Bearbeitungszusammenfassung |
|||
| Zeile 1: | Zeile 1: | ||
=Installation= | =Installation= | ||
==Tutorial | ==Tutorial Abbyy Recognition Server== | ||
===Installation und Einrichtung des Recognition Servers=== | ===Installation und Einrichtung des Recognition Servers=== | ||
Hinweis: diese Dokumentation geht auf Vorbereitungen und Besonderheiten ein, die in der Dokumentation des Recognition Servers | ''Hinweis'': diese Dokumentation geht auf die nötigen Vorbereitungen und Besonderheiten bei der OCR der Zeitschrift ''Daheim'' (und ähnliche Digitalisate) ein, die in der Dokumentation des [https://www.abbyy.com/de-de/recognition-server/ Abbyy Recognition Servers] und der dazugehörigen Korrekturstation nicht beschrieben werden. | ||
[[Bild:Installationsdialog.png]] | [[Bild:Installationsdialog.png]] | ||
Einstellungen können so übernommen werden; es erspart einem Denk- und Arbeitszeit für spätere Nutzung weiterer Programmkomponenten. | Die Einstellungen können so übernommen werden; es erspart einem Denk- und Arbeitszeit für spätere Nutzung weiterer Programmkomponenten. | ||
Minimal notwendig sind: | Minimal notwendig sind: | ||
* Server Manager | *Server Manager | ||
* Verification Station | *Verification Station | ||
===Auswählen des Benutzerkontos=== | ===Auswählen des Benutzerkontos=== | ||
| Zeile 18: | Zeile 18: | ||
[[Datei:Benutzerkonto.png]] | [[Datei:Benutzerkonto.png]] | ||
Die | Die Dokumentation des Recognition Servers bezieht sich auf eine Windows-Domäne mit Windows-Netzlaufwerken. Sollen die OCR-Ergebnisse auf einem Windows-Netzlaufwerk gespeichert werden, so muss ein Benutzerkonto/User account ausgewählt werden, der Berechtigungen zum Zugriff auf das Netzwerk hat. Der lokale Benutzer hat diese Rechte ''nicht''. | ||
Es bietet sich an, das Netzwerkdienstkonto auszuwählen, da dieses über Berechtigungen zum Zugriff auf Netzwerkressourcen besitzt. | Es bietet sich an, das Netzwerkdienstkonto auszuwählen, da dieses über Berechtigungen zum Zugriff auf Netzwerkressourcen besitzt. | ||
In unserem Fall | In unserem Fall handelte es sich hierbei um eine Novell-Domäne mit Novell-Netzlaufwerken. Das Speichern der OCR-Ergebnisse auf diesen Laufwerken war uns nicht möglich. Die Meldung im Recognition Server besagte, dass auf das Netzlaufwerk nicht zugegriffen werden konnte. Somit konnten die Ergebnisse nur auf dem lokalen ABBYY-Server gespeichert, und dann mit einem Synchronisationsprogramm auf ein Netzlaufwerk kopiert werden. | ||
=Workflow= | =Workflow= | ||
| Zeile 27: | Zeile 28: | ||
=== Anlegen der Ordnerstruktur === | === Anlegen der Ordnerstruktur === | ||
Es empfiehlt sich, folgende Ordnerstruktur | Es empfiehlt sich, folgende Ordnerstruktur zur Kontrolle des Worflows anzulegen: | ||
[[Datei:Ordnerstruktur.PNG]] | [[Datei:Ordnerstruktur.PNG]] | ||
| Zeile 35: | Zeile 36: | ||
* _Output | * _Output | ||
** hier werden die Ergebnisse der OCR abgelegt | ** hier werden die Ergebnisse der OCR abgelegt | ||
==== Den Ausgabeordner (hier ''Daheim'') freigeben ==== | ==== Den Ausgabeordner (hier ''Daheim'') freigeben ==== | ||
| Zeile 46: | Zeile 46: | ||
*** Benutzer auswählen, die Zugriff darauf haben sollen | *** Benutzer auswählen, die Zugriff darauf haben sollen | ||
Diese Benutzer müssen auf dem Rechner, auf dem der Recognition Server läuft, angelegt sein und ein Passwort haben | Diese Benutzer müssen auf dem Rechner, auf dem der Recognition Server läuft, angelegt sein und ein Zugang mit Passwort haben. | ||
* ''Jeder'' entfernen | * ''Jeder'' entfernen | ||
| Zeile 66: | Zeile 66: | ||
*** Pfad zum Recognition Server eingeben/auswählen | *** Pfad zum Recognition Server eingeben/auswählen | ||
*** Verbindung bei Anmeldung wiederherstellen | *** Verbindung bei Anmeldung wiederherstellen | ||
*** Fertig stellen | *** ''Fertig stellen'' | ||
=== Workfloweinstellungen === | === Workfloweinstellungen === | ||
| Zeile 74: | Zeile 74: | ||
====Zur Erklärung des Punktes "Entzerren":==== | ====Zur Erklärung des Punktes "Entzerren":==== | ||
Diese | Diese Option richtet das Bild anhand von Linien aus. Sind diese wie in diesem Beispielbild - die trapezförmige Daheim-Fahne - sieht die Ausgabe folgendermaßen aus: | ||
| Zeile 80: | Zeile 80: | ||
Das Programm richtet die lange Kante der Fahne horizontal aus | Das Programm richtet die lange Kante der Fahne horizontal aus, da es diese als Referenz für die Ausrichtung ansieht. Daher sollte in solchen Fällen die Option ''Entzerren'' deaktiviert werden. | ||
| Zeile 87: | Zeile 87: | ||
=== Qualitätskontrolle === | === Qualitätskontrolle === | ||
Für Dokumente mit sehr einfachen Formatierungen | Für Dokumente mit sehr einfachen Formatierungen (z.B. reiner Fließtext) und mit nur wenigen Abbildungen, kann ''Keine Überprüfung'' gewählt werden. Ein Beispiel für eine relativ unproblematische Seite: | ||
[[Bild:Fließtextseite.png]] | [[Bild:Fließtextseite.png]] | ||
Bei Dokumenten mit aufwändigeren Formatierungen sollte ''Alle Dokumente überprüfen'' gewählt werden, da | Bei Dokumenten mit aufwändigeren Formatierungen sollte hingegen ''Alle Dokumente überprüfen'' gewählt werden, da sonst häufig die segmentierten Bildunterschriften entweder in den Fließtext mit einbezogen oder als separates Textsegment erfasst wird. Das bringt die Lesereihenfolge durcheinander. Ein Beispiel für ein komplexe Formatierung: | ||
Das bringt die Lesereihenfolge durcheinander. Beispiel für komplexe | |||
[[Bild:Komplexe_Formatierung.png]] | [[Bild:Komplexe_Formatierung.png]] | ||
| Zeile 110: | Zeile 109: | ||
*** Erweitert | *** Erweitert | ||
Nun können unzulässige Zeichen eingetragen werden; direkt hintereinander ohne Leerzeichen oder andere Trennzeichen. | Nun können unzulässige Zeichen eingetragen werden; direkt hintereinander ohne Leerzeichen oder andere Trennzeichen. | ||
[[Bild:Verarbeitung.png]] | [[Bild:Verarbeitung.png]] | ||
=== Trainingsdatei für Schriftzeichen erstellen === | === Trainingsdatei für Schriftzeichen erstellen === | ||