Inhaltsverzeichnis

1 Tutorial Abby Recognition Server

Tutorial Abby Recognition Server

Installation und Einrichtung des Recognition Servers

Hinweis: diese Dokumentation geht auf Vorbereitungen und Besonderheiten ein, die in der Dokumentation des Recognition Servers oder der Korrekturstation nicht beschrieben werden.

Einstellungen können so übernommen werden; es erspart einem Denk- und Arbeitszeit für spätere Nutzung weiterer Programmkomponenten.

Minimal notwendig sind:

Server Manager
Verification Station

Auswählen des Benutzerkontos

Die Dokumetation des Recognition Servers bezieht sich auf eine Windows-Domäne mit Windows-Netzlaufwerken. Sollen die OCR-Ergebnisse auf einem Windows-Netzlaufwerk gespeichert werden, so muss ein Benutzerkonto/User account ausgewählt werden, der Berechtigungen zum Zugriff auf das Netzwerk hat. Der lokale Benutzer hat diese Rechte nicht. Es bietet sich an, das Netzwerkdienstkonto auszuwählen, da dieses über Berechtigungen zum Zugriff auf Netzwerkressourcen besitzt.

In unserem Fall ist es eine Novell-Domäne mit Novell-Laufwerken. Das Speichern der OCR-Ergebnisse auf Novell-Laufwerken war uns nicht möglich. Die Meldung im Recognition Server besagte, dass auf das Netzlaufwerk nicht zugegriffen werden konnte. Somit konnten die Ergebnisse nur auf dem lokalen ABBYY-Server gespeichert, und dann auf ein Netzlaufwerk kopiert werden.

Erstellen eines Workflows

Anlegen der Ordnerstruktur

Es empfiehlt sich, folgende Ordnerstruktur zu erstellen:

_Input
- Hier werden die zu erkennenden Scans eingefügt
_Output
- hier werden die Ergebnisse der OCR abgelegt

Den Ausgabeordner, hier Daheim, freigeben

Rechtsklick auf den Ordner
- Freigeben für -> erweiterte Freigabe
- Erweiterte Freigabe
- Haken bei Diesen Ordner freigeben setzen
- Berechtigungen
  - Benutzer auswählen, die Zugriff darauf haben sollen

Diese Benutzer müssen auf dem Rechner, auf dem der Recognition Server läuft, angelegt sein und ein Passwort haben

Jeder entfernen
- Hinzufügen
  - Erweitert
    - Jetzt suchen
    - Benutzer wählen
    - OK -> OK
  - Berechtigungen aktivieren
    - Ändern
    - Lesen

Die Ordner werden jetzt auf den Rechnern, auf denen die Korrekturstation installiert werden soll, als Netzlaufwerk eingebunden.

Windows-Explorer öffnen
- Extras
- Netzlaufwerk verbinden
  - Laufwerksbuchstabe wählen
  - Pfad zum Recognition Server eingeben/auswählen
  - Verbindung bei Anmeldung wiederherstellen
  - Fertig stellen

Workfloweinstellungen

Zur Erklärung des Punktes "Entzerren":

Diese Optiton richtet das Bild anhand von Linien aus. Sind diese wie in diesem Beispielbild - die trapezförmige Daheim-Fahne - sieht die Ausgabe folgendermaßen aus:

Das Programm richtet die lange Kante der Fahne horizontal aus. da es diese als Referenz für die Ausrichtung ansieht. Daher sollte un solchen Fällen die Option "Entzerren" deaktiviert werden.

Qualitätskontrolle

Für Dokumente mit sehr einfachen Formatierungen, wie z.B. reiner Fließtext, bzw. mit nur wenigen Abbildungen, kann "Keine Überprüfung" gewählt werden. Beispiel:

Bild: Fließtextseite

Bei Dokumenten mit aufwändigeren Formatierungen sollte "Alle Dokumente überprüfen" gewählt werden, da hier häufig die Segmentierung der Bildunterschriften als Text entweder in den Fließtext mit einbezogen, oder als separates Textsegment erfasst wird. Das bringt die Lesereihenfolge durcheinander. Beispiel für komplexe Formatierungen:

Bild: komplexe Formatierung

Rechtschreibprüfung

Diese führt in der Korrekturstation früher oder später zu Programmfehlern und zum Absturz. Alternativ kann eine txt-Datei als Wörterbuch im Recognition Server eingebunden werden. Diese wird mit UTF-16 angelegt und jedes Wort in eine eigene Zeile eingetragen. Hinzugefügt wird es im Reiter 2 Verarbeitung.

Bild: Reiter 2 Verarbeitung

Neue Sprache im FineReader erstellen und dem Recognition Server übergeben

In dieser kann der Zeichensatz ausgewählt werden und nicht vorkommende Zeichen entfernt, z.B. das @-Zeichen. Dieses kommt in älteren Schriften nicht vor, wird aber hin- und wieder mal als solches erkannt.

Hierzu im FineReader folgendermaßen vorgehen:

Optionen
Werkzeuge
- Sprachen
- Neu
  - Eine neue Sprache anhand einer bestehenden erstellen
  - OK
  - Erweitert

Nun können unzulässige Zeichen eingetragen werden; direkt hintereinander ohne Leerzeichen oder anderen Trenner.

Bild: Auszuschließende Zeichen

Trainingsdatei für Schriftzeichen erstellen

Erkennt der Recognition Server bestimmte Zeichen nicht, können diese mittels einer Trainingsdatei im FineReader erstellt, als .fbt-Datei exportiert und im Recognition Server importiert werden. Eine Testversion des FineReader kann man auf der Abbyy-Seite runterladen. Zum Erstellen einer Trainingsdatei, hier am Beispiel der Frakturschrift, wird der Punkt Verwenden Sie das Training zum Erkennen neuer Zeichen und Ligaturen gesetzt. Anschließend auf Seite erkennen klicken. Es öffnet sich der Mustertraining-Dialog. Das M wurde nicht vollständig segmentiert, daher mit dem Doppelpfeil >> das Segment erweitern, bis es vollständig umschlossen ist. Anschließend auf Training klicken. Sollten Segmente über ein Zeichen hinaus ragen, so können diese analog mit dem Doppelpfeil << verkleinert werden.

Bild: Verwenden Sie das Training... Bild: Mustertraining

Das Training kann jederzeit über die Schaltfläche Schließen beendet werden. Die trainierten Schriftzeichen können über

Werkzeuge
- Mustereditor

gesichtet, und deren Eigenschaften (Fett, Kursiv...) angepasst werden:

Bild: Benutzermuster

Um zu prüfen, ob die Erkennungsgenauigkeit mit der Trainingsdatei besser ist als ohne, kann man im FineReader schon mal einige Seiten mit und ohne den integrierten Mustern erkennen lassen. Die Trainingsdatei kann im FineReader über

Werkzeuge
- OCR
  - Benutzerdefinierte Muster und Sprachen speichern

exportiert und hier dem Recognition Server übergeben werden:

Bild: Benutzermuster einfügen

Besonderheiten

Neue Textsegmente erstellen

Wenn ein neues Textsegment erstellt wird, so ist der Drucktyp auf Default eingestellt. Dies schließt "normale" Drucktypen wie Antigua ein. Sind jedoch andere Drucktypen, wie etwa Fraktur zu erkennen, muss dies jedes mal auf Gothic geändert werden.

Bild: Gothic und Textreihenfolge

Anschließend muss die Textreihenfolge noch kontrolliert und korrigiert werden.

Nicht eingelesene Seitenzahlen

Sollte ein Textsegment, z.B. Seitenzahl, trotz Segmentierung nicht angezeigt werden, klickt man im linken Fenster mit der linken Maustaste doppelt auf das Segment. Jetzt sollte es im rechten Fenster erscheinen und der Cursor blinken. Nun kann die Seitenzahl eingetragen werden.

Bild: Nicht eingelesene Seitenzahlen

Fehlermeldungen...

treten auf bei:

Benutzung der Zwischenablage (Copy & Paste)
Benutzung der Rechtschreibprüfung

Eher selten während dem laufenden Betrieb. Dann jedoch sollte die Korrekturstation komplett geschlossen werden, da sie sonst die gleichen Fehler immer wieder und hintereinander liefert.

Bilder: Fehlermeldungen