Tutorial Abby Recognition Server: Unterschied zwischen den Versionen

Aus Kallimachos
Wechseln zu:Navigation, Suche
DeletedUser (Diskussion | Beiträge)
Keine Bearbeitungszusammenfassung
DeletedUser (Diskussion | Beiträge)
Zeile 60: Zeile 60:
*** Verbindung bei Anmeldung wiederherstellen
*** Verbindung bei Anmeldung wiederherstellen
*** Fertig stellen
*** Fertig stellen
Workfloweinstellungen
=== Workfloweinstellungen ===


Bild: Workfloweinstellungen
Bild: Workfloweinstellungen
Zur Erklärung des Punktes "Entzerren":
Diese Optiton richtet das Bild anhand von Linien aus. Sind diese wie in diesem Beispielbild - die trapezförmige Daheim-Fahne - sieht die Ausgabe folgendermaßen aus:
Bild: Daheim-Titelseite gerade
Bild: Daheim-Titelseite schief
Das Programm richtet die lange Kante der Fahne horizontal aus. da es diese als Referenz für die Ausrichtung ansieht. Daher sollte un solchen Fällen die Option "Entzerren" deaktiviert werden.
=== Qualitätskontrolle ===
Für Dokumente mit sehr einfachen Formatierungen, wie z.B. reiner Fließtext, bzw. mit nur wenigen Abbildungen, kann "Keine Überprüfung" gewählt werden. Beispiel:
Bild: Fließtextseite
Bei Dokumenten mit aufwändigeren Formatierungen sollte "Alle Dokumente überprüfen" gewählt werden, da hier häufig die Segmentierung der Bildunterschriften als Text entweder in den Fließtext mit einbezogen, oder als separates Textsegment erfasst wird.
Das bringt die Lesereihenfolge durcheinander. Beispiel für komplexe Formatierungen:
Bild: komplexe Formatierung

Version vom 11. August 2017, 08:30 Uhr

Tutorial Abby Recognition Server

Installation und Einrichtung des Recognition Servers

Hinweis: diese Dokumentation geht auf Vorbereitungen und Besonderheiten ein, die in der Dokumentation des Recognition Servers oder der Korrekturstation nicht beschrieben werden.

Bild: Installation

Einstellungen können so übernommen werden; es erspart einem Denk- und Arbeitszeit für spätere Nutzung weiterer Programmkomponenten.

Minimal notwendig sind:

  • Server Manager
  • Verification Station

Auswählen des Benutzerkontos

Bild:

Die Dokumetation des Recognition Servers bezieht sich auf eine Windows-Domäne mit Windows-Netzlaufwerken. Sollen die OCR-Ergebnisse auf einem Windows-Netzlaufwerk gespeichert werden, so muss ein Benutzerkonto/User account ausgewählt werden, der Berechtigungen zum Zugriff auf das Netzwerk hat. Der lokale Benutzer hat diese Rechte nicht. Es bietet sich an, das Netzwerkdienstkonto auszuwählen, da dieses über Berechtigungen zum Zugriff auf Netzwerkressourcen besitzt.

In unserem Fall ist es eine Novell-Domäne mit Novell-Laufwerken. Das Speichern der OCR-Ergebnisse auf Novell-Laufwerken war uns nicht möglich. Die Meldung im Recognition Server besagte, dass auf das Netzlaufwerk nicht zugegriffen werden konnte. Somit konnten die Ergebnisse nur auf dem lokalen ABBYY-Server gespeichert, und dann auf ein Netzlaufwerk kopiert werden.

Erstellen eines Workflows

Anlegen der Ordnerstruktur

Es empfiehlt sich, folgende Ordnerstruktur zu erstellen:

Bild: Ordnerstruktur

  • _Input
    • Hier werden die zu erkennenden Scans eingefügt
  • _Output
    • hier werden die Ergebnisse der OCR abgelegt

Den Ausgabeordner, hier Daheim, freigeben

  • Rechtsklick auf den Ordner
    • Freigeben für -> erweiterte Freigabe
    • Erweiterte Freigabe
    • Haken bei Diesen Ordner freigeben setzen
    • Berechtigungen
      • Benutzer auswählen, die Zugriff darauf haben sollen

Diese Benutzer müssen auf dem Rechner, auf dem der Recognition Server läuft, angelegt sein und ein Passwort haben

      • Jeder entfernen
      • Hinzufügen
        • Erweitert
          • Jetzt suchen
          • Benutzer wählen
          • OK -> OK
        • Berechtigungen aktivieren
          • Ändern
          • Lesen

Die Ordner werden jetzt auf den Rechnern, auf denen die Korrekturstation installiert werden soll, als Netzlaufwerk eingebunden.

  • Windows-Explorer öffnen
    • Extras
    • Netzlaufwerk verbinden
      • Laufwerksbuchstabe wählen
      • Pfad zum Recognition Server eingeben/auswählen
      • Verbindung bei Anmeldung wiederherstellen
      • Fertig stellen

Workfloweinstellungen

Bild: Workfloweinstellungen

Zur Erklärung des Punktes "Entzerren":

Diese Optiton richtet das Bild anhand von Linien aus. Sind diese wie in diesem Beispielbild - die trapezförmige Daheim-Fahne - sieht die Ausgabe folgendermaßen aus:

Bild: Daheim-Titelseite gerade

Bild: Daheim-Titelseite schief

Das Programm richtet die lange Kante der Fahne horizontal aus. da es diese als Referenz für die Ausrichtung ansieht. Daher sollte un solchen Fällen die Option "Entzerren" deaktiviert werden.

Qualitätskontrolle

Für Dokumente mit sehr einfachen Formatierungen, wie z.B. reiner Fließtext, bzw. mit nur wenigen Abbildungen, kann "Keine Überprüfung" gewählt werden. Beispiel:

Bild: Fließtextseite

Bei Dokumenten mit aufwändigeren Formatierungen sollte "Alle Dokumente überprüfen" gewählt werden, da hier häufig die Segmentierung der Bildunterschriften als Text entweder in den Fließtext mit einbezogen, oder als separates Textsegment erfasst wird. Das bringt die Lesereihenfolge durcheinander. Beispiel für komplexe Formatierungen:

Bild: komplexe Formatierung