Tutorial Abbyy Recognition Server (en): Unterschied zwischen den Versionen

Aus Kallimachos
Wechseln zu:Navigation, Suche
DeletedUser (Diskussion | Beiträge)
Keine Bearbeitungszusammenfassung
DeletedUser (Diskussion | Beiträge)
Keine Bearbeitungszusammenfassung
Zeile 21: Zeile 21:
The Recognition Server-manual is related to a Windows based domain and Windows network shares. If the OCR results are to be saved onto a network sare, you need to select a user with privileges on accessing the network. The ''local system account'' does have comprehensive privileges on the local machine, bot none on the network. It's advisable to choose the ''network service'' account.  
The Recognition Server-manual is related to a Windows based domain and Windows network shares. If the OCR results are to be saved onto a network sare, you need to select a user with privileges on accessing the network. The ''local system account'' does have comprehensive privileges on the local machine, bot none on the network. It's advisable to choose the ''network service'' account.  
In our case we had Novell domain and Novell network shares. These seem to be incompatible in this case. The error message of Recognition Server was ''cannot access drive xxx (the network share)''. Thus we saved the OCR results on the local server and copied them onto a network share by using a synchronizing programm.
In our case we had Novell domain and Novell network shares. These seem to be incompatible in this case. The error message of Recognition Server was ''cannot access drive xxx (the network share)''. Thus we saved the OCR results on the local server and copied them onto a network share by using a synchronizing programm.
= test =  
 
sdlfkjsioen bcvfb
=Creating a Workflow =  
 
<headertabs/>
<headertabs/>
== Create the folder structure ==
It's advisable to create it like the following:
[[Datei:Ordnerstruktur.PNG|600px|center]]
* _Input
** Scans are copied or moved into this folder
* _Output
** OCR results are saved in these subfolders with the corresponding file format
== Share the ''Daheim''-folder ==
* right button click on the folder
** share -> extended share
** extended share
** set checkbox on ''share this folder''
** privileges
*** choose the users that may have access to
Diese Benutzer müssen auf dem Rechner, auf dem der Recognition Server läuft, angelegt sein und ein Zugang mit Passwort haben.
* ''Jeder'' entfernen
** Hinzufügen
*** Erweitert
**** Jetzt suchen
**** Benutzer wählen
**** OK -> OK
*** Berechtigungen aktivieren
**** Ändern
**** Lesen
Die Ordner werden jetzt auf den Rechnern, auf denen die Korrekturstation installiert werden soll, als Netzlaufwerk eingebunden.
* Windows-Explorer öffnen
** Extras
** Netzlaufwerk verbinden
*** Laufwerksbuchstabe wählen
*** Pfad zum Recognition Server eingeben/auswählen
*** Verbindung bei Anmeldung wiederherstellen
*** ''Fertig stellen''
=== Workfloweinstellungen ===
[[Bild:Erweiterte_Workfloweinstellungen.png|600px|center]]
====Zur Erklärung des Punktes "Entzerren":====
Diese Option richtet das Bild anhand von Linien aus. Sind diese wie in diesem Beispielbild - die trapezförmige Daheim-Fahne - sieht die Ausgabe folgendermaßen aus:
[[Bild:Daheim-Titelseite gerade.png|600px|center]]
Das Programm richtet die lange Kante der Fahne horizontal aus, da es diese als Referenz für die Ausrichtung ansieht. Daher sollte in solchen Fällen die Option ''Entzerren'' deaktiviert werden.
[[Bild:Daheim-Titelseite schief.png|600px|center]]
=== Qualitätskontrolle ===
Für Dokumente mit sehr einfachen Formatierungen (z.B. reiner Fließtext) und mit nur wenigen Abbildungen, kann ''Keine Überprüfung'' gewählt werden. Ein Beispiel für eine relativ unproblematische Seite:
[[Bild:Fließtextseite.png|600px|center]]
Bei Dokumenten mit aufwändigeren Formatierungen sollte hingegen ''Alle Dokumente überprüfen'' gewählt werden, da sonst häufig die segmentierten Bildunterschriften entweder in den Fließtext mit einbezogen oder als separates Textsegment erfasst wird. Das bringt die Lesereihenfolge durcheinander. Ein Beispiel für ein komplexe Formatierung:
[[Bild:Komplexe_Formatierung.png|600px|center]]

Version vom 16. August 2017, 11:22 Uhr

[bearbeiten]

Installation and Configuration of Recognition Servers

Please note: this documentation concerns to the prerequisites and specifics wich aren't described comprehensively in the Abbyy Recognition Servers manual, regarding to the magazine "Daheim" and comparable digitized media.


These settings can be accepted as provided. It saves time-consuming troubleshooting.

Minimal prerequisites are:

  • Server Manager
  • Verification Station

Choosing the user account the server is running


The Recognition Server-manual is related to a Windows based domain and Windows network shares. If the OCR results are to be saved onto a network sare, you need to select a user with privileges on accessing the network. The local system account does have comprehensive privileges on the local machine, bot none on the network. It's advisable to choose the network service account. In our case we had Novell domain and Novell network shares. These seem to be incompatible in this case. The error message of Recognition Server was cannot access drive xxx (the network share). Thus we saved the OCR results on the local server and copied them onto a network share by using a synchronizing programm.

Create the folder structure

It's advisable to create it like the following:

  • _Input
    • Scans are copied or moved into this folder
  • _Output
    • OCR results are saved in these subfolders with the corresponding file format

Share the Daheim-folder

  • right button click on the folder
    • share -> extended share
    • extended share
    • set checkbox on share this folder
    • privileges
      • choose the users that may have access to


Diese Benutzer müssen auf dem Rechner, auf dem der Recognition Server läuft, angelegt sein und ein Zugang mit Passwort haben.

  • Jeder entfernen
    • Hinzufügen
      • Erweitert
        • Jetzt suchen
        • Benutzer wählen
        • OK -> OK
      • Berechtigungen aktivieren
        • Ändern
        • Lesen

Die Ordner werden jetzt auf den Rechnern, auf denen die Korrekturstation installiert werden soll, als Netzlaufwerk eingebunden.

  • Windows-Explorer öffnen
    • Extras
    • Netzlaufwerk verbinden
      • Laufwerksbuchstabe wählen
      • Pfad zum Recognition Server eingeben/auswählen
      • Verbindung bei Anmeldung wiederherstellen
      • Fertig stellen

Workfloweinstellungen

Zur Erklärung des Punktes "Entzerren":

Diese Option richtet das Bild anhand von Linien aus. Sind diese wie in diesem Beispielbild - die trapezförmige Daheim-Fahne - sieht die Ausgabe folgendermaßen aus:

Das Programm richtet die lange Kante der Fahne horizontal aus, da es diese als Referenz für die Ausrichtung ansieht. Daher sollte in solchen Fällen die Option Entzerren deaktiviert werden.

Qualitätskontrolle

Für Dokumente mit sehr einfachen Formatierungen (z.B. reiner Fließtext) und mit nur wenigen Abbildungen, kann Keine Überprüfung gewählt werden. Ein Beispiel für eine relativ unproblematische Seite:

Bei Dokumenten mit aufwändigeren Formatierungen sollte hingegen Alle Dokumente überprüfen gewählt werden, da sonst häufig die segmentierten Bildunterschriften entweder in den Fließtext mit einbezogen oder als separates Textsegment erfasst wird. Das bringt die Lesereihenfolge durcheinander. Ein Beispiel für ein komplexe Formatierung: