Tutorial Abby Recognition Server: Unterschied zwischen den Versionen

Aus Kallimachos
Wechseln zu:Navigation, Suche
(Trainingsdatei für Schriftzeichen erstellen)
K (Installation und Einrichtung des Recognition Servers)
 
(36 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 3: Zeile 3:
 
===Installation und Einrichtung des Recognition Servers===
 
===Installation und Einrichtung des Recognition Servers===
  
''Hinweis'': diese Dokumentation geht auf die nötigen Vorbereitungen und Besonderheiten bei der OCR der Zeitschrift ''Daheim'' (und ähnliche Digitalisate) ein, die in der Dokumentation des [https://www.abbyy.com/de-de/recognition-server/ Abbyy Recognition Servers] und der dazugehörigen Korrekturstation nicht beschrieben werden.
+
''Hinweis'': Diese Dokumentation geht auf die nötigen Vorbereitungen und Besonderheiten bei der OCR der Zeitschrift ''Daheim'' (und ähnliche Digitalisate) ein, die in der Dokumentation des [https://www.abbyy.com/de-de/recognition-server/ Abbyy Recognition Servers] und der dazugehörigen Korrekturstation nicht beschrieben werden.
  
 
[[Bild:Installationsdialog.png|600px|center]]
 
[[Bild:Installationsdialog.png|600px|center]]
  
  
Die Einstellungen können so übernommen werden; das erspart Denk- und Arbeitszeit für spätere Nutzung weiterer Programmkomponenten.
+
Die Einstellungen können so übernommen werden.
 
 
Minimal notwendig sind:
 
 
 
*Server Manager
 
*Verification Station
 
  
 
===Auswählen des Benutzerkontos===
 
===Auswählen des Benutzerkontos===
Zeile 21: Zeile 16:
  
  
Die Dokumentation des Recognition Servers bezieht sich auf eine Windows-Domäne mit Windows-Netzlaufwerken. Sollen die OCR-Ergebnisse auf einem Windows-Netzlaufwerk gespeichert werden, so muss ein Benutzerkonto/User account ausgewählt werden, der Berechtigungen zum Zugriff auf das Netzwerk hat. Der lokale Benutzer hat diese Rechte ''nicht''.  
+
Die Dokumentation des Recognition Servers bezieht sich auf eine Windows-Umgebung mit Windows-Netzlaufwerken. Sollen die OCR-Ergebnisse auf einem Windows-Netzlaufwerk gespeichert werden, so muss ein Benutzerkonto/User account ausgewählt werden, der Berechtigungen zum Zugriff auf das Netzwerk hat. Der lokale Benutzer hat diese Rechte ''nicht''.  
  
Es bietet sich an, das Netzwerkdienstkonto auszuwählen, da dieses über Berechtigungen zum Zugriff auf Netzwerkressourcen besitzt.  
+
Es bietet sich an, das ''Netzwerkdienstkonto'' auszuwählen, da dieses über Berechtigungen zum Zugriff auf Netzwerkressourcen besitzt.  
  
In unserem Fall handelte es sich hierbei um eine Novell-Domäne mit Novell-Netzlaufwerken. Das Speichern der OCR-Ergebnisse auf diesen Laufwerken war uns nicht möglich. Die Meldung im Recognition Server besagte, dass auf das Netzlaufwerk nicht zugegriffen werden konnte. Somit konnten die Ergebnisse nur auf dem lokalen ABBYY-Server gespeichert, und dann mit einem Synchronisationsprogramm auf ein Netzlaufwerk kopiert werden.
+
In unserem Fall handelte es sich um eine Novell-Umgebung mit Novell-Netzlaufwerken. Das Speichern der OCR-Ergebnisse auf diesen Laufwerken war uns nicht möglich. Die Meldung im Recognition Server besagte, dass auf das Netzlaufwerk nicht zugegriffen werden konnte. Somit konnten die Ergebnisse nur auf dem lokalen ABBYY-Server gespeichert, und dann mit einem Synchronisationsprogramm auf ein Netzlaufwerk kopiert werden.
  
 
=Workflow=
 
=Workflow=
 
==Erstellen eines Workflows==
 
==Erstellen eines Workflows==
 
=== Anlegen der Ordnerstruktur ===
 
=== Anlegen der Ordnerstruktur ===
 +
  
 
Es empfiehlt sich, folgende Ordnerstruktur zur Kontrolle des Worflows anzulegen:
 
Es empfiehlt sich, folgende Ordnerstruktur zur Kontrolle des Worflows anzulegen:
 +
  
 
[[Datei:Ordnerstruktur.PNG|600px|center]]
 
[[Datei:Ordnerstruktur.PNG|600px|center]]
 +
 +
  
 
* _Input
 
* _Input
Zeile 40: Zeile 39:
 
** hier werden die Ergebnisse der OCR abgelegt
 
** hier werden die Ergebnisse der OCR abgelegt
  
==== Den Ausgabeordner (hier ''Daheim'') freigeben ====
+
 
 +
==== Freigabe des Ausgabeordner (hier ''Daheim'') ====
 +
 
  
 
* Rechtsklick auf den Ordner
 
* Rechtsklick auf den Ordner
Zeile 49: Zeile 50:
 
*** Benutzer auswählen, die Zugriff darauf haben sollen
 
*** Benutzer auswählen, die Zugriff darauf haben sollen
  
Diese Benutzer müssen auf dem Rechner, auf dem der Recognition Server läuft, angelegt sein und ein Zugang mit Passwort haben.
+
 
 +
Diese Benutzer müssen auf dem Rechner, auf dem der Recognition Server läuft, mit Passwort angelegt sein.
  
 
* ''Jeder'' entfernen
 
* ''Jeder'' entfernen
Zeile 60: Zeile 62:
 
**** Ändern
 
**** Ändern
 
**** Lesen
 
**** Lesen
 +
  
 
Die Ordner werden jetzt auf den Rechnern, auf denen die Korrekturstation installiert werden soll, als Netzlaufwerk eingebunden.
 
Die Ordner werden jetzt auf den Rechnern, auf denen die Korrekturstation installiert werden soll, als Netzlaufwerk eingebunden.
Zeile 69: Zeile 72:
 
*** Pfad zum Recognition Server eingeben/auswählen
 
*** Pfad zum Recognition Server eingeben/auswählen
 
*** Verbindung bei Anmeldung wiederherstellen
 
*** Verbindung bei Anmeldung wiederherstellen
*** ''Fertig stellen''
+
*** Fertig stellen
  
 
=== Workfloweinstellungen ===
 
=== Workfloweinstellungen ===
 +
 +
  
 
[[Bild:Erweiterte_Workfloweinstellungen.png|600px|center]]
 
[[Bild:Erweiterte_Workfloweinstellungen.png|600px|center]]
 +
 +
  
 
====Zur Erklärung des Punktes "Entzerren":====
 
====Zur Erklärung des Punktes "Entzerren":====
 +
  
 
Diese Option richtet das Bild anhand von Linien aus. Sind diese wie in diesem Beispielbild - die trapezförmige Daheim-Fahne - sieht die Ausgabe folgendermaßen aus:
 
Diese Option richtet das Bild anhand von Linien aus. Sind diese wie in diesem Beispielbild - die trapezförmige Daheim-Fahne - sieht die Ausgabe folgendermaßen aus:
 +
 +
  
 
[[Bild:Daheim-Titelseite gerade.png|600px|center]]
 
[[Bild:Daheim-Titelseite gerade.png|600px|center]]
 +
 +
  
 
Das Programm richtet die lange Kante der Fahne horizontal aus, da es diese als Referenz für die Ausrichtung ansieht. Daher sollte in solchen Fällen die Option ''Entzerren'' deaktiviert werden.
 
Das Programm richtet die lange Kante der Fahne horizontal aus, da es diese als Referenz für die Ausrichtung ansieht. Daher sollte in solchen Fällen die Option ''Entzerren'' deaktiviert werden.
 +
 +
  
 
[[Bild:Daheim-Titelseite schief.png|600px|center]]
 
[[Bild:Daheim-Titelseite schief.png|600px|center]]
  
 
=== Qualitätskontrolle ===
 
=== Qualitätskontrolle ===
 +
  
 
Für Dokumente mit sehr einfachen Formatierungen (z.B. reiner Fließtext) und mit nur wenigen Abbildungen, kann ''Keine Überprüfung'' gewählt werden. Ein Beispiel für eine relativ unproblematische Seite:
 
Für Dokumente mit sehr einfachen Formatierungen (z.B. reiner Fließtext) und mit nur wenigen Abbildungen, kann ''Keine Überprüfung'' gewählt werden. Ein Beispiel für eine relativ unproblematische Seite:
 +
 +
  
 
[[Bild:Fließtextseite.png|600px|center]]
 
[[Bild:Fließtextseite.png|600px|center]]
 +
 +
  
 
Bei Dokumenten mit aufwändigeren Formatierungen sollte hingegen ''Alle Dokumente überprüfen'' gewählt werden, da sonst häufig die segmentierten Bildunterschriften entweder in den Fließtext mit einbezogen oder als separates Textsegment erfasst wird. Das bringt die Lesereihenfolge durcheinander. Ein Beispiel für ein komplexe Formatierung:
 
Bei Dokumenten mit aufwändigeren Formatierungen sollte hingegen ''Alle Dokumente überprüfen'' gewählt werden, da sonst häufig die segmentierten Bildunterschriften entweder in den Fließtext mit einbezogen oder als separates Textsegment erfasst wird. Das bringt die Lesereihenfolge durcheinander. Ein Beispiel für ein komplexe Formatierung:
 +
 +
  
 
[[Bild:Komplexe_Formatierung.png|600px|center]]
 
[[Bild:Komplexe_Formatierung.png|600px|center]]
Zeile 97: Zeile 118:
 
=Trainingsdaten=
 
=Trainingsdaten=
 
==Einbinden von Trainingsdaten==
 
==Einbinden von Trainingsdaten==
=== Neue Sprache in ''FineReader'' erstellen und dem Recognition Server übergeben ===
+
=== Trainingsdatei für Schriftzeichen erstellen ===
 +
 
 +
Erkennt der Recognition Server bestimmte Zeichen nicht, können diese mittels einer Trainingsdatei im FineReader erstellt, als .fbt-Datei exportiert und im Recognition Server importiert werden. Eine Testversion des FineReaders kann man auf der Abbyy-Seite herunterladen.
  
In dieser kann der Zeichensatz ausgewählt werden und nicht vorkommende Zeichen entfernt, z.B. das @-Zeichen. Dieses kommt in älteren Schriften nicht vor, wird aber hin- und wieder mal als solches erkannt.
+
Zum Erstellen einer Trainingsdatei (Im Beispiel eine Frakturschrift) wählen Sie die Option ''Verwenden Sie das Training zum Erkennen neuer Zeichen und Ligaturen'' aus. Anschließend auf ''Seite erkennen'' klicken. Es öffnet sich der ''Mustertraining''-Dialog.
  
Hierzu im FineReader folgendermaßen vorgehen:
 
* Optionen
 
* Werkzeuge
 
** Sprachen
 
** Neu
 
*** Eine neue Sprache anhand einer bestehenden erstellen
 
*** OK
 
*** Erweitert
 
Nun können unzulässige Zeichen eingetragen werden; direkt hintereinander ohne Leerzeichen oder andere Trennzeichen.
 
  
[[Bild:Verarbeitung.png]]
+
[[Bild:Training_Benutzermuster.png|600px|center]]
  
=== Trainingsdatei für Schriftzeichen erstellen ===
 
  
Erkennt der Recognition Server bestimmte Zeichen nicht, können diese mittels einer Trainingsdatei im FineReader erstellt, als .fbt-Datei exportiert und im Recognition Server importiert werden. Eine Testversion des FineReaders kann man auf der Abbyy-Seite herunterladen.
 
  
Zum Erstellen einer Trainingsdatei (Im Beispiel eine Frakturschrift) wählen Sie die Option ''Verwenden Sie das Training zum Erkennen neuer Zeichen und Ligaturen'' aus. Anschließend auf ''Seite erkennen'' klicken. Es öffnet sich der ''Mustertraining''-Dialog.
+
Das ''M'' wurde hier nicht vollständig segmentiert, daher mit dem Doppelpfeil >> das Segment erweitern, bis es vollständig umschlossen ist. Anschließend auf ''Training'' klicken. Sollten Segmente über ein Zeichen hinaus ragen, so können diese analog mit dem Doppelpfeil << verkleinert werden.
  
[[Bild:Training_Benutzermuster.png|600px|center]]
 
  
 
[[Bild:Mustertraining.png|600px|center]]
 
[[Bild:Mustertraining.png|600px|center]]
  
Das ''M'' wurde hier nicht vollständig segmentiert, daher mit dem Doppelpfeil >> das Segment erweitern, bis es vollständig umschlossen ist. Anschließend auf ''Training'' klicken. Sollten Segmente über ein Zeichen hinaus ragen, so können diese analog mit dem Doppelpfeil << verkleinert werden.
+
 
  
 
[[Bild:Mustertraining_2.png|600px|center]]
 
[[Bild:Mustertraining_2.png|600px|center]]
 +
 +
  
 
Das Training kann jederzeit über die Schaltfläche ''Schließen'' beendet werden.
 
Das Training kann jederzeit über die Schaltfläche ''Schließen'' beendet werden.
Zeile 132: Zeile 145:
 
*Werkzeuge
 
*Werkzeuge
 
** Mustereditor
 
** Mustereditor
 +
  
 
gesichtet, und deren Eigenschaften (Fett, Kursiv...) angepasst werden:
 
gesichtet, und deren Eigenschaften (Fett, Kursiv...) angepasst werden:
  
[[Bild:Benutzermuster.png]]
+
 
 +
 
 +
[[Bild:Benutzermuster.png|600px|center]]
 +
 
 +
 
  
 
Um zu prüfen, ob die Erkennungsgenauigkeit mit der Trainingsdatei besser ist als ohne, kann man im FineReader schon mal einige Seiten mit und ohne den integrierten Mustern erkennen lassen.
 
Um zu prüfen, ob die Erkennungsgenauigkeit mit der Trainingsdatei besser ist als ohne, kann man im FineReader schon mal einige Seiten mit und ohne den integrierten Mustern erkennen lassen.
Zeile 143: Zeile 161:
 
** OCR
 
** OCR
 
*** Benutzerdefinierte Muster und Sprachen speichern
 
*** Benutzerdefinierte Muster und Sprachen speichern
 +
  
 
exportiert und hier dem Recognition Server übergeben werden:
 
exportiert und hier dem Recognition Server übergeben werden:
  
[[Bild:Benutzermuster_Explorer.png]]
 
  
[[Bild:Benutzermuster_hinzufügen.png]]
+
 
 +
[[Bild:Benutzermuster_Explorer.png|600px|center]]
 +
 
 +
 
 +
 
 +
[[Bild:Benutzermuster_hinzufügen.png|600px|center]]
  
 
=Korrektur=
 
=Korrektur=
  
==Besonderheiten der Drucktype ''Gothic''==  
+
==Besonderheiten ==  
  
===Nicht eingelesene Seitenzahlen===
 
  
Sollte ein Textsegment, z.B. Seitenzahl, trotz Segmentierung nicht angezeigt werden, klickt man im linken Fenster mit der linken Maustaste doppelt auf das Segment. Jetzt sollte es im rechten Fenster erscheinen und der Cursor blinken. Nun kann die Seitenzahl eingetragen werden.
+
=== Seitenzahlen werden nicht angezeigt ===
  
[[Bild:Nicht_eingelesene_Seitenzahlen.png]]
+
Sollte ein Textsegment, z.B. Seitenzahl, trotz Segmentierung nicht angezeigt werden, prüft man, ob die Schriftfarbe die gleiche wie die Hintergrundfarbe ist. Hierzu klickt man im rechten Fenster zum Öffnen der Textformatierungsoptionen auf den Doppelpfeil. Im Feld ''Schriftfarbe'' auf das Farbfeld klicken und Schwarz auswählen.
 +
 
 +
 
 +
[[Bild:Nicht_eingelesene_Seitenzahlen_Schriftfarbe.png]]
 +
 
 +
 
 +
=== Besonderheit bei Drucktyp ''Gothic'' bei der Erstellung neuer Textsegmente ===
  
===Einstellungen in der Korrekturstation===
 
  
====Rechtschreibprüfung====
+
Wenn ein neues Textsegment erstellt wird, so ist die Drucktype auf ''Default'' eingestellt. Dies schließt "normale" Drucktypen wie Antiqua ein. Sind jedoch andere Drucktypen, wie etwa Fraktur zu erkennen, muss die Drucktype jedes mal auf ''Gothic'' geändert werden.
  
Diese führt in der Korrekturstation früher oder später zu Programmfehlern und zum Absturz. Alternativ kann eine txt-Datei als Wörterbuch im Recognition Server eingebunden werden. Diese wird mit UTF-16 angelegt und jedes Wort in eine eigene Zeile eingetragen.
 
Hinzugefügt wird es im Reiter 2 ''Verarbeitung''.
 
  
  
[[Bild:Rechtschreibprüfung.PNG]]
+
[[Bild:Neue_Textbox.png]]
  
====Neue Textsegmente erstellen====
 
  
Wenn ein neues Textsegment erstellt wird, so ist die Drucktype auf ''Default'' eingestellt. Dies schließt "normale" Drucktypen wie Antiqua ein. Sind jedoch andere Drucktypen, wie etwa Fraktur zu erkennen, muss die Drucktype jedes mal auf ''Gothic'' geändert werden.
 
  
 
Anschließend muss die Textreihenfolge noch kontrolliert und korrigiert werden.
 
Anschließend muss die Textreihenfolge noch kontrolliert und korrigiert werden.
 +
 +
 +
===Einstellungen in der Korrekturstation===
 +
 +
====Rechtschreibprüfung====
 +
 +
Diese führt in der Korrekturstation früher oder später zu Programmfehlern und zum Absturz. Alternativ kann eine txt-Datei als Wörterbuch im Recognition Server eingebunden werden. Diese wird im UTF-16-Format angelegt und jedes Wort in eine eigene Zeile eingetragen.
 +
 +
'''Hinzugefügt wird es im Reiter 2 ''Verarbeitung''. -> INTERNER LINK ZU WORKFLOW -> WORKFLOWEINSTELLUNGEN'''
 +
 +
[[Bild:Rechtschreibprüfung.PNG|600px|center]]
  
 
=Fehlermeldungen=
 
=Fehlermeldungen=
Zeile 188: Zeile 222:
 
[[Bild:Abbyy_Fehlermeldungen_1.png]]
 
[[Bild:Abbyy_Fehlermeldungen_1.png]]
 
<headertabs />
 
<headertabs />
 +
{{Sprachauswahl|Tutorial Abby Recognition Server (en)|Tutorial Abby Recognition Server}}

Aktuelle Version vom 19. September 2017, 09:29 Uhr

[bearbeiten]

Tutorial Abbyy Recognition Server

Installation und Einrichtung des Recognition Servers

Hinweis: Diese Dokumentation geht auf die nötigen Vorbereitungen und Besonderheiten bei der OCR der Zeitschrift Daheim (und ähnliche Digitalisate) ein, die in der Dokumentation des Abbyy Recognition Servers und der dazugehörigen Korrekturstation nicht beschrieben werden.

Installationsdialog.png


Die Einstellungen können so übernommen werden.

Auswählen des Benutzerkontos

Benutzerkonto.png


Die Dokumentation des Recognition Servers bezieht sich auf eine Windows-Umgebung mit Windows-Netzlaufwerken. Sollen die OCR-Ergebnisse auf einem Windows-Netzlaufwerk gespeichert werden, so muss ein Benutzerkonto/User account ausgewählt werden, der Berechtigungen zum Zugriff auf das Netzwerk hat. Der lokale Benutzer hat diese Rechte nicht.

Es bietet sich an, das Netzwerkdienstkonto auszuwählen, da dieses über Berechtigungen zum Zugriff auf Netzwerkressourcen besitzt.

In unserem Fall handelte es sich um eine Novell-Umgebung mit Novell-Netzlaufwerken. Das Speichern der OCR-Ergebnisse auf diesen Laufwerken war uns nicht möglich. Die Meldung im Recognition Server besagte, dass auf das Netzlaufwerk nicht zugegriffen werden konnte. Somit konnten die Ergebnisse nur auf dem lokalen ABBYY-Server gespeichert, und dann mit einem Synchronisationsprogramm auf ein Netzlaufwerk kopiert werden.

Erstellen eines Workflows

Anlegen der Ordnerstruktur

Es empfiehlt sich, folgende Ordnerstruktur zur Kontrolle des Worflows anzulegen:


Ordnerstruktur.PNG


  • _Input
    • Hier werden die zu erkennenden Scans eingefügt
  • _Output
    • hier werden die Ergebnisse der OCR abgelegt


Freigabe des Ausgabeordner (hier Daheim)

  • Rechtsklick auf den Ordner
    • Freigeben für -> erweiterte Freigabe
    • Erweiterte Freigabe
    • Haken bei Diesen Ordner freigeben setzen
    • Berechtigungen
      • Benutzer auswählen, die Zugriff darauf haben sollen


Diese Benutzer müssen auf dem Rechner, auf dem der Recognition Server läuft, mit Passwort angelegt sein.

  • Jeder entfernen
    • Hinzufügen
      • Erweitert
        • Jetzt suchen
        • Benutzer wählen
        • OK -> OK
      • Berechtigungen aktivieren
        • Ändern
        • Lesen


Die Ordner werden jetzt auf den Rechnern, auf denen die Korrekturstation installiert werden soll, als Netzlaufwerk eingebunden.

  • Windows-Explorer öffnen
    • Extras
    • Netzlaufwerk verbinden
      • Laufwerksbuchstabe wählen
      • Pfad zum Recognition Server eingeben/auswählen
      • Verbindung bei Anmeldung wiederherstellen
      • Fertig stellen

Workfloweinstellungen

Erweiterte Workfloweinstellungen.png


Zur Erklärung des Punktes "Entzerren":

Diese Option richtet das Bild anhand von Linien aus. Sind diese wie in diesem Beispielbild - die trapezförmige Daheim-Fahne - sieht die Ausgabe folgendermaßen aus:


Daheim-Titelseite gerade.png


Das Programm richtet die lange Kante der Fahne horizontal aus, da es diese als Referenz für die Ausrichtung ansieht. Daher sollte in solchen Fällen die Option Entzerren deaktiviert werden.


Daheim-Titelseite schief.png

Qualitätskontrolle

Für Dokumente mit sehr einfachen Formatierungen (z.B. reiner Fließtext) und mit nur wenigen Abbildungen, kann Keine Überprüfung gewählt werden. Ein Beispiel für eine relativ unproblematische Seite:


Fließtextseite.png


Bei Dokumenten mit aufwändigeren Formatierungen sollte hingegen Alle Dokumente überprüfen gewählt werden, da sonst häufig die segmentierten Bildunterschriften entweder in den Fließtext mit einbezogen oder als separates Textsegment erfasst wird. Das bringt die Lesereihenfolge durcheinander. Ein Beispiel für ein komplexe Formatierung:


Komplexe Formatierung.png

Einbinden von Trainingsdaten

Trainingsdatei für Schriftzeichen erstellen

Erkennt der Recognition Server bestimmte Zeichen nicht, können diese mittels einer Trainingsdatei im FineReader erstellt, als .fbt-Datei exportiert und im Recognition Server importiert werden. Eine Testversion des FineReaders kann man auf der Abbyy-Seite herunterladen.

Zum Erstellen einer Trainingsdatei (Im Beispiel eine Frakturschrift) wählen Sie die Option Verwenden Sie das Training zum Erkennen neuer Zeichen und Ligaturen aus. Anschließend auf Seite erkennen klicken. Es öffnet sich der Mustertraining-Dialog.


Training Benutzermuster.png


Das M wurde hier nicht vollständig segmentiert, daher mit dem Doppelpfeil >> das Segment erweitern, bis es vollständig umschlossen ist. Anschließend auf Training klicken. Sollten Segmente über ein Zeichen hinaus ragen, so können diese analog mit dem Doppelpfeil << verkleinert werden.


Mustertraining.png


Mustertraining 2.png


Das Training kann jederzeit über die Schaltfläche Schließen beendet werden. Die trainierten Schriftzeichen können über

  • Werkzeuge
    • Mustereditor


gesichtet, und deren Eigenschaften (Fett, Kursiv...) angepasst werden:


Benutzermuster.png


Um zu prüfen, ob die Erkennungsgenauigkeit mit der Trainingsdatei besser ist als ohne, kann man im FineReader schon mal einige Seiten mit und ohne den integrierten Mustern erkennen lassen.

Die Trainingsdatei kann im FineReader über

  • Werkzeuge
    • OCR
      • Benutzerdefinierte Muster und Sprachen speichern


exportiert und hier dem Recognition Server übergeben werden:


Benutzermuster Explorer.png


Benutzermuster hinzufügen.png

Besonderheiten

Seitenzahlen werden nicht angezeigt

Sollte ein Textsegment, z.B. Seitenzahl, trotz Segmentierung nicht angezeigt werden, prüft man, ob die Schriftfarbe die gleiche wie die Hintergrundfarbe ist. Hierzu klickt man im rechten Fenster zum Öffnen der Textformatierungsoptionen auf den Doppelpfeil. Im Feld Schriftfarbe auf das Farbfeld klicken und Schwarz auswählen.


Nicht eingelesene Seitenzahlen Schriftfarbe.png


Besonderheit bei Drucktyp Gothic bei der Erstellung neuer Textsegmente

Wenn ein neues Textsegment erstellt wird, so ist die Drucktype auf Default eingestellt. Dies schließt "normale" Drucktypen wie Antiqua ein. Sind jedoch andere Drucktypen, wie etwa Fraktur zu erkennen, muss die Drucktype jedes mal auf Gothic geändert werden.


Neue Textbox.png


Anschließend muss die Textreihenfolge noch kontrolliert und korrigiert werden.


Einstellungen in der Korrekturstation

Rechtschreibprüfung

Diese führt in der Korrekturstation früher oder später zu Programmfehlern und zum Absturz. Alternativ kann eine txt-Datei als Wörterbuch im Recognition Server eingebunden werden. Diese wird im UTF-16-Format angelegt und jedes Wort in eine eigene Zeile eingetragen.

Hinzugefügt wird es im Reiter 2 Verarbeitung. -> INTERNER LINK ZU WORKFLOW -> WORKFLOWEINSTELLUNGEN

Rechtschreibprüfung.PNG

Fehlermeldungen...

treten auf bei:

  • Benutzung der Zwischenablage (Copy & Paste)
  • Benutzung der Rechtschreibprüfung
  • Eher selten im laufenden Betrieb. Dann jedoch sollte die Korrekturstation komplett geschlossen werden, da sie sonst die gleichen Fehler immer wieder und hintereinander liefert.


Abbyy Fehlermeldungen 1.png