Tutorial Abby Recognition Server: Unterschied zwischen den Versionen
Aus Kallimachos
| (16 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt) | |||
| Zeile 9: | Zeile 9: | ||
Die Einstellungen können so übernommen werden. | Die Einstellungen können so übernommen werden. | ||
===Auswählen des Benutzerkontos=== | ===Auswählen des Benutzerkontos=== | ||
| Zeile 30: | Zeile 25: | ||
==Erstellen eines Workflows== | ==Erstellen eines Workflows== | ||
=== Anlegen der Ordnerstruktur === | === Anlegen der Ordnerstruktur === | ||
Es empfiehlt sich, folgende Ordnerstruktur zur Kontrolle des Worflows anzulegen: | Es empfiehlt sich, folgende Ordnerstruktur zur Kontrolle des Worflows anzulegen: | ||
[[Datei:Ordnerstruktur.PNG|600px|center]] | [[Datei:Ordnerstruktur.PNG|600px|center]] | ||
* _Input | * _Input | ||
| Zeile 39: | Zeile 38: | ||
* _Output | * _Output | ||
** hier werden die Ergebnisse der OCR abgelegt | ** hier werden die Ergebnisse der OCR abgelegt | ||
==== Freigabe des Ausgabeordner (hier ''Daheim'') ==== | ==== Freigabe des Ausgabeordner (hier ''Daheim'') ==== | ||
* Rechtsklick auf den Ordner | * Rechtsklick auf den Ordner | ||
| Zeile 61: | Zeile 62: | ||
**** Ändern | **** Ändern | ||
**** Lesen | **** Lesen | ||
Die Ordner werden jetzt auf den Rechnern, auf denen die Korrekturstation installiert werden soll, als Netzlaufwerk eingebunden. | Die Ordner werden jetzt auf den Rechnern, auf denen die Korrekturstation installiert werden soll, als Netzlaufwerk eingebunden. | ||
| Zeile 73: | Zeile 75: | ||
=== Workfloweinstellungen === | === Workfloweinstellungen === | ||
[[Bild:Erweiterte_Workfloweinstellungen.png|600px|center]] | [[Bild:Erweiterte_Workfloweinstellungen.png|600px|center]] | ||
====Zur Erklärung des Punktes "Entzerren":==== | ====Zur Erklärung des Punktes "Entzerren":==== | ||
Diese Option richtet das Bild anhand von Linien aus. Sind diese wie in diesem Beispielbild - die trapezförmige Daheim-Fahne - sieht die Ausgabe folgendermaßen aus: | Diese Option richtet das Bild anhand von Linien aus. Sind diese wie in diesem Beispielbild - die trapezförmige Daheim-Fahne - sieht die Ausgabe folgendermaßen aus: | ||
[[Bild:Daheim-Titelseite gerade.png|600px|center]] | [[Bild:Daheim-Titelseite gerade.png|600px|center]] | ||
Das Programm richtet die lange Kante der Fahne horizontal aus, da es diese als Referenz für die Ausrichtung ansieht. Daher sollte in solchen Fällen die Option ''Entzerren'' deaktiviert werden. | Das Programm richtet die lange Kante der Fahne horizontal aus, da es diese als Referenz für die Ausrichtung ansieht. Daher sollte in solchen Fällen die Option ''Entzerren'' deaktiviert werden. | ||
[[Bild:Daheim-Titelseite schief.png|600px|center]] | [[Bild:Daheim-Titelseite schief.png|600px|center]] | ||
=== Qualitätskontrolle === | === Qualitätskontrolle === | ||
Für Dokumente mit sehr einfachen Formatierungen (z.B. reiner Fließtext) und mit nur wenigen Abbildungen, kann ''Keine Überprüfung'' gewählt werden. Ein Beispiel für eine relativ unproblematische Seite: | Für Dokumente mit sehr einfachen Formatierungen (z.B. reiner Fließtext) und mit nur wenigen Abbildungen, kann ''Keine Überprüfung'' gewählt werden. Ein Beispiel für eine relativ unproblematische Seite: | ||
[[Bild:Fließtextseite.png|600px|center]] | [[Bild:Fließtextseite.png|600px|center]] | ||
Bei Dokumenten mit aufwändigeren Formatierungen sollte hingegen ''Alle Dokumente überprüfen'' gewählt werden, da sonst häufig die segmentierten Bildunterschriften entweder in den Fließtext mit einbezogen oder als separates Textsegment erfasst wird. Das bringt die Lesereihenfolge durcheinander. Ein Beispiel für ein komplexe Formatierung: | Bei Dokumenten mit aufwändigeren Formatierungen sollte hingegen ''Alle Dokumente überprüfen'' gewählt werden, da sonst häufig die segmentierten Bildunterschriften entweder in den Fließtext mit einbezogen oder als separates Textsegment erfasst wird. Das bringt die Lesereihenfolge durcheinander. Ein Beispiel für ein komplexe Formatierung: | ||
[[Bild:Komplexe_Formatierung.png|600px|center]] | [[Bild:Komplexe_Formatierung.png|600px|center]] | ||
| Zeile 103: | Zeile 123: | ||
Zum Erstellen einer Trainingsdatei (Im Beispiel eine Frakturschrift) wählen Sie die Option ''Verwenden Sie das Training zum Erkennen neuer Zeichen und Ligaturen'' aus. Anschließend auf ''Seite erkennen'' klicken. Es öffnet sich der ''Mustertraining''-Dialog. | Zum Erstellen einer Trainingsdatei (Im Beispiel eine Frakturschrift) wählen Sie die Option ''Verwenden Sie das Training zum Erkennen neuer Zeichen und Ligaturen'' aus. Anschließend auf ''Seite erkennen'' klicken. Es öffnet sich der ''Mustertraining''-Dialog. | ||
[[Bild:Training_Benutzermuster.png|600px|center]] | [[Bild:Training_Benutzermuster.png|600px|center]] | ||
Das ''M'' wurde hier nicht vollständig segmentiert, daher mit dem Doppelpfeil >> das Segment erweitern, bis es vollständig umschlossen ist. Anschließend auf ''Training'' klicken. Sollten Segmente über ein Zeichen hinaus ragen, so können diese analog mit dem Doppelpfeil << verkleinert werden. | Das ''M'' wurde hier nicht vollständig segmentiert, daher mit dem Doppelpfeil >> das Segment erweitern, bis es vollständig umschlossen ist. Anschließend auf ''Training'' klicken. Sollten Segmente über ein Zeichen hinaus ragen, so können diese analog mit dem Doppelpfeil << verkleinert werden. | ||
[[Bild:Mustertraining.png|600px|center]] | [[Bild:Mustertraining.png|600px|center]] | ||
[[Bild:Mustertraining_2.png|600px|center]] | [[Bild:Mustertraining_2.png|600px|center]] | ||
Das Training kann jederzeit über die Schaltfläche ''Schließen'' beendet werden. | Das Training kann jederzeit über die Schaltfläche ''Schließen'' beendet werden. | ||
| Zeile 117: | Zeile 145: | ||
*Werkzeuge | *Werkzeuge | ||
** Mustereditor | ** Mustereditor | ||
gesichtet, und deren Eigenschaften (Fett, Kursiv...) angepasst werden: | gesichtet, und deren Eigenschaften (Fett, Kursiv...) angepasst werden: | ||
[[Bild:Benutzermuster.png|600px|center]] | [[Bild:Benutzermuster.png|600px|center]] | ||
Um zu prüfen, ob die Erkennungsgenauigkeit mit der Trainingsdatei besser ist als ohne, kann man im FineReader schon mal einige Seiten mit und ohne den integrierten Mustern erkennen lassen. | Um zu prüfen, ob die Erkennungsgenauigkeit mit der Trainingsdatei besser ist als ohne, kann man im FineReader schon mal einige Seiten mit und ohne den integrierten Mustern erkennen lassen. | ||
| Zeile 128: | Zeile 161: | ||
** OCR | ** OCR | ||
*** Benutzerdefinierte Muster und Sprachen speichern | *** Benutzerdefinierte Muster und Sprachen speichern | ||
exportiert und hier dem Recognition Server übergeben werden: | exportiert und hier dem Recognition Server übergeben werden: | ||
[[Bild:Benutzermuster_Explorer.png|600px|center]] | [[Bild:Benutzermuster_Explorer.png|600px|center]] | ||
[[Bild:Benutzermuster_hinzufügen.png|600px|center]] | [[Bild:Benutzermuster_hinzufügen.png|600px|center]] | ||
| Zeile 166: | Zeile 204: | ||
====Rechtschreibprüfung==== | ====Rechtschreibprüfung==== | ||
Diese führt in der Korrekturstation früher oder später zu Programmfehlern und zum Absturz. Alternativ kann eine txt-Datei als Wörterbuch im Recognition Server eingebunden werden. Diese wird | Diese führt in der Korrekturstation früher oder später zu Programmfehlern und zum Absturz. Alternativ kann eine txt-Datei als Wörterbuch im Recognition Server eingebunden werden. Diese wird im UTF-16-Format angelegt und jedes Wort in eine eigene Zeile eingetragen. | ||
Hinzugefügt wird es im Reiter 2 ''Verarbeitung''. | '''Hinzugefügt wird es im Reiter 2 ''Verarbeitung''. -> INTERNER LINK ZU WORKFLOW -> WORKFLOWEINSTELLUNGEN''' | ||
[[Bild:Rechtschreibprüfung.PNG|600px|center]] | [[Bild:Rechtschreibprüfung.PNG|600px|center]] | ||
=Fehlermeldungen= | =Fehlermeldungen= | ||