ABBYY Finereader 9 - Dokument einlesen

  • geschlossen

Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

  • ABBYY Finereader 9 - Dokument einlesen

    Hallo Leute hier ist nun mal eine kurze Anleitung, wie man mit dem Finereader in Version 9
    eine Bilddatei oder .pdf mit maschinengeschriebenem Textinhalt digitalisiert
    - zur Weiterverarbeitung in Word beispielsweise:

    [ich hoffe, dass die großen Bilder nicht den Rahmen sprengen, aber man sollte sie ja schon lesen können]

    Über Datei -> Datei scannen bzw. PDF-Datei/ Bild öffnen gelangt man zur Ordnerauswahl und nach Bestätigen erscheint der folgende Dialog:
    bei mir ist eine SoftwareHilfe im pdf-Format geöffnet worden



    währenddessen ist schon eine Bearbeitung möglich, aber es geht natürlich zügiger, wenn man den Ladestand abwartet.
    Das Einlesen bedeutet, dass nun die Software die Zeichen als Buchstaben der jeweiligen Sprache zu entziffern versucht.
    Links ist die Seitenansicht zur schnellen Navigation, wichtiger ist aber der dreigeteilte Mittelbereich:
    links ist dort das Originaldokument, unten in der Vergrößerung und rechts das wichtige Feld,
    in dem sich zeigt, ob das Einlesen erfolgreich war und die Worte korrekt geschrieben wurden.


    Wie nun der folgende Ausschnitt zeigt, ist das gesamte Bild im Dokument (Screenshot aus dem Installationsprogramm) nicht erkannt.
    Erkennbar am roten Rahmen im linken Feld und deutlich sichtbar im rechten Bereich, dort fehlt auch jegliche Formatierung des restlichen Textes.



    Nun muss das Einlesen neugestartet werden, indem man beispielsweise über Dokument -> Dokument lesen oder Dokumentlayout analysieren
    einen weiteren Durchlauf der Zeichenerkennung und der Formatierungserkennung erzwingt.
    Der Text an sich wird schon beim ersten Mal weitesgehend richtig erkannt, doch die Absätze und Schriftarten und besondere Formatoptionen nicht unbedingt.


    Bei nur wenigen roten Stellen im linken Bereich und guter Umsetzung im rechten Bereich kann auch die betroffenen Stelle durch Rechtsklick -> Bereich lesen erkannt werden:



    In diesem Fall ist der Bereich für Finereader nicht einfach erkennbar und es ist möglcih, ein Bild aus dem Dokument einzufügen,
    dann allerdings ohne den Text weiterbearbeiten zu können.



    Ansonsten empfiehlt es sich in der Hilfe zu lesen, denn es sollte eigentlich ohne weiteres (also eingehändiges Abtippen des Textes) möglich sein,
    auch komplexe Textstrukturen zu erkennen.


    Bei Anregungen ruhig mal anschreiben ;)

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von Himbeer () aus folgendem Grund: Link hinzugefügt

  • Sehr gute Anleitung! Da steckt viel Arbeit drin, ich sage mal stellvertretend DANKE.

    Anmerkung: Es geht auch noch auf einem anderen Weg, z.B. lasse ich das PDF-Dokument durch einen "PDF-Grabber" laufen und als Word-Dokument abspeichern. Das hat den großen Vorteil, dass Text- und Zeichenformatierungen, Tabellen, Bilder und Grafiken weitgehend erhalten bleiben bzw. wiederhergestellt werden (Excel-Sheet kann anschließend wieder in Excel bearbeitet werden).

    mfg, gxgallery
    [COLOR="Navy"][SIZE="2"][FONT="Arial"]
    "Die Benutzung des Gehirns ist nicht illegal...
    ... sondern ausdrücklich erwünscht, kostenlos und nie umsonst."
    [/FONT][/SIZE][/color]
  • das müste in ähnlicher Form auch in der Version 8 funktionieren, vielelicht andere Bennenung der Funktionen, aber sehr ähnlich und meines Wissens mit einem Schritt-für-Schritt-Assistenten


    so spontan würde ich sagen es tut sich nichts, ob ich den PDF Grabber nehme oder den Finereader -welcher noch ein bisserl mehr einlesen kann und auch geschützte Dokumente!