Meine Papier-Bücher digitalisieren

  • Frage

  • rubensengel
  • 1377 Aufrufe 1 Antwort

Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

  • Meine Papier-Bücher digitalisieren

    Hallo Leseratten, ich will mir meine vorhandenen Bücher gerne einscannen und dann in ein E Book format umwandeln geht das, und mit welchen programm wäre das machbar? Würde mich über Tips von euch freuen. LG
  • Hat man das ganze Buch gescannt, muß esfür OCR vorbereitet werden. Dazu werden im Acrobat alle Seiten beschnitten, damit die Seitenzahlen und anderer Text außerhalb desSatzspiegels entfernt wird. Hierbei wird außerdem kontrolliert, ob derScan vollständig war und es werden alle Leerseiten gelöscht.
    Die fertige Datei wird gespeichert und im nächsten Schritt in ABBY Finereader 11 oder 12 geladen.

    In Finereader wird das Buch automatisch in Text umgewandelt, bei Problemstellen verschluckt sich das Programm, es gibt auch Erkennungsprobleme, zum Beispiel zwischen Kombinationen von rn und m. Man muß da manchmal ganz genau hinsehen. Das Programm greift beim OCR auf eine Rechtschreibdatenbank zurück, manchmal klappt es aber nicht so ganz. Deshalb muß nach dem automatischen Erkennen im Finereader alles noch einmal manuell geprüft werden. Man sollte das Fenster mit der PDF und dem erkannten Text übereinander positionieren und alle Problemstellen, alle unterkringelten Begriffe, aber auch möglichst alles andere überprüfen.

    Zum Schluß speichert man das OCR-Ergebnis im DOC-Format. Es kann in Word oder LibreOffice/OpenOffice weiterbearbeitet werden. Zu beachten ist jedoch, daß es sich um keine echte DOC-Datei handelt, sondern um eine RTF-Datei mit der Endung DOC (Microsoft erlaubt so etwas). Diese Datei muß aber in der Textverarbeitung – das ist der nächste Schritt der Arbeit unbedingt mit Speichern unter als DOC-Datei (Word) oder im ODT-Format (Libre-/OpenOffice) gesichert werden (RTF macht nur Probleme).


    Um in LibreOffice/OpenOffice eine epub-Datei schreiben zu können, muß das Plugin writer2epub installiert sein. Man erhält es von writer2epub.it.


    Egal, mit welcher Textverarbeitung man arbeitet, das Ergebnis des OCRs muß geladen und geglättet werden. Dazu gehört in erster Linie, daß alle Abschnittswechsel gesucht und durch ein Leerzeichen ersetzt werden. Dann müssen alle Textauszeichnungen maskiert werden, am einfachsten durch HTML-Tags. In Word ruft man dazu den Suchen&Ersetzen-Dialog mit Strg-F auf, gibt als Suchstring nichts ein, aber wählt bei Format die entsprechende Auszeichnung, also kursiv, fett, Kapitälchen, unterstrichen hochgestellt, tiefgestellt und so weiter auf.


    Jetzt wird alles neu formatiert, die Kapitelüberschriften zugewiesen, die Auszeichnungen zurückformatiert und dann die Auszeichnungen gelöscht und zum Schluß müssen alle harten Trennungen gesucht und ersetzt werden, also alle Zeilen, die einen Buchstaben, ein Komma, ein Leerzeichen oder einen Strichpunkt vor dem Zeilenumbruchzeichen haben müssen geprüft und ggf. zusammengezogen werden.


    Wer mit Word arbeitet, lädt die Datei in den Atlantis Wordprocessor und generiert mit File - Save Special - Save as ebook die ePUB-Datei.


    Jetzt ist das EBook angelegt und kann in Sigil geladen werden. Hier müssen die Formate geglättet, die noch fehlende Titelseite eingebunden werden und so weiter. Außerdem sollte man einen weiteren letzten Korrekturlauf durchführen.


    Alles eine reine Fleißarbeit ;)

    Schau auch mal hier:
    Wie konvertiert man eBook-Formate?