pdf2epub - erledigt

  • geschlossen
  • Frage

  • littleprof
  • 2332 Aufrufe 5 Antworten

Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

  • pdf2epub - erledigt

    Bin nicht sicher, ob das die richtige Abteilung ist - bitte ggfls. umbetten ;)
    Bei der Umwandlung von *.pdf in *.epub hatte ich bisher keine Probleme, in der Regel über Calibre ging das schnell und komfortabel.
    Nach längerer Zeit wollte ich jetzt nochmalk eine Zeitung von pdf zu epub konvertieren, das hat aber nicht geklappt - weder mit Calibre noch mit einem online-converter.
    Es ist zwar ne epub-Datei rausgekommen, aber man kann nicht vernünftig lesen (siehe Beispielbild).
    Was läuft da schief?
    Es ist nie zu spät für eine glückliche Kindheit! (Erich Kästner)

    Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von littleprof ()

  • Hi,

    Ich nehme an, bei deinem Beispiel (screenshot) es handelte sich um einen 2-spaltigen Artikel? :denk:

    littleprof schrieb:

    Bei der Umwandlung von *.pdf in *.epub hatte ich bisher keine Probleme, in der Regel über Calibre ging das schnell und komfortabel.

    Das wage ich mal zu bezweifeln :D (dein Mißerfolg zeigt da bereits, wo die Grenzen sind)

    Schnell - ja; komfortabel - ja ... aber zufriedenstellend maximal für den Eigenbedarf, wenn man keine Ansprüche auf grübelfreie Lesbarkeit legt.

    Aus dem einfachen Grund, dass eine PDF [FESTE Zeilenumbrüche, FESTE Seitenumbrüche, u.U. Seitenzahlen) nicht ohne Nacharbeit in eine zufriedenstellende epub (html, Fliesstext OHNE Zeilenumbrüche, OHNE Seitenumbrüche (es sei denn, man setzt sie bewusst)] umgewandelt werden kann.

    Und das erklärt auch a) meine Vermutung, es handelt sich um einen 2-spaltigen Artikel und b) dein Ergebnis, das so aussieht, wie es leider aussieht.

    Für calibre (und andere Auto-Konverter) geht die Zeile von ganz links bis ganz rechts und bei einer 2-spaltigen PDF heisst das eben:

    1. Zeile 1. Spalte 1. Zeile 2. Spalte
    2. Zeile 1. Spalte 2. Zeile 2. Spalte
    3. Zeile 1. Spalte 3. Zeile 2. Spalte
    4. Zeile 1. Spalte 4. Zeile 2. Spalte

    und es gibt keine Möglichkeit, zu definieren, dass es 2 Spalten sind.


    Der ergebnisorientierte Weg wäre:

    - PDF in eine OCR-Software einlesen lassen, Absatzkontrolle, Seitenzahlen entfernen. Mit einer OCR-Software kannst du auch mehrspaltige PDF einlesen (entsprechend mit Textblöcken belegen, die dann nacheinander eingelesen werden).
    - von dort exportieren (wobei es da mehrere Möglichkeiten gibt und jeder meint, seine wäre das gelbe vom Ei)

    Meine ist:
    - nach OCR (mit Finereader) Export in Word, dort noch grobe Erkennungsfehler der OCR beseitigen (geht mit suchen/ersetzen ja ruckzuck), entsprechend Layout vornehmen, Überschriften etc. formatieren)
    - die Word-Datei mit Atlantis Word Processor Export in epub

    Keine 1-Klick-Lösung aber dafür eine "vorzeigbare" dauerhafte.

    Fazit: Eine PDF auf direktem Weg in eine flexibles digitales Format umwandeln (epub, mobi, what ever) ist eine ganz schlechte Idee und das sollte maximal (wenns denn unbedingt sein muss) ausschliesslich für den Eigenbedarf gemacht werden. Ansonsten besser 1-2 Std. Zeit aufwenden und ein halbwegs annehmbares Ergebnis erzielen :)


    ---------------------------

    Nachtrag zum Beitrag von mad.de

    Die Nutzung der heuristischen Verabeitung ändert nichts daran, dass z.B. Seitenzahlen aus PDF übernommen werden (mitten im Text), bei Seitenumbrüchen Texte nicht zusammengezogen werden UND (worauf es hier vermutlich hinausläuft) 2-spaltige PDF eben als Kauderwelsch enden, nämlich hier jetzt sogar nach folgendem Schema (wie im screenshot vom TE):

    1. Zeile 1. Spalte
    1. Zeile 2. Spalte
    2. Zeile 1. Spalte
    2. Zeile 2. Spalte
    3. Zeile 1. Spalte
    3. Zeile 2. Spalte

    usw. usf.
    Da, wo die Neurosen blüh'n, da möcht' ich Landschaftsgärtner sein!
    Rechteübersicht * Forenregeln * F.A.Q. * Lexikon
    Suchfunktion * Chat * User helfen User
    Der Minister nimmt flüsternd den Bischof beim Arm: »Halt' du sie dumm, ich halt' sie arm!« (R. Mey)
  • Vielen Dank für eure Antworten - besonders für deinen sehr ausführlichen Kommentar.
    Komisch, sonst hat das Lesen dieser Zeitschrift auf dem ereader immer geklappt. Kann jedoch sein, dass ich die letzten erfolgreichen Versuche (stammen noch aus 2016) direkt als epub angeboten wurden.
    Schade - aber 1 - 2 Stunden Arbeit für ne Wochenzeitung sind nicht unbedingt zielführend.
    Es ist nie zu spät für eine glückliche Kindheit! (Erich Kästner)
  • @littleprof

    Thementitel editieren ist nicht, was du eigentlich schon seit Jahren kennst, wenn ein Thema erledigt ist. ;)



    littleprof schrieb:

    sonst hat das Lesen dieser Zeitschrift auf dem ereader immer geklappt
    E-Reader können i.d.R. auch PDF direkt. Nur mit zoomen wirds nix, es sei denn, es ist schon ein neuerer od. einer der älteren besseren, mit "reflow"-Option für PDF (PDF mit Text unterm Seitenbild)

    Schön wäre gewesen, wenn du das Geheimnis mal gelüftet hättest (mehrspaltiger Artiekel? oder wie oder was?)

    Und zuletzt: Über wieviele Seiten reden wir denn hier? Evtl. könnte ich da ja helfen :whistling:
    Da, wo die Neurosen blüh'n, da möcht' ich Landschaftsgärtner sein!
    Rechteübersicht * Forenregeln * F.A.Q. * Lexikon
    Suchfunktion * Chat * User helfen User
    Der Minister nimmt flüsternd den Bischof beim Arm: »Halt' du sie dumm, ich halt' sie arm!« (R. Mey)
  • NeHe schrieb:

    Thementitel editieren ist nicht, was du eigentlich schon seit Jahren kennst, wenn ein Thema erledigt ist.
    Manche lernen's nie ;(
    Ich mach's auch so selten, dass ich immer wieder neu überlegen muss.

    Danke auch für die neuerlichen Hilfsangebote. Mein momentanes Zeitkontingent erlaubt keine großen Sprünge. da es aber eilte bin ich kurzerhand in die Legalität abgedriftet und hab mir für 13 Wochen ein Probe-Abo gekauft. Danach seh'n wir weiter.
    Es ist nie zu spät für eine glückliche Kindheit! (Erich Kästner)