Sonntag, 28. Dezember 2014

vom gebundenen Buch zum epub - Teil 7: Finale - Erzeugen des epub

Nun ist es endlich soweit. Der Text ist komplett von Schreibfehlern befreit, die Textformatierung ist durchgängig gleich, die Satzzeichen haben keine Leerzeichen zum vorhergehenden Wort, die Anführungszeichen passen. Die Absätze sind korrekt, Überschriften richtig formatiert und vielleicht gibt es auch einige kursiv geschriebene Wörter im Text. Die Überschriften, die im Text als solche ausgezeichnet sind, könnten sogar in einem vorangestellten Inhaltsverzeichnis zusammengefasst werden. Ich habe allerdings festgestellt, das das im ebook nicht wirklich hilfreich ist.

Nun geht es an die Erzeugung des eigentlichen epub-Dokuments. Dazu verwendete ich Calibre, welches eine komplette Verwaltung elektronischer Bücher, sowie vielfältige Konvertier-Optionen bereithält.
Man beginnt ein neues ebook und lädt das RTF-Dokument hinein. Nun gibt es einige Metadaten, die gefüllt werden wollen. Dies sind unter andererem, der Autor, Titel des Buches, Verlag, Erscheinungsdatum und natürlich das Buchcover. Ist das alles richtig ausgefüllt, kann das Buch zum EPUB konvertiert werden. Ein Probelesen auf dem ebook-Reader zeigt vielleicht noch die Eine oder Andere Macke, aber prinzipiell ist das Buch nun ein vollständiges, funktionsfähiges ebook.

Noch eine wichtige Anmerkung zum Schluss betrifft das Copyright und das Vervielfältigen des Buches: Das Buch darf ohne Erlaubnis des Verlages und des Autors nicht kopiert werden! Für den privaten Gebrauch ist das vielleicht noch o.k. (wo kein Kläger, da kein Richter), aber die Gerichte haben in der Vergangenheit jede Menge Verfahren deswegen geführt und führen sie immer noch.

Also wichtig: Das ebook darf den eigenen Haushalt nicht verlassen!!

Dienstag, 23. Dezember 2014

vom gebundenen Buch zum epub - Teil 6: redigieren des Textes

nachdem nun der Text in der Textverarbeitung vorliegt, ist leider noch nicht alles erledigt. Eigentlich kommt jetzt der zeitaufwändige Teil - das Korrigieren der Übertragungsfehler im Text. Mal wurde ein ft zu A oder ein m zum rn. Bei mir waren die ? häufig 7 und komischerweise wü immer WÜ. Auch die "»" und "«" haben's irgendwie nicht immer geschafft. Da hilft leider nur: den ganzen Text durchlesen und korrigieren. Extrem hilfreich hat sich da die Rechschreibkontrolle meiner Textverarbeitung gezeigt. Die immer wieder angemakelten Eigennamen der Protagonisten habe ich kurzerhand ins Wörterbuch mit aufgenommen. So lese ich jetzt den Text zwar nicht in meinem ebook-Reader, sondern am PC, aber es geht ganz flüssig voran. Wenn der ganze Text dann keine Rechtschreibfehler mehr hat, werde ich nochmal die Leerzeichen vor den Satzzeichen entfernen, denn da hat die OCR komplett versagt. Das geht aber glücklicherweise mit einfachem Erstzen von " ?" zu "?" oder " ." zu ".".
Bis Weihnachten wird's wohl jetzt nichts mehr mit dem fertigen Text, aber das Buch wollte ich ja sowieso lesen...

Sonntag, 21. Dezember 2014

vom gebundenen Buch zum epub - Teil 5: das Extrahieren des Textes

bei diesem Schritt zeigt sich schnell, wieviel Zeit noch in eine Nacharbeit gesteckt werden muss. Die OCR kann nur wirklich gute Vorlagen mit geringer Fehlerquote verarbeiten. Ist die Auflösung zu klein oder zu viele Verschmutzungen auf der Seite, wird der Text falsch erkannt und man muss entweder nachabeiten oder nochmal einscannen. Ich habe feststellen müssen, dass ich manche Seiten nicht scharf abgelichtet hatte. Die OCR mühte sich redlich, erkannte aber beinahe die Hälfte des Textes dieser Seite nicht.
Ich habe übrigens eine alte, mal in einem PC-Magazin veröffentlichte ReadIris-Version benutzt. Da ich nur maximal 50 Seiten in einem Rutsch durchlaufen lassen konnte, musste ich mehrere Ausgangsdateien erzeugen 1-50, 51-100,...
Das Ergebnis ist übrigens eine RTF-Datei, die mit gängiger Textverarbeitung geöffnet werden kann.

Die erste Runde hatte ich mit der Option "volle Formatierung behalten" erkennen lassen. Das führte jedoch dazu, dass jede Seite in einen Textkasten, zum Teil sogar in mehrere eingebettet war. Das Layout ist zwar weitgehend zu dem im Buch identisch, wir wollen aber lieber einen Fließtext, den ich ja noch weiterbearbeiten muss. Hier bietet sich die Option "Wort und Paragraph-Formatierung beibehalten" an.

vom gebundenen Buch zum epub - Teil 4: Vorbereitungen für das Extrahieren des Textes

nun sind alle Seiten fotografiert und liegen, nach gerade/ungerade sortiert, in getrennten Ordnern. Die Bilder haben allerdings fortlaufende Nummern in den Dateinamen. Das passt natürlich nicht zu den Seitennummern. Ich habe hier das Bulk Renaming Utility benutzt, um die ungeraden Seiten 1.jpg, 3.jpg, 5.jpg, usw., sowie die geraden Seiten 2.jpg, 4.jpg, usw. umzubennen. Anschließend kann man nochmal - zur Kontrolle - die Bilder mit deren Dateinamen vergleichen.



Man könnte jetzt direkt die OCR drüber laufen lassen, würde aber reichlich viel Kram um das Buch herum mit verarbeiten müssen. Deswegen habe ich den Scan Tailor benutzt, um nochmal etwas bessere Vorlagen zu bekommen. Das Tool macht folgendes:

  • Drehen der Seiten (deswegen die zwei Verzeichnisse für gerade/ungerade, weil so alle Bilder in einem Rutsch gedreht werden können)
  • Zerschneiden der Buchseiten (ist zwar eigentlich für Doppelseiten gedacht, hilft aber hier ebenfalls, um die Ränder wegzuscheinden)
  • Geraderücken der Seiten (falls das Buch oder die Kamera etwas verdreht war)
  • Lokalisieren der Bereiche mit Text
  • Entzerren von schräg abfotografierten Seiten (funktioniert aber nur in Grenzen)
  • Umwandeln in schwarz-weiße Bilder. Alles drumrum ist jetzt weg
Die Automatik ist ganz gut, manche Seiten werden allerdings total vermurkst. Hier lohnt es sich, während des Prozesses ggf. die Automatik auszuschalten und manuell auszuwählen.
Wenn man sich die Ergebnisbilder nochmal in der Vorschau von Scan Tailor oder einer externen Bildbearbeitung ansieht, erkennt man schnell, welche Seiten nicht gut sind und evtl. sogar noch einmal eingescannt werden sollten. Lieber einmal mehr draufschauen und in den ersten Schritten Sorfalt walten lassen, sonst hängt man nachher dran und verbrät die Zeit...
Passt das soweit, kopiert man alles zusammen in einen Ordner und hat eine fortlaufend nummerierte Sammlung an Bildern.



Samstag, 20. Dezember 2014

vom gebundenen Buch zum epub - Teil 3: das Abfotografieren

Nachdem nun die Eigenbau-Buchscanner-Hardware zusammengebaut ist, geht es an's Abfotografieren der einzelnen Buchseiten.















Ich habe zuerst alle ungeraden Seiten, danach alle geraden Seiten abfotografiert. (Achtung: die Bilder der geraden/ungeraden Seiten kommen auf dem PC in getrennte Verzeichnisse, sonst tut man sich später schwer, die Reihenfolge zusammenzubasteln.) Dazu pplatzierte ich das Buch auf den Buchständer, schlug die erste Seite auf und legte die Plexiglasplatte auf die zu fotografierende Seite. Das Licht kommt von schräg seitlich, spiegelt also nicht in die Kamera. Die Kamera wird ausgerichtet und fokussiert, dann abgedrückt. Fertig ist die erste Seite. Nun nur noch umblättern, Plexiglas drauf und wieder abdrücken.














Wenn man da mal in den Ablauf reinkommt, ist in 30 min die eine Hälfte des 500 Seiten-Schmökers im Kasten. Man muss eben aufpassen, dass man beim Abdrücken des Auslösers die Ausrichtung der Kamera nicht verschiebt. Nun dreht man das Buch um und beginnt wieder von Vorne, diesmal jedoch die geraden Seiten. Nach etwa einer Stunde fehlt nur noch das Cover.




vom gebundenen Buch zum epub - Teil 2: der Buchscanner

wenn man so im Internet nach Buchscannern sucht, fällt auf, dass es vom Zerlegen des Buches in Einzelblätter, über das einfache Abfotografieren, bis hin zum vollautomatischen Profigerät, unendlich viele Möglichkeiten gibt.
Ich habe eine recht einfache, aber funktionale Methode gewählt, die mit Dingen aus meinem Bestand auskommt.

Ich habe folgende Dinge verwendet:
  • Ein Sperrholzbrett mit ca 60x70cm als Unterlage für die Buchstütze
  • Ein gebrauchter Versandkarton mit 33x23x18cm
  • Eine helle Schreibtischleuchte
  • Ein Stativ
  • Eine Kamera
  • Eine alte, leicht zerkratzte Plexiglasscheibe mit ca 20x30cm
  • Paketklebeband
  • Cutter















Zunächst habe ich den Versandkarton ringsum zugeklebt, so dass ich eine geschlossene Pappkiste hatte. Diese habe ich dann mit dem Cutter diagonal von unten nach oben aufgeschnitten, so dass 2 offene Hälften entstanden. Nun noch ein bisschen die losen Lappen innen festgeklebt und fertig sind die Buchstützen. Diese klebte ich nun mit dem Paketklebeband so auf das Bodenbrett, dass zwischen Beiden etwa 3cm Platz für den Rücken des Buches bleibt. So ist sichergestellt, dass, wenn das Buch aufgeklappt auf der Stütze liegt, die Seiten einigermaßen flach liegen. Das ist wichtig, damit beim fotografieren der Buchseiten keine Verzerrungen entstehen. Die Buchstütze ist nun fertig und liegt auf dem Tisch in Arbeitshöhe. Daneben stelle ich das Stativ mit aufgeschnallter Kamera, die Beleuchtung kommt von der Seite, so dass keine Schatten auf die abzufotografierende Buchseite geworfen werden.















Die Wahl der Kamera scheint mir nicht so wichtig zu sein, es muss nur sichergestellt sein, dass die Auflösung einigermaßen reicht, um ca 300 dpi aufzulösen (ich hatte 6 MPixel, die definitiv extrem knapp sind, weil da nur etwa 150dpi rauskamen und viel Nacharbeit nötig wurde), die Seiten möglichst verzerrungsfrei abgelichtet werden und genügend Licht für da ist, um ohne Blitz arbeiten zu können. Ich habe meine Nikon D50 mit dem Standardobjektiv bei Brennweite 55 verwendet. So ergab sich bei einem Abstand von ca. 70cm ein formatfüllendes Abbild des Buches ohne Verzerrungen. Die Verschlusswerte waren Blende 5.6 bei 1/90s. Hier wäre mehr Licht schön gewesen, um eine kleinere Blende und damit größere Tiefenschärfe zu erreichen. Wenn das ganze Konstrukt nicht ganz rechtwinklich ist, schleicht sich leicht eine Verzerrung oder Unschärfe ein, die im weiteren Verlauf der Bearbeitung mühsam herausgerechnet werden muss.

vom gebundenen Buch zum epub - Teil 1: Vorwort

Da heute ein sehr unwirtliches Wetter herrscht, habe ich beschlossen, eines meiner Bücher mal in ein epub zu konvertieren. Ich lese viel und da ich abends im Bett bei schlechtem Licht eine Lesebrille benötige, habe ich mir schon vor einiger Zeit einen Kobo Glo Ebook-Reader gekauft. Hier habe ich den Vorteil, dass ich die Schriftgröße nahezu beliebig groß einstellen kann und außerdem eine Hintergrundbeleuchtung existiert, die ein entspanntes Lesen auch bei schlechter Beleuchtung ermöglicht.
Das epub-Format wird als Buchformat unterstützt und bietet den Vorteil, dass es mit vertretbarem Aufwand - mit Hilfe einiger Freeware- und Computerzeitschriften-Programme - zu erzeugen ist.

Ich will hier Schritt für Schritt erklären, wie ich das gemacht habe und welche Fallstricke zu umschiffen waren. Der Übersichtlichkeit halber, teile ich das Geschreibsel auf mehrere Posts auf.

Dienstag, 10. Juni 2014

ein schrägverzahntes Zahnrad gedruckt mit dem 3D-Drucker

Da mich das Drucken mit dem 3D-Drucker fasziniert, habe ich von einem Ausdruck mal ein Video gemacht. Staunt selbst...

 

Samstag, 10. Mai 2014

3D-Drucker K8200 von Velleman

seit Anfang des Jahres baue ich an einem 3D-Drucker. Ich habe mich für das Modell K8200 der Firma Velleman entschieden. Bei verschiedenen Online-Versendern kann man einen Bausatz ordern, der - mit etwas Bastelgeschick - leicht aufzubauen ist. Nun, da der Drucker funktioniert, will ich hier ein paar Bilder einstellen und ein paar Hinweise für den Aufbau und den Betrieb liefern. Der Aufbau erfordert etwa 10 Stunden.





Der Drucker hat einen X/Y-Tisch und einen Z-Antrieb in der Höhe. Die Anleitung für den Aufbau ist sehr umfangreich und sehr gut bebildert. Dadurch war es überhaupt kein Problem, das Gerät zu bauen.

Die Funktionsweise: ein dünner Kunststoffdraht (3mm PLA oder ABS) wird durch eine beheizte Düse
gedrückt und dann auf ein in beide Richtungen bewegliches Heizbett gelegt.
Ist eine Lage vollständig, wird die Z-Achse ein Stückchen nach oben gefahren und eine weitere Lage Filament aufgelegt. Durch dieses Verfahren entsteht Schicht für Schicht das fertige Bauteil. Besondere Erwähnung bedarf das Heizbett, denn es sorgt dafür, dass die erste Lage kleben bleibt, also nicht wirklich abkühlt. Die Z-Achse erfordert eine genaue Einstellung des 0-Punktes, denn es muss sichergestellt sein, dass über den kompletten Tisch der richtige Abstand eingehalten wird.
Dafür finden sich verschiedene Einstellschrauben auch unter dem Tisch.
Alles richtig eingestellt, liefert der Drucker hervorragende Ergebnisse.