OCR-Problem

Hallo zusammen,

ich erfasse für Verlage Texte und verwende dafür OCR. Kein Problem, wenn es sich um Fließtext handelt.

Wenn ich jedoch Gedichte erfassen muss, was in letzter Zeit vermehrt vorkommt, gibt es folgendes Problem: Meine OCR-Programme (Fine-Reader, Omnipage etc.) erkennen zwar den Zeilenfall, aber beim Exportieren in eine Word-Datei werden die Zeilen zusammengezogen, was mir viel manuelle Arbeit beschert.

Ich habe ein uraltes OCR-Programm (aus Win 3.1-Zeiten), das ich leider nicht mehr installieren kann - das lässt den Zeilenfall unverändert.

Kann mir jemand ein modernes OCR-Programm nennen mit der Option, den Zeilenfall auch in die Export-Datei zu retten?

Gruß
ThoK

Hallo Thomas,

die OCR-Programme können den gescannten Text auch als reinen (formatlose) txt-Datei ausgeben. Dabei sollten dann auch die Zeilenumbrüche erhalten bleiben.

Diese Textdatei dann anschließen in eine Worddatei und ggf. nachformatieren.

Gruß
Franz

Wenn ich jedoch Gedichte erfassen muss, was in letzter Zeit
vermehrt vorkommt, gibt es folgendes Problem: Meine
OCR-Programme (Fine-Reader, Omnipage etc.) erkennen zwar den
Zeilenfall, aber beim Exportieren in eine Word-Datei werden
die Zeilen zusammengezogen, was mir viel manuelle Arbeit
beschert.

Ich habe ein uraltes OCR-Programm (aus Win 3.1-Zeiten), das
ich leider nicht mehr installieren kann - das lässt den
Zeilenfall unverändert.

Kann mir jemand ein modernes OCR-Programm nennen mit der
Option, den Zeilenfall auch in die Export-Datei zu retten?

Gruß
ThoK

Hallo Franz,

vielen Dank, dass Du Dir Gedanken gemacht hast. Leider ist auch der Text-Export so Zeilenende-los wie der Word-Export. Habe ich schon alles mit einem Hex-Editor untersucht.

Da die Texterfassung im gewerblichen Rahmen stattfindet, ist „ggf. nachformatieren“ wegen der Menge ein untauglicher Tipp - genau das wollte ich vermeiden.

Ich werde mich an die Hersteller der OCR-Software wenden, ob die irgend einen Geheimtipp am Lager haben.

Gruß
ThoK

Hallo Thomas,

die OCR-Programme können den gescannten Text auch als reinen
(formatlose) txt-Datei ausgeben. Dabei sollten dann auch die
Zeilenumbrüche erhalten bleiben.

Diese Textdatei dann anschließend in eine Worddatei und ggf.
nachformatieren.

Gruß
Franz