Hallo alle,
Problem: ich scanne oft Papier-Dokumente (beispielsweise Bankbelege, Behördenpost, also nur Text, evtl. Linien usw, aber keine Fotos) und speichere das Ergebnis als PDF. Die PDF-Datei wird aber leider zu groß. Grund: Das PDF enthält lauter unwichtige Informationen als Faksimilie, z.B. Eselsohren, Schatten, Knitter im Papier usw. Vor allem aber sind im PDF die Buchstaben nicht als solche gespeichert, sondern als Grafiken.
Ich suche also eine Möglichkeit, dieses PDF zu verkleinern, indem der gescannte Text erkannt wird (OCR). Das Ergebnis soll wieder eine PDF-Datei (!) sein, in der das Layout des ursprünglichen PDF mit reinem Text nachgebildet wird. Die Ziel-PDF-Datei ist dann natürlich sehr klein. Vielleicht ist so ein Programm sogar in der Lage, beispielsweise waagerechte Linien mit Minuszeichen nachzubilden, oder die verwendete Schriftart (mit/ohne Serifen) zu erkennen und möglichst eine passende Systemschrift zu wählen (Arial/Times/Courier).
Wichtig ist mir also, daß das Layout der Originaldatei (wo auf der Seite befindet sich welcher Text, in welcher Schriftgröße) erhalten bleibt.
Das Programm soll also ein Grafik-PDF in ein Text-PDF umwandeln und dabei aber vor allem das Textlayout beibehalten.
Wer kennt eine Lösung (möglichst als Freeware/Shareware)?
Herzlichen Dank, viele Grüße aus München
nmh