Kann man beliebige Textbereiche aus PDF-Dateien kopieren, und anschliessend in einem Textprogramm
in bestimmte Schriften umwandeln ?
(Beispiel: Sie sehen ein 200 Jahre altes Buch, das aus einem Archiv-Ort direkt per PDF-File ins Internet gestellt wurde; und wollen nun den kaum deutlichen aber immer noch gut erkennbaren Schriftzug aller Seiten ZUM UMWANDELN der Schrift in ein Wordpad-Dokument kopieren)
Meine Frage lautet nun: „Wie ist konkret vorzugehen um ein solches Vorhaben zu realisieren ?“
Hallo Sonnenmaus,
solange der Text als durchsuchbarer Text und ungeschützt vorliegt, geht das mit der copy_and_paste-Methode oder beim aktuellen Reader 9 mit „Als Text speichern“. Wenn die ursprüngliche Vorlage jedoch nur als Grafik eingebunden wurde, müsstest du diese erst mit einer OCR-Software umwandeln. Das geht jedoch nur, wenn die Auflösung der Vorlage gut genug ist. Ob du die Grafik mit dem Reader separieren kannst, weiß ich im Moment nicht. Eine ungeschützte PDF-Datei lässt sich jedoch z.B. mit Photoshop öffnen.
Wenn ich Daten als PDF veröffentliche, schütze ich diese meist vor Änderungen und Entnahme. Bei solchen Dateien hilft wohl nur das Abschreiben oder ein Spezialist, der geschützte Daten wieder editierbar macht, was ich nicht empfehlen möchte, da das zu Recht strafbar ist.
Ich hoffe, ich konnte ein wenig helfen.
Maik
Kann man beliebige Textbereiche aus PDF-Dateien kopieren, und anschliessend in einem Textprogramm in bestimmte Schriften umwandeln ?
Meine Frage lautet nun: „Wie ist konkret vorzugehen um ein solches Vorhaben zu realisieren ?“
Ja, dazu gibt es verschiedene Software.
Eine „alte“ Freeware: (sehr ungenau)
http://www.vollversion.de/download/abbyy_fine_reader…
Kostet 400,- Dollar: (aber nicht das gelbe vom Ei!)
http://abbyy-finereader-sprint.software.informer.com/
Vollversion für 349,-- € (das Beste auf dem Markt)
http://www.nuance.de/imaging/omnipage/omnipage-profe…
Beim EDV-Buchversand gibt es eine leicht abgespeckte Version für 99,-- €:
http://www.edv-buchversand.de/search.php?s7=-1&s0=om…
Und natürlich ist Adobe nicht zu vergessen, die haben schließlich das pdf-Format „erfunden“.
Diese oben angegeben Programme sind eigentlich für Firmen gedacht, die ihre eigenen Scans damit bearbeiten wollen.
In deinem Falle sollte ein umwandeln und bearbeiten kein Problem darstellen, da 200 Jahre alte Bücher der Allgemeinheit „gehören“.
Hallo -
im schlimmsten Fall mache ich einen screenshot mit SNAGIT und lese diesen mit einer Texterkennung aus. Überarbeiten muß man es danach sowieso.
Habe dann zwei Fenster offen: eines mit dem Text als Bild zum Lesen (linke Bildschirmhälfte), das andere mit Textverarbeitung zum Schreiben (rechte Bildschirmhälfte).
Viel Erfolg!
Grüße
> trimodus