***Adobe pdf Fileformat / Text exportieren ***

Hallo, weiss jemand, wie ich ein Adobe pdf File in einfachen ASCII Text konvertieren, oder als Text abspeichern kann?

Vielleicht kennst du auch das Dateiformat, also die Spezifikation, damit ich einen Parser schreiben kann.

Oder gibt es ein Programm, das pdfs importieren kann und als text exportieren?

lg, igis

weiss nicht, aber folgendes könnte gehen
Hallo igis,

Hallo, weiss jemand, wie ich ein Adobe pdf File in einfachen
ASCII Text konvertieren, oder als Text abspeichern kann?

Vielleicht kennst du auch das Dateiformat, also die
Spezifikation, damit ich einen Parser schreiben kann.

Oder gibt es ein Programm, das pdfs importieren kann und als
text exportieren?

beides kann ich nicht aus dem Kopf sagen, aber wenn Du das entsprechede Dokument ins Netz legst, und bei der Suchmaschine
www.google.com
anmeldest, (google kann auch in pdf-files suchen, und stellt bei der Suchanfrage auch eine Nurtextversion bereit) solltest Du Dir nach einiger Zeit über die Suchmaschine zugang zum ASCII Text des Documents verschaffen können.

Das wäre aber schon übel improvisiert und eine arme Suchmaschine böse missbraucht.

gruß unimportant

Holla

Hallo, weiss jemand, wie ich ein Adobe pdf File in einfachen
ASCII Text konvertieren, oder als Text abspeichern kann?

Ich kanns gerade nicht kontrollieren, aber ich glaube, bei Ghostscript/-view gibt es den Befehl „Text extrahieren“.
http://www.cs.wisc.edu/~ghost/

Vielleicht kennst du auch das Dateiformat, also die
Spezifikation, damit ich einen Parser schreiben kann.

Die muessten bei Adobe als White Paper rumliegen, aber fuer PDF gibt es schon ne Menge Tools…

Gruss, Lutz

Holla

Hallo, weiss jemand, wie ich ein Adobe pdf File in einfachen
ASCII Text konvertieren, oder als Text abspeichern kann?

Ich kanns gerade nicht kontrollieren, aber ich glaube, bei
Ghostscript/-view gibt es den Befehl „Text extrahieren“.
http://www.cs.wisc.edu/~ghost/

jep - gibt es

Greetinx
Christian

  1. In Akrobat importieren.
  2. Text markieren
  3. kopieren ins Clipboard
  4. Import in Word etc.
    Reinhard der digitale

Ich würde das pdf als Bild (Tif) abspeichern und mit einer OCR- Software den Text lesen lassen. Mit „Recognita Standart“ funtioniert das
gruß
Micha

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo igis,

mit Adobe Acrobat Reader 5.0 kannst du einfach den Text markieren und dann in einen Editor kopieren.

  1. Dokument in Acrobat Reader öffnen
  2. Bearbeiten-Alles markieren
  3. Kopieren
  4. Texteditor starten (z.B.NotePad)
  5. Bearbeiten-Einfügen
  6. Abspeichern

Geht Super-einfach. Mußt nur die neueste Version von Acrobat Reader haben (Version 5.0). Ist kostenlos.

Gruß
Martin Schaefer

Sorry, hab noch was vergessen.

Wenn du CorelDraw 10 hast, da kann man PDFs zum editieren öffnen und dann die bearbeitete Version wieder als PDF oder als CDR abspeichern.

Gruß
Martin Schaefer