Pdf in xml konvertieren

wie kann ich pdf in xml konvertieren.Die Endung muß .xml
heißen, nicht .doc nicht .xms o.ä.

  1. Möglichkeit:
    Man wählt im Adobe Acrobat (nicht der Reader) den Menüpunkt „Datei -> Speichern unter“ und wählt dann das Dateiformat .XML

  2. Möglichkeit:
    Man wandelt die pdf mit dem Kommandozeilen-Tool pdftohtml in XML um. (Das Tool unterstützt trotz des Namens auch XML als Ausgabeformat)

http://pdftohtml.sourceforge.net/
bzw. download:
http://sourceforge.net/projects/pdftohtml/files/wind…

Sicher gibt es noch andere Tools, die das beherrschen die obigen zwei fallen mir eben zuerst ein.

Hallo,
tut mir leid, hier kann ich nicht weiterhelfen,

wie kann ich pdf in xml konvertieren.Die Endung muß .xml
heißen, nicht .doc nicht .xms o.ä.

Hallo,

nicht kostenfrei, aber preiswert, der PdfGrabber:

http://www.pdfgrabber.de/shop/vollversionen/pdfgrabb…

Konvertiert auch in XML.

Freundliche Grüße

CupidoVienna

wie kann ich pdf in xml konvertieren.Die Endung muß .xml
heißen, nicht .doc nicht .xms o.ä.

Hallo D. Schweda,

das funktioniert in Acrobat 8 Pro (und höher) mit der Funktion [Datei - Speichern unter].
In Acrobat 8 wird die Datei im Format XML 1.0 gespeichert.

Ansonsten mal nach Freeware mit Begriffen wie „pdf2xml“ oder dergleichen „googlen“. Sollte einiges zu finden sein.
Außerdem bieten inzwischen viele Programme selbst den Export ins XML-Format an.

Mit freundlichen Grüßen aus Mainhattan
Armin

wie kann ich pdf in xml konvertieren.Die Endung muß .xml
heißen, nicht .doc nicht .xms o.ä.

Guten Morgen,
ich wüßte nicht wie das gehen sollte.

Mit freundlichen Grüßen

Elmar Brandt

Hallo
Die Konvertierung ist leider nicht so einfach möglich. Ein PDF hat eine Object orientierte Struktur und weicht erheblich von einer XML-Struktur ab. Also schließt eine einfach Umbenennung aus. Des weiteren ist das Datei-Format PDF (Portable Document Format) für das original getreue Anzeigen von Dokumenten auf verschiedenen Geräten entwickelt worden. Ein PDF beinhaltet somit z.B. Vector-Grafiken, Zeichensätze, Texte, Zeichenfolgen… usw. Es gibt einige Bibliotheken (PDFLib …) die ein extrahieren der Texte ermöglichen. Damit geht aber die Strukturierung (Absätze, Formatierung …) der Texte verloren.
Eine Anwendung die direkt umwandelt kenne ich leider nicht, wobei ich nicht ausschließen möchte das es eine gibt.
Ich würde folgenden Lösungsansatz in Betracht ziehen , Wenn Sie die Anwendung selbst entwickeln.
Das PDF als Blob (Binär-daten) in ein XML einfügen. Somit hätten Sie die das originale PDF gespeichert. Beim Öffnen des benötigten XML würde ich den Blob wieder in einen PDF-Viewer geben (Speichern des Blob als temporäres PDF und aufrufen des Viewers).

Ich hoffe ich konnte ihnen ein wenig weiterhelfen.
Mit freundlichen Grüßen

wie kann ich pdf in xml konvertieren.Die Endung muß .xml
heißen, nicht .doc nicht .xms o.ä.

Es tut mir leid aber eine solche Konvertierung kann ich leider nicht bieten!
Da PDF ja als Format gedacht ist welches die Daten vor gewissen Handhabungen schützen soll denke ich das dies auch nicht so leicht geht!
MfG
Marko

wie kann ich pdf in xml konvertieren.Die Endung muß .xml
heißen, nicht .doc nicht .xms o.ä.