pdf in xml konvertieren

Von: , 09.01.2012 15:12 Uhr


wie kann ich pdf in xml konvertieren.Die Endung muß .xml
heißen, nicht .doc nicht .xms o.ä.

6 Antworten zu dieser Frage

  1. Antwort von nach 16 Minuten 0 hilfreich
    Re: pdf in xml konvertieren

    1. Möglichkeit:
    Man wählt im Adobe Acrobat (nicht der Reader) den Menüpunkt "Datei -> Speichern unter" und wählt dann das Dateiformat .XML

    2. Möglichkeit:
    Man wandelt die pdf mit dem Kommandozeilen-Tool pdftohtml in XML um. (Das Tool unterstützt trotz des Namens auch XML als Ausgabeformat)

    http://pdftohtml.sourceforge.net/
    bzw. download:
    http://sourceforge.net/projects/pdftohtml/files/wind...

    Sicher gibt es noch andere Tools, die das beherrschen die obigen zwei fallen mir eben zuerst ein.

  2. Antwort von nach 2 Stunden 0 hilfreich
    Re: pdf in xml konvertieren

    Hallo,

    nicht kostenfrei, aber preiswert, der PdfGrabber:

    http://www.pdfgrabber.de/shop/vollversionen/pdfgrabb...

    Konvertiert auch in XML.

    Freundliche Grüße

    CupidoVienna

    wie kann ich pdf in xml konvertieren.Die Endung muß .xml
    heißen, nicht .doc nicht .xms o.ä.

  3. Antwort von nach 8 Stunden 0 hilfreich
    Re: pdf in xml konvertieren

    Hallo D. Schweda,


    das funktioniert in Acrobat 8 Pro (und höher) mit der Funktion [Datei - Speichern unter].
    In Acrobat 8 wird die Datei im Format XML 1.0 gespeichert.

    Ansonsten mal nach Freeware mit Begriffen wie "pdf2xml" oder dergleichen "googlen". Sollte einiges zu finden sein.
    Außerdem bieten inzwischen viele Programme selbst den Export ins XML-Format an.


    Mit freundlichen Grüßen aus Mainhattan
    Armin

  4. Antwort von nach 15 Stunden 0 hilfreich
    Re: pdf in xml konvertieren



    wie kann ich pdf in xml konvertieren.Die Endung muß .xml
    heißen, nicht .doc nicht .xms o.ä.
    Guten Morgen,
    ich wüßte nicht wie das gehen sollte.

    Mit freundlichen Grüßen

    Elmar Brandt

  5. Antwort von nach einem Tag 0 hilfreich
    Re: pdf in xml konvertieren

    Hallo
    Die Konvertierung ist leider nicht so einfach möglich. Ein PDF hat eine Object orientierte Struktur und weicht erheblich von einer XML-Struktur ab. Also schließt eine einfach Umbenennung aus. Des weiteren ist das Datei-Format PDF (Portable Document Format) für das original getreue Anzeigen von Dokumenten auf verschiedenen Geräten entwickelt worden. Ein PDF beinhaltet somit z.B. Vector-Grafiken, Zeichensätze, Texte, Zeichenfolgen... usw. Es gibt einige Bibliotheken (PDFLib ...) die ein extrahieren der Texte ermöglichen. Damit geht aber die Strukturierung (Absätze, Formatierung ...) der Texte verloren.
    Eine Anwendung die direkt umwandelt kenne ich leider nicht, wobei ich nicht ausschließen möchte das es eine gibt.
    Ich würde folgenden Lösungsansatz in Betracht ziehen , Wenn Sie die Anwendung selbst entwickeln.
    Das PDF als Blob (Binär-daten) in ein XML einfügen. Somit hätten Sie die das originale PDF gespeichert. Beim Öffnen des benötigten XML würde ich den Blob wieder in einen PDF-Viewer geben (Speichern des Blob als temporäres PDF und aufrufen des Viewers).

    Ich hoffe ich konnte ihnen ein wenig weiterhelfen.
    Mit freundlichen Grüßen

    wie kann ich pdf in xml konvertieren.Die Endung muß .xml
    heißen, nicht .doc nicht .xms o.ä.

  6. Antwort von nach 16 Tagen 0 hilfreich
    Re: pdf in xml konvertieren

    Es tut mir leid aber eine solche Konvertierung kann ich leider nicht bieten!
    Da PDF ja als Format gedacht ist welches die Daten vor gewissen Handhabungen schützen soll denke ich das dies auch nicht so leicht geht!
    MfG
    Marko

    wie kann ich pdf in xml konvertieren.Die Endung muß .xml
    heißen, nicht .doc nicht .xms o.ä.

    Jetzt auf diese Frage antworten.