ich habe nun schon mehrere Stunden mit Google-Suche verbracht, um herauszubekommen, wie man im Acrobat per JavaScript in eine Text-Datei schreiben kann.
Hab sowas gefunden, das funktioniert aber nicht.
var Report = new Report();
Report.writeText(„xxxx“)
Report.save("/c/temp/test.txt", „com.adobe.acrobat.plain-text“);
Grund:
ich möchte PDFs auslesen und dann bestimmte Ergebnisse in einen Text-Datei schreiben.
der Ansatz, das mit Acrobat zu machen, scheint mir unnötig einengend. Ich würde den Text erst einmal aus dem PDF extrahieren, in Textdateien schreiben und dann, mit welcher Programmiersprache auch immer, weiter verarbeiten.
Dafür gibt es (größtenteils kommerzielle) Bibliotheken, aber vielleicht hilft dir das hier weiter?
Viel Erfolg,
ich glaube nicht, dass Lesezeichen oder Dokumenteigenschaften ein Problem sind. Die Library und das Buch, die mir bei der ersten Antwort hätten einfallen sollen:
ich verstehe jetzt nicht, was ich mit der iText soll.
Ich habe im Internet dieses Statement gefunden, das Lesezeichen und Dokumenteneigenschalten ausliest und dann diese in ein neues PDF schreibt. Anstatt das in einem PDF zu haben, möchte ich das Ergebnis in einer .txt Datei haben. Wenn das nicht direkt geht, dann gibt es doch sicherlich die Möglichkeit, das PDF dann als .txt zu extrahieren. Das bietet ja Acrobat schließlich auch übers Menü. Nur bräuchte ich dann noch die Möglichkeit, wenn ich mehrere PDFs auslese, dass alles in 1 Text-Datei geschrieben wird, also immer angehängt wird.
/* List all Bookmarks */
/* Recursively work through bookmark tree */
function PrintBookmarks(bm, nLevel) {
if (nLevel != 0) { // don’t print the root
bmReport.absIndent=bmTab*(nLevel-1);
bmReport.writeText(util.printf("%s",bm.name));
}
if (bm.children != null)
for (var i = 0; i