Wie trenne ich eine PDF und benenne es aus Inhalt?

Guten Tag,

ich habe ca. 1500 PDF’s mit Crystal Reports generiert.
Es sind Anschreiben und bestehen jeweis aus 3 Seiten.

Auf der erste der 3 Seiten habe ich einen Dokumentenkopf (KundennrX_Datum), welches ich gerne auch als Dateiname des jeweiligen Schreiben nutzen möchte.

Wie trenne ich die Dokumenten auf und bennen im gleichem „Artemzug“ diese nach deren Dokumentenkopf?

Bevorzug ist eine Lösung unter Linux, natürlich aber auch unter Windows gerne.

Danke im voraus!

KIPYA

Hallo,

Wie trenne ich die Dokumenten auf und bennen im gleichem
„Artemzug“ diese nach deren Dokumentenkopf?

was meinst du mit „auftrennen“? Ich hatte dich so verstanden, dass du schon 1500 dreiseitige PDF-Dateien vorliegen hast. (Ansonsten hätte ich dir pdftk empfohlen, um Seiten(bereiche) aus einer PDF-Datei zu extrahieren.)

Um an den Inhalt heranzukommen und den Dateinamen zu erzeugen, würde ich pdftotext verwenden.

Andreas

Hallo Andreas,

gemeint ist, das Crystal Reports eine 1500 seitige PDF generiert.
Diese muss ich im nachhinein mit den von dir besagten Tool wieder auftrennen/splitten. Dann habe ich jedoch noch die Benennungsproblematik.

pdf2text läutert jedoch ein paar Glocken bei mir. Die Kombination von „pdftk split | pdf2tetx X | get first line | rename“ müsste das gewünschte ergebniss bringen oder?

Frage wäre noch wie?

Gruß und danke,
Kipya

Hallo Kipya,

Die Kombination von „pdftk split | pdf2tetx X | get first line |
rename“ müsste das gewünschte ergebniss bringen oder?

genau so etwas hatte ich im Sinn.

Frage wäre noch wie?

Was ist konkret dein Problem?

Andreas

Konkret war das Problem, 1. den Inhalt der PDF auszulesen (pdf2text sehe ich nun als lösung -danke) und 2. das ganze nun zu kombinieren.

Kipya