Hallo Leute!
Der Vertretungsplan meiner Schule wird auf deren Website als PDF zur Verfügung gestellt. Dort findet man in einer der ersten Zeilen das Datum und die Woche sowie in einer Tabelle nach der Klasse die Vertretungen. Ich möchte automatisiert mit Skripten oä das Datum und die Infos über die Vertretungen da raus holen.
Danke im Voraus.
sorry, kann dir da leider nicht weiterhelfen
Hier ist übrigens ein Beispiel für so eine Datei.
https://www.dropbox.com/s/2lnbna3z7v7202x/schueler.pdf
(Ich weiß nicht wie ich meine Frage bearbeiten kann und direkt mir selbst antworten geht auch nicht)
Hallo, kann dir leider nicht weiterhelfen
Hallo,
mit welchem Programm möchtest Du das denn machen?
Acrobat Reader dürfte nicht gehen.
Ob das die große Acrobat Version kann
weiß ich nicht, mache mich aber schlau.
Melde mich ggf. nochmal.
Also ich habe unter Linux einige Programme gefunden die mir zumindest den Text ausgeben: pdftotext und pdfgrep.
Jetzt muss ich ‚nur‘ noch ein Skript machen, das leere Zeilen erkennt und die Textdatei schritt für schritt durchsuchen kann.
Ich habe immer Leerzeilen zwischen den Infos. Es gibt eine Zeile mit der Klasse, eine mit dem Lehrer, eine mit dem raum und eine mit einem Kommentar. Kommentar und Klasse können über mehrere Zeilen hinweg gehen, haben dann aber keine Leerzeilen dazwischen.