Welches Programm für eine Textanalyse mit PDFs

Hallo ihr,

ich muss eine quantitative Textauswertung machen und bin auf der Suche nach einem Programm, dass mir die Arbeit erleichtert.

Folgendes:

Die Analyse soll nicht wirklich komplex ablaufen, ich möchte aus Texten, die ich als 13 PDFs oder Docs vorliegen habe(n werde :wink: bestimmte Akteure herausfiltern, die regelmäßig genannt werden. Ich habe zwei Möglichkeiten das Ganze zu machen, eine einfache und eine kompliziertere. Wenn euch für die Kompliziertere nichts einfällt, dann tut es auch die einfache.

Einfach:

Ein Programm, dass die PDF/Doc automatisch durchsucht und mir eine Exeltabelle ausspuckt, in der die Verteilungen festgehalten werden.

Kompliziert:

Da es sich um eine große Datenmenge handelt (je Dokument um die 60 Seiten) wäre es toll, wenn mich das Programm bei der Auswertung ein wenig unterstützen würde:

  • Es würde mir sehr weiterhelfen, wenn ich dem Programm die Gliederung des Textes nennen könnte und er mir die Wortverteilung für die jeweiligen Kapitel, nicht für den ganzen Text ausspucken würde.
  • Auch toll wäre es, wenn ich die Wörter, die ich letztlich auswähle in dem Programm anzeigen lassen könnte (also z.B. indem ich die Anzahl der Worte „blau“ anzeigen lassen kann und mir das Programm per Klick alle „blau“ im Text farblich hervorhebt o.ä.)

Das lässt sich natürlich auch manuell machen, aber wer schonmal mit solch großen Datenmengen gearbeitet hat, der weiß, dass es manuell extrem umständlich wäre.

Also, falls sich jemand mit dem Thema auskennt… ich wäre für Hilfe sehr dankbar.