PDF in Kurrentschrift automatisiert durchsuchen

Hallo

Gibt es eine kostengünstige Möglichkeit PDFs zu durchsuchen, die eingescannten Text in Kurrentschrift enthalten?
Es handelt sich dabei um alte Zeitungen im Zeitraum von 1925 bis 1935.

Hallo Burnout,
zunächst möchte ich auf ein ähnliches Thema verweisen:
/t/ocr-software-fuer-kurrent/1411574

Kurrentschrift ist schon ein sehr spezielles Thema. Wenn man Google bemüht, sieht man, dass es wohl mal Gegenstand von Projekten bei Universitäten/Bibliotheken war.

Es gibt wohl OCR Software, die Fraktur-Schriften erkennen soll allerdings bei Kurrentschrift hält man sich bedeckt.
http://www.abbyyeu.com/fraktur/

Kostengünstig ist das nächste Problem. Eventuell bieten manche Universitätsbibliotheken die Möglichkeit ggf. vorhandene Systeme/Software je nach Anwendungsfall (z.B. Ahnenforschung) zu nutzen. Fragen kostet jedenfalls nichts.

Sollte PDF nicht das geeignete Ausgangsformat sein so gibt es diverse Software aus PDF Bilddateien zu machen bzw. zu extrahieren:

  • Adobe-Acrobat bietet das Speichern als Bilddatei(en) an.
  • Mit PDF-Creator kann man aus beliebigen Quellen (auch) in Bilddateien drucken.
  • mit pdfimages aus dem xpdf Paket kann man Grafiken extrahieren ( http://www.foolabs.com/xpdf/ )

Hallo Burnout.

Als erstes würde mir da das zumindest in der Acrobatvollversion (Pro) enthaltene Preflight einfallen. Dort kannst Du nach den verwendeten Zeichensätzen suchen.
Bedingung ist allerdings das bei der zu erkennenden Schrift (bei dir Kurrent…) der Zeichensatz mit angegeben ist. Sollte das ganze allerdings als Bild eingescannt sein, sehe ich keine Chance.

Steicher3

Nach langer Suche aufgegeben.
Sorry

Hallo,
ich denke mal das ist eine sehr schwierige Aufgabe. Es müssen zuerst sehr gute Bildvorlagen erstellt / nachbearbeitet werden - möglichst hochauflösend. Die in Acrobat eingebaute OCR-Engine wird dabei wohl passen. Vielleicht haben Sie mit einer externen Software mehr Glück. Ich meine, ABBYY hatte dort etwas im Programm - ggf. gibt es eine Testversion.

Viel Glück!