Hallo Takima,
Da würde ich ganz gerne auf ein Texterkennungsprogramm
zurückgreifen.
Kann mir da jemand etwas empfehlen, was man da am besten
nimmt, bzw. welches die besten Ergebnisse Liefert?
Meine Empfehlung ist ebenfalls Abbyy Finereader. Ich benutze es selbst schon lange und bin sehr zufrieden damit.
Ein weiterer Platzhirsch ist OmniPage.
Allerdings liegen beide deutlich über 50 €. Von Abbyy Finereader kannst Du aber kostenlose Testversionen runterladen, die 15 Tage voll funktionsfähig sind (zumindest zu meiner Zeit war das so, ich hoffe das hat sich nicht geändert, konnte auf die Schnelle nichts finden)
http://www.abbyy.de/download/?source=products
http://www.nuance.de/for-individuals/by-product/omni…
Weiterhin würde mich interessieren, ob solche Programme auch
die altdeutsche Schrift erkennen und umsetzen können
Wenn Du mit altdeutsch Fraktur meinst, ja das können sie. Aber über die Erkennungsrate kann ich dir in diesem Fall nichts sagen, weil ich solche Dokumente nicht eingescannt habe.
Apropos Erkennungsrate, auf jeden Fall solltest Du dich von der Illusion einer 100%-igen Erkennungsrate verabschieden. Nacharbeit ist immer angesagt, mal mehr, mal weniger, hängt von der Qualität der Vorlage ab.
Ein weiteres „Problem“ - zumindest für dich - besteht darin, daß die Programme „lernen“, also am Anfang ist die Erkennungsrate schlechter als nach längerem Gebrauch.
Dann noch zum Preis: Es gibt auch freie OCR-Software, von der ich nur Cognitive OpenOCR von Cuneiform ausprobiert habe, weil im Web von sehr guten Erkennungsraten geredet wurde.
http://en.openocr.org/
Es wies auch eine sehr hohe Arbeitsgeschwindigkeit auf, weigerte sich bei mir jedoch beharrlich, seine Ergebnisse irgendwohin auszugeben, warum auch immer (an die Fehlermeldung kann ich mich nicht mehr erinnern). Das kann ein Fehler gewesen sein, der irgendwie mit meiner Arbeitsumgebung zusammenhing, muß also bei dir nicht auftreten. Jedenfalls kann ich deshalb nichts zur Qualität sagen.
Weitere freie OCR-Software ist SimpleOCR
http://www.simpleocr.com/?kSite=SW
oder gOCR
http://jocr.sourceforge.net/
dies ist allerdings Kommandozeilenbasiert. Für Linux gibt es da auch ausgezeichnete Oberflächen, für Windows… keine Ahnung.
Viele Grüße
Marvin