Texterkennungsprogramm

Hallo
Ich muß in nächster Zeit einige Hundert Seiten Schreibmaschinengeschriebene Seiten einscannen und digitalisieren.

Da würde ich ganz gerne auf ein Texterkennungsprogramm zurückgreifen.
Kann mir da jemand etwas empfehlen, was man da am besten nimmt, bzw. welches die besten Ergebnisse Liefert?

Als Preis möchte ich möglichst unter 50 Euro bleiben, weil es halt nur eine einmalige (wenn auch mehrseitige) Sache ist.

Weiterhin würde mich interessieren, ob solche Programme auch die altdeutsche Schrift erkennen und umsetzen können (teilweise halt auch Dokumente aus den 30ern und 40ern)

Vielen Dank für eure Hinweise

Gruß
Takima

Hallo,

hast Du schon einen Scanner? War da keine OCR-Software dabei? Die billigste Variante an eine gute OCR-Software zu kommen ist eigentlich immer das OEM-Softwarepaket eines Scanners. Inzwischen taugen diese Produkte eigentlich durch die Bank etwas. Fraktur ist allerdings immer so ein Thema, je nachdem wie sauber der Druck und das Papier sind. Die besten Erfahrungen habe ich (ist allerdings schon eine Weile her) dabei mit Abby Finereader gemacht.

Gruß vom Wiz

Hallo Takima,

Da würde ich ganz gerne auf ein Texterkennungsprogramm
zurückgreifen.
Kann mir da jemand etwas empfehlen, was man da am besten
nimmt, bzw. welches die besten Ergebnisse Liefert?

Meine Empfehlung ist ebenfalls Abbyy Finereader. Ich benutze es selbst schon lange und bin sehr zufrieden damit.
Ein weiterer Platzhirsch ist OmniPage.
Allerdings liegen beide deutlich über 50 €. Von Abbyy Finereader kannst Du aber kostenlose Testversionen runterladen, die 15 Tage voll funktionsfähig sind (zumindest zu meiner Zeit war das so, ich hoffe das hat sich nicht geändert, konnte auf die Schnelle nichts finden)
http://www.abbyy.de/download/?source=products
http://www.nuance.de/for-individuals/by-product/omni…

Weiterhin würde mich interessieren, ob solche Programme auch
die altdeutsche Schrift erkennen und umsetzen können

Wenn Du mit altdeutsch Fraktur meinst, ja das können sie. Aber über die Erkennungsrate kann ich dir in diesem Fall nichts sagen, weil ich solche Dokumente nicht eingescannt habe.
Apropos Erkennungsrate, auf jeden Fall solltest Du dich von der Illusion einer 100%-igen Erkennungsrate verabschieden. Nacharbeit ist immer angesagt, mal mehr, mal weniger, hängt von der Qualität der Vorlage ab.
Ein weiteres „Problem“ - zumindest für dich - besteht darin, daß die Programme „lernen“, also am Anfang ist die Erkennungsrate schlechter als nach längerem Gebrauch.
Dann noch zum Preis: Es gibt auch freie OCR-Software, von der ich nur Cognitive OpenOCR von Cuneiform ausprobiert habe, weil im Web von sehr guten Erkennungsraten geredet wurde.
http://en.openocr.org/
Es wies auch eine sehr hohe Arbeitsgeschwindigkeit auf, weigerte sich bei mir jedoch beharrlich, seine Ergebnisse irgendwohin auszugeben, warum auch immer (an die Fehlermeldung kann ich mich nicht mehr erinnern). Das kann ein Fehler gewesen sein, der irgendwie mit meiner Arbeitsumgebung zusammenhing, muß also bei dir nicht auftreten. Jedenfalls kann ich deshalb nichts zur Qualität sagen.
Weitere freie OCR-Software ist SimpleOCR
http://www.simpleocr.com/?kSite=SW
oder gOCR
http://jocr.sourceforge.net/
dies ist allerdings Kommandozeilenbasiert. Für Linux gibt es da auch ausgezeichnete Oberflächen, für Windows… keine Ahnung.

Viele Grüße
Marvin

Hallo

Danke für deinen Erfahrungsbericht.
Werde mir zunächst mal die kostenlosen anschauen, ob es vielleicht schon reicht.
Von den „kommerziellen“ kann man ja vielleicht auch eine etwas ältere Version nehmen, die können in der Regel das selbe und kosten einen Bruchteil.

Vielen Dank

Gruß
Andreas