Gratis Schrifterkennungsprogramme

Hallo Experten,

Was sind gute Schrifterkennungsprogramme die gratis sind?
Es soll vorwiegend für Bilder Scans von Power point, Microsoft word und Pdf genutzt werden.

Hat dazu jemand schon Erfahrungen gemacht?
Wo kann man nachfragen oder gibt es eine Rating liste mit wo die Texterkennung beurteilt wird?

Lg,
Chris

Guten Morgen Chris,
tut mir Leid - ich selbst habe keine Erfahrungen mit freien Schrifterkennungsprogrammen. Was ich allerdings in den diversen Foren höre deutet darauf hin, dass die alle nicht gut sind.
Es gibt allerdings im Netz freie Converter, die den in den Dokumenten hinterlegten Text extrahieren - ich schlage eine Suche nach »ppt2txt freeware« und »pdf2txt freeware« vor - man wird fündig, aber ich möchte keine Empfehlung aussprechen (da die Aufgabe aber relativ einfach ist vermute ich, dass die alle einigermaßen tun müssten).
Das Alles gilt natürlich nur, wenn die .pdf oder .ppt vorliegen.
Für gescannte Bilder (zum Beispiel von Ausdrucken) gibt es, wie gesagt, keine vernünftige Freeware.
Schönen Gruß - Norbert

Hallo Chris,

einen Zahn muss ich dir sofort ziehen: gratis und OCR sind zwei Begriffe, die sich mehr oder weniger ausschließen. Es gibt zwar 1-2 OpenSource-Versuche, aber die sind von der Erkennungsqualität her weit abgeschlagen und kommen auch wohl über den Experimentierstatus langfristig nicht hinaus.

Ansonsten gibt es weltweit genau drei Hersteller von OCR-Engines, nämlich Nuance, Abbyy und I.R.I.S. Diese lassen sich ihre Engines natürlich auch bezahlen, und das ist auch völlig OK so, denn es steckt einfach ein sehr hoher Entwicklungsaufwand dahinter.

Soviel dazu, aber jetzt mal technisch zu deiner Anforderung: OCR funktioniert mehr oder weniger hervorragend bei gescannten Belegen. D. h. der Text selber liegt plan auf der Scannereinheit. Dokumentenscanner verwenden dabei u. a. verschiedene Beleuchtungsmethoden, so dass möglichst wenig Störfaktoren auf dem Beleggut verbleiben und der Text an sich in gleicher Größe und Schriftart erkennbar ist. Darüber hinaus dienen z. B. Technologien wie iThresholding von Kodak dazu, Text als solchen hervorzuheben, Hintergründe auszublenden und Konturen zu schärfen. Das funktioniert aber ausschließlich bei reinen Schriftdokumenten, die gescannt werden. Deine Anforderung hört sich aber ein wenig so an, als möchtest Du Text aus Fotos heraus erkennen, die in Dokumente eingebunden sind. Dazu muss man aber ganz klar sagen, dass Du selbst bei professioneller, kostenpflichtiger OCR dann schon Glück hast, wenn überhaupt vereinzelt mal ein Buchstabe zufällig richtig erkannt wurde, denn Text liegt auf Fotos nie im erkennbaren Vordergrund. (Wobei das nicht zu 100% stimmt, es gibt vereinzelt einige wenige Projekte, die mit hohem Aufwand eine ganz bestimmte Schrifterkennung auch auf Fotos ermöglichen, wie z. B. die Kennzeichenerkennung auf Blitzerfotos, aber da ist der Abstand immer gleich, die Schriftart ist definiert, die Reflektion der Kennzeichen wird genutzt usw.).

Für normale Anwendungsfälle muss man aber definitiv sagen, dass es für deine Anforderung technisch keine Lösung gibt.

Viele Grüße
Rainer

Gute, kostenlose Schrifterkennung habe ich auch schon gesucht.
Das Einzige, was irgendwie in Frage kommt ist
http://sourceforge.net/projects/archivista/

VG,
Nick

Auch noch zu gebrauchen:

http://wiki.ubuntuusers.de/Texterkennung