Hallo Chris,
einen Zahn muss ich dir sofort ziehen: gratis und OCR sind zwei Begriffe, die sich mehr oder weniger ausschließen. Es gibt zwar 1-2 OpenSource-Versuche, aber die sind von der Erkennungsqualität her weit abgeschlagen und kommen auch wohl über den Experimentierstatus langfristig nicht hinaus.
Ansonsten gibt es weltweit genau drei Hersteller von OCR-Engines, nämlich Nuance, Abbyy und I.R.I.S. Diese lassen sich ihre Engines natürlich auch bezahlen, und das ist auch völlig OK so, denn es steckt einfach ein sehr hoher Entwicklungsaufwand dahinter.
Soviel dazu, aber jetzt mal technisch zu deiner Anforderung: OCR funktioniert mehr oder weniger hervorragend bei gescannten Belegen. D. h. der Text selber liegt plan auf der Scannereinheit. Dokumentenscanner verwenden dabei u. a. verschiedene Beleuchtungsmethoden, so dass möglichst wenig Störfaktoren auf dem Beleggut verbleiben und der Text an sich in gleicher Größe und Schriftart erkennbar ist. Darüber hinaus dienen z. B. Technologien wie iThresholding von Kodak dazu, Text als solchen hervorzuheben, Hintergründe auszublenden und Konturen zu schärfen. Das funktioniert aber ausschließlich bei reinen Schriftdokumenten, die gescannt werden. Deine Anforderung hört sich aber ein wenig so an, als möchtest Du Text aus Fotos heraus erkennen, die in Dokumente eingebunden sind. Dazu muss man aber ganz klar sagen, dass Du selbst bei professioneller, kostenpflichtiger OCR dann schon Glück hast, wenn überhaupt vereinzelt mal ein Buchstabe zufällig richtig erkannt wurde, denn Text liegt auf Fotos nie im erkennbaren Vordergrund. (Wobei das nicht zu 100% stimmt, es gibt vereinzelt einige wenige Projekte, die mit hohem Aufwand eine ganz bestimmte Schrifterkennung auch auf Fotos ermöglichen, wie z. B. die Kennzeichenerkennung auf Blitzerfotos, aber da ist der Abstand immer gleich, die Schriftart ist definiert, die Reflektion der Kennzeichen wird genutzt usw.).
Für normale Anwendungsfälle muss man aber definitiv sagen, dass es für deine Anforderung technisch keine Lösung gibt.
Viele Grüße
Rainer