Hallo Ulli,
eigentlich sollte man meinen, dass ein gescanntes Dokument nicht anderes als ein Foto ist, aber es gibt eine ganz entscheidende Regel: je weiter das Dokument von der Optik entfernt ist und je lockerer das Dokument liegt, umso weniger läßt sich mit OCR auslesen. Wenn man dann mal die Ergebnisse eines Dokumentenscanners, der die Dokumente mittels Andruckrollen plan und gerade an der Optik vorbeilaufen lässt bereits mit einem Flachbettscanner vergleicht, dann reden wir da bereits über einen Qualitätsverlust von locker 25%. Mit einer Kamera hast Du überhaupt keinen Druck mehr an der Optik, so dass selbst bei gut fotografierten Dokumenten nur noch per Zufall überhaupt einige Buchstaben oder Worte ausgelesen werden können.
Das es grundsätzlich aber nicht unmöglich ist, Text auch aus Fotos auszulesen, beweisen einige Kreisverwaltungen, die die Kennzeichen bei Blitzern automatisch auslesen. Aber: das funktioniert nur deshalb, weil die Kennzeichen bzw. die Schritarten genormt sind, Kennzeichenhintergründe für eine helle Ausleuchtung sorgen und der Abstand beim Blitzen immer gleich ist. Diesen Effekt hast Du aber leider bei keinem Dokument, daher wirst Du leider bei der Suche keinen Erfolg haben.
Viele Grüße
Mönsterlönder