Hallo Experten!
Im Moment gibt es für mich folgendes Problem:
Ich besitze einige alte Tagebücher in Süthalin-Schrift und einige alte zeitungsauschnitte in Fraktur-Schrift. Nun möchte ich diese Dokumente mit meiner Digicam knipsen und in „Normal“-Text umwandeln, da die Scannerei zu lange dauert und auch nicht überall möglich ist. Das Problem, das sich dabei stellt, ist, daß die Auflösung der einzelnen Buchstaben scheinar zu niedrig, um diese zu erkennen? Außerdem gibt es irgendwie keine Textverarbeitungsprogramme, die mit diesen Schrifttypen umgehen können. Es soll ein russisches Programm geben, welches aber Staffelpreise hat und viel Geld pro Seite verlangt wird. Wer hat ähnliche Probleme und kann mir deswegen einen Rat geben?
Danke im vorraus!
Gruß, Michael K
Hi
Sütterlin?
Nun möchte
ich diese Dokumente mit meiner Digicam knipsen und in
„Normal“-Text umwandeln, da die Scannerei zu lange dauert und
auch nicht überall möglich ist.
Das versteh ich nicht? was dauert an Scannen denn so lange?
A4 in SW/300dpi dauert bei mir und ner alten Gurke 12 Sekunden.
Sorry, ich kenn kein ocr software was das hinbekommt.
Das Problem, das sich dabei
stellt, ist, daß die Auflösung der einzelnen Buchstaben
scheinar zu niedrig, um diese zu erkennen? Außerdem gibt es
irgendwie keine Textverarbeitungsprogramme, die mit diesen
Schrifttypen umgehen können. Es soll ein russisches Programm
geben, welches aber Staffelpreise hat und viel Geld pro Seite
verlangt wird. Wer hat ähnliche Probleme und kann mir deswegen
einen Rat geben?
hol dir ne Spracherkennung wie Dragon natural speaking und lies ein wenig
das dürfte schneller gehen als alle Versuche diese Schriften zuverlässig mit OCR zu verarbeiten.
JS
Hi Michael K,
Süthalin-Schrift
heisst eigentlich Sütterlin, so viel ich weiss,
aber was soll’s, beides kann heutige OCR-Software nicht.
Wie wäre es, das abfotografierte selber zu lesen und zu tippen?
Dauert natürlich, ist aber wenigstens 100%ig fehlerfrei.
Gruß
BT
Hallo Michael,
diesmal hilft auch wieder Google weiter aber anders als man denkt:
http://www.golem.de/0609/47595.html
Ob Tesseract mit Fraktur gute Ergebnisse bringt kann ich allerdings auch nicht sagen.
Viele Grüße
Stefan
Hallo, Michael,
also Fotografien als Grundlage für OCR einzusetzen ist schon abenteuerlich. Die meisten OCR-Programme liefern schon bei gescannten Texten Fehler die Menge.
Noch schlimmer wird es dann bei Handschriftlichen Texten. Da geht meist nichts mehr automatisch. Bestenfalls die Zeitungsausschnitte könnten bearbeitet werden, wobei man ein trainierbares System braucht, um Fraktur umzusetzen.
Fazit: Manuelle Transkription, sprich lesen und tippen (höchstens vielleicht noch eine Sprachsoftware zum Diktieren verwenden.)
Gruß
Eckard
Also an Texterkenung gibts ABBYY FineReader OCR XIX
Der müsste auch mit Bilddateien klarkommen.
Aber Handschriften…das wird für den Hausgebrauch erst in einigen Jahren funktionieren
[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]
Hallo!
Vielen Dank für die vielen Anregungen. Schade, daß es doch so schwierig ist und werd mich dann doch (leider) an die Tastatur machen müssen.
Gruß, Michael K