HP-Scanner und Texterkennung

Hallo,

habe einen HP-Scanner (5370C), der „Text & Bild“ als pdf-Datei abspeichern kann. Tolle Sache, wenn das Programm nicht immer so komische Sachen in das Scanobject hinein interpretieren würde (speziellin Tabellen fehlen Zahlen, bzw. einzelne Wörter werden zum total schwarzen Rechteck…).

Dieses „Text&Bild“ finde ich gut, da man damit halt auch mehrere Seiten in eine Daei bekommt, was sonst ja nur mit dem recht grossen TIF Format geht. Aber wie gesagt, dieser Modus erkennt Sachen, die auf dem Original gar nicht drafu sind !!

Mich würde nun interessieren, ob das bei anderen Marken besser ist oder ob das eine HP-Macke ist. Wenn Letzteres, dann auch noch die Frage, ob das durch neue SW, Treiber,… behebbar ist…

Schon mal vielen Dank und ich bin gespannt, was Ihr mir zu diesem Thema erzählen könnt.
Matthias

Software-Problem
Hallo Matthias,

würde sagen, das liegt nicht am scanner, sondern an dem texterkennungs-programm. ich hab mal omnipage 14 ausprobieren können. auch dort gibt es die von dir beschriebene funktion. allerdings löst das omnipage auf eine recht nette weise: es wird der text und die grafik gemeinsam abgespeichert und auch so angezeigt. beim betrachten des dokuments fallen keine fehler auf. wenn man aber nur den text extrahiert, dann sieht man die fehler. beispiel: in einer tabelle ist „1234“ zu lesen. wenn man die zahl aber mit der text-kopier-funktion rausholt wird „1284“ draus - eben weil der 3er falsch erkannt wurde.
das problem bei der sache ist, dass die zusätzliche grafik-information natürlich die pdf-datei um einiges vergrößert.

ocr-programme sind trotz des ständigen fortschritts immer noch fehleranfällig. und von so einer beigelegten software sollte man nicht zu viel erwarten.

grüße, wolfgang

Hallo Wolfgang,

lange Zeit dass ich mich nicht eingelogged habe…

Mit der Einstellung „Text & Bild“ mache ich aber kein OCR, sondern das ist lediglich eine Parameterkombination, die gut für Textseiten mit Grafiken passt und die man dann als PDF speichern kann.

Ich finde es halt schwach, dass so etwas bei einem renomierten Scanner passiert und wollte einfach mal wissen ob Andere ähnliche Probleme haben…

Dabke für Deine Antwort.
Gruss Matthias