Welche Texterkennungssoftware?

Hallo Experten,
möchte mir für meinen Scanner eine Texterkennungssoftware zulegen, um verschiedene Artikel dann durchsuchbar im PC zu haben.
Im Moment schwanke ich zwischen ABBYY FineReader und OmniPage. Beide versprechen natürlich das blaue vom Himmel herunter, aber wie sieht es in der Realität aus?
Hat jemand Erfahrungen damit und kann mir vielleicht sogar einen Tipp geben, welches Programm „besser“ ist, auch wenn das sicher subjektiv ist. Mir kommt es natürlich in erster Linie auf die Erkennung an, aber auch die Handhabung sollte relativ gut sein. Benutzen würde ich es hauptsächlich für das Einscannen und Erkennen von Computerzeitschriftenartikeln, ab und zu auch mal ein Zeitungsartikel. Ach, und es sollte die eingescannten Sachen am besten als pdf-Dateien abspeichern können.

Vielen Dank schon mal
Jan

kleines plus für omnipage
Hallo Jan,

ich durfte mal vor Jahren Omnipage 14 gegen Finereader 7 testen.
Finereader hatte zwar die bessere Erkennungsrate, aber für unsere Zwecke war Omnipage besser. Und zwar weil man mit dem durchsuchbare pdfs mit Bild machen konnte. Wenn man das pdf öffnet sieht man einen Scan der Seite. Wenn man auf das Textwerkzeug klickt kann man den Text aber trotzdem markieren und kopieren.
Der Vorteil: man sucht z.b. einen Text von „Jan“ - Das pdf wird gefunden. Und dann will man die etwas komplizierte E-Mail-Adresse von Jan möglichst richtig aus dem Text rausholen. Mit dem gescannten Bild als Hintergrund kann man sofort sehen, ob die Texterkennung Mist gebaut hat oder nicht. Ok, es geht bei uns mehr um Diagramme und Tabellen - aber da wäre es schon auch blöd, wenn die OCR statt nem 1000-er Punkt plötzlich ein Komma erkennt.
Der Nachteil der Methode ist natürlich der höhere Speicherbedarf für eine Seite.

Beide Programme haben sich weiterentwickelt und es gibt wohl immer noch von beiden Testversionen. Also ausprobieren.

Grüße,
Wolfgang

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo Wolfgang,
Erstmal vielen Dank für deine Antwort.

ich durfte mal vor Jahren Omnipage 14 gegen Finereader 7
testen.
Finereader hatte zwar die bessere Erkennungsrate, aber für
unsere Zwecke war Omnipage besser. Und zwar weil man mit dem
durchsuchbare pdfs mit Bild machen konnte. Wenn man das pdf
öffnet sieht man einen Scan der Seite. Wenn man auf das
Textwerkzeug klickt kann man den Text aber trotzdem markieren
und kopieren.

Hm, ich verstehe das zwar, aber ist das nicht immer so bei pdf-Dateien? Ich meine, daß man da Text markieren und auch suchen kann. Soll das jetzt heissen, daß Finereader solche pdf-Dateien nicht machen kann, oder habe ich dich da falsch verstanden?

Beide Programme haben sich weiterentwickelt und es gibt wohl
immer noch von beiden Testversionen. Also ausprobieren.

Das wird wohl das beste sein. Ich werde mal nach solchen Testversionen suchen und beide ausprobieren. Schliesslich kosten beide ne ganze Menge Geld, das will und kann ich nicht gerade umsonst ausgeben.

Also nochmals vielen Dank
Jan

Hallo,

Erstmal vielen Dank für deine Antwort.

ich durfte mal vor Jahren Omnipage 14 gegen Finereader 7
testen.

Omnipage war eigentlich immer das etwas professionellere OCR.
Für gute Ergebnisse muß man aber bezahlen. Was den Consumerprodukten
oft so beigelegt wird, ist veraltet und eingeschränkt.

Hm, ich verstehe das zwar, aber ist das nicht immer so bei
pdf-Dateien? Ich meine, daß man da Text markieren und auch
suchen kann.

Nur, wenn der Text tatsächlich als Text im PDF drinsteht.
Wenn es bloß als Bitmap im PDF eingebettet ist, kannst du das
zwar kaum unterscheiden aber für den PC sind es eben bloß Pixel
und keine Buchstaben.

Soll das jetzt heissen, daß Finereader solche
pdf-Dateien nicht machen kann, oder habe ich dich da falsch
verstanden?

Was hat OCR eigentlich mit PDF zu tun? IMHO nix.
PDF kanst du aus jeder Anwendung heraus machen, z.B. indem du
Postscript druckst und das dann zu PDF konvertierst.
-> FreePDF
Gruß Uwi

Hallo Uwi,

Omnipage war eigentlich immer das etwas professionellere OCR.
Für gute Ergebnisse muß man aber bezahlen.

Habe ich ja nichts dagegen. Aber wenn ich bezahle, wollte ich vorher so in etwa wissen, ob das Produkt auch sein Geld wert ist.

Was hat OCR eigentlich mit PDF zu tun? IMHO nix.
PDF kanst du aus jeder Anwendung heraus machen, z.B. indem du
Postscript druckst und das dann zu PDF konvertierst.

In meiner Anfrage hat pdf schon was mit OCR zu tun, weil ich ja wissen wollte, ob beide Programme durchsuchbare pdf-Dateien erzeugen. Ich wollte ja nicht irgendwas schreiben und dann ausdrucken, sondern Dokumente einscannen und dann als Volltext-durchsuchbare Dateien ablegen.

Viele Grüsse
Jan

Hallo,

ich weiss nicht genau was du meinst, aber FineReader 7 kann auch PDFs erzeugen mit Bild und Text uebereinander. Wir haben da mal in einer Firma Maintenance Manuals von Flugzeugen digitalisiert. Da war es sehr wichtig, dass der Text durchsuchbar war und gleichzeitig sich nicht ein Fehler einschleichen konnte!

Ciao! Bjoern

Habe mich geirrt…
Hallo Jan,

hab noch mal nachgesehen - beide konnten damals schon pdf mit Bild unter/über Text erzeugen - da hat mich meine Erinnerung betrogen.

Unser tatsächliches Kriterium war, dass Omnipage Tabellen etwas besser erkannt hat (nicht die Zahlen drin, aber dass es überhaupt eine Tabelle ist). Das spielt zwar beim pdf-Ankucken keine Rolle, aber beim Übertragen der OCR-Ergebnisse in Excel.

Aber wie gesagt - die Unterschiede damals waren wirklich sehr gering. Die Programme sind besser (und sogar billiger) geworden. Leider gibt es noch kein OCR-Programm, das auch wirklich versteht was da steht.

Ach ja: in Heftzeitschriften sind immer wieder mal ältere Versionen der Programme zu finden (zuletzt gesehen: Finereader 6 in der c’t).

Grüße,
Wolfgang

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]