Ich habe folgendes Problem:
Ich habe einen eingescannten Text in Fraktura, und darin kommt auch ein griechischer und ein lateinischer Font vor.
Das ganze lasse ich nun durch Fine Reader 9.0 laufen, und trainiere dort die Muster, leider aber sind diese nicht individuell erweiterbar.
Das Problem mit dem griechischen Font konnte ich lösen da man Griechisch als Sprache hinzufügen kann, samt Zeichensatz, und es somit möglich ist Muster zu trainieren, aber was mache ich mit den gewöhnlichen lateinischen Fonts (Timesähnlich)?
Wenn ich den Buchstaben A in Fraktura und Times trainieren lasse dann habe ich erst recht probleme damit den Text richtig zu erkennen.
Ist es möglich für einen Buchstaben zwei Zeichen anzulegen und diese dann zwei verschiedenen Fonts zuzuordnen, so dass es zu keinem „Übertrainieren“ kommt?
Oder gibt es für diese Problem eine elegantere Lösung die es vieleicht ermöglichen würde im erkannten Text die beiden Fonts unterschiedlich darzustellen?