Hallo miteinander
Ich habe mir eine Software zur Büroautomation geschrieben.
Meine Software scannt Rechnungen ab Netzwerkscanner und archiviert diese als PDF wobei der reine Text als Blob in die Datenbank gespeichert wird (zum durchsuchen).
Geschrieben als HTML/ PHP/ Shell mit einem Web-Front-End.
Nun möchte ich den Einzahlungsschein erkennen können:
- Einzahlungsschein als separates Bild ausschneiden (TIF)
- Einzahlungsschein per OCR an bestimmten Positionen lesen
Der Einzahlungsschein kann an beliebiger Position auf einer A4 Seite sein. Hat aber eine definierte Grösse, Layout und Form.
Frage:
Hat sich vielleicht schon Mal jemand mit Mustererkennung per Shell Script auseinandergesetzt und kann mir ein paar Tips geben?
Wie erkenne ich den Einzahlungsschein zuverlässig?
Grüsse
Oliver
(ja, ich werde dann die Lösung hier posten)