Bücher scannen mit HP Scanjet

Guten Tag
Ich habe mir einen HP Scanjet 4890 zugelegt, um Artikel aus Büchern zu scannen (nur Text), und zwar „als Dokument“ und als Dateityp jpg.
Zwei Probleme traten dabei auf:

  1. Die Buchseiten werden automatisch immer vertikal gescannt; man muss jede einzelne (Doppel-)Seite in der Vorschau drehen, damit sie dann am Ende horizontal zu liegen kommt (und damit lesbar ist). Gibt es wirklich keine Möglichkeit, das schon in einem Scanprofil festzulegen, damit es jedes Mal automatisch so eingestellt wird? Ich habe mir ein Scanprofil eingerichtet, wo Auflösung, zu scannender Bereich usw. eingestellt sind, doch die horizontale/vertikale Ausrichtung fand ich dort nicht. Für Scans von Büchern wäre das doch aber essenziell!
  • Wähle ich als Dateityp pdf statt jpg, wird - bei selber Auflösung (300 dpi), ja sogar bei Auflösungen von 600 dpi - der Text ausgesprochen unscharf/verschwommen. Ich bin somit gezwungen, Texte als jpg zu scannen, da dort die Buchstaben wirklich scharf und klar wiedergegeben werden. Das ist dann jedoch beim Lesen unpraktisch, weil jede (Doppel-)Seite ein separates Dokument ist, und man in den entsprechenden Bilddarstellungsprogrammen nicht so gut scrollen kann wie im Adobe Reader. Ich weiss aber noch, dass ich mit einem anderen Scanner früher auch in pdf gut (scharf) scannen konnte. Hat jemand eine Idee, ob das auch im HP Scanjet 4890 möglich wäre, welcher doch ein Gerät der Oberklasse sein sollte?
    Herzlichen Dank
    Martin Schaub

Hallo,

Ich habe mir einen HP Scanjet 4890 zugelegt, um Artikel aus
Büchern zu scannen (nur Text), und zwar „als Dokument“ und als
Dateityp jpg.

JPG ist IMHO zwar sehr gut für Fotos, aber bei Text und Grafik
kommt es zu einigen störenden Effekten.
Da wäre z.B. GIF besser, oder dann gleich ein ordentliches
OCR-Programm einsetzen ?

Zwei Probleme traten dabei auf:

  1. Die Buchseiten werden automatisch immer vertikal gescannt;
    man muss jede einzelne (Doppel-)Seite in der Vorschau drehen,
    damit sie dann am Ende horizontal zu liegen kommt (und damit
    lesbar ist). Gibt es wirklich keine Möglichkeit, das schon in
    einem Scanprofil festzulegen, damit es jedes Mal automatisch
    so eingestellt wird?

Das kann man auch hinterher im ganzen Packen mit einem
Bildbearbeitungsprogr. machen, das diese Operation automatisch
für viele Dateien ausführt.

  • Wähle ich als Dateityp pdf statt jpg, wird - bei selber
    Auflösung (300 dpi), ja sogar bei Auflösungen von 600 dpi -
    der Text ausgesprochen unscharf/verschwommen.

Ist ein reines Problem der Software, die das PDF erzeugt.
Das sind die Parameter wohl sehr ungünstig eingestellt .

Ich bin somit gezwungen, Texte als jpg zu scannen, da dort die Buchstaben
wirklich scharf und klar wiedergegeben werden. Das ist dann
jedoch beim Lesen unpraktisch, weil jede (Doppel-)Seite ein
separates Dokument ist, und man in den entsprechenden
Bilddarstellungsprogrammen nicht so gut scrollen kann wie im
Adobe Reader.

Man kann aber auch die gescannten Seiten nacher in PDF umwandeln.
Z.B. Postscript in Datei drucken und dann mit FreePDF zu
PDF umwandeln und auch in einem Dokument zusammenfassen.

Ich weiss aber noch, dass ich mit einem anderen
Scanner früher auch in pdf gut (scharf) scannen konnte. Hat
jemand eine Idee, ob das auch im HP Scanjet 4890 möglich wäre,

Sicher, bloß nicht mit der dazu gelieferten Software (die ist
oft nicht viel wert). Nötig ist sowieso nur der Treiber.
Alles weitere an Bediensoftware ist austauschbar.
Man kann den Scanner auch von anderen Anwendungen aus nutzen.

Der Scanner macht in jedem Fall erstmal ein Bitmap, das dann
im folgenden in andere Formate umgewandelt wird.
Evtl. kannst Du dafür sogar das alte Programm nehmen.

Gruß Uwi

Hallo Uwi
Danke für deine kompetenten Hinweise.

Hallo,

Ich habe mir einen HP Scanjet 4890 zugelegt, um Artikel aus
Büchern zu scannen (nur Text), und zwar „als Dokument“ und als
Dateityp jpg.

JPG ist IMHO zwar sehr gut für Fotos, aber bei Text und Grafik
kommt es zu einigen störenden Effekten.
Da wäre z.B. GIF besser, oder dann gleich ein ordentliches
OCR-Programm einsetzen ?

Ich muss sagen, ich habe mit gif auch herumprobiert, aber der Text wurde nicht so scharf wie bei jpg. Freilich ging der Scanvorgang bei gif deutlich schneller. Und die Dateigrösse war etwa 30% kleiner. Die Ergebnisse meiner Versuche kann man unter http://service.gmx.net/mc/DFm3AABT1ijfNI7XWlYfkpDPhJ… ansehen. Ich habe die Buchseite als jpg, pdf (ohne OCR) und als gif gescannt, je mit 300 ppi farbig. Dann habe ich noch das jpg mit FreepdfXP in pdf umgewandelt, mit der Einstellung „High Quality“. Es gab auch da einen Qualitätsverlust.

OCR ist in der HP-Software dabei, und funktioniert auch gut - allerdings kann man OCR nur bei pdfs machen, bei jpg und gif nicht.

Zwei Probleme traten dabei auf:

  1. Die Buchseiten werden automatisch immer vertikal gescannt;
    man muss jede einzelne (Doppel-)Seite in der Vorschau drehen,
    damit sie dann am Ende horizontal zu liegen kommt (und damit
    lesbar ist). Gibt es wirklich keine Möglichkeit, das schon in
    einem Scanprofil festzulegen, damit es jedes Mal automatisch
    so eingestellt wird?

Das kann man auch hinterher im ganzen Packen mit einem
Bildbearbeitungsprogr. machen, das diese Operation automatisch
für viele Dateien ausführt.

  • Wähle ich als Dateityp pdf statt jpg, wird - bei selber
    Auflösung (300 dpi), ja sogar bei Auflösungen von 600 dpi -
    der Text ausgesprochen unscharf/verschwommen.

Ist ein reines Problem der Software, die das PDF erzeugt.
Das sind die Parameter wohl sehr ungünstig eingestellt.

Ist die HP-Software. Dort gibt es zwar eine Funktion „Scharfzeichnen“, die bringt aber auch nichts… Müsste mir also vielleicht einmal eine andere Software besorgen.

Ich bin somit gezwungen, Texte als jpg zu scannen, da dort die Buchstaben
wirklich scharf und klar wiedergegeben werden. Das ist dann
jedoch beim Lesen unpraktisch, weil jede (Doppel-)Seite ein
separates Dokument ist, und man in den entsprechenden
Bilddarstellungsprogrammen nicht so gut scrollen kann wie im
Adobe Reader.

Man kann aber auch die gescannten Seiten nacher in PDF
umwandeln.
Z.B. Postscript in Datei drucken und dann mit FreePDF zu
PDF umwandeln und auch in einem Dokument zusammenfassen.

Habe ich so gemacht, meine ich, wobei ohne speziellen Postscript-Schritt, das geschieht beim Freepdf XP automatisch (?).

Ich weiss aber noch, dass ich mit einem anderen
Scanner früher auch in pdf gut (scharf) scannen konnte. Hat
jemand eine Idee, ob das auch im HP Scanjet 4890 möglich wäre,

Sicher, bloß nicht mit der dazu gelieferten Software (die ist
oft nicht viel wert). Nötig ist sowieso nur der Treiber.
Alles weitere an Bediensoftware ist austauschbar.
Man kann den Scanner auch von anderen Anwendungen aus nutzen.

Der Scanner macht in jedem Fall erstmal ein Bitmap, das dann
im folgenden in andere Formate umgewandelt wird.
Evtl. kannst Du dafür sogar das alte Programm nehmen.

Gruß Uwi

Gruss
Martin

Hallo

Danke für deine kompetenten Hinweise.

Naja, wohl mal sehen. Ich bin für solche Sachen auch nicht
wirklich der absolute Spezi.

Ich habe mir einen HP Scanjet 4890 zugelegt, um Artikel aus
Büchern zu scannen (nur Text), und zwar „als Dokument“ und als
Dateityp jpg.

JPG ist IMHO zwar sehr gut für Fotos, aber bei Text und Grafik
kommt es zu einigen störenden Effekten.
Da wäre z.B. GIF besser, oder dann gleich ein ordentliches
OCR-Programm einsetzen ?

Ich muss sagen, ich habe mit gif auch herumprobiert, aber der
Text wurde nicht so scharf wie bei jpg. Freilich ging der
Scanvorgang bei gif deutlich schneller. Und die Dateigrösse
war etwa 30% kleiner.

Das ist nicht sehr plausibel. Normalerweise werden GIF etwas
größer, bei gleicher Qualität. Es treten dabei aber keine
Komprimierartefakte auf. Nun gut, wenn man JPG mit geringer
Komprimierrate macht, dann sind die auch kaum vom unkomp.
Original zu unterscheiden.
Wieso GIF bei gleicher Auflösung schneller geht, ist mir auch
nicht klar. Kann aber an der Komprimierung bei JPG liegen.

Um die Qualität des Scanners an sich zu klären, würde ich erstmal
nur reines Bitmap z.B. *.BMP nehmen.

Die Ergebnisse meiner Versuche kann man
unter http://service.gmx.net/mc/DFm3AABT1ijfNI7XWlYfkpDPhJ…
ansehen.

Die ersten beiden Dateien (GIF und JPG) kann ich nicht original
runterladen.
Die PDF haben aber eindeutig unterschiedliche Auflösung.
Schau Dir mal Deteils mit 2000% Vergrößerung an.

Ursache kann eine unterschiedliche Einstellung des verwendeten
Postscriptdruckertreibers sein.
Von dessen Qualität hängt IMHO primär das Ergebnis bei den PDF
ab (wenn nicht schon ein Komprimieralg. sein Unwesen getrieben hat).

Ich habe die Buchseite als jpg, pdf (ohne OCR) und
als gif gescannt, je mit 300 ppi farbig. Dann habe ich noch
das jpg mit FreepdfXP in pdf umgewandelt, mit der Einstellung
„High Quality“. Es gab auch da einen Qualitätsverlust.

Ich weiß nicht, was Deine jeweilige Software da macht.
Es ist mir noch einiges nicht sehr plausibel.
Zuerst mal grundsätzlich: Der Scanner macht ein Bitmap,
z.B. *.BMP.
Die nachgeschaltete Software macht daraus irgend was anderes.

Bei PDF wird das Ergebnis aber über einen Postscript-Druckertreiber
ausgegeben (auch FreePDF).
Außerdem bettet PDF verschiedenen Dateiformate und Komprimier-
algorythmen ein (z.B. JPG).

OCR ist in der HP-Software dabei, und funktioniert auch gut -
allerdings kann man OCR nur bei pdfs machen, bei jpg und gif
nicht.

Das stimmt so nicht. Prinzipiell dient jeder OCR-Software ein
Bitmap mit genügend Auflösung als Quelle. Anders macht das keinen
Sinn. Das Bitmap kann natürlich auch in ein PDF eingebettet sein.
Der Umweg über PDF ist aber IMHO nicht zweckmäßig,

  • Wähle ich als Dateityp pdf statt jpg, wird - bei selber
    Auflösung (300 dpi), ja sogar bei Auflösungen von 600 dpi -
    der Text ausgesprochen unscharf/verschwommen.

Ist IMHO nur ein Problem des verwendeten Postscriptdruckers.
Wenn der nur auf 150DPI steht, kann man keine 600 DPI-Qualität
bekommen.

Ist ein reines Problem der Software, die das PDF erzeugt.
Das sind die Parameter wohl sehr ungünstig eingestellt.

Ist die HP-Software. Dort gibt es zwar eine Funktion
„Scharfzeichnen“, die bringt aber auch nichts… Müsste mir
also vielleicht einmal eine andere Software besorgen.

Vermutlich ist diese Software nicht optimal oder benutzerunfreudlich.

Habe ich so gemacht, meine ich, wobei ohne speziellen
Postscript-Schritt, das geschieht beim Freepdf XP automatisch.

Ja, wenn man nix weiter macht, dann wird da ein Standardtreiber
installiert (z.B. AppleColorLW).
Man kann aber auch andere benutzen.

Gruß Uwi

Nur nochmals kurz:

Die ersten beiden Dateien (GIF und JPG) kann ich nicht
original
runterladen.

Über Datei > Download versucht?

Die PDF haben aber eindeutig unterschiedliche Auflösung.
Schau Dir mal Deteils mit 2000% Vergrößerung an.

Stimmt, das aus dem jpg erstellte ist deutlich schärfer als das direkt als pdf gescannte.

Ursache kann eine unterschiedliche Einstellung des verwendeten
Postscriptdruckertreibers sein.
Von dessen Qualität hängt IMHO primär das Ergebnis bei den PDF
ab (wenn nicht schon ein Komprimieralg. sein Unwesen getrieben
hat).

Ich glaube es dir schon. Kann das nur leider in dem „HP Solution Center“ (meine HP-Software, die mit dem Scanner zusammen kam) nicht beeinflussen, ja kann gar nicht sehen, was da eingestellt ist betr. Postscriptdruckertreiber und Komprimierung.

Ich habe die Buchseite als jpg, pdf (ohne OCR) und
als gif gescannt, je mit 300 ppi farbig. Dann habe ich noch
das jpg mit FreepdfXP in pdf umgewandelt, mit der Einstellung
„High Quality“. Es gab auch da einen Qualitätsverlust.

Ich weiß nicht, was Deine jeweilige Software da macht.
Es ist mir noch einiges nicht sehr plausibel.
Zuerst mal grundsätzlich: Der Scanner macht ein Bitmap,
z.B. *.BMP.
Die nachgeschaltete Software macht daraus irgend was anderes.

Interessant.

Bei PDF wird das Ergebnis aber über einen
Postscript-Druckertreiber
ausgegeben (auch FreePDF).
Außerdem bettet PDF verschiedenen Dateiformate und Komprimier-
algorythmen ein (z.B. JPG).

OCR ist in der HP-Software dabei, und funktioniert auch gut -
allerdings kann man OCR nur bei pdfs machen, bei jpg und gif
nicht.

Das stimmt so nicht. Prinzipiell dient jeder OCR-Software ein
Bitmap mit genügend Auflösung als Quelle. Anders macht das
keinen
Sinn. Das Bitmap kann natürlich auch in ein PDF eingebettet
sein.

Ich meinte nur, dass im „HP Solution Centre“, wenn man als Dateiformat bmp wählt, OCR automatisch ausgeschaltet ist. Auch bei gif ist das so. Nur bei pdf kann man einstellen, dass er mit OCR scannen soll. Daneben kann man auch angeben, dass er den Scan direkt ins Word senden soll, dann wird natürlich auch eine OCR durchgeführt.
Wie du sagtest, ist das wohl eine Schwäche dieses speziellen Programms (?).

Der Umweg über PDF ist aber IMHO nicht zweckmäßig,

  • Wähle ich als Dateityp pdf statt jpg, wird - bei selber
    Auflösung (300 dpi), ja sogar bei Auflösungen von 600 dpi -
    der Text ausgesprochen unscharf/verschwommen.

Ist IMHO nur ein Problem des verwendeten Postscriptdruckers.
Wenn der nur auf 150DPI steht, kann man keine 600 DPI-Qualität
bekommen.

Nur wüsste ich nicht, wo ich den von der Scansoftware verwendeten Postscriptdrucker sehen oder gar anders einstellen kann… Habe im GMX Mediacenter mal einen Screenshot des betreffenden Programmordners eingestellt, vielleicht kannst du es mir von dort angeben. Ist aber auch nicht so wichtig, ich werde mich wohl sowieso davor hüten, daran etwas zu ändern, ohne richtig drauszukommen.

Ist ein reines Problem der Software, die das PDF erzeugt.
Das sind die Parameter wohl sehr ungünstig eingestellt.

Ist die HP-Software. Dort gibt es zwar eine Funktion
„Scharfzeichnen“, die bringt aber auch nichts… Müsste mir
also vielleicht einmal eine andere Software besorgen.

Vermutlich ist diese Software nicht optimal oder
benutzerunfreudlich.

Habe ich so gemacht, meine ich, wobei ohne speziellen
Postscript-Schritt, das geschieht beim Freepdf XP automatisch.

Ja, wenn man nix weiter macht, dann wird da ein
Standardtreiber
installiert (z.B. AppleColorLW).

Ja, der wird bei mir genommen.

Man kann aber auch andere benutzen.

Gruß Uwi

Nur nochmals kurz:

Die ersten beiden Dateien (GIF und JPG) kann ich nicht
original
runterladen.

Über Datei > Download versucht?

Nö, bei „Datei/Download“ kommt bei mir nix :frowning:

Wenn ich die Datei öffne und dann über den Browser runterlade,
wird es immer nur als JPG gespeichert, obwohl das Bild ein GIF
sein soll. Ist dann wahrscheinlich nur sowas wie ein Screenshot.
Über die tatsächhliche Auflösung und Qualität kann ich deshalb
nicht mehr urteilen. Die scheint verfälscht zu sein.
Besser wäre es also, die Dateien per Mail zu schicken.

Du kannst die Bitmaps aber auch in ein beliebiges Bislbearbeitungs-
programm laden und dort äquivalent die Auflösung überprüfen.
Als Freeware bieten sich z.B. IrfanView und Gimp an .

Die PDF haben aber eindeutig unterschiedliche Auflösung.
Schau Dir mal Details mit 2000% Vergrößerung an.

Stimmt, das aus dem jpg erstellte ist deutlich schärfer als
das direkt als pdf gescannte.

Ursache kann eine unterschiedliche Einstellung des verwendeten
Postscriptdruckertreibers sein.
Von dessen Qualität hängt IMHO primär das Ergebnis bei den PDF
ab (wenn nicht schon ein Komprimieralg. sein Unwesen getrieben
hat).

Ich glaube es dir schon. Kann das nur leider in dem „HP
Solution Center“ (meine HP-Software, die mit dem Scanner
zusammen kam) nicht beeinflussen, ja kann gar nicht sehen, was
da eingestellt ist betr. Postscriptdruckertreiber und
Komprimierung.

Das ist ein Problem, bei solcher beigelegten Software.
Selbst ein 50€-Scanner scannt bei 300DPI mit zufrieden-
stellender Qualität. Die beigelegte Software bringt einem dann
oft das Grausen bei.
Die ist für den einfachen Nutzer (DAU) gemacht und erzeugt
regelmäßig einen gewissen Leidensdruck. Zum Bearbeiten von
Bitmaps aus dem Scanner benutze ich deshalb nur ein Vollprogramm
zur Bildbearbeitung (in dem Fall z.B. CorelPhotopaint).
Den ganzen Ramsch, denn es mal zum Scanner mit gab, installiere
ich deshalb gar nicht mehr.

Die OCR-Software ist auch oft veraltet und wird nur in Basisversion
geliefert(oft, wie bei Dir, noch mit Einschränkungen in der Funktion).

Ich habe die Buchseite als jpg, pdf (ohne OCR) und
als gif gescannt, je mit 300 ppi farbig. Dann habe ich noch
das jpg mit FreepdfXP in pdf umgewandelt, mit der Einstellung
„High Quality“. Es gab auch da einen Qualitätsverlust.

OCR ist in der HP-Software dabei, und funktioniert auch gut -
allerdings kann man OCR nur bei pdfs machen, bei jpg und gif
nicht.

Ich meinte nur, dass im „HP Solution Centre“, wenn man als
Dateiformat bmp wählt, OCR automatisch ausgeschaltet ist.

Richtige OCR-Software macht solche Zicken nicht.

Nur wüsste ich nicht, wo ich den von der Scansoftware
verwendeten Postscriptdrucker sehen oder gar anders einstellen
kann… Habe im GMX Mediacenter mal einen Screenshot des
betreffenden Programmordners eingestellt, vielleicht kannst du
es mir von dort angeben.

Keine Ahnung, was diese Software da veranstaltet.
Wie gesagt, entweder Du kommst damit klar, oder Du mußt Dir
ordentliche Software leisten. Das kostet natürlich was und
die Nachbearbeitung wird umso langwieriger.
Wenn Du also eine Variante hast, die halbwegs praktikabel ist,
dann wirst du dich wohl damit zufrieden geben müssen, oder?

Noch mal zum Problem der verdrehten Seiten.
Das kenne ich auch von selbst erzeugten PDF.
Passiert z.B. immer, wenn reine Bitmaps gewandelt werden.
Sobald da ein bischen richtiger Text drauf ist, wird dessen
Orientierung als Grundlage für die Darstellung benutzt.

Ich denke, das kann man irgend wo einstellen, wenn man selber
PDF macht (z.B. mit FreePDF -> über Gostscript).
Damit habe ich mich aber noch nicht beschäftigt.
Alternativ kann man irgendwo auf Blatt einen Text draufmachen,
(z.B. Kopf) dann wird das PDF auch entsprechend orientiert.
Ich würde das z.B. mit CorelDraw machen so machen und dann von
dort aus gleich als Postscript drucken.
Gruß Uwi

Die ersten beiden Dateien (GIF und JPG) kann ich nicht
original
runterladen.

Über Datei > Download versucht?

Nö, bei „Datei/Download“ kommt bei mir nix :frowning:

Wenn du das Kästchen bei der betreffenden Datei anklickst und dann auf Datei > Download gehst?

Wenn du das Kästchen bei der betreffenden Datei anklickst und
dann auf Datei > Download gehst?

Eben nicht :frowning: Da lädt bei mir nix!
Weiß nicht, warum das nicht geht :-?)
Gruß Uwi