Grafikformate beim Scannen von Dokumenten

Hallo,
Ich habe mir gerade einen Scanner zugelegt (Canon LiDE35) mit dem ich bis jetzt sehr zufrieden bin. Nun will ich private Dokumente von mir (Zeugnisse, Schulungsbescheinigungen, …) einscannen um sie digital zu archivieren.
Die Frage die ich mir nun stelle ist, in welchem Format ich die Dokumente abspeichern soll.
Da es alles keine reinen Textdokumente sind, kommt nur irgendein Grafikformat in Frage. Aber welches?

  • JPEG: ist ein leider ein verlustbehaftetes Komprimierungsverfahren, aber mir ist beim Betrachten eines jpeg-Bildes im Vergleich zu einem Bitmap noch kein sichtbarer unterschied aufgefallen.
  • GIF: ist zwar nicht verlustbehaftet, dafür aber auf ein Farbtiefe von 8bit beschränkt, wenn ich mich recht erinnern kann - also auch für diese Zwecke unbrauchbar.
  • BMP: ebenfalls nicht verlustbehaftet, aber es braucht auch den meisten Speicherplatz, der ja zugegebener Maßen heute (fast) nix mehr kostet, aber bei 100 - 150 Dokumenten kommt schon einiges zusammen.
  • über andere Grafikformate (TIFF, PCX, …) kann ich leider nix sagen. Da weis ich nicht, was die für Vor-/Nachteile haben.
  • Oder macht es Sinn, die Dokumente gleich ins pdf-Format zu wandeln?

Welche Auflösung bemi Scannen würdet ihr für den von mir gewählten Fall wählen? Ich denke mal 300dpi dürften ausreichend sein.

Ich hoffe ihr könnt mir weiterhelfen.

Gruß Rainer

Ich habe mir gerade einen Scanner zugelegt (Canon LiDE35) mit
dem ich bis jetzt sehr zufrieden bin. Nun will ich private
Dokumente von mir (Zeugnisse, Schulungsbescheinigungen, …)
einscannen um sie digital zu archivieren.
Die Frage die ich mir nun stelle ist, in welchem Format ich
die Dokumente abspeichern soll.
Da es alles keine reinen Textdokumente sind, kommt nur
irgendein Grafikformat in Frage. Aber welches?

Ich habe grade einen ganzen Stapel von solchem Kram gescannt. Der größte Teil sollte ja schwarzweiß sein, eventuell mit ein paar wenigen farbigen Elementen. Als recht gutes Format hat sich dabei PNG mit 8bit Palette erwiesen. Dadurch, dass große Flächen einfarbig sind (beim Scannen schon richtig einstellen, dass sehr feine Details wie die Struktur des Papers absaufen) lässt sich das ausgezeichnet komprimieren. Die Einschränkung auf 256 Farben fällt kaum auf, ein Ausdruck von einem 200DPI-Scan ist auf den ersten Blick nicht vom Original zu unterscheiden, und als Original geht so ein Scan sowieso nicht durch.

Die resultierenden Dateigrößen lagen bei A4-Scans mit 200DPI (Format ca. 1700x2475) bei 200KByte bis 1,8MByte, wobei nur 3 von 19 Dokumenten über 600KByte rauskamen.

Hi,
wie ist der weiter Verwendungszweck dieser Dokumente? Falls viel Text dabei ist und die Dokumente später einmal in Druck gehen sollen wären 600 ppi nicht schlecht. Ich gehe aber mal davon aus, dass du die Dokumente nur privat archivieren willst und sie gegebenenfall zu Hause ausdrucken möchtest. In diesem Fall reichen 300 ppi im PDF-Format. Tiff wäre auch eine Möglichkeit. Falls du PS hast kannst du diese mit LZW-Komprimierung (verlustfrei) abspeichern.
Also mein Rat, PDF oder Tiff mit LZW-Kompr. mit 300 ppi.

Gruß
Magnus

Hallo Rainer,

das Thema ist weiter unten unter „Zeugnisse digitalisieren“ schon diskutiert worden.

Gruss Reinhard

Hi, im Gegensatz zu dem unten genannten Versandproblem geht es hier um reine Archivierung.

Ich würde dazu in gar keinem Fall pdf nehmen, da man nicht weiß, ob es irgendwann noch pdf bzw. Programme die es lesen können, geben wird, und sich pdfs nur verlustbehaftet, wenn überhaupt in andere Formate konvertieren lässt. dh. Du hast dann einen Haufen Dokumente, wo man nicht mehr ran kommt.

Ich würde für Dokumente am ehesten TIF nehmen

  • verlustfreie komprimierung bei relativ guter Kompressionsrate möglich
  • mehrseitige Dokumente möglich
  • viele Scanner /Programme können mit Tif umgehen
  • weit verbreitet, in diverse Formate konvertierbar daher zukunftssicher

Wir archivieren in der Firma alle alten Zeichnungen als TIF. Eine A4 schwarz-weiß Seite ist da nur ca. 100 kB groß bei 400 dpi.

Gruss A.

Hallo,

ob beim Speichern als jpg- oder pdf-Datei Verluste auftreten, liegt an den Programmeinstellungen. Es ist durchaus möglich in beiden Formaten ohne Informationsverlust zu speichern.

ujk

Ich würde dazu in gar keinem Fall pdf nehmen, da man nicht
weiß, ob es irgendwann noch pdf bzw. Programme die es lesen
können, geben wird, und sich pdfs nur verlustbehaftet, wenn
überhaupt in andere Formate konvertieren lässt.

HÄ!!!
PDF ist so ziemlich DAS Austauschformat. Läuft auf allen Plattformen und wurde speziell zu diesem Zweck von Adobe entwickelt!
(PDF = PortableDocumentFile)

Gruß
Magnus

Hi, so nicht richtig. PDF kann ich verlustfrei abspeichern, JPG definitiv nicht! Ich kann die Komprimierung reduzieren aber nicht gänzlich ausschalten.

Gruß
Magnus

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo

Ich würde dazu in gar keinem Fall pdf nehmen, da man nicht
weiß, ob es irgendwann noch pdf bzw. Programme die es lesen
können, geben wird, und sich pdfs nur verlustbehaftet, wenn
überhaupt in andere Formate konvertieren lässt.

HÄ!!!
PDF ist so ziemlich DAS Austauschformat. Läuft auf allen
Plattformen und wurde speziell zu diesem Zweck von Adobe
entwickelt!
(PDF = PortableDocumentFile)

Es geht aber nicht um Austausch, sondern Archivierung. Da sollte man, soweit irgend möglich und absehbar, ein „simples“ Format nehmen. PDF ist ja nun nicht gerade dafür bekannt, das sich Inhalte ohne besondere Tools oder grössere Anstrengungen wieder extrahieren lassen.

Ich rate auch zu TIF, nur bei den dpi würde ich selektiv arbeiten (falls nicht zwingenderweise die gleiche Auflösung gefordert ist).
Z.B. 200-300 dpi Graustufen und bei hohen Linienanteilen im Dokument gleich in s/w mit 600 oder höher dpi.

Gruß, DW.

Hallo

Ich würde dazu in gar keinem Fall pdf nehmen, da man nicht
weiß, ob es irgendwann noch pdf bzw. Programme die es lesen
können, geben wird, und sich pdfs nur verlustbehaftet, wenn
überhaupt in andere Formate konvertieren lässt.

HÄ!!!
PDF ist so ziemlich DAS Austauschformat. Läuft auf allen
Plattformen und wurde speziell zu diesem Zweck von Adobe
entwickelt!
(PDF = PortableDocumentFile)

Es geht aber nicht um Austausch, sondern Archivierung. Da
sollte man, soweit irgend möglich und absehbar, ein „simples“
Format nehmen. PDF ist ja nun nicht gerade dafür bekannt, das
sich Inhalte ohne besondere Tools oder grössere Anstrengungen
wieder extrahieren lassen.

Was willst du denn extrahieren? Aus einem Tiff kannst du auch nichts extrahieren. PDF hat den Vorteil, dass doch inzwischen jeder den Acrobat hat. Ich kann meine Daten also problemlos von fast jedem Rechner dieser Erde ausdrucken. Bei PDF brauche ich also nicht notgedrungen ein Bildbearbeitungs- oder Layoutprogramm. Und will ich die PDF abändern (was bei archivierten Dokumenten wohl eher nicht der Fall sein wird) mach ich das Teil halt in PS auf. Meiner Meinung nach ist PDF das Format der Zukunft.

Gruß
Magnus

Hallo

Ich würde dazu in gar keinem Fall pdf nehmen, da man nicht
weiß, ob es irgendwann noch pdf bzw. Programme die es lesen
können, geben wird, und sich pdfs nur verlustbehaftet, wenn
überhaupt in andere Formate konvertieren lässt.

Hallo zusammen,

also mit so völlig unsinnigen Einwürfen gegen PDF hätte ich allenfalls von Leuten gerechnet, die auf der Lohnliste von Microsoft stehen. In Wirklichkeit ist PDF nicht nur an sich schon sytemübergreifend austauschbar, sondern beruht auch noch auf PostScript, einem der ältesten und etabliertesten Standards, die es in der IT jemals gab. Natürlich ist es genau das, was MS ein Dorn im Auge ist, aber dem muss man sich ja nicht sklavisch unterordnen.

Ausserdem soll mir mal jemand eine Volltextsuche in TIFF-Dateien demonstrieren - bei allen selbsterstellten PDFs kein Problem.

Gruss Reinhard

Hallo,

mein Graphikprogramm, behauptet mit der Option

Optional (4:4:4)

werden die jpgs ohne Qualitätsverlust gespeichert.

Ich habe den Versuch gemacht, eine Datei zu speicher, wieder zu öffnen und wieder zu speichern. Die Dateigröße verringert sich nicht.

Ist das schlüssig?

ujk

Hallo,

mein Graphikprogramm, behauptet mit der Option

Optional (4:4:4)

werden die jpgs ohne Qualitätsverlust gespeichert.

Ich habe den Versuch gemacht, eine Datei zu speicher, wieder
zu öffnen und wieder zu speichern. Die Dateigröße verringert
sich nicht.

Ist das schlüssig?

Ehrlich gesagt für mich nicht so ganz. Ich habe jetzt schon seit über 10 Jahren mit JPGs zu tun, dass es ein JPG ohne Komprimierung gibt, ergibt keinerlei Sinn.
Dass sich die Dateigröße nicht verändert ist im Übrigen völlig normal. Sobald ich beim nochmaligen Speicher die gleiche Komrpimierungsstufe wähle ändert sich weder Größe noch Qualität des Bildes (auch wenn viele etwas anderes behaupten). Bei mehrmaligem Speichern in gleicher Komprimierungsstufe wird die Qualität des Bildes nicht jedes Mal schlechter. Zum besseren Verständnis hier mal ein Link:
http://www.lemontree.de/seminare/gdbint/lektion2/4.htm

Abspeichern in 4:4:4 ist eigentlich kein JPG, da keinerlei Komprimierung stattfindet - dann kann ich’s gleich lassen!?!
Welches Programm benutzt du?

Gruß
Magnus

Hallo

also mit so völlig unsinnigen Einwürfen gegen PDF hätte ich
allenfalls von Leuten gerechnet, die auf der Lohnliste von
Microsoft stehen. In Wirklichkeit ist PDF nicht nur an sich
schon sytemübergreifend austauschbar, sondern beruht auch noch
auf PostScript, einem der ältesten und etabliertesten
Standards, die es in der IT jemals gab. Natürlich ist es genau
das, was MS ein Dorn im Auge ist, aber dem muss man sich ja
nicht sklavisch unterordnen.

[Wilde Beschimpfungen gegen Fachidioten verkneife ich mir mal]

Liesst irgendjemand eigentlich die Ausgangsfrage? :frowning:
Ich selbst benutze seit Ewigkeiten Acrobat, obwohl ich es ziemlich teuer finde, und benutze die erweiterten Funktionen wohl mehr als die meisten User (Acroscript), und war bei den drei von mir benutzen Lithos jeweils erster PDF statt PS Kunde.

Ich bleibe dabei, wer Zeugnisse oder so archivieren will, handelt sich mit PDF ein zusätzliches, und daher unnötiges Format ein, in der PDF ist auch nur ein TIF, JPG o.ä. eingebettet. Will man später aus irgendwelchen Gründen das Bild verändern (Kontrast anpassen, Ausschnitte rausholen…) muss man den Inhalt extrahieren, und dazu benötigt man ein Tool. Dann heisst es zu hoffen das es für die benutze PDF-Variante ein Freewareprogramm gibt, oder darf sich mit teuren Pre-Press-Programmen rumschlagen.

Ausserdem soll mir mal jemand eine Volltextsuche in
TIFF-Dateien demonstrieren - bei allen selbsterstellten PDFs
kein Problem.

Was ein Blödsinn! Seit wann hat PDF eine integrierte AI, die die Zeugnisnoten lesen kann?
Es gibt zwar Plugins, die automatisch OCR machen, und damit Catalog (oder wie immer das in der aktuellen Variante heist) füttern, aber mit dem gleichen Aufwand kann ich die Bitmaps OCRen und passend abspeichern (wenn man will und Ahnung hat, auch gleich als TIFF6 Tag in der TIF speichern).

DW.

  • JPEG: ist ein leider ein verlustbehaftetes
    Komprimierungsverfahren, aber mir ist beim Betrachten eines
    jpeg-Bildes im Vergleich zu einem Bitmap noch kein sichtbarer
    unterschied aufgefallen.

Na dann nimm JPEG…inwieweit es sichtbare Qualitätsverluste gibt, ist schließlich Einstellungssache.

  • GIF: ist zwar nicht verlustbehaftet, dafür aber auf ein
    Farbtiefe von 8bit beschränkt, wenn ich mich recht erinnern
    kann - also auch für diese Zwecke unbrauchbar.

Sind 256 Farben für Textdokumente denn nicht genug? Im simpelsten Fall hat man eh nur Schwarz Weiß (also 2 Farben).

  • Oder macht es Sinn, die Dokumente gleich ins pdf-Format zu
    wandeln?

Wenn man eingecanntes in PDF konvertiert, macht das imho auch nur Grafiken drauß (ähnlich JPEG). Erst wenn man es in wirklichen Text umwandelt (per OCR) kommt da ein Dokument ohne Verluste und von der Größe her frei skalierbar raus - bei kleiner Dateigröße.

[Wilde Beschimpfungen gegen Fachidioten verkneife ich mir mal]

Also jetzt halt mal den Ball flach! Es spricht nichts gegen PDF. Keines deiner Argumente ist stimmig! Ich kann PDF sehr wohl nachbearbeiten. Natürlich brauche ich ein Programm dazu - mit der Zahnbürste geht das nicht. Übrigens auch nicht beim Tiff! Oder holst du da den Malkasten raus und schmierst auf dem Bildschirm rum?
Fast jeder hat den AcrobatReader und der ist für UMME!
Aber mir wird das jetzt zu doof und klinke mich hier aus dieser Diskussion aus. Hat sich ja dann eh erledigt wenn das PDF-Format gestorben ist!
Benutzt JPG, TIFF, GIF oder sonst was und werdet glücklich damit.

Tschüss
Magnus

Hallo,

ich habe dazu auch noch was gefunden

http://www.hixmen.fh-wolfenbuettel.de/data/graf_dv/B…

Ich benutze das berüchtigte CorelPhotoPaint.

Gruß,

ujk

Hi,
danke für den Link - interessante Geschichte. Also gibt es JPG ohne Komprimierung, allein die Farbraumdefinition ändert sich.
Allerdings für die Praxis nicht wirklich nützlich eine Kompression mit dem Faktor Null zu ermöglichen.
Bitte kochen sie ihr Wasser auf der Stufe Null damit kein Dampf entsteht.
Na ja, immerhin sind wir jetzt alle ein Pfund schlauer.

Gruß
Magnus

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo,

Die Frage die ich mir nun stelle ist, in welchem Format ich
die Dokumente abspeichern soll.

Schau sie Dir nach dem Scannen an und Du wirst sehen, ob
die Qualität Deinen Ansprüchen genügt.

Da es alles keine reinen Textdokumente sind, kommt nur
irgendein Grafikformat in Frage. Aber welches?

GIF ist IMHO ein gutes und gängiges Format, das bei Grafiken
genügend Qualität liefert und dabei auch platzsparend
ist. Das Problem der begrenzten Farben ist da eher zweit-
rangig, wenn man bei der Konvertierung die Farbpalette
„optimiert“ einstellt. Dann werden genau die Farben genommen,
die im Bitmap drin sind. Du wist in den allermeisten Fällen
dann kaum Farbverfälschungen feststellen können.
Wenn Du natürlich die Standardfarben nimmst, dann sieht es
schon ziehmlich verfälscht aus.

  • JPEG: ist ein leider ein verlustbehaftetes
    Komprimierungsverfahren, aber mir ist beim Betrachten eines
    jpeg-Bildes im Vergleich zu einem Bitmap noch kein sichtbarer
    unterschied aufgefallen.

Das ist natürlich so, wenn die Komprimierrate gering
eingestellt wird (1:5…1:10). Dann ist nur mit Mühe der
Unterschied zum Original festzustellen.
Was da oft wegen der permanenten Qualitätseinbußen genannt
wird, ist IMHO Grafik-Esoterik.

  • GIF: ist zwar nicht verlustbehaftet, dafür aber auf ein
    Farbtiefe von 8bit beschränkt, wenn ich mich recht erinnern
    kann - also auch für diese Zwecke unbrauchbar.

Nö, bei Grafiken, mit großen Flächen, wird GIF bei gleicher
Qualität kleinere Datein liefern im Vergleich zu JPG.

Bei Fotos ist JPG mit moderater Komprimierung allemal
für’n Heimgebrauch ausreichend.

  • BMP: ebenfalls nicht verlustbehaftet, aber es braucht auch
    den meisten Speicherplatz, der ja zugegebener Maßen heute
    (fast) nix mehr kostet, aber bei 100 - 150 Dokumenten kommt
    schon einiges zusammen.

Muß ja nicht sein :smile:
Selbst wenn die Festplatten heute riesig sind, muß das
Ganze als Backup ja evtl. auf eine CD passen (DVD ginge
natürlich auch, aber deren Datensicherheit soll wesentlich
schlechter sein, als CD).

  • über andere Grafikformate (TIFF, PCX, …) kann ich leider
    nix sagen. Da weis ich nicht, was die für Vor-/Nachteile
    haben.

Entweder frist es Speicher oder hat die Nachteile der
Komprimierung. Man kann nicht alles gleichzeitig haben
wollen.

  • Oder macht es Sinn, die Dokumente gleich ins pdf-Format zu
    wandeln?

Nö, immer schon die Original behalten. PDF ist ein klasse
Austauschformat, aber nicht gut geeignet, wenn man später
noch mal was bearbeiten will.

Welche Auflösung bemi Scannen würdet ihr für den von mir
gewählten Fall wählen? Ich denke mal 300dpi dürften
ausreichend sein.

Für normale Grafiken reichen 300DPI.
Mit 600PDI in Farbe werdens dann auch schon riesige
BMP-Dateien, die gar nicht jedes Programm verarbeiten kann.

Gruß Uwi

Hallo Peter,
ich habe mich unter anderem durch dein Posting entschieden meine ganzen Dokumente mit 600dpi zu scannen und in TIF abzuspeichern. Das macht bei einem DIN A4 Dokument dann eine Dateigröße von etwa 10MB je Datei bei einer Originalgröße von 100MB und damit kann ich leben. Wenn ich in TIFF abspeichere kann ich zwischen verschiedenen Versionen wählen (zip-, lzw-Komprimierung). Kannst du mir sagen, was günstiger ist? Ich habe mal getestet und festgestellt zip erzeugt etwas kleinere Dateien, dafür konnte die Standard-Windows Bild und Faxanzeige das mit zip komprimierte Bild nicht öffnen; bei lzw war dieses Problem nicht da. Aber eigentlich müßte die zip-Konmprimierung verbreiteter sein, oder?

Gruß Rainer