TXT -> ist wohl die portabelste Lösung, im Klartext in
Datei gespeichert, allerdings ohne Formatierung
Plain Text ist empfehlenswert, wenn es nicht auf Layout ankommt. Einfache Layouts wie Fettschrift oder Kursiv lassen sich durch fest definierte Syntax erreichen (z.B. *fett*, **kursiv**).
HTML -> ist auch sehr portabel, der Inhalt ist leicht aus
der Datei zu lesen (auch ohne Browser), sieht aber nicht auf
jedem Bildschirm 100% gleich aus
HTML ist mittel empfehlenswert. Es wird noch lange in die Zukunft lesbar sein, allerdings ist es nichts halbes und nichts ganzes.
PDF -> ist auch portabel, der Inhalt wird immer gleich
dargestellt
PDF wird in der Weiterentwicklung von Adobe und der Lizenzpolitik von Adobe beeinflusst sein. Natürlich ist davon auszugehen, dass es die nächsten Jahre Standard bleiben wird, aber für Langzeitarchivierung gänzlich ungeeignet. Wie bekommst du z.B. die Texte in eine Datenbank für eine Komplettsuche? Wird der Acrobat Reader auch in 10 Jahren noch für welches Betriebssystemverfügbar sein. PDF ist meiner Meinung nach für Langzeitarchivierung gänzlich ungeeignet. Sollte es auf Layouttreue ankommen, könnte man eher über Postscript nachdenken, auch wenn hier die gleichen Nachteile wie bei PDF wirken, wenn es um die Indexierung geht.
Noch nicht erwähnt - und da währen wir beim Favorit - ist XML. Hier liegt einerseits die Zukunft, was Anbindung an kommende Programme angeht, andererseits ist gewährleistet, dass es auch in vielen Jahren noch wirksam verarbeitet werden kann, da die Datenbeschreibung ja meist angehängt wird und das Dateiformat sich auf Plain Text beschränkt. Wird auch immer wieder in Fachartikeln so erwähnt.
Ein Außenseiter fällt mir noch ein: Tex beziehungsweise Latex. Basiert auf Plain Text, kann folglich bearbeitet werden, hat aber ein professionelles Layout, das getrennt davon definiert werden kann. Ergebnisse können als DVI, PS, HTML (oder auch PDF) ausgegeben werden und stehen so in vielen Umgebungen in einer angepassten Form zur Verfügung, wobei die Quelldatei immer bearbeitbar, indexierbar und klein (auch nicht unwichtig, bei Datenmengen über Jahrzehnte hinweg) bleibt.
Bilder sollten auf alle Fälle getrennt abgespeichert werden. Aus heutiger Sicht empfehlen sich die Formate JPG (wenn Verlust ok ist), PNG (Platzvorteil, je nachdem keine Verluste), TIF (keine Verluste, große Dateien) oder (E)PS (in Druckumgebungen, z.B. Verlage). Bei einem Formatwechsel wie er alle 20 bis 30 Jahre zu erwarten ist, kann man dann mit einem einfachen Batchskript alle Dateien auf einmal in ein anderes Format kovertieren.
Bleibt noch die Frage der Datenhaltung / Datenträger - aber danach war ja gar nicht gefragt 