Hallo Norbert,
Der Text erscheint ohne Umlaute und mit allen
HTML-Programmierbefehlen.
Mit anderen Worten, da steht dann öfters sowas da:
Das ist eine Überschrift und hier kommt noch Text…
Sieht wahrscheinlich noch schlimmer aus…
Vieles kann ich auch gar nicht mehr
entziffern. Außerdem werden die Texte dadurch unendlich lang
und eine vernünftige Suche ist schwer möglich.
Hm, probiere mal mit html2txt die HTML-Tags rauszufiltern:
http://www.u32.de/soft_htm.html
Ähnliche Programme wurden vor kurzem auch hier empfohlen:
/t/html-code-entfernen/4677483/2
Viele Grüße
Marvin