Html-website in xml umwandeln - wie?

hallo,

als absolute XML-anfängerin suche ich nach einer möglichkeit, eine komplette bestehende HTML-website (jedenfalls zumindest die content-seiten) automatisch in XML umzuwandeln.

gibt es dafür (downloadbare) software? oder noch besser einen service in web, wo ich meine seite uploaden kann und diese dort in XML umgewandelt wird?

hoffe, es gibt eine lösung - brauche sie relativ dringend! vielen dank im voraus für eure antworten!

lg, martina

Hi,

kurze Antwort: Gibts nich.

Lange Antwort: Die eierlegende Wollmilchsau die du dir da wünschst ist nicht möglich. Was du da verlangst ist ja ähnlich wie maschienelles Übersetzen - und das haut auch kaum hin. Aber du kannst dir das selber machen: Mittels XSL(T) kannst du die entprechenden HTML-Konstrukte umschreiben. Aber wie gut das geht hängt von der Struktur deiner HTML-Seite ab. Und das denke ich mal kannst du wohl eher knicken.

MfG DIez

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Howdy,

ohne Aufwand wirst du da nicht weiterkommen, aber

ich habe ein PerlProgramm geschrieben, dass zum Verwalten kleinerer bis mittlerer Sites mit nur einem XSL-Stylesheet dient.
Die Eingabedateien sind die Contentdateien: XML. Ich denke, du koenntest sicherlich ein kleines Skript schreiben, dass dir von allen deinen alten HTML Seiten die Header und Footer wegschneidet und den Rest in eine XML-Seite verpacken… Uhmm, ich glaube ja nicht, dass ich mich gerade sehr verstaendlich ausdruecke… Schau einfach selbst: http://www.skamphausen.de/software

gruss
kampi

ps: ja, ja, is eigenwerbung, aber -hey- is freiesoftware

vielen dank, werde ich mir sicher anschauen!
lg, martina

Wenn du Probleme hast: schick mir ne Mail…

(Juchuu!! Im aktuellen LinuxMag taucht w3make in der BraveGNUWorld auf :smile:)))

oehm, tschullijung der kleine Ausbruch *g*

kampi

hallo,

als absolute XML-anfängerin suche ich nach einer möglichkeit,
eine komplette bestehende HTML-website (jedenfalls zumindest
die content-seiten) automatisch in XML umzuwandeln.

gibt es dafür (downloadbare) software? oder noch besser einen
service in web, wo ich meine seite uploaden kann und diese
dort in XML umgewandelt wird?

Du brauchst dafür keinen Web-Service. Einfach auf der Shell

for i in *.html; do mv $i basename $i .html.xml; done

eingeben (vorausgesetzt, Deine Dateien enden auf .html, ansonsten .html durch .htm ersetzen; desweiteren habe ich mangels weiterer Angaben angenommen, dass Du unter Unix arbeitest).

SCNR.

Ich bin nicht ganz sicher, was Du wirklich willst. Geht es Dir darum Dateien, die nach irgendwelchen SGML-DTDs ‚formatiert‘ sind (z.B. HTML 4.0) von SGML nach XML umzuwandeln? Dafür gibt’s z.B. osx, das ist im OpenSP-Paket enthalten. Aktuelles HTML sollte eigentlich nach der XHTML-DTD modelliert sein (weiss jemand, wie verbreitet das inzwischen ist?), da gibt’s dann nix mehr umzuwandeln, das ist dann schon gültiges XML.

Ciao, Christoph