XML Konformität wie erkennen

daniel_993968 · 8. Januar 2012 um 18:27

Hallo

ich versuche anhand unterschiedlicher Webseiten die XML Strukturen zu erkennen um sie dann mit einem DOM zu verarbeiten.

Als Beispiel habe ich die Seite
https://www.cortalconsors.de/Kurse-Maerkte/Aktien/In…

und würde nun gerne die einzelnen Kurse herauslesen bzw die Strukturen aufteilen. Nur ich weiss nicht wie ich da einen Überblick gewinnen kann

Kann mir bitte jemand einen Rat geben?

Danke

Daniel

guidot · 10. Januar 2012 um 09:08

Hallo,

dein Link ist leider unvollständig. Ich habe mir 'mal die Seite mit Indizes angeguckt, die haufenweise Validierungsfehler liefert (97 Fehler, 53 Warnings). Prinzipiell ist bei Webseiten aber das Problem, dass die zwar dem XHTML-Schema entsprechen müssen sollten, darüber hinaus aber zu nichts konform sein müssen. Mehr als den Seitenkode anzugucken und aus dem relevanten Part (hier: eine grosse Tabelle) selbst Regeln abzuleiten, fällt mir dazu nicht ein. Für den Anfang wäre eine Seite mit wenig bis keinen Fehlern sicher ein günstigerer Startpunkt.

Grüße, guidot

daniel_993968 · 10. Januar 2012 um 18:59

ich meine es verallgemeinert nicht konkret
Hallo

mein Problem ist das es mir im speziellen nicht um „eine“ Webseite geht für die ich eine Lösung suche. Mir geht es mehr darum selbst zu wissen wie ich die Lösung finde.

Die Seite von Consors mit den Indizies
cortalconsors.de/Kurse-Maerkte/Aktien/Indizes/world-indices

soll nur als Beispiel dienen nicht als Problemstellung.

ich habe zum Beispiel folgendes:

EU0
1
05.0 15:4:10 MEZ

das Problem ist das ich die Strukturen nicht erkenne. Ich weiss zwar dass das ein Teil ist den ich als Child exportieren kann.
Wenn ich aber die Strukturen wüsste dann könnte ich mir wärend der parsens davor und danach die entsprechenden codes selbst einfügen um dann den Baum zu bauen.

Daniel