Perfomance von Regulären Ausdrücken
Von: , Frage gestellt am Di, 3. Apr 2007
Hallo liebe Experten,
ich habe da ein kleines Problem :
Um eine HTML-Datei zu parsen (Export aus MSProject) will ich alle nutzlosen Daten entfernen. Die Datei sieht etwa wie folgt aus
<body>
bla
bla
<!--interessanter teil-->
<table>
.
.
.
</table>
bla
bla
bla
</body>
Nun möchte ich alles über und unter "interessanter teil" entfernen. Ein einfacher Ausdruck für "drüber" wäre z.B. (als PHP-Code)
preg_replace("/[\\s\\S]*<!--interessanter teil-->/","");
Durch das Suchverhalten der RegEx-Bibliothek dauert das ganze aber bei einer 30KB-Datei ca. 30 Sekunden.
Sieht jemand einen schnelleren Weg ?
Mit Stringfunktionen (pos,replace etc.) ist es zwar signifikant schneller, aber längst nicht so flexibel.
Wäre für jeden Hilfsansatz dankbar.
MfG
SvenOfNine
