Suchen von href und src mit preg_matsch ;)

Hi
Folgende beiden Schleifen finden komischerweise einige Links, anders gesagt nicht alle href-Tags bzw. src-Tags, nicht. Aber warum ?

Quelltext der beiden Schleifen:

# Ersetzen aller Links einer html-Seite
while(preg\_match("/(.\*[]\*\>.\*)/si", $html , $parts)){
 $new\_url = "XXXXXXXXXXXXXXX";
 $neu\_html = $new\_url.$parts[3].$neu\_html;
 $html = $parts[1];
}$neu\_html = $html.$neu\_html;

$html = $neu\_html;

while(preg\_match("/(.\*)([]\*\>.\*)/si", $html , $parts)){
 $new\_url = "yyyyyyyyyyyyyyyyy";
 $neu\_html = $new\_url.$parts[4].$neu\_html;
 $html = $parts[1].$parts[2];
}$neu\_html = $html.$neu\_html;

Hintergrund/Sinn des Ganzen:
Vor die href-links parse ich noch eine script-adresse, an diese wird dann der link als parameter übergeben.

Bei den src-links parse ich die relative Adresse zu einer absoluten.

Das wird gemacht, damit alle meine Seiten von der index-html ab, durch das selbe script geschleust werden.
Das Script parst die Inhalte, ändert eben einiges, und das Ergebniss wird gespeichert.

Danke for help.
Sebastian.

Re: Suchen von href und src mit preg_matsch :wink:
Hi,

Ersetzen aller Links einer html-Seite

Vielleicht hilft dir diese regexp ja weiter:

http://www.koehntopp.de/php/faq-regexp.html#regexp-8

Grüße,
Marcel