Hyperlinks

Inne_62dc77 · 31. August 2005 um 13:44

Hi,

schreibe gerade ein tool das alle hyperlinks aus einem .html dokument herausfiltert.

das auslesen der -Tag’s und des dazugehärigem href-attributes ist kein problem.

nur giebt es links wie „DIR/SEITE.html“ wo ich die aktuelle url davor setzen muss und welche wie „www.website.de“ die wiederum keine weitere nachbearbeitung benötigen.

giebt es noch mehr sonderfälle???

wie filtert ein browser die hyperlinks aus einem .html dokument?

Inne

Thomas_Nenning_a01047 · 31. August 2005 um 16:11

Hallo

Das folgende Beispiel liest die Links, die sich im Dokument befinden, und zeiget diese einzeln in einem Dialogfenster an.

Lg

function test(){
// Auslesen der Anzahl von Links im Dokument
var LinkAnz = document.links.length;

// Variable in der die URL übergeben wird
var TheUrl = „“;

// Ausgabe der Anzahl von Links
alert(„Im Dokument befinden sich „+LinkAnz+“ Links“);

// Durchlaufen der einzelnen Links
for(var i=0; i<LinkAnz;i++){

// Übergabe der URL an die Var. TheUrl
TheUrl = document.links[i];

// Ausgabe der URL
alert("Link „+(i+1)+“ verweist auf: "+TheUrl);
}
}
kjjl
kjjl
kjjl

Inne_62dc77 · 31. August 2005 um 17:12

danke das script wäre perfekt nur schreibe ich das tool in vb und lade um den träffic??? klein zu halten nur die .html dateien runter. keine bilder usw. und durchsuche diese dann mit vb nach links um diese dann anzuzeigen.

PHvL · 31. August 2005 um 17:31

Hallo,
deine Umschalttaste scheint defekt zu sein.

nur giebt es links wie „DIR/SEITE.html“ wo ich die aktuelle
url davor setzen muss und welche wie „www.website.de“ die
wiederum keine weitere nachbearbeitung benötigen.

letztere müssten entweder auf z.B. „http://www.website.example/“ lauten oder müssten sehr wohl ergänzt werden – die Ähnlichkeit des Verzeichnisnamens zu einem Domainnamen ist dann reiner Zufall (oder ein Fehler im HTML-Code).

giebt es noch mehr sonderfälle???

Das Referenzieren in HTML ist, wie so vieles in diesem Zusammenhang, in SelfHTML beschrieben: http://de.selfhtml.org/html/allgemein/referenzieren.htm.

Was du noch nicht erwähnt hast sind seiteninterne Links mit absoluten Pfaden ("/example.htm") oder in übergeordnete Verzeichnisse ("…/example.htm"). Diese fallen nicht oder nur bedingt in die Kategorie „aktuelle URL davorsetzen“.

–
PHvL

Inne_62dc77 · 31. August 2005 um 17:40

danke an euch.
damit ist meine frage bis auf weiteres beantwortet.
thx inne