Hallo
In meiner Homepage Statistik taucht neben IE und Netscape auch ein Browsertyp auf, mit dem ich überhaupt nichts anfangen kann. FAST-WebCrawler/2.2-pre 19.
Was ist das denn für einer?
Wär toll, wenn jemand von Euch das weiss.
Gruss
kathrin
Hallo Kathrin,
webcrawler ist kein Browser für Menschen, sondern ein Suchmaschinen-Spider.
Alles Gute wünscht
Michael
und was ist ein suchmaschinen - SPIDER??? Und warum erscheint das in meiner statistik unter „Browser“?
mfg,
Kathrin
Ein Suchmaschinen-Spider, ist ein Programm, dass wie eine Spinne (daher Spider) durch das ganze Web läuft (naja, das schafft keiner - das Web ist zu groß) und die gefundenen Seiten in die Suchmaschine einträgt.
Wenn du eine Suchmaschine befragst, wird nicht etwa in dem Augenblick im Web gesucht, sondern nur in der Datenbank, die die Spider dieser Suchmaschine vorher mit Daten gefüllt haben.
Eine URL deiner Seite ist wohl, evtl. durch deine explizite Anmeldung bei einer Suchmaschine oder durch einen Link von einer anderen Site, die der betreffenden Suchmaschine schon bekannt war, mit in die Suche reingerutscht.
Alles Gute wünscht
Michael
Hallo
Das erklärt aber immer noch nicht, warum der Crawler dann bei mir in der Browser Statistik landet oder?
gruss,
kathrin
Doch, er verhält sich ja wie ein Browser, nur ist es eben kein Browser, der von einem Menschen von Seite zu Seite weitergecklickt wird, sondern der über alle Links läuft, die er findet, sich die Seiten runterlädt und Auszüge daraus in eine Datenbank packt.
Der große Unterschied zu einem echten browser ist, dass die Seiten nicht „gerendert“ werden, also nicht formatiert auf einen Bildschirm gebracht werden. Den Spider interessieren nur der Text auf der Seite und die Links.
Jetzt klarer?
Michael
Hi,
Das erklärt aber immer noch nicht, warum der Crawler dann bei
mir in der Browser Statistik landet oder?
die Bezeichnung „Browser“ ist tatsächlich falsch - in Deiner Statistik. Es ist die Interpretation bzw. Darstellung dessen, was der Client (Browser sind Clients) als Header namens „User-Agent“ mitschickt. In dieser Angabe identifiziert sich das Programm, das die Seite anfordert; vorausgesetzt, es möchte das.
Ein Spider identifiziert sich z.B. als „WebCrawler“. Die Interpretation Deiner Statistik, es handele sich hier um einen Browser, stimmt zwar meistens, aber eben nicht immer.
Cheatah