Counter, Suchrobots/Spider

Letztens habe ich gelesen, dass ein Counter wenig aussagt über die Häufigkeit der Seitenaufrufe, da bis zu 90 % (!) auf das Konto von Suchrobotern gehen, die ständig durch das Netz wieseln und alles aufrufen/absuchen.
Was ist dran?
Danke Stucki

Letztens habe ich gelesen, dass ein Counter wenig aussagt über
die Häufigkeit der Seitenaufrufe, da bis zu 90 % (!) auf das
Konto von Suchrobotern gehen, die ständig durch das Netz
wieseln und alles aufrufen/absuchen.
Was ist dran?

90% scheint mir etwas sehr übertrieben. Es hängt ganz davon ab, wie Counter programmiert sind, wieviele Besucher kommen, und wie umfangreich die Seite ist. Grundsätzlich könnte man über eine Environment-Variable (HTTP_USER_AGENT) unterscheiden, ob ein Spider/Suchroboter oder ein Web-Browser auf die Seite zugreift.

Eine Reloadsperre hilft meist wenig, da die Spider fast immer einige Zeit zwischen den Zugriffen auf die Einzelseiten vergehen lassen. Einige sind auch noch so gemein von verschiedenen Rechnern (IP-Nummern) zuzugreifen. Daher werden diese Zugriffe von vermutlich vielen Countern (als Besucher) gezählt. Folge: Besucher werden nur einmal gezählt, auch wenn sie mehrere Seiten anschauen. Spider aber oft bei jedem Seitenzugriff. => Hoher Spideranteil

Meine Erfahrung: Auf unserer Seite läuft ein Counter, der die Spider mitzählt. Wir haben ca. 300 Einzelseiten und ca. 300 Besucher am Tag. Die Seiten wurden bei ziemlich vielen Suchmaschinen angemeldet. Im Schnitt haben wir ca. 20 Spiderzugriffe pro Tag. Bei den 300 Besuchern sind, dass weniger als 10%. Vor einigen Monaten hatten wir noch ca. 100 Besucher und nur etwas weniger Spiderzugriffe, also fast 20%. Es kann vorkommen, dass ein Spider auch mal 50 Seiten oder mehr an einem Tag durchsucht.

Je weniger Einzelseiten und je mehr Besucher eine Webseite hat, desto weniger wirken sich die Bot-Zugriffe auf die Seitenzählung aus. Mit einem guten Counter könnte man sie ganz eliminieren.

Grüße
nòóx

Was ist dran?

Hallo,

nichts ist dran … :smile:

Suchmaschinenrobots dursuchen zwar auch eine Homepage lösen aber bei den Countern keine Zählung aus. Lediglich bei Countern die auf der Access-Log-Basis zählen würde sich das bemerkbar machen. Derartige Counter sind aber eigentlich nicht üblich und wären vom Ansatz her auch recht unsinnig.

Was wohl der Tatsache entspricht, das der Traffic einer Homepage sowie die Page-Impressions bzw. die Hits im allgemeinen durch die Suchrobots beeinträchtigt werden. Allerdings wird das auch so in den bekannten Auswertungsprogrammen dargestellt. So das man diesen Faktor durchaus abziehen könnte.

Allerdings wer schon so weit im Internet zu Fuß ist, das er seine access_log Datei auswerten kann verwendet sowieso keine sichtbaren Counter, das tun eigentlich nur und nahezu ausschliesslich Seitenbetreiber die noch in den Anfängen stehen. Zumindest kann man oft anhand eines Counters erkennen, das die Seiten wohl von Anfängern kommen.

Hip ist es hingegen versteckte Counter zu verwenden (die Verwendung von Countern als solches ist ja nicht zwangsläufig unsinnig).

Die Suchmaschinenrobots verursachen übrigens um Deine eigene Site nicht lahm zu legen äusserst wenig impressions auf einmal. Die meisten Suchmaschinen schauen sich im Abstand von einigen Tagen immer mal 1-3 Seiten an, und lassen dann Deinen Server in Ruhe. Gehen wir mal von 10-20 Suchmaschinen aus würde bei 10 Suchmaschinen durschnittlich evtl. 1 Seite pro Tag besucht werden. Dabei werden aber diese Besuche auch nicht in den Countern protokoliert.

Fazit:
Wenn man einen Counter sieht, der nicht eine seröse Reloadsperre hat (z.B. http://webhits.de) sollte man ihm in keinem Fall trauen.
Und Counter (insbesondere die mit den etwas besseren Statistiken), werden nicht die Suchmaschinenzugriffe zählen.

Gruß aus Wedel
Knud Schiffmann
http://internet-partner.de

Suchmaschinenrobots dursuchen zwar auch eine Homepage lösen
aber bei den Countern keine Zählung aus. Lediglich bei
Countern die auf der Access-Log-Basis zählen würde sich das
bemerkbar machen. Derartige Counter sind aber eigentlich nicht
üblich und wären vom Ansatz her auch recht unsinnig.

Ich lese daraus, dass die meisten verfügbaren Counter den HTTP_USER_AGENT auslesen und dann nur die Browser zählen. Stimmt das?

Grüße
nòóx