Wie lange sind „alte“ Seiten im Google-Cache?

Hi!

Im Archiv hab’ ich schon gelesen (und ich wusste auch schon vorher), dass nicht mehr existente und/oder zwischenzeitlich veränderte Seiten dank Cache noch einige Zeit als Suchtreffer bei Google auftauchen, mindestens als sog. Schlaglicht in der Trefferübersicht.

Meine Frage ist jetzt:
Wie lange genau? Dauert es Wochen oder eher Monate, bis die Google-Suche (inkl. der Schlaglichter) nur noch den aktuellen Stand* ausspuckt – also bei veränderten Seiten nur noch den akuellen Stand anzeigen und bei gelöschten Seiten gar kein Ergebnis mehr – und nicht mehr den veralteten?
Gibt es da einen festen Zyklus, in dem Google (Deutschland) seinen Cache bereinigt?

Dazu habe ich jetzt weder im Archiv noch auf http://www.google.com/support/webmasters/bin/answer… ff./u. Ä. etwas Näheres gefunden.

Vielen Dank im Voraus für alle kompetenten Antworten!

LG
Jadzia

*) bei veränderten Sites hier unter der Annahme, dass nur eine Änderung stattgefunden hat und sich die Seite nicht permanent verändert; wir wollen’s ja nicht komplizierter machen als nötig :smile:

Hallo,

kann man so einfach nicht sagen, da dies von einer Vielzahl von Faktoren abhängt.

Zu gelöschten Seiten:

Wenn alle Voraussetzungen erfüllt sind, dauert dies einige Tage bis zu einigen Monaten. Die Seite muß entfernt, der Index gesäubert und der Spider muß eine 404 empfangen, wenn er denn mal vorbeikommt. Dann und erst dann - geht alles seinen sozialistischen Gang.

Für Notfälle git es das Removal-Tool:

http://www.google.com/support/webmasters/bin/answer…

Zu veränderten Seiten:

Dies hängt u.a. von der Besuchsfrequenz des Bots und der Art der Änderungen ab. Isses ja nicht doof, das Ding.

"google refreshes the cache on their own schedule, based on their re-spidering of your page. The cache doesn’t necessarily refresh every time a url gets spidered, but refreshing does depend on that.

There’s nothing that the site owner can do directly to make a cache refresh happen. But you can develop a site that google wants to spider more frequently, one that attracts many good backlnks and good traffic for example.

The crawl team has their own algorithm to set the „crawl-budget“ and it’s pretty complex. Clearly, have updated pages when googlebot stops by is a help. To that end, be sure the server responds accurately to If-modified-since requests.

An xml sitemap can help, and if your site is a news/blog style CMS, then pinging google whenever the RSS feed is updated can also help. There’s a host of factors involved, and they vary witih the type of site."

Quelle: Tedster (http://www.webmasterworld.com/google/3905321.htm)

Weitere von der Krake selbst:

http://www.googletutor.com/removing-your-content-fro…

Viel Spaß und laß dich nicht cachen …

godam

Hallo godam !
Die Zahl 404 bedeutet das die Seite zur Zeit nicht verfügbar ist . Ohne das ein Grund angegeben wird . Es kann verschiedene Gründe haben . Es ist aber möglich , das die Seite später wieder verfügbar ist . Gruss Koschke !

Hallo,

ist mir wohl bekannt. Die Gründe sind aber irrelvant, wichtig ist nur, das beim Aufruf der Seite eine 404 züruckgegeben wird, damit die Seite „verschwindet“.

Grüße

godam

Danke schonmal für Deine Antwort! Die hilft mir wenigstens etwas weiter.

LG
Jadzia