Hier gebe ich mal einen Auszug aus http://www.computerbase.de in die Runde.
Es handelt um Pentium versus Celeron. Und die Bedeutung des Caches.
Die prozessornahen L1 und L2 Speicher zeichnen sich hierbei durch besonders niedrige Latenzzeiten und hohe Taktraten aus, auf die der Prozessor nahezu ohne größere Verzögerung zugreifen kann. Im Vergleich dazu geht ein Lesevorgang aus dem Arbeitsspeicher nur im Schneckentempo von statten. Ein guter Prozessor versucht also Daten, die er aus dem Arbeitsspeicher benötigt zu laden, bevor er sie eigentlich benötigt. Er schätzt hab, welche Daten zu weiteren Abarbeitung des Prozesses (Threads) oder folgender Threads, die sich schon in der Warteschleife befinden, benötigt werden. Doch beim Schätzen kann man sich natürlich auch verschätzen, was sich dann in einem sogenannten Case Miss äußert. Hier muss der Prozessor mitten in der Bearbeitung eine Pause einlegen und auf die Daten auf den Arbeitsspeicher warten. Das kostet natürlich sehr viel Zeit und somit auch Performance. An dieser Stelle wäre ein Blick in die Grundlagen von HyperThreading anzuraten.
Um die Anzahl der Cache-Misses zu reduzieren, kann es also hilfreich sein, mehr Daten in den schnellen, prozessornahen Caches abzulegen. Eine Vergrößerung kann hier also wahre Wunder bewirken. Hier gilt es jedoch einen idealen Mittelweg zu finden. Denn die Caches sind nur dann schnell, wenn sie klein gehalten werden. Außerdem sind sie in ihrer Fertigung hochkomplex, da sie sehr viele Transistoren beinhalten. So machen 256kB L2 Cache beispielsweise ca. 13 Millionen zusätzliche Transistoren, die je nach Prozessorarchitektur mit dem vollen Prozessortakt betrieben werden. Doch bereits ein fehlerhafter Transistor kann das Aus für den ganzen Prozessor bedeuten.
Während die ersten Pentium 4 Prozessoren mit Willamette-Kern noch über einen 256 kB L2 Cache verfügten, kommen Pentium 4 Prozessoren mit Northwood-Kern mit ganzen 512 kB von diesem Speicher daher. Der erreichte Leistungszuwachs bei gleichem Takt ist ernorm, was nicht zuletzt der Celeron 2,0 GHz Review zeigte, wo der L2 Cache ganz und gar auf 128 kB L2 beschnitten wurden.