Moien
Es ging mir um die verschiedenen Prozessor Architekturen und
deren Verhältnis zu Operationen pro takt.
Da wirst du sehr viele Whitepaper lesen müssen und bist danach wahrscheinlich keinen Schritt weiter weil das meiste interessante Zeug Betriebsgeheimnis ist. Schon alleine die Auswirkungen eines Cache-miss oder einer falschen Branchprediction hauen unheimlich rein. Der P4 mag manche Ops in einem Takt gemacht haben (also Anzahl der Pipeline-stufen x 1 was auf eine Op pro Takt rausläuft) aber er hat in den ersten Versionen auch ziemlich übel auf falsche Branchprediction reagiert (die ganze Pipeline leer machen und neu ansetzen tut bei solch lagnen Pipelines richtig weh).
Dann sind die x86-Ops im Kern ja gar nicht mehr als x86-Op vorhanden. Es wird ja alles in mirco-Ops umgewandelt (teilweise mehrere micro-Ops pro x86-Befehl, teilweise mehrere x86-Befehle in einem micro-Op). Und die sind unter den Systemen wieder nicht vergleichbar.
Wenn es dann von x86 weg geht wird es noch komplexer. Power-Systeme haben z.B. spezielle Befehle die 80% der TCP/IP-Verwaltung in Hardware machen. Mit was willst du das beim x86 vergleichen?
Man kann eine durchschnittliche Op/takt-Rate mit etwas Aufwand aus den Spec-Benchmarks ablesen (sehen so aus: http://www.spec.org/cpu2006/results/res2006q3/cpu200… und sind recht gut beschrieben) Auch Mini-tests wie Wheatstone und Drystone Benchmarks sind da aufschlussreich.
aber evtl. bin ich auch auf dem Holzweg.
Komm von der Auswertung pro Befehl-XYZ runter und unterteil nur nach int, float und evtl. Speicher-Befehlen. Da sind die Unterschiede schon gewaltig genug.
cu