AMD Phenom II X4 Deneb — 45 nm für den Desktop
Die Schwächen des 65 nm K10
Die Strategie der stetigen Evolution hätte auch aufgehen können. In der Praxis erreicht ein K10 je nach Software pro Takt pro Kern tatsächlich eine 10–15 Prozent bessere Leistung, als ein K8. Man spricht hier von einem höheren IPC (bzw. seltener von einem niedrigeren CPI). Pi-mal-Daumen ist ein K10-Kern dank seiner Detail-Optimierungen bei 2,3 GHz ungefähr so schnell, wie ein K8-Kern bei 2,6 GHz. Zudem kann der K10 vier Kerne in die Waagschale werfen, während der K8 mit zweien auskommen muss, was multithreaded Anwendungen zusätzlich beschleunigt. Allerdings kommt ein höherer IPC nur dann in Form einer höheren Leistung beim User an, wenn der Hersteller nicht gleichzeitig die Taktfrequenz massiv senken muss. Gegenüber den 3,2 GHz des schnellsten K8 konnte der K10 anfangs aber nur 2,3 GHz dagegen setzen. Da hilft auch ein 15 Prozent höherer IPC nichts, wenn andererseits die Taktfrequenz um 30 Prozent reduziert wird. Ob die schlechte Taktbarkeit nur am zweifelhaften 65 nm Verfahren von AMD lag oder auch zusätzliche Ursachen im Design (Speed-Pathes, Signalübersprechungen, etc.) hatte, können wir an dieser Stelle natürlich nicht beantworten.
Zudem konnte sich der viel gerühmte L3-Cache nicht durchgehend bewähren. Zwar ist mehr Cache grundsätzlich positiv zu bewerten, da die Wahrscheinlichkeit sinkt Daten aus dem quälend langsamen RAM holen zu müssen. Als zusätzliche Cachestufe implementiert erhöht er jedoch auch die Latenz, da nun auch noch in einer dritten Cachestufe nachgesehen werden muss ehe ein Cache-Miss feststeht. In diesem Fall sind beim K10 bereits mehr Taktzyklen als beim K8 verstrichen, bevor die Daten dann letztendlich doch aus dem RAM angefordert werden müssen. Der Vorteil der niedrigen Latenzzeiten, die der K8 durch die Integration des Memory-Controllers in die CPU geschenkt bekam, war beim K10 zum Teil wieder dahin. Man könnte sagen: der Level 3 Cache des K10 ist mit nur 2 MB zu klein, um den Nachteil der längeren Latenzen aufzuwiegen.
Latenzen K8
Latenzen K10: ca. 40 CPU-Taktzyklen mehr Wartezeit beim Zugriff auf das RAM.
An dieser Stelle verweisen wir auf unseren Kuma-Artikel, wo wir uns über mehrere Seiten hinweg mit dem Für und Wider L3-Cache befassen.
Zusammenfassend hatte AMD beim K10 eine ganze Reihe von Punkten, die es zu verbessern galt:
- hoher Stromverbrauch
- schlechte Skalierbarkeit in Sachen Taktfrequenz
- zu geringes Leistungsplus (pro Kern) gegenüber dem K8