AMD Phenom II X4 Deneb — 45 nm für den Desktop

Artikel-Index:

Die Schwächen des 65 nm K10

Die Stra­te­gie der ste­ti­gen Evo­lu­ti­on hät­te auch auf­ge­hen kön­nen. In der Pra­xis erreicht ein K10 je nach Soft­ware pro Takt pro Kern tat­säch­lich eine 10–15 Pro­zent bes­se­re Leis­tung, als ein K8. Man spricht hier von einem höhe­ren IPC (bzw. sel­te­ner von einem nied­ri­ge­ren CPI). Pi-mal-Dau­men ist ein K10-Kern dank sei­ner Detail-Opti­mie­run­gen bei 2,3 GHz unge­fähr so schnell, wie ein K8-Kern bei 2,6 GHz. Zudem kann der K10 vier Ker­ne in die Waag­scha­le wer­fen, wäh­rend der K8 mit zwei­en aus­kom­men muss, was mul­ti­th­rea­ded Anwen­dun­gen zusätz­lich beschleu­nigt. Aller­dings kommt ein höhe­rer IPC nur dann in Form einer höhe­ren Leis­tung beim User an, wenn der Her­stel­ler nicht gleich­zei­tig die Takt­fre­quenz mas­siv sen­ken muss. Gegen­über den 3,2 GHz des schnells­ten K8 konn­te der K10 anfangs aber nur 2,3 GHz dage­gen set­zen. Da hilft auch ein 15 Pro­zent höhe­rer IPC nichts, wenn ande­rer­seits die Takt­fre­quenz um 30 Pro­zent redu­ziert wird. Ob die schlech­te Takt­bar­keit nur am zwei­fel­haf­ten 65 nm Ver­fah­ren von AMD lag oder auch zusätz­li­che Ursa­chen im Design (Speed-Pathes, Signal­über­spre­chun­gen, etc.) hat­te, kön­nen wir an die­ser Stel­le natür­lich nicht beantworten.

Zudem konn­te sich der viel gerühm­te L3-Cache nicht durch­ge­hend bewäh­ren. Zwar ist mehr Cache grund­sätz­lich posi­tiv zu bewer­ten, da die Wahr­schein­lich­keit sinkt Daten aus dem quä­lend lang­sa­men RAM holen zu müs­sen. Als zusätz­li­che Cache­stu­fe imple­men­tiert erhöht er jedoch auch die Latenz, da nun auch noch in einer drit­ten Cache­stu­fe nach­ge­se­hen wer­den muss ehe ein Cache-Miss fest­steht. In die­sem Fall sind beim K10 bereits mehr Takt­zy­klen als beim K8 ver­stri­chen, bevor die Daten dann letzt­end­lich doch aus dem RAM ange­for­dert wer­den müs­sen. Der Vor­teil der nied­ri­gen Latenz­zei­ten, die der K8 durch die Inte­gra­ti­on des Memo­ry-Con­trol­lers in die CPU geschenkt bekam, war beim K10 zum Teil wie­der dahin. Man könn­te sagen: der Level 3 Cache des K10 ist mit nur 2 MB zu klein, um den Nach­teil der län­ge­ren Laten­zen aufzuwiegen.


Laten­zen K8


Laten­zen K10: ca. 40 CPU-Takt­zy­klen mehr War­te­zeit beim Zugriff auf das RAM.

An die­ser Stel­le ver­wei­sen wir auf unse­ren Kuma-Arti­kel, wo wir uns über meh­re­re Sei­ten hin­weg mit dem Für und Wider L3-Cache befassen.

Zusam­men­fas­send hat­te AMD beim K10 eine gan­ze Rei­he von Punk­ten, die es zu ver­bes­sern galt:

  • hoher Strom­ver­brauch
  • schlech­te Ska­lier­bar­keit in Sachen Taktfrequenz
  • zu gerin­ges Leis­tungs­plus (pro Kern) gegen­über dem K8