AMD Phenom II X4 Deneb — 45 nm für den Desktop
Der Deneb im Detail — Rückblende K7
Ein Blick zurück
Wenn wir heute über die Technik des AMD Phenom II “Deneb” philosophieren, kommen wir nicht umhin auch seine direkten Vorgänger wenigstens kurz zu streifen, um zu verstehen wieso der Deneb so konzipiert ist und nicht anders.
AMD K7
Die Konzeption, die Intention hinter der Architektur des Phenom II, ist nicht neu. Deneb ist kein Prozessor, der auf dem weißen Blatt Papier entstanden ist. Nicht deswegen, weil der neue 45 nm Prozessor-Kern im Prinzip bereits vor einigen Wochen in Form des Server-Prozessors Shanghai eingeführt wurde. Nein, der Deneb hat seine Wurzeln im K7, der bereits 1999 das Licht der Welt erblickte. Damals hat AMD seine letzte wirklich auf keinem Vorgänger basierende, nagelneue Kern-Architektur präsentiert. Entsprechend erfolgreich war der unter dem Label ‘Athlon’ firmierende Prozessor. Nicht nur, dass er den damals Markt führenden Intel Pentium III Prozessor in Sachen Leistung überflügeln konnte, AMD gelang es mit der ersten Ausbaustufe des K7 auch das prestigeträchtige Gigahertz-Rennen für sich zu entscheiden, das damals auch weit über die IT-Presse hinaus für großes Aufsehen sorgte.
AMD hatte die Jahre zuvor mit dem K5 und dem K6 viel Lehrgeld bezahlen müssen. Zwar konnten diese CPUs in bestimmten Teilbereichen sehr gute bis hervorragende Leistung erzielen, allerdings waren ihre Talente zu einseitig. Das extreme Low-Latency Layout zusammen mit den aufwändigen Branch-Predictors war kompromisslos auf hohe Leistung pro Takt und kurze Durchlaufzeiten durch die Pipelines ausgelegt. Die Folge war, dass AMD erhebliche Schwierigkeiten hatte den K6 und noch mehr den K5 auf eine konkurrenzfähige Taktfrequenz zu bekommen. Zudem hatte AMD bzw. NexGen, die für den K6 verantwortlich zeichneten, das Thema Fließkomma-Leistung vernachlässigt, was aus damaliger Sicht verständlich war, sich im Rückblick jedoch als Boomarang entpuppte. Bis Mitte der 90er Jahre spielten mathematische Co-Prozessoren im Endkunden-Markt noch kaum eine Rolle. Bis zum 386er war der Co-Prozessor nicht einmal zwingend Bestandteil der CPU, sondern wurde bei Bedarf als zusätzlicher Chip in einen zweiten CPU-Sockel gesteckt. Fließkomma-Leistung wurde (für Endkunden) erst wichtig, als die ersten 3D-Spiele aufkamen — und das fällt genau in die Zeit, in der K5 und K6 auf den Markt kamen. Entsprechend schlecht schnitten diese Prozessoren auf diesem Gebiet ab. Daran änderte auch die später nachgeschobene 3DNow! SIMD-Einheit für den K6‑2 nichts, da kaum ein Spiele-Entwickler diese zusätzlichen Befehle nutzte.
Die jahrelange Unterlegenheit der K5 und K6 Prozessoren auf dem immer wichtiger werdenden Spiele-Markt scheint damals ihre Spuren hinterlassen zu haben, denn bei der Entwicklung des Nachfolgers namens K7 galt für die AMD-Entwickler ganz offenbar “klotzen, nicht kleckern”. Während der K6 nur eine non-pipelined FPU besaß, durfte der K7 auf nicht weniger als drei Fließkomma-Pipelines zurückgreifen. Unter anderem aus diesem Grund wurde der Athlon in den Jahren 1999 und 2000 der Liebling der Gamer — ein Ruf, der in Stammtischgesprächen noch heute nachhallt wenn mal wieder die ewige Frage AMD oder Intel debattiert wird.
Auch sonst blieb bei der Entwicklung des K7 kein Stein auf dem anderen. Das Three-Issue Design mit einem 3‑fach Dekoder, doppelt so langen ALU-Pipelines wie beim K6 und riesigen Level 1 Caches von je 64 KB für Code und Daten sorgte für ordentlich Durchsatz. Zudem fußte der K7 nicht mehr auf einer abgelegten, veralterten Infrastruktur von Intel, sondern auf einer brandneuen Plattform (zuerst Slot A, später Sockel A) mit DDR-Frontside-Bus und viel Entwicklungspotenzial. Neben dem Sockel 7 hat bisher keine x86-Infrastruktur länger überlebt als der Sockel A.