AMD Piledriver vs. Steamroller vs. Excavator — Leistungsvergleich der Architekturen
Als AMD im Jahr 2011 eine neue Prozessorarchitektur auf den Markt brachte, war die Spannung groß. Bis dahin hatte noch immer die 4 Jahre zuvor eingeführte K10-Architektur die Kastanien aus dem Feuer holen müssen. Doch Intels Tick-Tock-Dauerfeuer ausgesetzt, war AMD immer weiter zurück gefallen. Die total ausgelutschte K10-Architektur, die evolutionär über den K8 von 2003 bis zum K7 von 1999 zurückreicht, benötigte einen adäquaten Nachfolger; ach was, es brauchte eine Revolution, den ersten neuen AMD-Prozessor seit 1999, der nicht auf irgendeiner Vorgänger-Generation aufbaut, und ähnlich wie damals der erste Athlon K7 hätte die martialisch Bulldozer genannte Architektur auch einschlagen sollen.
Es wäre wenig sinnvoll, an dieser Stelle Spannung aufzubauen, schließlich wissen wir alle, wie das Spiel ausgegangen ist. AMDs Corporate Vice President und General Manager of the Server Business Unit, Andrew Feldman, verstieg sich vor 2 Jahren gar zu der Äußerung, Bulldozer sei ein vollkommener Fehlschlag gewesen, ohne allerdings zu konkretisieren, ob er das technisch oder wirtschaftlich meinte. Dabei war das Konzept auf dem Papier vielversprechend. Die Modulbauweise, mit der sich CMT realisieren ließ (statt “nur” SMT, wie Intel es praktiziert), dazu eine dicke FP-Einheit, die aus dem ehemaligen AMD-exklusiven SSE5-Projekt mit FMA4 hervorging, ein auf “Hochdrehzahl” ausgelegtes Design, Turbo-Core, viele SIMD-Funktionen und ein schneller Memory-Controller mit Support für DDR3-1866 im Dual-Channel – was konnte da noch schiefgehen?
Viel, wie wir schon beim ersten Review Ende 2011 erfahren mussten. Bei gängiger Wald-und-Wiesen-Software war Bulldozer sogar langsamer als sein direkter Vorgänger K10, pro Takt sowieso, aber auch absolut, was erstaunlich war, immerhin warf das Bulldozer-Topmodell mehr Threads und einen höheren Takt in die Waagschale. Ausnahme war lediglich Software, die integerlastig mit 8 Threads hantieren, die neuen SIMD-Features oder die eigenwillige FMAC-FPU nutzen konnte. Ansonsten war der Bulldozer eine herbe Enttäuschung, wie man auch aus den damaligen Artikeln und News herauslesen kann.
Irgendetwas stimmte nicht mit AMDs neuester Kreation und schon kurz nach dem Launch überschlugen sich die Kommentatoren mit Diagnosen. Das gemeinsame Frontend müsse es sein, die kleinen, teils shared L1-Caches, der langsame L2-/L3-Cache und so weiter. Einige hatten auch die Hoffnung, der erste Bulldozer sei noch nicht fertig entwickelt gewesen und hätte daher “versteckte” Features, die aus irgendwelchen Gründen noch nicht aktiviert worden waren. Dem war tatsächlich so, wie wir ein Jahr später mit dem Launch des Vishera erfahren durften, der nichts anderes war als ein fehlerbereinigter Zambezi. Hier die Werte eines Kurztests aus dem Forum zu jener Zeit:
AMD FX-6300 “Vishera” vs. FX-6100 “Zambezi” (2012)
Bereits früh veröffentlichte AMD eine Roadmap, wie es mit der glücklos eingeführten Bulldozer-Familie weitergehen sollte. Nach der ursprünglichen Bulldozer-Architektur sollte Piledriver folgen, welcher die gröbsten Einschränkungen beseitigen und die Leistung verbessern sollte. Anschließend stand Steamroller auf dem Plan und zuletzt Excavator als maximale Ausbaustufe der Bulldozer-Architektur.
Diesen Excavator halten wir heute in den Händen, allerdings anders als damals gedacht, denn seit jenen Tagen hat AMD mehrere Management- und Strategiewechsel hinter sich gebracht. Daher ist es heute schwierig, die einzelnen Bulldozer-Ausbaustufen miteinander zu vergleichen. So ist der Ur-Bulldozer ausschließlich als dicke Desktop-CPU Zambezi erschienen. Vom Nachfolger Piledriver dagegen gab es die Desktop-CPUs mit Namen Vishera (AM3+-Plattform mit L3-Cache, bis zu 8 Kerne) aber auch die APUs für Desktop und Notebook namens Trinity (ohne L3-Cache, bis zu 4 Kerne). Steamroller dagegen kam nur als APU Kaveri auf den Markt, allerdings immer noch für Desktop (FM2+) und Notebook. Die letzte Ausbaustufe der Architektur namens Excavator jedoch ist (bislang) ausschließlich als APU Carrizo für Laptops erschienen und ist zudem noch ein SoC, trägt also alles, was man früher Chipsatz nannte, im Prozessor.
Wenn man nun erfahren will, ob AMD mit der Weiterentwicklung der Bulldozer-Architektur gute Arbeit geleistet hat – wie will man das herausfinden? CPUs gegen APUs, klassische Architekturen gegen SoCs, L3-Cache ja/nein, TDP-Klassen von 12 W bis 220 W – ein Ding der Unmöglichkeit?