Als AMD im Herbst letzten Jahres endlich seine nagelneue Bulldozer-Architektur vorstellte, war die Enttäuschung groß. Das neue Konzept klang zwar auf dem Papier vielversprechend, in der Praxis jedoch mussten die FX-Prozessoren ordentlich Federn lassen. Zwar ließ sich die neue Architektur ganz gut takten, was eine Vorgabe bei der Entwicklung war, jedoch ging dies zu Lasten der IPC (Instruction per Clockcycle); der Bulldozer erledigte pro Kern pro Takt also weniger Arbeit, als sein Vorgänger K10. Das wurde auch bei unserem ausführlichen AMD FX-Review und vor allem der Analyse und dem Nachtest deutlich.
In der Folge wurde viel spekuliert und analysiert, woran es denn liegen könnte, dass eine frische, auf einem weißen Blatt Papier konzipierte neue Architektur der fast 12 Jahre alten K7/K8/K9/K10 Evolutionsreihe nicht ordentlich um die Ohren fährt. Dazu existiert im Forum ein Spekulationsthreads namens Fehler, Bugs, mangelnde Performance - Woran liegt es? mit mittlerweile 28 Seiten, wo die Architektur auseinander genommen wurde.
Anfang des Jahres erschien ein Patch für den Windows 7 Scheduler, nachdem deutlich war, dass Windows 7 mit der Modul-Bauweise des Bulldozers nicht so recht klarkommt und Threads/Prozesse auf die "falschen" Kerne verteilt. Auch dazu hatten wir einen Artikel, der zeigt, dass die Performance damit minimal besser wird; aber nicht die Welt.
Als der AMD FX auf den Markt kam, war bereits klar, dass eine Version 2 des Bulldozer-Kerns namens Piledriver, der für 2012 geplant war, vieles besser können soll, als die Urversion. Zwar bleibt die Architektur im wesentlich gleich, jedoch soll an vielen Schwachpunkten gefeilt werden. Der Piledriver für den Desktop wird noch vermutlich bis Spätsommer/Herbst auf sich warten lassen, jedoch kann sich der geneigte Leser einen ersten Eindruck verschaffen, denn die Piledriver-Kerne stecken in den neuen Trinity-APUs, die gerade Einzug erhalten in Laptops.
Allerdings ist es schwierig, daraus Schlussfolgerungen zu ziehen. Vom Ur-Bulldozer gab es keine mobilen Versionen und vom Piledriver gibt es derzeit nur APU-Versionen, denen z.B. der L3-Cache fehlt. Zudem hat der schnellste Trinity nur zwei Module (4 INT-Kerne), wohingegen Bulldozer mit zwei, drei und vier Modulen (4, 6, 8 INT-Kerne) auf dem Markt ist. Zudem sollen die Piledriver-FX-Prozessoren für den Desktop neben L3-Cache auch noch höher getaktet sein. Kurzum: ein 1:1 Vergleich fällt zum aktuellen Zeitpunkt schwer.
Was man jedoch sehr wohl machen kann ist, die Versprechungen, die AMD bezüglich der Detailoptimierungen gegeben hat, in der Praxis zu überprüfen. Das tun unsere emsigen Community-Mitglieder derzeit in einem Forenthread namens Trinity nimmt Fahrt auf. Dort werden z.B. die Cache-Latenzen geprüft und diverse maschinennahe Codes auf deren Ausführungsgeschwindigkeit hin überprüft. Möglich ist das, da User "Herr Melin" bereits über ein Trinity-Notebook verfügt. Und was dort getestet wird, klingt nicht schlecht für künftige Piledriver Desktop-Prozessoren.
Zum einen scheinen die Cache-Latenzen verkürzt worden zu sein.
AMD FX-6100 (Zambezi; 3 Bulldozer-Module)
AMD A10-4600M (Trinity; 2 Piledriver-Module)
Wie man sieht liegen die L2-Latenzen mit 16 vs. 20 Zyklen bei "Pseudo-Random" deutlich niedriger. Ebenfalls besser liegen die Random-Werte, die gerade eben so noch in den 2 MB großen L2-Cache passen. Hier liegen im schlechtesten Fall 31 Zyklen an, während Bulldozer bei 39 liegt. Anschließend wird es schwierig, da Bulldozer noch über eine dritte Cachestufe verfügt, während Trinity nach dem L2 direkt auf den Speicher zugreifen muss.
Auch ein Instruction Latency Dump mit AIDA zeigt durchaus Verbesserungen, wie Dresdenboy herausgefunden hat:
Was da im Vergleich der Latenzen u. Durchsatzzahlen mit BDv1 schon auffällt: mov r32,r32 -> Durchsatz von 2 auf 4 mov r64,r64 -> von 2 auf 3 IDIV/DIV -> Latenzen deutlich runter, z.B. 96/63b: 80->44 Takte, 63/63b: 80->14 Takte Einige SSE2/AVX-Lade/Speicher-Ops: teils Durchsatz +100%, teils halbiert.
Die niedrigeren Latenzen bei IDIV sind der endlich funktionierenden IDIV-Einheit geschuldet. Das sind nur ein paar wenige Aspekte, die derzeit bei uns im Forum von Usern analysiert und diskutiert werden. In jedem Fall lohnt es sich für interessierte Technikfans, das Prozessor-Forum samt Spekulations-Ecke im Auge zu behalten bzw. sich zu beteiligen. Sobald AMD Desktop-Prozessoren herausrückt, gibt's natürlich wie gewohnt auf Planet 3DNow! wieder einen ausführlichen Test. Spätestens dann wird klar werden, ob Piledriver das geworden ist, was Bulldozer bereits hätte werden sollen...
Diesen Artikel bookmarken oder senden an ...
