Planet 3DNow! Logo  

  Fantastic Zero Logo
English Français Русский язык Español Italiano Japanese Chinese

FORUM AKTUELL

   

Donnerstag, 21. Juni 2012

09:22 - Autor: Nero24

Aus dem Forum: AMD Piledriver-Kern zeigt sich stark verbessert

AMD-LogoAls AMD im Herbst letzten Jahres endlich seine nagelneue Bulldozer-Architektur vorstellte, war die Enttäuschung groß. Das neue Konzept klang zwar auf dem Papier vielversprechend, in der Praxis jedoch mussten die FX-Prozessoren ordentlich Federn lassen. Zwar ließ sich die neue Architektur ganz gut takten, was eine Vorgabe bei der Entwicklung war, jedoch ging dies zu Lasten der IPC (Instruction per Clockcycle); der Bulldozer erledigte pro Kern pro Takt also weniger Arbeit, als sein Vorgänger K10. Das wurde auch bei unserem ausführlichen AMD FX-Review und vor allem der Analyse und dem Nachtest deutlich.

In der Folge wurde viel spekuliert und analysiert, woran es denn liegen könnte, dass eine frische, auf einem weißen Blatt Papier konzipierte neue Architektur der fast 12 Jahre alten K7/K8/K9/K10 Evolutionsreihe nicht ordentlich um die Ohren fährt. Dazu existiert im Forum ein Spekulationsthreads namens Fehler, Bugs, mangelnde Performance - Woran liegt es? mit mittlerweile 28 Seiten, wo die Architektur auseinander genommen wurde.

Anfang des Jahres erschien ein Patch für den Windows 7 Scheduler, nachdem deutlich war, dass Windows 7 mit der Modul-Bauweise des Bulldozers nicht so recht klarkommt und Threads/Prozesse auf die "falschen" Kerne verteilt. Auch dazu hatten wir einen Artikel, der zeigt, dass die Performance damit minimal besser wird; aber nicht die Welt.

Als der AMD FX auf den Markt kam, war bereits klar, dass eine Version 2 des Bulldozer-Kerns namens Piledriver, der für 2012 geplant war, vieles besser können soll, als die Urversion. Zwar bleibt die Architektur im wesentlich gleich, jedoch soll an vielen Schwachpunkten gefeilt werden. Der Piledriver für den Desktop wird noch vermutlich bis Spätsommer/Herbst auf sich warten lassen, jedoch kann sich der geneigte Leser einen ersten Eindruck verschaffen, denn die Piledriver-Kerne stecken in den neuen Trinity-APUs, die gerade Einzug erhalten in Laptops.

Allerdings ist es schwierig, daraus Schlussfolgerungen zu ziehen. Vom Ur-Bulldozer gab es keine mobilen Versionen und vom Piledriver gibt es derzeit nur APU-Versionen, denen z.B. der L3-Cache fehlt. Zudem hat der schnellste Trinity nur zwei Module (4 INT-Kerne), wohingegen Bulldozer mit zwei, drei und vier Modulen (4, 6, 8 INT-Kerne) auf dem Markt ist. Zudem sollen die Piledriver-FX-Prozessoren für den Desktop neben L3-Cache auch noch höher getaktet sein. Kurzum: ein 1:1 Vergleich fällt zum aktuellen Zeitpunkt schwer.

Was man jedoch sehr wohl machen kann ist, die Versprechungen, die AMD bezüglich der Detailoptimierungen gegeben hat, in der Praxis zu überprüfen. Das tun unsere emsigen Community-Mitglieder derzeit in einem Forenthread namens Trinity nimmt Fahrt auf. Dort werden z.B. die Cache-Latenzen geprüft und diverse maschinennahe Codes auf deren Ausführungsgeschwindigkeit hin überprüft. Möglich ist das, da User "Herr Melin" bereits über ein Trinity-Notebook verfügt. Und was dort getestet wird, klingt nicht schlecht für künftige Piledriver Desktop-Prozessoren.

Zum einen scheinen die Cache-Latenzen verkürzt worden zu sein.

AMD FX-6100 (Zambezi; 3 Bulldozer-Module)


AMD A10-4600M (Trinity; 2 Piledriver-Module)


Wie man sieht liegen die L2-Latenzen mit 16 vs. 20 Zyklen bei "Pseudo-Random" deutlich niedriger. Ebenfalls besser liegen die Random-Werte, die gerade eben so noch in den 2 MB großen L2-Cache passen. Hier liegen im schlechtesten Fall 31 Zyklen an, während Bulldozer bei 39 liegt. Anschließend wird es schwierig, da Bulldozer noch über eine dritte Cachestufe verfügt, während Trinity nach dem L2 direkt auf den Speicher zugreifen muss.

Auch ein Instruction Latency Dump mit AIDA zeigt durchaus Verbesserungen, wie Dresdenboy herausgefunden hat:
Was da im Vergleich der Latenzen u. Durchsatzzahlen mit BDv1 schon auffällt:
mov r32,r32 -> Durchsatz von 2 auf 4
mov r64,r64 -> von 2 auf 3
IDIV/DIV -> Latenzen deutlich runter, z.B. 96/63b: 80->44 Takte, 63/63b: 80->14 Takte
Einige SSE2/AVX-Lade/Speicher-Ops: teils Durchsatz +100%, teils halbiert.
Die niedrigeren Latenzen bei IDIV sind der endlich funktionierenden IDIV-Einheit geschuldet. Das sind nur ein paar wenige Aspekte, die derzeit bei uns im Forum von Usern analysiert und diskutiert werden. In jedem Fall lohnt es sich für interessierte Technikfans, das Prozessor-Forum samt Spekulations-Ecke im Auge zu behalten bzw. sich zu beteiligen. Sobald AMD Desktop-Prozessoren herausrückt, gibt's natürlich wie gewohnt auf Planet 3DNow! wieder einen ausführlichen Test. Spätestens dann wird klar werden, ob Piledriver das geworden ist, was Bulldozer bereits hätte werden sollen...

Links zum Thema:» Kommentare
Planet 3DNow! RSS XML Newsfeed Planet 3DNow! Newsfeed bei iGoogle-Seite hinzufügen Planet 3DNow! Newsfeed bei My Yahoo! hinzufügen Planet 3DNow! Newsfeed bei Microsoft Live hinzufügen Planet 3DNow! Newsfeed bei My AOL hinzufügen

Weitere News:
Neue Startseite - bitte Lesezeichen anpassen
Intern: Planet 3DNow! ab 18:00 Uhr eingeschränkt erreichbar
Never Settle Forever: AMD überlässt Zusammenstellung der Spielebündel seinen Kunden
Microsoft Patchday August 2013
Der Partner-Webwatch von Planet 3DNow! (13.08.2013)
Kühler- und Gehäuse-Webwatch (11.08.2013)
Ankündigung Microsoft Patchday August 2013
Vorerst kein Frame Pacing für AMD-Systeme mit Dual Graphics
Intern: kommende Woche eingeschränkte Erreichbarkeit auf Planet 3DNow!
Kaveri verschoben und keine neuen FX-Prozessoren von AMD [3. Update]
AMD plant Vorstellung neuer High-End-Grafikkarte Hawaii im September
Kaveri verschoben und keine neuen FX-Prozessoren von AMD [Update]
Der Partner-Webwatch von Planet 3DNow! (06.08.2013)
Kaveri verschoben und keine neuen FX-Prozessoren von AMD
AMD startet neue "Never-Settle-Forever"-Spielebündel für Radeon Grafikkarten
Neuer Artikel: SilverStone Fortress FT04 - Die Hardware steht Kopf

 

Nach oben

 

Copyright © 1999 - 2013 Planet 3DNow!
Datenschutzerklärung