News Aus dem Forum: AMD Piledriver-Kern zeigt sich stark verbessert

Nero24

Administrator
Teammitglied
Mitglied seit
01.07.2000
Beiträge
24.066
Renomée
10.445
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2021
<img src="http://www.planet3dnow.de/photoplog/images/54308/1_AMD-Logo.png" border="0" alt="AMD-Logo" class="newsfloatleft">Als AMD im Herbst letzten Jahres endlich seine nagelneue Bulldozer-Architektur vorstellte, war die Enttäuschung groß. Das neue Konzept klang zwar auf dem Papier vielversprechend, in der Praxis jedoch mussten die FX-Prozessoren ordentlich Federn lassen. Zwar ließ sich die neue Architektur ganz gut takten, was eine Vorgabe bei der Entwicklung war, jedoch ging dies zu Lasten der IPC (Instruction per Clockcycle); der Bulldozer erledigte pro Kern pro Takt also weniger Arbeit, als sein Vorgänger K10. Das wurde auch bei unserem ausführlichen <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=399114">AMD FX-Review</a> und vor allem der <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=399118">Analyse</a> und dem <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=401023">Nachtest</a> deutlich.

In der Folge wurde viel spekuliert und analysiert, woran es denn liegen könnte, dass eine frische, auf einem weißen Blatt Papier konzipierte neue Architektur der fast 12 Jahre alten K7/K8/K9/K10 Evolutionsreihe nicht ordentlich um die Ohren fährt. Dazu existiert im Forum ein Spekulationsthreads namens <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=399188">Fehler, Bugs, mangelnde Performance - Woran liegt es?</a> mit mittlerweile 28 Seiten, wo die Architektur auseinander genommen wurde.

Anfang des Jahres erschien ein <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1326327456">Patch für den Windows 7 Scheduler</a>, nachdem deutlich war, dass Windows 7 mit der Modul-Bauweise des Bulldozers nicht so recht klarkommt und Threads/Prozesse auf die "falschen" Kerne verteilt. Auch dazu hatten wir einen <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=404011">Artikel</a>, der zeigt, dass die Performance damit minimal besser wird; aber nicht die Welt.

Als der AMD FX auf den Markt kam, war bereits klar, dass eine Version 2 des Bulldozer-Kerns namens Piledriver, der für 2012 geplant war, vieles besser können soll, als die Urversion. Zwar bleibt die Architektur im wesentlich gleich, jedoch soll an vielen Schwachpunkten gefeilt werden. Der Piledriver für den Desktop wird noch vermutlich bis Spätsommer/Herbst auf sich warten lassen, jedoch kann sich der geneigte Leser einen ersten Eindruck verschaffen, denn die Piledriver-Kerne stecken in den neuen <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=405075">Trinity-APUs</a>, die gerade Einzug erhalten in Laptops.

Allerdings ist es schwierig, daraus Schlussfolgerungen zu ziehen. Vom Ur-Bulldozer gab es keine mobilen Versionen und vom Piledriver gibt es derzeit nur APU-Versionen, denen z.B. der L3-Cache fehlt. Zudem hat der schnellste Trinity nur zwei Module (4 INT-Kerne), wohingegen Bulldozer mit zwei, drei und vier Modulen (4, 6, 8 INT-Kerne) auf dem Markt ist. Zudem sollen die Piledriver-FX-Prozessoren für den Desktop neben L3-Cache auch noch höher getaktet sein. Kurzum: ein 1:1 Vergleich fällt zum aktuellen Zeitpunkt schwer.

Was man jedoch sehr wohl machen kann ist, die Versprechungen, die AMD bezüglich der Detailoptimierungen gegeben hat, in der Praxis zu überprüfen. Das tun unsere emsigen Community-Mitglieder derzeit in einem Forenthread namens <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=404165">Trinity nimmt Fahrt auf</a>. Dort werden z.B. die Cache-Latenzen geprüft und diverse maschinennahe Codes auf deren Ausführungsgeschwindigkeit hin überprüft. Möglich ist das, da User "Herr Melin" bereits über ein Trinity-Notebook verfügt. Und was dort <a href="http://www.planet3dnow.de/vbulletin/showthread.php?p=4629725#post4629725">getestet wird</a>, klingt nicht schlecht für künftige Piledriver Desktop-Prozessoren.

Zum einen scheinen die Cache-Latenzen verkürzt worden zu sein.

AMD FX-6100 (Zambezi; 3 Bulldozer-Module)
<center><img src="http://h9.abload.de/img/sauberayne.png"></center>

AMD A10-4600M (Trinity; 2 Piledriver-Module)
<center><img src="http://www.pimpyourbet.com/Planet3dnow/trinity.PNG"></center>

Wie man sieht liegen die L2-Latenzen mit 16 vs. 20 Zyklen bei "Pseudo-Random" deutlich niedriger. Ebenfalls besser liegen die Random-Werte, die gerade eben so noch in den 2 MB großen L2-Cache passen. Hier liegen im schlechtesten Fall 31 Zyklen an, während Bulldozer bei 39 liegt. Anschließend wird es schwierig, da Bulldozer noch über eine dritte Cachestufe verfügt, während Trinity nach dem L2 direkt auf den Speicher zugreifen muss.

Auch ein Instruction Latency Dump mit AIDA zeigt durchaus Verbesserungen, wie Dresdenboy <a href="http://www.planet3dnow.de/vbulletin/showthread.php?p=4629919#post4629919">herausgefunden</a> hat:<blockquote><i>Was da im Vergleich der Latenzen u. Durchsatzzahlen mit BDv1 schon auffällt:
mov r32,r32 -> Durchsatz von 2 auf 4
mov r64,r64 -> von 2 auf 3
IDIV/DIV -> Latenzen deutlich runter, z.B. 96/63b: 80->44 Takte, 63/63b: 80->14 Takte
Einige SSE2/AVX-Lade/Speicher-Ops: teils Durchsatz +100%, teils halbiert. </i></blockquote>Die niedrigeren Latenzen bei IDIV sind der <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1334532731">endlich funktionierenden IDIV-Einheit</a> geschuldet. Das sind nur ein paar wenige Aspekte, die derzeit bei uns im Forum von Usern analysiert und diskutiert werden. In jedem Fall lohnt es sich für interessierte Technikfans, das <a href="http://www.planet3dnow.de/vbulletin/forumdisplay.php?f=2">Prozessor-Forum</a> samt <a href="http://www.planet3dnow.de/vbulletin/forumdisplay.php?f=110">Spekulations-Ecke</a> im Auge zu behalten bzw. sich zu beteiligen. Sobald AMD Desktop-Prozessoren herausrückt, gibt's natürlich wie gewohnt auf Planet 3DNow! wieder einen ausführlichen Test. Spätestens dann wird klar werden, ob Piledriver das geworden ist, was Bulldozer bereits hätte werden sollen...

<b>Links zum Thema:</b><ul><li><a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=399114">AMD FX Review</a></li><li><a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=399118">AMD FX Analyse</a></li><li><a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=401023">AMD FX Nachtest</a></li><li><a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=404011">AMD FX Scheduler-Patch Test</a></li><li><a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=405075">Trinity - die zweite APU-Generation</a></li><li><a href="http://www.planet3dnow.de/vbulletin/forumdisplay.php?f=110">CPU-Spekulationsforum [P3D Forum]</a></li></ul>
 
Danke für die Zusammenfassung des Threads, für mich als nicht technischen Freak sehr lesenswert! Danke auch an alle Mitglieder in diesen Threads, die sich die Mühe machen!
 
dito. Da schließe ich mich gern an! :)
 
Zudem sollen die Piledriver-Prozessoren für den Desktop neben L3-Cache auch noch höher getaktet sein.
Womöglich später auf dem Sockel AM3+. Auf dem Sockel FM2 sind der A8-5500 bis A10-5800K ohne L3 Cache angekündigt.
 
Womöglich später auf dem Sockel AM3+. Auf dem Sockel FM2 sind der A8-5500 bis A10-5800K ohne L3 Cache angekündigt.
Ja klar, mit Desktop war der FX-Piledriver für den Sockel AM3+ gemeint. Irgendwie sträubt sich's bei mir noch, Llano und Trinity zum Desktop zu zählen. Muss da vermutlich endlich mal umdenken... ;)
 
Kannst Dir ja den BigTower einfach auf die Knie stellen, dann ist es per definitionem ein Laptop :P
 
Schön zu sehen das der Bulldozer verbessert wurde!

Gedämpft wird der Optimismus jedoch gleich, wenn man die Leistung der Piledriver Kerne mit den alten K10 Kernen vergleicht. Da wird sofort klar das der Leistungssprung doch eher klein ist. Ich besitze zwar ein AM3+ Board, darauf werkelt aber noch ein guter alter X4. Sofern es keine deutlichen Verbesserungen im 2 stelligen Bereich gibt, werde iich wohl Weihnachten auf deb blauen Zug aufspringen...
 
zusätzlich hat der AM3+ Piledriver (Vishera) ja auch 4 Module, also 8 Threads.
Ist natürlich jetzt von der Anwendung abhängig, ob die daraus einen Nutzen ziehen kann,
aber wenn sie alle Kerne auslastet, läuft der Vishera jedem K10.5 PhenomII x4 leicht 50% davon, aber das tat ein PhenomII x6 ja auch schon.
 
@ Hitsche
Ja, wenn alle Kerne ausgelastet werden! Das ist aber mit zunehmender Kernzahl immer seltener der Fall! 8 Kerne werden auch in Zukunft seltener ausgelastet sein als 4. Wenn dann noch die Leistung der einzelnen Kerne bei dem Quadcore höher ist, dann wird es halt eng. Ich kaufe mir sicher keinen neuen Proz um im alltäglichen Gebrauch 10% Mehrleistung zu haben, wenn das denn überhaupt der Fall wäre.

Eine Fußheizung brauche ich in meinem zarten Alter auch noch nicht, deshalb bleibt extrem OC (wenn überhaupt) auch ausgeschlossen.
So wie es derzeit aussieht ist ein Wechsel in das blaue Lager die sinnvollste Überlegung. Traurig aber wahr!
 
Zurück
Oben Unten