AMD Phenom II X6 "Thuban"

MusicIsMyLife

Redaktion
☆☆☆☆☆☆
Mitglied seit
22.02.2002
Beiträge
15.579
Renomée
2.567
Standort
in der Nähe von Cottbus
  • QMC Race
  • BOINC Pentathlon 2017
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2019
  • SETI@Home Wow!-Event 2019
  • BOINC Pentathlon 2020
<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9440&w=o" alt="AMD Phenom II X6 Thuban - Titelbild" border="1"></center>

Gleich zwei neue Produkte aus dem Hause AMD haben heute ihre Weltpremiere. Zum Einen wird am heutigen Tag AMDs neuer High End-Chipsatz 890FX vorgestellt, welcher Enthusiasten-Mainboards beflügeln soll. Doch damit nicht genug. Denn zeitgleich stellt AMD eine neue Prozessor-Generation vor, die zusammen mit dem neuen Chipsatz eine neue Performance-Plattform hervorbringt.

Gemeint ist der neue Prozessor mit Codename "Thuban", welcher sich vom derzeitigen Topmodell Phenom II X4 965 relativ deutlich abhebt. Bei gleichbleibender Thermal Design Power von 125 Watt bietet "Thuban" ganze sechs Rechenkerne - 50 Prozent mehr als beim Deneb. Hinzu kommt die dynamische Anpassung der Taktrate an die Prozessorauslastung in Form von Turbo CORE. Das alles schafft AMD bei gleichbleibender Fertigungsgröße in 45 nm - dem neuen E0-Stepping sei Dank. Denn dieses Stepping wird unter Verwendung eines <a href="http://ht4u.net/news/21950_einsatz_von_low-k-dielektrikum_ermoeglicht_hoehere_taktraten_beim_phenom_ii_x6/" target="_blank">Ultra-Low-K-Dielektrikums</a> hergestellt, was für eine verringerte Leistungssaufnahme sorgt. Oder im aktuellen Fall für eine gleichbleibende Leistungsaufnahme bei 50 Prozent höherer Kernanzahl.

Gepaart mit der bereits vom Deneb bekannten Abwärtskompatibilität auf Sockel AM2+ -Platinen hat AMD auf dem Papier ein heißes Eisen im Feuer. Der bisher unter der Hand gehandelte Preis von weniger als 300 Euro verspricht angesichts der technischen Daten also ein sehr gutes Preis-/Leistungsverhältnis.

Im heutigen Artikel wollen wir einen ersten Blick auf Thuban werfen und uns die Performance näher anschauen.
[break=Der Zahn der Zeit]
11 Tage sind eine lange Zeit - theoretisch. Ausreichend, um sich ausführlich mit der neuen Hardware zu beschäftigen. Ein Performancevergleich mit dem Vorgänger, die Betrachtung von C1E, den Stromsparmöglichkeiten und das OC-Potenzial standen bei uns ursprünglich auf dem Plan. 11 Tage deshalb, weil wir unser Thuban-Sample genau 11 Tage vor dem Launch bekamen. Doch der Teufel liegt bekanntlich im Detail.

Der für die Redaktion vorgesehene Sechskern-Prozessor kam natürlich dort an, wo wir ihn nicht gebrauchen konnten - nämlich beim Herausgeber von Planet 3DNow!, Nero24. Daher sollte es per Express weiter gehen zum Tester. Doch wer nur halbwegs interessiert den Nachrichten der letzten Tage gefolgt ist, der wird die Wörter "Vulkanausbruch", "Aschewolke" und "Flugverbot" öfter gehört haben. Nur damit lässt sich erklären, warum ein Expresspaket ganze vier Tage unterwegs war.

Zwar ahnten wir, dass wir rechtzeitig zum Thuban-Launch ein Testsample erhalten würde, bis zum Eintreffen bei Nero24 konnten wir über das entsprechende Launchdatum aber nur mutmaßen. Und so kam, was kommen musste: Dienstliche und private Termine des zuständigen Redakteurs verkürzten den Testzeitraum auf gerade einmal zwei Tage. Viel zu wenig, um fundierte Testergebnisse im Stile von Planet 3DNow! mit unzähligen Vergleichssystemen zu erarbeiten.

Aus diesem Grund beschränken wir uns heute auf einen reinen Performancevergleich zwischen Phenom II X4 im C3-Stepping und AMDs neuem Flaggschiff, dem Thuban. Weitere Aspekte, wie zum Beispiel das Potenzial zur Spannungsabsenkung, der Taktfreudigkeit sowie ein Blick auf die <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=375291">C1E-Problematik</a>, werden wir in einem weiteren Artikel beleuchten, der in einigen Tagen erscheinen wird.

Ferner kann natürlich jeder einen Blick über den Tellerrand wagen und die Werte mit den Prozessoren aus den <a href="http://www.planet3dnow.de/vbulletin/forumdisplay.php?f=164">letzten Artikeln</a> vergleichen. Nur haben die Werte offiziell nichts im aktuellen Artikel verloren, da sich die Teststation geändert hat.
[break=Turbo CORE]
Eine der interessantesten Neuerungen an AMDs Sechskern-Prozessor ist mit Sicherheit das Turbo CORE-Feature. Wenn diese Option aktiviert wird, takten bis zu drei Prozessorkerne je nach Lastzustand des Prozessors um bis zu 400 MHz hoch, während die verbleibenden Kerne heruntergetaktet werden. Gleichzeitig wird die Versorgungsspannung erhöht, was für den stabilen Betrieb benötigt wird. Insgesamt wird dadurch gewährleistet, dass der Phenom II X6 in keinem Lastzustand die TDP von 125 Watt überschreitet.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9496&w=o" alt="Foto des Prozessors AMD Phenom II X6 Thuban" border="1"></center>

Dieses Diagramm stammt aus einer AMD-Präsentation anlässlich des heutigen CPU- sowie Chipsatz-Launches. Es verdeutlicht die Wirkungsweise von Turbo CORE. Das Feature wird in Hardware ausgeführt. Das bedeutet, dass zwar die Aktivierung bzw. Deaktivierung im BIOS stattfindet, im Betriebssystem jedoch kein weiterer Treiber oder sogar eine Software notwendig ist. Jeder User kann also ohne großes Zutun in den Genuss zusätzlicher Performance kommen.

Doch auch, wenn Turbo CORE für zusätzliche Performance sorgen kann und auch wird, so abhängig ist dieses Feature vom Betriebssystem. Denn das Betriebssystem sorgt dafür, dass anstehende Arbeit entsprechend der vorhandenen Ressourcen und der Qualität der Software möglichst gleichmäßig auf alle Prozessorkerne aufgeteilt wird. Das führt dazu, dass Bearbeitungsthreads oft den Prozessorkern wechseln und somit de facto "herumgereicht" werden.

Die Quintessenz dieser Überlegung ist, dass Turbo CORE nur funktionieren kann, wenn die Belastung durch Berechnungsthreads nicht permanent auf andere Kerne verschoben wird. Je gleichmäßiger also die Kerne vom Scheduler des Betriebssystem ausgenutzt werden, desto seltener wird Turbo Core greifen. Wir haben unseren Benchmark-Parcours daher jeweils mit aktiviertem und mit deaktiverten Turbo-Feature durchgeführt. Im späteren Verlauf dieses Artikels werden wir sehen, ob wir mit unserer Überlegung recht behalten haben oder nicht.
[break=AMD Phenom II X6 Thuban im Detail]
Schauen wir uns als erstes unser Prozessor-Sample im Detail an.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9433&w=o" alt="Foto des Prozessors AMD Phenom II X6 Thuban" border="1"></center>

Hergestellt wurde die CPU in der 10. Kalenderwoche 2010. Und wir erhielten nicht irgendeinen Thuban-Prozessor - nein, es ist das derzeitige Flaggschiff, ein Phenom II X6 1090T.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9434&w=o" alt="Foto des Prozessors AMD Phenom II X6 Thuban" border="1"></center>

Die Unterseite des Prozessors hält keine Überraschungen bereit. Alle bisherigen AM3-Prozessoren bieten dieses Pin-Layout und sind somit kompatibel zum Sockel AM2/AM2+ (DDR2) und Sockel AM3 (DDR3). Auch Nutzer von älteren Platinen können - BIOS-Update vorausgesetzt - voll auf ihre Kosten kommen. Gemäß <a href="http://support.amd.com/de/Processor_TechDocs/31116.pdf" target="_blank">BIOS and Kernel Developer's Guide</a> muss dann aber auf Turbo CORE verzichtet werden.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9435&w=o" alt="CPU-Z CPU AMD Phenom II X6 Thuban" border="0"></center>

Die Standard-Taktrate des 1090T liegt bei 3,2 GHz und 1,3 Volt. Mit dem bereits angesprochenen Turbo CORE taktet die CPU auf bis zu 3,6 GHz hinauf und verwendet dafür 1,475 Volt. Hinzu kommt der freie Multiplikator, da es sich beim 1090T um einen Black Edition-Prozessor handelt.

Die Größe des L3-Caches bleibt gegenüber dem Deneb unverändert. Es stehen weiterhin 6 MByte shared L3-Cache zur Verfügung. Bei starker Auslastung bedeutet dass jedoch, dass rechnerisch nur noch 1 MByte je Kern zur Verfügung steht - im Gegensatz zu 1,5 MByte beim Deneb. Auch hier wird sich bei den Benchmarks zeigen, ob diese Einschränkung zu Engpässen führt.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9493&w=o" alt="CPU-Z CPU AMD Phenom II X6 Thuban" border="0"></center>

Im Idle-Betrieb und gleichzeitig aktiviertem Cool'n'Quiet fällt die Taktrate auf die bereits vom Deneb bekannten 800 MHz ab. Anders als beim Vorgänger bleibt die Betriebsspannung mit 1,225 Volt aber relativ hoch.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9436&w=o" alt="CPU-Z Cache AMD Phenom II X6 Thuban" border="0"></center>

An der Cache-Assoziativität hat sich gegenüber Deneb ebenfalls nichts geändert.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9438&w=o" alt="CPU-Z Speicher AMD Phenom II X6 Thuban DDR3" border="0"></center>

Auch Thuban unterstützt DDR3-1333 bzw. DDR2-1066. Bei unseren Tests kamen die hier angezeigten Einstellungen zum Einsatz.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9495&w=o" alt="P-States AMD Phenom II X6 Thuban" border="0"></center>

Bei einem Blick auf die P-States des Thuban hilft uns das HTML-Logfile von CPU-Z. Dies offenbart die fünf vorhandenen Taktstufen samt Spannungen.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9439&w=o" alt="CPU-Z Latency AMD Phenom II X6 Thuban" border="0"></center>

Der Blick auf die Cache-Latenzen mittels des CPU-Z Latency-Tools darf natürlich nicht fehlen. Zum Vergleich haben wir folgend das Ergebnis des gleichen Tests beim Phenom II X4 965 Black Edition im C3-Stepping.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=7915&w=o" alt="CPU-Z Latency AMD Phenom II X4 Deneb" border="0"></center>
[break=Das Testsystem im Überblick]
<b>Hardware</b>
<ul><li><b>Prozessoren:</b><ul><li>AMD Phenom II X4 965 BE C3</li><li>AMD Phenom II X6 Thuban 1090T</li></ul><li><b>Kühler: </b>Noctua NH-D14</li><li><b>Mainboard:</b> ASUS Crosshair IV Formula (BIOS 0505)</li><li><b>Arbeitsspeicher:</b> 4x 2 GByte G.Skill DDR3-1333 (9-9-9-24 2T bei 1,5 Volt)</li><li><b>Grafikkarte:</b> Powercolor ATI Radeon HD5870 PCS+</li><li><b>Netzteil:</b> Enermax Revolution85+ 625 Watt</li><li><b>Festplatten:</b> <ul><li>Intel X25-M (Betriebssystem)</li><li>Hitachi HDS722020ALA330 (SATA, 2 TByte, 7200 u/min)</li></ul><li><b>Gehäuse:</b> Antec P180 Midi-Tower</li><li><b>Energiemessgerät:</b> Voltcraft Energy Monitor 3000</li></ul>

Auf der Software-Seite sieht das Testsystem so aus:

<center><table border="1" cellpadding="3" cellspacing="0" summary="verwendete Software / Treiber" width="550px"><tr><th style="font-weight: bold; color: #fff; background: #008c58; " >verwendete Software / Treiber</th><th style="font-weight: bold; color: #fff; background: #008c58; ">Version / Bemerkungen</th></tr><tr><td><div style="text-align: left;">Windows Vista Ultimate</td><td><div style="text-align: center;">64 Bit, Service Pack 2</td></tr><tr><td><div style="text-align: left;">DirectX</td><td><div style="text-align: center;">10, August-Update 2009</td></tr><tr><td><div style="text-align: left;">Grafikkartentreiber</td><td><div style="text-align: center;">Catalyst 10.3</td></tr><tr><td><div style="text-align: left;">Chipsatz-/Mainboardtreiber</td><td><div style="text-align: center;">aktuelle Version des Herstellers</td></tr><tr><td><div style="text-align: left;">Everest</td><td><div style="text-align: center;">5.50, Build 2100</td></tr><tr><td><div style="text-align: left;">WinRAR</td><td><div style="text-align: center;">x64 3.93</td></tr><tr><td><div style="text-align: left;">XMPEG</td><td><div style="text-align: center;">5.03, Build 5.0.8.84</td></tr><tr><td><div style="text-align: left;">XviD</td><td><div style="text-align: center;">1.2.-127</td></tr><tr><td><div style="text-align: left;">Avidemux</td><td><div style="text-align: center;">2.5.2</td></tr><tr><td><div style="text-align: left;">POV-Ray</td><td><div style="text-align: center;">3.7, Beta 36 (64 Bit)</td></tr><tr><td><div style="text-align: left;">Cinebench</td><td><div style="text-align: center;">R10, 64 Bit</td></tr><tr><td><div style="text-align: left;">Cinebench</td><td><div style="text-align: center;">R11, 64 Bit</td></tr><tr><td><div style="text-align: left;">Crysis</td><td><div style="text-align: center;">Demo</td></tr><tr><td><div style="text-align: left;">Crysis Benchmark Tool</td><td><div style="text-align: center;">1.0.0.5</td></tr><tr><td><div style="text-align: left;">UT3</td><td><div style="text-align: center;">Demo</td></tr><tr><td><div style="text-align: left;">UT3-Bench</td><td><div style="text-align: center;">0.2.0.44</td></tr><tr><td><div style="text-align: left;">Doom 3</td><td><div style="text-align: center;">Demo</td></tr><tr><td><div style="text-align: left;">FarCry 2</td><td><div style="text-align: center;">v1.03</td></tr><tr><td><div style="text-align: left;">FarCry 2 Benchmark Tool</td><td><div style="text-align: center;">1.0.3.0</td></tr><tr><td><div style="text-align: left;">3DMark Vantage</td><td><div style="text-align: center;">Advanced, Build 1.0.2, ohne Feature Tests</td></tr><tr><td><div style="text-align: left;">PCMark Vantage</td><td><div style="text-align: center;">Advanced, Build 1.0.2</td></tr><tr><td><div style="text-align: left;">BOINC</td><td><div style="text-align: center;">6.10.45 (64 Bit)</td></tr><tr><td><div style="text-align: left;">Prime95</td><td><div style="text-align: center;">x64, 25.9 Build 4</td></tr></table></center>

Unser Test-Parcours soll einen guten Querschnitt durch den Alltagsbetrieb eines PCs bilden. 32 Bit- und 64 Bit-Anwendungen sind vertreten, ältere Spiele wechseln sich mit neueren ab, Video-Encoding und Rendering sind vertreten und selbst Distributed Computing spielt eine Rolle. Das alles sind Anwendungen, die im Alltag auftreten können und zeigen so einen guten Querschnitt durch das Anforderungsprofil eines heutigen Prozessors.
[break=Everest Memory Benchmark, WinRAR]
Kommen wir nun zum essentiellen Teil unserer heutigen Erstbetrachtung - den Benchmarks. Insgesamt schmücken die Diagramme vier Ergebnisbalken. Zum Einen findet sich darin der von Planet 3DNow! gewohnte Vergleich bei identischer Taktrate wieder. Dazu haben wir unseren X4 965 Deneb-Prozessor mit 3,2 GHz gegen den Thuban 1090T mit deaktiviertem Turbo CORE antreten lassen. Gleichzeitig wollten wir wissen, wie sich die Performance der beiden Flaggschiffe mit ihren jeweiligen Standardeinstellungen verhält. Alle Ergebnisse sind in die folgenen Diagramme eingeflossen.

<center><b>Everest</b></center>

Everest von Lavalys hat sich in letzter Zeit zu einem populären Benchmark entwickelt. Viele nutzen ihn, die Versionsabhängigkeit ist nicht so ausgeprägt wie bei SiSoft Sandra und auch bei uns im Forum lassen sich viele Vergleichswerte finden. Aus diesem Grund nutzen wir den integrierten Memory-Benchmark von Everest, um den Speicherdurchsatz beim Lesen, Schreiben und kopieren sowie die Speicherlatenz zu messen. Dabei kommt die Programmversion 5.50 mit Build 2100 zum Einsatz.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=2901&w=l" alt="Everest" border="1"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9458&w=o" alt="Speicherdurchsatz: Lesen" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9459&w=o" alt="Speicherdurchsatz: Schreiben" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9460&w=o" alt="Speicherdurchsatz: Kopieren" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9461&w=o" alt="Speicherlatenz" border="0"></center>

AMD scheint kräftig am Speichercontroller gearbeitet zu haben. Besonders die Verbesserungen beim Kopieren sowie bei der Latenz stechen ins Auge. Die Verbesserung im Read-Wert fällt zwar geringer aus, ist jedoch auch nicht zu verachten. Gleichzeitig fällt auf, dass - mit Ausnahme des Write-Tests - Turbo CORE jeweils minimal bessere Ergebnisse abliefert. Besagter Write-Test liefert mit Turbo-Einstellung hingegen ein deutlich niedrigeres Ergebnis ab.


<center><b>WinRAR</b></center>

Auch bei WinRAR wird immer auf gleichem Weg getestet: Es wird ein Ordner mit gemischtem Inhalt geöffnet und anschließend der integrierte Benchmark gestartet. WinRAR reagiert äußerst feinfühlig auf Speicher-Latenzen und liegt mittlerweile in einer 64 Bit-Version vor, welche wir auch benutzen.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=2911&w=o" alt=WinRAR" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9462&w=o" alt="WinRAR" border="0"></center>

Dank ganzer sechs Prozessorkerne kann sich Thuban im WinRAR-Test deutlich in Szene setzen. Turbo CORE bringt hier hingegen so gut wie keinen Vorteil, was sehr wahrscheinlich dem Umstand geschuldet ist, dass alle Kerne stark beschäftigt sind und somit keine 50/50-Aufteilung stattfindet.
[break=XMPEG, Avidemux, H.264]
<center><u>XMPEG + XviD / Avidemux + h.264</u></center>

Wenn es um Video-Encoding bzw. -Decoding geht, so gibt es unzählige Variationen und Ausgestaltungen von Software. Viele Programme und noch mehr Codecs lassen dem Enduser die Qual der Wahl. Dabei ist die Nutzung der Ressourcen genauso vielfältig wie die Software selbst: Einige Programme bzw. Codecs können maximal einen Prozessorkern ansprechen, andere wiederum nehmen alles, was sie an Leistung bekommen können - schwer, dabei einen Querschnitt abzubilden.

Wir haben mit der Wahl von XMPEG in Verbindung mit dem XviD-Codec sowie Avidemux in Verbindung mit dem H.264-Codec versucht, diesen Querschnitt zu finden. Während XMPEG mit dem zum Teststart aktuellen XviD-Codec 1.2.-127 kaum mehr als einen Prozessorkern beansprucht, nutzt Avidemux dank H.264-Codec jede zur Verfügung stehende Ressource. In beiden Fällen wandeln wir je ein Referenz-Video um und messen dabei die benötigte Zeit.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=2912&w=o" alt="XMPEG" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9463&w=o" alt="XMPEG + XviD" border="0"></center>

Bei XMPEG beobachten wir seit längerem, dass die vom Programmierer auf dem Papier versprochene Multicore-Unterstützung bei weitem nicht so weit ist, wie sie sein könnte. Kein Wunder also, dass der mit permanent 3,4 GHz getaktete Deneb das Feld anführt. Interessant ist aber, dass bei Takt-Gleichstand Thuban ebenfalls das Nachsehen hat und Turbo CORE sogar noch zu einer minimalen Performance-Verschlechterung führt. Hierfür gibt es zwei (mögliche) Erklärungen:

1. XMPEG reagiert auf den L3-Cache. Vergangene Artikel haben gezeigt, dass zwischen Deneb (6 MByte L3-Cache) und Propus (kein L3-Cache) bei gleichem Takt bis zu 13 Prozent Performance-Unterschied liegen.
2. Da XMPEG bereits aus Quad-Cores keinen Vorteil ziehen kann, scheint das Herumreichen der Bearbeitungsthreads durch den Betriebssystem-Scheduler in Verbindung mit dem Hoch- und Runtertakten der Prozessorkerne das Übrige zu tun, um Thuban alt aussehen zu lassen.


<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=2897&w=o" alt="Avidemux" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9464&w=o" alt="Avidemux + H.264" border="0"></center>

Avidemux samt H.264-Codec ist hingegen ein ganz anderes Kaliber. Hier wird massiv parallel gearbeitet, wo jeder Kern zählt. Kein Wunder also, warum Deneb von Thuban deklassiert wird. Gleichzeitig zeigt sich am Ergebnis, dass alle Kerne so stark ausgelastet sind, dass Turbo CORE keinen Vorteil bietet.


Da das Encodieren eines Videos einen Aspekt darstellt, das Abspielen eines Videos hingegen einen völlig anderen, spielen wir ein vorgefertigtes mit h.264-Codec erstelltes Video im Windows Media Player ab und messen mittels der Windows Leistungsanzeige die auftretende Prozessorlast.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=2905&w=o" alt="Perfmon" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9465&w=o" alt="CPU-Last Wiedergabe h.264-Video" border="0"></center>

Auch bei der Wiedergabe eines mit H.264 encodierten Videos zeigt sich die Verteilung der Arbeit auf mehrere Kerne im Ergebnis. Six-Core vor Quad-Core.
[break=POV-Ray, Cinebench]
<center><b>POV-Ray</b></center>

Auch der Punkt Rendering darf in unserem Parcours nicht fehlen. Für diesen Bereich nutzen wir 2 Programme, die unterschiedliche Anwendungsgebiete haben.

Auf der einen Seite kommt POV-Ray im 64 Bit-Modus zum Einsatz. Dabei handelt es sich um ein <a href="http://de.wikipedia.org/wiki/Raytracer" target="_blank">Raytracer</a>-Programm, welches im Benchmark-Modus eine vorgefertigte 3D-Szene berechnet. Gemessen wird die dafür benötigte Zeit.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=2906&w=o" alt="POV-Ray" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9466&w=o" alt="POV-Ray" border="0"></center>

POV-Ray bietet das gleiche Bild wie Avidemux mit H.264-Codec. Massive Parallelisierung in der Bearbeitung führt zur Deklassierung des Phenom II X4. Gleichzeitig heißt das aber den Verzicht auf Turbo CORE, da alle Kerne voll ausgelastet sind.


<center><b>Cinebench</b></center>

Auf der anderen Seite nutzen wir das bekannte Renderprogramm Cinebench in der Version 10 sowie im neuesten Release R11. Cinebench basiert auf der Cinema 4D-Software von Maxon und liegt in einer 64 Bit-Version vor, welche wir natürlich nutzen. Wir lassen den Benchmark hintereinander erst auf einem Prozessorkern und dann auf allen Kernen laufen, notieren die jeweiligen Ergebnisse sowie den Speedup-Faktor.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=2898&w=l" alt="Cinebench" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9467&w=o" alt="Cinebench R10 1 CPU" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9468&w=o" alt="Cinebench R10 x CPU" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9469&w=o" alt="Cinebench R10 Multiprocessor Speedup" border="0"></center>

Während bei der 1-Kern-Berechnung bei 3,2 GHz noch nahezu gleichstand herrscht, so liegt der mit 3,4 GHz getaktete Deneb vor dem Thuban mit aktiviertem Turbo-Feature - obwohl dieser theoretisch auf 3,6 GHz zurückgreifen kann. Hier scheint abermals das Verschieben der Threads von Kern zu Kern zu einem Penalty zu führen.

Bei der Multicore-Berechnung zeigt Thuban aber wieder, wo der Hammer hängt. Auch hier bringt Turbo Core nichts, da erneut die volle Auslastung der Kerne auftritt. Logischerweise sinkt damit auch der Speedup-Faktor.


<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9470&w=o" alt="Cinebench R11" border="0"></center>

Im Cinebench R11 bietet sich ein ähnliches Bild wie im X-CPU-Test des R10.
[break=Crysis, UT3]
<center><b>Crysis</b></center>

Crysis ist ein DirectX 10-Spiel, welches einen integrierten CPU-Benchmark in 64 Bit bietet. Wir lassen diesen Benchmark mit Hilfe des kostenlosen <a href="http://www.crymod.com/filebase.php?fileid=280&lim=0" target="_blank">"Crysis Benchmark-Tools"</a> hintereinander in den Auflösungen 1280x1024, 1600x1200 sowie 1920x1200 jeweils mit dem Detail-Level "High" laufen.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=2899&w=l" alt="Crysis" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9471&w=o" alt="Crysis 1280x1024" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9472&w=o" alt="Crysis 1600x1200" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9473&w=o" alt="Crysis 1920x1200" border="0"></center>

Crysis kann keinerlei Vorteil aus Thuban schlagen. Weder helfen die zusätzlichen Kerne, noch bietet Turbo CORE einen Vorteil. Hier scheint einzig und allein die rechnerische Verknappung des L3-Caches je Kern zu wirken.


<center><b>UT3</b></center>

Unreal Tournament bzw. dessen Game-Engine ist ein Beispiel für gute Systemausnutzung. Hier spielt die Grafikleistung eine weniger gewichtige Rolle - stattdessen skaliert das Spiel mit der Anzahl der Prozessorkernen und ist somit ideal für einen Systemvergleich.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=2910&w=o" alt="UT3" border="0"></center>

Findige Programmierer haben ein kleines, kostenloses Tool namens <a href="http://olrac.org/ut3bench" target="_blank">"UT3-Bench"</a> geschrieben, welches wir für unsere Benchmarks nutzen. Auch hier nutzen wir die Auflösungen von 1280x1024, 1600x1200 sowie 1920x1200 und lassen den Benchmark mit der Map vCTF-Suspense_fly jeweils 60 Sekunden laufen. Vor den Durchläufen wird jedoch noch der von Haus aus eingebautet Frame-Limiter deaktiviert.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9474&w=o" alt="UT3 1280x1024" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9475&w=o" alt="UT3 1600x1200" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9476&w=o" alt="UT3 1920x1200" border="0"></center>

Im Unreal Tournament 3 sieht das Bild etwas besser aus, von gut kann jedoch keine Rede sein. Interessant ist, dass die Aktivierung von Turbo CORE hier sogar zu einer Verschlechterung der Performance führt.
[break=Doom 3, FarCry 2]
<center><b>Doom 3</b></center>

Doom 3 stellt unseren Vertreter der etwas älteren Spiele dar, was insgesamt zu einem guten Querschnitt durch die Spielewelt führt. Es wird mit "Ultra Details" getestet. Gewertet wird jeweils der zweite Durchlauf, da beim ersten Durchlauf starke Nachladeruckler auftreten und dadurch das Ergebnis verfälschen.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=2900&w=l" alt="Doom 3" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9477&w=o" alt="Doom 3 1024x768" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9478&w=o" alt="Doom 3 1280x1024" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9479&w=o" alt="Doom 3 1600x1200" border="0"></center>

Doom 3 zeigt erneut, dass die Parallelisierung nicht immer auf "Gegenliebe" stößt. Zwar bringt Turbo CORE einen kleinen Performanceschub, der Rückstand zum Deneb mit rechnerisch mehr L3-Cache je Kern bleibt aber bestehen.


<center><b>FarCry 2</b></center>

FarCry 2 hat ähnlich wie Unreal Tournament 3 den Ruf, eine gute Ressourcenauslastung zu besitzen. Das Spiel profitiert von Mehrkernprozessoren, bietet eine detailreiche Grafik sowie einen integrierten Benchmark und ist somit ideal für einen Prozessortest.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9441&w=l" alt="FarCry 2" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9480&w=o" alt="FarCry 2 1280x1024" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9481&w=o" alt="FarCry 2 1600x1200" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9482&w=o" alt="FarCry 2 1920x1200" border="0"></center>

Trotz gutem Ruf in Sachen Ressourcenauslastung zieht FarCry 2 keinen Vorteil aus Thuban. Auch hier scheint ein Mix aus geringerem L3-Cache je Kern und dem permanenten Verschieben der Threads ursächlich für den Leistungsrückstand zu sein. Turbo CORE tut dann sein Übriges.

An dieser Stelle wollen wir nicht unerwähnt lassen, dass AMD in eigenen Benchmarkergebnissen bei FarCry 2 einen Performanceschub von etwa 7 Prozent bei der Verwendung von Turbo CORE zeigt. Allerdings wurde im Gegensatz zu unseren Einstellungen 4x Anti Aliasing verwendet. Anhand unserer Ergebnisse sieht man zwar, dass mit steigender Auflösung der Rückstand von Thuban auf Deneb immer kleiner wird, Turbo CORE bietet aber nirgends einen Vorteil. Insofern können wir die Werte von AMD hier nicht nachvollziehen - es sei denn, während der Tests von AMD wurden die Threads von FarCry 2 Kernen fest zugeordnet, was wir nicht getan haben. Bei uns ist das verwendete Windows Vista Herrscher über die Ressourcenverteilung.
[break=3DMark Vantage, PCMark Vantage]
<center><b>3DMark Vantage</b></center>

Zum Abschluss unseres Benchmark-Parcours statten wir Futuremark noch einen Besuch ab. Obwohl die Benchmarks aus diesem Hause derzeit heftig umstritten sind (<a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=344923">wir berichteten</a>), gehören sie noch immer zu den beliebtesten Vergleichsmöglichkeiten.

Futuremark bietet mit 3DMark Vantage bzw. PCMark Vantage zwei Programme an, die ausschließlich unter Windows Vista laufen. PCMark liegt zudem in einer 64 Bit-Version vor, welche wir nutzen. 3DMark Vantage lassen wir im vorgefertigten Performance-Preset laufen (High- bzw. Extreme-Preset sind aufgrund des verwendeten Monitors nicht zugänglich).

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=2913&w=l" alt="3DMark Vantage Performance" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=2914&w=l" alt="3DMark Vantage Performance" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9483&w=o" alt="3DMark Vantage Performance Gesamt" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9484&w=o" alt="3DMark Vantage Performance CPU" border="0"></center>

Im synthetischen 3DMark Vantage zeigt Thuban seine volle Stärke, wenngleich das Turbo-Feature keinen Vorteil bringt.


<center><b>PCMark Vantage</b></center>

Der PCMark bietet verschiedene Suiten, die unterschiedliche Bereiche des PCs testen. Wir nutzen neben dem Standard-Durchlauf noch zusätzlich die Speicher- sowie Gaming-Suite und können somit ein detailliertes Ergebnis erzielen.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=2904&w=l" alt="PCMark Vantage" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9485&w=o" alt="PCMark Vantage gesamt" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9486&w=o" alt="PCMark Vantage Memory" border="0"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9487&w=o" alt="PCMark Vantage Gaming" border="0"></center>

Die Ergebnisse im PCMark Vantage wirken ziemlich durcheinander. Auffällig ist in erster Linie, dass der auf parallelen Workload optimierte PCMark mit variablen Taktraten so seine Schwierigkeiten zu haben scheint. Anders ist ein derart krasser Unterschied zwischen Turbo CORE Enabled und Disabled nicht zu erklären.

Im Gegensatz dazu bringt das Turbo-Feature in der Memory- sowie in der Gaming-Suite, in denen noch einmal deutlich mehr Tests zu einem Bereich durchgeführt werden, wieder einen deutlichen Vorteil.
[break=BOINC, Leistungsaufnahme]
<center><b>BOINC</b></center>

Viele Forenmitglieder von Planet 3DNow! betreiben Distributed Computing als Hobby und stellen dabei die nicht benötigte Rechenzeit ihres Computers der Wissenschaft zur Verfügung. Planet 3DNow! rangiert dank der vielen fleißigen Mitglieder <a href="http://de.boincstats.com/stats/boinc_team_stats.php?pr=bo&st=0" target="_blank">unter den Top 10-Teams weltweit</a> - kein Wunder also, dass wir einen Distributed Computing-Benchmark in unser Prozessor-Review eingebaut haben. Es kommt die zum Zeitpunkt der Referenz-Festlegung aktuelle BOINC-Version 6.10.36 in 64 Bit zum Einsatz, deren integrierter Benchmark genutzt wird. Der Benchmark errechnet jeweils die Leistungsfähigkeit <b>eines</b> Prozessorkerns.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9488&w=o" alt=" BOINC floating point MIPS (Whetstone) - pro Kern"></center>

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9489&w=o" alt=" BOINC integer MIPS (Dhrystone) - pro Kern"></center>

Die BOINC-Werte haben eher informatorischen Charakter. Denn sie spiegeln nur die Performance eines Prozessorkerns wieder, welcher dank Turbo CORE deutlich beschleunigt wird. Wird BOINC - wie eigentlich üblich - auf mehreren Kernen ausgeführt, so werden diese Ergebnisse anders aussehen als unsere Werte.

Vergleichbarkeit mit realen Anwendungssituationen hin oder her - interessant ist dennoch der Blick auf die Effektivität von Turbo CORE. Die Whetstone-Berechnung profitiert keinen Deut, obwohl Deneb mit höherem Takt zulegen kann. Ein Indiz dafür, dass einmal mehr der Aufwand des hoch- und runtertaktens bei gleichzeitigem Kernwechsel den Vorteil auffrisst.

Die Dhrystone-Berechnung profitiert widerum mehr als deutlich. Allerdings ist diese Berechnung eher Cache-lastig (mit Blick auf die Geschwindigkeit, nicht die Größe).


<center><b>Leistungsaufnahme</b></center>

Wie viel Strom verbraucht der aktuelle PC? Die Antwort auf diese Frage darf natürlich nicht fehlen. Aus diesem Grund messen wir die Leistungsaufnahme in bestimmten Szenarien mittels des Voltcraft Energy Monitor 3000. Dabei messen wir die Leistungsaufnahme des Gesamtsystems, jedoch ohne Monitor.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9490&w=o" alt="Leistungsaufnahme Prime95 64 Bit" border="0"></center>

AMD hat nicht zuviel versprochen. Schlappe 3 Watt Differenz zwischen Phenom II X4 965 C3 und dem mit 50 Prozent mehr Kernen ausgestatteten Thuban zeigen, dass die TDP-Klasse von 125 Watt wohl absolut gerechtfertigt ist. Logisch ist auch, dass Turbo CORE keinerlei Auswirkungen haben kann, da Prime95 alle Kerne voll auslastet.


<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9491&w=o" alt="Leistungsaufnahme Idle ohne Cool'n'Quiet" border="0"></center>

Im Idle-Zustand ohne aktiviertes Cool'n'Quiet zeigt sich Thuban von seiner besten Seite. Die Leistungsaufnahme ist deutlich geringer als beim Deneb. Der Grund hierfür dürfte in der verhältnismäßig geringen Versorgungsspannung von 1,30 Volt liegen - immerhin 0,1 Volt weniger als beim Deneb.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9492&w=o" alt="Leistungsaufnahme Idle mit Cool'n'Quiet" border="0"></center>

Mit aktiviertem Cool'n'Quiet dreht sich das Bild hingegen wieder um. Auch hier dürfte die VCore ursächlich sein. Denn beim Deneb wird diese immerhin um etwa 0,4 Volt verringert, während beim Thuban nur magere 0,075 Volt weniger zu Buche stehen.
[break=Fazit]
<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=9440&w=o" alt="AMD Phenom II X6 Thuban - Titelbild" border="1"></center>

Nachdem wir im letzten Jahr den Phenom II in diversesten Varianten begrüßen durften, hält heute eine weitere Ausbaustufe Einzug: Der AMD Phenom II X6 "Thuban". Ganze sechs Kerne, die im Normalfall mit bis zu 3,2 GHz takten (je nach Modell) und obendrauf noch 400 bis 500 MHz (ebenfalls modellabhängig) je nach Lastzustand dank Turbo CORE, lassen Thuban zu AMDs rechenstärksten Desktop-Prozessor avancieren. Dank der beibehaltenen Thermal Design Power-Klasse von 125 Watt könnte man fast eine generelle Kaufempfehlung aussprechen. Aber auch nur fast.

Aufgrund der Beibehaltung der L3-Cache-Größe stehen jedem Kern rechnerisch nur noch 1 MByte statt derer 1,5 MByte zur Verfügung. Zwar ist der L3-Cache shared ausgeführt und alle Kerne können auf die volle Kapazität zugreifen, im Bedarfsfall wird diese Ressource jedoch verknappt. Zumindest sind so einige suboptimale Benchmarkergebnisse in Spielen zu erklären, die in der Regel einen deutlichen Vorteil aus mehr L3-Cache ziehen können.

Hinzu kommt, dass Thuban auf verlorenem Posten steht, wenn die verwendete Software nicht auf Multithreading optimiert ist. Sobald eine geringe Auslastung vorliegt, scheint das permanente Verschieben der Threads durch den Scheduler des Betriebssystems von Kern zu Kern selbst den Taktvorteil des Turbo-Features wieder aufzufressen. Liegt jedoch, wie im Fall von POV-Ray, Avidemux oder Cinebench eine massive Parallelisierung vor, so muss Deneb Staub schlucken. In diesen Situationen greift allerdings Turbo CORE nicht mehr.

Die Diskussion um Multitasking, Ressoucenausnutzung und Parallelisierung kann mit Thuban also in eine neue Runde gehen. Jeder, der entsprechende Software nutzt, bekommt einen ordentlichen Performanceschub. Der geneigte Spieler sollte hingegen überlegen, ob ein schnell getakteter Deneb mit vier Kernen nicht die bessere Wahl ist. Denn Spiele scheinen dem Thuban nicht ganz zu liegen - zumindest noch nicht.

In einigen Tagen werden wir zudem einen tieferen Blick auf Thuban und dessen Fähigkeiten auf Overclocking sowie Spannungsabsenkung werfen. Auch C1E werden wir im Hinblick auf die Schnittstellenperformance noch einmal näher beleuchten. Hierfür fehlte beim heutigen Review die Zeit, die wir uns aber für diese Themen nehmen wollen.

<center><a href="http://www.planet3dnow.de/vbulletin/forumdisplay.php?f=163">...weitere Artikel</a><br><a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=379517">...diesen Artikel im Forum diskutieren</a></center>
 
Zurück
Oben Unten