Titelbild Phenom-Review


April 2003. AMD stellt mit dem Opteron seinen ersten 64 Bit-Serverprozessor vor. Seit diesen Tagen sind nunmehr über viereinhalb Jahre vergangen. Seither wurden mehrere Prozessorsockel mit noch mehr Prozessorvarianten vorgestellt. Eines hatten jedoch alle Modelle gemeinsam: Sie basierten alle auf AMDs K8-Architektur.

Am 10. September diesen Jahres wurde der langersehnte Nachfolger, der AMD K10, vorgestellt. Vorerst nur für Server auf Sockel F basierend, folgte letzten Montag die offizielle Vorstellung der Desktop-Varianten Phenom 9500 und 9600.

Obwohl der Phenom AMDs erster Quad-Core-Prozessor für den Desktop-Markt ist und mit einigen technischen Neuerungen aufwarten kann, stand die Präsentation unter keinem guten Stern. Keine Verfügbarkeit von Pressesamples, ein im letzten Moment entdeckter Fehler in der Prozessorarchitektur und obendrein bisher nur wenig gute Nachrichten in Sachen Performance und Leistungsaufnahme lassen erahnen, dass AMD im Gegensatz zum Opteron im April 2003 nicht der große Wurf gelungen ist.

Doch stimmen die Hiobsbotschaften der letzten Tage überhaupt? Ist der K10 für den Desktop wirklich so schlecht, wie er überall abschneidet? Dieser Frage möchten wir im heutigen Artikel auf den Grund gehen.

Eigentlich wollten wir bereits zum Launch am vergangenen Montag umfangreiche Benchmarkergebnisse des Phenom präsentieren. Kurz vor der versprochenen Lieferung eines Testsamples hieß es dann jedoch, dass es keine Pressesamples geben wird und statt dessen eine Presseveranstaltung in Warschau, Polen, stattfinden wird. Dort konnten eingeladene Redaktionen an vorkonfigurierten PCs vordefinierte Benchmarks durchführen.

Wir entschieden uns gegen eine Teilnahme an dieser Veranstaltung. Denn was bringen Benchmarkergebnisse, die unter nicht reproduzierbaren Bedingungen entstanden sind? Fragen, wie sich zum Beispiel eine andere CPU im Testrechner geschlagen hätte, wären trotz vorliegenden Ergebnissen unbeantwortet geblieben. Aus diesem Grund entschlossen wir uns, auf ein Phenom-Sample zu warten, welches wir unter unseren Bedingungen testen konnten.

Doch leider mussten wir eineinhalb Wochen warten, bis wir einen Phenom in unser Testsystem einbauen konnten. Bezeichnend für den nicht ganz rund abgelaufenen Start des Desktop-K10 ist die Tatsache, dass die von uns genutzte CPU nicht von AMD selbst stammt. Wir griffen kurzerhand auf einen Retail-Chip zurück, welcher uns von einem befreundeten Hardware-Händler geliehen wurde. Hier konnte man uns eher bedienen als AMD dies tun konnte.

Doch jetzt ist es endlich soweit, auf den folgenden Seiten widmen wir uns der Performance des K10. Viel Vergnügen beim Lesen.
[break=Déjá Vu und Danksagung]
Déjá Vu

Einige werden sich sicherlich noch an die Einführung des AM2 im Mai 2006 erinnern. Bereits beim Launch dieses Sockeltyps verlief die Versorgung mit Pressesamples sehr holprig. Viel zu spät sollte unser Testsystem verschickt werden, was dazu führte, dass Nero24 kurzerhand Deutschlands Autobahnen unter die Räder nahm und einmal quer durch die Republik fuhr, um das Sample selbst zu transportieren.

Auch im Vorfeld des heutigen Artikels wurden wieder 1.300 Autobahn-Kilometer zurückgelegt, denn es ergab sich am letzten Dienstag unverhofft die Gelegenheit einen Phenom zu testen. Für eine Nacht stand er uns zur Verfügung, bevor er am folgenden Vormittag wieder beim rechtmäßigen Eigentümer vorliegen musste. Doch hier hatten wir die Rechnung ohne den Wirt - pardon - das Mainboard gemacht, denn die uns zu diesem Zeitpunkt vorliegenden Mainboards (drei an der Zahl) wollten allesamt nicht mit dem Prozessor booten. Es gab schlichtweg kein passendes BIOS für die drei Hauptplatinen.

Unverrichteter Dinge gaben wir das Sample wieder zurück. Aber wenigstens einen guten Aspekt hatte der nächtliche Fehlschlag: Statt Ergebnisse unter Verwendung einer AM2-Plattform zu präsentieren und so der möglichen Frage zu unterliegen, ob ein AM2+ -Mainboard nicht viel besser gewesen wäre, konnten wir in der Zwischenzeit ein MSI K9A2 Platinum erwerben, welches auf dem AMD 790FX basiert und somit alle Features des AMD Phenom unterstützt.

Durch diesen Aspekt wird klar: Die Stunde der Wahrheit für den AMD K10 folgt auf den kommenden Seiten.

Danksagung

Einmal mehr möchten wir der Topas GBS Datentechnik GmbH in Cottbus, speziell Herrn Hundro, danken. Wie bereits bei vergangenen Artikeln wurden wir tatkräftig in Form von Hardware-Teststellungen unterstützt. Die Liste der uns zur Verfügung gestellten Hardware liest sich lang:
  • Radeon HD2900 XT
  • AMD Athlon64 X2 6000+
  • AMD Athlon64 X2 4400+
  • AMD Phenom X4 9500
  • 2x 1GB Arbeitsspeicher
  • Gigabyte GA-MA69G-S3H
  • MSI K9A2 Platinum
Wie man der beachtlichen Liste entnehmen kann, wäre ein fundierter Vergleich der Plattformen ohne die Hilfe der Topas GBS Datentechnik GmbH nicht möglich gewesen, deren Mitarbeitern wir an dieser Stelle noch einmal ganz besonders danken möchten.
[break=Testsysteme und Testaufbau]
Testsysteme

Um die Leistungsfähigkeit des Phenom bestmöglich zu vergleichen, haben wir insgesamt drei Testsysteme zusammengestellt. Die verwendete Hardware auf einen Blick:

Testsystem AMD AM2:

  • AMD Athlon 64 X2 6000+ (2x 1 MB L2-Cache; F3-Stepping)
  • AMD Athlon 64 3800+ (1x 512 KB L2-Cache; F2-Stepping)
  • Gigabyte GA-MA69G-S3H (BIOS F4)
  • 2x 1024 MB Teamgroup PC8500 (5-5-5-15 2T)
  • Xpert Vision Radeon HD2900 XT 512 MB
  • Maxtor 6E040L0 IDE (40 GB, 7.200 u/min)
  • Maxtor 6Y080M0 SATA (80 GB, 7.200 u/min)
  • bequiet Dark Power Pro 530 Watt
  • Chieftec Mesh CH-01 Midi-Tower


Testsystem AMD AM2+:

  • AMD Athlon 64 X2 4400+ (2x 512 KB L2-Cache; G2-Stepping)
  • AMD Phenom X4 9500 (4x 512 KB L2-Cache; 2 MB L3-Cache; B2-Stepping)
  • MSI K9A2 Platinum (BIOS 1.0)
  • 2x 1024 MB Teamgroup PC8500 (5-5-5-15 2T)
  • Xpert Vision Radeon HD2900 XT 512 MB
  • Maxtor 6E040L0 IDE (40 GB, 7.200 u/min)
  • Maxtor 6Y080M0 SATA (80 GB, 7.200 u/min)
  • bequiet Dark Power Pro 530 Watt
  • Chieftec Mesh CH-01 Midi-Tower


Testsystem Intel:

  • Intel Core 2 Quad Q6600 (G0-Stepping)
  • Asus P5K Deluxe
  • 2x 1024 MB takeMS PC 6400 (5-5-5-15 2T)
  • Xpert Vision Radeon HD2900 XT 512 MB
  • Seagate ST3160811AS (160 GB, 7.200 u/min)
  • Seasonic S12 380 Watt
  • Antec P180


Verwendete Software

Auf den Testsystemen wurde Windows XP Professional mit Service Pack 2, DirectX 9.0c Dezemberupdate 2005 sowie Catalyst 7.10 installiert. Für die Chipsätze der Mainboards kamen die jeweils mitgelieferten Treiber zum Einsatz. Weiterhin kommt folgende Software zum Einsatz:

verwendete Software / TreiberVersion / Bemerkungen
Windows XP Professional
32 Bit, Service Pack 2
DirectX
9.0c, Dezemberupdate 2005
Grafikkartentreiber
Catalyst 7.10 + Control Center
SiSoft Sandra
2007 lite SP4
Sciencemark2
32 Bit
XMPEG
5.03
Xvid
Core 2.1
WinRAR
3.70d
Cinebench
9.5
Cinebench
R10
3DMark01
Build 3.3.0, ohne Feature Tests
3DMark03
3.6.0 Professional dition
3DMark05
1.3.0 Advanced Edition
3DMark06
1.1.0 Advanced Edition
PCMark05
1.2.0 Advanced Edition
Aquamark3
1024x768x32
Quake3
640x480x16, Low Details
Quake3
1024x768x16, High Details
UT2004
1024x768x32, High Details
UT2004
1280x1024x32, High Details
UT2004
1600x1200x32, High Details
Doom3 Demo
1024x768x32, Ultra Details
Doom3 Demo
1280x1024x32, Ultra Details
Doom3 Demo
1600x1200x32, Ultra Details
Crysis CPU-Benchmark
1024x768x32, High Details
Crysis CPU-Benchmark
1280x1024x32, High Details
Crysis CPU-Benchmark
1600x1200x32, High Details
SuperPI
1M, Mod 1.5
BOINC Manager
Version
wPrime
32m, 1.53
wPrime
1024m, 1.53

[break=Impressionen von AMDs Phenom]
Nach langer Vorrede möchten wir endlich ein paar Bilder des neuen K10 sprechen lassen.

Produktbild AMD Phenom


Produktbild AMD Phenom


Produktbild AMD Phenom


Produktbild AMD Phenom


Produktbild AMD Phenom


Bis auf die Verpackung und den Aufdruck auf dem Heatspreader unterscheidet sich die CPU optisch nicht von einem "alten" K8-Modell. Der Unterschied steckt vielmehr unter der Haube, unter dem Heatspreader.
[break=Details des K10]
Auf dieser Seite möchten wir einige Screenshots präsentieren, die wir vom Phenom 9500 angefertigt haben.

CPU-Z Phenom 9500: CPU


Nach dem Einbau des Phenom in unser Testsystem wurde die CPU von vornherein korrekt erkannt. Alle 4 Kerne konnten genutzt werden und wurden automatisch angesprochen.

CPU-Z Phenom 9500: Memory


Eigentlich kommt der K10 mit DDR2-1066-Unterstützung daher. Leider verweigerte unser System komplett den Dienst, als wir die dazu passende Einstellung nutzen wollten. Der verwendete Arbeitsspeicher hat bereits in anderen Systemen bewiesen, dass er mit DDR2-1066 bei 2,2 Volt problemlos funktioniert. Nur im MSI K9A2 Platinum sollte es nicht so sein. Nach erfolglosem Speichertausch und BIOS-Update beschlossen wir, alle Benchmarks mit DDR2-800 durchzuführen. Denn auf ein weiteres Beta-BIOS, welches unser Problem behebt, wollten wir nicht mehr länger warten.

CPU-Z Phenom 9500: Memory Latency


Hier noch einige Screenshots, wie SiSoft Sandra den Prozessor erkennt:

SiSoft Sandra Phenom 9500


TitSiSoft Sandra Phenom 9500


SiSoft Sandra Phenom 9500


SiSoft Sandra Phenom 9500


[BREAK=Phenom - K10 Architektur]

Während Intel bereits seit längerem aus zwei Dies zusammengesetzte Quad-Core Prozessoren anbietet, setzt AMD auf ein eigenes natives Design, das vier Kerne in einem Die vereint.

Diese Kerne verfügen jeweils über einen eigenen L2-Cache und einen gemeinsamen über die Crossbar angebundenen L3-Cache.



Gegenüber dem K8 hat AMD aber an vielen weiteren Stellen Veränderungen vorgenommen, um dem K10 zu mehr Performance zu verhelfen.

Mit HyperTransport 3.0 wurde die maximale Taktfrequenz der bidirektionalen Hochgeschwindigkeitsverbindung auf 2,6 GHz erhöht, was eine Bandbreite von bis zu 20,8 GigaByte/s pro Link ermöglicht. Zusätzlich enthält das Protokoll zahlreiche neue Features, unter anderem erweiterte Energiesparmaßnahmen.

Hinzugekommene SSE-Befehle und eine Änderung bei der Abarbeitung von 128-Bit-SSE-Befehlen firmieren unter dem Namen SSE4a, der allerdings nicht kompatibel mit Intels Befehlssatzerweiterung SSE4 ist. Vielmehr steckt dahinter nur eine leicht verbesserte Variante der SSE3-Befehlssatzerweiterung.

Der Memory-Controller wurde in zwei 64-Bit Single-Channel-Controller geteilt, bietet allerdings einen ganged Modus, in dem die Zugriffe mit 128-Bit erfolgen.

Zusätzlich wurde die Instruction Queue erweitert (von 16 Byte auf 32 Byte pro Taktzyklus), der Translation Lookaside Buffer (TLB) vergrößert (von 40 auf 48 Einträge) und eine erweiterte Sprungvorhersage eingebaut.

Trotz der gesamten Verbesserungen ist der K10 aber eher eine Evolution des K8 und keine vollkommen neue Prozessor-Konzeption.


[break=Besonderheiten beim Speicher]
Viele werden sich noch an ihre ersten Gehversuche mit der "Problematik" des Speicherteilers beim Athlon64 erinnern. Multiplikator, Referenztakt und eingestellter Speichertakt wurden für die Berechnung eines Speicherteilers herangezogen, mit dem wiederum vom Prozessortakt der reale Speichertakt abgeleitet wurde. Die Zeiten des aufwändigen Berechnens sind mit dem Phenom nun vorbei.

Beim AMD Phenom wird der Speichertakt nicht mehr vom Prozessortakt abgeleitet. Als Grundlage hierfür dient jetzt der Referenztakt. Zur Verdeutlichung zwei Screenshots:

Beispielscreenshot Berechnung Speichertakt AMD Phenom


Beispielscreenshot Berechnung Speichertakt AMD Phenom


Mit Veränderung des Referenztaktes verändert sich auch der Speichertakt. Verändert man hingegen den Multiplikator, so hat dies keine Auswirkung auf den Speichertakt (im Gegensatz zum K8).

AMD musste die Herangehensweise für den Speichertakt ändern, da sonst für die aktuellen Phenom-Taktraten kein DDR2-1066 möglich gewesen wäre. Der kleinste mögliche Speicherteiler beim K8 ist 5, was im Umkehrschluss bedeutet, dass DDR2-1066 erst mit einem Prozessortakt von 2.666 MHz möglich gewesen wäre (2.666 / 5 = 533 MHz = DDR2-1066). Zudem hätte man in diesem Fall zusätzlich auf 266 MHz Referenztakt und Multiplikator 10 zurückgreifen müssen, da man es sonst mit einem Teiler von 7 zu tun gehabt hätte.

Aber dieses theoretische Geplänkel gehört nun der Vergangenheit an.

ganged vs. unganged

Eine weitere Neuerung betrifft die zwei möglichen Modi "ganged" und "unganged". Diese beiden Varianten beschreiben die Arbeitsweise des Speichercontrollers des K10.

Während bei unganged der Speichercontroller mit 2x 64 Bit betrieben wird, bedeutet ganged einen Betrieb mit 1x 128 Bit, ähnlich wie beim K8. Beide Varianten bedeuten Dual-Channel, auch wenn einige Mainboards den ganged-Mode als Single-Channel "erkennen".

Beim ganged-Mode profitieren Single-Threaded-Anwendungen, da die Speicherzugriffe gebündelt werden. Vom unganged-Mode hingegen profitieren Multi-Threaded-Anwendungen oder der Multitasking-Betrieb, da die Speicherzugriffe separat behandelt werden können und somit der Speicherzugriff optimiert wird.

Ganged und unganged wirken sich direkt auf die Performance einzelner Anwendungen aus. Dabei kann es vorkommen, dass eine Anwendung von ganged profitiert, die nächste wiederum von unganged. Hier muss jeder User für sich die bestmögliche Einstellung in Verbindung mit seinen meistgenutzten Anwendungen finden.

Im heutigen Benchmark-Parcours haben wir alle Tests mit unganged durchgeführt. Zum Einen, weil es die Vorgabe im BIOS des MSI K9A2 Platinum ist, zum Anderen weil wir die Architektur des nativen Quad-Cores bei Multi-Threaded-Anwendungen nicht künstlich bremsen wollten und zum Dritten, da der unganged-Modus ja einer der neuen Features des K10 gegenüber dem K8 ist, welches wir natürlich ausprobieren möchten.

Über die genauen Auswirkungen auf die Performance der Plattform bei ganged-/unganged-Konfiguration werden wir in einem gesonderten Artikel in naher Zukunft berichten.
[break=Vorwort zu den Benchmarks]
Wir haben uns natürlich im Vorfeld überlegt, womit wir den neuen K10 am Besten vergleichen. Da bis zum Schluss nicht feststand, mit welcher Taktrate des Phenom wir es letztendlich zu tun bekommen, mussten wir im Vorfeld alle möglichen Launch-Takte abdecken und gegentesten. Dass etwa ein Intel "Penryn" mit 3.0 GHz schneller ist, als ein Phenom mit 2.2 GHz, setzen wir als gegeben voraus; so etwas braucht man in Kenntnis der Architekturen nicht zu testen. Wir wollten in diesem Artikel möglichst identische Taktraten miteinander vergleichen, um Rückschlüsse ziehen zu können wie effizient ein Prozessor arbeitet, wie hoch sein IPC ist.

Der zum Test genutzte Phenom 9500 hat eine Standard-Taktrate von 2,2 GHz. Auf der AMD-Seite findet man einige K8-Pendants mit eben dieser Taktrate oder man simuliert sie kurzerhand durch Veränderungen am Multiplikator. Auf der Seite von Intel gibt es hingegen keine Core-CPU, welche mit 2,2 GHz betrieben wird. Aus diesem Grund haben wir uns entschieden, die Vergleichstaktraten wie folgt zu definieren:

Zuallererst vergleichen wir den Phenom 9500 bei Standardtakt mit einigen K8-Vorgängern. Hier kommt jeweils eine CPU mit F2, F3 sowie G2-Stepping zum Einsatz. Anschließend werden alle CPUs mit 2,4 GHz durch unseren Benchmark-Parcours gejagt. Zusätzlich kommt bei dieser Taktrate auf der Intel-Seite zum Vergleich ein Intel Core 2 Quad Q6600 mit G0-Stepping zum Einsatz, bei dem für die Simulation eines Dual-Core-Prozessors zwei Kerne beim Windows-Boot abgeschalten werden. Somit können wir bei der Taktrate von 2,2 GHz auf insgesamt 3 K8-Vergleichswerte und bei der Taktrate von 2,4 GHz auf 3 K8- und zusätzlich 2 Core2-Vergleichswerte zurückgreifen.

Um 2,4 GHz mit dem AMD Phenom 9500 zu erreichen, wurde lediglich der Referenztakt von 200 auf 218 MHz erhöht. Da wir alle vom Referenztakt abhängigen Taktraten nicht verändert haben, lief der HT-Link mit 1.090 MHz und der Speicher mit 436 MHz bzw. DDR2-872. Da unser System den Dienst verweigerte, wenn wir Einstellungen für DDR2-1066 vornahmen, mussten wir den Phenom mit 200x11 bei DDR2-800 bzw. 218x11 bei DDR2-872 durch den Benchmarkparcours bringen.

Um gute Vergleichsmöglichkeiten der Leistung des Phenom zur Verfügung zu haben, haben wir bei einigen Benchmarks das jeweilige Gesamtergebnis auf die Anzahl der Prozessorkerne herunter- bzw. heraufgerechnet. So wurden die Ergebnisse der SiSoft Sandra Arithmetic sowie Multimedia-Benchmarks durch die Anzahl der Kerne geteilt, die Ergebnisse des BOINC-Benchmarks wurde mit der Anzahl der Kerne multipliziert.

Diese Vorgehensweise dient lediglich der besseren Vergleichsmöglichkeit. Rückschlüsse auf die tatsächliche Skalierbarkeit mit der Anzahl der Kerne sind daraus nicht möglich.

Auf den folgenden Seiten haben wir eine bunte Mischung an Benchmarks zusammengestellt. In allen dazu angefertigten Ergebnisdiagrammen kommen die Farben blau (Intel Core 2), grün (AMD K8) sowie rot (AMD K10) zum Einsatz.
[break=Benchmarks: SiSoft Sandra]
Sandra 2007
  • Hersteller: SiSoftware
  • Webseite: www.sisoftware.co.uk
  • Bereich: Synthetisch
  • Schwerpunkt: Speicher- und Netzwerkbandbreite
  • Referenzen auf Planet 3DNow!: Suche...
  • Referenzen im Forum: Suche...

Sandra Arithmetic: Drystone MIPS (gesamte CPU)

Benchmarkergebnis AMD Phenom: SiSoft Sandra Drystone MIPS - gesamte CPU


Sandra Arithmetic: Drystone MIPS (pro Kern)

Benchmarkergebnis AMD Phenom: SiSoft Sandra Drystone MIPS - pro Kern


Platz zwei und drei für den Phenom gleich im ersten Test sehen erst einmal vielversprechend aus. Betrachtet man hingegen die Performance pro Core, so sieht die Welt bereits ganz anders aus.

Sandra Arithmetic: Whetstone MFLOPS (gesamte CPU)

Benchmarkergebnis AMD Phenom: SiSoft Sandra Whetstone MFLOPS


Hier reicht der K10 bei gleichem Takt fast an einen Core 2 Quad heran. Nur einen Hauch trennen beide Kandidaten.

Sandra Arithmetic: Whetstone MFLOPS (pro Kern)

Benchmarkergebnis AMD Phenom: SiSoft Sandra Whetstone MFLOPS - pro Kern


Die Performance pro Kern sieht ebenfalls wesentlich besser aus.

Sandra Multimedia: Integer it/s (gesamte CPU)

Benchmarkergebnis AMD Phenom: SiSoft Sandra Integer - gesamte CPU


Nicht den Hauch einer Chance hat der K10 bei der integer-Berechnung des Multimedia-Benchmarks.

Sandra Multimedia: Integer it/s (pro Kern)

Benchmarkergebnis AMD Phenom: SiSoft Sandra Integer - pro Kern


Die Berechnung pro Kern sieht buchstäblich verheerend aus.

Sandra Multimedia: Floating-Point it/s (gesamte CPU)

Benchmarkergebnis AMD Phenom: SiSoft Sandra Multimedia FPU - gesamte CPU


Etwas besser sieht das Bild bei der FP-Berechnung des Multimedia-Benchmarks aus.

Sandra Multimedia: Floating-Point it/s (pro Kern)

Benchmarkergebnis AMD Phenom: SiSoft Sandra Multimedia FPU - pro Kern


Auch das Bild der pro-Kern-Leistung sieht deutlich freundlicher aus.

Sandra Memory: CPU Streaming

Benchmarkergebnis AMD Phenom: SiSoft Sandra CPU Streaming


Sandra Memory: FPU Streaming

Benchmarkergebnis AMD Phenom: SiSoft Sandra Memory FPU Streaming


Bei der Speicherbandbreite sind zwei Dinge zu beachten.

1. Das verwendete Gigabyte GA-MA69G-S3H ist in puncto Bandbreite durch die verbaute IGP eingeschränkt. Dieses Phänomen konnten wir in einigen Mainboardtests in diesem Jahr beobachten. Eine niedrige Bandbreite ist daher nur bedingt aussagefähig.

2. Der Phenom 9500 schneidet augenscheinlich sehr schlecht ab. Hier muss aber beachtet werden, dass die Entwicklung von SiSoft Sandra noch nicht beim Phenom angekommen ist. Berichte anderer User zeigen ebenfalls eine sehr niedrige Bandbreite. Grund hierfür ist die Programmierung des Tests, welcher erst noch auf die Architektur angepasst werden muss.

Sandra Memory Latency

Benchmarkergebnis AMD Phenom: SiSoft Sandra Memory Latency


Die Speicherlatenz bewegt sich im Mittelfeld.
[break=Benchmarks: Sciencemark, XMPEG, Avidemux, WinRAR]
Sciencemark
  • Hersteller: Dr. Timothy Wilkens & Alex Goodrich
  • Webseite: www.sciencemark.de
  • Bereich: Synthetisch
  • Schwerpunkt: Memory-Controller Performance
  • Referenzen auf Planet 3DNow!: Suche...
  • Referenzen im Forum: Suche...

Benchmarkergebnis AMD Phenom: Sciencemark Memory Bandwidth


Hier werden die Probleme deutlich, die bei dem Test der SiSoft Sandra Speicherbandbreite auftreten. Denn werden bei dem Test nur sehr magere Ergebnisse erzielt, zeigt sich bei Sciencemark die wahre Bandbreite des K10.

Benchmarkergebnis AMD Phenom: Sciencemark Memory Latency


Die Speicherlatenz bewegt sich allenfalls im Mittelfeld. Ferner sieht man, dass die AMD-CPUs trotz ihres integrierten Memory-Controllers gegenüber den Intel-CPUs, die noch immer einen externen Memory-Controller auf dem Mainboard nutzen, keinen Vorteil mehr in Sachen Speicherlatenz haben.

XMPEG + XviD

Benchmarkergebnis AMD Phenom: XMPEG


Obwohl XMPEG in Verbindung mit XviD theoretisch Multi-Thread-fähig ist, zeigt die Praxis ein anderes Bild. Beim Intel Q6600 konnten wir beispielsweise nur eine maximale Prozessorauslastung von 40 Prozent beobachten. Der Rest der vorhandenen Rechenzeit lag brach.

Avidemux + x264

Benchmarkergebnis AMD Phenom: Avidemux + x264


Ein wesentlich besseres Beispiel für ein Programm, welches selbst Quad-Cores auslasten kann, ist Avidemux. In Verbindung mit dem x264-Codec waren Auslastungsgrade von ca. 97 Prozent durchwegs an der Tagesordnung.

WinRAR
  • Hersteller: Rarsoft
  • Webseite: www.winrar.de
  • Bereich: Anwendungen
  • Schwerpunkt: ALU, Speicherlatenzen
  • Referenzen auf Planet 3DNow!: Suche...
  • Referenzen im Forum: Suche...

Benchmarkergebnis AMD Phenom: WinRAR


WinRAR kann als Paradedisziplin des K10 bezeichnet werden. Bereits bei 2,2 GHz wird der Q6600 deutlich geschlagen. Mit 1.901 Kbyte/s erreicht der Phenom bei 2,4 GHz bereits einen um ca. 130 Kbyte/s höheren Wert als ein QX6850 von Intel.
[break=Benchmarks: Cinebench 9.5, Cinebench R10, SuperPI]
Cinebench
  • Hersteller: Maxon
  • Webseite: www.maxon.net
  • Bereich: Anwendungen
  • Schwerpunkt: CPU-Performance
  • Referenzen auf Planet 3DNow!: Suche...
  • Referenzen im Forum: Suche...

Cinebench 9.5

Benchmarkergebnis AMD Phenom: Cinebench 9.5 1 Core


Die Ergebnisse eines einzelnen Kerns sind nicht sonderlich berauschend.

Benchmarkergebnis AMD Phenom: Cinebench 9.5 x Cores


Unter Zuhilfenahme aller verfügbaren Kerne deklassiert der K10 alle bisherigen K8-CPUs, muss sich allerdings dem Core 2 Quad geschlagen geben.

Benchmarkergebnis AMD Phenom: Cinebench Multiprocessor Speedup


Die Skalierung von einem zu n-Kernen ist beim K10 deutlich besser als bei Intel.

Cinebench R10

Benchmarkergebnis AMD Phenom: Cinebench R10 1 Core


Auch beim Cinebench R10 fallen die Werte der einzelnen Berechnungs-Threads nur mittelmäßig aus.

Benchmarkergebnis AMD Phenom: Cinebench R10 x Cores


Mit 4 Kernen sieht die Welt wieder besser aus.

Benchmarkergebnis AMD Phenom: Cinebench R10 Multiprocessor Speedup


Cinebench R10 zeigt erneut, dass die Effizienz der 4 Kerne des K10 besser ist als die Effizienz des Core 2 Quad. Womöglich ein positiver Effekt der nativen Quad-Core Bauweise, während Intels Q-Modelle genau genommen als Doppel-Dual-Core CPUs ausgelegt sind.

SuperPI

Benchmarkergebnis AMD Phenom: SuperPI 1M


SuperPI ist eine Paradedisziplin der Intel-CPUs. Aber auch AMD hat gegenüber dem K8 einen großen Sprung gemacht und schneidet rund 3,2 Sekunden besser ab als der schnellste K8 bei dieser Taktrate.
[break=Benchmarks: 3DMark 01/03/05/06, PCMark05, Aquamark]
3DMark01/03/05/06 + PCMark05

3DMark01

Benchmarkergebnis AMD Phenom: 3DMark01


Gegen den Core 2 ist im 3DMark01 kein Kraut gewachsen.

3DMark03

Benchmarkergebnis AMD Phenom: 3DMark03 gesamt


Auch das Gesamtergebnis im 3DMark03 zeigt das gleiche Bild. Dennoch überflügelt der Phenom alle bisherigen Athlon-Konkurrenten.

Benchmarkergebnis AMD Phenom: 3DMark03 CPU


Die CPU-Benchmarks kann der Phenom für sich entscheiden.

3DMark05

Benchmarkergebnis AMD Phenom: 3DMark05 gesamt


Platz 3 und 4 für den Phenom 9500 im 3DMark05.

Benchmarkergebnis AMD Phenom: 3DMark05 CPU


Der CPU-Wert wird vom Core 2 dominiert.

3DMark06

Benchmarkergebnis AMD Phenom: 3DMark06 gesamt


Im 3DMark06 macht AMD einen deutlichen Sprung, kommt jedoch nicht an den Core 2 Quad heran.

Benchmarkergebnis AMD Phenom: 3DMark06 CPU


Der CPU-Wert profitiert von den zusätzlichen Kernen.

PCMark05

Benchmarkergebnis AMD Phenom: PCMark05 gesamt


Nur knapp kann sich der AMD Phenom mit 4 Kernen vor den simulierten E6600 mit zwei Kernen setzen. Der Sprung vom K8 zum K10 ist hingegen sehr deutlich.

Benchmarkergebnis AMD Phenom: PCMark05 CPU


Beim CPU-Wert kann sich der K10 vom Core 2 Duo recht deutlich distanzieren.

Benchmarkergebnis AMD Phenom: PCMark05 Memory


Der Memory-Wert des Benchmarks liegt einmal mehr nur im Mittelfeld.
[break=Benchmarks: Aquamark3, Quake III, Doom3]
Aquamark 3
  • Hersteller: Massive Development
  • Webseite: www.aquamark3.com
  • Bereich: Grafik-Performance
  • Schwerpunkt: CPU-, FPU- und Speicher-Performance
  • Referenzen auf Planet 3DNow!: Suche...
  • Referenzen im Forum: Suche...

Benchmarkergebnis AMD Phenom: Aquamark3


Ebenso wie bei 3DMark01 ist gegen den Core 2 kein Kraut gewachsen. Den K8 lässt der Phenom jedoch klar hinter sich.

Quake III Arena

Benchmarkergebnis AMD Phenom: Quake 3 (640x480)


Benchmarkergebnis AMD Phenom: Quake 3 (1024x768)


Quake 3 zeigt einmal mehr das Bild, welches wir bereits mehrfach hatten. Gegen den Athlon sieht der Phenom gut aus, kommt aber nicht an die Werte des Core 2 heran.

Doom 3
  • Hersteller: id Software
  • Infoseite: auf Planet 3D Games
  • Bereich: Gaming
  • Schwerpunkt: Grafik-Performance (Grafikkarten lastig)
  • Referenzen auf Planet 3DNow!: Suche...
  • Referenzen im Forum: Suche...

Benchmarkergebnis AMD Phenom: Doom3 (1024x768)


Benchmarkergebnis AMD Phenom: Doom3 (1280x1024)


Benchmarkergebnis AMD Phenom: Doom3 (1600x1200)


Doom 3 liefert das gleiche Bild wie Quake 3. Gegenüber dem Vorgänger ein großer Sprung, gegen den Core 2 ein ebenso großer Rückstand.
[break=Benchmarks: UT2004, Crysis CPU-Benchmark]
Unreal Tournament 2004
  • Hersteller: Digital Extremes
  • Infoseite: auf Planet 3D Games
  • Bereich: Gaming
  • Schwerpunkt: Grafik-Performance (CPU-Lastig)
  • Referenzen auf Planet 3DNow!: Suche...
  • Referenzen im Forum: Suche...

Benchmarkergebnis AMD Phenom: UT2004 (1024x768)


Benchmarkergebnis AMD Phenom: UT2004 (1280x1024)


Benchmarkergebnis AMD Phenom: UT2004 (1600x1200)


Ein weiteres mal zeigt sich das Bild des Performance-Rankings. Erst Core 2, dann K10 und abschließend K8.

Crysis
  • Hersteller: Crytek GmbH
  • Infoseite: www.Crysis-Game.com
  • Bereich: Gaming
  • Schwerpunkt: Grafik-Performance (CPU-Lastig)
  • Referenzen auf Planet 3DNow!: Suche...
  • Referenzen im Forum: Suche...

Benchmarkergebnis AMD Phenom: Crysis CPU-Benchmark (1024x768)


Eine Auflösung von 1024x768 ist bei Crysis faktisch die höchste Auflösung, bei der von einer CPU-Limitierung gesprochen werden kann. Hier schließt der K10 die Lücke zwischen K8 und Core 2.

Benchmarkergebnis AMD Phenom: Crysis CPU-Benchmark (1280x1024)


Benchmarkergebnis AMD Phenom: Crysis CPU-Benchmark (1600x1200)


Je höher die Auflösung, desto geringer der Abstand zum Core 2 Quad. Bei 1600x1200 sind beide CPUs faktisch gleichauf.
[break=Benchmarks: BOINC, wPrime]
BOINC
  • Hersteller: Universität Berkeley
  • Webseite: www.BOINC.Berkeley.edu
  • Bereich: Distributed Computing
  • Schwerpunkt: CPU-Performance
  • Referenzen auf Planet 3DNow!: Suche...
  • Referenzen im Forum: Suche...

BOINC floating point MIPS (Whetstone) (gesamte CPU)

Benchmarkergebnis AMD Phenom: BOINC floating point MIPS (Whetstone) - gesamte CPU


BOINC floating point MIPS (Whetstone) (pro Kern)

Benchmarkergebnis AMD Phenom: BOINC floating point MIPS (Whetstone) - pro Kern


Im BOINC-Benchmark (genauer bei der BOINC floating point Berechnung) zeigt sich der K10 von seiner besten Seite.

BOINC integer MIPS (Dhrystone) (gesamte CPU)

Benchmarkergebnis AMD Phenom: BOINC integer MIPS (Dhrystone) - gesamte CPU


BOINC integer MIPS (Dhrystone) (pro Kern)

Benchmarkergebnis AMD Phenom: BOINC integer MIPS (Dhrystone) - pro Kern


Im krassen Gegenzug dazu muss sich der K10 bei den integer MIPS (Dhrystone) selbst einem K8 geschlagen geben.

wPrime
  • Hersteller: wPrime
  • Webseite: www.wPrime.net
  • Bereich: Distributed Benchmarks
  • Schwerpunkt: CPU-Performance
  • Referenzen auf Planet 3DNow!: Suche...
  • Referenzen im Forum: Suche...

wPrime 32M

Benchmarkergebnis AMD Phenom: wPrime 32M


wPrime 1024M

Benchmarkergebnis AMD Phenom: wPrime 1024M


wPrime ist einer der wenigen Benchmarks, der überhaupt von Multicores profitiert. Hier kann sich der K10 wieder gekonnt in Szene setzen.
[break=Leistungsaufnahme]
Leistungsaufnahme AMD Phenom: Idle


Bei der Leistungsaufnahme im Ruhezustand kann der Phenom gegenüber dem Core 2 Quad punkten.

Zu beachten ist, dass sich die Leistungsaufnahme zwischen Q6600 und simuliertem E6600 nicht unterscheidet, weil die Prozessorkerne nur softwareseitig abgeschalten werden. Weder Windows noch Software nutzt sie, sie laufen jedoch im idle-Zustand immer mit.

Leistungsaufnahme AMD Phenom: Last


Auch unter Last liegt der Phenom vor dem Core 2 Quad, wenn auch nur knapp.

In einigen anderen Tests wurde dem Phenom eine höhere Leistungsaufnahme bescheinigt als dem Core 2 Quad. Bei uns ist das zwar nicht der Fall, dennoch muss die Aussage nicht falsch sein. Für unser Intel-System haben wir ein Asus P5K Deluxe verwendet. Dieses Mainboard ist nicht unbedingt als das sparsamste Exemplar bekannt, weshalb es hier unter Umständen für eine höhere Leistungsaufnahme gegenüber dem verwendeten AM2+ -Mainboard sorgt.
[break=Overclocking und Cache-Latenzen]
An dieser Stelle wollten wir eigentlich einen Screenshot eines möglichst hohen Prozessortaktes präsentieren. Jedoch haben wir das Unterfangen gleich von Anfang an unterlassen, als wir feststellen mussten, dass eine Taktrate von 2,4 GHz bei Standardspannung nicht stabil war und ein Kern Fehler in Prime95 verursachte. Mit einer Erhöhung der VCore auf 1,3 Volt konnten die Fehler behoben werden.

Demnach ist die verwendete Taktrate von 218x11 die höchste, welche wir mit unserem Exemplar erreicht haben (ohne mehr zu probieren). Zwar wäre mit Sicherheit noch etwas mehr möglich gewesen, allerdings wollten wir dem geliehenen Phenom keine hohe Spannung zumuten.

Titelbild Phenom-Launch


Titelbild Phenom-Launch


Titelbild Phenom-Launch


Interessant bei einem Blick auf die Latenzzeiten der Caches des Phenom ist, dass AMD die Wartezyklen beim Zugriff auf den L2-Cache gegenüber den letzten K8 G-Stepping CPUs in 65 nm Bauweise wieder von 20 Takte auf 15 Takte reduzieren konnte, nachdem AMD sie gegenüber den älteren F-Steppings zuerst von 12 auf 20 erhöht hatte. Beim Zugriff auf den L3-Cache dagegen dürfen die Kerne bereits mit längeren Wartezeiten rechnen. Hier liegen wir im Bereich von einem Drittel der Latenzen eines Speicherzugriffs.
[break=Fazit]
Titelbild Phenom-Launch


Eineinhalb Wochen nach dem offiziellen Launch konnten wir endlich ein paar Fragen zur Performance des AMD Phenom K10 beantworten. So lange hat es nämlich gedauert, bis wir in der Lage waren, einen Prozessor in die Finger zu bekommen. Nicht, weil wir nicht eher wollten, sondern weil wir bisher kein Sample von AMD bekommen haben (heute nach Fertigstellung des Artikels ist dann das AMD-System angekommen). Dank der großartigen Unterstützung der Topas GBS Datentechnik GmbH in Cottbus bekamen wir die Möglichkeit erste Schritte mit dem AM2+ zu unternehmen.

Wenden wir uns einmal der Gleichung auf dem oben gezeigten Bild zu. Ist AMD mit der Kombination aus dem AMD 790FX und dem Phenom X4 der große Wurf gelungen? Oder handelt es sich vielmehr um Anspruch als um Wirklichkeit?

Die Frage, ob der K10 eine gute CPU ist, kann man aus zwei Richtungen betrachten. Die erste Sichtweise ist dabei die aus Richtung des Intel Core 2 Quad. Vergleicht man dabei den Phenom mit einem Core 2 Quad bei gleicher Taktrate, so zeigt sich ein mehr oder weniger uneinheitliches Bild. Viele Anwendungen werden von Intels Core-Architektur dominiert (3DMark, Cinebench, SiSoft Sandra), bei einigen schlägt das Pendel in Richtung AMD aus (WinRAR, Sciencemark Speicherbandbreite).

Die Kehrseite ist die Sichtweise aus Richtung der Vorgänger-Architektur K8. Betrachtet man den K10 so, wird man feststellen, dass in fast allen Belangen ein mehr oder minder deutlicher Performance-Sprung zu beobachten ist. Zwar gibt es auch einige Negativbeispiele (Cinebench 9.5 1 Core, BOINC integer MIPS) wo der Phenom pro Core langsamer ist als sein Vorgänger, die Anzahl dieser Beispiele ist aber gering.

Offen bleibt die Frage, wie die Performance des Phenom in Verbindung mit DDR2-1066 aussehen würde. Leider verweigerte unser Testsystem komplett den Dienst, als wir entsprechende Einstellungen vornehmen wollten. Wir hoffen, dass wir diese Frage in den nächsten Wochen nachträglich beantworten können. Es ist aber davon auszugehen, dass der K10 durch die Erhöhung des Speichertaktes weiter Boden auf den Core 2 Quad gutmachen wird, da er diesbezüglich architekturbedingt im Vorteil ist (Stichwort integrierter Speichercontroller).

Das derzeit größte Problem beim Phenom dürfte die BIOS-Unterstützung der Mainboards sein. Allen Orten liest man immer wieder von Zipperlein, welche die AM2+ -Mainboards noch plagen. Einstellung X funktioniert nicht (wie wir auch feststellen mussten), Setting Y führt zu Instabilität, Option Z lässt sich nicht verstellen. Dabei ist eine reibungslos funktionierende Plattform entscheidend für den Erfolg oder Misserfolg einer neuen Prozessorarchitektur.

Kommen wir von der größten Baustelle zum größten Vorteil des Phenom: seine Abwärtskompatibilität. Besitzer einer AM2-Plattform können ohne Mainboardwechsel auf den K10 umsteigen. Zwar sind in dieser Konstellation nicht alle Features des Phenom nutzbar (unterschiedliche Taktung der Kerne, DDR2-1066-Unterstützung), dennoch ist ein Prozessorupgrade zur nächsten Generation ohne Mainboardwechsel in der heutigen Zeit bares Geld wert. Voraussetzung hier: Ein BIOS-Update des Mainboards. Leider trennt sich auch hier die Spreu vom Weizen, denn es wird nicht für alle Hauptplatinen ein entsprechendes Update geben (nähere Informationen zur Phenom-Unterstützung bei AM2-Mainboards sind in unserem Sammelthread-Forum zu finden).

Insgesamt sind sowohl beim größten Vorteil als auch beim aktuell größten Manko die BIOS-Programmierer gefragt. Ihre Arbeit sollte schnellstmöglich Früchte tragen, um eine solide Plattform für den K10 bereitzustellen.

Was AMD nun noch zum Glück fehlt, ist ein fehlerfreies Stepping (Stichwort TLB-Erratum), welches den Weg für höher getaktete Modelle freimacht. Der etwas niedrigere Takt von 2,2 GHz beim Phenom 9500 bzw. 2,3 GHz beim Phenom 9600 ändert allerdings nichts an der Tatsache, das Preis und Leistung beim Phenom durchaus stimmen. Zusammen mit dem Faustpfand, bei einem Umstieg möglicherweise auf den Kauf eines neuen Mainboards verzichten zu können, kann sich der Phenom durchaus auch mit einem Q6600 aus Preis-/Leistungssicht messen (siehe Phenom-Preisvergleich).

Wenn AMD mit kommenden Steppings (das B3-Stepping soll Ende des ersten Quartals 2008 erscheinen) auch höhere Taktraten erreichen kann und die zu Tage getretenen Fehler der Plattform beseitig sind, dann steht einem Erfolg des Phenom in seiner Marktnische wohl nichts mehr im Wege. Gleichzeitig ist aber Grundvoraussetzung für die Entscheidung bei einem komplett neuen System eine preislich attraktivere Positionierung gegenüber der Konkurrenz aus Santa Clara. Momentan sind die boxed Varianten von AMD Phenom 9500 und Intel Core 2 Quad Q6600 beide für knapp 205 Euro erhältlich.

Wir hoffen, mit unserem ersten Artikel zum AMD Phenom etwas Licht ins Dunkel gebracht zu haben. Die neue Plattform wird uns selbstverständlich in der Zukunft begleiten und es werden noch einige Aspekte durch uns näher betrachtet werden.

...weitere Artikel
...diesen Artikel im Forum diskutieren


Links zum Thema: