Titelbild zum C1E - Der Transferratenkiller

Drehen wir die Zeit um ein paar Monate zurück: Anfang November letzten Jahres stellte AMD das neue C3-Stepping des Phenom II vor. Auch wir bekamen ein Sample in Form des AMD Phenom II X4 965 Black Edition zusammen mit ein paar spärlichen Informationen. So konnten wir den Unterlagen nur entnehmen, dass es Verbesserungen beim C1E-Management gibt, da dieses Stromsparfeature mit dem C3 in Hardware unterstützt wird. Mehr konnten wir nicht ableiten. Zudem legte man seitens AMD den Fokus auf die Verringerung der TDP von 140 auf 125 Watt. Und genau nach diesen Informationen richteten wir unseren Artikel zum Launch aus.

In den Kommentaren zum Review fragten uns einige User, wie sich die Transferraten von USB und Co. mit dem C3-Stepping verhalten, wenn C1E aktiviert wird. Denn nach den Aussagen der User resultierte genau das in einer teils drastischen Verlangsamung der Transferraten, wenn bei einem Prozessor mit C2-Stepping das Stromsparfeature aktiviert wurde. Auf die Fragen hatten wir keine Antwort parat. Allerdings nahmen wir diese Situation zum Anlass, um über einen entsprechenden Vergleichsartikel nachzudenken.

Im heutigen Artikel möchten wir uns nun (endlich) mit diesem Thema auseinandersetzen, wenn auch anders, als ursprünglich geplant.

Viel Vergnügen beim Lesen!
[break=Anspruch und Wirklichkeit]

Umfang der Tests

Vor der Durchführung unserer Tests steht logischerweise immer eine Planung. Was muss unbedingt getestet werden? Welche Aspekte sind interessant? Diese Frage führte im Falle der C1E-Problematik aber schnell zu der Erkenntnis, dass wir leider nicht all das testen können, was wir gerne testen würden.

In erster Linie stand natürlich der Vergleich zwischen C2- und C3-Stepping der Phenom II-Prozessoren im Vordergrund. Doch sofern tatsächlich der Einbruch der Transferleistung erfolgt, wenn C1E aktiviert wird (genau so, wie es unsere Leser beschreiben), so steht als nächstes die Frage im Raum, ob Mainboards mit ATI- und NVIDIA-Chipsatz identisch reagieren. Möglicherweise hat der Chipsatz diesbezüglich ebenfalls eine Mitschuld, denn SATA, USB und PCI werden direkt über den Chipsatz realisiert, sodass dessen Mitwirkung nicht kategorisch ausgeschlossen werden darf.

Interessant wäre auch das Verhalten bei verschiedenen Betriebssystemen. Windows XP ist noch immer auf vielen PCs zu finden, Windows Vista und Windows 7 werden jedoch mittlerweile wesentlich besser "gepflegt". Daher sind Unterschiede schon fast vorprogrammiert. Hinzu kommt, dass es für Windows Vista und Windows 7 C1E-Updates gibt, die Verbesserungen mit sich bringen (sollen).

Das Gefühl sagte uns, dass wir bei Betrachtung aller denkbaren Konstellationen viel zu tun hätten. Um nicht blindlings ins Verderben zu laufen, brachten wir alle Szenarien kurz zu Papier um dann festzustellen, dass wir den Rotstift ansetzen müssen. Alle Konstellationen zusammen hätten mindestens 768 Bootvorgänge, 960 Benchmarks mit insgesamt 2016 Einzelergebnissen bedeutet - ein Umfang, den man als "Freizeit-Tester" nicht stemmen kann wenn man noch ein richtiges Leben "nebenbei" hat.

Die Wahl des Mainboards

Leider befindet sich in unserem Portfolio auch kein Mainboard, welches einen NVIDIA-Chipsatz mitbringt und C1E korrekt implementiert hat. Wir fragten also bei einem Hersteller bezüglich einer Leihstellung an, konnten jedoch keinen Erfolg verbuchen. Es musste also bei einem AMD-basierten Mainboard bleiben. Doch bei welchem?

Zur Auswahl standen ein Gigabyte GA-MA790XT-UD4P, welches seit fast einem Jahr für unsere Prozessor-Tests zum Einsatz kommt oder das im Juli 2009 getestete ASUS Crosshair III Formula. Anfragen bei beiden Herstellern bezüglich C1E brachten jedoch zu Tage, dass ASUS hier einen eigenen Weg geht. Was genau man bei der Implementierung des Stromsparfeatures anders macht, konnten wir nicht herauskitzeln. Jedoch entspricht die Umsetzung nicht der des BIOS and Kernel Developer's Guide (BKDG) von AMD. Gigabyte hingegen setzt C1E nach eigenen Angaben gemäß des Guides um, sodass die Wahl logischerweise auf das GA-MA790XT-UD4P fiel. Einziger Wermutstropfen: Dieses Mainboard besitzt keinen "echten" eSATA-Port.

Gigabyte verbaut auf dem GA-MA790XT-UD4P (übrigens ein Mainboard mit AMD 790X-Chipsatz samt Southbridge SB750) einen Gigabyte SATA2-Chip, welcher auf einem JMicron JMB363 basiert. Solch ein Zusatzchip kommt auf diversen Mainboards zum Einsatz. Dabei handelt es sich um einen per PCI Express angebundenen Chip, welcher zwei SATA- oder optional eSATA-Ports bereitstellt. Gigabyte geht auf dem GA-MA790XT-UD4P den Weg, dass man sich eSATA spart und stattdessen zwei zusätzliche SATA-Ports bereitstellt. Allerdings kann man mit einer beiliegenen Slotblende einen beliebigen SATA-Port nach außen führen und hat so künstlich einen eSATA-Anschluss. Genau das haben wir getan und den Gigabyte SATA2-Chip aka JMB363 für eSATA-Tests genutzt.

Der Test

Aufgrund der beschriebenen Problematiken in Bezug auf den Testumfang und die Testhardware führten wir alle Benchmarks und Messungen ausschließlich unter Windows Vista durch. Sowohl ein Prozessor im C2- als auch im C3-Stepping wurde jeweils mit deaktiviertem C1E, aktiviertem C1E sowie aktiviertem C1E samt KB974090-Update durch die Benchmarks geschickt. Alle Tests wurden dreifach durchlaufen und anschließend der Mittelwert berechnet. Betrachtet wurden die Transferraten von SATA, eSATA, IDE, PCI, USB und LAN - also alle wichtigen I/O-Raten. Dies bedeutet insgesamt sechs unterschiedliche Konstellationen, die sich in sechs Balken in den Ergebnisdiagrammen niederschlagen. Die Blautöne stehen dabei für die Ergebnisse des C3-Steppings, das C2-Stepping wird in Grautönen dargestellt.

Im Normalfall führen wir Prozessorvergleiche immer bei identischen Einstellungen in Bezug auf den Takt und die Betriebsspannung durch. Für den heutigen Test sind wir jedoch von dieser Praxis abgewichen und haben beide Prozessoren jeweils mit ihren Standardwerten betrieben. Erstens, weil die Auswirkungen der Prozessorgeschwindigkeit de facto keinen Einfluss auf die Transferraten haben und zweitens, weil wir dem Mainboard-BIOS den alleinigen Einfluss über C1E übertragen wollten.
[break=Das Testsystem im Überblick]
Die verwendete Hardware auf einen Blick:
  • Mainboard: Gigabyte GA-MA790XT-UD4P (BIOS F7)
  • Prozessoren:
    • AMD Phenom II X4 955 BE (C2-Stepping)
    • AMD Phenom II X4 965 BE (C3-Stepping)
  • Kühler: OCZ Vendetta 2
  • Arbeitsspeicher: 4x 2 GByte Corsair PC3-12800 (9-9-9-27 2T, 1,60 Volt)
  • Grafikkarte: NVIDIA 9800 GTX
  • Netzteil: Seasonic S12-650
  • Festplatten:
    • Seagate ST3250410AS (SATA, 7.200 u/min, Betriebssystem)
    • Maxtor 6E040L0 (IDE, 7.200 u/min)
    • 2x Maxtor 4D080H4 (IDE, 5.400 u/min, Raid0 am STLab PCI-Raidcontroller)
    • Hitachi P7K500 (SATA, 7.200 u/min, per USB bzw. eSATA angeschlossen)
  • Gehäuse: Chieftec Mesh CH-01 Midi-Tower
  • Energiemessgerät: Voltcraft Energy Monitor 3000

Auf der Software-Seite sieht das System so aus:

verwendete Software / TreiberVersion / Bemerkungen
Windows Vista Ultimate
64 Bit, Service Pack 2
DirectX
10, Juni-Update 2008
Windows Update
KB974090, C1E-Patch
Grafikkartentreiber
ForceWare 185.85
Prozessortreiber
aktuelle Version, nur bei Bedarf
Chipsatz-/Mainboardtreiber
aktuelle Version des Herstellers
Prime95
25.9, 64 Bit
HDTune
2.55
netio
netio für Windows, Version 126

[break=HDTune (IDE, SATA)]
Für die Messung der Schnittstellen-Performance nutzen wir das kostenlose Tool HDTune in der Version 2.55. HDTune lässt eine sehr detaillierte Sicht der Dinge zu, wobei wir uns im Normalfall auf die Kernaspekte der Burst-Rate sowie die Prozessorauslastung konzentrieren. Heute aber nutzen wir für unseren C1E-Artikel zusätzlich noch die Angabe der durchschnittlichen Transferrate. Bei unseren Mainboardtests war diese Angabe bisher nicht relevant, da es de facto keine Unterschiede gibt. Doch bei der Nutzung von C1E sind sehr wohl Differenzen erkennbar, weshalb wir auch diesen Aspekt begutachten.

HDTune


IDE-Performance

HDTune: IDE Average


Wie man sieht, gibt es keine Unterschiede zu verzeichnen. Weder reagieren das C2- und C3-Stepping unterschiedlich noch gibt es Differenzen bei Aktivierung von C1E. Hier gibt es also keine Auffälligkeiten.

HDTune: IDE Burst


Anders sieht das Bild bei der IDE Burst-Rate aus. Das C3-Stepping ist generell minimal schneller als das C2-Pendant und bricht bei Aktivierung von C1E auch nicht ein, wie es das C2-Stepping tut. Besagter C2-Prozessor verliert etwa 20 Prozent, ist also rund ein Fünftel langsamer.

HDTune: IDE Prozessorlast


Auch in Sachen Prozessorlast gibt es deutliche Unterschiede zwischen C2- und C3-Prozessoren. Während der C3 bei Aktivierung von C1E einen Hauch besser abschneidet, so verliert er mit dem Windows-Patch wiederum leicht. Das C2-Stepping profitiert mit aktiviertem C1E deutlich in puncto Prozessorlast und auch der Windows-Patch bringt noch eine leichte Verbesserung.

SATA-Performance

HDTune: SATA Average


Kurioses gibt es bei der durchschnittlichen SATA-Transferrate zu berichten. Aktiviert man C1E bei unserem C3-Prozessor, so wird er (im Bereich der Messgenauigkeit) einen Tick schneller als ohne Stromspareinstellung. Und selbst der C1E-Patch für Windows Vista bringt noch eine leichte Verbesserung. Das C2-Stepping verlangsamt sich bei aktiviertem C1E hingegen etwas, kann aber dank Windows-Patch wiederum einen Teil zurückgewinnen.

HDTune: SATA Burst


Bei der SATA Burst-Rate steht das C3-Stepping wieder On Top. Allerdings auch hier mit einer unerwarteten Reihenfolge. Denn während die Aktivierung des Stromsparmechanismus zu einer geringen Verlangsamung führt, so ist der Performanceanstieg durch das Windows-Update so deutlich, dass es zum absoluten Spitzenplatz reicht. Einmal mehr muss sich das C2-Stepping mit einem Performanceverlust herumschlagen, wenn es um das Stromsparen geht. Wieder gehen rund 20 Prozent verloren, auch das Update KB974090 hilft hier nicht.

HDTune: SATA Prozessorlast


Wieder bringt C1E beim C2-Stepping eine gesenkte Prozessorlast mit sich, der C1E-Patch kann hier aber nicht punkten. Allerdings dürfte die verringerte Prozessorlast auch durchaus mit der verringerten Burst-Rate zu tun haben, denn schließlich hat das System hier weniger zu tun. Beim C3-Stepping tut sich in puncto Prozessorlast hingegen nicht viel, hier sind alle Einstellungen sehr dicht beieinandern.
[break=HDTune (PCI, USB, eSATA)]
PCI-Performance

HDTune: PCI Average


Bei der durchschnittlichen Transferrate unseres PCI-Raidverbundes gibt es keine Unterschiede. Alle Konstellationen befinden sich innerhalb von 0,1 MByte je Sekunde - Messungenauigkeit par excellence.

HDTune: PCI Burst


Anders sieht das Bild in puncto Burst-Rate aus. Das C3-Stepping führt das Diagramm an (unabhängig davon, ob C1E aktiviert ist oder nicht), das C2-Stepping muss abermals einen deutlichen Performanceeinschnitt von etwa 15 Prozent hinnehmen.

HDTune: PCI Prozessorlast


Wieder zeigt sich, dass C1E beim C2-Stepping zu einer geringeren Prozessorlast führt, beim C3-Stepping tut sich diesbezüglich recht wenig.

USB-Performance

HDTune: USB Average


Auch bei der durchschnittlichen USB-Transferrate krankt das C2-Stepping deutlich, wenn das Stromsparfeature C1E aktiviert wird. Rund 30 Prozent Leistung gehen verloren, der C1E-Patch macht die Sache sogar noch einen Tick schlechter. Beim C3-Stepping gibt es keine Unterschiede zwischen C1E Enabled und Disabled, lediglich KB974090 macht auch hier das Ergebnis etwas schlechter.

HDTune: USB Burst


Auch beim Burst verringert sich die Leistung des C2-Steppings deutlich, hier um rund ein Viertel. Das C3-Stepping ist hingegen unbeeindruckt vom Stromsparsetting.

HDTune: USB Prozessorlast


Erneut bedeutet C1E beim C2-Stepping eine deutlich niedrigere Prozessorlast. Und wieder macht das Windows-Update die Situation etwas schlechter. Beim C3-Stepping tut sich in Sachen Prozessorlast hingegen wenig.

eSATA-Performance

HDTune: eSATA Average


Premiere während unserer Tests: Auch das C3-Stepping kann bei aktiviertem C1E mit verringerten Transferraten aufwarten. Während ohne C1E beide Prozessorsteppings identische Ergebnisse abliefern, so verliert das C3-Stepping mit C1E sogar noch einen Tick mehr an Leistung (rund 10 Prozent) als das mit den rund 9 Prozent beim C2-Stepping der Fall ist. Konstant bleibt jedoch die Tatsache, dass der C1E-Patch für minimal schlechtere Ergebnisse sorgt.

HDTune: eSATA Burst


Anders sieht es jedoch beim Burst aus. Hier zeigt sich C3 völlig unbeeindruckt vom jeweiligen Setting, das C2-Stepping muss hingegen mit einem drastischen Performanceeinbruch von über 40 Prozent leben. Da kommt es auf den minimalen Verlust mit KB974090 auch nicht mehr an...

HDTune: eSATA Prozessorlast


Auch der Blick auf das vorangegangene Diagramm ist mehr als interessant. Doch der Reihe nach. Das C2-Stepping kann trotz drastisch niedrigerer Burst-Rate kaum Verbesserungen in puncto Prozessorlast aufweisen. Dagegen verdreifacht sich die Prozessorlast beim C3-Stepping fast, wenn C1E ins Spiel kommt - Betriebssystem-Patch hin oder her.
[break=netio]
Mit netio lässt sich die Bandbreite auf Basis des TCP/IP-Protokolls überprüfen. Das Ergebnis wird dabei in KByte/s sowohl für das Senden als auch das Empfangen ausgegeben und lässt somit eine detailliertere Auswertung zu.

netio


Ein Gigabit-LAN-Anschluss kann per Definition maximal 128.000 KByte/s senden bzw. empfangen.

Netzwerkperformance

Netzwerkbandbreite Windows - Tx


Erneut macht das C2-Stepping negativ auf sich aufmerksam, wenn es ums Stromsparen geht. Rund 13 Prozent Leistung gehen verloren, wobei die Ergebnisse stark schwanken. Teilweise stehen nur rund 85.000 KByte/s zu Buche, im Spitzenfall waren es 105.000 KByte/s. Das C3-Stepping zeigt sich bei diesem Test unbeeindruckt von C1E.

Netzwerkbandbreite Windows - Rx


Gleiches Bild im zweiten Teiltest: Auch hier bricht die Performance deutlich ein, diesmal um etwa ein Viertel. Der C1E-Patch verbessert die Lage ein wenig, kann das Ruder aber nicht mehr herumreißen. Das C3-Stepping ist wiederum die Konstanz in Person.

Für die Messung der Prozessorlast verwenden wir die Windows Leistungsanzeige. Der netio-Benchmark wird dafür mit allen vorgefertigten Paketgrößen durchgeführt (1k, 2k, 4k, 8k, 16k, 32k), was etwa eine Minute dauert. Während dieser Zeit messen wir die durchschnittliche Prozessorauslastung.

Prozessorlast Netzwerkverkehr Windows


In Sachen Prozessorlast zeigt sich einmal mehr eine deutliche Verringerung, wenn das Stromsparfeature C1E aktiviert wird - zumindest beim C2-Stepping. Beim C3-Stepping fällt der Unterschied geringer aus, ist aber vorhanden. Allerdings verschlechtert sich die Situation des C3-Prozessors wieder, wenn der C1E-Patch genutzt wird.
[break=Leistungsaufnahme]
Obwohl wir im heutigen Artikel ausschließlich die Transferraten begutachtet haben, wollen wir dennoch jeweils drei Messungen zur Leistungsaufnahme vornehmen. Denn schließlich haben wir in allen bisherigen Diagrammen gesehen, dass die Wirkung des Betriebssystem-Patches KB974090 eher zweifelhaft ist. Aber vielleicht bewirkt der Patch ja zumindest, dass die Leistungsaufnahme sinkt? Aus diesem Grund messen wir die Leistungsaufnahme des Gesamtsystems jeweils unter Last sowie im Idle-Betrieb (Cool'n'Quiet Enabled und Disabled) mittels des Voltcraft Energy Monitor 3000.

Leistungsaufnahme Prime95 64 Bit


C1E hat keine Auswirkungen auf die Leistungsaufnahme, wenn die CPU belastet wird. Ein Watt mehr mit C1E-Patch stehen zwar beim C2-Stepping zu Buche, diese Abweichung ist jedoch zu vernachlässigen, da es sich in drei Messungen nur um ein Watt Differenz handelte, welches letztendlich eine andere Rundung bei der Mittelwertberechnung zur Folge hatte. Die Unterschiede zwischen C2- und C3-Stepping ergeben sich lediglich aus den unterschiedlichen Einstellungen bezüglich Takt und VCore.

Leistungsaufnahme Idle ohne Cool'n'Quiet


Im Idle-Betrieb ohne Cool'n'Quiet spart C1E beim C2-CPU fünf und beim C3-Prozessor derer acht Watt. Der C1E-Patch hat keinerlei Auskwirkungen.

Leistungsaufnahme Idle mit Cool'n'Quiet


Mit aktiviertem Cool'n'Quiet zeigt sich beim C3-Prozessor eine Einsparung von acht Watt, beim C2-Stepping sind es immerhin noch sechs Watt. Wieder zeigt sich der fehlende Einfluss des C1E-Patches auf das Ergebnis der Leistungsaufnahme. Zwar steht auch hier ein Watt Differenz beim C2-Stepping zu Buche, wieder ist es aber ein Watt bei einer Messung, welches zu einer anderen Rundung bei der Mittelwertberechnung führt.

Abschließend lässt sich sagen, dass das von Microsoft bereitgestellte Windows Update KB974090 für die heutigen Messungen keinen nennenswerten Einfluss auf die Testergebnisse hat.
[break=Fazit]
Titelbild zum C1E - Der Transferratenkiller


Beinahe drei Monate nach dem Launch des C3-Steppings der Phenom II-Prozessoren haben wir auf den letzten Seiten hoffentlich die Fragen beantwortet, die einigen Usern von Anfang an unter den Nägeln gebrannt haben. Wider besseren Wissens bzw. aufgrund einer anderen Ausrichtung des Launch-Reviews vom November mussten wir die Antworten bisher schuldig bleiben. Aber besser spät als nie!

Unsere Testergebnisse bieten gute, aber auch schlechte Nachrichten. Die schlechte ist, dass alle User eines Phenom II-Prozessors mit C2-Stepping genau überlegen sollten, ob sie das Stromsparfeature C1E aktivieren oder nicht. Denn wird es aktiviert, so zeigt sich generell eine verringerte Prozessorlast beim Datenverkehr, die Transferraten brechen teilweise aber drastisch ein. So fehlen plötzlich rund 20 Prozent beim IDE- sowie SATA-Burst, 15 Prozent beim PCI-Burst, rund 30 Prozent beim USB-Average sowie -Burst und sagenhafte 40 Prozent beim eSATA-Burst. Auch die Netzwerkleistung leidet und verringert sich um etwa 13 (senden) bzw. 25 Prozent (empfangen). Positiv ist die gleichzeitige Verringerung der Leistungsaufnahme im Idle-Betrieb, die nach unserer Meinung hingegen in keinem Verhältnis zur Verlangsamung der Transferraten steht.

Nun eine gute Nachricht: Das C3-Stepping merzt fast (!!) alle Unzulänglichkeiten aus. Fast überall zeigt sich unser Sample unbeeindruckt von der Aktivierung von C1E und funktioniert ohne Fehl und Tadel (und spart dabei noch Strom im Idle-Betrieb). Einzig die Leistung des eSATA-Anschlusses lässt zu wünschen übrig. Bei der durchschnittlichen Transferrate lässt die Leistung um etwa 10 Prozent nach (sogar noch minimal mehr als beim C2-Stepping), die Prozessorlast wird hingegen fast verdreifacht (6,7 gegenüber 2,5 Prozent). Fraglich ist aber, ob andere eSATA-Lösungen (z.B. anderer Zusatzchip oder ähnlich) ggf. anders reagieren. Bei allen anderen Transferraten weiß das C3-Stepping zu gefallen und kann unserer Meinung nach auch bedenkenlos mit aktiviertem C1E betrieben werden.

Im Zuge dieses Artikels haben wir zudem das von Microsoft für Windows Vista und Windows 7 bereitgestellte C1E-Update KB974090 getestet. Zumindest in unseren Tests lässt sich in fast keinem Fall eine Verbesserung der Situation erkennen - im Gegenteil. Wenn das Betriebssystem-Update einen Effekt erzielt, dann meist einen minimal negativen. Zumindest für uns ist daher der Einsatz des KB974090 zu überdenken.

The Good:
Das hat uns gefallen
  • deutliche Verbesserung der Situation mit AMDs C3-Stepping
The Bad:
Das hat uns weniger gefallen
  • stark problembehafteter C1E-Betrieb mit einem C2-Stepping-Prozessor
  • noch nicht ganz unproblematischer eSATA-Betrieb mit C3-Stepping


...weitere Artikel
...diesen Artikel im Forum diskutieren