Ergebnis 1 bis 1 von 1
  1. Beitrag #1
    Themenstarter
    Redaktion
    Redaktion
    Avatar von MusicIsMyLife
    • Mein System
      Notebook
      Modell: HP DV7-2225sg
      Desktopsystem
      Prozessor: Intel Core i7-5960X
      Mainboard: ASUS Rampage V Extreme
      Kühlung: EK Water Blocks EK-Supreme HF
      Arbeitsspeicher: 4x 8 GB G.Skill RipjawsV F4-3600C17D-16GVK (2 Kits)
      Grafikkarte: 2x ASUS GeForce GTX Titan X
      Display: 40" Philips BDM4065UC (3840x2160), 27" ASUS ROG Swift PG279Q (2560x1440)
      Festplatte(n): 2x Crucial M500 960 GB im Raid0 (Datenhalde), Crucial C300 256 GB (Windows und eigene Dateien)
      Optische Laufwerke: LG CH08LS10 Blu-ray Disc-Player
      Soundkarte: Sound Blaster Recon3D
      Gehäuse: Little Devil LD PC-V8 Reverse
      Netzteil: Enermax MaxRevo 1350 Watt
      Betriebssystem(e): Windows 10 Professional
      Browser: Firefox

    Registriert seit
    22.02.2002
    Ort
    in der Nähe von Cottbus
    Beiträge
    13.218
    Danke
    215
    Gedankt 1.756 Mal für 144 Themen
    Blog-Einträge
    1

    Vishera Reloaded


    Titelbild AMD Vishera Reloaded


    Als AMD Ende Oktober die neuen "Vishera"-Prozessoren vorstellte, war sich die Pressewelt weitestgehend einig: Aus Performance-Sicht sind die neuen CPUs durchaus gelungen und reduzieren den Leistungsrückstand auf die Intel-Konkurrenz um ein gutes Stück. Was allerdings überhaupt nicht gut ankam und noch immer nicht ankommt, ist die Leistungsaufnahme der Neulinge. Denn statt auch hier Fortschritte vorweisen zu können, stagniert die Entwicklung bzw. sind in einigen Teilen sogar kleine Rückschritte zu verzeichnen.

    Doch nicht nur über diese beiden Aspekte wurde bei uns im Forum (und natürlich auch in anderen Communities) diskutiert. So wurden über das Internet verteilt einige Fragen aufgeworfen, die wir in der Folgezeit aufgegriffen haben, um sie mit unseren eigenen Tests beantworten zu können. Hierzu zählt unter anderem die Frage nach Vorteilen neuerer AGESA-Codes, der Performance-Vergleich zwischen vier Threads auf vier Modulen mit vier Threads auf nur zwei Modulen, ein Überblick über die Performance mit verschiedenen Speichertakten und -timings sowie die Frage, ob der Turbo-Modus unseres FX-8350 individuell verbessert werden kann.

    All diese Aspekte haben wir ausgetestet und auf den kommenden Seiten für unsere Leser aufbereitet. Wir wünschen viel Vergnügen beim Lesen!
    [nextpage title="Das Testsystem"]
    Schauen wir uns zunächst an, wie unser Testsystem aussieht.

    Hardware
    • Prozessor: AMD FX-8350
    • Kühler: Noctua NH-C14 (bestückt mit dem oberen Lüfter)
    • Mainboards:
      • ASUS Crosshair V Formula-Z
      • Gigabyte GA-990FXA-UD7
      • ASUS Crosshair V Formula
      • Gigabyte GA-890FXA-UD5 Rev. 3.0
    • Arbeitsspeicher: 4x 4 GByte G.Skill RipjawsZ DDR3-1866 (9-10-9-28 2T)
    • Grafikkarte: ASUS Radeon HD 6970
    • Netzteil: Seasonic S12-650
    • Festplatte: Western Digital WD6400AADS (SATA, 7.200/min)
    • Gehäuse: DIMASTECH Bench-Table
    • Energiemessgerät: Voltcraft Energy Monitor 3000


    Natürlich haben wir nicht alle vier Mainboards gleichzeitig verwendet. In erster Linie kam das Crosshair V Formula-Z von ASUS zum Einsatz, welches wir auch bereits für unsere Tests beim "Vishera"-Launch verwendet haben. Für alle Tests mit abgeschalteten Threads haben wir auf das Gigabyte-Flaggschiff GA-990FXA-UD7 zurückgegriffen. Die anderen beiden Mainboards kamen ausschließlich zu Kompatibilitätstests zum Einsatz.

    Auf der Software-Seite sieht das System so aus:

    verwendete Software / TreiberVersion / Bemerkungen
    Windows 7 Ultimate
    64 Bit, Service Pack 1
    WinFuture Update-Pack
    2.16, August 2012
    DirectX
    11, Juni-Update 2010
    Grafikkartentreiber
    Catalyst 12.9 Beta
    CPU-Z
    1.61.3 x64
    GPU-Z
    0.6.4
    WinRAR
    4.20d x64
    XMPEG
    5.0.3
    XViD
    1.3.2
    Cinebench
    R11.5, 64 Bit
    Crysis
    Demo
    Crysis Benchmark Tool
    1.0.0.5
    Sleeping Dogs
    Steam-Version
    Adrenaline Sleeping Dogs-Benchmark-Tool
    1.0.0.3
    3DMark 11
    Advanced, Build 1.0.1, ohne Feature-Tests
    LinX
    0.6.4 (Non-AVX-Version)
    Prime95
    v27.6 Build 4 x64
    Steam
    1960 / v012


    Unser Test-Parcours soll einen guten Querschnitt durch den Alltagsbetrieb eines PCs bilden. 32 Bit- und 64 Bit-Anwendungen sind vertreten, ältere Software wechselt sich mit neuerer ab, Video-Encoding und Rendering sind vertreten und selbst synthetische Benchmarks spielen eine Rolle. Das alles sind Anwendungen, die im Alltag auftreten können, sie zeigen so einen guten Querschnitt durch das Anforderungsprofil eines heutigen PCs.

    Einstellungen

    Seit der Einführung der Turbo-CORE-2.0-Technologie bei den neuen FX-Prozessoren lässt sich verallgemeinernd sagen, dass Turbo nicht gleich Turbo ist. Denn je nach Einstellungen kann der Turbo-CORE-Modus zwar aktiv sein, aber nicht ideal arbeiten. Das ist zum Beispiel der Fall, wenn zwar Turbo CORE aktiviert ist, die C6-States hingegen deaktiviert bleiben. Dann zündet maximal die erste Turbo-Stufe, bei der alle Kerne gleichmäßig übertaktet werden, sofern der TDP-Spielraum ausreicht. Im Falle unseres FX-8350 wären dies 4,1 GHz, die volle Taktrate von 4,2 GHz würde dann nicht zum Einsatz kommen. Wir nutzen für unsere Benchmarks daher folgende Einstellungen:
    • Profil "Turbo CORE deaktiviert"
      • Cool'n'Quiet: deaktiviert
      • C1E: deaktiviert
      • C6-State: deaktiviert
      • Turbo CORE: deaktiviert
      • HPC Mode: deaktiviert
      • APM (sofern vorhanden): deaktiviert
    • Profil "Turbo CORE aktiviert"
      • Cool'n'Quiet: aktiviert
      • C1E: deaktiviert
      • C6-State: aktiviert
      • Turbo CORE: aktiviert
      • HPC Mode: deaktiviert
      • APM (sofern vorhanden): aktiviert

    Bei unseren Benchmark-Vergleichen ohne Turbo CORE nutzen wir somit die Standard-Taktrate unserer Prozessoren. In einer weiteren Benchmark-Reihe aktivieren wir den Turbo-Modus mit den oben verzeichneten BIOS-Einstellungen und können somit sicher sein, dass alle Turbo-Stufen greifen und das System mit den idealen Einstellungen läuft. C1E deaktivieren wir bei beiden Benchmark-Reihen, da es zwar in Sachen Leistungsaufnahme Verbesserungen bringen kann, gleichzeitig aber zu negativen Einflüssen auf die Performance führen kann. Zudem ist C1E für die korrekte Turbo-Funktion nicht notwendig.

    Messungen zur Leistungsaufnahme

    Die Leistungsaufnahme messen wir für das Gesamtsystem, jedoch ohne Monitor. Es werden ausschließlich die Grundkomponenten verwendet: Mainboard, CPU, RAM, Grafikkarte, DVD-Laufwerk, SATA-Festplatte mit Betriebssystem.
    [break=Mainboard-Kompatibilität]
    Während der Tests zum "Vishera"-Launch waren die neuesten BIOS-Versionen mit AGESA-Codes ausgestattet, deren Versionsnummern in der Regel mit 1.2. begannen. Mit dem offiziellen Launch wurden von den Mainboard-Herstellern jedoch flächendeckend neue BIOS-Versionen herausgebracht, die den AGESA-Code 1.5.0.0 beinhalteten – also die neueste, von AMD empfohlene Version. Zudem wurde bei den Release-Notes oftmals vermerkt, dass damit neue Prozessoren unterstützt werden würden. Das warf zwei Fragen auf:

    Gab es mit dem neuen AGESA-Code Auswirkungen auf die Performance? Und da wir bei unserem Launch-Review mit AGESA-Code 1.2.9.0 gearbeitet haben, wollten wir wissen, wie alt der Code noch sein konnte und dennoch den neuen FX-8350 unterstützte.

    Zuerst stürzten wir uns auf die Frage nach dem Alter des AGESA-Code. Dazu nahmen wir unsere insgesamt vier "Zambezi" unterstützenden Mainboards aus dem Schrank und installierten nacheinander jeweils den AMD FX-8350. Wir wollten wissen, ob das Mainboard mit der zuletzt für Tests des FX-8150 verwendeten BIOS-Version auch mit dem neuen Flaggschiff startet. Das Ergebnis liest sich wie folgt:

    Übersicht Mainboard-Kompatibilität


    Alle vier Mainboards hatten keinerlei Probleme mit der Verwendung des FX-8350. Der älteste AGESA-Code war dabei auf unserem Gigabyte GA-890FXA-UD5 Rev. 3.0 vorhanden. Selbst mit der Version 1.1.0.0 gab es keinerlei Auffälligkeiten und auch Cool'n'Quiet sowie der Turbo-Modus funktionierten anstandslos. Es war also bei keinem der vier verwendeten Mainboards notwendig, das BIOS für die Unterstützung des FX-8350 zu flashen. Deshalb gehen wir davon aus, dass alle Mainboards, welche bereits die "Zambezi"-Generation unterstützen, auch problemlos für "Vishera" genutzt werden können – auch ohne erneutes BIOS-Update. Selbstverständlich können wir hierfür keinerlei Garantie übernehmen. Unsere Testergebnisse lassen diesen Schluss jedoch zu.

    Auf der kommenden Seite haben wir das BIOS unseres ASUS Crosshair V Formula-Z auf eine BIOS-Version mit AGESA-Code 1.5.0.0 geflasht und überprüft, wie sich dadurch die Performance gegenüber dem Launch-Review verändert.
    [break=Performance mit neuem AGESA-Code]
    Bei WinRAR wird immer auf gleichem Weg getestet: Es wird ein ca. 4,5 Gigabyte großes RAR-Archiv mit gemischtem Inhalt geöffnet und anschließend der integrierte Benchmark laufen gelassen.

    WinRAR"


    Performance AGESA-Code - WinRAR


    Veränderung mit neuem AGESA-Code ja, Verbesserung nein. Sowohl mit als auch ohne Turbo-Modus gibt es leichte Abschläge in Sachen Performance.



    XMPEG nutzt mit dem aktuellen XViD-Codec kaum mehr als einen Prozessorkern und ist daher eher ein Dinosaurier in Sachen Videobearbeitung. Dennoch eignet sich das Programm gut dazu, die Performance aktueller Hardware bei wenigen Bearbeitungs-Threads zu vergleichen. Wir wandeln ein Referenz-Video um und messen dabei die benötigte Zeit.

    XMPEG



    Performance AGESA-Code - XMPEG + XViD


    Auch bei XMPEG gibt es kleine Rückschritte in Sachen Prozessorleistung.



    Das bekannte Renderprogramm Cinebench liegt in der aktuellen Version R11.5 vor. Cinebench basiert auf der Cinema-4D-Software von Maxon und ist zudem in einer 64-Bit-Version erhältlich, welche wir natürlich nutzen.

    Cinebench


    Performance AGESA-Code - Cinebench R11.5


    Hier tut sich de facto überhaupt nichts in Sachen Performance. Mit nur 0,01 Punkten Differenz vom schnellsten zum langsamsten Ergebnis kann man hier trotz mehreren Duchläufen durchaus von einem Unterschied im Rahmen der Messungenauigkeit sprechen.



    Obwohl die Benchmarks aus dem Hause Futuremark nicht ganz unumstritten sind (wir berichteten), gehören sie noch immer zu den beliebtesten Vergleichsmöglichkeiten. Futuremark bietet mit dem 3DMark 11 ein Programm an, das ausschließlich unter DirectX 11 läuft. Wir lassen 3DMark 11 im vorgefertigten Performance-Preset laufen (High- bzw. Extreme-Preset sind aufgrund der GPU-Limitierung nicht sinnvoll).

    3DMark 11 Performance


    Performance AGESA-Code - 3DMark 11 Performance Preset Gesamt


    In Sachen Gesamtergebnis gibt es einen minimalen Vorteil für den neuen AGESA-Code, wenn der Turbo-Modus deaktiviert wird. Mit aktiviertem Turbo-Modus hingegen gibt es leichte Einbußen, sodass auch hier kein nennenswerter Vorteil für die neue BIOS-Version entsteht.

    Performance AGESA-Code - 3DMark 11 Performance Preset Physik


    Im Physik-Test schieben sich die Ergebnisse mit neuem BIOS genau zwischen die Ergebnisse aus unserem Launch-Review. In diesem Teil-Test gibt es ohne Turbo-Modus leichte Einbußen, mit Turbo-Modus hingegen stehen ein paar Punkte mehr zu Buche.
    [break=Performance mit neuem AGESA-Code - Fortsetzung]
    Crysis ist ein Spiele-Klassiker aus NVIDIAs "The Way It's Meant to be Played"-Programm, welcher einen integrierten CPU-Benchmark in 64 Bit bietet. Wir lassen diesen Benchmark mit Hilfe des kostenlosen "Crysis Benchmark-Tools" hintereinander in den Auflösungen 1280x1024, 1600x1200 sowie 1920x1200 jeweils mit dem Detail-Level "High" laufen. Dazu nutzen wir den DirectX-9-Renderpfad.

    Crysis


    Performance AGESA-Code - Crysis 1280x1024


    Performance AGESA-Code - Crysis 1600x1200


    Performance AGESA-Code - Crysis 1920x1200


    Der Turbo-Modus kann dank AGESA-Code 1.5.0.0 überzeugen. Hier stehen auflösungsübergreifend geringfügig bessere Ergebnisse als mit Version 1.2.9.0 zu Buche. Ohne Turbo-Modus kann die neuere Version nicht so ganz überzeugen. Insgesamt geht es aber sehr eng zu.



    Als zweiter Vertreter der Spiele-Zunft kommt Sleeping Dogs zum Einsatz. Hierbei handelt es sich um einen Titel aus AMDs "Gaming Evolved"-Serie. Wieder kommen unsere drei bekannten Auflösungen zum Einsatz, genau wie der DirectX-11-Renderpfad. Die Performance wird mit Hilfe des Adrenaline Sleeping-Dogs-Benchmark-Tools gemessen.

    Sleeping Dogs


    Performance AGESA-Code - Sleeping Dogs 1280x1024


    Performance AGESA-Code - Sleeping Dogs 1600x1200


    Performance AGESA-Code - Sleeping Dogs 1920x1200


    In diesem Spiel kann die neue BIOS-Version durchgängig überzeugen. Sowohl mit aktiviertem als auch deaktiviertem Turbo-Modus stehen jeweils minimal bessere Ergebnisse im Diagramm als mit der älteren BIOS-Version.

    Insgesamt bringt der neuere AGESA-Code zwar Veränderungen mit sich, diese fallen jedoch äußerst gering aus. Hinzu kommt, dass einige Anwendungen profitieren, andere hingegen leicht verlieren.
    [break=Performance mit vier Threads]
    Auf dieser Seite möchten wir uns den Performance-Unterschied anschauen, welcher bei Nutzung von vier Threads auf vier Modulen bzw. vier Threads auf zwei Modulen entsteht. AMD gibt an, durch Verdoppelung der Register sowie der Integer-Einheiten, was etwa 20 Prozent des Flächenbedarfs eines "echten" Kerns bedeutet, ca. 80 Prozent der Performance eines Kerns erzielen zu können. Auf unsere Testreihe übertragen bedeutet dies, dass vier Threads, welche auf vier Modulen laufen (also je Thread die kompletten Ressourcen eines Moduls zur Verfügung stehen) schneller arbeiten können als vier Threads, die sich die Ressourcen von zwei Modulen teilen müssen. Vier Threads auf zwei Modulen sollen also etwa 90 Prozent der Leistung von vier Threads auf vier Modulen erreichen. So sind jedenfalls die Angaben von AMD zu verstehen. Werfen wir nun einen Blick auf die Praxis, für welche dieses Mal das Gigabyte GA-990FXA-UD7 zum Einsatz kommt:

    Performance mit vier Threads - WinRAR


    Je ein Thread pro Modul bedeutet im WinRAR einen deutlichen Performanceschub. Die zwei-Modul-Konfiguration ist jedoch mit rund 88 Prozent der Leistung knapp unter der von AMD prognostizierten Performance und kann sich damit nicht ganz so gut in Szene setzen.

    Performance mit vier Threads - XMPEG + XViD


    Unter XMPEG stehen für zwei Module 92 Prozent der Performance von vier Threads auf vier Modulen zu Buche. Damit zeigt sich das Modulkonzept hier von seiner besseren Seite.

    Das Ergebnis in XMPEG zeigt jedoch noch eine weitere Besonderheit, welche nicht aus dem Diagramm hervorgeht: In Normalkonfiguration (also acht Threads auf vier Modulen) dauert der XMPEG-Benchmark zwischen 185 Sekunden (Turbo CORE aktiviert) und 191 Sekunden (Turbo CORE deaktiviert). Beide Konfigurationen mit vier Threads unterbieten dieses Ergebnis mehr als deutlich. Zuerst hatten wir hier das verwendete Gigabyte-Mainboard in Verdacht. Doch wir mussten schnell feststellen, dass es tatsächlich an den zur Verfügung stehenden Ressourcen liegt. Denn aktiviert man auch auf dem Gigabyte-Mainboard wieder alle acht Threads des FX-8350, so landet die Bearbeitungszeit auch wieder im bisher bekannten Zeitfenster. Somit scheint diese Software ein Problem mit der Modulbauweise zu haben bzw. mit weniger Ressourcen besser klarzukommen. Möglicherweise liegt das an herumgereichten Bearbeitungsthreads, welche immer wieder auf gerade abgeschalteten Kernen landen, was bis zum erneuten Aufwachen einige Taktzyklen kostet. Eine weitere Erklärung könnte sein, dass XMPEG häufig auf Daten im L2-Cache zurückgreift. Sobald ein Bearbeitungsthread auf ein anderes Modul verschoben wurde, ist der L2-Cache des soeben noch genutzten Moduls für den Thread nicht mehr erreichbar, sodass erst wieder nachgeladen werden muss.

    Performance mit vier Threads - Cinebench R11.5


    Mit nur rund 82 Prozent der Performance ist die zwei-Modul-Konfiguration im Cinebench innerhalb unseres kurzen Benchmark-Parcours gegenüber der Konfiguration mit vier Modulen am Langsamsten. Hier wird die Performance-Prognose von AMD in unseren wenigen Tests deutlich unterschritten.

    Performance mit vier Threads - 3DMark 11 Performance Preset Gesamt


    Im Gesamtergebnis des 3DMark 11, in welchem zugegebenermaßen die Grafikleistung im Vordergrund steht, trennen beide Ergebnisse nicht einmal vier Prozent.

    Performance mit vier Threads - 3DMark 11 Performance Preset Physik


    Im Physik-Test, welcher sehr stark auf die Prozessorleistung angewiesen ist, stehen über 88 Prozent der Leistung der nativen Kerne zu Buche.

    Performance mit vier Threads - Crysis 1280x1024


    Performance mit vier Threads - Crysis 1600x1200


    Performance mit vier Threads - Crysis 1920x1200


    Crysis, welches abermals eher grafiklastig ausfällt, schmeckt der Modulbauweise. Je nach Auflösung liegt die Performance von vier Threads auf zwei Modulen gegenüber vier Threads auf vier Modulen zwischen 97 und 98 Prozent – besser geht es nicht.

    Performance mit vier Threads - Sleeping Dogs 1280x1024


    Performance mit vier Threads - Sleeping Dogs 1600x1200


    Performance mit vier Threads - Sleeping Dogs 1920x1200


    Sleeping Dogs ist hier schon ein anderes Kaliber. In niedrigen Auflösungen, in denen bekanntermaßen das Grafiklimit nicht so ausgeprägt ist, erreicht das Modulkonzept etwa 88 Prozent der Leistung von nativen Kernen. Mit steigender Auflösung steigt auch das Ergebnis, da sich das Performancelimit immer weiter in Richtung Grafikkarte verschiebt. In 1920x1200 werden immerhin 95 Prozent der Leistung nativer Kerne erreicht.

    Über unseren kurzen Testparcours gemittelt erreicht die Modulbauweise 92 Prozent der Leistung von vier Threads auf vier nativen Kernen. Insofern wird die Aussage von AMD, etwa 90 Prozent der Leistung zu erreichen, ziemlich genau eingehalten.
    [break=Performance-Skalierung mit dem Speichertakt]
    Wie bereits beim FX-8150 getestet, wollen wir auch beim FX-8350 wissen, wie sich die Performance mit verschiedenen Speichertakten verhält. Wir haben dafür die Speichertimings auf 10-11-10-28 2T festgesetzt und nur den Speichertakt verändert. Schauen wir uns nun an, welche Veränderungen in der Praxis auftreten.

    Performance-Skalierung mit dem Speichertakt - WinRAR


    Gleich im WinRAR-Test sehen wir die erste Überraschung. Im sehr bandbreiten- und latenzlastigen Benchmark lässt sich bis DDR3-1866 ein deutliche Steigerung der Leistung feststellen. Darüber hinaus gibt es keinen Vorteil mehr, sondern die Leistung fällt minimal ab. Zu vermuten sind hier Speicher-Subtimings, welche durch das Mainboard-BIOS automatisch angepasst werden, um die hohe Speichertaktrate erst erreichen zu können. Der Vorteil der höheren Bandbreite wird durch die vermutlich verlangsamten Subtimings mehr als aufgefressen.

    Performance-Skalierung mit dem Speichertakt - XMPEG + XViD


    Gleiches Bild auch bei XMPEG. Während es hier generell sehr eng zugeht (und deshalb kaum Vorteile aus schnellerem Speicher gezogen werden können), ist DDR3-1866 auch in diesem Test die schnellste Einstellung.

    Performance-Skalierung mit dem Speichertakt - Cinebench R11.5


    Auch im Cinebench ist DDR3-1866 schneller als DDR3-1600, welches widerum schneller ist als DDR3-1333. DDR3-2133 reiht sich einmal mehr an einer Stelle ein, die wir so nicht erwartet hätten – nämlich noch hinter DDR3-1600.

    Performance-Skalierung mit dem Speichertakt - 3DMark 11 Performance Preset Gesamt


    Im Gesamtergebnis des 3DMark 11 haben wir endlich einmal die Ergebnisreihenfolge, welche laut Papier bestehen sollte. Je schneller der Speichertakt, desto höher das Ergebnis. Allerdings fallen die Unterschiede hier insgesamt mehr als knapp aus.

    Performance-Skalierung mit dem Speichertakt - 3DMark 11 Performance Preset Physik


    Betrachten wir nur das Ergebnis des Physik-Tests, so wurde die alte Reihenfolge abermals hergestellt. DDR3-1866 ist am Schnellsten, gefolgt von DDR3-2133. DDR3-1600 und DDR3-1333 müssen einmal mehr etwas abreißen lassen.

    Performance-Skalierung mit dem Speichertakt - Crysis 1280x1024


    Performance-Skalierung mit dem Speichertakt - Crysis 1600x1200


    Performance-Skalierung mit dem Speichertakt - Crysis 1920x1200


    Im Crysis-Benchmark zeigt sich einmal mehr, dass DDR3-1866 die wahrscheinlich beste Einstellung für AMDs FX-8350 ist. Denn auch hier positioniert sich dieser Speichertakt auflösungsübergreifend vorn, für DDR3-2133 ist wieder einmal wenig zu holen.

    Performance-Skalierung mit dem Speichertakt - Sleeping Dogs 1280x1024


    Performance-Skalierung mit dem Speichertakt - Sleeping Dogs 1600x1200


    Performance-Skalierung mit dem Speichertakt - Sleeping Dogs 1920x1200


    In Sleeping Dogs kann sich DDR3-2133 wenigstens bei der höchsten von uns genutzten Auflösung durchsetzen. In den niedrigeren Auflösungen stellt einmal mehr DDR3-1866 das Maß der Dinge dar.

    Generell fallen die Unterschiede in Sachen Speichertakt nicht sonderlich groß aus. Lediglich DDR3-1333 hat mitunter an einem größeren Rückstand zu knabbern, ist jedoch nicht wirklich langsam. Insgesamt bleibt festzuhalten, dass "Vishera" mit allen Speichertakten betrieben werden kann, ohne viel Leistung zu verlieren. DDR3-1866 macht aus Performance-Sicht jedoch am meisten Sinn.
    [break=Performance-Skalierung Speichertimings]
    Wenn wir schon einen Blick auf die Performance von verschiedenen Speichertakten werfen, darf ein Blick auf die Performance mit verschiedenen Speichertimings natürlich nicht fehlen. Für diese Testreihe haben wir den Speichertakt auf DDR3-1600 festgesetzt und ausschließlich die Haupttimings verändert.

    Performance-Skalierung Speichertimings - WinRAR


    Im WinRAR sehen wir die Reihenfolge, welche auch auf dem Papier existiert. Je langsamer die Timings, desto langsamer auch das Ergebnis in diesem Benchmark. Interessant ist zudem, dass 2T Command hier noch einmal für einen sehr gut messbaren Leistungsverlust sorgt.

    Performance-Skalierung Speichertimings - XMPEG + XViD


    Auch in XMPEG sehen wir die "perfekte" Reihenfolge, wenngleich es hier insgesamt sehr eng zugeht.

    Performance-Skalierung Speichertimings - Cinebench R11.5


    In Cinebench kann sich einmal mehr 8-9-8-28 1T an die Spitze setzen. Alle anderen Einstellungen sind sich untereinander einig und folgen mit sehr geringem Abstand auf den Plätzen.

    Performance-Skalierung Speichertimings - 3DMark 11 Performance Preset Gesamt


    Auch im Gesamtergebnis des 3DMark 11 setzt sich die Einstellung mit den schnellsten Timings an die Spitze. Interessant ist, dass sich die Einstellung mit CL10 und 2T Command hier sehr knapp an dem Pendant mit 1T Command vorbeischieben kann. Das lässt vermuten, dass die Command Rate in diesem Test de facto irrelevant ist und es nur auf die primären Timings ankommt.

    Performance-Skalierung Speichertimings - 3DMark 11 Performance Preset Physik


    Im Physik-Test sehen wir einmal mehr die "perfekte" Reihenfolge.

    Performance-Skalierung Speichertimings - Crysis 1280x1024


    Performance-Skalierung Speichertimings - Crysis 1600x1200


    Performance-Skalierung Speichertimings - Crysis 1920x1200


    In unserem Crysis-Benchmark sehen wir auflösungsübergreifend eine nahezu eindeutige Reihenfolge. Lediglich in der höchsten von uns genutzten Auflösung kommt die Rangliste etwas durcheinander, da alle drei 1T-Konfigurationen gleich schnell sind. Hier muss lediglich CL10 mit 2T Command etwas abreißen lassen.

    Performance-Skalierung Speichertimings - Sleeping Dogs 1280x1024


    Performance-Skalierung Speichertimings - Sleeping Dogs 1600x1200


    Performance-Skalierung Speichertimings - Sleeping Dogs 1920x1200


    In den niedrigeren Auflösungen von Sleeping Dogs kann sich sogar 10-11-10-28 2T teilweise in Szene setzen. In der höchsten von uns genutzten Auflösung steht jedoch wieder die "perfekte" Reihenfolge zu Buche.

    Alles in allem zeigt sich, dass die Speichertimings nur für einen äußerst geringen Performance-Unterschied verantwortlich zeichnen können. Zwar sehen wir sehr häufig die Einstellung mit den schärfsten Timings an der Spitze der Diagramme, die Differenz ist jedoch immer sehr gering. Daher macht es kaum Sinn, teuren Speicher mit niedrigen Latenzen zu kaufen. DDR3-1866 mit einer Cas Latency von 9 dürfte hier aus Preis-/Leistungs-Sicht ideal sein.
    [break=Leistungsaufnahme und Temperatur]
    Die Achillesverse von "Vishera" ist bekanntermaßen die Leistungsaufnahme. Zudem hängt die Leistungsaufnahme auch von der Temperatur ab. Je höher die Temperatur, desto höher auch die Leistungsaufnahme. Uns hat deshalb interessiert, wie groß die Unterschiede ausfallen können, wenn statt einer herkömmlichen Luftkühlung eine Wasserkühlung zum Einsatz kommt.

    In den fünf folgenden Diagrammen haben wir unsere Tests zur Leistungsaufnahme insgesamt drei Mal durchgeführt. Zuerst nur mit Luftkühlung, in einer zweiten Testreihe mit angeschlossenen Komponenten der Wasserkühlung (Pumpe, drei 120-mm-Lüfter), wo jedoch noch immer eine luftgekühlte CPU zum Einsatz kam und zum Schluss noch eine Testreihe mit wassergekühlter CPU, dafür aber noch mit angeschlossenem Lüfter der Luftkühlung. Auf diese Weise konnten wir sowohl den Einfluss der Temperatur auf die Leistungsaufnahme feststellen als auch die Unterschiede der Leistungsaufnahme ermitteln, die durch die Komponenten der Wasserkühlung verursacht werden. Die Ergebnisse, bei denen der Prozessor luftgekühlt wurde, sind in den Diagrammen grün dargestellt. Wurde die CPU mit Wasser gekühlt, so ist das Ergebnis rot eingefärbt.

    Da die Temperatursensoren der FX-Prozessoren mitunter zweifelhafte Werte ausgeben (Idle-Temperaturen unterhalb der Raumtemperatur), können wir keine genauen Temperaturwerte nennen. Soviel sei aber gesagt: Die Lasttemperaturen mit LinX fallen bei Wasserkühlung um etwa sechs Grad Celsius geringer aus als bei Luftkühlung. Diese Angabe bezieht sich auf den Standardtakt des Prozessors.

    Leistungsaufnahme und Temperatur - 3DMark11


    Mit aktiviertem Turbo-Modus treten etwa fünf Watt Differenz zwischen reiner Luftkühlung und Luftkühlung samt angeschlossener Wasserkühlung auf. Wird der Prozessor wassergekühlt, so lassen sich knapp sieben Watt Differenz ermitteln. Ohne Turbo-Modus sieht das Bild etwas anders aus. Ungefähr sieben Watt Mehrverbrauch entfallen auf die Komponenten der Wasserkühlung. Und obwohl sich beim Wechsel von Luft- zu Wasserkühlung fünf Watt sparen lassen, so reicht es nicht, besser als die reine Luftkühlung zu sein.

    Leistungsaufnahme und Temperatur - LinX 64 Bit


    Bei Verwendung von LinX, wo ausschließlich CPU und RAM belastet werden, sehen wir eine eindeutige Reihenfolge. Zwar fällt die Leistungsaufnahme mit Wasserkühlung jeweils sechs Watt geringer aus, die Komponenten der Wasserkühlung benötigen insgesamt jedoch mehr als die Ersparnis ausmacht. So ist die Luftkühlung in diesem Test noch immer das Maß der Dinge. Im Übrigen ändert auch eine Wasserkühlung nichts daran, dass die CPU mit aktivierten Turbo-CORE-Einstellungen auf 3,4 GHz heruntertaktet.

    Leistungsaufnahme und Temperatur - Prime94 64 Bit


    Ein ähnliches Bild sehen wir bei Auslastung mittels Prime95. Auch hier verringert sich die Leistungsaufnahme, wenn eine Wasserkühlung genutzt wird, die Ersparnis genügt jedoch nicht, den zusätzlichen Verbrauch durch die Komponenten der Kühlung zu kompensieren.

    Leistungsaufnahme und Temperatur - Idle ohne Cool'n'Quiet/C1E


    Leistungsaufnahme und Temperatur - Idle mit Cool'n'Quiet/C1E


    Da die Leistungsaufnahme von AMDs FX-8350 im Idle-Betrieb auf einem akzeptablen Niveau liegt und zudem eine geringe Prozessortemperatur vorherrscht (schließlich werden die Rechenwerke nicht belastet), so war uns von vornherein klar, dass eine Wasserkühlung keine Vorteile bringen kann. Und tatsächlich. Zwar kann die Leistungsaufnahme dank etwas geringerer Temperaturen profitieren, der Verbrauch der zusätzlichen Komponenten macht diesen Vorteil jedoch wieder völlig zu Nichte und es stehen insgesamt höhere Verbrauchswerte zu Buche als mit reiner Luftkühlung.

    Bei Standardtakt macht eine Wasserkühlung also wenig Sinn, zumindest aus Sicht der Leistungsaufnahme. Möglicherweise kommt es hier aber auch auf die Konfiguration der Kühlung an. Doch wie sieht es aus, wenn man den Prozessor übertaktet? Hier sollten sich doch Vorteile generieren lassen...

    Leistungsaufnahme und Temperatur - übertaktet - LinX 64 Bit


    In der Tat. Wir konnten unser Exemplar des FX-8350 unter Verwendung unseres Noctua-Luftkühlers mit bis zu 4,5 GHz bei 1,35 Volt betreiben. Die Leistungsaufnahme hierfür betrug 312 Watt, welche durch Verwendung der Wasserkühlung auf 306 Watt verringert werden konnte. Und das, obwohl die Komponenten der Kühlung für etwa sechs bis sieben Watt verantwortlich sind. Umgerechnet fällt die Leistungsaufnahme aufgrund der Temperatur um 12 bis 13 Watt. Der Grund hierfür ist einfach: Statt etwa sechs Grad Temperaturdifferenz wie bei Standardtakt, sprechen wir hier über etwa 21 Grad Celsius.

    Zudem kann die verringerte Temperatur auch dazu verwendet werden, weiteres Taktpotenzial auszunutzen. Denn während mit Luftkühlung 4,5 GHz das Maximum bei 1,35 Volt VCore darstellte, konnten wir mit Wasserkühlung noch einmal etwa 70 MHz drauflegen – bei gleicher Betriebsspannung. Und selbst 4,57 GHz verbraucht das Gesamtsystem noch minimal weniger als mit Luftkühlung bei weniger Takt. Und abschließend lässt sich dank Wasserkühlung noch weiter an der Betriebsspannung des Prozessors drehen. Bei Luftkühlung hielten wir 1,35 Volt für das vertretbare Maximum an Betriebsspannung für unseren neuen Prozessor. Mit Wasserkühlung und damit einhergehend einer im Zaum gehaltenen Temperatur haben wir ausprobiert, wie weit wir mit 1,45 Volt VCore kommen. Und mit weiteren 200 MHz konnten wir ein Ergebnis von 4,77 GHz einfahren. Dass dann die Leistungsaufnahme weiter steigt, ist kein Geheimnis. Doch ohne Wasserkühlung hätten wir das Ergebnis mit unserem Testexemplar gar nicht erst erreicht.

    Leistungsaufnahme und Temperatur - übertaktet - Idle


    Ohne Auslastung sehen wir hingegen wieder ein gewohntes Bild: Der Temperaturvorteil fällt geringer aus als der Nachteil der zusätzlich zu versorgenden Wasserkühlungs-Komponenten. Und natürlich fällt auch hier die Einstellung für 4,77 GHz aus dem Rahmen, da 1,45 Volt auch im Idle-Betrieb gewisse Spuren hinterlassen.
    [break=Performance-Skalierung mit erhöhtem Northbridgetakt]
    Als nächstes haben wir uns angeschaut, wie sich die Leistung bei erhöhtem Northbridgetakt verhält. Bereits bei vergangenen Prozessorgenerationen von AMD war dies eine der Stellschrauben, die zu ordentlicher Mehrleistung führen konnte. Neben der reinen Leistungssteigerung wollten wir jedoch noch einen weiteren Aspekt betrachten. In einem OC-Review von "Vishera" bekamen wir anhand der Ergebnisse den Eindruck, dass es nicht von Vorteil war, den erhöhten Northbridgetakt so einzustellen, dass integrierte Northbridge und HT-Link als Ergebnis gleich schnell liefen. Es wurde der Anschein erweckt, dass eine derartige Kombination die Performance verschlechtert.

    Wir haben für unsere Testreihe auf den Standard-Prozessortakt von 4 GHz zurückgegriffen, den HT-Link auf 2,6 GHz eingestellt und die integrierte Northbridge erst mit 2,2 GHz, anschließend mit 2,4 GHz und zu guter letzt noch mit 2,6 GHz – also gleich schnell wie der HT-Link – betrieben.

    Performance-Skalierung mit erhöhtem Northbridgetakt - WinRAR


    In WinRAR sehen wir eine deutliche Leistungssteigerung durch die Erhöhung des Northbridgetaktes. Allerdings fällt der Unterschied von 2.200 MHz zu 2.400 MHz deutlich größer aus, als von 2.400 zu 2.600 MHz. Dennoch ist der Parallelbetrieb von Northbridge und HT-Link letztendlich die schnellste Kombination.

    Performance-Skalierung mit erhöhtem Northbridgetakt - XMPEG + XViD


    Bei XMPEG geht es ziemlich linear zu. Jede Erhöhung des Northbridgetaktets wird gut umgesetzt.

    Performance-Skalierung mit erhöhtem Northbridgetakt - Cinebench R11.5


    Wie bereits bei Speichertakt und Speichertimings zu sehen, zählt in Cinebench fast ausschließlich der CPU-Takt. Denn auch die Erhöhung des Northbridgetaktes um 400 MHz bzw. rund 18 Prozent bringt keinerlei Veränderung der Performance mit sich.

    Performance-Skalierung mit erhöhtem Northbridgetakt - 3DMark 11 Performance Preset Gesamt


    Im 3DMark 11 können wir wieder kleine Veränderungen verzeichnen. Jedoch gilt auch hier, dass der Sprung von Multiplikator 11 zu 12 einen größeren Vorteil bringt als der Sprung von Multiplikator 12 zu 13.

    Performance-Skalierung mit erhöhtem Northbridgetakt - 3DMark 11 Performance Preset Physik


    Der Physik-Test des 3DMark bringt widerum etwas größere Unterschiede hervor. Aber auch hier gilt, dass die erste Erhöhung etwas mehr bringt als der zweite Schritt.

    Performance-Skalierung mit erhöhtem Northbridgetakt - Crysis 1280x1024


    Performance-Skalierung mit erhöhtem Northbridgetakt - Crysis 1600x1200


    Performance-Skalierung mit erhöhtem Northbridgetakt - Crysis 1920x1200


    Spiele sind traditionell sehr angetan von der Erhöhung des Northbridgetaktes. Sie profitieren oftmals am Meisten davon. In den heutigen Tests fallen die Unterschiede nicht sehr groß aus, allerdings sind sie doch sehr gut messbar und zeigen stets die erwartete Reihenfolge: 2.600 MHz vor 2.400 MHz vor 2.200 MHz.

    Performance-Skalierung mit erhöhtem Northbridgetakt - Sleeping Dogs 1280x1024


    Performance-Skalierung mit erhöhtem Northbridgetakt - Sleeping Dogs 1600x1200


    Performance-Skalierung mit erhöhtem Northbridgetakt - Sleeping Dogs 1920x1200


    Gleiches gilt auch für Sleeping Dogs. Insgesamt fallen die Unterschiede hier noch etwas kleiner aus als in Crysis, die Reihenfolge bleibt jedoch stets erhalten.

    Insgesamt zeigt sich, dass die Erhöhung des Northbridgetaktes ein gutes Stück an Leistung bringen kann. Gleichzeitig hat sich unser Verdacht, dass synchroner HT-Link und Northbridge-Takt ein Problem darstellen können, nicht bestätigt. Zwar gibt es Beispiele, wo die Leistungssteigerung im letzten Schritt geringer ausfällt als bei der ersten Erhöhung (wo noch unterschiedliche Taktraten vorherrschen), letztendlich sind aber jeweils 2.600 MHz Northbridgetakt samt 2.600 MHz HT-Link schneller als eine Kombination aus 2.400 MHz bzw. 2.600 MHz.
    [break=Performance mit erhöhtem Referenztakt]
    Weiter geht es mit einem Blick auf die Performance bei erhöhtem Referenztakt. Grund für diese Betrachtungsweise ist ein Review, in welchem davon gesprochen wurde, dass AMDs FX-Prozessoren an Leistung verlieren, sobald man den Referenztakt erhöht. Sofern man über 204 bis 205 MHz Referenztakt agiert, soll die Leistung leiden. Also haben wir neben der Standard-Einstellung noch Einstellungen für eine zweite Testreihe herausgearbeitet, bei der ein Referenztakt von 235 MHz zum Einsatz kam. Die einzelnen Einstellungen wurden im BIOS wie folgt vorgenommen:

    Übersicht der Einstellungen für einen erhöhten Referenztakt


    Die Einstellungen für 200 MHz Referenztakt haben einen leichten Vorteil auf Seiten des Prozessortaktes, des Northbridgetaktes sowie des HT-Links. Bei 235 MHz Referenztakt hingegen steht ein geringfügig höherer Speichertakt zu Buche. Alles in allem sehr geringe Unterschiede, sodass 235 MHz in der Theorie deutlich langsamer agieren sollte, sofern die Behauptungen stimmen. Doch wie sieht es nun in der Praxis aus:

    Performance mit erhöhtem Referenztakt - WinRAR


    235 MHz agieren minimal schneller, was jedoch auch auf den leicht erhöhten Speichertakt zurückzuführen sein kann. Denn bekanntlich ist WinRAR sehr bandbreitenhungrig.

    Performance mit erhöhtem Referenztakt - XMPEG + XViD


    In XMPEG sehen wir die 200 MHz Referenztakt vorn. Da XMPEG mehr vom Prozessortakt profitiert, könnte darin der Grund für den Unterschied zu finden sein.

    Performance mit erhöhtem Referenztakt - Cinebench R11.5


    Wieder dürfte der Grund für den hauchdünnen Vorsprung von 200 MHz Referenztakt in dem minimal höheren CPU-Takt liegen.

    Performance mit erhöhtem Referenztakt - 3DMark 11 Performance Preset Gesamt


    De facto gleich schnelle Ergebnisse sehen wir im Gesamtergebnis des 3DMark 11.

    Performance mit erhöhtem Referenztakt - 3DMark 11 Performance Preset Physik


    Auch im Physik-Test liegt der erhöhte Referenztakt leicht vorn. Das ist insofern interessant, als dass wir hier einen Vorteil durch den höheren CPU-Takt bei 200 MHz vermutet hätten.

    Performance mit erhöhtem Referenztakt - Crysis 1280x1024


    Performance mit erhöhtem Referenztakt - Crysis 1600x1200


    Performance mit erhöhtem Referenztakt - Crysis 1920x1200


    Auflösungsübergreifend ist der höhere Referenztakt flotter unterwegs als die Standardeinstellung von 200 MHz. Zwar nur äußerst gering, aber durchaus messbar. Hier kann die Standard-Einstellung keinen Vorteil aus den leicht höheren Taktraten bei CPU, Northbridge und HT-Link ziehen.

    Performance mit erhöhtem Referenztakt - Sleeping Dogs 1280x1024


    Performance mit erhöhtem Referenztakt - Sleeping Dogs 1600x1200


    Performance mit erhöhtem Referenztakt - Sleeping Dogs 1920x1200


    Ganz so eindeutig geht es bei Sleeping Dogs nicht zu. In der mittleren Auflösung haben die 200 MHz knapp die Nase vorn, in den anderen beiden Auflösungen hingegen wieder der erhöhte Referenztakt.

    Die Aussage, ein AMD FX würde bei verändertem Referenztakt an Leistung verlieren, ist nach unseren Tests kaum mehr haltbar. Auf welche Erfahrungen die Redaktion diese Aussage stützt, entzieht sich unserer Kenntnis. In unseren Tests jedenfalls gibt es keinerlei Hinweise auf Leistungsverluste. Im Gegenteil, oft ist der erhöhte Referenztakt sogar minimal schneller. Ein Grund hierfür könnte die Einstellung für das Verhältnis des Speichertaktes sein. Durch DDR3-1600 statt DDR3-1866 sind möglicherweise minimal straffere Subtimings zum Einsatz gekommen, die in Summe einen kleinen Vorteil ausgemacht haben. Aber auch der minimal höhere Speichertakt kann ein Grund sein.
    [break=Performance mit geradem und ungeradem Multiplikator]
    Kommen wir noch einmal zu einem OC-Review zurück, bei dem einige Ergebnisse den Verdacht aufkommen ließen, dass gerade Multiplikatoren bei hohen Prozessortakten einen Vorteil gegenüber ungeraden Multiplikatoren haben. Das würde bedeuten, dass Übertakter, die lediglich den Multiplikator erhöhen, möglicherweise Performance verschenken. Also haben wir uns zwei Einstellungen ausgearbeitet, die in einem hohen Prozessortakt resultieren und gleichzeitig nahezu identische Werte bei CPU-Takt, Northbridgetakt und HT-Link liefern. Lediglich beim Speichertakt mussten wir eine etwas größere Lücke hinnehmen, welche mit 26 MHz jedoch noch einigermaßen im Rahmen liegt. Und so sieht es im Detail aus:

    Übersicht der Einstellungen für einen geraden und ungeraden Multiplikator


    Mit diesen Einstellungen haben wir unseren Benchmark-Parcours durchlaufen und überprüft, ob ein gerader Multiplikator tatsächlich einen Vorteil bietet oder nicht.

    Performance mit geradem und ungeradem Multiplikator - WinRAR


    Gleich im WinRAR erleben wir eine kleine Überraschung. Trotz 18 MHz weniger CPU- und 26 MHz weniger Speichertakt liegt der gerade Multiplikator ein gutes Stück vorn. Möglicherweise spielt aber auch hier der Fakt eine Rolle, dass das Verhältnis von Referenztakt zu Speichertakt sehr unterschiedlich ausfällt. Auf der einen Seite kommt DDR3-1600 zum Tragen, auf der anderen Seite nutzen wir DDR3-2133. Bei diesem Unterschied könnte es sich durchaus um die Auswirkung von besseren Subtimings handeln. Zudem hat DDR3-2133 in unseren Tests zum Speichertakt ohnehin nicht die beste Figur gemacht.

    Performance mit geradem und ungeradem Multiplikator - XMPEG + XViD


    Bei XMPEG sehen wir die Reihenfolge, die wir auch erwartet haben. Hier setzt sich der leicht höhere Prozessortakt durch.

    Performance mit geradem und ungeradem Multiplikator - Cinebench R11.5


    Gleiches Bild auch beim Cinebench. Mehr Prozessortakt bedeuten mehr Punkte.

    Performance mit geradem und ungeradem Multiplikator - 3DMark 11 Performance Preset Gesamt


    Hier sind sich beide Konfigurationen einig. Identische Performance bedeutet keinen Vorteil für eine der Lösungen.

    Performance mit geradem und ungeradem Multiplikator - 3DMark 11 Performance Preset Physik


    Dank höherem Prozessortakt hat im Physik-Test des 3DMark 11 der ungerade Multiplikator die Nase vorn.

    Performance mit geradem und ungeradem Multiplikator - Crysis 1280x1024


    Performance mit geradem und ungeradem Multiplikator - Crysis 1600x1200


    Performance mit geradem und ungeradem Multiplikator - Crysis 1920x1200


    Interessant. Auflösungsübergreifend liegt der gerade Multiplikator trotz geringerem Prozessor- und Speichertakt vorn (bzw. mindestens gleichauf). Aber auch hier könnte der Grund in der Einstellung für DDR3-1600 gegenüber DDR3-2133 zu suchen sein. Dank schärferer Subtimings könnte es hier für die Übernahme der Führung reichen.

    Performance mit geradem und ungeradem Multiplikator - Sleeping Dogs 1280x1024


    Performance mit geradem und ungeradem Multiplikator - Sleeping Dogs 1600x1200


    Performance mit geradem und ungeradem Multiplikator - Sleeping Dogs 1920x1200


    Auch in Sleeping Dogs sehen wir den geraden Multiplikator trotz Handicap auflösungsübergreifend vorn. Abschließend lässt sich daher sagen, dass ein gerader Multiplikator durchaus den Nachteil von ein paar MHz CPU- bzw. Speichertakt wettmachen kann. Allerdings liegt dies nach unseren Vermutungen eben nicht am Multiplikator selbst, sondern vermutlich an der günstigeren Einstellung des Speichertaktes und damit einhergehend besserer Subtimings des Arbeitsspeichers.
    [break=Performance mit angepasstem Turbo-Modus]
    Abschließend wollen wir noch einen Blick auf den Turbo-Modus des FX-8350 werfen. Aufgrund des hohen Basistaktes von 4 GHz fällt der von Hause aus mitgelieferte Taktsprung nicht mehr sonderlich hoch aus, weshalb es keine deutliche Leistungssteigerung mehr zu verzeichnen gibt. Doch was ist, wenn man den Turbo-Modus individualisiert? Schließlich konnten wir unseren Prozessor mit fast 4,8 GHz betreiben – warum soll da nicht ein höherer Turbo-Modus zu erzielen sein?

    Zuerst stand natürlich die Frage im Raum, wie wir dies anstellen sollten. Zwar kann man im BIOS des ASUS Crosshair V Formula-Z den Turbo-Multiplikator verändern, jedoch kann man keine verschiedenen Spannungen angeben. Um einen hohen Turbo-Takt zu realisieren, müssten wir eine verhältnismäßig hohe Spannung ansetzen, welche die Effizienz im Idle jedoch wieder zunichte macht. Die Lösung für dieses Problem heißt AMDMSRTweaker. Dabei handelt es sich um ein kleines Tool, geschrieben von einem Forenmitglied von Hardwareluxx, mit welchem man die einzelnen P-States der FX-Prozessoren anpassen kann. Nachdem wir uns das Tool heruntergeladen hatten, haben wir zuerst einen Blick auf die Standardeinstellungen geworfen:

    Originaleinstellungen des Turbo-Modus eines AMD FX-8350


    P2 bedeutet den Standardtakt unseres Prozessors, P1 und P0 sind die jeweiligen Turbo-Stufen. Diese wollten wir anpassen. Jedoch hatten wir noch ein anderes Ziel: P3 ist der Status, in den der FX-8350 zurückfällt, wenn das Advanced Power Management aktiviert ist und die Auslastung mit LinX zu hoch wird – die CPU taktet in P3 zurück.

    Nach etlichen Teststunden hatten wir herausgefunden, dass unsere CPU mit 4,6 GHz bei Teillast selbst mit Luftkühlung betrieben werden konnte. Gleichzeitig war es uns möglich, P3 auf 3,9 GHz anzuheben, ohne ein Heruntertakten während LinX zu beobachten. Satte 500 MHz mehr bedeuteten einen ordentlichen Performance-Sprung in LinX. Statt etwa 36,7 GFlops stehen nunmehr 38,9 GFlops zu Buche. Insgesamt sehen unsere Einstellungen nun so aus:

    angepasste Einstellungen des Turbo-Modus eines AMD FX-8350


    Die erste Turbo-Stufe haben wir bei 4,3 GHz gesetzt, der volle Turbo kann nun auf 4,6 GHz zurückgreifen. Die Spannungen sind laut Screenshot zwar deutlich verringert, allerdings ist dies nur die halbe Wahrheit. Da wir unsere OC-Tests stehts mit aktivierter LoadLine-Calibration (Einstellungen zur Spannungskurve unter Last) durchgeführt haben, haben wir dies auch bei unseren Tests mit individualisiertem Turbo so gehandhabt. Dadurch liegen die Spannungen real sehr nah an dem eingestellten wert, während sie bei Standardeinstellungen (abgeschaltete LoadLine-Calibration) gegenüber den eingestellten Werten mitunter deutlich abfallen. Zu erwähnen ist noch, dass NB_P0 falsch angezeigt wird. Da wir den Northbridgetakt bei Beibehaltung der Betriebsspannung um 200 MHz anheben konnten, haben wir dies auch getan. Doch welche Auswirkungen haben unsere individualisierten Einstellungen nun auf die Performance?

    Performance angepasstem Turbo-Modus - WinRAR


    WinRAR nimmt unsere individualisierten Einstellungen sehr dankbar an. Gegenüber den Standardeinstellungen lässt sich die Performance noch einmal um etwa 7,5 Prozent steigern.

    Performance angepasstem Turbo-Modus - XMPEG + XViD


    Auch XMPEG profitiert deutlich von unseren Einstellungen. Hauptsächlich kommt hier der hohe Turbo-Takt zum Tragen.

    Performance angepasstem Turbo-Modus - Cinebench R11.5


    Während der automatische Turbo-Modus gleich schnell ist wie ein deaktivierter Turbo-Modus, so kann sich unser individueller Turbo sehr deutlich absetzen. Hier dürfte trotz Last auf allen Kernen P1 greifen, welches wir 200 MHz höher eingestellt haben als normal.

    Performance angepasstem Turbo-Modus - 3DMark 11 Performance Preset Gesamt


    Mit aktiviertem Turbo-Modus gingen im 3DMark 11 immer ein paar Punkte verloren. Diese Punkte kann unser individualisierter Turbo wieder gutmachen und ist damit exakt gleich schnell wie ein FX-8350 ohne Turbo-Modus.

    Performance angepasstem Turbo-Modus - 3DMark 11 Performance Preset Physik


    Auch hier zeigen sich unsere eigenen Einstellungen von ihrer besten Seite. Gegenüber dem Standard-Turbo steht ein ordentliches Leistungsplus zu Buche.

    Performance angepasstem Turbo-Modus - Crysis 1280x1024


    Performance angepasstem Turbo-Modus - Crysis 1600x1200


    Performance angepasstem Turbo-Modus - Crysis 1920x1200


    Da kommt Freude auf: Unsere angepassten P-States können sich auflösungsübergreifend gut in Szene setzen. In der kleinsten von uns genutzten Auflösung stehen sogar über vier Bilder pro Sekunde mehr auf der Habenseite – ein sehr gutes Ergebnis!

    Performance angepasstem Turbo-Modus - Sleeping Dogs 1280x1024


    Performance angepasstem Turbo-Modus - Sleeping Dogs 1600x1200


    Performance angepasstem Turbo-Modus - Sleeping Dogs 1920x1200


    In Sleeping Dogs fallen die Vorteile für unsere Einstellungen nicht ganz so groß aus, sie sind jedoch auch hier messbar. Unser eigener Turbo-Modus stellt auch hier auflösungsübergreifend den Klassenprimus dar.

    Aus Leistungssicht kann unser individualisierter Turbo-Modus also klar überzeugen. Doch ist es uns auch gelungen, die Leistungsaufnahme im Zaum zu halten?
    [break=Leistungsaufnahme mit angepasstem Turbo-Modus]
    Leistungsaufnahme mit angepasstem Turbo-Modus - 3DMark11


    Gegenüber den automatischen Turbo-Einstellungen haben wir uns im 3DMark 11 leicht verschlechtert. Wir sind allerdings noch immer sparsamer unterwegs als ohne Turbo-Modus (welcher bei uns auch Stromspareinstellungen beinhaltet).

    Leistungsaufnahme mit angepasstem Turbo-Modus - LinX 64 Bit


    Autsch! Hier haben wir die Leistungsaufnahme ein weiteres mal explodieren lassen. Allerdings können wir uns diesen Wert nicht so ganz erklären. Denn gegenüber dem Durchlauf ohne Turbo-Modus läuft LinX mit einer geringeren Spannung und zudem noch mit geringerem Takt. Einzig die integrierte Northbridge läuft mit 200 MHz mehr, was jedoch nicht zu einem solchen Anstieg führen kann. Insofern sind wir an dieser Stelle etwas ratlos, nehmen den Anstieg aber zur Kenntnis.

    Leistungsaufnahme mit angepasstem Turbo-Modus - Prime94 64 Bit


    Das komplette Gegenteil von LinX sehen wir bei Prime95. Hier schlägt die Verringerung der Spannungen voll durch und wir sind deutlich sparsamer unterwegs als mit Standardeinstellungen. Interessant ist auch, dass uns unter Last teilweise sogar 4,3 GHz angezeigt werden – also P1 greift.

    Leistungsaufnahme mit angepasstem Turbo-Modus - Idle ohne Cool'n'Quiet/C1E


    Leistungsaufnahme mit angepasstem Turbo-Modus - Idle mit Cool'n'Quiet/C1E


    Da wir die hohen P-States unverändert gelassen haben, dafür aber die LoadLine-Calibration aktiviert haben, fällt die Leistungsaufnahme im Idle minimal höher aus als vorher. Hier könnte man natürlich noch nachregeln, sodass man letztendlich auch im Idle mindestens genauso dasteht wie zuvor.

    Insgesamt zeigen unsere Messungen zur Leistungsaufnahme, dass ein individualiserter Turbo-Modus sowohl Vor- als auch Nachteile haben kann. Die Vorteile überwiegen, allerdings haben wir unter Last mittels LinX auch den Vogel abgeschossen. Hier wäre weiteres Finetuning notwendig.
    [break=Fazit]
    Titelbild AMD Vishera Reloaded


    Die letzten Seiten haben einige interessante Erkenntnisse für uns bereitgehalten. Zeit, ein kurzes Fazit zu ziehen.

    Das neuer nicht gleich besser ist, zeigen unsere Tests zum AGESA-Code. Zwar kommen unsere beiden Spiele im Benchmark-Parcours durchaus gut damit klar, andere Anwendungen verlieren mitunter leicht mit neuerem AGESA-Code. Insgesamt sind die Unterschiede jedoch sehr gering, sodass die Hoffnungen auf (noch) bessere Performance mit einem BIOS-Update enttäuscht werden müssen.

    Dagegen zeigen unsere Tests mit vier Threads (einmal auf zwei Modulen und einmal auf vier Modulen), dass AMDs Modulkonzept recht ordentlich funktioniert. Mit 20 Prozent der Diefläche eines nativen Kerns möchte man 80 Prozent dessen Performance erreichen. Und in unseren Benchmarks schafft man dies mit durchschnittlich 92 Prozent auch, wobei die Bandbreite von 82 Prozent bis 98 Prozent reicht.

    Als nächstes haben wir uns den Speicherausbau vorgenommen. Sowohl Speichertakt als auch -timings können zwar Vorteile bringen, deutliche Performancesteigerungen sind jedoch kaum zu erwarten. DDR3-1600 und DDR3-1866 stellen dabei die beste Lösung aus Preis-/Leistungssicht dar und auch bei den Timings sollte man keinen hohen Aufpreis für straffe Latenzen zahlen. Dazu bringen diese schlichtweg zu wenig.

    Unsere OC-Tests (erhöhter Northbridgetakt, erhöhter Referenztakt, gerader vs. ungerader Multiplikator) haben gezeigt, dass es einige interessante Aspekte gibt, die noch ein Quäntchen mehr Performance erzielen können. Ein erhöhter Northbridgetakt bringt durchweg einen kleinen Leistungsschub, während ein gerader Multiplikator unter Umständen ebenfalls positive Auswirkungen haben kann. Dies schreiben wir allerdings weniger dem Multiplikator an sich zu als dem kleineren Speichertaktverhältnis, was zu besseren Subtimings führt.

    Zu guter Letzt hat unser individuell eingestellter Turbo-Modus gezeigt, dass man die Leistung eines AMD FX-8350 noch einmal ein gutes Stück steigern kann. Bis zu 7,5 Prozent mehr Leistung konnten wir unserem Prozessor entlocken, was ein sehr gutes Ergebnis darstellt. Dass wir damit sogar die Leistungsaufnahme teilweise verringern konnten, hat uns natürlich gefreut. Allerdings hat sich die Anpassung des P3-State stark gerächt und wir haben einen neuen Negativrekord in Sachen Leistungsaufnahme unter LinX aufgestellt.

    Alle Tests zeigen, dass mit guten Entscheidungen beim Kauf bzw. bei der Wahl der Einstellungen noch das eine oder andere Prozent an Leistung gewonnen werden kann. Und wer es liebt, sein System ans Limit zu bringen, der hat mit "Vishera" einen guten Unterbau, um lange Zeit austesten zu können.

    ...weitere Artikel
    ...diesen Artikel im Forum diskutieren

  2. Die folgenden 72 Benutzer sagen Danke zu MusicIsMyLife für diesen nützlichen Beitrag:

    Andy06 (30.01.2013), Atlan78 (28.01.2013), Backfire (28.01.2013), bbott (28.01.2013), Bobo_Oberon (03.02.2013), Bond.007 (28.01.2013), btolksdorf (28.01.2013), Byce (28.01.2013), bytefuzzy (29.01.2013), C4rp3di3m (28.01.2013), Cappuandy (16.03.2013), ceVoIX (30.01.2013), Cr@zed^ (28.01.2013), Dalai (29.01.2013), DEFENDER (31.01.2013), denjo (28.01.2013), Denniss (28.01.2013), deoroller (29.01.2013), depp1978 (29.01.2013), derDruide (28.01.2013), dev art (28.01.2013), Dr4go (28.01.2013), Effe (28.01.2013), erde-m (28.01.2013), Filidae (28.01.2013), FredD (29.01.2013), heiko-soft (29.01.2013), heizzr (29.01.2013), hoschi_tux (28.01.2013), ICEMAN (28.01.2013), isigrim (28.01.2013), Jagdpanther53 (28.01.2013), Joels (28.01.2013), jumPM (28.01.2013), Kona (29.01.2013), Kosak (18.02.2013), LordNord (28.01.2013), mapim (29.01.2013), matty2580 (29.01.2013), maximus_hertus (28.01.2013), mibo (30.01.2013), michelthemaster (28.01.2013), MrBad (28.01.2013), Nike (30.01.2013), Nosyboy (30.01.2013), OjO (05.05.2013), Pirx (28.01.2013), pokasser (30.01.2013), Rabe (28.01.2013), Raspo (28.01.2013), S.I. (28.01.2013), Sagi T 754 (28.01.2013), samm (28.01.2013), SemtexX_ (28.01.2013), Sje8607 (28.01.2013), skibice (30.01.2013), SnakeByte0815 (29.01.2013), Soran (29.01.2013), Species_0001 (28.01.2013), TAL9000 (28.01.2013), Tanzmusikus (26.08.2015), testi (29.01.2013), tex_ (29.01.2013), The_Lynx (28.01.2013), tspoon (28.01.2013), Unbekannter Krieger (10.12.2013), WindHund (28.01.2013), X1900AIW (28.01.2013), yakon (28.01.2013), Yarismann (29.01.2013), Zoller (30.01.2013)

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •  
Single Sign On provided by vBSSO