AMD Ryzen Threadripper 1950X — Part One
Performance-Auffälligkeiten bei Threadripper
Während unserer ersten Gehversuche mit der TR4-Plattform sind uns einige Aspekte aufgefallen, welche wir natürlich nicht verschweigen wollen. Beginnen wollen wir dabei mit der Kühlerinstallation.
Wie wir im Verlaufe des Artikels bereits angemerkt haben, konnten wir unsere AiO-Kühlung nicht so ausrichten, wie wir das eigentlich wollten. Um zu verdeutlichen, was wir meinen, haben wir mit Hilfe des Fotos eines geköpften Threadrippers ein Schema gebastelt, was die Situation einigermaßen wiedergibt:
Aufgrund der Ausgestaltung der beiliegenden TR4-Halterung für unsere AiO-Kühlung konnten wir die an zwei Seiten gerade Kühlfläche nicht in der gleichen Richtung anordnen, wie die vier Dies verbaut sind. Zudem ist die Kühlfläche der Kühlung relativ klein, sodass wir davon ausgehen, dass wie im obigen Bild nicht die komplette Die-Fläche abgedeckt ist. Dass wir bei hoher CPU-Auslastung ein Throttling beobachten konnten, könnte durchaus allein an dieser Tatsache liegen. Die alternative Erklärung besagt, dass die AiO des Liquid Cooling Kit, welches beim AMD FX ausgeliefert wurde, zu schwach für 180 Watt TDP ist. Zumindest dann, wenn es um dauerhafte Volllast geht.
An diesem Screenshot, welcher für die Anzeige einer vergrößerten Version angeklickt werden kann, sehen wir zwei Dinge. Einerseits zeigt HWINFO an, dass der Takt bei Auslastung mit Prime95 unter den Standardtakt von 3,4 GHz gefallen ist. Tctl liegt bei über 90 Grad, was zum Verringern des Taktes führt. Daneben stellen wir fest, dass ein Monitor mit einer Auflösung von 2.560x1.440 nicht genügt, um bei 32 Threads in Prime irgendwelche Informationen zu den einzelnen Worker-Threads anzuzeigen. Um also überhaupt einen Überblick über die Situation in Prime zu bekommen, muss entweder eine höhere Auflösung herhalten oder einfach die einzelnen Fenster von Prime über das Menü kaskadiert werden.
Doch das ist noch nicht alles, was es zu berichten gibt. Werfen wir ein Blick auf das folgende Ergebnis-Diagramm:
Wir sehen die Werte von fünf Durchläufen beim Packen mit 7zip. Wir hatten erwähnt, dass wir den Durchschnitt aus zwei Durchläufen werten, sofern diese maximal um ein Prozent beim Ergebnis auseinander liegen. Bei 7zip, dem Wort-Case-Szenario, mussten wir dafür insgesamt fünf Durchläufe starten. Denn die ersten beiden Benchmarks stellen die Extremwerte im Diagramm dar und weichen mit einer Differenz von rund sieben Prozent deutlich voneinander ab. Allen Durchläufen gemein ist dabei ein Reboot des Systems zwischen den einzelnen Durchläufen.
Die Performance von Ryzen Threadripper kann also von Durchlauf zu Durchlauf schwanken. Besonders Anwendungen, welche nur eine Teilllast verursachen, können hiervon betroffen sein. Und unserer Meinung nach ist das die Ursache dafür:
Das Bild zeigt die CPU-Auslastung kurz vor Ende eines Packvorgangs mit 7zip. Der 1950X läuft im Creator Mode, Turbo und Stromsparmechanismen sind aktiviert. Durchschnittlich steht eine Total CPU Usage von 39,9 Prozent zu Buche. Also deutlich weniger als die Hälfte, was dazu führt, dass die Kerne eines Dies scheinbar fast komplett auf ihren Idle-Taktraten verharren. Uns drängt sich der Eindruck auf, dass 7zip hin und wieder auf diese Kerne/Threads zugreifen muss und somit wertvolle Zeit vergeht, bis die Kerne ihren Bestimmungstakt erreichen. Denn wie wir gesehen haben, läuft der Packvorgang etwa 15 Prozent schneller, wenn statt Turbo-Modus samt Stromsparmechanismen eine feste Taktrate angelegt wird.
Unter Verwendung des Game Mode sieht die Situation deutlich besser aus. Die durchschnittliche Total CPU Usage beläuft sich auf knapp 70 Prozent, alle Kerne werden von HWINFO mit 3,7 GHz laufend vermeldet.
7zip zeigt hier eindrucksvoll, was einem Threadripper-Nutzer blühen kann, wenn er die CPU nicht genug auslastet. Einerseits kann die Performance bei identischer Aufgabe schwanken, andererseits kann sie weit hinter den Werten bleiben, welche möglich wären. Dass 7zip hier nicht allein ist, zeigt folgende Übersicht:
Wir haben insgesamt sieben verschiedene Benchmarkreihen durchgeführt. Unsere Herangehensweise von zwei Benchmarks, deren Ergebnisse maximal um ein Prozent voneinander abweichen dürfen, führt hin und wieder zur Wiederholung einzelner Durchläufe. Und im obigen Diagramm haben wir verewigt, bei welcher Benchmark-Serie wir wie oft einen Durchlauf wiederholen mussten, um unser 1‑Prozent-Ziel zu erreichen. Wir sehen, dass bei drei Benchmark-Serien mit unserem 1800X gerade einmal 13 Wiederholungen notwendig waren. Im Schnitt also lediglich 4,3 Wiederholungen pro Serie. Beim 1950X sieht das Bild deutlich schlechter aus: 44 Wiederholungen in vier Serien machen durchschnittlich 11 Wiederholungen pro Serie aus – zweieinhalb Mal soviel wie bei Ryzen 7. Und selbst die Threadripper-Serie mit den wenigsten Abweichungen fällt schlechter aus als die Ryzen-Serie mit den meisten Abweichungen. Das ist zwar kein Weltuntergang, zeigt aber, dass Threadripper ordentlich ausgelastet sein will, um zuverlässige und gleichmäßige Performance zu liefern. Wer das nicht leisten kann, sollte tatsächlich darüber nachdenken, statt auf Stromsparmechanismen auf eine feste Taktrate zu setzen. Zwar geht das auf Kosten der Leistungsaufnahme, die Performance sollte in diesem Fall aber etwas homogener ausfallen.
Kurzum: Bereits Ryzen 7 hat uns gezeigt, dass die Rohleistung verpufft, wenn nicht die richtige Software zur Hand ist. Ryzen Threadripper hebt diese Situation noch einmal auf ein neues Niveau und schreit förmlich nach der richtigen Software bzw. Auslastung.