Artikel AMD Ryzen Threadripper 1950X - Part Two

MusicIsMyLife

Redaktion
☆☆☆☆☆☆
Mitglied seit
22.02.2002
Beiträge
15.579
Renomée
2.567
Standort
in der Nähe von Cottbus
  • QMC Race
  • BOINC Pentathlon 2017
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2019
  • SETI@Home Wow!-Event 2019
  • BOINC Pentathlon 2020
titelbild_2-300x174.jpg


Vor einigen Wochen haben wir unseren Artikel “AMD Ryzen Threadripper 1950X — Part One” veröffentlicht. Wie der Name vermuten ließ, sollte es nicht bei diesem einen Artikel bleiben. Heute wollen wir uns nun endlich weitere Aspekte rund um Threadripper anschauen: Wieviel Mehrperformance bringt ein höherer Speichertakt? Welchen Einfluss haben Speichertimings auf die Leistung? Bringt SMT eine beachtliche Mehrleistung? Wie leistungsfähig kann Threadripper in BOINC sein?


Viel Vergnügen beim Lesen!
(…)

» Artikel lesen
 
Einige User hatten nach Part One Wünsche zu individuellen Tests. Allerdings habe ich es nicht geschafft, die Wünsche in ein ordentliches Test-Szenario zu überführen. Vor allem muss ich gestehen, dass mich MeGUI mehr verwirrt hat als alles andere... :(

Ich schlage deshalb vor, bestimmte Wünsche hier im Thread abzuarbeiten (sofern es mir möglich ist) - also nicht im Rahmen eines Artikels. Das geht besser, da die Wünsche genauer erfüllt werden können (quasi unter Wunscheinstellungen).
 
Ein paar Benchmarks mit und ohne SMT würden mich noch interessieren.
Wie sehen die Ergebnisse mit 8Kernen SMT an Aus aus?!
Ist die Software bei so vielen Kernen einfach an Ende?!
Wie schaut es mit 2 Programmen aus wenn SMT an Aus ist?
 
Threadripper bietet viele leistungssteigernde Möglichkeiten, wobei diese Optionen in unterschiedlichen Kombinationen auch unterschiedliche Ergebnisse hervorbringen können.

*Nostalgie*

Musste man früher nicht auch viel basteln und einstellen, um ein optimales System zu erhalten? *buck*
 
Das nenne ich mal einen umfangreichen Test. :o
Da hat sich das Warten ja gelohnt.

Kannst du noch ein Problem verifizieren das ich bei SiSoftware Sandra Lite mit meinem TR System habe?
Der Test zur wissenschaftlichen Analyse schmiert dort regelmäßig ab, im Falle der GPU Tests kam es des öfteren gar zur Selbstabschaltung des Systems, wobei ich hier meine GPU Config mit 8 Fiji Chips nicht ausschließen möchte.
 
Sehr nize @Music.. das waren bestimmt einige Schlaflose Nächte/Stunden und Nervenaufreibende Momente beim Testen und beim Testen und achja beim Testen auch noch.. ;D

Aber Hut ab (Hut-Ab-Smiley-Vorstellen), der Part One war schon gut u. der zweite nun noch besser ! > *greater*

Gruß Andy
 
Super test hab haber bis jetzt die letzte hälfte nur überflogen lese ich nachher in ruher am PC

60watt mehr Leistungsaufnahme nur durch höheren Speicher Geschwindigkeit *buck*
Das Fazit könnte auch genau Andersrum lauten je nach Anwendung ist es sinnvoll auf langsamer Speicher zu setzen *suspect*
 
Hab auch mal nen Flüchtigkeitsfehler gefunden:

Benchmarks: Wieviel Performance bringt SMT?
Cinebench R15 Multi-Thread..... 2.960..... 2.129.... 39,03.... 2.944.... 21.33.... 38,02

Der Punkt kommt sicherlich hinter die 2 in der Tabelle ,2.133

--- Update ---

OK hier auch:
Benchmarks: schnellste und langsamste Einstellung
 
Zuletzt bearbeitet:
Bezüglich Asteroids und POGS im Test: "Mit knapp 83.000 Punkten pro Tag wird der Wert vom 1800X mehr als verdoppelt. Grund hierfür dürfte sein, dass es bei POGS eine relativ stark schwankende Punktevergabe pro Arbeitspaket gibt. Von den abermals über 60 WUs wurden relativ viele Pakete mit 297,18 Punkten belohnt und nur wenige mit weniger Punkten."
Das Gegenteil ist der Fall: POGS entwertet immer konstant. Die Pakete werden nur in unterschiedlichen Größenabstufungen verteilt. Bei Asteroids ist die Punktevergabe ebenfalls konstant, aber die Laufzeiten können sich je nach Batch verändern. So wird auch der Nachteil des TR gegen den R7 Ryzen zu erklären sein.
 
Ein paar Benchmarks mit und ohne SMT würden mich noch interessieren.
Wie sehen die Ergebnisse mit 8Kernen SMT an Aus aus?!
Ist die Software bei so vielen Kernen einfach an Ende?!
Wie schaut es mit 2 Programmen aus wenn SMT an Aus ist?

Wenn ich dich richtig verstehe, möchtest du einige Test im Game Mode ohne SMT, richtig? Also tatsächlich den 1.000-Euro-Prozessor auf ein Viertel seiner Threads kastrieren?!

Welche Tests würdest du denn gerne sehen?



*Nostalgie*

Musste man früher nicht auch viel basteln und einstellen, um ein optimales System zu erhalten? *buck*

Da hast du natürlich recht. Allerdings haben "damals" die Einstellungen alle inoffiziellen Charakter gehabt. Und bei TR sind zumindest der Memory Access Mode und der Legacy Compatibility Mode offizielle Einflussmöglichkeiten. AMD führt diese Optionen überall mit ins Feld, sodass diese imho einen anderen Stellenwert genießen als es früher der Fall war.

Insgesamt hast du aber natürlich recht. ;)



Kannst du noch ein Problem verifizieren das ich bei SiSoftware Sandra Lite mit meinem TR System habe?
Der Test zur wissenschaftlichen Analyse schmiert dort regelmäßig ab, im Falle der GPU Tests kam es des öfteren gar zur Selbstabschaltung des Systems, wobei ich hier meine GPU Config mit 8 Fiji Chips nicht ausschließen möchte.

Da kann ich von mir aus mal einen Blick drauf werfen. Wird aber a) frühestens erst Ende nächster Woche und b) musst du mir das Szenario nochmal genauer beschreiben. Aber das sollten wir hinbekommen...



Super test hab haber bis jetzt die letzte hälfte nur überflogen lese ich nachher in ruher am PC

60watt mehr Leistungsaufnahme nur durch höheren Speicher Geschwindigkeit *buck*
Das Fazit könnte auch genau Andersrum lauten je nach Anwendung ist es sinnvoll auf langsamer Speicher zu setzen *suspect*

So könnte man das natürlich auch sehen. Wobei halt selbt Cinebench auf "zu" langsamen Speicher reagiert. Als Verbrauchssicht sicherlich sinnvoll, aus Leistungssicht eher nicht...



Hab auch mal nen Flüchtigkeitsfehler gefunden:

Benchmarks: Wieviel Performance bringt SMT?
Cinebench R15 Multi-Thread..... 2.960..... 2.129.... 39,03.... 2.944.... 21.33.... 38,02

Der Punkt kommt sicherlich hinter die 2 in der Tabelle ,2.133

--- Update ---

OK hier auch:
Benchmarks: schnellste und langsamste Einstellung

Oh, danke. Du hast recht, der Punkt soll woanders hin. Und es ist ein Copy/Paste-Fehler...



Bezüglich Asteroids und POGS im Test: "Mit knapp 83.000 Punkten pro Tag wird der Wert vom 1800X mehr als verdoppelt. Grund hierfür dürfte sein, dass es bei POGS eine relativ stark schwankende Punktevergabe pro Arbeitspaket gibt. Von den abermals über 60 WUs wurden relativ viele Pakete mit 297,18 Punkten belohnt und nur wenige mit weniger Punkten."
Das Gegenteil ist der Fall: POGS entwertet immer konstant. Die Pakete werden nur in unterschiedlichen Größenabstufungen verteilt. Bei Asteroids ist die Punktevergabe ebenfalls konstant, aber die Laufzeiten können sich je nach Batch verändern. So wird auch der Nachteil des TR gegen den R7 Ryzen zu erklären sein.

Du wirst recht haben. Ich wollte halt ausdrücken, dass die WUs in POGS unterschiedlich viele Punkte abwerfen - aufgrund welcher Ursache auch immer. Und dass der 1950X ziemlich viele davon mit 297 Punkten belohnt bekommen hat - was beim 1800X nicht der Fall gewesen sein muss.

Insgesamt wissen denke ich alle, was gemeint ist. Zumal es zwischen dem 1800X und dem 2x1800X (aka 1950X) keine allzu großen Unterschiede gibt (weder in puncto Effizienz noch Leistung).
 
Sofern ich es nicht überlesen habe.. Wie sieht es denn mit dem UV Potenzial aus?
 
Sofern ich es nicht überlesen habe.. Wie sieht es denn mit dem UV Potenzial aus?

3,4 GHz liefen 15 Minuten Prime95 In-place large FFTs mit eingestellten 0,9875 Volt. Habe ich weniger eingestellt, so bootete das System nicht mehr. Das tat es aber auch nicht bei 3,3 oder 3,2 GHz - 0,9875 Volt waren also quasi das Minimum.

Das steht auf der Overclocking-Seite des Artikels.
 
Ah, doch überlesen..

Sind die Balken im Diagramm zur Leistungsaufnahme mit den Spannungen/Frequenzen aus dem Plot drüber?

Lassen sich die Spannungen unter Windows evtl. weiter reduzieren? Oder gibt es ein Offset im BIOS (ich nehme an, die Spannungen und Frequenzen wurden fest eingestellt)?
 
Sind die Balken im Diagramm zur Leistungsaufnahme mit den Spannungen/Frequenzen aus dem Plot drüber?

Ja.



Lassen sich die Spannungen unter Windows evtl. weiter reduzieren? Oder gibt es ein Offset im BIOS (ich nehme an, die Spannungen und Frequenzen wurden fest eingestellt)?

Spannungen und Frequenzen wurden, bis auf den AUTO-Wert im Diagramm, fest eingestellt. Da hast du recht.

Ich habe im Windows versucht, die Spannung mit Ryzen Master zu reduzieren. Dummerweise wollte das Programm immer einen Reboot (obwohl das nach meinem Kenntnisstand bei der Spannung allein nicht sein dürfte) und beim Reboot blieb das System dann wieder hängen und startete nicht.

Und mit der AI Suite von ASUS ließen sich überhaupt keine Spannungen einstellen. Allerdings fürchte ich, dass das nur eine falsche Version war, denn laut anderen Reviews vom ROG Zenith Extreme bietet die Suite die Funktion - bei mir aber nicht.

Kurzum: Ich habe zwei Sachen aus Windows heraus ausprobiert bzw. wollte es ausprobieren, hatte aber keinen Erfolg. Deshalb: Möglich, dass aus Windows heraus die Spannungen niedriger einzustellen gehen, während meiner Tests konnte ich das aber nicht herausfinden.
 
Liegt die idle Spannung auch bei 0.9875V oder schaltet er da korrekt um?

Die 0.9875V kann man auch andernorts mit der Frequenz und einem Ryzen nicht unterbieten. Evtl. kommt der Sprung in der Betriebsspannung erst unterhalb 3GHz. Sollte dann einen Knick oder eine Stufe in der Effizienzkurve geben. Ungewöhnlich ist die konstante Spannung allerdings schon.
 
Da kann ich von mir aus mal einen Blick drauf werfen. Wird aber a) frühestens erst Ende nächster Woche und b) musst du mir das Szenario nochmal genauer beschreiben. Aber das sollten wir hinbekommen...

Kein Problem, es geht mir ohnehin mehr om eine Verifizierung des Problems. Ich schaue dann am besten auch nochmal nach deinem Problem mit dem AIDA64: FPU VP8 Test.
Es geht mir speziell um diese beiden Tests:
Tests 1.jpg

Wenn ich den Prozessor Test starte schmiert mir regelmäßig der dafür erforderliche Dienst ab und das ganze Programm mus neu gestartet werden:
Man sieht aber auch das er schonmal durchlief.
Fehler CPU Test.PNG

Beim GP Test mit hoher Genauigkeit schmierte der Dienst ebenfalls ab.
Anhang anzeigen 36310

In der OpenCL Variante lief er CPU only durch, bei normaler Genauigkeit und nur mit den GPUs hing sich der Rechner ganz auf.

--- Update ---

Ich habe den Test mit AIDA64 extreme 592 durchlaufen lassen und kann das Verhalten nur bestätigen.
Mit SMT läuft er durch, ohne SMT schmiert das Benchmark Modul kurz nach dem Start ab.
 
Wenn ich dich richtig verstehe, möchtest du einige Test im Game Mode ohne SMT, richtig? Also tatsächlich den 1.000-Euro-Prozessor auf ein Viertel seiner Threads kastrieren?!

Welche Tests würdest du denn gerne sehen?
.
Ich muss gestehen ich hatte dein Test am Handy bis Jetzt nur mal überflogen.......

Du schreibst aber:
Zudem zählen Takt und Kerne – aber nur reale Kerne. Denn im Game Mode mit 16 Threads ist der Test wesentlich langsamer als mit gleicher Thread-, dafür aber doppelter Kern-Anzahl. SMT gibt auch noch an anderer Stelle eine schlechte Figur ab: Ohne SMT ist der Test, unabhängig von UMA oder NUMA, schneller als mit SMT.


Das was Ich bis her Getestet hatte mit meinem R51400 im CineBench/BeatBench/HWBOTx265/HDBC schaut genau anders rum aus.
Deswegen oben auch noch die Frage ob die Software überhaupt mit so vielen Kernen umgehen kann und wie es ausschaut wenn 2 Programme gleichzeitig laufen.
BZW was passiert wenn HandBrake z.b. "NUR" mit 8Kerne/16 Threads und mit 8 Echten Kernen läuft.


Lese ich das richtig raus das du die Abschaltungen Nicht im Bios machst?

Game Mode......???
Hast im Bios keine Option wo steht 2Core / 4Core / 6Core / 8Core...........SMT On/Off?
Schaut bei mir so aus:



HandBrake schaut bei mir so aus:

R5 1400 @ 3.445MHz , Spannung -100mV , Turbo Aus , restliche Stromsparfunktionen An oder Auto , Windows7 Höchstleistung.
Ram 8GB G.Skill Kit 3200MHz @ 3066MHz 1,325V CL 14.15.15.30.52.T1
SOC Voltage 0,95V

HandBrake 4Kerne 103Watt =16.276730fps


HandBrake 4Kerne mit SMT 115Watt =20.409914fps

--- Update ---

AIDA64 v5.90.4242 Beta: FPU VP8 Test
Egal ob SMT an oder aus ist,das lüpt.
 
Zuletzt bearbeitet:
Liegt die idle Spannung auch bei 0.9875V oder schaltet er da korrekt um?

Ich habe bei dieser Einstellung Spannungswerte zwischen 0,98 und 1,0 Volt gesehen.



Min wurden mir schon 0,3....V angezeigt.


Kannst hier noch ein wenig besser sehen,die 4 Kerne mit 3 unterschiedlichen Spannungen.


Es geht weniger Spannung als 0,9875 Volt - keine Frage. Aber wenn ich diese Spannung fest einstelle und nicht mittels Stromsparmechanismen, dann bootet das System halt nicht.



Kein Problem, es geht mir ohnehin mehr om eine Verifizierung des Problems. Ich schaue dann am besten auch nochmal nach deinem Problem mit dem AIDA64: FPU VP8 Test.
Es geht mir speziell um diese beiden Tests:
Anhang anzeigen 36308

Wenn ich den Prozessor Test starte schmiert mir regelmäßig der dafür erforderliche Dienst ab und das ganze Programm mus neu gestartet werden:
Man sieht aber auch das er schonmal durchlief.
Anhang anzeigen 36309

Beim GP Test mit hoher Genauigkeit schmierte der Dienst ebenfalls ab.
Anhang anzeigen 36310

In der OpenCL Variante lief er CPU only durch, bei normaler Genauigkeit und nur mit den GPUs hing sich der Rechner ganz auf.

Das werde ich mir bei Gelegenheit mal anschauen. :)



Ich habe den Test mit AIDA64 extreme 592 durchlaufen lassen und kann das Verhalten nur bestätigen.
Mit SMT läuft er durch, ohne SMT schmiert das Benchmark Modul kurz nach dem Start ab.

Genau so verhält sich der Benchmark auch bei mir.

AIDA64 v5.90.4242 Beta: FPU VP8 Test
Egal ob SMT an oder aus ist,das lüpt.

Dann scheint der Benchmark "nur" ein Problem damit zu haben, wenn SMT bei den zwei Dies deaktiviert wird.

Ich werde deine Version bei Gelegenheit ausprobieren...



Du schreibst aber:
Zudem zählen Takt und Kerne – aber nur reale Kerne. Denn im Game Mode mit 16 Threads ist der Test wesentlich langsamer als mit gleicher Thread-, dafür aber doppelter Kern-Anzahl. SMT gibt auch noch an anderer Stelle eine schlechte Figur ab: Ohne SMT ist der Test, unabhängig von UMA oder NUMA, schneller als mit SMT.


Das was Ich bis her Getestet hatte mit meinem R51400 im CineBench/BeatBench/HWBOTx265/HDBC schaut genau anders rum aus.
Deswegen oben auch noch die Frage ob die Software überhaupt mit so vielen Kernen umgehen kann und wie es ausschaut wenn 2 Programme gleichzeitig laufen.

Das mag ja sein, dass es mit deinem R5 1400 anders läuft. Auf dem 1950X mit 16/16 bzw. 16/32 sieht das Bild aber nunmal (leider) so aus. Auf Seite 3 des Artikels, also der Seite mit der Gegenüberstellung der Ergebnisse mit und ohne SMT, steht auch, dass ich spekuliere, dass HandBrake eben nicht endlos skaliert - zumindest bei Fast 1080p/30.

Ich glaube, dass ist der Punkt, worauf du hinaus willst. Aber das steht schon im Artikel drin...



BZW was passiert wenn HandBrake z.b. "NUR" mit 8Kerne/16 Threads und mit 8 Echten Kernen läuft.

Was meinst du mit "8 Echten Kernen"? Meinst du eine Gegenüberstellung von 8/16 mit 8/8? Oder verstehe ich da was falsch?



Lese ich das richtig raus das du die Abschaltungen Nicht im Bios machst?

Doch, SMT habe ich im BIOS deaktiviert. Es ist aber egal, ob ich SMT im BIOS oder über Ryzen Master deaktiviere. Das Ergebnis bleibt gleich.




Was ist dir am Game Mode unklar?



Hast im Bios keine Option wo steht 2Core / 4Core / 6Core / 8Core...........SMT On/Off?

Doch, habe ich. Wieso?
 
Ich habe bei dieser Einstellung Spannungswerte zwischen 0,98 und 1,0 Volt gesehen.

Es geht weniger Spannung als 0,9875 Volt - keine Frage. Aber wenn ich diese Spannung fest einstelle und nicht mittels Stromsparmechanismen, dann bootet das System halt nicht.
Ich hab ihn so verstanden als ob er wissen wollte ob die Spannung auch bei manueller Änderung noch im Windows runter geht.



Dann scheint der Benchmark "nur" ein Problem damit zu haben, wenn SMT bei den zwei Dies deaktiviert wird.

Ich werde deine Version bei Gelegenheit ausprobieren...
Das könntest ja auch durch Kernabschaltung Gegentesten.



Das mag ja sein, dass es mit deinem R5 1400 anders läuft. Auf dem 1950X mit 16/16 bzw. 16/32 sieht das Bild aber nunmal (leider) so aus. Auf Seite 3 des Artikels, also der Seite mit der Gegenüberstellung der Ergebnisse mit und ohne SMT, steht auch, dass ich spekuliere, dass HandBrake eben nicht endlos skaliert - zumindest bei Fast 1080p/30.

Ich glaube, dass ist der Punkt, worauf du hinaus willst. Aber das steht schon im Artikel drin...


Was meinst du mit "8 Echten Kernen"? Meinst du eine Gegenüberstellung von 8/16 mit 8/8? Oder verstehe ich da was falsch?

Doch, SMT habe ich im BIOS deaktiviert. Es ist aber egal, ob ich SMT im BIOS oder über Ryzen Master deaktiviere. Das Ergebnis bleibt gleich.

Was ist dir am Game Mode unklar?
Hattest dir die Auslastung denn nicht angesehen beim Testen?
Ja diese Problematik mein ich,wenn du natürlich nicht drauf geachtet hast und HandBrake z.b. nur max 18 oder 20 Threads verwendet,dann kann es natürlich gut möglich sein das HandBrake SMT "Kerne" verwendet hatte weil du ja auch so gut wie keinen Unterschied beim Verbrauch hast.
Ich hab mit meinem ja schon rund 13Watt Unterschied.......
Deswegen auch den Test mit weniger Kernen und SMT.
Das sehe ich ja auch bei mir das die SMT "Kerne" meist zu erst verwendet werden.
Diese Mode allgemein....ich kann z.b. auch im Bios CineBench , GeekBench.......laden,nur läuft das CineBench Profil z.b. nicht wirklich.
Die CPUs,Ram,Mainboard sind ja nicht alle gleich,aber die Einstellungen sind Fest für Alle Komponenten.
Ich verwende lieber die Default Einstellung und stell ansonsten alles von Hand ein wie auch die Kernabschaltung....SMT.......und alles im Bios.
Softwareabschaltungen hatten doch noch nie wirklich Funktioniert,meist wurd es doch nur Ausgeblendet und die Kerne waren immer noch Aktiv was man am Stromverbrauch sehen konnte.





Doch, habe ich. Wieso?

Hattest darüber auch die Kerne Abgeschaltet mit und ohne SMT?
Wie genau kannst Kerne Abschalten und kannst auch die Dies einzeln Schalten?
 
Zuletzt bearbeitet:
Was mich noch interessieren würde wäre ob man die DIEs Einzelne untervolten kann
Bei epyc soll jedes DIE ja mit seiner optimalen Spannung laufen
 
smiley_emoticons_seb_zylinder.gif

Wow!

Wäre es möglich die Ergebnisse für 2666MHz bei den Speichertests auch mit in die Tabellen einzubauen? Der Unterschied zwischen 1833 und 3066 ist natürlich bei einigen Anwendungen enorm - aber mir stellt sich dann die Frage, liegt es an den doch seehr niedrigen Takt von 1833 oder ist vielleicht schon bei weniger Takt kaum noch eine Steigerung möglich? Vor allem im Hinblick auf die doch dünne Luft im Bereich von 3200MHz.

Bei den Boinc-Werten wurden wohl Mittelwerte genommen? Ich persönlich nehme da lieber immer den Median, weil der eben wunderbar die Ausreißer rausfiltert. Das ist dann zwar nur noch ein theoretischer Wert, aber in der Praxis kommt er über einen langen Zeitraum doch ganz gut hin.
 
Du hast wohl deinen Rechenknecht wieder in den Kühlschrank verbannt...? *buck*
 
Zurück
Oben Unten