AMD Ryzen Threadripper 1950X — Part Two

Artikel-Index:

Benchmarks: Wieviel Performance bringt SMT?

Wir begin­nen unse­ren heu­ti­gen Zah­len­ma­ra­thon mit einem Blick auf den Per­for­mance­vor­teil von SMT. Wir haben dazu jeweils eine Takt­ra­te von fes­ten 3,4 GHz mit DDR4-2666 ver­wen­det und in Ryzen Mas­ter ver­schie­de­ne Ein­stel­lun­gen vor­ge­nom­men. Der Default-Ein­stel­lung von UMA (Crea­tor Mode) haben wir des­halb noch die NUMA-Ein­stel­lung gegen­über gestellt. In der fol­gen­den Tabel­le haben wir die Ein­zel­er­geb­nis­se jeweils mit SMT Enab­led und Dis­ab­led dar­ge­stellt. Dane­ben befin­det sich in bei­den Fäl­len eine Spal­te mit der pro­zen­tua­len Dif­fe­renz zwi­schen SMT off und SMT on.

Auf den Ver­gleich des Game Mode mit und ohne SMT haben wir ver­zich­tet. Es wider­streb­te uns, eine 1.000-Euro-CPU auf nur ein Vier­tel ihrer Threads zu kas­trie­ren. Daher spielt die­se Ein­stel­lung in die­sem Ver­gleich kei­ne Rolle.

Bench­mark / Aspekt Crea­tor Mode, SMT Enabled Crea­tor Mode, SMT Disabled Dif­fe­renz in % SMT Dis­ab­led zu Enabled NUMA, Lega­cy Mode off, SMT Enabled NUMA, Lega­cy Mode off, SMT Disabled Dif­fe­renz in % SMT Dis­ab­led zu Enabled
AIDA64: Memo­ry Read 65.484 65.395 0,14 81.071 81.119 -0,06
AIDA64: Memo­ry Write 77.543 77.862 -0,41 81.464 80.995 0,58
AIDA64: Memo­ry Copy 71.444 71.679 -0,33 79.107 80.346 -1,54
AIDA64: Memo­ry Latency 102,1 103,2 1,07 77,5 77,5 0,00
AIDA64: CPU Queen 119.575 88.017 35,85 119.259 88.116 35,34
AIDA64: CPU PhotoWorxx 39.715 44.103 -9,95 46.087 51.824 -11,07
AIDA64: CPU ZLib 1.273,9 829,3 53,61 1.283,5 831,8 54,30
AIDA64: CPU AES 121.853 106.906 13,98 121.877 106.903 14,01
AIDA64: CPU Hash 41.085 26.996 52,19 41.082 26.987 52,23
AIDA64: FPU VP8 7.955 n.a. n.a. 7.314 n.a. n.a.
AIDA64: FPU Julia 70.968 67.773 4,71 70.984 67.746 4,78
AIDA64: FPU Mandel 37.177 35.630 4,34 37.175 35.611 4,39
AIDA64: FPU SinJulia 23.311 16.063 45,12 23.312 16.063 45,13
AIDA64: FP32 Ray-Trace 14.795 13.332 10,97 14.756 13.336 10,65
AIDA64: FP64 Ray-Trace 7.473 7.331 1,94 7.743 7.331 1,94
Cine­bench R15 Single-Thread 142 142 0,00 143 143 0,00
Cine­bench R15 Multi-Thread 2.960 2.129 39,03 2.944 2.133 38,02
Blen­der 13,8 18,4 25,00 13,8 18,4 25,00
Hand­Bra­ke: FPS 55,1 57,7 -4,51 50,9 54,1 -5,91
Hand­Bra­ke: Leistungsaufnahme 197,4 200,1 1,35 194,0 194,1 0,05
POV-Ray 44,7 54,9 18,58 44,7 54,8 18,43
Win­RAR Packen 144,5 130,7 -10,56 144,1 132,3 -8,92
Win­RAR Entpacken 66,6 66,3 -0,45 66,1 66,0 -0,15
7‑Zip Packen 197,7 198,1 0,20 255,9 265,7 3,69
7‑Zip Ent­pa­cken 87,4 87,7 0,34 87,0 86,4 -0,69
Veracrypt: Kuz­nye­chik 1.946 1.331 46,21 1.946 1.331 46,21
Veracrypt: Twofish(Serpent) 2.253 1.741 29,41 2.253 1.741 29,41
3DMark Fire­Strike: Gesamt 10.578 10.582 -0,04 10.677 10.551 1,19
3DMark Fire­Strike: CPU 24.256 20.351 19,19 25.525 21.511 18,66
3DMark Fire­Strike: Leistungsaufnahme 191,5 191,0 -0,26 193,7 190,6 -1,63
Metro Last Light Redux: FPS 59,3 59,8 -0,84 59,5 59,5 0,00
Metro Last Light Redux:
Leistungsaufnahme
292,8 287,7 -1,77 289,6 284,9 -1,65
Arma3: Yet Ano­ther Arma Benchmark 35,4 36,2 -2,21 41,9 39,8 5,28
Rise Of The Tomb Rai­der: FPS 77,8 78,0 -0,26 77,4 79,6 -2,76
Prime95 x64: Leistungsaufnahme 267 251 -6,37 256 249 -2,81
Idle: Leis­tungs­auf­nah­me 102 98 -4,08 100 98 -2,04
Durch­schnitts­ab­wei­chung     10,32     10,57
Durch­schnitts­ab­wei­chung
(ohne Leistungsaufnahme)
    12,41     12,60

Arbei­ten wir die Zah­len der Tabel­le ein­mal der Rei­he nach auf.

Im Durch­schnitt sind sich UMA und NUMA sehr ähn­lich, wenn es um die pro­zen­tua­le Leis­tungs­stei­ge­rung durch SMT geht. Etwas mehr als 10 Pro­zent mehr Leis­tung durch SMT steht gemit­telt über unse­ren Bench­mark-Par­cours zu Buche. Lässt man die Leis­tungs­auf­nah­me aus der Durch­schnitts­be­rech­nung her­aus, so reden wir über eine etwas mehr als 12 Pro­zent höhe­re Per­for­mance. Dabei schwan­ken die Ergeb­nis­se von Ein­zel­test zu Ein­zel­test sehr stark. Der ZLib-Test von AIDA64 pro­fi­tiert mit über 50 Pro­zent bei bei­den Ein­stel­lun­gen am Meis­ten, die nega­ti­ven Aus­rei­ßer unter­schei­den sich hin­ge­gen. Im Crea­tor Mode fährt SMT beim Packen mit Win­RAR den größ­ten Per­for­mance-Ver­lust ein, im NUMA-Betrieb ist das beim Pho­to­Wor­xx-Test von AIDA64 der Fall.

Der VP8-Test von AIDA64 stürzt, zumin­dest mit der von uns ver­wen­de­ten Soft­ware-Ver­si­on, ohne SMT bei jedem ein­zel­nen Durch­lauf ab. Der Test ist also ent­we­der auf SMT ange­wie­sen, oder aber – was wahr­schein­li­cher ist – er ist schlicht­weg nicht dar­auf vor­be­rei­tet, wenn SMT bei einer CPU deak­ti­viert ist. Der nächs­te nen­nens­wer­te Aspekt betrifft Arma3 (in der Tabel­le blau gekenn­zeich­net). Denn wäh­rend sich alle ande­ren Tests in der Ten­denz einig sind, unab­hän­gig von UMA und NUMA ent­we­der mit SMT zu gewin­nen oder zu ver­lie­ren (oder zumin­dest sehr gerin­ge Unter­schie­de nahe­zu im Rah­men von Mess­un­ge­nau­ig­kei­ten auf­zu­wei­sen), so zeigt Arma3 ein ande­res Bild. Im Crea­tor Mode wird Arma3 lang­sa­mer, wenn SMT akti­viert ist. Nutzt man den NUMA-Mode, so gewinnt Arma statt­des­sen fünf Pro­zent Leis­tung durch SMT hin­zu. Es zeigt sich also, dass die von AMD zur Ver­fü­gung gestell­ten Schal­ter im Ryzen Mas­ter nicht immer die glei­che Aus­wir­kung haben und im Zwei­fels­fall ein Test der genutz­ten Anwen­dun­gen sinn­voll sein kann. Andern­falls kann Leis­tung “ver­schenkt” werden.

Inter­es­sant ist auch, dass Hand­Bra­ke ohne SMT schnel­ler läuft als mit. Ein Zei­chen, dass das Pro­gramm nicht end­los mit immer mehr Threads ska­lie­ren kann – zumin­dest mit unse­ren gewähl­ten Ein­stel­lun­gen. Und wenn wir noch einen Blick auf 3DMark wer­fen, so fällt auf, dass trotz deut­li­cher Stei­ge­rung im CPU-Test kaum eine Ver­än­de­rung des Gesamt­ergeb­nis­ses statt­fin­det. Hier ver­mu­ten wir jedoch die Ursa­che in der Gewich­tung der ein­zel­nen Bench­mark­tei­le im Gesamtergebnis.

Hal­ten wir also fest: SMT reagiert je nach ver­wen­de­ter Soft­ware unter­schied­lich. Das Fea­ture kann einen deut­li­chen Per­for­mance-Schub gene­rie­ren, nega­ti­ve Ent­wick­lun­gen sind jedoch auch möglich.