AMD Ryzen Threadripper 1950X — Part Two

Artikel-Index:

Fazit

Titelbild: AMD Ryzen Threadripper 1950X Part Two

Der zwei­te Blick auf Thre­ad­rip­per und sei­ne Per­for­mance liegt hin­ter uns. Weit über 500 Ein­zel­er­geb­nis­se haben wir erstellt, die Test­sys­te­me dazu weit über 1.000 Mal reboo­tet. Ein enor­mer Auf­wand, um zu erfah­ren, wie schnell AMDs aktu­el­les Flagg­schiff wirk­lich ist. Aber der Auf­wand hat sich gelohnt.

Bereits beim ers­ten Blick auf die Per­for­mance unse­res 1950X haben wir fest­ge­stellt, dass Thre­ad­rip­per mehr denn je auf die rich­ti­ge Soft­ware ange­wie­sen ist. Nicht, weil er sonst (zu) lang­sam agiert, son­dern weil sonst ein Teil der Leis­tung brach­lie­gen kann. Mit dem heu­ti­gen Review müs­sen wir die­se Aus­sa­ge aber noch ergän­zen. Denn nicht nur die Soft­ware selbst soll­te mit den Res­sour­cen etwas anfan­gen kön­nen, auch die rich­ti­ge Ein­stel­lung will gesetzt sein. Bei iden­ti­scher Takt­ra­te von RAM und CPU sowie iden­ti­schen Spei­cher­ti­mings las­sen sich mehr als 50 Pro­zent Leis­tung her­aus­kit­zeln, wenn die Optio­nen Memo­ry Access Mode, Lega­cy Com­pa­ti­bi­li­ty Mode und SMT (Simul­ta­neous Mul­ti­th­re­a­ding) geschickt gesetzt wer­den. Natür­lich gilt das nicht immer aus­ge­hend vom Werks­zu­stand, son­dern stellt die Dif­fe­renz zwi­schen der lang­sams­ten und der schnells­ten Ein­stel­lung dar. Das ändert jedoch nichts dar­an, dass selbst in die­sen drei Optio­nen eine Men­ge Leis­tungs­po­ten­zi­al liegt. Daher unse­re Emp­feh­lung: Wer häu­fig mit der glei­chen Soft­ware arbei­tet, der soll­te zumin­dest die­se hin­sicht­lich ihrer schnells­ten Ein­stel­lung aus­tes­ten. Es kann sich lohnen.

Die Akti­vie­rung von SMT bringt sowohl im UMA- als auch im NUMA-Modus gemit­telt über unse­ren Bench­mark-Par­cours etwa 10 Pro­zent mehr Leis­tung gegen­über dem Betrieb ohne SMT. Dabei sind sich UMA und NUMA äußerst ähn­lich – mit einer Aus­nah­me: Arma3. Wäh­rend die Mili­tär­si­mu­la­ti­on im UMA-Betrieb mit SMT etwas Leis­tung ver­liert (2,21 Pro­zent), so gewinnt sie im NUMA-Modus durch SMT etwas Per­for­mance hin­zu (5,28 Pro­zent). Alle ande­ren Bench­marks zei­gen ent­we­der immer die glei­che Ten­denz oder bewe­gen sich um den Null­punkt. Nur Arma reagiert hier deut­lich unter­schied­li­cher. Zwar han­delt es sich in Sum­me noch immer um einen Wert von deut­lich weni­ger als 10 Pro­zent und es betrifft bei uns auch nur die­se eine Anwen­dung, die Erkennt­nis dar­aus ist jedoch son­nen­klar: SMT off muss nicht gleich SMT off sein. Anwen­dun­gen kön­nen unter­schied­lich reagie­ren, was der geneig­te User durch­aus aus­tes­ten sollte.

In punc­to Spei­cher­ti­mings kön­nen wir fest­hal­ten, dass der Ein­fluss auf die Leis­tung über­schau­bar ist. Bei DDR4-1866 von 14–14-14–36 1T auf 10–9‑9–27 1T bei gleich­zei­tig ver­schärf­ten Sub­ti­mings gewan­nen die von uns genutz­ten Anwen­dun­gen etwa drei Pro­zent Leis­tung hin­zu. Aller­dings gibt es ein­zel­ne Aus­rei­ßer, sodass 7‑Zip beim Packen sogar 16 Pro­zent schnel­ler agiert. Die­ser Wert darf jedoch nicht dar­über hin­weg täu­schen, dass solch ein enor­mer Sprung bei den Timings nur bei nied­ri­gen Spei­cher­takt­ra­ten mög­lich ist. Höhe­re Tak­te bedeu­ten gerin­ge­re Anpas­sungs­mög­lich­kei­ten. Gleich­zei­tig zeig­te sich, dass DDR4-1866 mit straf­fen Timings stel­len­wei­se deut­lich lang­sa­mer agier­te als DDR4-2666 mit mit­tel­präch­ti­gen Timings. Des­halb macht die Jagd nach schär­fe­ren Timings nur dann Sinn, wenn der Spei­cher­takt nicht gleich­zei­tig (stark) ver­rin­gert wer­den muss. Die Balan­ce ist entscheidend.

Beim Spei­cher­takt sieht es da schon etwas anders aus. Von DDR4-1866 zu DDR4-3066 mit fast kom­plett iden­ti­schen Timings konn­te unser Test­sys­tem etwa 11 Pro­zent an Leis­tung zule­gen. 11 Pro­zent klingt auch erst­mal nicht viel, aller­dings ist das eben nur der Mit­tel­wert. 7‑Zip und Win­RAR beim Packen sowie Arma3 gewin­nen bei die­sem Sprung jeweils mehr als 25 Pro­zent Leis­tung hin­zu, was dann ein ganz ande­res Bild zeich­net. Inwie­weit sich hier der rei­ne Spei­cher­takt bemerk­bar macht oder viel­leicht doch eher die erhöh­te Band­brei­te der Infi­ni­ty Fabric zur Inter-Core-Kom­mu­ni­ka­ti­on, lässt sich (wie auch bei Ryzen) nicht sagen. Die­se Fra­ge­stel­lung ist jedoch zweit­ran­gig, weil bei­de Aspek­te untrenn­bar mit­ein­an­der ver­bun­den sind. Und Leis­tungs­plus ist nun­mal Leis­tungs­plus – egal, wer genau dafür ver­ant­wort­lich ist.

Das The­ma Over­clo­cking hielt abschlie­ßend auch noch ein­mal eine klei­ne Über­ra­schung für uns bereit. Nied­ri­ge­re Wer­te als ein­ge­stell­te 0,9875 Volt lie­ßen unser Sys­tem nicht mehr star­ten. Und die­se Span­nung genügt bereits für 3,4 GHz, sodass ein Unter­tak­ten von unse­rem 1950X aus Effi­zi­enz­grün­den kei­nen Sinn macht. Aber auch beim Über­tak­ten muss­ten wir fest­stel­len, dass es kei­nen rich­ti­gen Sweets­pot gibt. Jede Erhö­hung der Takt­ra­te benö­tigt mehr zusätz­li­che Span­nung als der vor­her­ge­hen­de Takt­schritt. Bis 3,6 GHz sind die not­wen­di­gen Mehr­span­nun­gen noch rela­tiv klein, dar­über steigt die Kur­ve deut­lich stei­ler an. Im Ver­gleich zur Stan­dard-Leis­tungs­auf­nah­me könn­te man jedoch einen Wert um etwa 3.750 MHz als Sweets­pot aus­ma­chen. Denn bei etwa die­ser Takt­ra­te wür­de man gleich viel ver­brau­chen wie ohne OC mit akti­vier­tem Tur­bo-Modus, hät­te jedoch mehr Takt­ra­te zur Verfügung.

Das Fazit zusam­men­ge­fasst heißt: Thre­ad­rip­per bie­tet vie­le leis­tungs­stei­gern­de Mög­lich­kei­ten, wobei die­se Optio­nen in unter­schied­li­chen Kom­bi­na­tio­nen auch unter­schied­li­che Ergeb­nis­se her­vor­brin­gen kön­nen. Wer sich eine Sockel-TR4-CPU kauft, der soll­te sich zumin­dest bei den von ihm am häu­figs­ten genutz­ten Anwen­dun­gen die Mühe machen, eini­ge Ein­stel­lun­gen aus­zu­pro­bie­ren. Die Mög­lich­keit, trotz glei­cher Takt­ra­te und Timings noch eini­ge Pro­zent­punk­te an Leis­tung her­aus­zu­kit­zeln, ist groß.