Zen 2 — AMD Ryzen 7 3700X und Ryzen 9 3900X im Test

Artikel-Index:

AMD Ryzen 3700X Mikroarchitekturbenches

Für wei­te­re Tests ver­wen­de­ten wir die Soft­ware RMMA in der Ver­si­on 3.8. Dort kön­nen ver­schie­de­ne Mikro­ar­chi­tek­tur­bench­marks aus­ge­wählt wer­den, mit denen man die Aus­wir­kun­gen von AMDs Archi­tek­tur­än­de­run­gen über­prü­fen kann. Alle Ben­ches wur­den bei 4.0 Ghz und deak­ti­vier­ten Strom­spar­me­cha­nis­men durch­ge­führt, um etwa­ige Abwei­chun­gen so gering wie mög­lich zu halten.

Zuerst ver­wen­den wir einen nor­ma­len Cache-Zugriffs­bench mit zufäl­li­gem Zugriffs­mus­ter (ran­dom), um die obi­gen CPU-Z-Wer­te zu verifizieren:

AMD Ryzen 9 3900X im Detail - RMMA

Erfah­rungs­ge­mäß schnei­den Tests mit Zufalls­zu­griffs­mus­ter schlech­ter ab, als die CPU-Z-Tests, den­noch zei­gen sich kei­ne gro­ßen Abwei­chun­gen. L1-Daten ste­hen nach 4 Tak­ten zur Ver­fü­gung, L2-Daten nach ca. 12 Tak­ten und der L3 schafft es um die 40 Tak­te. Auf­fal­lend ist, dass die alte Zen-Archi­tek­tur etwas bes­ser abschnei­det. Ob dies an der Archi­tek­tur selbst, oder an unrei­fen BIOS-Ver­sio­nen liegt, müs­sen zukünf­ti­ge Tests klären.

Um die Hal­bie­rung des L1I-Caches zu veri­fi­zie­ren führ­ten wir auch die Tests für den Instruk­ti­ons­cache durch. Den Unter­schied sieht man deut­lich im Pseu­do-Ran­dom Zugriff:

AMD Ryzen 9 3900X im Detail - RMMA

Dar­an sieht man auch den Grund für AMDs Ent­schei­dung, den I‑Cache zu ver­klei­nern. Die Pre­fet­ch­au­to­ma­tik ist auch bei Pseu­do-Ran­dom­zu­grif­fen gut genug, um die Latenz im Spei­cher­be­reich über 32 kiBy­te auf dem Niveau des alten Designs mit 64 kiBy­te zu hal­ten. Mehr noch — es kann sogar bis ca. 300 kiBy­te gehal­ten wer­den. Im L3-Bereich und im RAM-Spei­cher­be­reich zei­gen sich wie­der die bereits oben genann­ten Nach­tei­le der neu­en Gene­ra­ti­on gegen­über der Vorgängerversion.

Inter­es­sant wird es nun natür­lich, ob man die µCode-Cache-Ände­rung visua­li­sie­ren könn­te. Die­se zei­gen sich in der Tat in den Deco­ding-Sub­bench­marks. Dazu tes­te­ten wir die Deko­die­rung von Compa­re (CMP) Instruk­tio­nen, jeweils mit und ohne Präfixe:

AMD Ryzen 9 3900X im Detail - RMMA

AMD Ryzen 9 3900X im Detail - RMMA

Bei bei­den sieht man anfangs eine star­ke Deko­dier­leis­tung zwi­schen 20 und 25 Byte/Takt. Die Vor­gän­ger­ge­ne­ra­ti­on zeigt dabei einen frü­he­ren Ein­bruch der Deko­dier­ra­te bei ca. 6 kiB, der neue Zen 2 kann die höhe­re Rate dage­gen bis ca. 12 kiB hal­ten. Die­se ist etwas gerin­ger — mög­li­cher­wei­se muss­te die Zugriffs­zeit auf­grund der Grö­ßen­än­de­rung leicht ver­schlech­tert wer­den. Im L3- und RAM-Bereich zei­gen sich wie­der die genann­ten Schwä­chen der aktu­el­len Testkonfiguration.

Als klei­nes Zwi­schen­fa­zit lässt sich fest­stel­len, dass die Ver­klei­ne­rung des L1-Instruk­ti­ons-Caches nicht groß ins Gewicht fal­len dürf­te. Der ver­grö­ßer­te µOp-Cache zeigt sei­ne Vor­tei­le und ega­li­siert die Nach­tei­le, außer­dem wur­de die L2-Anbin­dung — genau­er: deren Pre­fetch — ver­bes­sert. Scha­de nur, dass AMD im Gegen­zug nicht den L1-Daten­cache auf 64 kIB ver­grö­ßer­te. Etwas merk­wür­dig sind die Leis­tungs­nach­tei­le des neu­en Designs im L3-Bereich. Einer­seits wäre es nor­mal, dass ein dop­pelt so gro­ßer Cache die Daten etwas lang­sa­mer lie­fern kann, ande­rer­seits soll­te der Her­stel­lungs­pro­zess-Vor­teil von 7 nm die­sen Nach­teil aber wie­der auf­fan­gen kön­nen. Frü­he BIOS-Ver­sio­nen mit kon­ser­va­ti­ven Timings sind als Grund für das etwas schlech­te­re Abschnei­den eben­falls ein mög­li­cher Grund. In der Rea­li­tät dürf­ten aber in jedem Fall die Vor­tei­le durch den dop­pelt so gro­ßen L3-Cache überwiegen.