[User-Review] Zen2 Benchmark Analyse

Hotstepper

Vice Admiral Special
Mitglied seit
12.04.2005
Beiträge
831
Renomée
117
Hallo zusammen!

kürzlich gabs einen Userbenchmark Leak des aktuellen Zen2 ES mit 12C/24T @3.4GHz und 3200MHz CL22 RAM.

Mit Kollegen (RalNi. und Manuel und ZeroZerp - merci nochmal) haben wir das mal mit ihren Ryzen 1600x, 1200, 2600x und einem 9900k einmal grob nachgestellt.

Ich glaube aus den Werten lassen sich einige Dinge ableiten, die ganz interessant sind.

Beispielsweise:

Der Userbenchmark misst die Rechenwerke im Single Thread durch.

Ein 1600x kommt dabei auf eine Score von

96 Punkten für Integer bei 3.4GHz
105 Punkte für Float bei 3.4GHz
83ns Latenz bei 3200MHz CL22 (Settings)

Ein 1200er auf 3.4GHz kommt auf die gleichen Werte und zeigt die Messtoleranz.

Ein 2600x auf 3.4GHz kommt CPU seitig ebenfalls auf die exakt gleichen Werte, landet bei den RAM Latenzen allerdings besser (*)

96 Punkten für Integer bei 3.4GHz
105 Punkte für Float bei 3.4GHz
76ns Latenz bei 3200MHz CL22 (*)

Zuersteinmal bleibt dabei hängen, dass der Userbenchmark wirklich rein die Rechenwerke misst. Das Frontend spielt dabei offensichtlich kaum eine Rolle sonst hätte der Zen+ mit seinen schnelleren Caches und den kürzeren Latenzen zum RAM hier einen Vorteil gegenüber Zen, der sich aber in diesem Benchmark nicht wiederspiegelt.

Das ES von Zen 2 kommt taktgleich auf eine Score von

95 Punkten für Integer bei 3.4GHz
121 Punkten für Float bei 3.4GHz
79.8ns Latenz bei 3200MHz CL22 (Quelle:Micron--> DataSheets)

Das lässt einige Erkenntnisse zu.

Am Integer Rechenwerk hat sich grundsätzlich nichts getan. Die IPC wird hier allenfalls durch die Verbesserungen am Frontend (Cache Größen, Sprungvorhersage etc. besser werden). INT SingleCore Leistung wird also vermutlich haupstsächlich über den Takt steigen.

An der FPU haben sie hingegen erheblich was verbessert. +15% IPC rein durch die Verbesserungen am Rechenwerk selbst. Dazu kommen dann noch Frontend Verbesserungen + Takt.

Das gleiche gilt für die gemessene QuadCore Leistung. Die Integer Performance liegt innerhalb der Messtoleranz zwischen Zen, Zen+ und Zen2, die FPU Leistung des Zen2 ES liegt 14.9% darüber.

Zu guter Letzt haben wir noch einen taktgleichen Bench mit einem 9900k (Coffee Lake Refresh) durch den Userbenchmark getrieben, um einen Anhaltspunkt zur Leistungsfähigkeit der Rechenwerke des aktuellen Konkurenten zu haben. (Herzlichen Dank an ZeroZerp!)


Im Ergebnis sind das:

102 Punkten für Integer bei 3.4GHz
108 Punkte für Float bei 3.4GHz
60ns Latenz bei 3200MHz CL22 (**)

Single Core Leistung in UB aufgeschlüsselt nach INT und FPU als bar chart:

performance.png

Die Latenz zum RAM wird durch die Verlagerung des IMC auf das I/O Die also nicht entscheident leiden, es wird tendenziell eher besser gegenüber Zen und auch Zen+ (* - beachten). Typisch für den Intel IMC ist, das er eine erhebliche bessere Latenz aufweisst woran sich auch durch Zen2 nichts ändert. Allerdings hat auch der Intel IMC seine Schattenseiten, und die werden offensichtlich bei der Messung des Durchsatzes. Bei diesem kann Zen2 gegenüber Zen+ nochmal eine kleine Schippe drauf legen und liegt somit 21% oberhalb des Intel IMC. Die Vermutung liegt nahe das hier zwei unterschiedliche Philosophien am Werk sind. AMD opfert Latenz für Durchsatz bzw. umgekehrt.

Zusammengefasst die Leistung der IMC:

IMC Performance.png

Zuletzt noch eine konkrete Gegenüberstellung der Latenzen der verschiedenen Generationen in der Speicherhierarchie L1-L2-L3-RAM:

caches.png

Demnach sind die L1 Caches etwas schneller geworden, die L2 Caches einen Hauch langsamer und die L3 Caches ebenfalls etwas langsamer, dafür aber ist deutlich zu sehen das die Größe des L3 verdoppelt wurde.

In Anbetracht dessen, dass dies ein Engineering Sample ist, muss allerdings abgewartet werden ob die finalen Cache/RAM Latenzen nicht doch noch etwas kürzer werden. Bei Zen wurde durch AGESA 1.0.0.4 selbst nach Release noch an den RAM Latenzen gearbeitet. Bei den Rechenwerken selbst würde ich keine Veränderung mehr erwarten.

Gruss und ich hoffe es war eure 3 min und meine 2 Stunden wert ;-)

Hotstepper

EDIT: Werte für Zen+ hinzugefügt

* - 3200MHz FlareX RAM@XMP und anschließend verlängerten Primär Timings auf 22-22-22-22-44. Sehr wahrscheinlich durch das XMP Profil aber kürzere Sekundärtimings als der beim Zen2 verwendete JEDEC konforme 3200MHz CL22 RAM. Generell war bei allen Messungen der Zen und Zen+ "RAM Power Down" im BIOS disabled.

Edit 2: Vergleich der Performance der Cache Hierarchien. Zen--Zen+--Zen2 hinzugefügt


Edit 3: 9900k Coffee Lake Refresh als Vergleich hinzugefügt (Dank an ZeroZerp aus der CB Community)

(**) - 4000MHz G.SKILL F4 Dual Rank Speicher mit reduzierten Primär Timings. Es gelten die gleichen Punkte mit Vorsicht zu genießen wie beim künstlich reduzierten FlareX.
 
Zuletzt bearbeitet:
Architecture
Zen 2 inherits most of the design from Zen+ but improves the instruction stream bandwidth and floating-point throughput performance.

Key changes from Zen+
7 nm process (from 12 nm)
I/O die still utilizes 14 nm
Core
Front-end
Improved branch prediction unit
Improved prefetcher
Improved µOP cache tags
Improved µOP cache
Larger µOP cache (?? entries, up from 2048)
Increased dispatch bandwidth
Back-end
Increased retire bandwidth (??-wide, up from 8-wide)
FPU
2x wider datapath (256-bit, up from 128-bit)
2x wider EUs (256-bit FMAs, up from 128-bit FMAs)
2x wider LSU (2x256-bit L/S, up from 128-bit)
Security
In-silicon Spectre enhancements
Increase number of keys/VMs supported
I/O
PCIe 4.0 (from 3.0)
Infinity Fabric 2
2.3x transfer rate per link (25 GT/s, up from ~10.6 GT/s)
This list is incomplete; you can help by expanding it.
das weiss man doch schon länger ^^
 
Yo, aber halt nicht quantifiziert was dabei rumkommt, nicht was die RAM Latenz angeht, nicht ob sich bei INT etwas tut. ^^
 
Man muss es ja nicht schlecht reden, wenn jemand eine Analyse macht.

Zu meckern hätte ich höchstens, dass der "User Benchmark" doch sehr umstritten ist. Und ZEN+ -Werte wären interessant.
 
Zuletzt bearbeitet:
Danke für die Mühe, allerdings wissen wir wohl vieles erst genau bei Release. Z.B. RAM-latenz. Bei mir bringt z.B. Power Down Mode ganze 12ns Latenz, jedoch wird nirgendwo gesagt, wo und wie die eingestellt wurde.
 
Zuletzt bearbeitet:
Merci! Habs gesehen! Sehr gerne!

Falls ein Mitleser einen halbwegs aktuellen Intel hat und den mal @3.4GHz durch den UB treiben will, wäre natürlich super. Ich hab nur den i3-4130 in der UB Datenbank gefunden. Das ist aber Haswell und daher etwas veraltet.

Der liegt durchschnittlich bei:

90.4 Punkten für Integer bei 3.4GHz
91.3 Punkten für Float bei 3.4GHz

EDIT: Hat sich erledigt - 9900k ist hinzugefügt.
 
Zuletzt bearbeitet:
Hab ichs überlesen oder würde noch kein Vergleich mit 3200MHz CL 16.16.16.....gemacht?
Ich glaub nicht das Final Zen2 bei 3200MHz mit so bescheidenen Timing Laufen wird.Und dann wäre der Vergleich mit dem 9900K noch mal interessant da AMD deutlich mehr von Timings Profitiert als Intel.
 
@Casi030

Der Benchmark des Zen2 stammt vermutlich aus der laufenden Validierung des RAMs nach JEDEC 3200MHz (siehe News), denn die verwendeten Module im UB des Zen2 ES (Micron 8ATF1G64AZ-3G2) sind laut Micron (Quelle ist verlinkt) 3200MHz CL22-22-22-22 JEDEC konforme Module ohne XMP. Micron gibt aber keine weiteren Subtimings an so das wir das nur nach den Primärtimings nachstellen konnten.

Ich halte es für unwahrscheinlich, dass die 3200MHz CL22 Module mit manuell angezogenen Timings durch den UB liefen. Daher haben wir alle Tests der anderen CPUs ebenfalls mit 22-22-22-22 Timings durchgeführt. Das ist halt bona fide das Beste was man tun kann, wobei die Micron Module @SPD @JEDEC bei 1.2V vermutich etwas längere Subtimings hatten als die anderen im Test verwendeten Module, die ja XMP 1.35V Module sind.

Das ganze hat aber auf die Single Core INT und FPU Werte eh kaum einen Einfluss. Der Benchmark variert bei gegebenem CPU Takt kaum ausgehend von unterschiedlichen RAM Frequenzen. Das ist auch gewollt, weil der Userbenchmark die Performance der einzelnen Komponenten unabhängig von einander testen soll. Das klappt ja auch sehr zuverlässig, wie man an der sehr niedrigen Varianz sehen kann, bringt aber gleichzeitig auch Nachteile mit sich, weil das Frontend kaum mitgemessen wird.

Das bleibt hier eine Variable. Schlechter als Zen+ wird die Performance des Frontends aber sicherlich nicht sein.
 
Zuletzt bearbeitet:
Stimmt (R5 2400G),95 und 104 nur die Latenz bei 3200MHz CL16 ist auf 73 runter mit 16GB DR.
 
Ist ja ganz praktisch das Deiner mit CL16 ist, denn damit wird deutlich, dass der Userbenchmark CPU Bench relativ RAM unempfindlich läuft.

Man braucht sich darüber keinen Kopf machen.

P.S.: Ich hab ihn für Dich gefunden und schon verlinkt.
 
Hier nochmal die Werte normiert auf den i9

ProzessorInteger
Float
Latenz (in ns)
AMD Ryzen 1600X @3,4 GHz (Zen)9694,12 %10597,22 %8361,67 %
AMD Ryzen 2600X @3,4 GHz (Zen+)9694,12 %10597,22 %7673,33 %
ES AMD @3,4 GHz (Zen 2)9593,14 %121112,04 %79,367,83 %
Intel Core i9-9900K102100%108100%60100%
 
https://www.userbenchmark.com/UserRun/17482084

AMD Ryzen 2700X (Zen+) mit DDR4 2400 MHz CL17

Code:
UserBenchmarks: Game 40%, Desk 144%, Work 127%
CPU: AMD Ryzen 7 2700X - 103.4%
GPU: AMD Radeon  Pro WX 5100 Graphics - 29.2%
SSD: Samsung 970 Evo NVMe PCIe M.2 1TB - 299.3%
SSD: SanDisk SSD 128GB - 56.5%
SSD: Crucial MX200 250GB - 112.9%
HDD: Seagate Desktop SSHD 4TB - 97.7%
HDD: Intenso USB 3.0 device 4TB - 99.1%
RAM: Micron 18ADF2G72AZ-2G3B1 2x16GB - 85.6%
MBD: Asus ROG STRIX B350-F GAMING

SC Int 120
SC Float 128

MC Int 1,298
MC Float 1,342

Als Vergleichswert, alle Einstellungen auf Auto, keine Übertaktung.
 
Zuletzt bearbeitet:
Mit vernünftigem Speicher rückt man dem 9900K schon gefährlich auf die Pelle..
 
Ja das schaut für Intel richtig beschissen aus wenn der kleine 6 Kern mit deutlich weniger cTDP schon so dicht an die Topmodelle rückt.Der Abstand zum 2600 ist schön recht groß.
Im Cinebench R15 Multi sollte der R7 3800x locker auf 2100 Punkte kommen.....Single um 210 Punkte.....

--- Update ---

Ich mein gut die Kernleistung würd schon mit den Ryzen 1 erreicht,aber jetzt kommt noch die leichte Taktangleichung und man kann gut sehen das bei fast gleichem Takt der Intel deutlich anfängt zu schwächeln.
 
Zuletzt bearbeitet:
@Stefan Payne :Ja danke für den Hinweis. Es heißt wirklich Takt ohne ck.

Wenn schon der R5 3600 diese Geschwindigkeit bietet mit schnellem Speicher wird ein R7 3800X mit Single Threaded Software
richtig loslegen. Ob der "andere" Mitbewerber die Endkundenpreise herabsetzt?
 
Zuletzt bearbeitet:
Zurück
Oben Unten