News AMD bei Zen 3 mit mindestens acht Prozent höherer IPC?

pipin · 12.10.2019

AMD hat noch nicht einmal alle Zen 2 Desktopprozessoren vorgestellt, da tauchen erneut weitere Gerüchte und Spekulationen zum Nachfolger Zen 3 auf, nachdem in der vorigen Woche bereits eine AMD-Präsentation mit Informationen zu Zen 3 wohl versehentlich kurzzeitig in Netz gelangte (wir berichteten). Laut RedGamingTech soll Zen 3 bei der IPC (Instructions per cycle) gegenüber Zen 2 um mindestens acht Prozent zulegen.
(…)

» Artikel lesen

Peet007 · 12.10.2019

Das Problemkind was sehr viel Einfluß auf die Taktbarkeit hat ist die IF. Je mehr da drüber muss um so geringer fällt der Takt aus. Da wird man einiges optimieren können.

Hotstepper · 12.10.2019

@Peet007

Das kommt ja schon alleine durch einen gemeinsamen L3 Cache je Chiplet zustande. Dann muss nicht mehr jeder CCX zu CCX Verkehr über das IOD sondern nur noch der CCP zu CCP Verkehr. Sprich... der Traffic halbiert sich.

Peet007 · 13.10.2019

Was bei Zen 2 gnadenlos zuschlägt ist die VCore Grenze von ca. 1,2 Volt da steigt die Leistungsaufnahme extrem an. Wenn sie mit einer verbesserten Fertigung unter 1,2 Volt bis 4 GHz kommen wäre ja nicht schlecht. Der riesige L3 und IF sind da auch keine Sparwunder wenn Datenmenen drüber müssen.

Flodul · 14.10.2019

Ein vereinheitlichter L3-Cache wäre wirklich gut. Denn die Verbindung zwischen den CCXen ist wirklich langsam.
Es gibt ein bekanntes, praktisches Problem der Informatik nach dem ich kürzlich für eine bessere als die verfügbaren Lösungen suchte. Die Standard-Lösung skaliert nicht mit der Anzahl der Kerne / Threads und alle anderen Lösungen die besser skalieren als der naive Ansatz sind alle sub-optimal. Ich hab eine Lösung gefunden die bisher noch keiner gefunden hat und die so gut ist wie es nur möglich ist (hat aber dennoch nen fetten Overhead durch die Lansamkeit der Verbindungen zwischen den Caches). Beim Benchmarken musste ich feststellen, dass die Performance unter Windows 10 nach vier Threads um 35% zurückging. Das lag daran, dass Windows die ersten vier Threads auf einem CCX gruppierte, der fünfte aber dann aber einen Überlauf auf das nächste verursachte.

Die Balken-Gruppen sind die Anzahl der Threads von 1 bis 16. Die Balken in der Gruppe ist die Größe eines lock-freien Puffers den ich benötige um meine Datenstruktur ohne Kernel-Contention zu aktualisieren. Hab den Drop von Gruppe vier Threads auf Gruppe fünf Threads markiert.
Nebenbei sieht man mal den Unterschied zwischen single-threaded und multi-threaded zwischen Gruppe ein Thread und zwei Threads. Da fällt die Performance um 2/3 ab, allein dadurch, dass zusätzlich Cachezeilen-Inhalte zwischen den Kernen hin und her wandern müssen. Also ganz ohne, dass da Kernel-Synchronisation stattfindet.

News AMD bei Zen 3 mit mindestens acht Prozent höherer IPC?

pipin

Administrator

Peet007

Admiral Special

Hotstepper

Vice Admiral Special

Peet007

Admiral Special

Flodul

Commander

Ähnliche Themen