AMD Zen 3 Architektur im Detail
Änderungen – CCX-Topologie und L3-Cache
CCX-Topologie und L3-Cache
Die offensichtlichste und seit langem bekannte Änderung bei Zen 3 gegenüber Zen 2 ist der Aufbau des Core Complex (CCX). Bisher bestand ein Compute-Die (CCD) aus zwei CCX von je 4 Kernen, die jeweils einen eigenen L3-Cache mit 16 MB Größe besaßen. Wollten Kerne aus verschiedenen CCX miteinander kommunizieren, musste dazu über den Infinity-Fabric-Link (IF) zugegriffen werden, was deutlich mehr Latenz erzeugte als der Zugriff innerhalb eines CCX. Auf den Last-Level-Cache des fremden CCX konnte gar nicht zugegriffen werden. Gerade bei Spielen, die nicht am GPU-Limit hingen und auf Monitoren mit hoher Bildwiederholrate oder deaktiviertem VSync möglichst hohe Frameraten erreichen sollten, war diese Bauweise nachteilig und eine der letzten großen Domänen aktueller Intel-Prozessoren.
Bei Zen 3 hat AMD diese Topologie nun geändert. Ein CCD besteht nicht mehr aus zwei CCX mit je 4 Kernen und separaten L3-Caches, sondern aus einem CCX mit 8 Kernen und gemeinsamem L3-Cache. Die Modelle mit 6 und 8 Kernen können so über 32 MB Last-Level-Cache verfügen und miteinander kommunizieren ohne Umweg über das IF. Welch positiven Effekt das haben kann, hatte bereits die Einführung des Ryzen 3 3300X angedeutet, bei dem ein CCX komplett deaktiviert wurde und seine 4 Kerne innerhalb eines CCX beheimatet waren. Genauso ist das nun auch bei Ryzen 5000, mit dem Unterschied, dass es nicht mehr 4 Kerne und 16 MB L3 sind, sondern 8 Kerne und 32 MB, die hier verzögerungsarm miteinander kommunizieren dürfen. Andererseits darf nicht verschwiegen werden, dass AMD die Bandbreite aus dem L3-Cache nicht verändert hat. Während also bisher nur 4 Kerne aus dem L3-Cache nuckelten, sind es nun bis zu 8; bei unveränderter Bandbreite.
Zudem gibt AMD offen zu, dass die neue Topologie nicht unter allen Umständen zu kürzeren Latenzen führt. So sollen durch die höhere Anzahl an Kernen innerhalb des CCX einige kleine Zugriffsmuster länger dauern als zuvor und auch die L3-Latenz dürfte aufgrund der Größe etwas länger dauern; laut AMD 46 Takte gegenüber 39 bei Zen 2 und 35 bei Zen 1. Unter dem Strich bleibt aber ein Plus, schon allein dadurch, dass die Latenzen nun gleichbleibend sind und der für jeden Kern nutzbare L3-Cache doppelt so groß ist. AMD verspricht bei 1080p-Gaming im Mittel +26 % Performance, bei speziellen CPU-intensiven Titeln wie League of Legends oder Counter-Strik: Global Offensive noch deutlich mehr (+40 bis 50 %).
Bei Modellen mit mehr als einem Compute-Die, also bei den 12- und 16-Kernern, bleibt natürlich eine zusätzliche Latenz, nämlich immer dann, wenn ein Kern aus Die 1 mit einem Kern aus Die 2 kommunizieren muss. Dies geschieht wie bisher via IF.