AMD EPYC Milan‑X mit 3D-V-Cache zuerst in Azure-Cloud
Auf dem angekündigten Datacenter-Event, das interessierte Zuseher gestern Abend auch bei uns im Forum verfolgen konnten, hat AMD unter anderem die neuen EPYC Server-Prozessoren mit Codenamen Milan‑X und 3D-V-Cache vorgestellt. Es handelt sich dabei um eine Technologie, die AMD bereits im Sommer anhand eines speziellen Ryzen 5900X demonstriert hatte: Dabei wurde einem Ryzen 9 5900X, der serienmäßig mit 32 MB L3-Cache je Compute-Die ausgestattet ist, per 3D-Stacking über Through Silicon Vias (TSV) 64 MB zusätzlicher L3-Cache je Die übergestülpt. Im Falle des EPYC mit seinen bis zu acht CCDs ergibt dies eine Gesamt-L3-Cache-Größe von sagenhaften 768 MB. Da AMD die L1- und L2-Caches auch noch dazu addiert, was nicht ganz korrekt aber aufgrund der non-inclusive Cache-Verwaltung der aktuellen AMD-Prozessoren auch nicht gänzlich verkehrt ist, war auf der Veranstaltung von 804 MB Cache die Rede.
AMD bringt die 3D-V-Cache Technologie, die im Sommer als besonders günstig im Spieleumfeld angepriesen wurde, nun doch zunächst im Server-Bereich. Den Anfang macht direkt die Microsoft Azure-Cloud, wo der Milan‑X im Rahmen der “Azure HBv3 virtual machines for HPC” bereits getestet werden kann. Der Produktivbetrieb soll “bald” gestartet werden, ohne jedoch einen konkreten Termin zu nennen.
Microsoft nennt ein paar Zahlen, mit welchen Verbesserungen im HPC-Umfeld zu rechnen ist:
80 percent higher performance for CFD
60 percent higher performance for EDA RTL
50 percent higher performance for explicit FEA
19 percent higher performance for weather simulation
Am meisten profitieren natürlich Workloads, bei denen durch den massiv vergrößerten Cache nur noch selten oder gar nicht mehr auf das RAM zugegriffen werden muss, die Verarbeitung also überwiegend aus den Caches gespeist werden kann. Wenn der Workload genau passt, kann sich die Verarbeitungsgeschwindigkeit im Idealfall auch ver-X-fachen, denn Daten aus dem L3-Cache zu holen, ist nicht nur vom Durchsatz her bedeutend schneller als aus dem RAM, sondern vor allem mit erheblich niedrigeren Latenzzeiten verbunden.