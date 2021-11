Auf dem ange­kün­dig­ten Dat­a­cen­ter-Event, das inter­es­sier­te Zuse­her gestern Abend auch bei uns im Forum ver­fol­gen konn­ten, hat AMD unter ande­rem die neu­en EPYC Ser­ver-Pro­zes­so­ren mit Code­na­men Milan‑X und 3D-V-Cache vor­ge­stellt. Es han­delt sich dabei um eine Tech­no­lo­gie, die AMD bereits im Som­mer anhand eines spe­zi­el­len Ryzen 5900X demons­triert hat­te: Dabei wur­de einem Ryzen 9 5900X, der seri­en­mä­ßig mit 32 MB L3-Cache je Com­pu­te-Die aus­ge­stat­tet ist, per 3D-Stacking über Through Sili­con Vias (TSV) 64 MB zusätz­li­cher L3-Cache je Die über­ge­stülpt. Im Fal­le des EPYC mit sei­nen bis zu acht CCDs ergibt dies eine Gesamt-L3-Cache-Grö­ße von sagen­haf­ten 768 MB. Da AMD die L1- und L2-Caches auch noch dazu addiert, was nicht ganz kor­rekt aber auf­grund der exklu­si­ven Cache-Ver­wal­tung der AMD-Pro­zes­so­ren auch nicht gänz­lich ver­kehrt ist, war auf der Ver­an­stal­tung von 804 MB Cache die Rede.

AMD bringt die 3D-V-Cache Tech­no­lo­gie, die im Som­mer als beson­ders güns­tig im Spie­le­um­feld ange­prie­sen wur­de, nun doch zunächst im Ser­ver-Bereich. Den Anfang macht direkt die Micro­soft Azu­re-Cloud, wo der Milan‑X im Rah­men der “Azu­re HBv3 vir­tu­al machi­nes for HPC” bereits getes­tet wer­den kann. Der Pro­duk­tiv­be­trieb soll “bald” gestar­tet wer­den, ohne jedoch einen kon­kre­ten Ter­min zu nennen.

Micro­soft nennt ein paar Zah­len, mit wel­chen Ver­bes­se­run­gen im HPC-Umfeld zu rech­nen ist:

80 per­cent hig­her per­for­mance for CFD

60 per­cent hig­her per­for­mance for EDA RTL

50 per­cent hig­her per­for­mance for expli­cit FEA

19 per­cent hig­her per­for­mance for wea­ther simulation

Am meis­ten pro­fi­tie­ren natür­lich Workloads, bei denen durch den mas­siv ver­grö­ßer­ten Cache nur noch sel­ten oder gar nicht mehr auf das RAM zuge­grif­fen wer­den muss, die Ver­ar­bei­tung also über­wie­gend aus den Caches gespeist wer­den kann. Wenn der Workload genau passt, kann sich die Ver­ar­bei­tungs­ge­schwin­dig­keit im Ide­al­fall auch ver-X-fachen, denn Daten aus dem L3-Cache zu holen, ist nicht nur vom Durch­satz her bedeu­tend schnel­ler als aus dem RAM, son­dern vor allem mit erheb­lich nied­ri­ge­ren Latenz­zei­ten verbunden.