AMD EPYC Milan멭 mit 3D-V-Cache zuerst in Azure-Cloud

Auf dem ange짯k체n짯dig짯ten Dat짯a짯cen짯ter-Event, das inter짯es짯sier짯te Zuse짯her gestern Abend auch bei uns im Forum ver짯fol짯gen konn짯ten, hat AMD unter ande짯rem die neu짯en EPYC Ser짯ver-Pro짯zes짯so짯ren mit Code짯na짯men Milan멭 und 3D-V-Cache vor짯ge짯stellt. Es han짯delt sich dabei um eine Tech짯no짯lo짯gie, die AMD bereits im Som짯mer anhand eines spe짯zi짯el짯len Ryzen 5900X demons짯triert hat짯te: Dabei wur짯de einem Ryzen 9 5900X, der seri짯en짯m채짯횩ig mit 32 MB L3-Cache je Com짯pu짯te-Die aus짯ge짯stat짯tet ist, per 3D-Stack짯ing 체ber Through Sili짯con Vias (TSV) 64 MB zus채tz짯li짯cher L3-Cache je Die 체ber짯ge짯st체lpt. Im Fal짯le des EPYC mit sei짯nen bis zu acht CCDs ergibt dies eine Gesamt-L3-Cache-Gr철짯횩e von sagen짯haf짯ten 768 MB. Da AMD die L1- und L2-Caches auch noch dazu addiert, was nicht ganz kor짯rekt aber auf짯grund der non-inclu짯si짯ve Cache-Ver짯wal짯tung der aktu짯el짯len AMD-Pro짯zes짯so짯ren auch nicht g채nz짯lich ver짯kehrt ist, war auf der Ver짯an짯stal짯tung von 804 MB Cache die Rede.

AMD bringt die 3D-V-Cache Tech짯no짯lo짯gie, die im Som짯mer als beson짯ders g체ns짯tig im Spie짯le짯um짯feld ange짯prie짯sen wur짯de, nun doch zun채chst im Ser짯ver-Bereich. Den Anfang macht direkt die Micro짯soft Azu짯re-Cloud, wo der Milan멭 im Rah짯men der Azu짯re HBv3 vir짯tu짯al machi짯nes for HPC bereits getes짯tet wer짯den kann. Der Pro짯duk짯tiv짯be짯trieb soll 쐀ald gestar짯tet wer짯den, ohne jedoch einen kon짯kre짯ten Ter짯min zu nennen.

Micro짯soft nennt ein paar Zah짯len, mit wel짯chen Ver짯bes짯se짯run짯gen im HPC-Umfeld zu rech짯nen ist:

80 per짯cent hig짯her per짯for짯mance for CFD
60 per짯cent hig짯her per짯for짯mance for EDA RTL
50 per짯cent hig짯her per짯for짯mance for expli짯cit FEA
19 per짯cent hig짯her per짯for짯mance for wea짯ther simulation

Am meis짯ten pro짯fi짯tie짯ren nat체r짯lich Workloads, bei denen durch den mas짯siv ver짯gr철짯횩er짯ten Cache nur noch sel짯ten oder gar nicht mehr auf das RAM zuge짯grif짯fen wer짯den muss, die Ver짯ar짯bei짯tung also 체ber짯wie짯gend aus den Caches gespeist wer짯den kann. Wenn der Workload genau passt, kann sich die Ver짯ar짯bei짯tungs짯ge짯schwin짯dig짯keit im Ide짯al짯fall auch ver-X-fachen, denn Daten aus dem L3-Cache zu holen, ist nicht nur vom Durch짯satz her bedeu짯tend schnel짯ler als aus dem RAM, son짯dern vor allem mit erheb짯lich nied짯ri짯ge짯ren Latenz짯zei짯ten verbunden.