Neuer Supercomputer von Cray mit Next Generation AMD GPU

Der nächs­te Super­com­pu­ter von Cray und auch AMD wird in Groß­bri­tan­ni­en an der Uni­ver­si­tät von Edin­burgh zum Ein­satz kom­men. ARCHER2 soll im Mai 2020 in Betrieb gehen und wird unter ande­rem auf fast 12.000 AMD “Rome” Pro­zes­so­ren mit nahe­zu 750.000 CPU-Ker­nen set­zen. Zusätz­lich soll die Instal­la­ti­on auch  “Next Gene­ra­ti­on AMD GPUs” beinhal­ten, ohne dass dazu genaue­re Details genannt wurden.

ARCHER (Quel­le: UK Rese­arch and Innovation)

ARCHER2 von Cray

ARCHER2 wird den 2013 instal­lier­ten Super­com­pu­ter ARCHER (Aca­de­mic Rese­arch Com­pu­ting High End Resour­ce) erset­zen und soll ab Mai 2020 in der Advan­ced Com­pu­ting Faci­li­ty der Uni­ver­si­tät von Edin­burgh in den Pro­be­be­trieb gehen. Für die Anschaf­fung wur­den im März 2019 knapp 91 Mil­lio­nen Euro bereit­ge­stellt. Das “UK Rese­arch and Innovation’s Engi­nee­ring and Phy­si­cal Sci­en­ces Rese­arch Coun­cil” (EPSRC) und das “Natu­ral Envi­ron­ment Rese­arch Coun­cil” sind für die Instal­la­ti­on zuständig.

Gelie­fert wird der Super­com­pu­ter — wie bereits schon sein Vor­gän­ger — vom Super­com­pu­ter­bau­er Cray, der mitt­ler­wei­le zu Hew­lett Packard Enter­pri­se (HPE) gehört. Dabei setzt Cray auf AMDs Epyc 7002 Pro­zes­so­ren (“Rome”) und wird von die­sen 11.696 Stück ver­bau­en. Das gesam­te Sys­tem soll eine Peak-Per­for­mance von 28 Peta­flops errei­chen und dürf­te sich in der aktu­el­len TOP500-Lis­te vom Juni 2019 um einen Platz unter den ers­ten 10 bewerben.

Spezifikationen von ARCHER2

  • 28 PFLOP/s peak performance
  • 5,848 com­pu­te nodes, each with dual AMD Rome 64 core CPUs at 2.2GHz, for 748,544 cores in total and 1.57 PBytes of total sys­tem memory
  • 23x Shas­ta Moun­tain direct liquid coo­led cabinets
  • 14.5 PBytes of Lust­re work sto­rage in 4 file systems
  • 1.1 PBy­te all-flash Lust­re Burst­Buf­fer file system
  • 1+1 PBy­te home file sys­tem in Dis­as­ter Reco­very con­fi­gu­ra­ti­on using Net­App FAS8200
  • Cray next-gene­ra­ti­on Slingshot 100Gbps net­work in a dia­me­ter-three dra­gon­fly topo­lo­gy, con­sis­ting of 46 com­pu­te groups, 1 I/O group and 1 Ser­vice group
  • Shas­ta River racks for manage­ment and post processing
  • Test and Deve­lo­p­ment Sys­tem (TDS) plat­form, to be instal­led in advance
  • Col­la­bo­ra­ti­on plat­form with 4 x com­pu­te nodes atta­ched to 16 x Next Gene­ra­ti­on AMD GPUs
Road­map von April 2019 (Quel­le: AMD)

Nächste Generation AMD GPUs — Arcturus?

Ein inter­es­san­tes Detail bie­tet der letz­te Ein­trag bei den Spe­zi­fi­ka­tio­nen. Dabei wird auf eine nächs­te Gene­ra­ti­on von AMD Gra­fik­kar­ten ver­wie­sen ohne, dass genau­er dar­auf ein­ge­gan­gen wird.

In Road­maps hat­te AMD bis­lang immer eine “Next-Gen” Gra­fik in 7‑nm+ für 2020 ange­kün­digt. Nach der Vor­stel­lung der ers­ten Kar­ten auf der Basis von “Navi” hat­te man neue Road­maps ver­öf­fent­licht, die sich nicht auf die Code­na­men der Gra­fik­chips, son­dern auf deren Mikro­ar­chi­tek­tur bezogen.

Road­map Stand Sep­tem­ber 2019 (Quel­le: AMD)

Denn mit “Navi” hat­te man sich von der seit 2012 genutz­ten Befehls­satz­ar­chi­tek­tur Gra­phics Core Next (GCN) ver­ab­schie­det und RDNA (Rade­on DNA) zuerst mit der Rade­on RX 5700 eingeführt. 

Frag­lich ist aber, ob AMD in Zukunft die­sel­be Archi­tek­tur sowohl für den Desktop‑, als auch für den Ser­ver­be­reich ver­wen­den wird. Für letz­te­ren kom­men Gra­fik­be­schleu­ni­ger unter dem Namen Rade­on Instinct zum Ein­satz, die momen­tan aber noch grund­sätz­lich auf der­sel­ben Archi­tek­tur beru­hen. So stell­te AMD zuerst im Dezem­ber 2016 die Rade­on Instinct MI25 vor, die auf “Vega” basiert. 

Jetzt soll eine eben­falls auf Vega basie­ren­de Gra­fik­kar­te mit dem Code­na­men “Arc­turus” kurz vor der Vor­stel­lung ste­hen, von der drei ver­schie­de­nen Vari­an­ten (GL, XT, XL) gehan­delt wer­den. Für den HPC-Bereich dürf­te dann wohl eine davon als Rade­on Instinct M100 erschei­nen. Zusätz­lich soll “Arc­turus” kei­ne 3D-Engi­ne mehr besit­zen und damit mehr in Rich­tung “rei­ne” Beschleu­ni­ger­kar­te tendieren. 

Letzt­end­lich war wohl wie­der­holt zu hören, dass sich der Code­na­me nur auf die Gra­fik­chips bezieht und nicht auf eine neue Gene­ra­ti­on. AMD könn­te also für den HPC-Bereich noch ein wei­te­res As im Ärmel haben, falls sich hier bei der Bezeich­nung “Next-Gen” kein Feh­ler beim ARCHER2 ein­ge­schli­chen hat und es bis Mai 2020 auch nicht mehr weit ist.

 

Quel­le: AMD to Power Cray’s ARCHER2 Super­com­pu­ter in the UK (insi­deHPC)