AMD erzielt mit FirePro-Installation in Darmstadt Achtungserfolg in Green500-Liste der energieeffizientesten Supercomputer

Die Clus­ter-Instal­la­ti­on L‑CSC am GSI Helm­holtz­zen­trum für Schwer­io­nen­for­schung GmbH in der Nähe von Darm­stadt wur­de mit einem Ergeb­nis von 5,27 GFLOPS/W als ener­gie­ef­fi­zi­en­tes­ter Höchst­leis­tungs­rech­ner aus­ge­zeich­net und hält damit den ers­ten Platz in der Green500-Lis­te der welt­weit ener­gie­ef­fi­zi­en­tes­ten HPC-Sys­te­me. Im Ver­gleich zum Spit­zen­rei­ter der Juni-Aus­ga­be TSUBAME-KFC mit NVIDIA Kep­ler K20 GPUs als Beschleu­ni­ger (jetzt Drit­ter) liegt die Effi­zi­enz 20 % höher. Für AMD ist dies zugleich ein Ach­tungs­er­folg, denn der L‑CSC-Clus­ter am GSI setzt als einer von nur drei Super­com­pu­tern aus der aktu­el­len TOP500-Lis­te, in der die welt­weit 500 schnells­ten Rechen­sys­te­me gelis­tet sind, auf Fire­Pro-Gra­fik­kar­ten von AMD als GPU-Beschleu­ni­ger. In den von ASUS gelie­fer­ten Ser­vern ESC4000 G2S sind Intel Xeon E5-2690­v2 mit jeweils 10 Ker­nen und einer Takt­fre­quenz von 3 GHz ver­baut, denen jeweils vier Fire­Pro S9150 pro Rechen­kno­ten zur Sei­te ste­hen, die spe­zi­ell für den Ein­satz in Ser­vern aus­ge­legt sind. Zwi­schen den ein­zel­nen Rechen­kno­ten läuft die Kom­mu­ni­ka­ti­on über Infi­ni­band FDR von Mellanox.

AMD FirePro and research facility

Es ist jedoch nicht ganz klar, in wel­cher Kon­fi­gu­ra­ti­on die Mes­sun­gen für die Lis­ten TOP500 und Green500 durch­ge­führt wur­den. Offen­bar waren nur 60 Rechen­kno­ten mit 240 Fire­Pro S9150 bestückt und zusätz­li­che Kno­ten mit den älte­ren Dual-GPU-Gra­fik­kar­ten Fire­Pro S10000 aus­ge­rüs­tet. Im Voll­aus­bau, der bis zum Jah­res­en­de geschafft wer­den soll, sind 160 Kno­ten mit dann 600 Fire­Pro S9150 geplant.  Mit dem Teil­aus­bau schaff­te es der L‑CSC-Clus­ter bei einer Leis­tungs­auf­nah­me von 57.15 kW immer­hin auf 316,7 TFLOPS (FLOP gibt die Gleit­kom­ma­ope­ra­tio­nen pro Sekun­de an) im Lin­pack-Bench­mark und erreicht damit Platz 168 in der TOP500-Lis­te. Jede Gra­fik­kar­te bie­tet bei einer TDP von 235 W eine theo­re­ti­sche Spit­zen­leis­tung von 5,07 TFLOPS bei ein­fa­cher Genau­ig­keit (SP) oder 2,53 TFLOPS bei dop­pel­ter Genau­ig­keit (DP) und stellt 16 GiB Spei­cher zur Ver­fü­gung. Im Voll­aus­bau soll die theo­re­ti­sche Spit­zen­leis­tung allein der 600 Gra­fik­kar­ten, die den Löwen­an­teil der Rechen­leis­tung bereit­stel­len, 3.25 peta­FLOPS SP und 1.62 peta­FLOPS DP betragen.

AMD FirePro S9150

Das GSI führt auf dem Clus­ter Simu­la­ti­ons­rech­nun­gen zur Quan­ten­chro­mo­dy­na­mik durch, wobei man angibt, für die Lat­ti­ce-QCD-Simu­la­tio­nen eine der schnells­ten Open­CL-Imple­men­tie­run­gen für For­schungs­zwe­cke zu nutzen.

Quel­le: Pres­se­mit­tei­lung