Ein Turbolader für den Superrechner JUWELS

For­schungs­zen­trum Jülich, Atos und Par­Tec pla­nen mit NVIDIA und Mel­lan­ox die Erwei­te­rung des Jüli­cher Supercomputers

Jülich, 14. Novem­ber 2019 – Der Jüli­cher Super­com­pu­ter JUWELS bekommt einen gro­ßen Bru­der, ein soge­nann­tes Boos­ter-Modul, wie das For­schungs­zen­trum Jülich, Atos und Par­Tec ver­ein­bart haben. Das mit meh­re­ren Tau­send Gra­fik­pro­zes­so­ren bestück­te Modul ist für extre­me Rechen­leis­tun­gen und für Auf­ga­ben der Künst­li­chen Intel­li­genz aus­ge­legt. Es wird als deutsch-fran­zö­si­sches Pro­jekt gemein­sam mit den Unter­neh­men NVIDIA und Mel­lan­ox im Co-Design-Ver­fah­ren kon­zi­piert. Mit dem Start des Boos­ters im Jahr 2020 wird die Rechen­leis­tung von JUWELS von aktu­ell 12 auf über 70 Peta­flops erhöht. Dies ent­spricht 70 Bil­li­ar­den Rechen­ope­ra­tio­nen pro Sekun­de oder der Leis­tung von über 300.000 moder­nen PCs – schnel­ler rech­net der­zeit kei­ner in Europa.

JUWELS Super­com­pu­ter, JSC, FZJ (Copy­right: For­schungs­zen­trum Jülich / Ralf-Uwe Limbach)

Der „Jülich Wizard for Euro­pean Lea­der­ship Sci­ence“, kurz JUWELS, folgt dem neu­ar­ti­gen Prin­zip der in Jülich ent­wi­ckel­ten modu­la­ren Super­com­pu­ting-Archi­tek­tur. Die­ses sieht die Kom­bi­na­ti­on unter­schied­li­cher Modu­le vor, die auf ver­schie­de­ne Anfor­de­run­gen zuge­schnit­ten sind. Sie kön­nen über eine ein­heit­li­che Sys­tem­soft­ware zusam­men­ge­führt und zu einem ein­zi­gen, ultraf­le­xi­blen Super­com­pu­ter zusam­men­ge­schal­tet werden.

Das ers­te Modul, das soge­nann­te Clus­ter-Modul, besticht durch sei­ne Viel­sei­tig­keit und ein­fa­che Nutz­bar­keit. Es ging bereits 2018 in Betrieb und war von Anfang an für die Erwei­te­rung durch zusätz­li­che Modu­le aus­ge­legt. Das mit Abstand größ­te die­ser Modu­le ist das nun kom­men­de, mit Gra­fik­pro­zes­so­ren aus­ge­stat­te­te Boos­ter-Modul, mit dem sich gro­ße Daten­men­gen und beson­ders rechen­in­ten­si­ve Pro­gramm­tei­le par­al­lel mit höchs­ter Effi­zi­enz bear­bei­ten las­sen – bei­spiels­wei­se für groß­an­ge­leg­te Simu­la­tio­nen oder maschi­nel­les Lernen.

Als das ers­te Modul von JUWELS instal­liert wur­de, waren noch nicht alle Kom­po­nen­ten, die für den Bau des Boos­ters benö­tigt wer­den, auf dem Markt. Mitt­ler­wei­le sind alle Tei­le erhält­lich, die für ein aus­ge­wo­gen kon­zi­pier­tes Höchst­leis­tungs­re­chen­mo­dul erfor­der­lich sind.

Neues Supercomputer-Konzept aus Jülich

Die modu­la­re Super­com­pu­ting-Archi­tek­tur ermög­licht es, fle­xi­bel und ohne Kom­pro­mis­se die bes­ten ver­füg­ba­ren Tech­no­lo­gien zu inte­grie­ren”, erklärt Prof. Tho­mas Lip­pert, Direk­tor des Jülich Super­com­pu­ting Cent­re (JSC). „Die Modu­la­ri­tät ist unse­re Ant­wort auf die zuneh­mend kom­ple­xe­ren und hete­ro­ge­ne­ren Anfor­de­run­gen der Anwen­dungs­codes an die Super­com­pu­ter. Sie erlaubt, Exas­ca­le kos­ten­güns­tig zu rea­li­sie­ren und wird es sogar ermög­li­chen, so exo­ti­sche Zukunfts­tech­no­lo­gien wie Quan­ten­com­pu­ter zu integrieren.“

Der Bau eines Exas­ca­le-Rech­ners wird welt­weit als der nächs­te gro­ße Schritt auf dem Gebiet des High Per­for­mance Com­pu­ting (HPC) ver­folgt. Ein sol­cher Rech­ner ist mit einer Tril­li­on (10^18) Rechen­ope­ra­tio­nen pro Sekun­de noch um min­des­tens eine Grö­ßen­ord­nung leis­tungs­fä­hi­ger als die schnells­ten Super­com­pu­ter von heute.

Die Idee des modu­la­ren Super­com­pu­ting wur­de von Lip­pert kon­zi­piert und unter Lei­tung von Dr. Este­la Sua­rez, JSC, gemein­sam mit Par­Tec in den von der EU geför­der­ten For­schungs­pro­jek­ten DEEP und DEEP-ER mit Hil­fe vie­ler euro­päi­scher Part­ner aus For­schung und Indus­trie in die Pra­xis umge­setzt. “Der JUWELS-Boos­ter ist weg­wei­send für die Ent­wick­lung eines euro­päi­schen Exas­ca­le-Sys­tems, denn auf dem Gebiet der Sys­tem­ar­chi­tek­tur ist Euro­pa welt­weit füh­rend”, sagt Bern­hard Froh­wit­ter, Vor­stands­vor­sit­zen­der von ParTec.

Hardware-Partner aus Europa, Israel und den USA

Der JUWELS-Boos­ter basiert auf der Super­com­pu­ter-Rei­he Bull­Se­qua­na XH2000 von Atos. “Aus­ge­stat­tet mit unse­ren neu­es­ten, leis­tungs­fä­higs­ten beschleu­nig­ten Blades bie­tet die Bull­Se­qua­na-Platt­form Jülich die effek­tivs­te Rechen­in­fra­struk­tur auf dem Weg zu Exas­ca­le. Sie unter­stützt auch das Bestre­ben des For­schungs­zen­trums nach nach­hal­ti­gen Lösun­gen mit unse­rer paten­tier­ten Direct-Liquid-Coo­ling-Warm­was­ser-Tech­no­lo­gie”, führt Agnès Bou­dot, Seni­or Vice Pre­si­dent, Head of HPC & Quan­tum bei Atos, aus.

Eine Beson­der­heit des modu­la­ren JUWELS-Sys­tems ist, dass er glei­cher­ma­ßen für die anspruchs­volls­ten Auf­ga­ben im Bereich der Simu­la­tio­nen und des Maschi­nel­len Ler­nens, also der Künst­li­chen Intel­li­genz, geeig­net ist und auf ein­fa­che Wei­se bei­de Berei­che zusam­men­brin­gen kann. “Das JSC setzt unse­re GPUs für Rechen­zen­tren der nächs­ten Gene­ra­ti­on im Boos­ter-Modul von JUWELS ein, um die­se Anfor­de­run­gen bei höchs­ter Ener­gie­ef­fi­zi­enz zu erfül­len”, sagt Marc Hamil­ton, VP, Solu­ti­ons Archi­tec­tu­re and Engi­nee­ring bei NVIDIA.

Die extrem hohe Netz­werk­leis­tung, die für den modu­la­ren Rech­ner benö­tigt wird, kommt von Mel­lan­ox aus Isra­el. “Unse­re 200 Gb/s HDR Infi­ni­Band-Tech­no­lo­gie bie­tet einen welt­weit füh­ren­den Daten­durch­satz und eine extrem nied­ri­ge Latenz­zeit, und lie­fert damit die Netz­werk­leis­tung, die zur Rechen­leis­tung der Rechen­kno­ten des JUWELS-Boos­ters passt. Dar­über hin­aus ermög­li­chen die fle­xi­blen adap­ti­ven Rou­ting- und Steue­rungs­funk­tio­na­li­tä­ten den Betrieb von JUWELS als ein­heit­li­chen modu­la­ren Super­com­pu­ter”, erklärt Gilad Shai­ner, SVP für Mar­ke­ting bei Mel­lan­ox Technologies.

Förderung durch Bund und Land

Die Anschaf­fung des Boos­ters wird vom Bund und vom Land Nord­rhein-West­fa­len finan­ziert. Das JSC betreibt JUWELS als Mit­glied des Gauss Cent­re for Super­com­pu­ting (GCS), dem Zusam­men­schluss der drei natio­na­len Höchst­leis­tungs­re­chen­zen­tren in Deutsch­land, zu denen die drei Rechen­zen­tren des For­schungs­zen­trums Jülich (JSC), der Baye­ri­schen Aka­de­mie der Wis­sen­schaf­ten (LRZ) und der Uni­ver­si­tät Stutt­gart (HLRS) gehören.

Die Rechen­zeit wird über Peer-Review-Ver­fah­ren auf natio­na­ler und euro­päi­scher Ebe­ne ver­ge­ben. Das GCS und das For­schungs­zen­trum Jülich wer­den unter­stützt vom Bun­des­mi­nis­te­ri­um für Bil­dung und For­schung (BMBF) und dem Minis­te­ri­um für Kul­tur und Wis­sen­schaft des Lan­des Nord­rhein-West­fa­len sowie dem Minis­te­ri­um für Wis­sen­schaft, For­schung und Kunst Baden-Würt­tem­berg und dem Baye­ri­schen Staats­mi­nis­te­ri­um für Wis­sen­schaft und Kunst.

Weiterführende Informationen:

Jülich Super­com­pu­ting Centre

DEEP-Pro­jek­te

Pres­se­mit­tei­lung vom 6. Mai 2019, „Pro­to­typ für künf­ti­ge modu­la­re Supercomputer“

Online­bei­trag zu JUWELS„Ein neu­es Kronjuwel“