News HP präsentiert stromsparendes Serverprojekt Moonshot auf ARM Basis - AMD überraschenderweise auch dabei

Opteron

Redaktion
☆☆☆☆☆☆
Mitglied seit
13.08.2002
Beiträge
23.645
Renomée
2.254
  • SIMAP Race
  • Spinhenge ESL
  • BOINC Pentathlon 2012
<div class="newsfloatleft"><a href="http://www.planet3dnow.de/photoplog/images/49616/1_HP_Logo.png"><img src="http://www.planet3dnow.de/photoplog/images/49616/1_HP_Logo.png" border="0"</a>
</div>
<a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1319827147"target="_blank">Wie bereits vorab gemeldet</a> präsentierte hp nun eine neue Serverreihe. Das Projekt wurde auf den Namen Moonshot getauft und basiert auf vielen kleinen, einzelnen ARM Rechner, die jeweils nur aus einem hochintegiertem Chip und einem 4 GB Speichermodul bestehen. Da die Prozessoren noch nicht auf ARMs erst kürzlich präsentierten <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1319790133" target="_blank">64-Bit-Erweiterung basieren</a></li>, ist dies auch gleichzeitig das Speichermaximum.

Haupteinheit eines Servers sind vier Einschübe in einem Gehäuse, das 4 Höheneinheiten belegt. Jeder Einschub verfügt über 72 Prozessorchips, die sich auf 18 Karten à 4 Chips aufteilen. Eine solche Karte, <a href="http://www.calxeda.com/products/energycards/techspecs" target="_blank">die 25W verbraucht</a>, sieht man im folgenden Bild:

<center><a href="http://www.planet3dnow.de/photoplog/index.php?n=17370"><img class="center" src="http://www.planet3dnow.de/photoplog/file.php?n=17370&amp;w=l" alt="QuadNode Calxeda Karte"></center></a>

Dort sieht man schön die vier Speichermodulsockel, jeweils einen für die vier Prozessormodule des Typs "ECX-1000". Ansonsten gibt es nur noch SATA-Anschlüsse, um Festplatten oder SSDs direkt an die Node anzuschließen. Dies ist aber nicht zwingend, man kann auch auf Netzwerkspeicherplatz zugreifen.

Ein Prozessormodul ECX-1000 ist folgendermaßen aufgebaut:
<center><a href="http://www.planet3dnow.de/photoplog/index.php?n=17371"><img class="center" src="http://www.planet3dnow.de/photoplog/file.php?n=17371&amp;w=l" alt="Calxeda ARM Prozessor Module"></center></a>

Wie man sieht, ist das Modul hauptsächlich aus vier ARM-Cortex-A9-Kernen, 4 MB L2-Cache und einer "EnergyCore" Management-Unit aufgebaut. Laut <a href="http://www.calxeda.com/assets/documents/products/ECX1000/ecx1000-pbr1_1.pdf" target="_blank">Datenblatt </a>beträgt der CPU-Takt 1,1-1,4 GHz. Zusätzlich findet man noch bis zu fünf SATA2-Anschlüsse sowie viele Netzwerk- und Interconnect-Schnittstellen, mit folgenden Eigenschaften:
<ul><li>Support 1Gb and 10Gb Ethernet</li><li>Up to five (5) XAUI 10Gb ports</li><li>Up to six (6) 1Gb SGMII ports (multiplexed with XAUI ports)</li><li>Three (3) 10Gb Ethernet MACs supporting IEEE 802.1Q</li></ul>

<strong>AMDs Rolle</strong>

Kommen wir aber nun zum eigentlichen Aufmacher der Meldung: AMD will ebenfalls bei HPs neuem Server-Stromspar-Programm mitwirken. Mark Papermaster, Senior Vice President und Chief Technology Officer wird mit den folgenden Worten zitiert:
<div style="margin: 5px 20px 20px;"> <div class="smallfont" style="margin-bottom: 2px;">Zitat:</div> <table border="0" cellpadding="6" cellspacing="0" width="100%"> <tbody><tr><td class="alt2" style="border: 1px inset;">AMD and HP have worked together for several years to bring innovative low-power server solutions to market. As we roll out our next-generations of low-power AMD Opteron processors, we look forward to working with HP and the Pathfinder Program to further advance efforts around energy-efficient server architectures that sip power while continuing to meet the rapidly demanding performance scale require by the Cloud.</td></tr> </tbody></table></div>Papermaster stellt also die kommenden Opterons auf Bulldozerbasis in den Vordergrund. Nachdem bereits durchgesickert ist, dass es einen<a href="http://www.cpu-world.com/news_2011/2011100701_Pre-order_prices_of_AMD_Opteron_3200_4200_and_6200_processors.html" target="_blank"> Opteron 4256 EE mit vier Modulen (8 Kernen) mit 2,5 GHz bei 35 W TDP</a> geben wird, ist der Konkurrenzkampf wohl eröffnet. Zwar sind die aktuellen Opteronchips nicht so hochintegriert wie die Lösung auf ARM-Basis, dafür aber sicherlich schneller und dank AMD64 ist man nicht auf 4 GB RAM limitiert. Zukünftig scheint AMD in diesem Bereich ebenfalls gut gerüstet zu sein. Die kleinen AMD-APUs der C- und E-Serie (Codename Zacate bzw. Ontario) sind ähnlich wie obiges ARM-Modul aufgebaut. Wie Calxeda werden die Chips maschinell entworfen, und man integriert ebenfalls mehrere I/O-Schnittstellen in bekannter SoC (System-on-a-chip) Manier.

<a href="http://www.3dcenter.org/artikel/amd-mobile-prozessoren-roadmap-2011-2013" target="_blank">Die in 28nm geplanten Nachfolger</a> werden auch I/O-Funktionen integrieren, die bisher noch in der Southbridge stecken, z.B. den SATA-Kontroller, sodass man zum Calxeda-Design weiter aufholt. Aber man hat noch einen Trumpf im Ärmel, denn durch die integrierte Grafikkarte, die sich über OpenCL auch für Berechnungen eignet, ist man dem ARM-Lager voraus. Erst kürzlich wurde der erste HPC Großrechner auf <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=399870"target="_blank">Llano-Basis in Betrieb genommen</a>. Ob dies im Niedriegenergiesegment allerdings ein Vorteil ist, muss sich erst noch beweisen.

Intel will dem Ganzen übrigens nicht tatenlos zuschauen. Zwar sind sie (noch?) nicht bei HPs Serverprogramm dabei, aber Gerüchten zufolge basteln sie angeblich bereits an einem <a href="http://semiaccurate.com/2011/11/01/intel-8-core-server-atom-gets-a-name-and-date/" target="_blank">8-Kern Serverchip auf Atom-Basis</a>.

<strong>Quellen:</strong><ul><li><a href="http://www.hp.com/go/moonshot" target="_blank">Projekt Moonshoot Hauptseite [Englisch] </a><li><a href="http://www.youtube.com/watch?v=XLmKAoEF9NE" target="_blank">Übersichtsvideo [YT, Englisch]</a><li><a href="http://www.youtube.com/watch?v=4PIajg_Htx0" target="_blank">Technische Details [YT, Englisch]</a><li><a href="http://www.calxeda.com/products/energycards/techspecs"target="_blank">Calxeda, EnergyCard-Details</a><li><a href="http://www.calxeda.com/products/energycore/ecx1000" target="_blank">Calxeda ECX-1000</a></ul><strong>Links auf frühere Meldungen:</strong><ul><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1319790133" target="_blank">ARM wird Mitglied im 64-Bit-Club</a></li><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1319827147" target="_blank">HP angeblich bald mit ARM-Servern - Tiefschlag für Intel?</a></li><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1319989387" target="_blank">AppliedMicro zeigt erste ARMv8 64-Bit-Implementierung X-Gene</a></li></ul><strong>Diskussion im Forum:</strong><ul><li><a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=399711" target="_blank">ARMv8 64-Bit-Architektur: Allgemeiner Info- und Spekuthread</a></li></ul>
 
Nun ja AMDs Rolle - dass sie bei Server mitspielen ist ja nichts Neues...und dass Energiesparen Trumpf ist auch nicht - also nicht ganz so besonders..oder?
AMD Serveranteil ist unter der die 5% Huerde gefallen - also aktuell sehr mager. Da muss man nehmen was man kann.... ;-)
Daran ist sicherlich erst einmal nichts schlechtes.

Aber mal ehrlich wer haette den vor wenigen Jahren ARM im Server gesehen?
Kaum jemand - aber Konkurrenz belebt das Geschaeft.
 
Ich meine 35watt mit 8CMT Kerne ist was feines. Aber so ein Bobcat mit 16Kerne und 35watt wäre sehr interessant fürs DC. Aber warten wir mal ab.
 
Zuletzt bearbeitet:
Mal kurz überschlagen:
1 Karte: 25W
Ein Einschub mit 18 Karten: 450W
Ein Chassis mit 4 Einschüber: 1800W
Das auf 4HE, das wird echt spaßig zu kühlen. :]
 
Nun ja AMDs Rolle - dass sie bei Server mitspielen ist ja nichts Neues
Nein, das nicht.
...und dass Energiesparen Trumpf ist auch nicht - also nicht ganz so besonders..oder?
Ebenfalls richtig.
Aber AMD hat halt (noch?) keine QuadCores mit ~7W, und auch noch keinen SOC mit integrierter Southbridge.
Anscheinend wird AMD aber da wohl jetzt angreifen, sieht man bei der anderen News mit den Entlassungen. Das gesparte Geld soll reinvestiert werden, und die Bobcat-Kerne sollen angeblich ne wichtigere Rolle als bisher einnehmen:
http://www.xbitlabs.com/news/other/...ces_Set_to_Unveil_New_Strategy_Next_Week.html

Nachdem Bobcat eben auch maschinell entworfen wird, wäre ein QuadCore mit Serverfeatures sicherlich schnell zu haben. Notfalls kann man den bereits geplanten 28nm-Wichita hernehmen. Für ein neues, Extra-Die ist die Frage ist, ob die Stückzahlen hoch genug wären.
 
Nein, das nicht.

Ebenfalls richtig.
Aber AMD hat halt (noch?) keine QuadCores mit ~7W, und auch noch keinen SOC mit integrierter Southbridge.
Anscheinend wird AMD aber da wohl jetzt angreifen, sieht man bei der anderen News mit den Entlassungen. Das gesparte Geld soll reinvestiert werden, und die Bobcat-Kerne sollen angeblich ne wichtigere Rolle als bisher einnehmen:
http://www.xbitlabs.com/news/other/...ces_Set_to_Unveil_New_Strategy_Next_Week.html

Nachdem Bobcat eben auch maschinell entworfen wird, wäre ein QuadCore mit Serverfeatures sicherlich schnell zu haben. Notfalls kann man den bereits geplanten 28nm-Wichita hernehmen. Für ein neues, Extra-Die ist die Frage ist, ob die Stückzahlen hoch genug wären.

Bobcat müsste für Server wenigstens um ECC-Support "ergänzt" werden, besser noch um Dual-Channel; Reg-Ram ggf auch.

AMD hat aber derzeit einen 2,5W Dualcore (Bobcat ohne GPU-Teil) -> 2x2,5W = 5W + ein wenig FCH = 7W *lol* ; Shrink auf 28nm = 5W Quadcore bei 1GHz Bobcat ohne GPU-Teil aber x86 d.h. besserer Softwaresupport als ARM ;)
 
Bei 1800W in 4HE kühlste nichts mehr passiv sondern bestenfalls mit vielen > 6000 rpm-Lüftern in der Mitte des Gehäuses ;)

Aber ich hab mir die News gerade nochmal durchgelesen, ich glaube die ist schlichtweg was verwirrend bzw. irreführend formuliert ("4Unit Rack").
Evtl. ist mit Unit hier so ein Einschub gemeint und keine Höheneinheit / Heigh Unit.
 
Bei 1800W in 4HE kühlste nichts mehr passiv sondern bestenfalls mit vielen > 6000 rpm-Lüftern in der Mitte des Gehäuses ;)

Aber ich hab mir die News gerade nochmal durchgelesen, ich glaube die ist schlichtweg was verwirrend bzw. irreführend formuliert ("4Unit Rack").
Evtl. ist mit Unit hier so ein Einschub gemeint und keine Höheneinheit / Heigh Unit.
Naja, das Ding ist 4U hoch, deswegen schrieb ich 4Unit Rack. Ein Einschub ist 1/4 -> Volumenmäßig 1U, Deine Rechnung sollte schon stimmen, hier sagt er es:

http://www.youtube.com/watch?feature=player_detailpage&v=4PIajg_Htx0#t=56s
 
Rack bezeichnet doch den Schrank, nicht das Gehäuse (Chassis). Oder verstehe ich hier was nicht? 4U Racks kenne ich zumindest nicht. Würden im HPC Bereich auch keinen Sinn ergeben.
 
Bei 1800W in 4HE kühlste nichts mehr passiv sondern bestenfalls mit vielen > 6000 rpm-Lüftern in der Mitte des Gehäuses ;)

Aber ich hab mir die News gerade nochmal durchgelesen, ich glaube die ist schlichtweg was verwirrend bzw. irreführend formuliert ("4Unit Rack").
Evtl. ist mit Unit hier so ein Einschub gemeint und keine Höheneinheit / Heigh Unit.

Ich dachte wir reden von der Steckkarte das Foto meine ich ???
 
Rack bezeichnet doch den Schrank, nicht das Gehäuse (Chassis). Oder verstehe ich hier was nicht? 4U Racks kenne ich zumindest nicht. Würden im HPC Bereich auch keinen Sinn ergeben.
Naja, ist ja kein HPC, sondern Cloud ;-)

Ansonsten, hier ist noch nen zweite Quelle:

This is the 4U, 4 tray HP rack mount box(*), an SL6500 chassis to be exact. Each tray is 2U x .5U, so 1U in volume, and contains up to 18 Calxeda EnergyCards, each one is a four node reference design. That would mean 72 nodes/servers per U, 288 cores. A 4U box would contain 288 nodes and 1152 cores. Back to the power side, each tray has a small power distribution board in the center, and it is fed by two 6-pin PCIe Graphics connectors (PEG), and has mounting brackets for one more board.
http://semiaccurate.com/2011/11/03/calxeda-launches-a-4-core-arm-server-chip/

Noch Genaueres zur Stromversorgung, die 25W sind anscheinend nur worst case. Da man weiß, dass pro 6Pin Grafikstromanschluss nur 75A laufen dürfen, sinds ingesamt, für alle 4 Einschübe, 1200W:
Each PEG can supply 75W total, so that means a tray has a max supply of 300W, 16.67W/board, 4.17W/node average. This is a prototype box, and HP doesn’t have to stick to the PEG limits, it may only be using the physical connector, but it shows that Calxeda is definitely in the ballpark of 5W/node for their initial samples.
Wenn sie sich ans Limit halten .. ;-)

@Makso:
Ne, ging nicht über die einzelne Karte. Er hat ja den Gesamtbedarf ausgerechnet, indem er immer nen Level höher rechnete. Karte -> Einschub (mit 72 Karten) -> komplettes Teil (mit 4 Einschüben).
Irgendwo haste da was falsch mitbekommen, Die Richtung Karte -> 4 einzelne SoCs ist die falsche, da gehste ja ein Level runter, nicht rauf ;-)


PS:
(*) "rack mount box" ergo Du hast recht, das ist kein Rack, das Rack ist der ganze Schrank, habs umformuliert:

Haupteinheit eines Servers sind vier Einschübe in einem Gehäuse, das 4 Höheneinheiten belegt
 
Schaut doch einfach hier: http://www.hp.com/hpinfo/newsroom/p...rastructure/images/Redstone_Platform_Full.jpg

Der große Kasten ist 4U, vier Einschübe mit jeweils maximal 18 Karten (hintereinander drei Blöcke aus je sechs Stück nebeneinander). Oder alternativ wie hier auf dem Bild nur sechs Karten und dafür Festplatten dahinter.

Ich denke mal, wenn man so einen kompletten Block nur mit Karten füllen würde (d.h. 288 CPUs), könnte man die je 16 SATA-Ports pro Karte, also insgesamt 1152 Ports (!!!) sowieso nicht alle nutzen, allein der Kabelwust wäre nicht zu handeln. *chatt* (ich stell mir gerade die Arbeit vor für denjenigen, der die Kabel anstecken soll, uiuiui^^)
Aber so ist das flexibler, dann kann man auch evtl. nur ein oder zwei Karten pro Einschub verbauen und den Rest mit Platten auffüllen. Oder mit Steckmodul-SSDs arbeiten.

Die 1,8 kW pro 4U sind jedenfalls richtig gerechnet (jedenfalls als theoretischer Spitzenwert), aber in dem großen Kasten kann man das wohl wegkühlen. Muß ja nicht leise sein ;D
 
Das erscheint mir als sehr verspäteter Nachzügler mit seiner 4GB Ram Begrenzung.
...... dafür aber sicherlich schneller und dank AMD64 ist man nicht auf 4 GB RAM limitiert ......
Fast schon wie ein Verzweiflungsakt, jedenfalls sehr hinterherhinkend, auch wenn die Chips ansich wohl durch ihre Einfachheit recht flott sind.
Das wäre Ano Domini 2000 der Hit gewesen, aber nicht 2012.
AM64 ist längst etabliert und kann den Speicherhunger auch zukünftiger Anwendungen weitaus besser stillen.
Kann das ganze nicht so recht nachvollziehen, vllt. denke ich auch falsch....*noahnung*
 
Mittels PAE (Physikalische Adress Erweiterung) ist die Begrenzung schnell umgangen. Bei diesem Konzept dürfte der RAM eh nicht das Problem darstellen. Meiner Logik nach hat man viele kleine Kerne, brauch man für jeden kleinen Kern etwas RAM, hat man aber einen dicken Opteron oder Xeon drinnen, sollte jeder Kern schon ordendlich RAM bekommen, damit man ihn auslasten kann.
 
Das erscheint mir als sehr verspäteter Nachzügler mit seiner 4GB Ram Begrenzung.(...)
Kann das ganze nicht so recht nachvollziehen, vllt. denke ich auch falsch....*noahnung*
Naja, ARM gibts auch erst seit den späten 80ern, das ist kein 70er Design. Von daher halt konstante 10 Jahre später dran ;-)
Ist schon ok. Bisher brauchte man bei ARM halt kein 64bit.
Mittels PAE (Physikalische Adress Erweiterung) ist die Begrenzung schnell umgangen.
Jo, aber das LPEA war wohl mehr ein "Hack" Modus. Zumindest haben sich wenige dafür interessiert und wenn HP da jetzt nur 4 GB DIMMs verbaut, nutzen sies es anscheinend auch nicht.
 
PAE ist ein Prozessorfeature eines x86 Prozessors und gibt es auf ARM nicht.

lg
__tom
 
Jein, ich wusste, dass es so etwas vergleichbares wie PEA für x86 auch für ARM gibt, ich ging davon aus, dass es gleich benannt ist. Danke für den Hinweis ;)
 
Zurück
Oben Unten