Die Opteron Zukunft, kann AMD überleben?

Lang, lange hats gedauert. Und nun ist Cray nach Jahren wieder an der Spitze der Top-500.org Computer. In der 34. Top-Liste errang der Jaguar in Oak Ridge, als Supercomputer des National Center for Computational Science sehr deutlich den Spitzenplatz. Das war auch möglich durch ein Opteron-Upgrade vom "Shanghai"- (Quadcore) zum "Istanbul"-Chip (Hexacore).
Knapp 1,8 PetaFlops pro Sekunde vermag der Jaguar im LinPack-Benchmark zu berechnen und überholt sehr deutlich IBMs Roadrunner (Los Alamos). Der steht bei aktuell 1,04 PetaFlops/s.

Martin Meurer hat dazu einen Kommentar geschrieben: "Der große Sprung des Jaguar".
Herr Meurer muss es wissen. Er ist der Veranstalter und Kopf der ISC (International Supercomputing Conference).


Ziemlich knapp dahinter mit 832 TeraFlop/s steht ein weiterer Cray XT5-Rechner. Auch dieser war schon in der Liste als Kraken im National Institute for Computational Sciences/University of Tennessee beschäftigt.

"AMD Opteron erobert Spitzenposition der Superc[url=http://www.nccs.gov/jaguar/]omputer[/url]".

Was ist aber besonders, wenn eine Supercomputer-Firma an der Spitze steht? Es gibt zwei Gründe dies bei P3D und in diesem Thread besonders zu betonen:

1. Supercomputer ohne Nr.1
So paradox es klingt, es hat lange gedauert. Ständig überholte IBM in den letzten Dekaden Cray an Stückzahl und Spitzenleistung. Und auch HP verstand es sich in diesem exklusiven Feld sich breit zu machen.
2. Spitze mit AMD trotz Conroe-Schock
Im Jahr 2009, lange so lange hats gedauert, stehen die Crays am Gipfel mit AMD-Prozessoren. Das ist in so fern bemerkenswert, weil seit dem Conroe- und Penryn-Schock die Prozessoren von AMD nicht mehr überlegen waren. Spätestens mit dem Nehalem (Ende 2007/Anfang 2008 ) waren auch architektonische theoretische Vorteile der K8/K10-Plattform dahin.

Wie Cray zur Legende wurde
Die Marke nach seinem Schöpfer und HPC-Pionier Seymour Cray stand in den Anfangstagen für hohe Rechenleistung auf kleinem Raum mit schicken Gehäuse (Cray-1, Cray-2). Die ersten Rechner in den Anfangstagen 1976 haben die Fachwelt in Staunen versetzt. Aber die Firma konnte die Rechner nicht beständig mit eigenen Vektor-Prozessoren zuverlässig weiter in der Rechenleistung steigern.

Wechselspiele Cray
Jahre später und nach einer Umorientierung auf fremde Prozessoren (DEC mit Alphas, Sun mit UltraSPARCs) wurde AMD 2002 ausgewählt den Crays Rechenkraft zu geben. Das war in den Anfangstagen mit AMDs K8 gut (2003/2004) geeignet dem professionellen Umfeld zu zeigen, dass es eine ernsthafte Alternative zu Intels Frontside Bus-Prozessoren gibt.

Auf den Plätzen IBM und VR-China
Aber die Liste lässt noch weiter aufhorchen. Nicht nur weil IBM etwas abgesackt ist, mit der aktuellen Nummer 2 Roadrunner und der Nummer 4 mit dem IBM BlueGene/P im Deutschen Forschungszentrum Juelich (FZJ) mit 825,5 TeraFlop/s.

Tianhe-1 mit GPGPU-Computing
Auch die Grossmacht China ist nun mit dem Tianhe-1vertreten. Auch hier steckt AMDs Technik drin, aber zusammen mit Intel-Prozessoren. Die hauptsächliche Rechenkraft steckt aber nicht in den Prozessoren ... sondern in den eingesteckten AMD/ATI-GPUsn. Pro Intel-CPU werkeln zwei Grafikkarten als Number-Cruncher.
Chinas Rechner gehört zur Gattung der Hybrid-Rechner, vergleichbar mit IBMs HPC "Road-Runner" (Opterons zusammen mit dem Cell in Form des PowerXCell-8i-Prozessor).
Der Tianhe-1 (Fluss im Himmel) ist am National Super Computer Center in Tianjin aufgebaut. Dort wird es für Geologische Probleme (Suche nach Erdöl) und Strömungssimulationen für die Luftfahrtindustrie verwendet.

Neue alte Zukunft mit ...
Die neuen Rechner mit GPGPU-Computing sind nun auch in der Top-Liste vertreten ... und das nicht in einem US-System, oder aus Europa, sondern von der aufstrebenden Wirtschaftsmacht China.
Für einen zeitweilig ins Straucheln geratenen Konzern, wie AMD, ist das eine bemerkenswerte Notiz, dass trotz angegrauter Systemarchitektur mit ihren neuen Hexacores (Istanbul) solche Supercomputer möglich sind. Oder mit anderen Worten ... auch heute noch haben die Opterons eine Zukunft.

MFG Bobo(2009) Martin Bobowsky
 
Zuletzt bearbeitet:
@XT5
Gibt es Informationen, inwieweit zur Performance (neben der schlichten Anzahl der Kerne) der vom 6MB L3-Cache abgeteilte (2MB-)Snoop-Cache beiträgt?
MfG
 
@XT5
Gibt es Informationen, inwieweit zur Performance (neben der schlichten Anzahl der Kerne) der vom 6MB L3-Cache abgeteilte (2MB-)Snoop-Cache beiträgt?
MfG
Da Cray die Opterons allenfalls als zweifach-Sockel-Modul einsetzt, wird sich die Leistungssteigerung damit in Grenzen halten.

Systemaufbau Cray XT5
cray-xt5_seastar2-plus.jpg


Modul mit FPGA
cray-xr1-reconfiguable-processing-blade.jpg


Vektor-Modul
cray-x2-vektor-blade.jpg


Quelle

Der systemweite Interconnect des XT-5 leistet der SeaStar 2+, wobei dieser auch gewährleistet, dass der Speicherdatenraum kohärent bleibt.
Bei einem Zweifach-Sockel hält sich der Traffic aufgrund der Kohärenz-Daten noch im Rahmen. 4-fach und 8-fache Opteron-Sockel sind da viel kritischer.

Modulare Erweiterung mit speziellen firmeneigenen Blades
cray-xt5_optionen.jpg


cray-xt5_mainboard.jpg


Quelle

Erste Crays mit dem Opteron waren (so weit ich unterrichtet bin) Einzelsockel, die über dem Cray-Chip Seastar miteinander verknüpft waren.

MFG Bobo(2009)
 
Zuletzt bearbeitet:
@XT5
Gibt es Informationen, inwieweit zur Performance (neben der schlichten Anzahl der Kerne) der vom 6MB L3-Cache abgeteilte (2MB-)Snoop-Cache beiträgt?
MfG

Cray baut Systeme mit 2 Sockeln, da macht der Snoop-Filter (HT Assist) keinen Sinn und wird abgeschaltet. Außerdem ist dessen Größe auf 1 MiB festgelegt!


MfG @


BTW Schicke Bilder Bobo *great*
 
Zuletzt bearbeitet:
Zurück
Oben Unten