AMD präsentiert mit Kaveri die erste APU mit den HSA-Merkmalen hQ und hUMA
Endlich ist es soweit, nach mehrjähriger Wartezeit und nach drei APU-Generationen, in denen x86-Prozessor und ATI-Grafikeinheit zumindest schon auf einem Siliziumträger vereint waren, entlässt AMD heute nun mit der 4. Generation namens Kaveri die erste vollintegrierte APU in den Markt, bei der die beiden wichtigsten Einheiten ohne viel Aufwand gemeinsam rechnen können. Oder kurz: HSA ist nun erhältlich.
Im Gegensatz zu den Vorläufergenerationen können nun alle APU-Recheneinheiten ohne Umwege über Partitionen oder sonstige Tricks auf den gemeinsamen Hauptspeicher mittels hUMA zugreifen. Auch die Kooperation zwischen den ehemals unterschiedlichen Rechenwerken wurde durch die sogenannten heterogenen Warteschlangen vereinfacht. Folgerichtig ist das AMD Marketing mutig und vermarktet Kaveri mit gleich 12 Rechenkernen (compute cores). Dabei zählt AMD die vier x86-Kerne, die die beiden Steamrollermodule beisteuern, sowie die acht Rechenkerne — nach alter Lesart sind dies 512 Shader — der GCN-Grafikeinheit zusammen:
Ob dies eine weise Entscheidung war, werden der Markt und die Reaktion der Kunden zeigen müssen. Positiv anzumerken sind zumindest die neuen Kerne der bereits erwähnten Steamroller-Architektur. Nachdem Piledriver zwar bemerkbares Feintuning lieferte, architektonisch aber wenig Neues brachte, durfte man auf Steamroller gespannt sein. Schließlich hatte AMD nun genug Zeit, um die engsten Flaschenhälse der Bulldozer-Architekturfamilie zu weiten.
Das Steamroller-Design kann durchaus gefallen, allerdings gilt das leider nur unter Vorbehalt, denn aufgrund des eng gesteckten Zeitplans und der wenigen Testexemplare, die AMD für Deutschland einplante, gingen wir leider leer aus, so dass wir Kaveri nicht durch den üblichen Planet-3DNow!-Testparcours schicken konnten. Als einzige Tests konnten wir bei einer Pressedemo in München die Mikrobenches von AIDA64 laufen lassen und die Ergebnisse sichern. Zugegeben wenig, aber eben auch besser als gar nichts. Wir versprechen aber die Tests nach Erhalt eines Samples nachzuliefern.
Damit gehen wir zum informativen Teil über, den wir der offiziellen AMD-Präsentation entnehmen konnten. Vieles dazu hatten wir bereits vor ein paar Tagen gemeldet, als der Foliensatz im Internet durchsickerte, jedoch darf es hier in einer Übersicht nicht fehlen:
Hier sieht man also, dass das Kaveri-Die ein bisschen kleiner als Trinity bzw. Richland ist, obwohl sowohl Steamrollerkerne als auch GCN-Kerne das Transistorenbudget erhöhten. Dies ist dem etwas kleinerem Herstellungsprozess zu verdanken. AMD nennt diesen “28 nm SHP” und streicht heraus, dass er für ein APU-Design optimiert worden sei, was aufgrund der unterschiedlichen Anforderungen von Prozessor- und Grafikkernen aber fast unmöglich ist. Sicherlich darf man aber annehmen, dass AMD den bestmöglichen Kompromiss gewählt hat:
Überraschend ist das Kürzel “SHP”, trugen doch bisher nur SOI-Prozesse diesen Namen und kündigte AMD doch vor geraumer Zeit an, auf Bulk-Prozesse zu wechseln. Steamroller wird auf der kommenden ISSCC-Präsentation sogar als Bulk-Design angekündigt, anscheinend hat hier ein Umdenken eingesetzt. Wir warten noch auf eine Antwort von AMD, um diesen Sachverhalt endgültig aufklären zu können.
Update 23.01.2014: AMD hat uns jetzt offiziell bestätigt, dass es sich beim verwendeten 28nm-SHP-Prozess um einen Bulk-Prozess handelt. Mehr dazu findet Ihr in der zugehörigen News.