AMD stellt sechste APU-Generation „Carrizo” für Notebooks vor

Artikel-Index:
AMD-FX-APU-Logo

Auf der aktuell in Taipei stattfindenden COMPUTEX 2015 hat AMD heute die „Carrizo”-APUs vorgestellt, mit denen speziell im Mainstream-Marktsegment zwischen 400 und 700 US-Dollar angegriffen werden soll. Hier möchte AMD verlorene Marktanteile zurückgewinnen. Damit dies gelingen kann, wurde stark an der Energieeffizienz gearbeitet. AMD selbst spricht vom größten Sprung in der Firmengeschichte. Außerdem sollen sich die neuen APUs, die offiziell als sechste Generation bezeichnet werden, besonders durch die Wiedergabe von UHD-Videos auszeichnen. Dazu wurde die Rechenleistung der UVD-Einheit deutlich aufgebohrt, sodass mittels HEVC-Codec (H.265) komprimierte Videos mit einer Auflösung von 3840 × 2160 Pixeln bei einer Bildwechselrate von 60 Hz flüssig dekodiert werden können. Zudem bietet Carrizo erstmals volle Unterstützung für die HSA-Spezifikation in Version 1.0 und die Sicherheitstechnologie ARM TrustZone.

Die technischen Highlights der „Carrizo”-APU fasst AMD wie folgt zusammen:

„Excavator”-CPU-Kerne: höhere IPC und Energieeffizienz

Seit der ISSCC im Februar waren die meisten Eckdaten bereits bekannt:
Carrizo wird 250 mm² groß, ein CPU-Modul wird 23 % kleiner und der Stromverbrauch sinkt um 40 % ggü. Kaveri. Der Level-1-Datencache eines jeden Integer-Clusters wurde von 16 kB und vierfacher Assoziativität auf 32 kB und achtfache Assoziativität vergrößert. Damit dürfte die Trefferrate nach einer Daumenregel ungefähr auf das Vierfache ansteigen. Neues hat AMD nun über dessen Implementierung verraten:

Demnach konnte AMD den Stromverbrauch des L1-Caches trotz dessen Verdopplung halbieren. Sicherlich keine Kleinigkeit, AMD scheint derzeit ein besonders fähiges Ingenieurteam zu haben. Das lässt für AMDs neue Zen-Architektur durchaus hoffen. Aber zurück zum Excavator. Bei der aktuellen Präsentation wurde noch ein weiteres Detail bekannt gegeben. Demnach hat AMD auch die Sprungvorhersage verbessert:

Statt bisher 512 Einträgen wurde die Anzahl der Einträge des Sprungzielpuffers bei Excavator um die Hälfte auf 768 vergrößert. Dies kommt etwas überraschend, schließlich war eine gute Sprungvorhersage mit ein Hauptvorteil des Bulldozerdesigns. Da eine Einheit für zwei Kerne bzw. Threads verantwortlich ist, fiel sie auch bisher schon recht großzügig aus. Möglicherweise ist diese Verbesserung schlicht eine Auswirkung der HD-Libraries. Vor allem das Front-End mit dem Instruktionscachekontroller profitiert ja von AMDs Schrumpfkur:

Vermutlich standen die Ingenieure also schlicht vor dem seltenen Luxusproblem, plötzlich Die-Platz zur Verfügung zu haben. Unter diesen Rahmenbedingungen bietet sich natürlich eine abermalige Investition in eine bessere Sprungvorhersage an.

Ein weiterer Punkt der Sprungvorhersage betrifft die FPU. Diese steht im Falle falscher Sprungvorhersagen nun schneller zur Verfügung als bisher, da der „Flush” der (überflüssigen) Daten bei Excavator schneller vonstattengeht.

Im Gegenzug zur L1-Verdoppelung halbierte AMD den L2-Cache auf 1 MB pro Modul. Trotzdem verspricht AMD für Excavator aber eine IPC-Verbesserung von 9-13%:

Damit hat AMD sicherlich alles richtig gemacht. Einerseits spart man einen Großteil der Die-Fläche durch zwei MB weniger L2-Cache, andererseits wird der Prozessor aber trotzdem schneller. Das erfreut den Kunden, während AMD die APU günstiger fertigen kann. Gleichzeitig wird auch noch der Stromverbrauch gedrosselt. Auf die Hintergründe von AMDs Stromsparkniffen gingen wir bereits im ISSCC-Artikel ein, nun verriet AMD auch noch ein Detail, wie sich der Stromverbrauch auf die einzelnen Chipbereiche im Vergleich zur Kaveri-Generation verteilt und unterscheidet:

DDR4–Unterstützung

Offiziell wird Carrizo mit DDR3-Unterstüzung beworben, jedoch fand unser Forenmitglied Crashtest im gleichzeitig veröffentlichten Programmierleitfaden mehrere Einträge zu DDR4. Demnach besitzt Carrizo also einen DDR4-Kontroller. Dies wird sogar für eine FM2+-Version beschrieben, was überraschend ist, da Carrizo (noch?) nicht für FM2+ angekündigt ist. Jedoch darf man nicht alles für bare Münze nehmen, was in Programmierleitfäden steht, schließlich ändert AMD des Öfteren die Produktpläne. Festzuhalten ist aber, dass das Carrizo-Die mit DDR4-Speicher umgehen kann, sodass z.B. eine AM4-Version durchaus möglich erscheint.

Optimierte GCN-GPU mit Unterstützung für HSA 1.0

Auf Seiten der GPU wurde die Architektur auf die dritte GCN-Generation aktualisiert, die bisher nur von der „Tonga”-GPU der Radeon R9 285 bekannt ist. Damit einher geht ein effizienteres Frontend, welches außerdem eine höhere Tessellation-Leistung bietet. Die komprimierte Übertragung der Texturen vom und zum Speicher (Delta Color Compression) soll für 5 bis 7 % mehr Grafikleistung sorgen. Zudem wird hardwareseitig erstmals volle Unterstützung für die HSA-Spezifikation der Version 1.0 geboten. Passend zum Start von Windows 10 wird wie bei allen anderen GCN-GPUs DirectX 12 unterstützt. Allerdings bleibt vorerst ungewiss, für welches Feature-Level dies genau gilt.

Um den vorhandenen TDP-Spielraum effizienter nutzen zu können, hat die GPU ihre eigene Spannungsversorgung bekommen. Zuvor hingen Northbridge und GPU an derselben. Wegen der konsequenten Auslegung des Designs auf einen Bereich geringer Leistungsaufnahme konnte in ebenjenem die Energieeffizienz deutlich gesteigert werden. Zudem können jetzt auch bei 15 W TDP alle acht GCN-CUs genutzt werden.

Aufgebohrte UVD-Einheit

Neben der Unterstützung von UHD und HEVC haben die Ingenieure erneut an einer Reduktion der Leistungsaufnahme beim Abspielen von Videos gearbeitet. Normalerweise wird das dekodierte Video zurück in den Speicher geschrieben, von dort für eventuelle Bildnachbearbeitungen sowie Skalierung erneut geladen und zurückgeschrieben, um schließlich nochmals für die Bildausgabe aus dem Speicher geladen zu werden. Für „Carrizo” wurde die Display Engine um die Fähigkeit zur Bildskalierung erweitert, sodass ein Weg über den Speicher eingespart werden kann, wenn keine Bildnachbearbeitung erforderlich ist.
Die zweite Optimierung nutzt die massive Erhöhung der Rechenkapazität zur Dekodierung von UHD-Videos. Dadurch ist die UVD-Einheit in der Lage, FullHD-Videos viel schneller zu dekodieren, als es erforderlich ist. Sobald die einzelnen Bilder fertig berechnet sind, kann somit der Hardwareblock abgeschaltet und von der Spannungszufuhr getrennt werden (Power Gating). Insgesamt will AMD durch diese Maßnahmen eine doppelt so lange Videowiedergabe im Akkumodus gegenüber „Kaveri” ermöglichen.

Bereits in der Vergangenheit hatte AMD mit den Entwicklern des Open-Source-Projekts HandBrake zusammengearbeitet, um die Decodierung von Videos auf die UVD-Einheit und die Videoskalierung mittels OpenCL auf die GPU auszulagern. Aktuell wird daran gearbeitet, dass das Videotool zum Encodieren im H.264-Codec an Stelle der CPU die VCE-Einheit von APUs verwenden kann. Die unten gezeigten Werte wurden mit Beta-Treibern und einer Beta-Version von Handbrake bei der Transkodierung einer Videodatei gemessen (von 10 Mbps h.264 nach 5 Mbps h.264.CZN-52). Neben möglichen Geschwindigkeitsvorteilen könnte die Verwendung der Video Coding Engine (VCE) im mobilen Einsatz die Akkulaufzeit verlängern. Wann die Funktionalität in einer stabilen Version verfügbar wird, ist wie immer bei Open-Source-Projekten nicht vorhersagbar.

Softwareunterstützung

Neben der bereits bekannten Gestensteuerung (AMD Gesture Control), die einzig eine HD-Webcam voraussetzt, können Käufer eines „Carrizo”-Notebooks künftig AMD Looking Glass verwenden. Mit Hilfe dieser Anwendung kann ein Suchindex für alle auf dem Massenspeicher vorhandenen Videos erstellt werden, wobei eine Gesichtserkennung sämtliche darin vorkommenden Gesichter erfasst. Durch die nachträgliche Zuordnung von Namen durch den Anwender kann die Videosammlung gezielt nach Videos mit einer bestimmten Person durchsucht werden. Um die gewaltige Datenmenge schnell verarbeiten zu können, greift die Software auf die Rechenleistung der GPU zurück.

Carrizo-Lineup

Zum Start besteht das Angebot lediglich aus je einem Modell in der FX-, A10- und A8-Serie. Alle „Carrizo”-APUs nutzen das FP4-Package, werden also auf dem Mainboard fest verlötet. Abermals können die OEMs über die konfigurierbare TDP einen Wert zwischen 12 und 35 W einstellen, was natürlich in erster Linie einen Einfluss auf das Turboverhalten hat.

AMD gibt an, mit allen großen OEMs an Notebookmodellen im anvisierten Preisbereich zwischen 400 bis 700 US-Dollar gearbeitet zu haben. Genannt werden speziell ASUS, Acer, Lenovo, Toshiba und HP. Entsprechende Geräte sollen zwischen Juni und August erscheinen. Wann und ob all diese dann auch nach Deutschland kommen, bleibt aber ungewiss. Vielleicht helfen ja die Spiele DiRT Rally oder LEGO Batman 3: Jenseits von Gotham, welche als kostenlose Dreingabe beigelegt werden können.

Sämtliche Folien findet ihr auf den nachfolgenden beiden Seiten.

Quelle: AMD

» Carrizo-Folien Überblick