AMD bewirbt aktuell ein neues Feature, mit dem sie den Tablet-Markt aufmischen wollen. Genannt wird das ganze "Turbo-Dock" und das Funktionsprinzip ist recht einfach. Schließt man sein AMD-Tablet an eine Docking-Station mit externer Tastatur und sonstiger Peripherie an, muss keine Rücksicht mehr aufs Energiesparen genommen werden, weil in diesem Fall natürlich auch ein Anschluss ans Stromnetz besteht. Dadurch und durch bessere Kühlmaßnahmen plant AMD seine 1-GHz-Temash-APU um 40% auf 1,4 Ghz hochtakten zu können.
Das Ganze wird in folgendem Werbefilmchen von AMD gezeigt:
Neben all den Features ist aber insbesondere das Kleingedruckte interessant. So nennt AMD im Abspann einige Benchmark-Ergebnisse, unter anderem auch von Cinebench. Dieser Bench soll uns nun für einen kleinen Leistungsvergleich mit anderen Kernarchitekturen von AMD dienen. Als Vergleichsexemplare dienen zum einen der Jaguar-Vorläufer Bobcat in Form des Z-60 und ein C-50 mit gleichem Takt, sowie ein untertakteter Athlon-X4-750K auf Trinity-Basis mit Piledriver-Kernen unseres Forenmitglieds David64. Die Ergebnisse sind in der folgenden Tabelle zu sehen:
CPU
A6-1540
A6-1540
Z-60
C-50
Athlon X4 750K
Athlon X4 750K
Codename / Modus
Temash / Tablet
Temash / DockingTurbo
Hondo
Ontario
Trinity
Trinity
Kerne/Threads
4
4
2
2
4
4
CPU-Taktfrequenz
1,0 GHz
1,4 GHz
1,0 GHz
1,0 GHz
1,0 GHz (untertaktet)
1,4 GHz (untertaktet)
GPU-Taktfrequenz
300 Mhz
500 Mhz
275 Mhz
275 Mhz
- keine -
- keine -
L2-Cache-Größe
2 MB
2 MB
2 x 0,5 MB
2 x 0,5 MB
2x2 MB
2x2 MB
Cinebench 11.5 multith.
0,99
1,39
- unbekannt -
0,39
0,80
1,14
Cinebench 11.5 single
0,25 (Schätzung)
0,35 (Schätzung)
- unbekannt -
0,19 (Schätzung)
0,24
0,35
PCMark Vantage
3123
- unbekannt -
1914
1831
- unbekannt -
- unbekannt -
3DMark Vantage P
981
- unbekannt -
455
425
- unbekannt -
- unbekannt -
3DMark 11
379
537
- unbekannt -
190
- unbekannt -
- unbekannt -
GPU-Typ/Shadercores
GCN / 128
GCN / 128
VLIW5 / 80
VLIW5 / 80
- keine -
- keine -
Befehlssätze
SSEx/AES/AVX
SSEx/AES/AVX
bis SSSE3
bis SSSE3
SSEx/AES/AVX/FMA
SSEx/AES/AVX/FMA
RAM
2 GB DDR-1066
2 GB DDR-1066
4 GB DDR3-1066
2 GB DDR3-1066
2x2 GB DDR-1600
2x2 GB DDR-1600
TDP
~5W
~5W
4,5 W
9 W
100W
100W
Herstellungsprozess
28 nm
28 nm
40 nm
40 nm
32 nm SOI
32 nm SOI
Die-Size (mm²)
110 (Schätzung)
110 (Schätzung)
75
75
246
246
Update (05.03.2013): In der Tabelle hatte sich ein Fehler beim C-50 eingeschlichen, wir hatten dort statt den 3DMark Vantage P Werten fälschlicherweise die Punkte des CPU-Teilbenchmarks angegeben. Danke an Gipsel für den Hinweis. Außerdem wurde die Shaderzahl bei Kabini & Temash ergänzt. Laut AMDs Äußerungen auf der CES bekommt der Chip 2 GCN-Compute Units, was 128 Shaderkernen entspricht. Zusätzlich wurde der 3DMark11-Wert des C-50 ergänzt.
Auffallend ist nun, dass Jaguar unter Multithread-Bedingungen beim Cinebench um ca. 20% schneller arbeitet. Nun bedeutet das aber noch keinen IPC-Vorsprung. Cinebench ist bekanntlich etwas FPU-lastig und davon hat Trinity bauartbedingt ja nur zwei. Wie schaut es also mit nur einem Thread aus? Zwar gibt AMD keine Single-Thread-Ergebnisse des Temash an, jedoch skaliert Cinebench auf Mehrkern-CPUs ohne technische Finessen wie CMT oder SMT fast ideal. Mit einem angenommenen Skalierungsfaktor von 3,95 käme man so auf die Leistung eines einzelnen Jaguar-Kerns in Höhe von 0,25. Dies ist fast mit den gemessenen 0,24 Punkte des 750Ks bei 1,0 Ghz identisch. Die IPC bei Cinebench unterscheidet sich also nicht viel, Piledriver und Jaguar sind bei dieser Single-Thread-Anwendung also auf Augenhöhe.
Unter Betrachtung des Die-Flächen- und Energieverbrauchs sieht Bulldozer dagegen aber schlecht aus. Wie wir aus unserer alten Meldung über die Vorstellung des Jaguar-Quad-Moduls wissen, benötigt ein Jaguar-Quad-Modul ungefähr soviel Fläche wie ein einziges Bulldozer-Modul. Nun ziehen aber selbst zwei Module leistungstechnisch den Kürzeren, der Flächen- und Stromverbrauch ist deshalb nicht zu rechtfertigen.
Das Bulldozer-Design ist deswegen aber nicht per se schlecht, bei Einsatz von FMA-Code würde sich dessen theoretische Leistung verdoppeln. Für HPC-Anwendungen und andere Einsätze, bei denen Spitzenleistungen verlangt werden, bleibt Bulldozer also erste Wahl. Aber für alles Andere wie normale Desktop-Anwendungen oder auch Spielkonsolen wie die PS4 (wir berichteten) führt an Jaguar so gut wie kein Weg vorbei – zumindest solange man mit den eher bescheidenen Taktraten um die 2 GHz auskommen kann.
Diesen Artikel bookmarken oder senden an ...