AMD Piledriver vs. Steamroller vs. Excavator — Leistungsvergleich der Architekturen
Architekturvergleich – how to?
Nicht ganz, schließlich haben Architekturvergleiche hier auf planet3dnow.de eine lange Tradition. Wir haben schon die K6- mit der K7-Architektur verglichen, K7 mit K8, K8 mit K10 und K10 mit Bulldozer (K15). Wenn man nicht Prozessoren miteinander vergleichen möchte, sondern deren Architekturen, muss man annähernd identische Voraussetzungen schaffen. Das wichtigste Kriterium ist “gleiche Taktfrequenz”. Das ist heutzutage schwieriger als es klingt, denn “die” Taktfrequenz gibt es eigentlich gar nicht mehr. Heute wechseln die Prozessoren je nach Lastzustand zwischen einem halben Dutzend Frequenzen hin und her, von der Leerlauf-Drehzahl über diverse Zwischenstufen, den Basistakt, bis hin zu mehreren Turbotaktraten. Zu allem Überfluss ist nicht nur die Last ein Kriterium für die Taktfrequenz, sondern auch die zulässige TDP – bei APUs u.a. abhängig vom integrierten Grafikprozessor – und natürlich die Temperatur, was gerade bei Fertig-Laptops beim Testen ein Problem werden kann, wenn der Hersteller bei der Kühlung gespart hat.
Wie also will man unter diesen Voraussetzungen CPU-Architekturen vergleichen, wenn schon ein und dasselbe Prozessormodell um 50% abweichende Performance liefern kann, je nachdem, ob der Notebook-Hersteller ihn auf 12 W oder 35 W TDP eingestellt hat, ob er ihn aufwändig kühlt oder so billig wie möglich? Das wird nicht einfach, aber man muss den kleinsten gemeinsamen Nenner finden. Das ist in unserem Fall die Excavator-APU Carrizo. Die haben wir in Form eines HP Pavilion 15-ab052ng vor uns, eines Consumer-Notebooks ohne Wartungsklappen, mit nur einem DDR3-Modul bestückt, das HP mit lediglich 1333 MHz arbeiten lässt, obwohl es ein DDR3-1600-Modul ist, 100-MBit-LAN (dass es so was noch gibt!?) und ohne jegliche Möglichkeiten im BIOS Taktraten, TDPs oder sonst irgendetwas einzustellen.
Der AMD A10-8700P ist also unsere Basis, an die sich alle anderen anpassen müssen. Leider wäre das Projekt an dieser Stelle schon fast gescheitert, denn die APU zeigte sich äußerst zickig gegenüber den einschlägigen Tuning-Tools. AMDs Overdrive wurde zuletzt 2014 aktualisiert, war also keine große Hilfe. AMDMsrTweaker konnte zwar APM und Turbo abschalten, aber immer nur für Sekunden, dann ließ eine “höhere Macht” die Taktfrequenz wieder tanzen; und PSCheck startete auf dem Carrizo erst gar nicht. Auch die Leistungseinstellungen im Catalyst Control Center waren auf den ersten Blick keine Hilfe. Damit konnte man zwar den minimalen Takt anheben, aber der dort verzeichnete maximale Takt von 1,8 GHz war lediglich der Basistakt und der Turbo tanzte munter darüber hinweg. Die nächstniedrigere Stufe auf der Skala war 1,6 GHz, aber auch das schien Carrizo nicht weiter zu interessieren – zumindest laut Taktfrequenz-Anzeige im Windows-10-Taskmanager. In Wahrheit jedoch hatten wir hier unser Schlupfloch gefunden, denn der Taskmanager zeigt anscheinend nur die Taktfrequenz an, die das System gemäß seinen P‑States gerne hätte, nicht wie sie tatsächlich sind. CPU‑Z in der neuesten Beta half uns aus. Hier zeigte sich der Takt auf 1600 MHz festgenagelt und Gegenchecks mit CPU-Benchmarks, die bekannt linear mit dem Takt skalieren, bewiesen: Wir hatten den Excavator-befeuerten Carrizo auf 1600 MHz festgezurrt.
Die weitere Gemeinsamkeit, die wir finden mussten, war die Speicherkonfiguration. HP hat unser Testexemplar zwar mit DDR3-1600-Speicher bestückt, aber allen Ernstes trotz fehlender Wartungsklappe (Argument “Nachrüstung”) nur mit einem Modul, zu allem Überfluss auch noch im DDR3-1333-Modus arbeitend. 10,7 GB/s Transferrate also nur statt der möglichen 25,6 GB/s. Das heißt, wir dürfen unsere Vergleichssysteme mit Piledriver- und Steamroller-Kernen auch nur mit DDR3-1333-Single-Channel-RAM bestücken.
Folgende Eckdaten haben wir also nun:
- 2 Module / 4 Threads
- 1600 MHz Taktfrequenz, 1300 MHz Northbridge-Taktrate
- Turbo aus, APM aus, CnQ aus
- RAM: 1x 8 GiB DDR3-1333 Single-Channel 9–9‑9–24 1T, Dual-Rank
- Microsoft Windows 10 x64
- AMD Catalyst 15.7.1 WDDM 2.0
Doch das ist noch nicht alles: Wenn wir die CPU-Architekturen vergleichen wollen, müssen wir alle störenden Einflüsse der unterschiedlichen Plattformen eliminieren. So haben Kaveri und Carrizo z.B. einen integrierten PCI-Express‑3.0‑Controller, Trinity jedoch nur einen der Version 2.0. Das heißt, Tests mit PCI-Express-Grafikkarten sind tabu – und mit einem Laptop ohnehin “schwierig”. Auch die integrierten GPUs dürfen wir nicht nutzen, schließlich basiert die GPU von Trinity noch auf VLIW4, Kaveris und Carrizos dagegen schon auf GCN – von den unterschiedlichen Shaderzahlen, Taktfrequenzen und TDP-Budgets mal ganz abgesehen; ergo grundsätzlich keine Tests, die irgendwie grafiklastig wären. Aber damit ist das Ende noch nicht erreicht! Carrizo ist ein SoC, trägt also den kompletten Chipsatz samt SATA-Controller in der CPU. Carrizo hat so prinzipbedingt erheblich kürzere Latenzen beim Zugriff auf alles, was man früher Southbridge nannte, als die extern angebundenen Chips bei Trinity und Kaveri. Damit scheiden auch all jene Benchmarks aus, die das Gesamtsystem beanspruchen. Was wir brauchen, sind also Tests, die rein in der CPU laufen oder das Subsystem so schwach beanspruchen, dass es nicht ins Gewicht fällt!
Obwohl wir uns so viel Mühe gemacht hatten mit der Speicherkonfiguration, mussten wir nach ersten Checks auch RAM-lastige Benchmarks streichen, denn trotz gleicher Konfiguration der Primärparameter zeigten Latenztests bei Carrizo deutlich längere Zugriffszeiten. Irgendwelche sekundären Timings oder der Northbridgetakt, auf den wir am Carrizo-Laptop natürlich keinen Einfluss hatten, mussten – vermutlich dem Stromsparen auf der Notebook-Plattform geschuldet – langsamer eingestellt sein als bei den zum Vergleich herangezogenen Systemen. Wir haben dennoch ein paar Speichertests durchgeführt und zeigen sie auch, weil einige interessante Werte dabei sind.
Wir haben uns für folgende entschieden:
- Cinebench 11.5 x64
- Cinebench 15 x64
- 7‑Zip 9.38 x64
- Truecrypt 7.1a
- Fritz (Schach-Benchmark) 4.2
- LAME 3.99.5 x64
- AIDA64 Engineer 5.30