Ergänzung: AMD A10-7700K & A10-7850K
Weitere OpenCL-Tests und HSA
Bevor wir uns ansehen, wie die APUs abschließen, wenn der HSA-Stack (Heterogeneous System Architecture) genutzt wird, müssen wir einige Worte verlieren.
Für den technischen Hintergrund möchten wir euch folgende Beiträge aus der Vergangenheit ans Herz legen:
- Artikel — AMD präsentiert mit Kaveri die erste APU mit den HSA-Merkmalen hQ und hUMA
- News — Kaveris HSA-Features: AMD nennt Zeitplan für Unterstützung in Treibern und Tools
Die Veröffentlichung der “Heterogenen Systemarchitektur” sorgte für Aufsehen. Jahrelang hatte AMD auf diesen Schritt hingearbeitet. Wie es schon immer war, muss auch die Software die Features der Hardware unterstützen. Im Falle der APUs stützt sich AMD vor allem auf OpenCL (News zum ersten Catalyst mit OpenCL‑2.0‑Support). In der Praxis können wir mit einem Pressetreiber ein HSA-Gerät installieren. Die Option hierzu ist aber erst verfügbar, wenn IOMMU im BIOS/UEFI aktiviert wird. Das HSA-Gerät erscheint mitsamt dem IOMMU-Device im Geräte-Manager von Microsofts Windows und signalisiert die theoretische Verfügbarkeit. Aufgrund des aktuellen Betastatus von HSA in Verbindung mit Windows sind etliche weitere Eingriffe notwendig. Hierzu zählt unter anderem die Deaktivierung von Stromsparmechanismen über die Windows-Registry. Über die clinfo.exe können wir herausfinden, ob der HSA-Stack für Berechnungen genutzt wird.
Im dazugehörigen Ordner, den uns AMD zur Verfügung gestellt hat, befinden sich mehrere Programme, die auch schon auf anderen Seiten vorgestellt wurden. Neben einer angepassten Version von Corels AfterShot Pro, das wir nicht getestet haben, finden wir einen JPG-Dekoder sowie eine angepasste Version von LibreOffice. Im Netz finden sich jedoch Andeutungen, dass auch nicht speziell optimierte Anwendungen bereits vom HSA-Stack profitieren würden. Dazu gehören unter anderem der bekannte LuxMark sowie der PCMark 8. Letzterer möchte bei uns nicht fehlerfrei durchlaufen und stürzt bei beiden APUs an der gleichen Stelle ab. LibreOffice profitiert laut unseren Versuchen von OpenCL, der zusätzliche Leistungsschub durch HSA ist nicht reproduzierbar.
Der LuxMark profitiert vom HSA-Treiber, sobald die GPU ins Spiel kommt. Ungewöhnlich ist der Anstieg der GPU-Leistung, wenn der A10-7850K genutzt wird. Soll explizit nur die CPU genutzt werden, sehen wir keinen Unterschied in der Leistungsfähigkeit.
Der im AMD-Paket enthaltene JPG-Dekoder ist “closed source”. Die Ausführung ist nur mit den Kaveri-APUs möglich. Wir sehen, dass durch die Nutzung der GPU viel Zeit eingespart werden kann: je größer die Auflösung der Bilder, desto größer der Nutzen. Wird der HSA-Treiber installiert und das HSA-Device als OpenCL-Device genutzt, lässt sich der Benchmark nicht mehr ausführen. Wir vermuten, dass der Benchmark an die Identifikation der Spectre-GPU geknüpft ist.
Zuletzt haben wir uns eines der bekanntesten Packprogramme angesehen, WinZip. Mit den Versionen 17.5 und 18.5 bietet der Hersteller der Software OpenCL-Support. Wir wollen anhand von Stoppuhr-Messungen (arithmetisches Mittel von drei Messungen) herausfinden, ob auch eine Alltagsanwendung vom HSA-Treiber profitieren kann. An den Kompressionseinstellungen verändern wir nichts, sondern nutzen die Standardeinstellungen.
In unserem Fall profitiert WinZip 17.5 nur geringfügig, wenn OpenCL genutzt wird. Der HSA-Stack kann sich entweder gar nicht oder nur mit geringfügigem Abstand an die Spitze bringen. Überraschend ist, dass die kleinere A10-7700K-APU mit OpenCL schneller als das Topmodell rechnet.
Nutzen wir die aktuelle Version 18.5, ist der Unterschied zwischen CPU- und OpenCL-Berechnungen deutlich größer. Im Falle der A10-7850K-APU sehen wir eine leicht längere Kompressionszeit gegenüber dem normalen OpenCL. Bei der kleineren Version A10-7700K kann erneut ein leichter Vorsprung herausgearbeitet werden.
Zum Thema HSA können wir anhand des kurzen Einblicks nur eines sagen: Der Betastatus ist spürbar. Die Installation ist noch kompliziert und nicht für jedermann zugänglich. Aktuelle Software kann ebenso nicht in hohem Maß profitieren. Akzente sind zu sehen, der Wow-Effekt bleibt jedoch (aktuell noch) aus. Dabei dürfen wir nicht vergessen, dass alle getesteten Anwendungen für die Nutzung von OpenCL 1.x vorgesehen sind und theoretisch keine HSA-Features nutzen sollten. Inwieweit andere Optimierungen greifen, können wir nicht sagen.