Ergänzung: AMD A10-7700K & A10-7850K

Artikel-Index:

Weitere OpenCL-Tests und HSA

Bevor wir uns anse­hen, wie die APUs abschlie­ßen, wenn der HSA-Stack (Hete­ro­ge­neous Sys­tem Archi­tec­tu­re) genutzt wird, müs­sen wir eini­ge Wor­te verlieren.
Für den tech­ni­schen Hin­ter­grund möch­ten wir euch fol­gen­de Bei­trä­ge aus der Ver­gan­gen­heit ans Herz legen:

Die Ver­öf­fent­li­chung der “Hete­ro­ge­nen Sys­tem­ar­chi­tek­tur” sorg­te für Auf­se­hen. Jah­re­lang hat­te AMD auf die­sen Schritt hin­ge­ar­bei­tet. Wie es schon immer war, muss auch die Soft­ware die Fea­tures der Hard­ware unter­stüt­zen. Im Fal­le der APUs stützt sich AMD vor allem auf Open­CL (News zum ers­ten Cata­lyst mit OpenCL‑2.0‑Support). In der Pra­xis kön­nen wir mit einem Pres­se­trei­ber ein HSA-Gerät instal­lie­ren. Die Opti­on hier­zu ist aber erst ver­füg­bar, wenn IOMMU im BIOS/UEFI akti­viert wird. Das HSA-Gerät erscheint mit­samt dem IOM­MU-Device im Gerä­te-Mana­ger von Micro­softs Win­dows und signa­li­siert die theo­re­ti­sche Ver­füg­bar­keit. Auf­grund des aktu­el­len Betasta­tus von HSA in Ver­bin­dung mit Win­dows sind etli­che wei­te­re Ein­grif­fe not­wen­dig. Hier­zu zählt unter ande­rem die Deak­ti­vie­rung von Strom­spar­me­cha­nis­men über die Win­dows-Regis­try. Über die clinfo.exe kön­nen wir her­aus­fin­den, ob der HSA-Stack für Berech­nun­gen genutzt wird.

Im dazu­ge­hö­ri­gen Ord­ner, den uns AMD zur Ver­fü­gung gestellt hat, befin­den sich meh­re­re Pro­gram­me, die auch schon auf ande­ren Sei­ten vor­ge­stellt wur­den. Neben einer ange­pass­ten Ver­si­on von Corels AfterShot Pro, das wir nicht getes­tet haben, fin­den wir einen JPG-Deko­der sowie eine ange­pass­te Ver­si­on von Libre­Of­fice. Im Netz fin­den sich jedoch Andeu­tun­gen, dass auch nicht spe­zi­ell opti­mier­te Anwen­dun­gen bereits vom HSA-Stack pro­fi­tie­ren wür­den. Dazu gehö­ren unter ande­rem der bekann­te Lux­Mark sowie der PCMark 8. Letz­te­rer möch­te bei uns nicht feh­ler­frei durch­lau­fen und stürzt bei bei­den APUs an der glei­chen Stel­le ab. Libre­Of­fice pro­fi­tiert laut unse­ren Ver­su­chen von Open­CL, der zusätz­li­che Leis­tungs­schub durch HSA ist nicht reproduzierbar.

Der Lux­Mark pro­fi­tiert vom HSA-Trei­ber, sobald die GPU ins Spiel kommt. Unge­wöhn­lich ist der Anstieg der GPU-Leis­tung, wenn der A10-7850K genutzt wird. Soll expli­zit nur die CPU genutzt wer­den, sehen wir kei­nen Unter­schied in der Leistungsfähigkeit.

Der im AMD-Paket ent­hal­te­ne JPG-Deko­der ist “clo­sed source”. Die Aus­füh­rung ist nur mit den Kaveri-APUs mög­lich. Wir sehen, dass durch die Nut­zung der GPU viel Zeit ein­ge­spart wer­den kann: je grö­ßer die Auf­lö­sung der Bil­der, des­to grö­ßer der Nut­zen. Wird der HSA-Trei­ber instal­liert und das HSA-Device als Open­CL-Device genutzt, lässt sich der Bench­mark nicht mehr aus­füh­ren. Wir ver­mu­ten, dass der Bench­mark an die Iden­ti­fi­ka­ti­on der Spect­re-GPU geknüpft ist.

Zuletzt haben wir uns eines der bekann­tes­ten Pack­pro­gram­me ange­se­hen, Win­Zip. Mit den Ver­sio­nen 17.5 und 18.5 bie­tet der Her­stel­ler der Soft­ware Open­CL-Sup­port. Wir wol­len anhand von Stopp­uhr-Mes­sun­gen (arith­me­ti­sches Mit­tel von drei Mes­sun­gen) her­aus­fin­den, ob auch eine All­tags­an­wen­dung vom HSA-Trei­ber pro­fi­tie­ren kann. An den Kom­pres­si­ons­ein­stel­lun­gen ver­än­dern wir nichts, son­dern nut­zen die Standardeinstellungen.

In unse­rem Fall pro­fi­tiert Win­Zip 17.5 nur gering­fü­gig, wenn Open­CL genutzt wird. Der HSA-Stack kann sich ent­we­der gar nicht oder nur mit gering­fü­gi­gem Abstand an die Spit­ze brin­gen. Über­ra­schend ist, dass die klei­ne­re A10-7700K-APU mit Open­CL schnel­ler als das Top­mo­dell rechnet.
Nut­zen wir die aktu­el­le Ver­si­on 18.5, ist der Unter­schied zwi­schen CPU- und Open­CL-Berech­nun­gen deut­lich grö­ßer. Im Fal­le der A10-7850K-APU sehen wir eine leicht län­ge­re Kom­pres­si­ons­zeit gegen­über dem nor­ma­len Open­CL. Bei der klei­ne­ren Ver­si­on A10-7700K kann erneut ein leich­ter Vor­sprung her­aus­ge­ar­bei­tet werden.

Zum The­ma HSA kön­nen wir anhand des kur­zen Ein­blicks nur eines sagen: Der Betasta­tus ist spür­bar. Die Instal­la­ti­on ist noch kom­pli­ziert und nicht für jeder­mann zugäng­lich. Aktu­el­le Soft­ware kann eben­so nicht in hohem Maß pro­fi­tie­ren. Akzen­te sind zu sehen, der Wow-Effekt bleibt jedoch (aktu­ell noch) aus. Dabei dür­fen wir nicht ver­ges­sen, dass alle getes­te­ten Anwen­dun­gen für die Nut­zung von Open­CL 1.x vor­ge­se­hen sind und theo­re­tisch kei­ne HSA-Fea­tures nut­zen soll­ten. Inwie­weit ande­re Opti­mie­run­gen grei­fen, kön­nen wir nicht sagen.