AMD Mantle — Die neue API in einem ersten Test

Artikel-Index:

Update 2: Windows 8.1 — Multiplayer: Ergebnisse

Kom­men wir nun end­lich zu den von uns lang ersehn­ten Testergebnissen.

Windows 8.1, Ergebnisse FPS, Multiplayer, Siege of Shanghai, 64 Spieler

Bei den durch­schnitt­li­chen Frames pro Sekun­de ren­dert Man­t­le um etwas über 12 Pro­zent schnel­ler als DirectX. Die mini­ma­len Frames pro Sekun­de legen sogar um knapp ein Vier­tel zu. Sieg für Man­t­le. Kein KO, aber ein Punktsieg.

Windows 8.1, Ergebnisse Leistungsaufnahme, Multiplayer, Siege of Shanghai, 64 Spieler

Bei der Leis­tungs­auf­nah­me sehen wir nur recht gerin­ge Unter­schie­de. Unser Sys­tem ver­braucht nur rund ein Pro­zent mehr, sobald Man­t­le akti­viert wird.

Doch wir haben nicht umsonst alle mög­li­chen Para­me­ter mit­log­gen las­sen, sodass wir uns die Ergeb­nis­se noch ein­mal im Detail anschau­en wol­len. In der fol­gen­den Tabel­le sind die ermit­tel­ten Wer­te je Durch­lauf doku­men­tiert, was bei uns wäh­rend der Erstel­lung der Tabel­le für einen rie­si­gen Wow-Moment sorg­te. Doch seht selbst:

Windows 8.1, Details Auswertung Multiplayer

Die FPS-Wer­te der ein­zel­nen Durch­läu­fe je API sind bis auf die abso­lu­ten Min-FPS nahe­zu iden­tisch. Dabei spiel­te es offen­sicht­lich kei­ne Rol­le, wie lan­ge die Run­de lief, an wel­chen Stel­len auf der Map wir uns auf­hiel­ten, ob wir in Fahr­zeu­gen oder zu Fuß unter­wegs waren oder ob wir in einem Gebäu­de kämpf­ten oder auf einem Außen­are­al unser Glück such­ten — im Durch­schnitt schei­nen die­se Aspek­te nahe­zu egal zu sein. Von unse­ren erhoff­ten 10 Pro­zent Dif­fe­renz sind wir mei­len­weit ent­fernt — und das im posi­ti­ven Sin­ne. Doch schau­en wir uns die Tabel­le im Detail an.

  • Es fällt auf, dass Man­t­le zwar bes­se­re Min-FPS auf­weist, wenn man die abso­lu­ten Aus­rei­ßer her­aus­rech­net. Doch die­se her­aus­ge­rech­ne­ten FPS wei­sen eine erstaun­li­che Kon­ti­nui­tät auf, die let­zend­lich schlech­ter ist als bei DirectX. Eine klei­ne Anzahl Bil­der ist also kon­ti­nu­ier­lich schlech­ter als bei DirectX. Eine Begrün­dung für die­sen Sach­ver­halt kön­nen wir aber lei­der nicht liefern.
  • Die durch­schnitt­li­che Run­den­län­ge je API dif­fe­riert nur um fünf Sekun­den. Hier haben wir unbe­wusst eine Punkt­lan­dung hin­ge­legt. Dem geneig­ten Leser wer­den zudem ein paar nicht gefüll­te Zel­len auf­ge­fal­len sein. Hier haben wir im Eifer des Gefechts schlicht ver­säumt, den Afterbur­ner-Log zu star­ten. Da die vor­han­de­nen Mes­sun­gen aber sehr ähn­lich sind und gegen­über DirectX auch eine ein­deu­ti­ge Ten­denz auf­wei­sen, haben wir auf den erneu­ten Besuch des Schlacht­fel­des ver­zich­tet. In der Zwi­schen­zeit kam uns außer­dem noch der nächs­te Batt­le­field-4-Patch dazwi­schen, sodass wir ohne­hin kei­ne Mes­sun­gen mehr mit glei­chem Vor­zei­chen erstel­len können.
  • Im Detail ist noch zu sehen, dass die GPU-Last trotz bereits hoher 95,5 Pro­zent unter DirectX mit Man­t­le noch ein­mal um zwei Pro­zent­punk­te zulegt. Gleich­zei­tig wird die CPU um knapp sechs Pro­zent­punk­te ent­las­tet, was glat­te 10 Pro­zent Ver­än­de­rung der CPU-Last bedeu­tet. Der Mix aus erhöh­ter GPU-Last und ver­rin­ger­ter CPU-Last sorgt im End­ef­fekt für eine etwa ein­pro­zen­ti­ge Erhö­hung der Leistungsaufnahme.
  • Der GPU-Takt wird mit Man­t­le um durch­schnitt­lich vier Mega­hertz ver­rin­gert. Da die Tem­pe­ra­tur mit maxi­mal 47 Grad nicht mehr das Limit dar­stellt, scheint an die­ser Stel­le das TDP-Limit über­schrit­ten wor­den zu sein. Doch vier MHz bzw. rund 0,4 Pro­zent sind an die­ser Stel­le kaum der Rede wert. Hät­ten wir nicht auf eine Was­ser­küh­lung gesetzt, so wäre der GPU-Takt sowohl unter DirectX als auch unter Man­t­le deut­li­cher abge­fal­len. Gleich­zei­tig wäre der Unter­schied von DirectX zu Man­t­le etwas grö­ßer gewe­sen, wes­halb die Per­for­mance-Dif­fe­renz bei­der APIs um ein paar Pro­mil­le gerin­ger aus­ge­fal­len wäre.
  • Man­t­le benö­tigt wesent­lich mehr Gra­fik­kar­ten-Spei­cher. Rund 62 Pro­zent mehr VRAM wird gegen­über DirectX belegt, was zu durch­schnitt­lich knapp drei Giga­byte beleg­tem VRAM füh­ren. Und das, obwohl wir mit rela­tiv huma­nen Gra­fik­ein­stel­lun­gen gespielt haben. Höhe­re Qua­li­täts­ein­stel­lun­gen dürf­ten dann selbst bei vier Giga­byte VRAM der R9-290X wohl zum Über­lauf füh­ren, wovon auch vie­le betrof­fe­ne Spie­ler berich­ten. Zwar hat­ten wir zu kei­ner Zeit Pro­ble­me mit zu wenig VRAM, ange­sichts unse­rer Ein­stel­lun­gen ver­mu­ten wir hier aber auch ein­fach Glück. Anschei­nend gibt es an die­ser Stel­le noch ordent­lich Opti­mie­rungs­be­darf. Auch der nor­ma­le RAM wird mit etwa zwei Pro­zent mehr belas­tet, was aber eben doch eine ande­re Haus­num­mer ist als 62 Pro­zent beim deut­lich knap­pe­ren VRAM. Die Spei­cher­be­las­tung (sowohl RAM als auch VRAM, nicht in der Tabel­le ersicht­lich) liegt auf einem ver­gleichs­wei­se kon­stant hohen Niveau. Zwar gibt es ein paar Aus­rei­ßer nach unten, der Durch­schnitt liegt aber meist sehr nah am Maximum.

Wem die vor­an­ge­gan­ge­ne Detail­über­sicht noch nicht aus­reicht, für den haben wir noch eine wei­te­re Detail­be­trach­tung. Wir haben alle ger­en­der­ten Frames mit ihren Frame­ti­mes in einer Glo­cken­kur­ve dar­ge­stellt. Dar­in zeigt sich visu­ell der Unter­schied bei­der APIs. Von links nach rechts sehen wir die ein­zel­nen FPS-Wer­te. Je wei­ter rechts die Kur­ve beginnt, des­to höher die jewei­li­ge Bild­wie­der­hol­ra­te. Je höher die Kur­ve ansteigt, des­to mehr Frames haben die­se Berech­nungs­zeit benötigt.

Windows 8.1, Normalverteilung, Multiplayer, Siege of Shanghai, 64 Spieler, FPS

Es ist ein­deu­tig zu sehen, dass die Ver­tei­lungs­kur­ve mit Man­t­le deut­lich wei­ter rechts beginnt. Die benö­tig­ten Frame­ti­mes sind kür­zer, wes­halb mehr FPS zu Buche ste­hen. Zudem steigt die Kur­ve von DirectX lang­sa­mer an, sodass hier ersicht­lich wird, dass Man­t­le auch weni­ger lang­sa­me Frames gene­riert als DirectX. Ins­ge­samt lie­gen Kur­ven­an­fang und ‑ende bei Man­t­le enger zusam­men, sodass man von gleich­mä­ßi­ge­ren Frame­ti­mes bzw. bes­se­rer FPS-Ver­tei­lung spre­chen kann. Und natür­lich zeigt sich anhand des Dia­gramms auch, dass Man­t­le bei nahe­zu iden­ti­scher Berech­nungs­zeit wesent­lich mehr Frames lie­fern kann, wes­halb die Kur­ve ins­ge­samt höher aus­fällt als unter DirectX.

Hal­ten wir abschlie­ßend fest: Man­t­le macht auch im Mul­ti­play­er von Batt­le­field 4 vie­les rich­tig. Bis auf die ein­zel­nen lang­sa­men Frames und den hohen VRAM-Ver­brauch, wel­cher bei uns zwar noch unkri­tisch ist, ins­ge­samt aber deut­lich höher liegt als bei DirectX, konn­ten wir kei­ner­lei Nach­tei­le von Man­t­le fest­stel­len. Wir hat­ten kei­nen ein­zi­gen Absturz zu ver­zeich­nen, konn­ten Batt­le­field 4 so spie­len, wie es sich die Ent­wick­ler gedacht haben und hat­ten oben­drein noch mehr Leis­tung zur Ver­fü­gung. Das spricht in die­ser Moment­auf­nah­me kom­plett für Man­t­le. Wobei sich für die Zukunft mit­un­ter die Fra­ge stellt, ob der ver­stärk­te Fokus auf Man­t­le nicht womög­lich auch Aus­wir­kun­gen auf die DirectX-Per­for­mance hat. Denn ver­ein­zelt sind bereits Stim­men zu ver­neh­men, die von einem gerin­ge­ren Enga­ge­ment sei­tens AMD in Sachen DirectX-Per­for­mance-Ent­wick­lung aus­ge­hen. Hier kön­nen wir nur abwar­ten und die Situa­ti­on beobachten.