News Fable Legends: Zweiter DirectX-12-Benchmark wiederholt gute Ergebnisse für AMD-GPUs

Onkel_Dithmeyer · 28.09.2015

Vor einigen Wochen berichteten wir über die ersten Ergebnisse zu Microsofts neuer Grafik-API DirectX 12. Das Spiel Ashes of the Singularity zeigte Leistungszugewinne für AMD-Grafikkarten von bis zu 75 %, während NVIDIAs Pixelbeschleuniger aufgrund der fehlenden Async-Compute-Funktion um bis zu 10 % weniger Bilder in der Sekunde renderten.
(…)

» Artikel lesen

SPINA · 28.09.2015

Onkel_Dithmeyer schrieb:
...aufgrund der fehlenden Async-Compute-Funktion um bis zu 10% weniger Bilder in der Sekunde renderten.

Ich dachte der derzeitige Stand wäre, dass Asynchronous Shader bei der Maxwell-Architektur gegeben sind. Allerdings mit der bedeutsamen Einschränkung, dass dies nur bis zu einer Queue Length von < 32 ohne Context Switch möglich ist. Danach fallen zusätzliche Wartezyklen an. Die GCN-Architektur von AMD ist an dieser Stelle wesentlich flexibler und kommt selbst bei 128 parallelen Graphics und Compute Threads nicht aus dem Tritt. Es sind also bei AMD wesentlich größere Reserven vorhanden. Ob diese praxisrelevant sein werden, muss sich natürlich erst noch erweisen.

bbott · 28.09.2015

SPINA schrieb:
.... dass dies nur bis zu einer Queue Length von < 32 ohne Context Switch möglich ist. Danach fallen zusätzliche Wartezyklen an. Die GCN-Architektur von AMD ist an dieser Stelle wesentlich flexibler und kommt selbst bei 128 parallelen Graphics und Compute Threads nicht aus dem Tritt...

So wie ich das bisher verstanden habe wird die Async-Compute-Funktion bei NV vollständig per Software Emuliert, da es die Hardware überhaupt nicht kann.

Mente · 28.09.2015

und so wie man munkelt mag NV nicht das die Option genutzt wird, der shader wird wohl per Software "abgefangen" aber das wird sich sicher bald aufklären, derzeit reicht die Leistung der TI noch aus um die fuiji im schach zu halten, mal abwarten wie es weiter geht.

Onkel_Dithmeyer · 28.09.2015

Zumindest in Ashes of the Singularity wurde Async Compute vom Entwickler auf NVIDIA-GPUs deaktiviert weil es zu Problemen kam.

WindHund · 28.09.2015

Onkel_Dithmeyer schrieb:
Zumindest in Ashes of the Singularity wurde Async Compute vom Entwickler auf NVIDIA-GPUs deaktiviert weil es zu Problemen kam.

Da wird wohl das Power Limit, Temp-target oder eine Mischung aus beidem, dazwischen gefunkt haben.

Wenn Async-compute greift dann ist die Pipeline "busy" !

SPINA · 28.09.2015

bbott schrieb:
...wird die Async-Compute-Funktion bei NV vollständig per Software emuliert...

Das möchte ich nicht ausschließen. Allerdings würde eine Emulation in Software nicht erklären, wieso es bei mehr als 32 Threads zu diesem abrupten Einbruch der Skalierung kommt. Das spricht in meinen Augen schon für ein Hardwarelimit bei der Maxwell-Architektur. Bei einer Emulation müsste der Verlauf doch gleichmäßig abfallen; ohne deutlich sichtbaren Sprung. Jedenfalls kann man sagen, dass AMD seine Hausaufgaben gemacht hat und nVidia nicht. Dabei hat die GCN-Architektur einige Jahre mehr auf dem Buckel. Das spricht für die Weitsicht der Radeon-Ingenieure.

WindHund · 28.09.2015

SPINA schrieb:
Das möchte ich nicht ausschließen. Allerdings würde eine Emulation in Software nicht erklären, wieso es bei mehr als 32 Threads zu diesem abrupten Einbruch der Skalierung kommt. Das spricht in meinen Augen schon für ein Hardwarelimit bei der Maxwell-Architektur. Bei einer Emulation müsste der Verlauf doch gleichmäßig abfallen; ohne deutlich sichtbaren Sprung. Jedenfalls kann man sagen, dass AMD seine Hausaufgaben gemacht hat und nVidia nicht. Dabei hat die GCN-Architektur einige Jahre mehr auf dem Buckel. Das spricht für die Weitsicht der Radeon-Ingenieure.

Hui, das ist aber wirklich gut kombiniert, Watson!
Wenn sich Windows ein + erhofft, dann sollten sie schleunigst FMA4+XOP in Windows 10 implementieren, sonst tut es die Linux Destrib. Gentoo!
8)

sompe · 29.09.2015

@SPINA
Ich habe bisher noch gar keinen Skalierungstest für Async-Compute gesehen...hast du mal nen Link dazu?
Bisher hatte ich eher den Eindruck als wenn man allgemein nicht davon profitiert sondern durch die CPU Emulation eher etwas verliert, was vermutlich bereits durch die zusätzlichen Latenzen für den Umweg über die CPU bedingt ist.
Gehen der CPU allerdings die Reserven aus dürfte die Performance durch den Datenstau allerdings massiv einbrechen.

SPINA · 30.09.2015

sompe schrieb:
@SPINA: Ich habe bisher noch gar keinen Skalierungstest für Async-Compute gesehen...hast du mal nen Link dazu?

Hier, bitte, Messwerte einer GeForce GTX 980 Ti. Zur Aussagekraft kann ich jedoch nichts beisteuern: Klick

Bei der Radeon R9 Fury X ist der Verlauf durchgehend auf einem (obgleich zu Beginn deutlich höheren) Niveau. Es gibt keine Abstufungen im Verlauf. Das ist das Idealbild, welches die GCN-Architektur hinsichtlich Asynchrounos Shader abliefern kann. Die parallele Berechnung von Graphics und Compute bremst dagegen die Maxwell-Architektur aus. Genau genommen kann man dies schon ab dem zweiten Kernel beobachten. Bis 32 Threads bleibt dies noch auf einem niedrigen Niveau mit dem man AMD schlagen kann, aber dannach wird es mit den Sprüngen immer schlimmer. Spätestens ab 128 Threads hat die Radeon R9 Fury X ganz klar Oberwasser. Es ist also etwas faul im grünen Teil von Kalifornien... Asynchronous Shader wären demnach nicht gegeben - so wie es oben in der News steht. Bei AMD ist alles in Butter; abgesehen davon, dass die Latenzen bei < 96 Threads noch verbesserungswürdig sind.

Update: Das sieht man bei dieser Gegenüberstellung mit < 128 Threads (niedrigere Werte sind besser, da Millisekunden):

Man kann schon erahnen, was bei mehr als 128 Threads geschieht. Dann sieht die GeForce GTX 980 Ti kein Land mehr.

Jetzt müsste man bloß wissen, welche Anzahl an Graphics und Compute Threads aktuelle Spiele im Schnitt fahren...

News Fable Legends: Zweiter DirectX-12-Benchmark wiederholt gute Ergebnisse für AMD-GPUs

Onkel_Dithmeyer

Redaktion
☆☆☆☆☆☆

SPINA

Grand Admiral Special

bbott

Grand Admiral Special

Mente

Grand Admiral Special

Onkel_Dithmeyer

Redaktion
☆☆☆☆☆☆

WindHund

Grand Admiral Special

SPINA

Grand Admiral Special

WindHund

Grand Admiral Special

sompe

Grand Admiral Special

SPINA

Grand Admiral Special

Ähnliche Themen

News Fable Legends: Zweiter DirectX-12-Benchmark wiederholt gute Ergebnisse für AMD-GPUs

Redaktion☆☆☆☆☆☆

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Redaktion☆☆☆☆☆☆

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Grand Admiral Special

Ähnliche Themen

Redaktion
☆☆☆☆☆☆

Redaktion
☆☆☆☆☆☆