News Fable Legends: Zweiter DirectX-12-Benchmark wiederholt gute Ergebnisse für AMD-GPUs

Onkel_Dithmeyer

Redaktion
☆☆☆☆☆☆
Mitglied seit
22.04.2008
Beiträge
12.943
Renomée
4.014
Standort
Zlavti
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2012
  • BOINC Pentathlon 2013
  • BOINC Pentathlon 2014
  • BOINC Pentathlon 2015
  • BOINC Pentathlon 2016
  • BOINC Pentathlon 2017
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2019
  • SETI@Home Intel-Race II
  • BOINC Pentathlon 2020
  • THOR Challenge 2020
  • BOINC Pentathlon 2021
  • BOINC Pentathlon 2022
  • BOINC Pentathlon 2023
MS-DirectX-12-Logo.png


Vor einigen Wochen berichteten wir über die ersten Ergebnisse zu Microsofts neuer Grafik-API DirectX 12. Das Spiel Ashes of the Singularity zeigte Leistungszugewinne für AMD-Grafikkarten von bis zu 75 %, während NVIDIAs Pixelbeschleuniger aufgrund der fehlenden Async-Compute-Funktion um bis zu 10 % weniger Bilder in der Sekunde renderten.
(…)

» Artikel lesen
 
Zuletzt bearbeitet:
...aufgrund der fehlenden Async-Compute-Funktion um bis zu 10% weniger Bilder in der Sekunde renderten.
Ich dachte der derzeitige Stand wäre, dass Asynchronous Shader bei der Maxwell-Architektur gegeben sind. Allerdings mit der bedeutsamen Einschränkung, dass dies nur bis zu einer Queue Length von < 32 ohne Context Switch möglich ist. Danach fallen zusätzliche Wartezyklen an. Die GCN-Architektur von AMD ist an dieser Stelle wesentlich flexibler und kommt selbst bei 128 parallelen Graphics und Compute Threads nicht aus dem Tritt. Es sind also bei AMD wesentlich größere Reserven vorhanden. Ob diese praxisrelevant sein werden, muss sich natürlich erst noch erweisen.
 
Zuletzt bearbeitet:
.... dass dies nur bis zu einer Queue Length von < 32 ohne Context Switch möglich ist. Danach fallen zusätzliche Wartezyklen an. Die GCN-Architektur von AMD ist an dieser Stelle wesentlich flexibler und kommt selbst bei 128 parallelen Graphics und Compute Threads nicht aus dem Tritt...

So wie ich das bisher verstanden habe wird die Async-Compute-Funktion bei NV vollständig per Software Emuliert, da es die Hardware überhaupt nicht kann.
 
und so wie man munkelt mag NV nicht das die Option genutzt wird, der shader wird wohl per Software "abgefangen" aber das wird sich sicher bald aufklären, derzeit reicht die Leistung der TI noch aus um die fuiji im schach zu halten, mal abwarten wie es weiter geht.
 
Zumindest in Ashes of the Singularity wurde Async Compute vom Entwickler auf NVIDIA-GPUs deaktiviert weil es zu Problemen kam.
 
Zumindest in Ashes of the Singularity wurde Async Compute vom Entwickler auf NVIDIA-GPUs deaktiviert weil es zu Problemen kam.
Da wird wohl das Power Limit, Temp-target oder eine Mischung aus beidem, dazwischen gefunkt haben. ;D

Wenn Async-compute greift dann ist die Pipeline "busy" !
 
...wird die Async-Compute-Funktion bei NV vollständig per Software emuliert...
Das möchte ich nicht ausschließen. Allerdings würde eine Emulation in Software nicht erklären, wieso es bei mehr als 32 Threads zu diesem abrupten Einbruch der Skalierung kommt. Das spricht in meinen Augen schon für ein Hardwarelimit bei der Maxwell-Architektur. Bei einer Emulation müsste der Verlauf doch gleichmäßig abfallen; ohne deutlich sichtbaren Sprung. Jedenfalls kann man sagen, dass AMD seine Hausaufgaben gemacht hat und nVidia nicht. Dabei hat die GCN-Architektur einige Jahre mehr auf dem Buckel. Das spricht für die Weitsicht der Radeon-Ingenieure.
 
Das möchte ich nicht ausschließen. Allerdings würde eine Emulation in Software nicht erklären, wieso es bei mehr als 32 Threads zu diesem abrupten Einbruch der Skalierung kommt. Das spricht in meinen Augen schon für ein Hardwarelimit bei der Maxwell-Architektur. Bei einer Emulation müsste der Verlauf doch gleichmäßig abfallen; ohne deutlich sichtbaren Sprung. Jedenfalls kann man sagen, dass AMD seine Hausaufgaben gemacht hat und nVidia nicht. Dabei hat die GCN-Architektur einige Jahre mehr auf dem Buckel. Das spricht für die Weitsicht der Radeon-Ingenieure.
Hui, das ist aber wirklich gut kombiniert, Watson!
Wenn sich Windows ein + erhofft, dann sollten sie schleunigst FMA4+XOP in Windows 10 implementieren, sonst tut es die Linux Destrib. Gentoo!
8)
 
@SPINA
Ich habe bisher noch gar keinen Skalierungstest für Async-Compute gesehen...hast du mal nen Link dazu?
Bisher hatte ich eher den Eindruck als wenn man allgemein nicht davon profitiert sondern durch die CPU Emulation eher etwas verliert, was vermutlich bereits durch die zusätzlichen Latenzen für den Umweg über die CPU bedingt ist.
Gehen der CPU allerdings die Reserven aus dürfte die Performance durch den Datenstau allerdings massiv einbrechen.
 
@SPINA: Ich habe bisher noch gar keinen Skalierungstest für Async-Compute gesehen...hast du mal nen Link dazu?
Hier, bitte, Messwerte einer GeForce GTX 980 Ti. Zur Aussagekraft kann ich jedoch nichts beisteuern: Klick

Bei der Radeon R9 Fury X ist der Verlauf durchgehend auf einem (obgleich zu Beginn deutlich höheren) Niveau. Es gibt keine Abstufungen im Verlauf. Das ist das Idealbild, welches die GCN-Architektur hinsichtlich Asynchrounos Shader abliefern kann. Die parallele Berechnung von Graphics und Compute bremst dagegen die Maxwell-Architektur aus. Genau genommen kann man dies schon ab dem zweiten Kernel beobachten. Bis 32 Threads bleibt dies noch auf einem niedrigen Niveau mit dem man AMD schlagen kann, aber dannach wird es mit den Sprüngen immer schlimmer. Spätestens ab 128 Threads hat die Radeon R9 Fury X ganz klar Oberwasser. Es ist also etwas faul im grünen Teil von Kalifornien... Asynchronous Shader wären demnach nicht gegeben - so wie es oben in der News steht. Bei AMD ist alles in Butter; abgesehen davon, dass die Latenzen bei < 96 Threads noch verbesserungswürdig sind.

Update: Das sieht man bei dieser Gegenüberstellung mit < 128 Threads (niedrigere Werte sind besser, da Millisekunden):

ac_980ti_vs_fury_xlnssd.png

Man kann schon erahnen, was bei mehr als 128 Threads geschieht. Dann sieht die GeForce GTX 980 Ti kein Land mehr.

Jetzt müsste man bloß wissen, welche Anzahl an Graphics und Compute Threads aktuelle Spiele im Schnitt fahren...
 
Zuletzt bearbeitet:
Zurück
Oben Unten