NVIDIA - Pascal

Für mich klingt das Async Compute von Pascal irgendwie wie hingemogelt. Bei Maxwell musste die gesamte GPU halten und switchen, bei Pascal eben nur Teile der GPU.

... sieht wohl auch PCGH so:
Eher obskur dagegen ist die Hardware-Zuteilung für Compute und Grafik. In Maxwell-GPUs mussten die einzelnen SMs vom Treiber in den Compute- oder Grafikmodus versetzt werden. Eine Mischung aus beidem, wie es AMDs GCN-Architektur erlaubt, ist nicht möglich. Eine Neuzuteilung ist nur möglich, wenn dazu die ganze GPU kurz angehalten wird - das will man aus Performancegründen möglichst vermeiden. Pascal in Form des GP104 erlaubt nun, dass die SMs zur Laufzeit, also ohne die komplette GPU anzuhalten, ihre Betriebsart wechseln: Von Compute zu Grafik oder umgekehrt. Trotzdem müssen die SMs ihre gerade laufende Aufgabe zu Ende bearbeiten. Die Unterbrechung, also eine Preemption, kann zwar wesentlich feinkörniger als zuvor erfolgen, scheint aber im Treiber noch nicht freigeschaltet zu sein oder zu funktionieren. Nvidia spricht von Pixel-Level-Preemption für Compute und Grafik, der Treiber meldet derzeit aber noch die gröbstmögliche Konfiguration "DMA Buffer", wie auch andere Grafikchips es tun. Intels Skylake-IGP kann bereits Triangle-Level Grafik-Preemption und Pixel-Level-Preemption für Compute.
 
Techpowerup hat die GTX 1080 getestet. Die Effizienz sieht bei dem neuen Prozess echt nicht schlecht aus. Da bin ich gleich noch mehr auf den 14 nm von GF gespannt.
Naja, weltbewegend ist das jetzt aber auch nicht. Die dort gezeigten ~50% hätte ich auch mindestens erwartet bei dem Sprung von 28nm bulk auf 16nm FF. Hoffen wir mal, dass Glofo mit ihrem 14nm FF Prozess noch ein bisschen mehr rauskitzeln.
 
Ziemlich enttäuschend das Ganze. nVidia hat es doch tatsächlich geschafft, noch mal eine DX11 Karte auf den Markt zu werfen. Unter DX12 Titeln mit Ach und Krach gerade so auf Fury X Niveau. Da dürfte AMD leichtes Spiel haben. Würde mich schlapp lachen, wenn Polaris unter DX12 die gleiche Leistung erreicht ;D
 
Naja, weltbewegend ist das jetzt aber auch nicht. Die dort gezeigten ~50% hätte ich auch mindestens erwartet bei dem Sprung von 28nm bulk auf 16nm FF. Hoffen wir mal, dass Glofo mit ihrem 14nm FF Prozess noch ein bisschen mehr rauskitzeln.

Da gehe ich mit. Deswegen stand dort auch "echt nicht schlecht". Vorher an dieser Stelle nur "nicht schlecht". ;)

Gruß Lehmann
 
Ob die Karte tatsächlich gut ist, wird man denke ich erst sehen, wenn AMD seine 14nm Modelle launcht. Dass Pascal sichtlich besser als seine 28nm Vorgänger abschneiden würde, ist jetzt keine wirkliche Überraschung. Dafür ist der Fertigungsvorteil einfach zu gross. Im Moment würde ich Pascal als kurzlebig solide einstufen. Mehr aber auch nicht. Dass der Architektur nach wie vor wichtige Neuerungen für zB DX12 fehlen, hatte sich angedeutet und ist nun Gewissheit. Das könnte Pascal noch schwer zu schaffen machen.

Mehr zu denken gibt mir allerdings, ob Nvidia wieder mal ihre TDP Schummelei forciert. Bei den Messergebnissen von CB haben wir mit Max und unter Berücksichtigung der Netzteileffizienz, zuzüglich von vielleicht 10W Idle Leistungsaufnahme, eine Last-Idle-Differenz von ~240W. Das liegt 60W über der beworbenen TDP. Ob der verwendete i7-6700K so viel ausmacht, halte ich für fraglich. Zumal Spiele eh keine Maximallast erzeugen können. Bei GPGPU genehmigt sich die GTX 1080 vermutlich noch einiges mehr.
 
Zuletzt bearbeitet:
Tomshardware hat da recht gute Messungen zu. Hat halt wider die üblichen 3-400W spitzen wie Maxwell.
 
Tomshardware traue ich spätestens seit der Maxwell Farce nicht mehr.
 
Ist das mit oder ohne Netzteilverlust? Und ob das wirklich aussagekräftig ist, ist auch nicht gesagt.
Der Core i7-6700K liegt hier mit fast 76 Watt bereits 23 Watt über dem Wert des 6600K, was uns am Ende ein wenig ins Grübeln brachte. Entweder ist unser Testmuster des Core i5-6600K besonders gut oder der Core i7-6700K ist im CPU-Lotto eine glatte Niete - je nach Standpunkt.

--- Update ---

Hmm, CB zeigt den i7-6700K auch ziemlich stromhungrig unter Spielen. Deutlich über dem i5. Dann könnte der i7 in der Tat 60W oder gar mehr benötigen. Hätte die 14nm Modelle sparsamer erwartet.
 
Ziemlich enttäuschend das Ganze. nVidia hat es doch tatsächlich geschafft, noch mal eine DX11 Karte auf den Markt zu werfen. Unter DX12 Titeln mit Ach und Krach gerade so auf Fury X Niveau. Da dürfte AMD leichtes Spiel haben. Würde mich schlapp lachen, wenn Polaris unter DX12 die gleiche Leistung erreicht ;D

Gerade auch bei Async Compute sieht man sehr schön Marketing vs Reality.
In summary AMD’s R9 Fury X saw much greater benefit at all resolutions from the DirectX 12 API itself and from Async Compute compared to the GTX 1080 and 980 Ti. The 1080 showed modest gains with Async Compute and DirectX 12 but did not exhibit any performance regression like the GTX 980 Ti. So the improvements introduced with Pascal definitely helped but were not quite enough to close the gap. In fact, It’s quite eye opening to see the GTX 1080 – which is 30% faster than the R9 Fury X at in DirectX 11 games – only managing to squeeze past the Fury X by 9% in DirectX 12.
GTX-1080-Ashes-Of-The-Singularity-DirectX-12-Async-Compute-Performance-1440p-Extreme.jpg

von WCCFTECH

Also ein "Oberknaller" sieht schon deutlich anders aus.
 
Eine nicht ganz oberflächliche Analyse: Pascal, A New King??
Der Artikel ist sehr merkwürdig - viele Worte, wenig Gehalt. Der Autor verliert ob seiner ganzen Zahlenspiele den Blick für das Wesentliche.

Zum Beispiel:
However, when it comes to P100, Pascal's top tier card we see something completely different. The core density falls off the map in comparison to the GTX 1080. So why doesn't Nvidia scale the die down in order to achieve the same core density as a GTX 1080? I personally believe that they are not doing this because of thermals. If Nvidia could a achieve the same core density on GP100 that they did on the GTX1080 they could make the GP100 at 440mm. However, because of the high TDP to Die Size ratio the chip would not overclock well and may be subjected to thermal throttling, so a bigger die is needed to offload that heat over a larger area in order for it to be dissipate more efficiently.
Meint er das wirklich ernst? Es ist doch bekannt, dass der GP100 ein DP:SP-Verhältnis von 1:2 hat. Beim GP104 sind es lediglich 1:32. Der GP104 hat durch den Wegfall von Einheiten natürlich ein günstigeres "core density" Verhältnis; ohnehin eine schwachsinnige Wortschöpfung. Der Autor sollte lieber schauen wieviel Transistoren sich auf einem Quadratmillimeter tummeln. Die Ausführungen zur "OC efficiency" sind nicht weniger konfus.
 
Pauschal betrachtet ist sein Bericht nicht so abwegig. Sein Rückschluss zur TDP sehe ich aber etwas anders. Meiner Meinung nach spielt hier Nvidia einfach noch mit dem Raum für die spätere TI / Titan. Im Designzusammenspiel mit HBM2 relativiert sich dann wohl auch die dann erreichte TDP.
 
Für mich klingt das Async Compute von Pascal irgendwie wie hingemogelt. Bei Maxwell musste die gesamte GPU halten und switchen, bei Pascal eben nur Teile der GPU.

Wetten, dass das die für Maxwell versprochene Async Compute verbesserung ist, die nVidia so großspurig angekündigt hat?
Und die wahrscheinlich auch gar nicht mehr für Maxwell kommen wird...
 
Den Verdacht habe ich auch. Die 2-5% die sie damit gewinnen bekommt man auch locker mit Treiberoptimierung hin..
 
Zuletzt bearbeitet:
Bis auf den Ausrutscher wo sie unter der 980 kommt auf 980ti Niveau mal sehn wann wirklich Test kommen
 
Das dauert eh noch ein wenig länger, wahrscheinlich bis Polaris da ist oder irgendwelche neuen Spiele kommen und da die neuen Karten mitgebencht werden.

Hab ja letztens irgendwelche DX12 Reviews gesehen, bei denen die Fury X flotter war als 'ne 1080...
 
Im Augenblick betrachtet ist die 1080 in fast allen Fällen die 1070 in vielen Fällen deutlich schneller als die gleichteure/teurere Karten von AMD bzw. die alte Riege der 9X0 ti/Titan. Zumindest bei DX11. Wie die Sache bei DX12 aussieht wird interessanter werden. Ohne tatsächlich erschienene Titel die nicht nur mit Unterstützung eines Herstellers erschienen sind oder eigentlich nur Techdemos darstellen muss man halt abwarten.

Hinsichtlich der Preisgestaltung sag ich mal: Genommen wird was geht!
 
Computerbase schrieb:
Ihr fragt euch, wo unser Test zur GeForce GTX 1070 ist? Das dauert leider noch. Nvidia hat uns leider keine Grafikkarte gegeben. Das gab es zuletzt vor... Hm. Wir können uns gar nicht daran erinnern!

Wie konnte das passieren? ;)
 
Da dauert das Selektieren wohl nbissl länger bei den paar wenigen GP104 Exemplaren im Moment. *chatt*
 
Zurück
Oben Unten