App installieren
How to install the app on iOS
Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: This feature may not be available in some browsers.
Alles rund um Compiler und Softwareentwicklung
- Ersteller gruffi
- Erstellt am
IT-Extremist
Gesperrt
- Mitglied seit
- 09.12.2015
- Beiträge
- 225
- Renomée
- 1
Was hätten sie tun sollen/können?
cyrusNGC_224
Grand Admiral Special
- Mitglied seit
- 01.05.2014
- Beiträge
- 5.924
- Renomée
- 117
- Aktuelle Projekte
- POGS, Asteroids, Milkyway, SETI, Einstein, Enigma, Constellation, Cosmology
- Lieblingsprojekt
- POGS, Asteroids, Milkyway
- Meine Systeme
- X6 PII 1090T, A10-7850K, 6x Athlon 5350, i7-3632QM, C2D 6400, AMD X4 PII 810, 6x Odroid U3
- BOINC-Statistiken
Nvidia hat das geschafft. Gut, die haben deutlich mehr Ressourcen. Aber über die Jahre hätte man wirklich etwas an der Treiber Leistung nachbessern können/müssen.
AMD zumeist höhere Rohleistung kam nie richtig an.
AMD zumeist höhere Rohleistung kam nie richtig an.
Ich habe mir den Artikel von Herrn Stiller in der c't zum Thema C++-Compiler durchgelesen. Getestet wurden unter Windows Microsofts Visual Studio 2015, unter Windows und Red-Hat-Linux Intels Parallel Studio X2016 sowie nur unter Linux die GNU Compiler Collection GCC 5.3.0. Bei "normalem" Code ist der Unterschied wirklich nicht überwältigend (ca. +15 % Vorsprung für Intel vor Microsoft und GCC).
Richtig krass wird es jedoch, sofern man sehr Fließkomma-intensive Berechnungen mit Autovektorisierungspotential (SSE, AVX) kompiliert. Dort kann dann die Intelsche Compiler-Magie schon mal eine Beschleunigung um den Faktor 70 (auf einem Intel-System) herausschlagen. Es wird auch deutlich, dass Compiler sehr launische Magier sind. Hier und da verpufft die Magie schon durch eher kleine Änderungen am Quellcode.
Richtig krass wird es jedoch, sofern man sehr Fließkomma-intensive Berechnungen mit Autovektorisierungspotential (SSE, AVX) kompiliert. Dort kann dann die Intelsche Compiler-Magie schon mal eine Beschleunigung um den Faktor 70 (auf einem Intel-System) herausschlagen. Es wird auch deutlich, dass Compiler sehr launische Magier sind. Hier und da verpufft die Magie schon durch eher kleine Änderungen am Quellcode.
derDruide
Grand Admiral Special
- Mitglied seit
- 09.08.2004
- Beiträge
- 2.989
- Renomée
- 615
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 3900X
- Mainboard
- Asus Strix B450-F Gaming
- Kühlung
- Noctua NH-C14
- Speicher
- 32 GB DDR4-3200 CL14 FlareX
- Grafikprozessor
- Radeon RX 590
- Display
- 31.5" Eizo FlexScan EV3285
- SSD
- Corsair MP510 2 TB, Samsung 970 Evo 512 GB
- HDD
- Seagate Ironwulf 6 TB
- Optisches Laufwerk
- Plextor PX-880SA
- Soundkarte
- Creative SoundblasterX AE-7
- Gehäuse
- Antec P280
- Netzteil
- be quiet! Straight Power E9 400W
- Maus
- Logitech Trackman Marble (Trackball)
- Betriebssystem
- openSUSE 15.2
- Webbrowser
- Firefox
- Internetanbindung
- ▼50 MBit ▲10 MBit
Bei HSA geht es wieder etwas voran: http://phoronix.com/scan.php?page=news_item&px=AMD-G3D-HSA-CL-Interop
Die Meldung ist recht dünn, und irgendwie hab ich grad keine frischen Hirnzellen mehr, um die Folgen genauer abzuschätzen. Aber geteilte Ressourcen zwischen OpenGL und OpenCL / HSA klingt gut.
Die Meldung ist recht dünn, und irgendwie hab ich grad keine frischen Hirnzellen mehr, um die Folgen genauer abzuschätzen. Aber geteilte Ressourcen zwischen OpenGL und OpenCL / HSA klingt gut.
Complicated
Grand Admiral Special
- Mitglied seit
- 08.10.2010
- Beiträge
- 5.041
- Renomée
- 490
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7 3700X
- Mainboard
- MSI X570-A PRO
- Kühlung
- Scythe Kama Angle - passiv
- Speicher
- 32 GB (4x 8 GB) G.Skill TridentZ Neo DDR4-3600 CL16-19-19-39
- Grafikprozessor
- Sapphire Radeon RX 5700 Pulse 8GB PCIe 4.0
- Display
- 27", Samsung, 2560x1440
- SSD
- 1 TB Gigabyte AORUS M.2 PCIe 4.0 x4 NVMe 1.3
- HDD
- 2 TB WD Caviar Green EADS, NAS QNAP
- Optisches Laufwerk
- Samsung SH-223L
- Gehäuse
- Lian Li PC-B25BF
- Netzteil
- Corsair RM550X ATX Modular (80+Gold) 550 Watt
- Betriebssystem
- Win 10 Pro.
http://www.planet3dnow.de/cms/22761-amd-stattet-cgg-mit-firepro-gpus-aus/
Dass AMDs Initiative GPUOpen so schnell auch in der Praxis Anwendung findet hat mich jetzt überrascht. Hier scheinen wirklich ganz andere Seiten in Bezug auf Software aufgezogen worden zu sein.
Beim stöbern auf der GPUOpen Seite entdeckte ich diese Sammlung an DX11 Tools:
http://gpuopen.com/games-cgi/
TresFX war mir ja bekannt, doch ShadowFX, GeometryFX und AOFX nicht.
Das liest sich wie eine Liste von Libraries, die genau die größten Problemzonen durch Nvidias Gameworks adressieren. Zuletzt gab es ja da mit Schatten und HBAO+ Schwierigkeiten. Und GeometryFX wirkt wie etwas, dass dem Tesselation Overkill der Nvidia-gesponsorten Titel entgegenwirken soll.
Kann das jemand bestätigen, der detailliertere Kenntnisse um die Gameworks-Situation hat?
Edit:
Also wenn ich das richtig verstehe: http://gpuopen.com/gaming-product/geometryfx/
Dann ist er Ansatz den AMD geht mit GPUOpen ja einfach genial!
Wenn Nvidias Vorgaben für Sponsoring einen Tesselationlevel von 64x vorschreiben, dann bietet GPUOpen die Möglichkeit einfach zusätzlich GeometryFX einzusetzen, welche in einem "pre-pass" alles wieder raus filtert was nicht sichtbar ist um die GPU nicht unnötig zu belasten. Sozusagen ein "Heilmittel" gegen Gameworks-AMD-Bremsen.
Was hier so genial finde, ist dem ausweichen der Notwendigkeit einer eigenen Gameworksartigen API, sondern einfach eine Toolsammlung die frei verfügbar ist um Drawbacks für AMDs Produkte wieder auszugleichen. Die Entwickler müssen sich nicht mit Nvidia rum streiten, da die AMD Optimierungen in Form einer Library kommen und einfach negative Effekte wieder ausgleichen - das offensichtlich mit Hilfe der besseren Compute-Fähigkeiten ohne große Leistungsverluste.
Dass AMDs Initiative GPUOpen so schnell auch in der Praxis Anwendung findet hat mich jetzt überrascht. Hier scheinen wirklich ganz andere Seiten in Bezug auf Software aufgezogen worden zu sein.
Da scheint der CUDA Converter in vollem Einsatz zu sein und tatsächlich praktisch Nutzen zu entwickeln für AMDs Kampf um MarktanteileEmploying AMD’s HPC GPU Computing software tools available on GPUOpen.com, CGG rapidly converted its in-house Nvidia CUDA code to OpenCL™ for seismic data processing running on an AMD FirePro™ S9150 GPU production cluster, enabling fast, cost-effective GPU-powered research.
Beim stöbern auf der GPUOpen Seite entdeckte ich diese Sammlung an DX11 Tools:
http://gpuopen.com/games-cgi/
TresFX war mir ja bekannt, doch ShadowFX, GeometryFX und AOFX nicht.
Das liest sich wie eine Liste von Libraries, die genau die größten Problemzonen durch Nvidias Gameworks adressieren. Zuletzt gab es ja da mit Schatten und HBAO+ Schwierigkeiten. Und GeometryFX wirkt wie etwas, dass dem Tesselation Overkill der Nvidia-gesponsorten Titel entgegenwirken soll.
Kann das jemand bestätigen, der detailliertere Kenntnisse um die Gameworks-Situation hat?
Edit:
Also wenn ich das richtig verstehe: http://gpuopen.com/gaming-product/geometryfx/
Dann ist er Ansatz den AMD geht mit GPUOpen ja einfach genial!
Wenn Nvidias Vorgaben für Sponsoring einen Tesselationlevel von 64x vorschreiben, dann bietet GPUOpen die Möglichkeit einfach zusätzlich GeometryFX einzusetzen, welche in einem "pre-pass" alles wieder raus filtert was nicht sichtbar ist um die GPU nicht unnötig zu belasten. Sozusagen ein "Heilmittel" gegen Gameworks-AMD-Bremsen.
Was hier so genial finde, ist dem ausweichen der Notwendigkeit einer eigenen Gameworksartigen API, sondern einfach eine Toolsammlung die frei verfügbar ist um Drawbacks für AMDs Produkte wieder auszugleichen. Die Entwickler müssen sich nicht mit Nvidia rum streiten, da die AMD Optimierungen in Form einer Library kommen und einfach negative Effekte wieder ausgleichen - das offensichtlich mit Hilfe der besseren Compute-Fähigkeiten ohne große Leistungsverluste.
Zuletzt bearbeitet:
cyrusNGC_224
Grand Admiral Special
- Mitglied seit
- 01.05.2014
- Beiträge
- 5.924
- Renomée
- 117
- Aktuelle Projekte
- POGS, Asteroids, Milkyway, SETI, Einstein, Enigma, Constellation, Cosmology
- Lieblingsprojekt
- POGS, Asteroids, Milkyway
- Meine Systeme
- X6 PII 1090T, A10-7850K, 6x Athlon 5350, i7-3632QM, C2D 6400, AMD X4 PII 810, 6x Odroid U3
- BOINC-Statistiken
Aber die Spielentwickler müssten das integrieren? Aber warum sollten sie das, wenn sie an Gameworks teilnehmen?
Complicated
Grand Admiral Special
- Mitglied seit
- 08.10.2010
- Beiträge
- 5.041
- Renomée
- 490
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7 3700X
- Mainboard
- MSI X570-A PRO
- Kühlung
- Scythe Kama Angle - passiv
- Speicher
- 32 GB (4x 8 GB) G.Skill TridentZ Neo DDR4-3600 CL16-19-19-39
- Grafikprozessor
- Sapphire Radeon RX 5700 Pulse 8GB PCIe 4.0
- Display
- 27", Samsung, 2560x1440
- SSD
- 1 TB Gigabyte AORUS M.2 PCIe 4.0 x4 NVMe 1.3
- HDD
- 2 TB WD Caviar Green EADS, NAS QNAP
- Optisches Laufwerk
- Samsung SH-223L
- Gehäuse
- Lian Li PC-B25BF
- Netzteil
- Corsair RM550X ATX Modular (80+Gold) 550 Watt
- Betriebssystem
- Win 10 Pro.
Daher eine Library. AMD Fallback Code müssen sie ja sowieso einbauen. Ich denke der Aufwand wird geringer sein, als selber daran rum zu basteln. Und Nvidia kann ja nicht verbieten für AMD zu optimieren, sondern lediglich vorschreiben mit welchen Settings Gameworks zu implementieren ist.
Zuletzt haben die Verkäufe gelitten bei Titeln die so eindeutig schlechte Performance hatten.
Zuletzt haben die Verkäufe gelitten bei Titeln die so eindeutig schlechte Performance hatten.
sompe
Grand Admiral Special
- Mitglied seit
- 09.02.2009
- Beiträge
- 15.647
- Renomée
- 2.468
- Mein Laptop
- Dell G5 15 SE 5505 Eclipse Black
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7 7800X3D
- Mainboard
- MSI MPG X670E CARBON WIFI
- Kühlung
- Wasserkühlung
- Speicher
- 32GB DDR5-6000 CL36
- Grafikprozessor
- AMD Radeon RX 6900 XT
- Display
- 1x 32" LG 32UD89-W + 1x 24" Dell Ultrasharp 2405FPW
- SSD
- Samsung SSD 980 PRO 1TB, Crucial MX500 500GB, Intel 600p 512GB, Crucial T705 4TB
- HDD
- Western Digital WD Red 2TB, 3TB, 8TB
- Optisches Laufwerk
- LG GGC-H20L
- Soundkarte
- onboard
- Gehäuse
- Thermaltake Armor
- Netzteil
- be quiet! Dark Power Pro 11 1000W
- Betriebssystem
- Windows 10 Professional, Windows 7 Professional 64 Bit, Ubuntu 20.04 LTS
- Webbrowser
- Firefox
@ cyrusNGC_224
Weil sie so am Gameworks Programm teilnehmen und gleichzeitig schädliche Effekte wie eine überzogene Tesselation herausfiltern könnten.
Der Witz an der Sache ist ja das gerade beim Punkt Tesselation auch die Geforce Fraktion davon profitieren könnte denn bei AMD kann man den Tesselationsfaktor im Treiber begrenzen aber bei den Geforce Treibern? Sie profitieren dabei ebenso von einer höheren Framerate.
Weil sie so am Gameworks Programm teilnehmen und gleichzeitig schädliche Effekte wie eine überzogene Tesselation herausfiltern könnten.
Der Witz an der Sache ist ja das gerade beim Punkt Tesselation auch die Geforce Fraktion davon profitieren könnte denn bei AMD kann man den Tesselationsfaktor im Treiber begrenzen aber bei den Geforce Treibern? Sie profitieren dabei ebenso von einer höheren Framerate.
gruffi
Grand Admiral Special
★ Themenstarter ★
- Mitglied seit
- 08.03.2008
- Beiträge
- 5.393
- Renomée
- 65
- Standort
- vorhanden
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 5 1600
- Mainboard
- MSI B350M PRO-VDH
- Kühlung
- Wraith Spire
- Speicher
- 2x 8 GB DDR4-2400 CL16
- Grafikprozessor
- XFX Radeon R7 260X
- Display
- LG W2361
- SSD
- Crucial CT250BX100SSD1
- HDD
- Toshiba DT01ACA200
- Optisches Laufwerk
- LG Blu-Ray-Brenner BH16NS40
- Soundkarte
- Realtek HD Audio
- Gehäuse
- Sharkoon MA-I1000
- Netzteil
- be quiet! Pure Power 9 350W
- Betriebssystem
- Windows 10 Professional 64-bit
- Webbrowser
- Mozilla Firefox
- Verschiedenes
- https://valid.x86.fr/mb4f0j
Bestrebungen, CUDA Code in OpenCL Code zu übersetzen, gibt es ja schon länger. Mal schauen, ob AMDs Lösung das letzte Puzzleteilchen ist, damit dies auch Unternehmen schnell und effizient bewerkstelligen können. Der erste Schritt scheint gemacht. Kann man nur hoffen, dass andere zügig nachziehen.
sompe
Grand Admiral Special
- Mitglied seit
- 09.02.2009
- Beiträge
- 15.647
- Renomée
- 2.468
- Mein Laptop
- Dell G5 15 SE 5505 Eclipse Black
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7 7800X3D
- Mainboard
- MSI MPG X670E CARBON WIFI
- Kühlung
- Wasserkühlung
- Speicher
- 32GB DDR5-6000 CL36
- Grafikprozessor
- AMD Radeon RX 6900 XT
- Display
- 1x 32" LG 32UD89-W + 1x 24" Dell Ultrasharp 2405FPW
- SSD
- Samsung SSD 980 PRO 1TB, Crucial MX500 500GB, Intel 600p 512GB, Crucial T705 4TB
- HDD
- Western Digital WD Red 2TB, 3TB, 8TB
- Optisches Laufwerk
- LG GGC-H20L
- Soundkarte
- onboard
- Gehäuse
- Thermaltake Armor
- Netzteil
- be quiet! Dark Power Pro 11 1000W
- Betriebssystem
- Windows 10 Professional, Windows 7 Professional 64 Bit, Ubuntu 20.04 LTS
- Webbrowser
- Firefox
solche Sichtbarkeitsprüfungen sind doch ein alter Hut. Wenn ich mich recht erinnere wird dafür der Z-Buffer genutzt.
Complicated
Grand Admiral Special
- Mitglied seit
- 08.10.2010
- Beiträge
- 5.041
- Renomée
- 490
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7 3700X
- Mainboard
- MSI X570-A PRO
- Kühlung
- Scythe Kama Angle - passiv
- Speicher
- 32 GB (4x 8 GB) G.Skill TridentZ Neo DDR4-3600 CL16-19-19-39
- Grafikprozessor
- Sapphire Radeon RX 5700 Pulse 8GB PCIe 4.0
- Display
- 27", Samsung, 2560x1440
- SSD
- 1 TB Gigabyte AORUS M.2 PCIe 4.0 x4 NVMe 1.3
- HDD
- 2 TB WD Caviar Green EADS, NAS QNAP
- Optisches Laufwerk
- Samsung SH-223L
- Gehäuse
- Lian Li PC-B25BF
- Netzteil
- Corsair RM550X ATX Modular (80+Gold) 550 Watt
- Betriebssystem
- Win 10 Pro.
Nur eben nicht ohne Leistungsverlust in Quasi-Echtzeit dank verbesserter Computing Fähigkeiten.
sompe
Grand Admiral Special
- Mitglied seit
- 09.02.2009
- Beiträge
- 15.647
- Renomée
- 2.468
- Mein Laptop
- Dell G5 15 SE 5505 Eclipse Black
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7 7800X3D
- Mainboard
- MSI MPG X670E CARBON WIFI
- Kühlung
- Wasserkühlung
- Speicher
- 32GB DDR5-6000 CL36
- Grafikprozessor
- AMD Radeon RX 6900 XT
- Display
- 1x 32" LG 32UD89-W + 1x 24" Dell Ultrasharp 2405FPW
- SSD
- Samsung SSD 980 PRO 1TB, Crucial MX500 500GB, Intel 600p 512GB, Crucial T705 4TB
- HDD
- Western Digital WD Red 2TB, 3TB, 8TB
- Optisches Laufwerk
- LG GGC-H20L
- Soundkarte
- onboard
- Gehäuse
- Thermaltake Armor
- Netzteil
- be quiet! Dark Power Pro 11 1000W
- Betriebssystem
- Windows 10 Professional, Windows 7 Professional 64 Bit, Ubuntu 20.04 LTS
- Webbrowser
- Firefox
Was für ein Leistungsverlußt soll entstehen wenn verdeckte Objekte nicht vollständig gerändert werden? 
Occlusion Culling ist lt. Wikipedia bei nvidia seit der Geforce 3 im Einsatz. Keine Ahnung wie das Gegenstück von ATI hieß.
--- Update ---
Nach dem Artikel ist das Feature kalter Kaffee von vorgestern und schon lange im Einsatz.
http://www.tomshardware.de/ati-radeon-9700-pro-anspruch-auf-den-thron,testberichte-478-21.html
Bei ATI hieß das wohl HyperZ.

Occlusion Culling ist lt. Wikipedia bei nvidia seit der Geforce 3 im Einsatz. Keine Ahnung wie das Gegenstück von ATI hieß.
--- Update ---
Nach dem Artikel ist das Feature kalter Kaffee von vorgestern und schon lange im Einsatz.
http://www.tomshardware.de/ati-radeon-9700-pro-anspruch-auf-den-thron,testberichte-478-21.html
Bei ATI hieß das wohl HyperZ.
gruffi
Grand Admiral Special
★ Themenstarter ★
- Mitglied seit
- 08.03.2008
- Beiträge
- 5.393
- Renomée
- 65
- Standort
- vorhanden
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 5 1600
- Mainboard
- MSI B350M PRO-VDH
- Kühlung
- Wraith Spire
- Speicher
- 2x 8 GB DDR4-2400 CL16
- Grafikprozessor
- XFX Radeon R7 260X
- Display
- LG W2361
- SSD
- Crucial CT250BX100SSD1
- HDD
- Toshiba DT01ACA200
- Optisches Laufwerk
- LG Blu-Ray-Brenner BH16NS40
- Soundkarte
- Realtek HD Audio
- Gehäuse
- Sharkoon MA-I1000
- Netzteil
- be quiet! Pure Power 9 350W
- Betriebssystem
- Windows 10 Professional 64-bit
- Webbrowser
- Mozilla Firefox
- Verschiedenes
- https://valid.x86.fr/mb4f0j
So ist das.solche Sichtbarkeitsprüfungen sind doch ein alter Hut. Wenn ich mich recht erinnere wird dafür der Z-Buffer genutzt.
SPINA
Grand Admiral Special
- Mitglied seit
- 07.12.2003
- Beiträge
- 18.132
- Renomée
- 990
- Mein Laptop
- Lenovo IdeaPad Gaming 3 (15ARH05-82EY003NGE)
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7 5700X3D (100-100001503)
- Mainboard
- ASUS ProArt B550-Creator
- Kühlung
- AMD Wraith Prism
- Speicher
- 2x Micron 32GB PC4-25600E (MTA18ASF4G72AZ-3G2R)
- Grafikprozessor
- Sapphire Pulse Radeon RX 7600 8GB (11324-01-20G)
- Display
- LG Electronics 27UD58P-B
- SSD
- Samsung 980 PRO (MZ-V8P1T0CW)
- HDD
- Western Digital SN850X (WDS400T2XHE)
- Optisches Laufwerk
- HL Data Storage BH16NS55
- Gehäuse
- Lian Li PC-7NB
- Netzteil
- Seasonic PRIME Gold 650W
- Betriebssystem
- Debian 12.x (x86-64) Xfce
- Verschiedenes
- ASUS TPM-SPI (Nuvoton NPCT750A)
Die Voreinstellung im CNext für Tesselation ist "AMD Optimized", womit der Override für das Tesselationlevel aktiviert wird.Wenn Nvidias Vorgaben für Sponsoring einen Tesselationlevel von 64x vorschreiben...
Diese Option besteht seit 2011 und seitdem kann sich der Display Driver über die Vorgaben der Spieleengine hinwegsetzen.
Complicated
Grand Admiral Special
- Mitglied seit
- 08.10.2010
- Beiträge
- 5.041
- Renomée
- 490
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 7 3700X
- Mainboard
- MSI X570-A PRO
- Kühlung
- Scythe Kama Angle - passiv
- Speicher
- 32 GB (4x 8 GB) G.Skill TridentZ Neo DDR4-3600 CL16-19-19-39
- Grafikprozessor
- Sapphire Radeon RX 5700 Pulse 8GB PCIe 4.0
- Display
- 27", Samsung, 2560x1440
- SSD
- 1 TB Gigabyte AORUS M.2 PCIe 4.0 x4 NVMe 1.3
- HDD
- 2 TB WD Caviar Green EADS, NAS QNAP
- Optisches Laufwerk
- Samsung SH-223L
- Gehäuse
- Lian Li PC-B25BF
- Netzteil
- Corsair RM550X ATX Modular (80+Gold) 550 Watt
- Betriebssystem
- Win 10 Pro.
Na das ist ja ein Hammer:
http://www.planet3dnow.de/vbulletin/showthread.php?t=425071
Originalquelle:
http://venturebeat.com/2016/03/09/o...-the-best-graphics-software-across-platforms/
http://www.planet3dnow.de/vbulletin/showthread.php?t=425071
Originalquelle:
http://venturebeat.com/2016/03/09/o...-the-best-graphics-software-across-platforms/
Und bei solchen Sätzen muss ich immer lachen und frage mich warum sie keinen Technikguy nochmal drüber lesen lassen:Otoy has ported the CUDA language to run on AMD, Intel, and ARM GPUs for the first time ever. That means any application written in CUDA can run, without modification, on all major chipsets and platforms. While there is an independent GPGPU standard dubbed OpenCL, it isn’t necessarily as good as CUDA, Otoy believes.
[...]
“It’s pretty ready, and it answers questions about whether this could be done,” Urbach said. “It runs on the other cards at the same speed as it runs on Nvidia cards.”
Otoy will be building new backends to this framework to allow CUDA to target alternative applications programming interfaces (APIs) such as Vulkan, DirectX, and OpenGL – across Android, Playstation 4 and WebGL 3 (the latter with the help of JavaScript creator Brendan Eich).
As an example, CUDA has something called “compute shaders” that allow for much more advanced graphics effects, Urbach said.
Zuletzt bearbeitet:
hoschi_tux
Grand Admiral Special
- Mitglied seit
- 08.03.2007
- Beiträge
- 4.823
- Renomée
- 330
- Standort
- Ilmenau
- Aktuelle Projekte
- Einstein@Home, Predictor@Home, QMC@Home, Rectilinear Crossing No., Seti@Home, Simap, Spinhenge, POEM
- Lieblingsprojekt
- Seti/Spinhenge
- BOINC-Statistiken
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen R9 5900X
- Mainboard
- ASUS TUF B450m Pro-Gaming
- Kühlung
- Noctua NH-U12P
- Speicher
- 2x 16GB Crucial Ballistix Sport LT DDR4-3200, CL16-18-18
- Grafikprozessor
- AMD Radeon RX 6900XT (Ref)
- Display
- LG W2600HP, 26", 1920x1200
- HDD
- Crucial M550 128GB, Crucial M550 512GB, Crucial MX500 2TB, WD7500BPKT
- Soundkarte
- onboard
- Gehäuse
- Cooler Master Silencio 352M
- Netzteil
- Antec TruePower Classic 550W
- Betriebssystem
- Gentoo 64Bit, Win 7 64Bit
- Webbrowser
- Firefox
Wenn es so schnell wie auf nVidia Karten läuft, die AMD Pendants aber idR. deutlich mehr Rohleistung haben, dürfte da dennoch Potenzial für Optimierung sein.
Warum sollte nVidia keine Compute Shader haben? Deren Problem sind nur die Context Switches, d.h. entweder Grafik oder Compute.
Warum sollte nVidia keine Compute Shader haben? Deren Problem sind nur die Context Switches, d.h. entweder Grafik oder Compute.
Bei Anandtech ist ein Artikel zu einem Vergleich zwischen Intels Xeon-Dickschiffen und IBMs Power8-Chips erschienen. Die letzten werden hier mangels Softwarebasis kaum jemanden interessieren, aber beim Vergleich der Speicherbandbreite ist ein interessantes Detail enthalten: Intels aktuellen Xeons kann man die volle Bandbreite nur mit vektorisierten Maschinenbefehlen abtrotzen, sonst bleibt doch einiges davon liegen.
http://www.anandtech.com/show/10435/assessing-ibms-power8-part-1/7
Wenn man demnächst einen AMD Zen mit einem Intel Xeon vergleicht, sollte man das im Hinterkopf behalten. Nicht das man nicht-vektorisierten Maschinencode auf dem Zen gegen vektorisierten auf dem Xeon vergleicht.
http://www.anandtech.com/show/10435/assessing-ibms-power8-part-1/7
Wenn man demnächst einen AMD Zen mit einem Intel Xeon vergleicht, sollte man das im Hinterkopf behalten. Nicht das man nicht-vektorisierten Maschinencode auf dem Zen gegen vektorisierten auf dem Xeon vergleicht.
WindHund
Grand Admiral Special
- Mitglied seit
- 30.01.2008
- Beiträge
- 12.262
- Renomée
- 548
- Standort
- Im wilden Süden (0711)
- Mitglied der Planet 3DNow! Kavallerie!
- Aktuelle Projekte
- PrimeGrid@home
- Lieblingsprojekt
- none, try all
- Meine Systeme
- RYZEN R9 5950X @ ASRock Taichi X570 & Sapphire RX 7900 XTX Nitro+
- BOINC-Statistiken
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 9 5950X
- Mainboard
- ASRock 570X Taichi P5.50
- Kühlung
- AlphaCool Eisblock XPX, 366x40mm Radiator 8l Brutto m³
- Speicher
- 2x 16 GiB DDR4-3200 CL22 Kingston (Dual Rank, unbuffered ECC)
- Grafikprozessor
- 1x Sapphire Radeon RX 7900XTX OC 24GByte GDDR6 VRAM
- Display
- SAMSUNG Neo QLED QN92BA 43" up to 4K@144Hz FreeSync PP HDR10+
- SSD
- WD_Black SN850 PCI-Express 4.0 NVME
- HDD
- 3 Stück
- Optisches Laufwerk
- 1x HL-DT-ST BD-RE BH10LS30 SATA2
- Soundkarte
- HD Audio (onboard)
- Gehäuse
- SF-2000 Big Tower
- Netzteil
- Corsair RM1000X (80+ Gold)
- Tastatur
- Habe ich
- Maus
- Han I
- Betriebssystem
- Windows 10 x64 Professional (up to date!)
- Webbrowser
- @Chrome.Google & Edge Chrome
Mit Process Lasso kann man die Thread Anzahl eines Programm anzeigen lassen, da diese meist höher sind als Hardware Kerne vorhanden sind, gehe ich von OS Scheduler Threads aus.
Als Test Programm habe ich den HEVC Decoder von "The Stilt" ausgewählt, da er einen "absolute Mode" bietet.
Der Unterschied ist die Thread Anzahl die von ffmpeg.exe genutzt werden.
22 Threads: http://abload.de/img/hevc_161_stock_proces3frb9.png
141 Threads: http://abload.de/img/hevc_161_absolute_probjril.png

Als Test Programm habe ich den HEVC Decoder von "The Stilt" ausgewählt, da er einen "absolute Mode" bietet.
Der Unterschied ist die Thread Anzahl die von ffmpeg.exe genutzt werden.
22 Threads: http://abload.de/img/hevc_161_stock_proces3frb9.png
141 Threads: http://abload.de/img/hevc_161_absolute_probjril.png

WindHund
Grand Admiral Special
- Mitglied seit
- 30.01.2008
- Beiträge
- 12.262
- Renomée
- 548
- Standort
- Im wilden Süden (0711)
- Mitglied der Planet 3DNow! Kavallerie!
- Aktuelle Projekte
- PrimeGrid@home
- Lieblingsprojekt
- none, try all
- Meine Systeme
- RYZEN R9 5950X @ ASRock Taichi X570 & Sapphire RX 7900 XTX Nitro+
- BOINC-Statistiken
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 9 5950X
- Mainboard
- ASRock 570X Taichi P5.50
- Kühlung
- AlphaCool Eisblock XPX, 366x40mm Radiator 8l Brutto m³
- Speicher
- 2x 16 GiB DDR4-3200 CL22 Kingston (Dual Rank, unbuffered ECC)
- Grafikprozessor
- 1x Sapphire Radeon RX 7900XTX OC 24GByte GDDR6 VRAM
- Display
- SAMSUNG Neo QLED QN92BA 43" up to 4K@144Hz FreeSync PP HDR10+
- SSD
- WD_Black SN850 PCI-Express 4.0 NVME
- HDD
- 3 Stück
- Optisches Laufwerk
- 1x HL-DT-ST BD-RE BH10LS30 SATA2
- Soundkarte
- HD Audio (onboard)
- Gehäuse
- SF-2000 Big Tower
- Netzteil
- Corsair RM1000X (80+ Gold)
- Tastatur
- Habe ich
- Maus
- Han I
- Betriebssystem
- Windows 10 x64 Professional (up to date!)
- Webbrowser
- @Chrome.Google & Edge Chrome
Wie viele API´s sollen es sein?
CPU only openCL: http://abload.de/img/luxmark3.1_stock_openpirka.png
CPU only C + +: http://abload.de/img/luxmark3.1_stock_natimnoqe.png (262W Peak an der Dose)
Aber Bildqualität kommt nicht von Quantität sondern Elektrizität:
All openCL Devices: http://abload.de/img/luxmark3.1_stock_all_trrt0.png (123W idle a.d.D, 612W Peak)
CPU only openCL: http://abload.de/img/luxmark3.1_stock_openpirka.png
CPU only C + +: http://abload.de/img/luxmark3.1_stock_natimnoqe.png (262W Peak an der Dose)
Aber Bildqualität kommt nicht von Quantität sondern Elektrizität:

All openCL Devices: http://abload.de/img/luxmark3.1_stock_all_trrt0.png (123W idle a.d.D, 612W Peak)
derDruide
Grand Admiral Special
- Mitglied seit
- 09.08.2004
- Beiträge
- 2.989
- Renomée
- 615
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 3900X
- Mainboard
- Asus Strix B450-F Gaming
- Kühlung
- Noctua NH-C14
- Speicher
- 32 GB DDR4-3200 CL14 FlareX
- Grafikprozessor
- Radeon RX 590
- Display
- 31.5" Eizo FlexScan EV3285
- SSD
- Corsair MP510 2 TB, Samsung 970 Evo 512 GB
- HDD
- Seagate Ironwulf 6 TB
- Optisches Laufwerk
- Plextor PX-880SA
- Soundkarte
- Creative SoundblasterX AE-7
- Gehäuse
- Antec P280
- Netzteil
- be quiet! Straight Power E9 400W
- Maus
- Logitech Trackman Marble (Trackball)
- Betriebssystem
- openSUSE 15.2
- Webbrowser
- Firefox
- Internetanbindung
- ▼50 MBit ▲10 MBit
Nach AMD rüsten jetzt auch Intel und nVidia Ihren OpenCL-Support auf Version 2.0 auf
nVidia hing bisher noch bei OpenCL 1.2 fest, hat sich auch eher auf CUDA fokussiert. Jetzt reichen sie OpenCL 2.0-Support nach. Das könnte man als Zeichen verstehen, dass OpenCL gegenüber CUDA weiter an Bedeutung gewinnt, denn vermutlich würden sie am liebsten weiter ihre eigene Suppe kochen, wenn der Markt das akzeptieren würde.
https://www.phoronix.com/scan.php?page=news_item&px=OpenCL-2.0-NVIDIA-Preps
Intel rüstet auch unter Linux auf OpenCL 2.0 auf: http://www.phoronix.com/scan.php?page=news_item&px=Intel-Beignet-1.3-Released
Die Software Darktable zur Entwicklung von Bildern im RAW-Format kommt in Version 2.2 mit einem verbesserten OpenCL-Support. Bei Benchmarks des Portals Phoronix war Darktable mit AMD- und nVidia-Grafikkarten gleich schnell:
nVidia hing bisher noch bei OpenCL 1.2 fest, hat sich auch eher auf CUDA fokussiert. Jetzt reichen sie OpenCL 2.0-Support nach. Das könnte man als Zeichen verstehen, dass OpenCL gegenüber CUDA weiter an Bedeutung gewinnt, denn vermutlich würden sie am liebsten weiter ihre eigene Suppe kochen, wenn der Markt das akzeptieren würde.
https://www.phoronix.com/scan.php?page=news_item&px=OpenCL-2.0-NVIDIA-Preps
Intel rüstet auch unter Linux auf OpenCL 2.0 auf: http://www.phoronix.com/scan.php?page=news_item&px=Intel-Beignet-1.3-Released
Die Software Darktable zur Entwicklung von Bildern im RAW-Format kommt in Version 2.2 mit einem verbesserten OpenCL-Support. Bei Benchmarks des Portals Phoronix war Darktable mit AMD- und nVidia-Grafikkarten gleich schnell:
Similar to our other OpenCL benchmarks we have carried out in the past with Radeon GPUs using the AMDGPU-PRO driver, this proprietary OpenCL stack overall performs competitively with GeForce GPUs on the latest NVIDIA Linux drivers. It will be great once that AMD OpenCL stack is fully open and widely usable, hopefully we'll see that milestone achieved in 2017.
Zuletzt bearbeitet:
derDruide
Grand Admiral Special
- Mitglied seit
- 09.08.2004
- Beiträge
- 2.989
- Renomée
- 615
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 3900X
- Mainboard
- Asus Strix B450-F Gaming
- Kühlung
- Noctua NH-C14
- Speicher
- 32 GB DDR4-3200 CL14 FlareX
- Grafikprozessor
- Radeon RX 590
- Display
- 31.5" Eizo FlexScan EV3285
- SSD
- Corsair MP510 2 TB, Samsung 970 Evo 512 GB
- HDD
- Seagate Ironwulf 6 TB
- Optisches Laufwerk
- Plextor PX-880SA
- Soundkarte
- Creative SoundblasterX AE-7
- Gehäuse
- Antec P280
- Netzteil
- be quiet! Straight Power E9 400W
- Maus
- Logitech Trackman Marble (Trackball)
- Betriebssystem
- openSUSE 15.2
- Webbrowser
- Firefox
- Internetanbindung
- ▼50 MBit ▲10 MBit
Neben der Veröffentlichung von OpenCL 2.2 wird von zwei Seiten daran gearbeitet, CUDA-Code nach OpenCL zu konvertieren:
Compile CUDA Codes To OpenCL, Run Everywhere
Compile CUDA Codes To OpenCL, Run Everywhere
cyrusNGC_224
Grand Admiral Special
- Mitglied seit
- 01.05.2014
- Beiträge
- 5.924
- Renomée
- 117
- Aktuelle Projekte
- POGS, Asteroids, Milkyway, SETI, Einstein, Enigma, Constellation, Cosmology
- Lieblingsprojekt
- POGS, Asteroids, Milkyway
- Meine Systeme
- X6 PII 1090T, A10-7850K, 6x Athlon 5350, i7-3632QM, C2D 6400, AMD X4 PII 810, 6x Odroid U3
- BOINC-Statistiken
Wobei es bisher unter Linux für Intel keinen OpenCL Support gibt/gab.Intel rüstet auch unter Linux auf OpenCL 2.0 auf: http://www.phoronix.com/scan.php?page=news_item&px=Intel-Beignet-1.3-Released
derDruide
Grand Admiral Special
- Mitglied seit
- 09.08.2004
- Beiträge
- 2.989
- Renomée
- 615
- Details zu meinem Desktop
- Prozessor
- AMD Ryzen 3900X
- Mainboard
- Asus Strix B450-F Gaming
- Kühlung
- Noctua NH-C14
- Speicher
- 32 GB DDR4-3200 CL14 FlareX
- Grafikprozessor
- Radeon RX 590
- Display
- 31.5" Eizo FlexScan EV3285
- SSD
- Corsair MP510 2 TB, Samsung 970 Evo 512 GB
- HDD
- Seagate Ironwulf 6 TB
- Optisches Laufwerk
- Plextor PX-880SA
- Soundkarte
- Creative SoundblasterX AE-7
- Gehäuse
- Antec P280
- Netzteil
- be quiet! Straight Power E9 400W
- Maus
- Logitech Trackman Marble (Trackball)
- Betriebssystem
- openSUSE 15.2
- Webbrowser
- Firefox
- Internetanbindung
- ▼50 MBit ▲10 MBit
Auf der SIGGRAPH 2018 wurden die Pläne für OpenCL-Next vorgestellt. Die neue Version der Spezifikation erscheint 2019 und soll für Graka-Hersteller einfacher zu implementieren sein. Auch nVidia soll die nächste Version von OpenCL weiterhin unterstützen.
Bei den Features stecke ich nicht so tief in den Details, aber wie es aussieht, wird unter anderem die Portabilität bzw. das Zusammenwirken von OpenCL mit Vulkan verbessert.
https://www.phoronix.com/scan.php?page=article&item=siggraph-2018-khr&num=2
Bei den Features stecke ich nicht so tief in den Details, aber wie es aussieht, wird unter anderem die Portabilität bzw. das Zusammenwirken von OpenCL mit Vulkan verbessert.
https://www.phoronix.com/scan.php?page=article&item=siggraph-2018-khr&num=2
Ähnliche Themen
- Antworten
- 3
- Aufrufe
- 2K
- Antworten
- 1
- Aufrufe
- 957
- Antworten
- 37
- Aufrufe
- 14K