Alles über/um HSA (aus dem Kabinithread)

Naja Gruffi, wenn AMD behauptet wie toll doch die Computecores von Kaveri sind und damit Werbung machen (Sandwich YouTube Video) sollten sie dringend mehr tun.

Eigentlich hätte es beim Kaveri-Launch irgendwas Produktives für die Presse und Berichterstattung geben müssen.

Meine Meinung.

Meine auch. Man kann nicht erwarten, dass Qualcomm oder Samsung als Steigbügelhalter einspringen. Für AMD ist das ein Schlüsselfeature, für Samsung ein "Nice-to-have". Die Idee gut, die Umsetzung ein Desaster. Wenn ich Jahre benötige um eine PreAlpha eines Entwicklerkits zur Verfügung zu stellen, welche dann auch noch ein Jahr nach dem Produktlaunch(Kaveri) auf den Markt, dann blamiere ich mich nur damit.
 
[UOTE]Media APIs [/QUOTE]
Aha, sicher gut informiert dafür solle es seit langem ein separates SDK geben... und einzelne Anwendungen sollen es auch benutzen.
 
Nicht wirklich. GNU ist Intel überlegen bezüglich Portabilität und Standardunterstützung. Und der Microsoft Compiler war nie wirklich gut. Nur halt am meisten verbreitet unter Windows.

Das ist ja genau der Punkt, dass man Portabilität weglassen kann, wenn man sich in einer Monokultur befindet. Apple geht bei X-86 Intel-only und kann alle Intel-Optimierungen nutzen. Vielleicht hast Du ja ein bisschen Ahnung vom Programmieren und weißt, dass man im Kompiler Optimierungen einstellen kann. Wenn z.B. Micorosft sein Betriebssystem oder sein Office kompiliert, kann es sich nicht auf Kompileroptimierungen einlassen, weil die Software auf allen X-86 Systemen laufen muss, die am Markt sind. Apple als Hardwarelieferant kennt seine Hardware und nimmt die Optimierungen dankend mit.

Dass GNU portabler ist und mehr Standards unterstützt ist ja ganz schön. Allein die Aussage steht isoliert da und reiht sich nicht in die Argumentationskette ein, die von der These ausging, dass Intel erheblich von seinen Softwareinvestitionen profitiert.

Was CUDA betrifft, so bringt es der GPGPU-Community sehr viel. CUDA ist DER Standard, an dem sich AMD messen lassen muss. Es liegt performancemäßig einen Schritt vor OpenCL, und vor allem liefert Nvidia etablierte Entwicklerwerkzeuge (ganz i.Ggs. zu AMD). Dir persönlich bringt es vielleicht weniger, weil CUDA eher auf den Profibereich abzielt, also z.B. die Auswertung von 3D-Punktwolken bei bildgebenden Verfahren. Das ist in der Industrie relevant, weniger auf Deinem Rechner.
MfG
 
Nur dass dieses Synologie NAS nicht existiert.

Nee, ist klar DAS gibt es nicht, und DAS gibt es auch nicht, alles nur heisse Luft.
Schon, aber nicht von mir! :P

Das ist typisch in der Argumentation. HSA Software wird geleugnet und Intel werden Dinge zugeschrieben die gar nicht existieren.

Siehe oben!

Core Aftershot z.B nutzt sehr effektiv HSA und nun sogar bei OpenCL. Matle ist ein API mit HSA Elementen und der Nutzen ist eindeutig vorhanden auch ohne HSA API und Treibern. Und welches anderes Unternehmen hat so viele Softwareentwucklungen gemacht wie AMD in den letzten 3 Jahren.

Wer ist Core und was ist Matle?
 
Anders wird ein Schuh draus: AfterShot Pro nutzt die OpenCL 2.0 Features und profitiert dadurch von einem HSA-Unterbau.

Das ist alleine dadurch widerlegt, dass die vorherige Version ohne OpenCL 2.0 HSA Beschleunigung nutze. Benchmarks sind hier im Thread. Die Beschleunigung der OpenCL2.0 Version sollte noch besser ausfallen. Daher ist diese Programm derzeit wohl gut geeignet wenn man testen will. Ohne HSA Intel, Kaveri ohne OpenCL 2.0 und mit.

--- Update ---

Die Synolohy hat kein Qicksync. Keine Synology hat das. Die Avoton Plattform bietet das einfach nicht an. Nur die QNAP TS-451 mit dem J1900 ist das einzige derzeit erhältliche NAS damit. Genau das meine ich mit falschem Eindruck der Verbreitung.
 
Die Avoton Plattform bietet das einfach nicht an. Nur die QNAP TS-451 mit dem J1900 ist das einzige derzeit erhältliche NAS damit. Genau das meine ich mit falschem Eindruck der Verbreitung.

Zitat von hier : synology-diskstation-ds214play-nas

Denn auch wenn das Transkodieren der Videos für die DS214play dank Hardware-Beschleunigung durch den Intel Atom CE5335 tatsächlich kein Problem darstellt ...

Avoton ist aber DIE hier.
 
Zuletzt bearbeitet:
Das ist alleine dadurch widerlegt, dass die vorherige Version ohne OpenCL 2.0 HSA Beschleunigung nutze. Benchmarks sind hier im Thread. Die Beschleunigung der OpenCL2.0 Version sollte noch besser ausfallen. Daher ist diese Programm derzeit wohl gut geeignet wenn man testen will. Ohne HSA Intel, Kaveri ohne OpenCL 2.0 und mit.
Nein, ist es nicht.

Diese Benchmarks wurden dadurch erstellt, dass an der alten Version (AfterShot Pro 1) Modifikationen vorgenommen werden mussten mit Dateien, die nur der Presse zu Verfügung standen.

Und auch da wurde lediglich eine HSA-beschleunigte OpenCL-Laufzeitumgebung verwendet. Das wird im übrigen auch in der Präsentation aufgezeigt, die Du selber verlinkt hast.
 
Also gibt es Software dafür. Kannst du präzisieren wo das steht, dass es nich nicht mit der käuflich erwerbaren Version funktioniert?
 
Also gibt es Software dafür. Kannst du präzisieren wo das steht, dass es nich nicht mit der käuflich erwerbaren Version funktioniert?

AfterShot Pro 2 könnte mit dem letzten Update die erste Anwendung sein, die über OpenCL 2.0 von HSA profitieren kann. Testen kann ich dies derzeit freilich nicht.

Das habe ich doch oben geschrieben. AMD hatte damals im Presseordner Dateien bereitgestellt mit denen die frei verfügbare Version von ArfterShot modifiziert werden musste, damit sie von der HSA-beschleunigten OpenCL-Laufzeitumgebung profitieren konnte. Jene HSA-beschleunigte OpenCL-Laufzeitumgebung ist aber bis heut nicht frei verfügbar.
 
Und auch da wurde lediglich eine HSA-beschleunigte OpenCL-Laufzeitumgebung verwendet. Das wird im übrigen auch in der Präsentation aufgezeigt, die Du selber verlinkt hast.
Ich meinte wo ich das finden kann in meinen Links. Ich kann mich nicht entsinnen dies damals gelesen zu haben.

Würde mich nun interessieren, ob dies nun die finale Version eben dieser Preview sein könnte. Ich weiss nur dass die von mit verlinkte Version kein SVM (Shared Virtual Memory) genutzt hat. Dies wurde in der Präsentation für die kommende Version als grosser Schritt bei der Beschleunigung avisiert. Mich würde interessieren, ob dies hier eben der Fall ist.
 
Das ist ja genau der Punkt, dass man Portabilität weglassen kann, wenn man sich in einer Monokultur befindet. Apple geht bei X-86 Intel-only und kann alle Intel-Optimierungen nutzen. Vielleicht hast Du ja ein bisschen Ahnung vom Programmieren und weißt, dass man im Kompiler Optimierungen einstellen kann. Wenn z.B. Micorosft sein Betriebssystem oder sein Office kompiliert, kann es sich nicht auf Kompileroptimierungen einlassen, weil die Software auf allen X-86 Systemen laufen muss, die am Markt sind. Apple als Hardwarelieferant kennt seine Hardware und nimmt die Optimierungen dankend mit.
Aber nur beim BS. Und das ist im Endeffekt kaum relevant. Die Anwendungen selbst machen immer noch andere. Und ganz ehrlich, ich glaube nicht, dass Apple sein BS auf Intel only optimiert bzw auf ganz bestimmte Mikroarchitekturen. Damit würden sie sich selbst ins Fleisch schneiden. Ganz zu schweigen davon, dass man sowieso keinen einheitlichen Befehlssatz hat, auf den man optimieren könnte. x86 ist schliesslich nicht gleich x86 mit all den Befehlssatzerweiterungen.

Dass GNU portabler ist und mehr Standards unterstützt ist ja ganz schön. Allein die Aussage steht isoliert da und reiht sich nicht in die Argumentationskette ein, die von der These ausging, dass Intel erheblich von seinen Softwareinvestitionen profitiert.
Es bleibt aber halt auch nur eine These. Vielleicht profitiert Intel davon. Als Endverbraucher profitiert man allerdings weniger davon. Unter Windows ist wie gesagt der Microsoft Compiler mit Abstand am weitesten verbreitet. Der Intel Compiler mag eher bei Benchmarks zum Einsatz kommen. Davon habe ich im Alltag aber nichts. Da habe ich mehr vom GCC, weil mir als Entwickler die Sprachunterstützung wesentlich wichtiger ist als ein paar Prozent Performance. Und diese paar Prozent Performance gibt's beim Intel Compiler auch nicht immer. Das ist anwendungsabhängig. Ich nutze zB einen eigenen MinGW Build von LAME, der mir mehr Performance gibt als der Standard ICC Build.

Was CUDA betrifft, so bringt es der GPGPU-Community sehr viel. CUDA ist DER Standard, an dem sich AMD messen lassen muss.
Von Standard kann und konnte bei CUDA nie die Rede sein. Und mittlerweile ist davon auch immer weniger zu sehen. Entwickler setzen zum Glück mehr und mehr auf wirkliche Standards, wie zB OpenCL.

Es liegt performancemäßig einen Schritt vor OpenCL, und vor allem liefert Nvidia etablierte Entwicklerwerkzeuge (ganz i.Ggs. zu AMD).
Ist das so? Dann belege das doch mal mit ein paar Zahlen. Und bitte keine Nvidia CUDA vs Nvidia OpenCL Vergleiche. Es ist kein Geheimnis, dass Nvidia seine OpenCL Implementierung künstlich verkrüppelt, um CUDA besser dastehen zu lassen. Ich glaube eher das sind nur Vorurteile deinerseits, resultierend aus dem Stand von vor einigen Jahren. Bei OpenCL hat sich mittlerweile aber recht viel getan. Lies dir zB mal durch, was der Kollege hier schreibt, Stand Ende 2013. Mag also schon nicht mehr ganz aktuell sein. GDB Support bietet zB AMD auch, obwohl hier was anderes behauptet wird. Unterm Strich klingt das jedenfalls nicht mehr sonderlich prickelnd für CUDA. Es gibt auch einige recht interessante Projekte, wie pocl, für Unternehmen die keine eigene OpenCL Implementierung anbieten können oder wollen.

Das Problem von CUDA ist einfach, praktisch alle namhaften Unternehmen setzen nicht darauf. AMD, ARM, Apple, IBM, Intel usw. Und das aus gutem Grund. Warum soll man Nvidia bei ihren Alleingängen unterstützen, die ausser Nvidia keinem wirklich helfen? Mittelfristig wird CUDA abseits von Nischenmärkten daher keine Relevanz mehr haben. Dann interessiert es auch keinen mehr, ob CUDA vor einigen Jahren vielleicht mal alternativlos war.
 
Ich meinte wo ich das finden kann in meinen Links. Ich kann mich nicht entsinnen dies damals gelesen zu haben.

Würde mich nun interessieren, ob dies nun die finale Version eben dieser Preview sein könnte. Ich weiss nur dass die von mit verlinkte Version kein SVM (Shared Virtual Memory) genutzt hat. Dies wurde in der Präsentation für die kommende Version als grosser Schritt bei der Beschleunigung avisiert. Mich würde interessieren, ob dies hier eben der Fall ist.

Von welchem Link sprichst du jetzt ganz genau?
Das eine Modifikation an AfterShot Pro 1 vorgenommen werden musste, schrieb ich ja jetzt zum wiederholten Male. Warum andere Seiten dies nicht in ihren Artikeln explizit erwähnen, musst du dort erfragen.

Mal abgesehen davon: Ohne HSA-fähigen Treiber bringen auch die Anwendungen den AMD-Kunden nicht weiter.
 
Ach gruffi, das bringt doch so nichts. Dafür ist mir meine Zeit zu schade.
MfG
 
Also mich hätten schon mal ein paar Zahlen deinerseits interessiert, ob CUDA heutzutage einen Performancevorteil gegenüber OpenCL hat und ob Nvidias Entwicklerwerkzeuge so viel besser sind als AMDs. Schliesslich waren das deine Behauptungen. Und behaupten kann ich auch viel, wenn der Tag lang ist. ;) Mir scheint eher, wie bereits gesagt, dass sich bei dir viele Vorurteile festgesetzt haben, die, wenn ich mir diverse Erfahrungsberichte im Netz durchlese, mit der aktuellen Situation nicht mehr wirklich viel zu tun haben.
 
Also in der aktuellen Top 500 hält sich CUDA/NV mit den Phi´s ziemlich die Waage auch wenn ich zu faul bin das jetzt genau zu zählen. Vermutlich wird aber da sogar der Mangel an AMD CPU´s CUDA schaden weil es vermutlich auch den ein oder anderen Phi kostenneutral zum Xeon gibt ;-).
 
Von welchem Link sprichst du jetzt ganz genau?
Das eine Modifikation an AfterShot Pro 1 vorgenommen werden musste, schrieb ich ja jetzt zum wiederholten Male.
Richtig und du schriebst es würde in einem meiner Links die ich gepostet habe stehen. Ich würde das gerne dort nachlesen wenn du mir sagen könntest wo du das gelesen hast. Ich finde nichts darüber bei Google außer eben deine Behauptung in diesem Thread.
 
Nun, mich beschleicht das Gefühl, dass Du mich absichtlich falsch verstehen willst. Damit endet diese Diskussion für mich mit diesem Post.

Richtig und du schriebst es würde in einem meiner Links die ich gepostet habe stehen. Ich würde das gerne dort nachlesen wenn du mir sagen könntest wo du das gelesen hast. Ich finde nichts darüber bei Google außer eben deine Behauptung in diesem Thread.

Das einzige mal, dass ich auf irgendeinen Link verwiesen habe, war hier:

Nein, ist es nicht.

Diese Benchmarks wurden dadurch erstellt, dass an der alten Version (AfterShot Pro 1) Modifikationen vorgenommen werden mussten mit Dateien, die nur der Presse zur Verfügung standen.

Und auch da wurde lediglich eine HSA-beschleunigte OpenCL-Laufzeitumgebung verwendet. Das wird im übrigen auch in der Präsentation aufgezeigt, die Du selber verlinkt hast.

Das bezog sich ganz offensichtlich auf einen von dir geposteten Link zur Präsentation bzgl. GPU-Beschleunigung von AfterShot auf der APU13.

http://www.planet3dnow.de/vbulletin...Kabinithread?p=4945131&viewfull=1#post4945131


Als Quelle für die Herangehensweise, die für die Benchmarks zum Start von Kaveri notwendig war, darfst Du mich ansehen (die Redaktion hatte ja schließlich Zugriff auf die Daten). Offenbar hat es sonst niemand beschrieben. Vielleicht steht es noch wo anders im Netz, ich habe aber auch nur einen Bruchteil der Artikel dazu gelesen.
 
Also da sind sage und und schreibe 5 links in dem von dir verlinkten Beitrag von mir. Ich habe die alle gelesen bevor ich sie gepostet habe. Nirgendwo dort habe ich etwas gelesen von speziell angepassten Dateien für die Presse. Könntest du nachdem ich nun erneut frage, den Link wo das steht hier Posten und eventuell ein Zitat oder einen Hinweis an welcher Stelle ich das was du schreibst selber lesen kann. So langsam wird es merkwürdig und ich zweifle an der Existenz dieses Beweises.

Es tut mir Leid, doch fällt es mir schwer dich als Referenz zu nehmen für HSA Test, da offensichtlich dir nicht gelingt, was vielen anderen Redaktionen gelungen ist. HSA zum laufen zu bringen.
 
Also da sind sage und und schreibe 5 links in dem von dir verlinkten Beitrag von mir. Ich habe die alle gelesen bevor ich sie gepostet habe. Nirgendwo dort habe ich etwas gelesen von speziell angepassten Dateien für die Presse. Könntest du nachdem ich nun erneut frage, den Link wo das steht hier Posten und eventuell ein Zitat oder einen Hinweis an welcher Stelle ich das was du schreibst selber lesen kann. So langsam wird es merkwürdig und ich zweifle an der Existenz dieses Beweises.

Es tut mir Leid, doch fällt es mir schwer dich als Referenz zu nehmen für HSA Test, da offensichtlich dir nicht gelingt, was vielen anderen Redaktionen gelungen ist. HSA zum laufen zu bringen.

Dieser Post bestätigt nur meine Vermutung. Immer noch erzählst Du was von einem Link, wo was über die notwendigen Modifikationen steht, welche von der Presse durchgeführt werden mussten, um AfterShot Pro mit HSA-beschleunigter OpenCL-Laufzeitumgebung nutzen zu können. Dabei habe ich jetzt wiederholt klargestellt, dass ich mich auf die Präsentation von Corel auf der APU13 bezogen habe. Wenn du in deinen eigenen wild zusammengestellten Posts nicht durchsiehst, ist es nicht mein Problem. Um irgendwelche Modifikationen ging es da nie.
Als Quelle für die Notwendigkeit von Modifikationen an AfterShot Pro, damit das Programm von der HSA-beschleunigten OpenCL-Laufzeitumgebung profitiert, kannst du mich ansehen - oder es einfach weiter ignorieren.

Dass Du weiterhin diese falschen Behauptungen verbreitest, ich würde HSA nicht zum laufen bringen finde ich schon ziemlich anmaßend. Wie ich dir schon mal schrieb, funktioniert die Beschleunigung von AftreShot Pro nach den Anpassungen mit der HSA beschleunigten OpenCL-Laufzeitumgebung. LibreOffice habe ich ja bereits als nicht HSA-beschleunigt entlarvt, was auch jeder mit den bereitgestellten Dateien nachprüfen kann.

Abgesehen davon, ist Stand heute, dass der Endkunde nicht von HSA profitieren kann. Es fehlt schlicht ein passender Treiber. Dies könnte sich vielleicht noch Ende 2014 ändern, wenn AMD seinen OpenCL 2.0 Treiber veröffentlicht (bisher ja nur eine Version die sich an Entwickler richtet). Dieser wird dann hoffentlich auch HSA als Unterbau nutzen können. Der aktuelle Preview-Treiber für Entwickler nutzt aber eben kein HSA. Offizielle Aussagen oder Ankündigungen zur Verfügbarkeit des HSA-Softwarestacks gibt es weiterhin nicht. Die ganze Situation bei HSA ist völlig unklar.

EOD
 
Zunächst mal ist es deine Aussage gewesen es würde bei dir mit HSA und LibreOffice nicht klappen. Bei anderen kann mannlesen es funktioniert inkl. Benchmarks. Das ist keine Behauptung von mir und somit auch keine Falsche.

Als nächstes behauptest du es waren modifizierte Dateien für die Presse bei Corel, mit der Behauptung dies wäre in von mir geposteten Links nachzulesen.

Auf die Frage wo das denn dort stehen solle, soll ich mein Chaos sortieren? Das steht dort eben nicht. Falls doch dann belege deine Behauptung
 
Interessant. Da steht auch, dass CL Code dann Offline kompiliert wird. Das war mir noch gar nicht klar.
Ich hoffe, der Windows HSA Stack folgt nicht erst nach Ostern...
MfG
 
Zurück
Oben Unten