{"id":1291,"date":"2013-08-25T23:06:57","date_gmt":"2013-08-25T21:06:57","guid":{"rendered":"http:\/\/www.planet3dnow.de\/cms\/?p=1291"},"modified":"2013-11-25T17:11:30","modified_gmt":"2013-11-25T16:11:30","slug":"amd-prasentiert-hsa-details-auf-der-hotchips-25","status":"publish","type":"post","link":"https:\/\/www.planet3dnow.de\/cms\/1291-amd-prasentiert-hsa-details-auf-der-hotchips-25\/","title":{"rendered":"<span class=\"caps\">AMD<\/span> pr\u00e4sentiert HSA-Details auf der Hot Chips 25 [Update]"},"content":{"rendered":"<p>Auf der gera\u00adde statt\u00adfin\u00adden\u00adden Hot-Chips-Kon\u00adfe\u00adrenz hat <span class=\"caps\">AMD<\/span> in Zusam\u00admen\u00adar\u00adbeit mit den HSA-Part\u00adnern Qual\u00adcomm und <span class=\"caps\">ARM<\/span> Details zur ihrer gemein\u00adsa\u00admen hete\u00adro\u00adge\u00adnen Sys\u00adtem\u00adar\u00adchi\u00adtek\u00adtur (<span class=\"caps\">HSA<\/span>) preis\u00adge\u00adge\u00adben. Die Grund\u00adla\u00adgen von <span class=\"caps\">HSA<\/span> sind schon seit deren <a href=\"http:\/\/www.planet3dnow.de\/cgi-bin\/newspub\/viewnews.cgi?id=1339584790\">Gr\u00fcn\u00addung 2012 bekannt<\/a>, ein Eck\u00adpfei\u00adler der Archi\u00adtek\u00adtur ist u.a. die Unter\u00adst\u00fct\u00adzung von gemein\u00adsam benutz\u00adtem, hete\u00adro\u00adge\u00adnen Sys\u00adtem\u00adspei\u00adcher, der unter dem Schlag\u00adwort <a title=\"AMD r\u00fchrt die Werbetrommel f\u00fcr seine HSA-Architektur und erkl\u00e4rt hUMA [Update]\" href=\"http:\/\/www.planet3dnow.de\/cgi-bin\/newspub\/viewnews.cgi?category=1&amp;id=1367308053\">hUMA<\/a> bewor\u00adben wird. Aktu\u00adell ist der Begriff auf\u00adgrund der even\u00adtu\u00adel\u00adlen <a href=\"http:\/\/www.planet3dnow.de\/cms\/898-gamescom-2013-playstation-4-unterstutzt-huma-xbox-one-jedoch-nicht\/\">hUMA-Unter\u00adst\u00fct\u00adzung der <span class=\"caps\">PS4<\/span><\/a> im Gespr\u00e4ch. In der Pr\u00e4\u00adsen\u00adta\u00adti\u00adon wur\u00adde anfangs durch AMDs Fel\u00adlow und HSA-Pr\u00e4\u00adsi\u00adden\u00adten Phil Rogers noch\u00admals die obers\u00adte HSA-Ebe\u00adne erkl\u00e4rt:<\/p>\n<ul>\n<li>Gemein\u00adsa\u00admer Adress\u00adraum quer \u00fcber alle ein\u00adge\u00adsetz\u00adten Pro\u00adzes\u00adso\u00adren des HSA-SoCs: Der GPU-Com\u00adpu\u00adte-Pro\u00adzes\u00adsor nutzt die glei\u00adchen Adres\u00adsen und Poin\u00adter wie die&nbsp;<span class=\"caps\">CPU<\/span>.<\/li>\n<li>M\u00f6g\u00adli\u00adches Nut\u00adzen einer Spei\u00adcher-Aus\u00adla\u00adge\u00adrungs\u00adda\u00adtei auf der Festplatte.<\/li>\n<li>Spei\u00adcher\u00adko\u00adh\u00e4\u00adrenz: Alle Threads k\u00f6n\u00adnen auf die Ergeb\u00adnis\u00adse ande\u00adrer Threads zugreifen.<\/li>\n<li>User Mode Dis\u00adpatch: Appli\u00adka\u00adtio\u00adnen und Biblio\u00adthe\u00adken k\u00f6n\u00adnen die Hard\u00adware direkt, ohne Umweg \u00fcber Trei\u00adber\u00adrou\u00adti\u00adnen, nutzen.<\/li>\n<li>Archi\u00adtec\u00adted queu\u00ading lan\u00adguage: Rechen\u00adpa\u00adke\u00adte f\u00fcr GPU-Com\u00adpu\u00adte haben ein iden\u00adti\u00adsches, hard\u00adware-unab\u00adh\u00e4n\u00adgi\u00adges Format.<\/li>\n<li>Hoch\u00adspra\u00adchen\u00adun\u00adter\u00adst\u00fct\u00adzung f\u00fcr GPU-Com\u00adpu\u00adte (Java, C++,&nbsp;etc.)<\/li>\n<li>Pre\u00ademp\u00adti\u00adon und Kon\u00adtextswit\u00adching: Auf\u00adgrund des h\u00f6he\u00adren Nut\u00adzungs\u00adgrads durch vie\u00adle Threads wer\u00adden Zeit\u00adschei\u00adben\u00admo\u00addel\u00adle auch f\u00fcr die <span class=\"caps\">GPU<\/span> ben\u00f6tigt.<\/li>\n<\/ul>\n<p>Wie man also sieht, ist <span class=\"caps\">HSA<\/span> unab\u00adh\u00e4n\u00adgig von spe\u00adzi\u00adel\u00adlem Maschi\u00adnen\u00adcode wie x86 oder ARMv8, statt\u00addes\u00adsen gibt es eine Zwi\u00adschen\u00adschicht namens <span class=\"caps\">HSAIL<\/span> (<span class=\"caps\">HSA<\/span> Inter\u00adme\u00addia\u00adte Lay\u00ader), d.h. Pro\u00adgramm\u00adcode wird mit\u00adtels eines Echt\u00adzeit-Com\u00adpi\u00adlers auf die ent\u00adspre\u00adchen\u00adde Ziel\u00adplatt\u00adform \u00fcber\u00adsetzt. Schlie\u00df\u00adlich ging es dann in den Pra\u00adxis\u00adteil \u00fcber. Den Anfang mach\u00adte die Pla\u00adnung zu AMDs Apa\u00adra\u00adpi. Die\u00adses Soft\u00adware\u00adtool gibt es seit 2012 und erm\u00f6g\u00adlicht es, Java-Appli\u00adka\u00adtio\u00adnen auf GPUs lau\u00adfen zu las\u00adsen. F\u00fcr die im Jah\u00adre 2015 geplan\u00adte Java-Ver\u00adsi\u00adon 9 ist erst\u00admals eine voll\u00adst\u00e4n\u00addi\u00adge Inte\u00adgra\u00adti\u00adon in die <span class=\"caps\">JVM<\/span> mit dem Code\u00adna\u00admen \u201cSuma\u00adtra\u201d vorgesehen:<\/p>\n<p style=\"text-align: center;\"><img decoding=\"async\" class=\"ngg-singlepic ngg-center\" alt=\"19hc25_hsa\" src=\"http:\/\/www.planet3dnow.de\/cms\/wp-content\/gallery\/hotchips25-hsa\/19hc25_hsa.png\"><\/p>\n<p>Kern\u00adpunkt der Unter\u00adst\u00fct\u00adzung ist der bei Java 8 ein\u00adge\u00adf\u00fchr\u00adte Lamb\u00adda-Aus\u00addruck. Ver\u00adwen\u00addet man die\u00adsen bereits in sei\u00adnem Java-Code, so wird Java 9 auto\u00adma\u00adtisch Tei\u00adle davon auf der <span class=\"caps\">GPU<\/span> aus\u00adf\u00fch\u00adren k\u00f6n\u00adnen. Anschlie\u00ad\u00dfend wur\u00adden Leis\u00adtungs\u00adbei\u00adspie\u00adle gebracht. So kann man bei Algo\u00adrith\u00admen zur Gesichts\u00ader\u00adken\u00adnung, die in meh\u00adre\u00adren Stu\u00adfen (im Bei\u00adspiel 22) erfol\u00adgen, durch die abwech\u00adseln\u00adden Berech\u00adnun\u00adgen auf <span class=\"caps\">CPU<\/span> und <span class=\"caps\">GPU<\/span> eine Leis\u00adtungs\u00adver\u00adbes\u00adse\u00adrung bzw. eine Ener\u00adgie\u00adkos\u00adten\u00admin\u00adde\u00adrung um den Fak\u00adtor 2,5 erm\u00f6glichen:<\/p>\n<p style=\"text-align: center;\"><img decoding=\"async\" class=\"ngg-singlepic ngg-center\" alt=\"29hc25_hsa\" src=\"http:\/\/www.planet3dnow.de\/cms\/wp-content\/gallery\/hotchips25-hsa\/29hc25_hsa.png\"><\/p>\n<p>Wie man dem obi\u00adgen Bild ent\u00adneh\u00admen kann, ist das Leis\u00adtungs\u00adma\u00adxi\u00admum der <span class=\"caps\">APU<\/span> bei Aus\u00adla\u00adge\u00adrung der ers\u00adten drei Berech\u00adnungs\u00adschrit\u00adten auf die <span class=\"caps\">GPU<\/span> erreicht. Der Rest der Schrit\u00adte wird dann auf der <span class=\"caps\">CPU<\/span> aus\u00adge\u00adf\u00fchrt, da der Par\u00adal\u00adle\u00adli\u00adsie\u00adrungs\u00adgrad stark abnimmt. W\u00e4h\u00adrend die <span class=\"caps\">CPU<\/span> also den Aus\u00adschnitt zu Ende rech\u00adnet, beginnt die <span class=\"caps\">GPU<\/span> mit den Berech\u00adnungs\u00adschrit\u00adten des n\u00e4chs\u00adten Bild\u00adaus\u00adschnitts. Exklu\u00adsi\u00adves Rech\u00adnen auf der <span class=\"caps\">CPU<\/span> (blau, links) bzw. <span class=\"caps\">GPU<\/span> (grau, rechts) lie\u00adfert jeweils eine schlech\u00adte\u00adre Leis\u00adtung. W\u00e4h\u00adrend die weni\u00adgen CPU-Ker\u00adne anfangs mit der Daten\u00admen\u00adge \u00fcber\u00adfor\u00addert sind, bricht die <span class=\"caps\">GPU<\/span> in den hin\u00adte\u00adren Berech\u00adnungs\u00adstu\u00adfen auf\u00adgrund der stark gesun\u00adke\u00adnen Thre\u00ada\u00addan\u00adzahl und ihrer gerin\u00adgen Sin\u00adgle-Thread-Leis\u00adtung ein. Ein kom\u00adbi\u00adnier\u00adter Ansatz ist somit die Ide\u00adal\u00adl\u00f6\u00adsung. Neben die\u00adsem bereits fr\u00fc\u00adher gezeig\u00adten Bei\u00adspiel gab es auch noch ande\u00adre, eben\u00adfalls schon bekann\u00adte F\u00e4l\u00adle. Als neu fiel dage\u00adgen der Anwen\u00addungs\u00adfall \u201cGame\u00adplay Rigid Body Phy\u00adsics\u201d auf, der mit an Sicher\u00adheit gren\u00adzen\u00adden Wahr\u00adschein\u00adlich\u00adkeit aus der Zusam\u00admen\u00adar\u00adbeit mit den Spie\u00adle\u00adkon\u00adso\u00adlen\u00adher\u00adstel\u00adlern ent\u00adstam\u00admen d\u00fcrf\u00adte, schlie\u00df\u00adlich ist zumin\u00addest Sony offi\u00adzi\u00adel\u00adles Mit\u00adglied der HSA-Foun\u00adda\u00adti\u00adon. Zuerst eine \u00dcber\u00adsichts\u00adfo\u00adlie als Einsteig:<\/p>\n<p style=\"text-align: center;\"><img loading=\"lazy\" decoding=\"async\" class=\"ngg-singlepic ngg-none aligncenter\" alt=\"35hc25_hsa\" src=\"http:\/\/www.planet3dnow.de\/cms\/wp-content\/gallery\/hotchips25-hsa\/35hc25_hsa.png\" width=\"750\" height=\"563\"><\/p>\n<p>Wie man sieht, wird die rea\u00adlis\u00adti\u00adsche (phy\u00adsi\u00adka\u00adli\u00adsche) Starr\u00adk\u00f6r\u00adper\u00adani\u00adma\u00adti\u00adon bis\u00adher nur in Effek\u00adten, aber nicht direkt im Spiel als Inter\u00adak\u00adti\u00adon genutzt. Auf der n\u00e4chs\u00adten Sei\u00adte wird erkl\u00e4rt, wie der Algo\u00adrith\u00admus funk\u00adtio\u00adniert. Zuerst lau\u00adfen drei Pha\u00adsen der Kol\u00adli\u00adsi\u00adons\u00ader\u00adken\u00adnung, dann wer\u00adden die Kon\u00adtakt\u00adpunk\u00adte berech\u00adnet, danach die Ein\u00adschr\u00e4n\u00adkun\u00adgen gel\u00f6st:<\/p>\n<p style=\"text-align: center;\"><img decoding=\"async\" class=\"ngg-singlepic ngg-center\" alt=\"36hc25_hsa\" src=\"http:\/\/www.planet3dnow.de\/cms\/wp-content\/gallery\/hotchips25-hsa\/36hc25_hsa.png\"><\/p>\n<p>Die n\u00e4chs\u00adten bei\u00adden Foli\u00aden lie\u00adfern dann all\u00adge\u00admei\u00adne Gr\u00fcn\u00adde, wie\u00adso <span class=\"caps\">HSA<\/span> bzw. hUMA Vor\u00adtei\u00adle bei der Ver\u00adwen\u00addung mit Starr\u00adk\u00f6r\u00adpern und deren rea\u00adlis\u00adti\u00adscher Ani\u00adma\u00adti\u00adon und Inter\u00adak\u00adti\u00adon bringt:<\/p>\n<p style=\"text-align: center;\"><img decoding=\"async\" class=\"ngg-singlepic ngg-center\" alt=\"37hc25_hsa\" src=\"http:\/\/www.planet3dnow.de\/cms\/wp-content\/gallery\/hotchips25-hsa\/37hc25_hsa.png\"><br>\n<img decoding=\"async\" class=\"ngg-singlepic ngg-center\" alt=\"38hc25_hsa\" src=\"http:\/\/www.planet3dnow.de\/cms\/wp-content\/gallery\/hotchips25-hsa\/38hc25_hsa.png\"><\/p>\n<p>Zusam\u00admen\u00adfas\u00adsend kann man sagen, dass <span class=\"caps\">HSA<\/span> v.a. Vor\u00adtei\u00adle bei vie\u00adlen, inter\u00adak\u00adti\u00adven Objek\u00adten bie\u00adtet, da der gesam\u00adte Spei\u00adcher\u00adraum und nicht nur das begrenz\u00adte <span class=\"caps\">VRAM<\/span> zur Ver\u00adf\u00fc\u00adgung ste\u00adhen. Au\u00dfer\u00addem kann durch eine ver\u00adbes\u00adser\u00adte Koope\u00adra\u00adti\u00adon zwi\u00adschen <span class=\"caps\">CPU<\/span> und <span class=\"caps\">GPU<\/span> eine h\u00f6he\u00adre Bild\u00adwie\u00adder\u00adhol\u00adra\u00adte garan\u00adtiert wer\u00adden. Fazit: Die M\u00f6g\u00adlich\u00adkei\u00adten von <span class=\"caps\">HSA<\/span> sind viel\u00adver\u00adspre\u00adchend, aber lang\u00adsam soll\u00adten den Wor\u00adten auch Taten in Form von funk\u00adti\u00adons\u00adt\u00fcch\u00adti\u00adger und kauf\u00adba\u00adrer Hard\u00adware fol\u00adgen. Dass <span class=\"caps\">AMD<\/span> hin\u00adter dem Zeit\u00adplan liegt, sieht man schon allein an dem Umstand, dass die Pr\u00e4\u00adsen\u00adta\u00adti\u00adon nur wenig Neu\u00ades ent\u00adhielt. Vie\u00adles stamm\u00adte aus einer fr\u00fc\u00adhe\u00adren Pr\u00e4\u00adsen\u00adta\u00adti\u00adon des letz\u00adten Jah\u00adres: <a href=\"http:\/\/de.slideshare.net\/hsafoundation\/hsa-keynote-oct-2012v11-arm-techcon\"><span class=\"caps\">ARM<\/span> Tech\u00adcon Key\u00adnote 2012<\/a>. Aber immer\u00adhin, die Soft\u00adware\u00adent\u00adwick\u00adler schei\u00adnen sich durch den z\u00f6ger\u00adli\u00adchen Hard\u00adware\u00adstart nicht aus dem Rhyth\u00admus brin\u00adgen zu las\u00adsen und die Spielekonsole(n) schei\u00adnen eine trei\u00adben\u00adde Kraft zu sein. Je sp\u00e4\u00adter die Hard\u00adware am Ende erscheint, des\u00adto gr\u00f6\u00ad\u00dfer wird die Soft\u00adware\u00adaus\u00adwahl sein. Zum Abschluss alle Foli\u00aden in der \u00dcbersicht:<\/p>\nngg_shortcode_0_placeholder\n<p><strong>Update 27.08.2013:<\/strong> Der Bil\u00adder\u00adga\u00adle\u00adrie wur\u00adden noch eini\u00adge Foli\u00aden von <a href=\"http:\/\/pc.watch.impress.co.jp\/docs\/column\/kaigai\/20130826_612591.html\"><span class=\"caps\">PC<\/span> Watch<\/a> hinzugef\u00fcgt.<\/p>\n<p><strong>Pro\u00adgram\u00admier\u00adlinks:<\/strong><\/p>\n<ul>\n<li><a href=\"http:\/\/developer.amd.com\/tools-and-sdks\/heterogeneous-computing\/aparapi\/\">Apa\u00adra\u00adpi | <span class=\"caps\">AMD<\/span><\/a>.<\/li>\n<li><a href=\"https:\/\/code.google.com\/p\/aparapi\/\">apa\u00adra\u00adpi \u2014 <span class=\"caps\">API<\/span> for data par\u00adal\u00adlel&nbsp;Java&nbsp;<\/a><\/li>\n<li><a href=\"http:\/\/openjdk.java.net\/projects\/sumatra\/\">OpenJDK: Pro\u00adject Sumatra<\/a><\/li>\n<li><a href=\"http:\/\/hsafoundation.com\/hsa-foundation-has-just-released-version-0-95-of-the-programmers-reference-manual-which-we-affectionately-refer-to-as-the-hsail-spec\/\">The <span class=\"caps\">HSAIL<\/span>&nbsp;spec&nbsp;<\/a><\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Auf der gera\u00adde statt\u00adfin\u00adden\u00adden Hot-Chips-Kon\u00adfe\u00adrenz hat <span class=\"caps\">AMD<\/span> in Zusam\u00admen\u00adar\u00adbeit mit den HSA-Part\u00adnern Qual\u00adcomm und <span class=\"caps\">ARM<\/span> Details zur ihrer gemein\u00adsa\u00admen hete\u00adro\u00adge\u00adnen Sys\u00adtem\u00adar\u00adchi\u00adtek\u00adtur (<span class=\"caps\">HSA<\/span>) preis\u00adge\u00adge\u00adben. Die Grund\u00adla\u00adgen von <span class=\"caps\">HSA<\/span> sind schon seit deren Gr\u00fcn\u00addung 2012 bekannt, ein Eck\u00adpfei\u00adler der Archi\u00adtek\u00adtur ist u.a. die Unter\u00adst\u00fct\u00adzung von gemein\u00adsam benutz\u00adtem, hete\u00adro\u00adge\u00adnen Sys\u00adtem\u00adspei\u00adcher, der unter dem Schlag\u00adwort hUMA bewor\u00adben wird. (\u2026) <a class=\"moretag\" href=\"https:\/\/www.planet3dnow.de\/cms\/1291-amd-prasentiert-hsa-details-auf-der-hotchips-25\/\">Wei\u00adter\u00adle\u00adsen&nbsp;\u00bb<\/a><\/p>\n","protected":false},"author":5,"featured_media":1341,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"wp_typography_post_enhancements_disabled":false,"ngg_post_thumbnail":0,"footnotes":""},"categories":[12,11],"tags":[224,1003,214],"class_list":["post-1291","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-aktuelles","category-news","tag-hot-chips","tag-hsa","tag-huma","entry"],"share_on_mastodon":{"url":"","error":""},"_links":{"self":[{"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/posts\/1291","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/comments?post=1291"}],"version-history":[{"count":84,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/posts\/1291\/revisions"}],"predecessor-version":[{"id":6184,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/posts\/1291\/revisions\/6184"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/media\/1341"}],"wp:attachment":[{"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/media?parent=1291"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/categories?post=1291"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/tags?post=1291"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}