{"id":4916,"date":"2013-10-26T22:48:02","date_gmt":"2013-10-26T20:48:02","guid":{"rendered":"http:\/\/www.planet3dnow.de\/cms\/?p=4916"},"modified":"2013-10-27T08:12:36","modified_gmt":"2013-10-27T06:12:36","slug":"details-zu-amds-heterogener-verarbeitungsschlange","status":"publish","type":"post","link":"https:\/\/www.planet3dnow.de\/cms\/4916-details-zu-amds-heterogener-verarbeitungsschlange\/","title":{"rendered":"Details zu AMDs heterogener Verarbeitungsschlange"},"content":{"rendered":"<p>Die\u00adse Woche gab <span class=\"caps\">AMD<\/span> Details zur Pro\u00adgramm\u00adab\u00adar\u00adbei\u00adtung auf HSA-f\u00e4hi\u00adgen Pro\u00adzes\u00adso\u00adren bzw. APUs bekannt, zus\u00e4tz\u00adlich beant\u00adwor\u00adte\u00adte uns <span class=\"caps\">AMD<\/span> noch Detail\u00adfra\u00adgen dazu. Das beschrie\u00adbe\u00adne Kon\u00adzept h\u00f6rt im Eng\u00adli\u00adschen auf den Namen \u201chete\u00adro\u00adge\u00adneous Queu\u00ading\u201d, abge\u00adk\u00fcrzt: \u201chQ\u201d.<\/p>\n<p>Wie schon bei <a href=\"http:\/\/www.planet3dnow.de\/cgi-bin\/newspub\/viewnews.cgi?id=1367308053\">AMDs Spei\u00adcher\u00adtech\u00adnik hUMA<\/a> ist \u201chete\u00adro\u00adgen\u201d schnell erkl\u00e4rt. Bei hUMA bedeu\u00adtet es schlicht, dass <em>unter\u00adschied\u00adli\u00adche<\/em> Pro\u00adzes\u00adsor\u00adker\u00adne auf einen gemein\u00adsa\u00admen Spei\u00adcher \u00fcber glei\u00adche Spei\u00adcher\u00adadres\u00adsen zugrei\u00adfen k\u00f6n\u00adnen. Im Zusam\u00admen\u00adspiel mit einer Ver\u00adar\u00adbei\u00adtungs\u00adschlan\u00adge bedeu\u00adtet es nun, dass sich die glei\u00adchen <em>unter\u00adschied\u00adli\u00adchen<\/em> Pro\u00adzes\u00adsor\u00adker\u00adne nun gegen\u00adsei\u00adtig Arbeit zuschi\u00adcken k\u00f6nnen:<\/p>\n<p style=\"text-align: center;\">ngg_shortcode_0_placeholder<\/p>\n<p>hUMA und hQ sind sich also kon\u00adzep\u00adtio\u00adnell \u00e4hn\u00adlich, aber im Ver\u00adgleich zum Spei\u00adcher gibt es kei\u00adne gemein\u00adsa\u00adme Schlan\u00adge, son\u00addern min\u00addes\u00adtens zwei, eine f\u00fcr die <span class=\"caps\">CPU<\/span> sowie eine f\u00fcr die&nbsp;<span class=\"caps\">GPU<\/span>:<\/p>\n<p style=\"text-align: center;\">ngg_shortcode_1_placeholder<\/p>\n<p style=\"text-align: left;\">Die\u00adse bei\u00adden War\u00adte\u00adschlan\u00adgen wer\u00adden von der jewei\u00adli\u00adgen Rechen\u00adein\u00adheit regel\u00adm\u00e4\u00ad\u00dfig auto\u00adma\u00adtisch abge\u00adfragt und even\u00adtu\u00adell gefun\u00adde\u00adne Rechen\u00adpa\u00adke\u00adte dadurch z\u00fcgig abge\u00adar\u00adbei\u00adtet. Die Pake\u00adte lie\u00adgen im Haupt\u00adspei\u00adcher, wobei ein soge\u00adnann\u00adtes hQ-Paket aber kei\u00adnen aus\u00adzu\u00adf\u00fch\u00adren\u00adden Code selbst ent\u00adh\u00e4lt, son\u00addern nur einen Zei\u00adger auf diesen.<\/p>\n<p style=\"text-align: left;\">Dadurch, dass die hQ-Pake\u00adte im Haupt\u00adspei\u00adcher lie\u00adgen, k\u00f6nn\u00adte man nun anneh\u00admen, dass die Kom\u00admu\u00adni\u00adka\u00adti\u00adon zwi\u00adschen <span class=\"caps\">CPU<\/span> und <span class=\"caps\">GPU<\/span> stark von der rela\u00adtiv hohen RAM-Latenz behin\u00addert wird. Jedoch ver\u00adsi\u00adcher\u00adte uns <span class=\"caps\">AMD<\/span> auf Nach\u00adfra\u00adge, dass die Spei\u00adcher\u00adstel\u00adlen der hQ-Pake\u00adte voll cache-f\u00e4hig sei\u00aden, es auch kei\u00adne Koh\u00e4\u00adrenz\u00adpro\u00adble\u00adme zwi\u00adschen <span class=\"caps\">CPU<\/span> und <span class=\"caps\">GPU<\/span> g\u00e4be und somit kei\u00adne Per\u00adfor\u00admance-Pro\u00adble\u00adme entst\u00fcnden.<\/p>\n<p style=\"text-align: left;\">Neu ist das beschrie\u00adbe\u00adne Paket\u00adfor\u00admat nicht ganz. Im bereits seit L\u00e4n\u00adge\u00adrem \u00f6ffent\u00adlich erh\u00e4lt\u00adli\u00adchen <span class=\"caps\">HSA-PDF<\/span> wer\u00adden schon soge\u00adnann\u00adte AQL-Pake\u00adte (Archi\u00adtec\u00adted Queu\u00ading Lan\u00adguage) beschrie\u00adben. <span class=\"caps\">AMD<\/span> best\u00e4\u00adtig\u00adte uns, dass die hQ-Pak\u00adte eng mit die\u00adsen ver\u00adwandt sei\u00aden und sie voll unter\u00adst\u00fct\u00adzen. Alle bis\u00adher gezeig\u00adten Funk\u00adti\u00adons\u00adbe\u00adschrei\u00adbun\u00adgen wer\u00adden auch von den AQL-Pake\u00adten erf\u00fcllt, jedoch w\u00fcr\u00adden die hQ-Pake\u00adte noch AMD-spe\u00adzi\u00adfi\u00adsche Fea\u00adtures, die \u00fcber den stan\u00addar\u00addi\u00adsier\u00adten Rah\u00admen hin\u00adaus gin\u00adgen, unter\u00adst\u00fct\u00adzen. Die AQL-Pake\u00adte sind fol\u00adgen\u00adder\u00adma\u00ad\u00dfen spezifiziert:<\/p>\n<blockquote>\n<p style=\"text-align: left;\">An <span class=\"caps\">AQL<\/span> packet is an HSA-stan\u00addard packet for\u00admat. <span class=\"caps\">AQL<\/span> dis\u00adpatch packets are used to dis\u00adpatch new ker\u00adnels on the <span class=\"caps\">HSA<\/span> com\u00adpo\u00adnent and spe\u00adci\u00adfy the launch dimen\u00adsi\u00adons, ins\u00adtruc\u00adtion code, ker\u00adnel argu\u00adments, com\u00adple\u00adti\u00adon detec\u00adtion, and more. <strong>Other <span class=\"caps\">AQL<\/span> packets may also be sup\u00adport\u00aded in the future.<\/strong><\/p>\n<\/blockquote>\n<p>Dadurch, dass sich die <span class=\"caps\">GPU<\/span> \u00fcber hQs die Arbeit selbst holen kann, besteht ein Vor\u00adteil gegen\u00ad\u00fcber der aktu\u00adel\u00adlen bzw. bald ver\u00adal\u00adte\u00adten Tech\u00adnik, bei der die <span class=\"caps\">CPU<\/span> Berech\u00adnun\u00adgen h\u00e4n\u00addisch und rela\u00adtiv kom\u00adpli\u00adziert \u00fcber Betriebs\u00adsys\u00adtem\u00adschnitt\u00adstel\u00adlen und Ker\u00adnel\u00adtrei\u00adber an die <span class=\"caps\">GPU<\/span> sen\u00adden muss. Die\u00adser alte Umweg ist im fol\u00adgen\u00adden Bild sche\u00adma\u00adtisch dargestellt:<\/p>\n<p style=\"text-align: center;\">ngg_shortcode_2_placeholder<\/p>\n<p style=\"text-align: left;\">Zum Schluss wol\u00adlen wir noch auf den Umstand hin\u00adwei\u00adsen, dass es nicht nur zwei Schlan\u00adgen gibt. Jede Appli\u00adka\u00adti\u00adon kann ihre eige\u00adne Schlan\u00adge benut\u00adzen, wobei es aber eine gewis\u00adse Ober\u00adgren\u00adze bei ca. 30 St\u00fcck&nbsp;gibt:<\/p>\n<p style=\"text-align: center;\">ngg_shortcode_3_placeholder<\/p>\n<p>Man darf also gespannt auf die Ver\u00adbes\u00adse\u00adrung sein, die <span class=\"caps\">HSA<\/span> mit sich bringt, allein es fehlt noch an der Hard\u00adware. <span class=\"caps\">AMD<\/span> wird hof\u00adfent\u00adlich bald nach\u00adle\u00adgen und auf der kom\u00admen\u00adden APU13-Mes\u00adse nicht nur Foli\u00aden son\u00addern auch Sili\u00adzi\u00adum zeigen.<\/p>\n<p>Alle Foli\u00aden gibt es in unse\u00adrer Slideshow:<\/p>\n<p style=\"text-align: center;\">ngg_shortcode_4_placeholder<\/p>\n<p style=\"text-align: left;\">Abschlie\u00ad\u00dfend m\u00f6ch\u00adten wir uns bei <span class=\"caps\">AMD<\/span> f\u00fcr die Beant\u00adwor\u00adtung unse\u00adrer Fra\u00adgen bedanken.<\/p>\n<p style=\"text-align: left;\">Quel\u00adle:<br>\n<a href=\"http:\/\/hsafoundation.com\/standards\/\">Stan\u00addards \u2014 <span class=\"caps\">HSA<\/span> Foun\u00adda\u00adti\u00adon<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Die\u00adse Woche gab <span class=\"caps\">AMD<\/span> Details zur Pro\u00adgramm\u00adab\u00adar\u00adbei\u00adtung auf HSA-f\u00e4hi\u00adgen Pro\u00adzes\u00adso\u00adren bzw. APUs bekannt, zus\u00e4tz\u00adlich beant\u00adwor\u00adte\u00adte uns <span class=\"caps\">AMD<\/span> noch Detail\u00adfra\u00adgen dazu. Das beschrie\u00adbe\u00adne Kon\u00adzept h\u00f6rt im Eng\u00adli\u00adschen auf den Namen \u201chete\u00adro\u00adge\u00adneous Queu\u00ading\u201d, abge\u00adk\u00fcrzt: \u201chQ\u201d. (\u2026) <a class=\"moretag\" href=\"https:\/\/www.planet3dnow.de\/cms\/4916-details-zu-amds-heterogener-verarbeitungsschlange\/\">Wei\u00adter\u00adle\u00adsen&nbsp;\u00bb<\/a><\/p>\n","protected":false},"author":5,"featured_media":80,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"wp_typography_post_enhancements_disabled":false,"ngg_post_thumbnail":0,"footnotes":""},"categories":[12,11],"tags":[966,970,379,378,1003,214],"class_list":["post-4916","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-aktuelles","category-news","tag-amd","tag-apu","tag-aql","tag-hq","tag-hsa","tag-huma","entry"],"share_on_mastodon":{"url":"","error":""},"_links":{"self":[{"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/posts\/4916","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/comments?post=4916"}],"version-history":[{"count":25,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/posts\/4916\/revisions"}],"predecessor-version":[{"id":4944,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/posts\/4916\/revisions\/4944"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/media\/80"}],"wp:attachment":[{"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/media?parent=4916"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/categories?post=4916"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.planet3dnow.de\/cms\/wp-json\/wp\/v2\/tags?post=4916"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}