AMD stellt Mainstream-Grafikkarte Radeon RX 480 mit Polaris-Architektur vor

Artikel-Index:

Nach einer län­ge­ren Durst­stre­cke will AMD im Gra­fik­kar­ten-Markt wie­der durch­star­ten. Ent­ge­gen der sonst übli­chen Stra­te­gie erfolgt der Angriff nicht vom High-End aus, son­dern im volu­men­träch­ti­gen Main­stream. Hier griff AMD zuletzt inner­halb der Rade­on-Rx-300-Serie auf zum Teil doch recht betag­te GPUs (z. B. “Pit­cairn”) zurück. In die­sem Gra­fik­kar­ten-Markt­seg­ment mit Prei­sen von 100 bis 300 US-Dol­lar will man jetzt mit den bei­den neu­en “Arc­tic Islands”-GPUs “Pola­ris 10” und “Pola­ris 11” ver­lo­ren gegan­ge­ne Markt­an­tei­le zurück­er­obern und wie­der in die Erfolgs­spur fin­den. Neben Opti­mie­run­gen auf Sei­ten der zugrun­de lie­gen­den GCN-GPU-Archi­tek­tur hilft hier­bei, dass mit dem soge­nann­ten 14-nm-Fin­FET-Pro­zess von Sam­sung und Glo­bal­Found­ries end­lich eine neue Fer­ti­gung mit klei­ne­ren Struk­tur­grö­ßen zur Ver­fü­gung steht. Hier­durch kön­nen gegen­über dem bis­he­ri­gen soge­nann­ten 28-nm-Pro­zess nicht nur mehr Tran­sis­to­ren auf glei­cher Die-Flä­che unter­ge­bracht wer­den, son­dern kann auch deren Leis­tungs­auf­nah­me deut­lich redu­ziert wer­den.

Wie schon auf der GDC 2016 ange­kün­digt will AMD beim The­ma Vir­tu­al Rea­li­ty wei­ter­hin voll auf Angriff set­zen. Die heu­te vor­ge­stell­te Rade­on RX 480 auf Basis der “Polaris-10”-GPU, die in der Ent­wick­lungs­pha­se mit “Elles­me­re” bezeich­net wur­de, soll den Ein­stiegs­preis für Vir­tu­al-Rea­li­ty-fähi­ge Sys­te­me signi­fi­kant her­ab­set­zen und so die neue Tech­no­lo­gie einem brei­te­ren Markt zugäng­lich machen. Für Anbie­ter ent­spre­chen­der Inhal­te ver­grö­ßert sich ent­spre­chend der adres­sier­ba­re Markt. AMD hofft hier auf Syn­er­gie­ef­fek­te. Mehr Con­tent erhöht die Nach­fra­ge nach dedi­zier­ten Gra­fik­kar­ten und umge­kehrt. Aber auch für den nach wie vor größ­ten Anteil unter den PC-Spie­lern, die laut Steam-Sta­tis­tik typi­scher­wei­se einen ein­zel­nen Moni­tor mit einer Auf­lö­sung von 1080p nut­zen, bringt “Pola­ris” eini­ge inter­es­san­te Neue­run­gen.

Zu einem spä­te­ren Zeit­punkt fol­gen die Rade­on RX 470 (teil­de­ak­ti­vier­te “Pola­ris 10”) und Rade­on RX 460 (“Pola­ris 11”). Den nach­fol­gen­den Foli­en sind nur ein paar Infor­ma­ti­ons­häpp­chen zu ent­neh­men. Bei “Pola­ris 11” ist AMD zudem auf die gegen­über “Bon­aire” von 1,9 mm auf 1,5 mm ver­rin­ger­te Höhe des Chips stolz, was wegen der dar­auf basie­ren­den mobi­len Lösun­gen für Note­books von Inter­es­se sein dürf­te.

Polaris-Architektur

Bei “Pola­ris” han­delt es sich aber­mals um kei­ne von Grund auf neu ent­wi­ckel­te GPU-Archi­tek­tur. AMD setzt statt­des­sen auf eine kon­ti­nu­ier­li­che Wei­ter­ent­wick­lung der bekann­ten Archi­tek­tur Gra­phics Core Next (GCN), die in AMDs Zäh­lung nun­mehr ihre vier­te Aus­bau­stu­fe erreicht hat.

Aus den ein­zel­nen Rechen­ein­hei­ten (CUs) konn­te durch Detail­ver­bes­se­run­gen (ver­bes­ser­ter Pre­fetch für Befeh­le, grö­ße­re Befehl­spuf­fer, ver­bes­ser­te Nut­zung des L2-Caches) eine um bis zu 15 % höhe­re Leis­tung her­aus­ge­kit­zelt wer­den. Außer­dem kön­nen jetzt auch die CUs der dedi­zier­ten GPUs nativ Berech­nun­gen in den Daten­for­ma­ten FP16 und Int16 mit redu­zier­ter Genau­ig­keit durch­füh­ren, was für bestimm­te Algo­rith­men völ­lig aus­rei­chend ist, dar­über hin­aus bei der Redu­zie­rung der Leis­tungs­auf­nah­me hel­fen kann. Bis­her war die­se Funk­tio­na­li­tät den GPUs in AMDs “Carrizo”-APUs vor­be­hal­ten. Im Rah­men von GPUO­pen bie­tet AMD Ent­wick­lern für Direc­tX 11, Direc­tX 12 und Vul­kan pas­sen­de Schnitt­stel­len an, um spe­zi­el­le Funk­tio­nen der eige­nen Hard­ware ver­wen­den zu kön­nen. Außer­dem wur­den aber­mals die Geo­me­trie­be­rech­nun­gen opti­miert und die Tes­sel­la­ti­ons­leis­tung erhöht.

Mit­tels der neu hin­zu­ge­kom­me­nen HWS-Ein­hei­ten (Hard­ware Sche­du­ler) wer­den die GPUs bei der asyn­chro­nen Abar­bei­tung von Rechen­auf­ga­ben noch fle­xi­bler. Zusätz­lich zur bis­her schon mög­li­chen par­al­le­len Abar­bei­tung von Gra­fik- sowie Com­pu­te-Ker­nels kön­nen jetzt vom HWS sol­che Ker­nel per Pre­emp­ti­on unter­bro­chen oder mit hoher Prio­ri­tät ein­ge­scho­ben wer­den. Wich­tig wer­den die­se Fähig­kei­ten spe­zi­ell bei VR-Anwen­dun­gen, wo zu gro­ße Laten­zen zwi­schen Ein­ga­be (z. B. Kopf­be­we­gung) und Reak­ti­on der vir­tu­el­len Umge­bung schnell die Prä­senz kaputt machen oder gar zu Übel­keit füh­ren kön­nen.

Damit die GPU vom rela­tiv schma­len 256-Bit-Spei­cher­in­ter­face nicht aus­ge­bremst wird, haben die Inge­nieu­re auch hier eini­ge Stell­schrau­ben ange­packt. Zum einen kön­nen die GDDR5-Chips jetzt mit bis zu 8 Gbps ange­steu­ert wer­den, zum ande­ren kann Pola­ris mit der ver­füg­ba­ren Band­brei­te effi­zi­en­ter umge­hen. Hier­zu wur­de die Effi­zi­enz der ver­lust­frei­en Kom­pri­mie­rung (Del­ta Color Com­pres­si­on, DCC), wel­che erst­mals von “Ton­ga” zum Ein­satz gebracht wur­de, wei­ter ver­bes­sert und Anpas­sun­gen am Gra­fik­trei­ber vor­ge­nom­men. Zusätz­lich hilft der auf 2 MiB ver­grö­ßer­te L2-Cache.

Bei den wei­te­ren Opti­mie­run­gen und Ver­bes­se­run­gen lag das Augen­merk ins­be­son­de­re auf der Unter­stüt­zung von HDR-Dis­plays und neu­en Ver­bin­dungs­stan­dards zur Anbin­dung von 4K- (120 Hz oder 96 Hz bei HDR) und 5K-Dis­plays (60 Hz) mit nur einem ein­zel­nen Kabel. Hier­zu wur­de eine neue Dis­play-Engi­ne ent­wi­ckelt, die Unter­stüt­zung für Dis­play­Port 1.3 HBR3, Dis­play­Port 1.4 HDR und HDMI 2.0b bie­tet. Zudem kann Free­Sync jetzt auch über HDMI 2.0b genutzt wer­den, was gemäß AMD bereits 28 Dis­plays von Acer, LG, Mstar­Se­mi­con­duc­tor, Nova­tek, Real­tek und Sam­sung unter­stüt­zen.

HDR-Dis­plays stel­len einen deut­lich grö­ße­ren Anteil des Farb­spek­trums dar, wel­ches das mensch­li­che Auge wahr­neh­men kann. Die Dis­play Engi­ne von Pola­ris kann nor­ma­le 8-Bit-Farb­bil­der, 10-Bit- und 12-Bit-HDR-Bil­der aus­ge­ben. Für eine opti­ma­le Bild­qua­li­tät wie zur Ver­mei­dung von zusätz­li­chen Laten­zen durch Umwand­lun­gen im Dis­play kann des­sen Kon­fi­gu­ra­ti­on aus­ge­le­sen und berück­sich­tigt wer­den. Über das neue Rade­on Pho­tonS­DK kann bereits die Spie­le-Engi­ne auf die­se Infor­ma­ti­on zugrei­fen, um ein opti­mier­tes Bild zu gene­rie­ren.

Auch die Mul­ti­me­dia-Beschleu­ni­ger von “Pola­ris”, UVD (Uni­fied Video Deco­der) und VCE (Video Coding Engi­ne), wur­den auf­ge­rüs­tet. Die auf­ge­bohr­ten Ein­hei­ten unter­stüt­zen höhe­re Bild­wech­sel­fre­quen­zen und neben H.264 jetzt auch HEVC (H.265) bei Auf­lö­sun­gen von bis zu 4K. Erst­mals kann ein 2-Pass-Enco­ding zur Erhö­hung der Bild­qua­li­tät beim Strea­men ver­wen­det wer­den. Außer­dem beherrscht UVD nun die Deko­die­rung von HDR-Vide­os.

14 nm FinFET und Design-Optimierungen

Auf­grund der immer klei­ne­ren Struk­tur­grö­ßen sind die sta­ti­schen Leck­strö­me zu einem immer grö­ße­ren Pro­blem gewor­den, wel­ches mit Hil­fe von Power Gating, Vol­ta­ge Islands, Back Bias oder ande­ren Tricks bekämpft wur­de, die aber alle einen nega­ti­ven Effekt auf die Per­for­mance haben. Mit dem neu­en soge­nann­ten 14-nm-Fin­FET-Pro­zess konn­ten nicht nur die abso­lu­ten Leck­strö­me, son­dern auch deren Varia­ti­on stark redu­ziert wer­den. Zwi­schen den bes­ten und den schlech­tes­ten Chips aus der Pro­duk­ti­on besteht also kein so gro­ßer Unter­schied bei der für einen feh­ler­frei­en Betrieb not­wen­di­gen Span­nung. Beim Bin­ning muss bei der Span­nung also kein so gro­ßer Puf­fer mehr ein­ge­plant wer­den, was zu einer Ver­rin­ge­rung der Leis­tungs­auf­nah­me führt.

Im Wei­te­ren hat AMD in die Trick­kis­te der APU-Inge­nieu­re gegrif­fen und Adap­ti­ve Clo­cking imple­men­tiert. Hier­durch kann die Span­nung nied­ri­ger gewählt wer­den, weil ein Algo­rith­mus durch Rechen­last ver­ur­sach­te Span­nungs­ab­fäl­le vor­her­sagt, infol­ge­des­sen recht­zei­tig für ein schnel­les Absen­ken der Takt­fre­quenz sorgt. Eine wei­te­re Metho­de, die beim Ein­stel­len eines jeden Chips auf des­sen opti­ma­le Betriebs­pa­ra­me­ter hilft, ist das Adap­ti­ve Vol­ta­ge & Fre­quen­cy Sca­ling (AVFS). Hier­zu wur­den neben den bereits über den gesam­ten Die ver­teil­ten Sen­so­ren für Leis­tungs­auf­nah­me (indi­rekt errech­net über Aus­las­tung) und Tem­pe­ra­tur noch Sen­so­ren zur Detek­ti­on der Fre­quenz ein­ge­baut. Mit­tels Boot Time Power Sup­ply Cali­bra­ti­on (BTC) wird aber­mals eine Varia­ti­on der Span­nung aus dem Spiel genom­men. Vor der Aus­lie­fe­rung wird auf dem Chip eine Span­nungs­ana­ly­se durch­ge­führt; die glei­che Ana­ly­se erfolgt beim Boo­ten des PCs. Zur Ver­mei­dung einer unnö­tig hohen Leis­tungs­auf­nah­me wird das Ergeb­nis aus dem Ver­gleich bei­der Ana­ly­sen zur Anpas­sung der Steu­er­si­gna­le an die Span­nungs­wand­ler ver­wen­det. Auch Alte­rungs­ef­fek­te wer­den durch die Adap­ti­ve Aging Com­pen­sa­ti­on eli­mi­niert, sodass die bis­her vor­ge­se­he­nen 2 bis 3 % Takt­fre­quenz-Puf­fer ent­fal­len kön­nen. Ange­wen­det wur­den noch wei­te­re Design-Knif­fe bei der Aus­le­gung der elek­tri­schen Schal­tun­gen.

Radeon RX 480

Als ers­ter Ver­tre­ter der neu­en Pola­ris-Genera­ti­on geht die Rade­on RX 480 an den Start. Aus­ge­stat­tet ist sie mit 36 CUs, wel­che auf vier Shader Engi­nes mit jeweils eige­nem Geo­me­try Pro­ces­sor sowie Ras­te­ri­zer auf­ge­teilt sind. Ange­trie­ben wer­den die sich somit erge­ben­den 2304 Shader mit einer Takt­fre­quenz von 1120 MHz (Boost bis 1266 MHz), was eine theo­re­ti­sche Rechen­leis­tung von 5,1 bis zu 5,8 TFLOPS ergibt. Über­dies besitzt jede CU vier TMUs, sodass ins­ge­samt 144 ver­baut sind. Das Back-End besteht aus 32 ROPs und acht 32-Bit-Spei­cher­con­trol­lern, die an einem 2 MiB gro­ßen L2-Cache hän­gen. Zur Ver­wal­tung von asyn­chro­nen Gra­fik- und Com­pu­te-Ker­nels ste­hen vier ACE- eben­so wie zwei HWS-Ein­hei­ten zur Ver­fü­gung. Zur Kom­mu­ni­ka­ti­on in Cross­Fire-Gespan­nen wird wei­ter­hin die XDMA-Engi­ne ver­wen­det, sodass kei­ne Cross­Fire-Brü­cken not­wen­dig sind. Über das 256 Bit brei­te Spei­cher­in­ter­face wird der GDDR5 mit 224 GB/s ange­steu­ert. Die “Board Power” gibt AMD mit 150 W an, was sich aus den zuläs­si­gen Maxi­mal­be­las­tun­gen des PCIe-Slots (75 W) und des ein­zel­nen 6-Pin-Ste­ckers (eben­falls 75 W) ergibt.

Für die Posi­tio­nie­rung im Markt wur­de die NVIDIA GeForce GTX 970 als Geg­ner aus­er­ko­ren, den es zu schla­gen gilt. In den AMD-eige­nen Mes­sun­gen gelingt dies auch zumeist. Beim Refe­renz­de­sign wol­len die Desi­gner beson­de­ren Wert auf einen geräusch­ar­men Küh­ler gelegt haben. Nach den Vor­stel­lun­gen von AMD ist die Rade­on RX 480 zu Prei­sen ab 214,20 € (4 GiB RAM) und ab 255,85 € für die Ver­si­on mit einem Spei­cher­aus­bau von 8 GiB ab heu­te ver­füg­bar.

Quel­le: AMD

» Alle Foli­en