AMD stellt Mainstream-Grafikkarte Radeon RX 480 mit Polaris-Architektur vor

Artikel-Index:

Nach einer l채n짯ge짯ren Durst짯stre짯cke will AMD im Gra짯fik짯kar짯ten-Markt wie짯der durch짯star짯ten. Ent짯ge짯gen der sonst 체bli짯chen Stra짯te짯gie erfolgt der Angriff nicht vom High-End aus, son짯dern im volu짯men짯tr채ch짯ti짯gen Main짯stream. Hier griff AMD zuletzt inner짯halb der Rade짯on-Rx-300-Serie auf zum Teil doch recht betag짯te GPUs (z. B. 쏱it짯cairn) zur체ck. In die짯sem Gra짯fik짯kar짯ten-Markt짯seg짯ment mit Prei짯sen von 100 bis 300 US-Dol짯lar will man jetzt mit den bei짯den neu짯en 쏛rc짯tic Islands-GPUs 쏱ola짯ris 10 und 쏱ola짯ris 11 ver짯lo짯ren gegan짯ge짯ne Markt짯an짯tei짯le zur체ck짯er짯obern und wie짯der in die Erfolgs짯spur fin짯den. Neben Opti짯mie짯run짯gen auf Sei짯ten der zugrun짯de lie짯gen짯den GCN-GPU-Archi짯tek짯tur hilft hier짯bei, dass mit dem soge짯nann짯ten 14-nm-Fin짯FET-Pro짯zess von Sam짯sung und Glo짯bal짯Found짯ries end짯lich eine neue Fer짯ti짯gung mit klei짯ne짯ren Struk짯tur짯gr철짯횩en zur Ver짯f체짯gung steht. Hier짯durch k철n짯nen gegen짯체ber dem bis짯he짯ri짯gen soge짯nann짯ten 28-nm-Pro짯zess nicht nur mehr Tran짯sis짯to짯ren auf glei짯cher Die-Fl채짯che unter짯ge짯bracht wer짯den, son짯dern kann auch deren Leis짯tungs짯auf짯nah짯me deut짯lich redu짯ziert werden.

Wie schon auf der GDC 2016 ange짯k체n짯digt will AMD beim The짯ma Vir짯tu짯al Rea짯li짯ty wei짯ter짯hin voll auf Angriff set짯zen. Die heu짯te vor짯ge짯stell짯te Rade짯on RX 480 auf Basis der 쏱olaris-10-GPU, die in der Ent짯wick짯lungs짯pha짯se mit 쏣lles짯me짯re bezeich짯net wur짯de, soll den Ein짯stiegs짯preis f체r Vir짯tu짯al-Rea짯li짯ty-f채hi짯ge Sys짯te짯me signi짯fi짯kant her짯ab짯set짯zen und so die neue Tech짯no짯lo짯gie einem brei짯te짯ren Markt zug채ng짯lich machen. F체r Anbie짯ter ent짯spre짯chen짯der Inhal짯te ver짯gr철짯횩ert sich ent짯spre짯chend der adres짯sier짯ba짯re Markt. AMD hofft hier auf Syn짯er짯gie짯ef짯fek짯te. Mehr Con짯tent erh철ht die Nach짯fra짯ge nach dedi짯zier짯ten Gra짯fik짯kar짯ten und umge짯kehrt. Aber auch f체r den nach wie vor gr철횩짯ten Anteil unter den PC-Spie짯lern, die laut Steam-Sta짯tis짯tik typi짯scher짯wei짯se einen ein짯zel짯nen Moni짯tor mit einer Auf짯l철짯sung von 1080p nut짯zen, bringt 쏱ola짯ris eini짯ge inter짯es짯san짯te Neuerungen.

Zu einem sp채짯te짯ren Zeit짯punkt fol짯gen die Rade짯on RX 470 (teil짯de짯ak짯ti짯vier짯te 쏱ola짯ris 10) und Rade짯on RX 460 (쏱ola짯ris 11). Den nach짯fol짯gen짯den Foli짯en sind nur ein paar Infor짯ma짯ti짯ons짯h채pp짯chen zu ent짯neh짯men. Bei 쏱ola짯ris 11 ist AMD zudem auf die gegen짯체ber 쏝on짯aire von 1,9 mm auf 1,5 mm ver짯rin짯ger짯te H철he des Chips stolz, was wegen der dar짯auf basie짯ren짯den mobi짯len L철sun짯gen f체r Note짯books von Inter짯es짯se sein d체rfte.

Polaris-Architektur

Bei 쏱ola짯ris han짯delt es sich aber짯mals um kei짯ne von Grund auf neu ent짯wi짯ckel짯te GPU-Archi짯tek짯tur. AMD setzt statt짯des짯sen auf eine kon짯ti짯nu짯ier짯li짯che Wei짯ter짯ent짯wick짯lung der bekann짯ten Archi짯tek짯tur Gra짯phics Core Next (GCN), die in AMDs Z채h짯lung nun짯mehr ihre vier짯te Aus짯bau짯stu짯fe erreicht hat.

Aus den ein짯zel짯nen Rechen짯ein짯hei짯ten (CUs) konn짯te durch Detail짯ver짯bes짯se짯run짯gen (ver짯bes짯ser짯ter Pre짯fetch f체r Befeh짯le, gr철짯횩e짯re Befehls짯puf짯fer, ver짯bes짯ser짯te Nut짯zung des L2-Caches) eine um bis zu 15 % h철he짯re Leis짯tung her짯aus짯ge짯kit짯zelt wer짯den. Au횩er짯dem k철n짯nen jetzt auch die CUs der dedi짯zier짯ten GPUs nativ Berech짯nun짯gen in den Daten짯for짯ma짯ten FP16 und Int16 mit redu짯zier짯ter Genau짯ig짯keit durch짯f체h짯ren, was f체r bestimm짯te Algo짯rith짯men v철l짯lig aus짯rei짯chend ist, dar짯체ber hin짯aus bei der Redu짯zie짯rung der Leis짯tungs짯auf짯nah짯me hel짯fen kann. Bis짯her war die짯se Funk짯tio짯na짯li짯t채t den GPUs in AMDs 쏞arrizo-APUs vor짯be짯hal짯ten. Im Rah짯men von GPUO짯pen bie짯tet AMD Ent짯wick짯lern f체r DirectX 11, DirectX 12 und Vul짯kan pas짯sen짯de Schnitt짯stel짯len an, um spe짯zi짯el짯le Funk짯tio짯nen der eige짯nen Hard짯ware ver짯wen짯den zu k철n짯nen. Au횩er짯dem wur짯den aber짯mals die Geo짯me짯trie짯be짯rech짯nun짯gen opti짯miert und die Tes짯sel짯la짯ti짯ons짯leis짯tung erh철ht.

Mit짯tels der neu hin짯zu짯ge짯kom짯me짯nen HWS-Ein짯hei짯ten (Hard짯ware Sche짯du짯ler) wer짯den die GPUs bei der asyn짯chro짯nen Abar짯bei짯tung von Rechen짯auf짯ga짯ben noch fle짯xi짯bler. Zus채tz짯lich zur bis짯her schon m철g짯li짯chen par짯al짯le짯len Abar짯bei짯tung von Gra짯fik- sowie Com짯pu짯te-Ker짯nels k철n짯nen jetzt vom HWS sol짯che Ker짯nel per Pre짯emp짯ti짯on unter짯bro짯chen oder mit hoher Prio짯ri짯t채t ein짯ge짯scho짯ben wer짯den. Wich짯tig wer짯den die짯se F채hig짯kei짯ten spe짯zi짯ell bei VR-Anwen짯dun짯gen, wo zu gro짯횩e Laten짯zen zwi짯schen Ein짯ga짯be (z. B. Kopf짯be짯we짯gung) und Reak짯ti짯on der vir짯tu짯el짯len Umge짯bung schnell die Pr채짯senz kaputt machen oder gar zu 횥bel짯keit f체h짯ren k철nnen.

Damit die GPU vom rela짯tiv schma짯len 256-Bit-Spei짯cher짯in짯ter짯face nicht aus짯ge짯bremst wird, haben die Inge짯nieu짯re auch hier eini짯ge Stell짯schrau짯ben ange짯packt. Zum einen k철n짯nen die GDDR5-Chips jetzt mit bis zu 8 Gbps ange짯steu짯ert wer짯den, zum ande짯ren kann Pola짯ris mit der ver짯f체g짯ba짯ren Band짯brei짯te effi짯zi짯en짯ter umge짯hen. Hier짯zu wur짯de die Effi짯zi짯enz der ver짯lust짯frei짯en Kom짯pri짯mie짯rung (Del짯ta Color Com짯pres짯si짯on, DCC), wel짯che erst짯mals von 쏷on짯ga zum Ein짯satz gebracht wur짯de, wei짯ter ver짯bes짯sert und Anpas짯sun짯gen am Gra짯fik짯trei짯ber vor짯ge짯nom짯men. Zus채tz짯lich hilft der auf 2 MiB ver짯gr철짯횩er짯te L2-Cache.

Bei den wei짯te짯ren Opti짯mie짯run짯gen und Ver짯bes짯se짯run짯gen lag das Augen짯merk ins짯be짯son짯de짯re auf der Unter짯st체t짯zung von HDR-Dis짯plays und neu짯en Ver짯bin짯dungs짯stan짯dards zur Anbin짯dung von 4K- (120 Hz oder 96 Hz bei HDR) und 5K-Dis짯plays (60 Hz) mit nur einem ein짯zel짯nen Kabel. Hier짯zu wur짯de eine neue Dis짯play-Engi짯ne ent짯wi짯ckelt, die Unter짯st체t짯zung f체r Dis짯play짯Po짯rt 1.3 HBR3, Dis짯play짯Po짯rt 1.4 HDR und HDMI 2.0b bie짯tet. Zudem kann Free짯Sync jetzt auch 체ber HDMI 2.0b genutzt wer짯den, was gem채횩 AMD bereits 28 Dis짯plays von Acer, LG, Mstar짯Se짯mi짯con짯duc짯tor, Nova짯tek, Real짯tek und Sam짯sung unterst체tzen.

HDR-Dis짯plays stel짯len einen deut짯lich gr철짯횩e짯ren Anteil des Farb짯spek짯trums dar, wel짯ches das mensch짯li짯che Auge wahr짯neh짯men kann. Die Dis짯play Engi짯ne von Pola짯ris kann nor짯ma짯le 8멊it-Farb짯bil짯der, 10-Bit- und 12-Bit-HDR-Bil짯der aus짯ge짯ben. F체r eine opti짯ma짯le Bild짯qua짯li짯t채t wie zur Ver짯mei짯dung von zus채tz짯li짯chen Laten짯zen durch Umwand짯lun짯gen im Dis짯play kann des짯sen Kon짯fi짯gu짯ra짯ti짯on aus짯ge짯le짯sen und ber체ck짯sich짯tigt wer짯den. 횥ber das neue Rade짯on Pho짯tonSDK kann bereits die Spie짯le-Engi짯ne auf die짯se Infor짯ma짯ti짯on zugrei짯fen, um ein opti짯mier짯tes Bild zu generieren.

Auch die Mul짯ti짯me짯dia-Beschleu짯ni짯ger von 쏱ola짯ris, UVD (Uni짯fied Video Deco짯der) und VCE (Video Coding Engi짯ne), wur짯den auf짯ge짯r체s짯tet. Die auf짯ge짯bohr짯ten Ein짯hei짯ten unter짯st체t짯zen h철he짯re Bild짯wech짯sel짯fre짯quen짯zen und neben H.264 jetzt auch HEVC (H.265) bei Auf짯l철짯sun짯gen von bis zu 4K. Erst짯mals kann ein 2멠ass-Enco짯ding zur Erh철짯hung der Bild짯qua짯li짯t채t beim Strea짯men ver짯wen짯det wer짯den. Au횩er짯dem beherrscht UVD nun die Deko짯die짯rung von HDR-Videos.

14 nm FinFET und Design-Optimierungen

Auf짯grund der immer klei짯ne짯ren Struk짯tur짯gr철짯횩en sind die sta짯ti짯schen Leck짯str철짯me zu einem immer gr철짯횩e짯ren Pro짯blem gewor짯den, wel짯ches mit Hil짯fe von Power Gating, Vol짯ta짯ge Islands, Back Bias oder ande짯ren Tricks bek채mpft wur짯de, die aber alle einen nega짯ti짯ven Effekt auf die Per짯for짯mance haben. Mit dem neu짯en soge짯nann짯ten 14-nm-Fin짯FET-Pro짯zess konn짯ten nicht nur die abso짯lu짯ten Leck짯str철짯me, son짯dern auch deren Varia짯ti짯on stark redu짯ziert wer짯den. Zwi짯schen den bes짯ten und den schlech짯tes짯ten Chips aus der Pro짯duk짯ti짯on besteht also kein so gro짯횩er Unter짯schied bei der f체r einen feh짯ler짯frei짯en Betrieb not짯wen짯di짯gen Span짯nung. Beim Bin짯ning muss bei der Span짯nung also kein so gro짯횩er Puf짯fer mehr ein짯ge짯plant wer짯den, was zu einer Ver짯rin짯ge짯rung der Leis짯tungs짯auf짯nah짯me f체hrt.

Im Wei짯te짯ren hat AMD in die Trick짯kis짯te der APU-Inge짯nieu짯re gegrif짯fen und Adap짯ti짯ve Clo짯cking imple짯men짯tiert. Hier짯durch kann die Span짯nung nied짯ri짯ger gew채hlt wer짯den, weil ein Algo짯rith짯mus durch Rechen짯last ver짯ur짯sach짯te Span짯nungs짯ab짯f채l짯le vor짯her짯sagt, infol짯ge짯des짯sen recht짯zei짯tig f체r ein schnel짯les Absen짯ken der Takt짯fre짯quenz sorgt. Eine wei짯te짯re Metho짯de, die beim Ein짯stel짯len eines jeden Chips auf des짯sen opti짯ma짯le Betriebs짯pa짯ra짯me짯ter hilft, ist das Adap짯ti짯ve Vol짯ta짯ge & Fre짯quen짯cy Sca짯ling (AVFS). Hier짯zu wur짯den neben den bereits 체ber den gesam짯ten Die ver짯teil짯ten Sen짯so짯ren f체r Leis짯tungs짯auf짯nah짯me (indi짯rekt errech짯net 체ber Aus짯las짯tung) und Tem짯pe짯ra짯tur noch Sen짯so짯ren zur Detek짯ti짯on der Fre짯quenz ein짯ge짯baut. Mit짯tels Boot Time Power Sup짯p짯ly Cali짯bra짯ti짯on (BTC) wird aber짯mals eine Varia짯ti짯on der Span짯nung aus dem Spiel genom짯men. Vor der Aus짯lie짯fe짯rung wird auf dem Chip eine Span짯nungs짯ana짯ly짯se durch짯ge짯f체hrt; die glei짯che Ana짯ly짯se erfolgt beim Boo짯ten des PCs. Zur Ver짯mei짯dung einer unn철짯tig hohen Leis짯tungs짯auf짯nah짯me wird das Ergeb짯nis aus dem Ver짯gleich bei짯der Ana짯ly짯sen zur Anpas짯sung der Steu짯er짯si짯gna짯le an die Span짯nungs짯wand짯ler ver짯wen짯det. Auch Alte짯rungs짯ef짯fek짯te wer짯den durch die Adap짯ti짯ve Aging Com짯pen짯sa짯ti짯on eli짯mi짯niert, sodass die bis짯her vor짯ge짯se짯he짯nen 2 bis 3 % Takt짯fre짯quenz-Puf짯fer ent짯fal짯len k철n짯nen. Ange짯wen짯det wur짯den noch wei짯te짯re Design-Knif짯fe bei der Aus짯le짯gung der elek짯tri짯schen Schaltungen.

Radeon RX 480

Als ers짯ter Ver짯tre짯ter der neu짯en Pola짯ris-Gene짯ra짯ti짯on geht die Rade짯on RX 480 an den Start. Aus짯ge짯stat짯tet ist sie mit 36 CUs, wel짯che auf vier Shader Engi짯nes mit jeweils eige짯nem Geo짯me짯try Pro짯ces짯sor sowie Ras짯te짯ri짯zer auf짯ge짯teilt sind. Ange짯trie짯ben wer짯den die sich somit erge짯ben짯den 2304 Shader mit einer Takt짯fre짯quenz von 1120 MHz (Boost bis 1266 MHz), was eine theo짯re짯ti짯sche Rechen짯leis짯tung von 5,1 bis zu 5,8 TFLOPS ergibt. 횥ber짯dies besitzt jede CU vier TMUs, sodass ins짯ge짯samt 144 ver짯baut sind. Das Back-End besteht aus 32 ROPs und acht 32-Bit-Spei짯cher짯con짯trol짯lern, die an einem 2 MiB gro짯횩en L2-Cache h채n짯gen. Zur Ver짯wal짯tung von asyn짯chro짯nen Gra짯fik- und Com짯pu짯te-Ker짯nels ste짯hen vier ACE- eben짯so wie zwei HWS-Ein짯hei짯ten zur Ver짯f체짯gung. Zur Kom짯mu짯ni짯ka짯ti짯on in Cross짯Fi짯re-Gespan짯nen wird wei짯ter짯hin die XDMA-Engi짯ne ver짯wen짯det, sodass kei짯ne Cross짯Fi짯re-Br체짯cken not짯wen짯dig sind. 횥ber das 256 Bit brei짯te Spei짯cher짯in짯ter짯face wird der GDDR5 mit 224 GB/s ange짯steu짯ert. Die 쏝oard Power gibt AMD mit 150 W an, was sich aus den zul채s짯si짯gen Maxi짯mal짯be짯las짯tun짯gen des PCIe-Slots (75 W) und des ein짯zel짯nen 6멠in-Ste짯ckers (eben짯falls 75 W) ergibt.

F체r die Posi짯tio짯nie짯rung im Markt wur짯de die NVIDIA GeForce GTX 970 als Geg짯ner aus짯er짯ko짯ren, den es zu schla짯gen gilt. In den AMD-eige짯nen Mes짯sun짯gen gelingt dies auch zumeist. Beim Refe짯renz짯de짯sign wol짯len die Desi짯gner beson짯de짯ren Wert auf einen ger채usch짯ar짯men K체h짯ler gelegt haben. Nach den Vor짯stel짯lun짯gen von AMD ist die Rade짯on RX 480 zu Prei짯sen ab 214,20 궗 (4 GiB RAM) und ab 255,85 궗 f체r die Ver짯si짯on mit einem Spei짯cher짯aus짯bau von 8 GiB ab heu짯te verf체gbar.

Quel짯le: AMD