AMD stellt neues Spitzenmodell Radeon R9 290X vor

Artikel-Index:

Nach­dem AMD bereits vor zwei Wochen sei­ne ers­ten “neu­en Gra­fik­kar­ten” aus der “Volcanic-Islands”-Serie für das Jahr 2014 vor­ge­stellt hat, folgt heu­te mit der Rade­on R9 290X die ers­te wirk­lich neue Gra­fik­kar­te. Bis auch die abge­speck­te Ver­si­on des neu­en Spit­zen­mo­dells auf Basis der “Hawaii”-GPU ver­füg­bar wird, müs­sen sich inter­es­sier­te Kun­den noch ein wenig län­ger gedul­den. Mit der Rade­on R9 290X will AMD in ers­ter Linie Enthu­si­as­ten mit dem ent­spre­chen­den Geld­beu­tel anspre­chen und bewirbt ins­be­son­de­re die Per­for­mance der neu­en Gra­fik­kar­te unter 4K/UHD-Auf­lö­sun­gen. Als direk­ter Geg­ner wur­de etwas über­ra­schend nicht die NVIDIA GeForce GTX Titan aus­er­ko­ren, son­dern die klei­ne­re GeForce GTX 780, bei der zusätz­li­che Funk­ti­ons­ein­hei­ten der GK100-GPU deak­ti­viert sind. Ver­mut­lich liegt dies am ange­peil­ten Preis­punkt – dazu spä­ter mehr.

Das bis­her vor­ge­stell­te Auf­ge­bot der vul­ka­ni­schen Inseln haben wir in der nach­fol­gen­den Tabel­le zusam­men­ge­stellt. Dabei gilt es zwei Din­ge zu beach­ten: AMD nennt zwecks Ver­ein­heit­li­chung der Kom­mu­ni­ka­ti­on künf­tig kei­ne Basis- und Tur­bo-Takt­fre­quen­zen mehr, was mit der Aus­ge­stal­tung der über­ar­bei­te­ten Power­Tu­ne-Funk­tio­na­li­tät begrün­det wird – dazu spä­ter mehr. Ent­spre­chend garan­tiert AMD nicht, dass die ange­ge­be­nen GPU-Takt­fre­quen­zen in allen Last­sze­na­ri­en dau­er­haft anlie­gen. Wenn Power­Tu­ne ein­greift und den GPU-Takt dros­selt, dann sinkt ent­spre­chend auch die Rechen­leis­tung der Shader und TMUs. Die zwei­te Anmer­kung bezieht sich auf die Anga­ben zur Die-Grö­ße der “Tahiti”-GPU. AMD hat­te hier bis­her 365 mm² genannt. In den neu­en Foli­en tauch­te jetzt bei der Gegen­über­stel­lung von “Tahi­ti” und “Hawaii” aller­dings ein neu­er Wert auf. Die 352 mm² bezie­hen sich laut AMD auf die Die-Flä­che des eigent­li­chen Designs, wes­halb die­ser Wert für einen Ver­gleich der Archi­tek­tu­ren bes­ser geeig­net sei. Die phy­si­sche Grö­ße von “Hawaii” dürf­te dem­nach ober­halb der ange­ge­be­nen 438 mm² lie­gen, da hier noch das Mate­ri­al zwi­schen den ein­zel­nen Dies ein­fließt, was für das Zer­sä­gen der Wafer benö­tigt wird.


Das Power­Tu­ne-Limit für die GPU der Rade­on R9 290X gibt AMD mit 208 W an.

Über die Neue­run­gen hin­sicht­lich Eye­fi­ni­ty und der Unter­stüt­zung von 4K/UHD-Dis­plays haben wir bereits in der News zum Start der klei­ne­ren Model­le Berich­tet. Sel­bi­ges gilt für TrueAu­dio, womit wir uns zudem im Detail beschäf­tigt haben.

Hawaii”-GPU

Die Archi­tek­tur der neu­en “Hawaii”-GPU benennt AMD wei­ter­hin schlicht als Gra­phics Core Next (GCN). Gegen­über der ers­ten Inkar­na­ti­on “Tahi­ti” vor fast zwei Jah­ren hat sich im Detail aber den­noch eini­ges getan, was auch im Block­dia­gramm ersicht­lich wird:

Die offen­kun­digs­te Ände­rung hat AMD hin­sicht­lich der Orga­ni­sa­ti­on der ein­zel­nen Funk­ti­ons­ein­hei­ten vor­ge­nom­men. Shader, TMUs und ROPs sind in soge­nann­ten Shader Engi­nes näher zusam­men­ge­rückt, zwi­schen denen die Arbeits­last auf­ge­teilt wird. Jede die­ser Shader Engi­nes besteht aus einem Geo­me­try Pro­ces­sor, einem Ras­te­ri­zer, elf GCN-Com­pu­te-Units, 44 TMUs und 16 ROPs. Um die Effi­zi­enz des Front-Ends zu erhö­hen, hat AMD die Para­me­ter- und Posi­ti­ons-Caches ver­grö­ßert. Zudem soll die Geo­me­try Shader Per­for­mance höher lie­gen, weil hier­bei jetzt auch auf den LDS zuge­grif­fen wer­den kann, sodass hier­für weni­ger Band­brei­te zum GDDR5 ver­braucht wird. Neben der Ver­dop­pe­lung der Tes­sel­la­to­ren auf jetzt vier soll eine erneu­te Ver­bes­se­rung der Puf­fe­rung im GDDR5 bei beson­ders hohen Tes­sel­la­ti­ons­fak­to­ren für eine höhe­re Tes­sel­la­ti­ons­leis­tung sorgen.

Mit Blick auf die GPG­PU-Leis­tungs­fä­hig­keit der über­ar­bei­te­ten Archi­tek­tur ste­hen jetzt ins­ge­samt acht Asyn­chro­no­us Com­pu­te Engi­nes (ACE) zur Ver­fü­gung, die jeweils acht Queu­es ver­wal­ten kön­nen. Außer­dem will AMD mit den GCN-Shadern jetzt bei bestimm­ten Rechen­ope­ra­tio­nen eine höhe­re Genau­ig­keit errei­chen. Das Ver­hält­nis zwi­schen der theo­re­tisch maxi­mal erziel­ba­ren Rechen­leis­tung mit dop­pel­ter und ein­fa­cher Genau­ig­keit wur­de uns für die Rade­on R9 290X mit einem Ach­tel angegeben.

An der Funk­tio­na­li­tät der Mul­ti­me­dia­ein­hei­ten VCE und UVD gibt es kei­ne Ver­än­de­run­gen gegen­über der Vor­gän­ger­ge­ne­ra­ti­on zu ver­mel­den. Die UVD-Ein­heit auf der “Hawaii”-GPU kann also wei­ter­hin kei­ne 4K-Vide­os dekodieren.

Beson­ders stolz ist der Kon­zern dar­auf, dass trotz der Erhö­hung des Tran­sis­tor-Bud­gets gegen­über “Tahi­ti” um 44 % der Die im gezwun­ge­ner­ma­ßen wei­ter­hin ver­wen­de­ten 28-nm-Pro­zess ledig­lich um 24 % ange­wach­sen ist. Dabei konn­ten 37 % mehr Shader-Ein­hei­ten und TMUs, eine Ver­dop­pe­lung der ROPs und Gra­phics Engi­nes, die Ver­brei­te­rung des Spei­cher­in­ter­faces von 384 auf 512 Bit und zusätz­li­che DSPs für TrueAu­dio auf dem Chip rea­li­siert wer­den. Mög­lich wur­de dies unter ande­rem dadurch, dass das 512-Bit-Spei­cher­in­ter­face 20 % weni­ger Flä­che benö­tigt als das auf höhe­re Fre­quen­zen aus­ge­leg­te 384-Bit-Inter­face von “Tahi­ti”.

Überarbeitetes PowerTune

Bis­her war Power­Tu­ne eher dazu gedacht, Last­spit­zen anhand der Ein­hei­ten­aus­las­tung recht­zei­tig zu erken­nen, um durch geziel­te Dros­se­lung des GPU-Takts eine Über­schrei­tung des defi­nier­ten TDP-Spiel­raum­s/­Power­Tu­ne-Limits zu ver­hin­dern. Mit der Rade­on HD 7970 GHz Edi­ti­on führ­te AMD dann einen soge­nann­ten Tur­bo ein, was aber letzt­lich ein­fach nur ein zusätz­li­cher P‑State mit höhe­rer Takt­fre­quenz und Span­nung ist, der bei Bedarf von Power­Tu­ne ein­ge­bremst wird. AMD nutz­te hier­für den Puf­fer, wel­cher zuvor bei der ori­gi­na­len Rade­on HD 7970 nahe­zu in jeder Spiel­si­tua­ti­on ver­hin­dern soll­te, dass die GPU von Power­Tu­ne gedros­selt wer­den muss. In bei­den Fäl­len arbei­tet Power­Tu­ne unab­hän­gig von äuße­ren Ein­flüs­sen oder spe­zi­fi­schen Gege­ben­hei­ten des jewei­li­gen Sys­tems, in wel­chem die Gra­fik­kar­te ver­baut ist.

Bei der Rade­on R9 290X hat AMD Power­Tu­ne deut­lich über­ar­bei­tet, was auch Aus­wir­kun­gen auf Steue­rung von Takt und Span­nung für die GPU hat. Fort­an wer­den näm­lich nur noch ein obe­rer und ein unte­rer P‑State defi­niert. Einen garan­tier­ten Basistakt gibt es nicht. In Abhän­gig­keit von der anlie­gen­den Rechen­last wählt die GPU selb­stän­dig eine pas­sen­de Kom­bi­na­ti­on aus Takt­fre­quenz und Span­nung zwi­schen den defi­nier­ten Betriebs­punk­ten. Ermög­licht wird dies durch das neue Inter­face zum Con­trol­ler der Span­nungs­wand­ler (SVI2), wel­ches bereits für die FM2-APUs zum Ein­satz kommt. Hier­durch ist eine Anpas­sung der Span­nung inner­halb von ~10 μs in 255 Schrit­ten von 6,25 mV zwi­schen 0,00 und 1,55 V mög­lich. Die sehr schnel­len Span­nungs­wech­sel las­sen sich rea­li­sie­ren, weil der Con­trol­ler über das SVI2-Inter­face auch Tele­me­trie-Daten bezüg­lich Span­nung und Strom­stär­ke mit hoher Geschwin­dig­keit (40kHz Sam­pling, 20 Mbps Band­brei­te) an die GPU zurück­sen­det. Die GPU muss also nicht eine defi­nier­te Zeit­span­ne abwar­ten, son­dern bekommt ein Signal, wenn die ange­for­der­te Span­nung anliegt.

Das auf­ge­bohr­te Power­Tu­ne schätzt wei­ter­hin die Leis­tungs­auf­nah­me auf Basis der Ein­hei­ten­aus­las­tung ab, bezieht aber zusätz­lich die Mess­da­ten vom SVI2-Inter­face für Span­nung und Strom­stär­ke mit ein. Zusätz­lich wer­den die Daten der über den Die ver­teil­ten Tem­pe­ra­tur­sen­so­ren ver­ar­bei­tet. Auf Basis die­ser Daten, der anlie­gen­den Rechen­last und der defi­nier­ten Limits für die Leis­tungs­auf­nah­me, Tem­pe­ra­tur und Lüf­ter­ge­schwin­dig­keit legt Power­Tu­ne dann dyna­misch die GPU-Takt­fre­quenz sowie zuge­hö­ri­ge Span­nung fest, um die höchst­mög­li­che Per­for­mance zu erzielen.

Eine Tem­pe­ra­tur­li­mi­tie­rung, wie sie bei NVI­DI­As GeForce GTX Titan bei Stan­dard­ein­stel­lun­gen zu beob­ach­ten ist, soll­te wenn über­haupt nicht so stark aus­ge­prägt sein, weil AMD hier stan­dard­mä­ßig 95 °C fest­ge­legt hat. Dies ist angeb­lich auch der Wert, bei dem älte­re Model­le ther­misch bedingt dros­seln. Update: Das Stu­di­um der bis­her ver­öf­fent­lich­ten Arti­kel (z. B. HT4U) zeigt auf, dass wir hier einer Fehl­ein­schät­zung unter­la­gen. Die Rade­on R9 290X scheint gera­de­zu dar­auf opti­miert zu sein, bei 95 °C betrie­ben zu wer­den. Limi­tie­rend wirkt zwar in der Tat nicht direkt die Tem­pe­ra­tur, aber indi­rekt über die Begren­zung der maxi­ma­len Lüfterdrehzahl.

Zusam­men mit Power­Tu­ne wur­den auch die zuge­hö­ri­gen Reg­ler im AMD-Over­Dri­ve-Menü des CCC über­ar­bei­tet. Um den Zusam­men­hang zwi­schen Takt­fre­quenz, Power-Limit und abzu­füh­ren­der Wär­me bes­ser zu ver­deut­li­chen, wur­den die Reg­ler für die GPU-Takt­fre­quenz und das Power­Tu­ne-Limit in einem zwei­di­men­sio­na­len Dia­gramm zusam­men­ge­fasst. Hier kann der gewünsch­te Betriebs­punkt frei gewählt wer­den, wobei die farb­li­che Unter­le­gung die Grö­ßen­ord­nung der abzu­füh­ren­den Wär­me­men­ge ver­deut­licht. Zusätz­lich kön­nen Besit­zer einer Rade­on R9 290X das Tem­pe­ra­tur- und Lüf­ter­dreh­zahl-Limit den eige­nen Wün­schen ent­spre­chend kon­fi­gu­rie­ren. Am bekann­ten Schie­be­reg­ler für die Takt­fre­quenz, mit der der GDDR5 ange­steu­ert wird, hat sich nichts verändert.

AMD will zudem dafür gesorgt haben, dass der Lüf­ter kei­ne sprung­haf­ten Dreh­zahl­än­de­run­gen vor­nimmt, son­dern mög­lichst gleich­mä­ßi­ge Übergänge.

Mit Hil­fe des BIOS-Schal­ter kann zusätz­lich zwi­schen dem “Quiet Mode” und “Uber Mode” gewählt wer­den Aller­dings erschließt sich uns hier ange­sichts der viel­fäl­ti­gen Ein­stel­lungs­mög­lich­kei­ten im CCC nicht so recht der Sinn. Denn laut AMD ist der ein­zi­ge Unter­schied zwi­schen bei­den BIOS-Schal­ter­po­si­tio­nen das Lüf­ter­dreh­zahl­li­mit, was offen­bar im “Quiet Mode” bei 40 % liegt. Die höchst­mög­li­che Per­for­mance ist dem­nach im “Uber Mode” (Limit: 55 %) erziel­bar, was ins­be­son­de­re bei schlecht belüf­te­ten Gehäu­sen oder in Cross­Fi­re-Kon­fi­gu­ra­tio­nen signi­fi­kant ins Gewicht fal­len kann.

Update: Bei­spiels­wei­se der Test von Com­pu­ter­Ba­se zeigt auf, dass die dyna­mi­sche GPU-Takt­ra­te im “Quiet Mode” in der Regel zwi­schen 800 und 900 MHz liegt und nur im “Uber Mode” nahe­zu durch­ge­hend die 1.000 MHz gehal­ten wer­den können.

Update 2: Dem gegen­über zei­gen die Mes­sun­gen von Anand­Tech höhe­re durch­schnitt­li­che Takt­fre­quen­zen im “Quiet Mode”. Hier liegt im Schnitt ein Takt ober­halb von 900 MHz an. Die unter­schied­li­chen Ergeb­nis­se zei­gen auf, wie stark die Per­for­mance der Rade­on R9 290X von einem gut gekühl­ten Gehäu­se abhän­gig ist.

CrossFire via XDMA

Beim The­ma Cross­Fi­re geht AMD neue Wege. Die jün­ge­ren GPUs “Hawaii” und “Bon­aire” ver­fü­gen über eine XDMA getauf­te Funk­ti­ons­ein­heit, die für einen geord­ne­ten, direk­ten Daten­aus­tausch zwi­schen den GPUs eines Cross­Fi­re-Gespanns über den PCIe-Bus sor­gen soll. Dafür fal­len die bis­her not­wen­di­gen Cross­Fi­re-Brü­cken weg. XDMA ist laut AMD die Abkür­zung für AMD Cross­Fi­re Direct Memo­ry Access.

Von AMD wur­de uns die Funk­tio­na­li­tät wie folgt beschrie­ben: XDMA nutzt Spei­cher­di­rekt­zu­grif­fe (Direct Memo­ry Access), über die die zwei­te (und ggf. drit­te und vier­te) GPU ihre fer­tig berech­ne­ten Bild­da­ten direkt an einen klei­nen Spei­cher­be­reich im Dis­play-Block der pri­mä­ren GPU sen­det. Die­se Daten wer­den dann von der Dis­play-Engi­ne gele­sen und an die Bild­schir­me aus­ge­ge­ben. All dies geschieht ohne Inter­ak­ti­on mit der CPU oder unnö­ti­ges Umher­ko­pie­ren zwi­schen den GPUs und dem Arbeitsspeicher.

Die neue XDMA-Tech­no­lo­gie soll gegen­über der Ver­wen­dung von Cross­Fi­re-Brü­cken kei­ne Nach­tei­le hin­sicht­lich der Ska­lie­rung haben. Auf unse­re Nach­fra­ge hin zeig­te sich AMD gar zuver­sicht­lich, dass selbst bei Kon­fi­gu­ra­tio­nen mit vier GPUs, die per PCIe 2.0 x8 ange­bun­den sind, die vol­le Per­for­mance erreicht wird. AMD gibt sogar an, die­se Tech­no­lo­gie sei im spe­zi­el­len für 4K/UHD-Auf­lö­sun­gen und die Mul­ti-Moni­tor-Tech­no­lo­gie Eye­fi­ni­ty ent­wi­ckelt wor­den. Außer­dem soll es wohl Vor­tei­le beim Frame Pacing bringen.

Lei­der konn­te uns AMD vor Redak­ti­ons­schluss noch kei­nen fina­len Euro-Preis für Deutsch­land nen­nen. Ange­peilt sind aber offen­bar ca. 475,- Euro, was gegen­über den Kon­kur­renz­pro­duk­ten von NVIDIA ein ech­ter Kampf­preis ist. Ob Man­t­le oder TrueAu­dio zusätz­li­che Kauf­ar­gu­men­te sind, kann der­zeit schlicht nicht bewer­tet wer­den. Für ers­te­res ist bis­her offi­zi­ell nur ein ent­spre­chen­der Batt­le­field-4-Patch im Dezem­ber die­sen Jah­res ange­kün­digt und TrueAu­dio nut­zen vor­aus­sicht­lich erst im nächs­ten Jahr die ers­ten Spie­le. Laut AMD sol­len die Rade­on R9 290X bereits ab heu­te ver­füg­bar sein. Wie es mit der Ver­füg­bar­keit aus­sieht, bleibt aber natür­lich abzuwarten.