AMD stellt neues Spitzenmodell Radeon R9 290X vor
Nachdem AMD bereits vor zwei Wochen seine ersten “neuen Grafikkarten” aus der “Volcanic-Islands”-Serie für das Jahr 2014 vorgestellt hat, folgt heute mit der Radeon R9 290X die erste wirklich neue Grafikkarte. Bis auch die abgespeckte Version des neuen Spitzenmodells auf Basis der “Hawaii”-GPU verfügbar wird, müssen sich interessierte Kunden noch ein wenig länger gedulden. Mit der Radeon R9 290X will AMD in erster Linie Enthusiasten mit dem entsprechenden Geldbeutel ansprechen und bewirbt insbesondere die Performance der neuen Grafikkarte unter 4K/UHD-Auflösungen. Als direkter Gegner wurde etwas überraschend nicht die NVIDIA GeForce GTX Titan auserkoren, sondern die kleinere GeForce GTX 780, bei der zusätzliche Funktionseinheiten der GK100-GPU deaktiviert sind. Vermutlich liegt dies am angepeilten Preispunkt – dazu später mehr.
Das bisher vorgestellte Aufgebot der vulkanischen Inseln haben wir in der nachfolgenden Tabelle zusammengestellt. Dabei gilt es zwei Dinge zu beachten: AMD nennt zwecks Vereinheitlichung der Kommunikation künftig keine Basis- und Turbo-Taktfrequenzen mehr, was mit der Ausgestaltung der überarbeiteten PowerTune-Funktionalität begründet wird – dazu später mehr. Entsprechend garantiert AMD nicht, dass die angegebenen GPU-Taktfrequenzen in allen Lastszenarien dauerhaft anliegen. Wenn PowerTune eingreift und den GPU-Takt drosselt, dann sinkt entsprechend auch die Rechenleistung der Shader und TMUs. Die zweite Anmerkung bezieht sich auf die Angaben zur Die-Größe der “Tahiti”-GPU. AMD hatte hier bisher 365 mm² genannt. In den neuen Folien tauchte jetzt bei der Gegenüberstellung von “Tahiti” und “Hawaii” allerdings ein neuer Wert auf. Die 352 mm² beziehen sich laut AMD auf die Die-Fläche des eigentlichen Designs, weshalb dieser Wert für einen Vergleich der Architekturen besser geeignet sei. Die physische Größe von “Hawaii” dürfte demnach oberhalb der angegebenen 438 mm² liegen, da hier noch das Material zwischen den einzelnen Dies einfließt, was für das Zersägen der Wafer benötigt wird.
Das PowerTune-Limit für die GPU der Radeon R9 290X gibt AMD mit 208 W an.
Über die Neuerungen hinsichtlich Eyefinity und der Unterstützung von 4K/UHD-Displays haben wir bereits in der News zum Start der kleineren Modelle Berichtet. Selbiges gilt für TrueAudio, womit wir uns zudem im Detail beschäftigt haben.
“Hawaii”-GPU
Die Architektur der neuen “Hawaii”-GPU benennt AMD weiterhin schlicht als Graphics Core Next (GCN). Gegenüber der ersten Inkarnation “Tahiti” vor fast zwei Jahren hat sich im Detail aber dennoch einiges getan, was auch im Blockdiagramm ersichtlich wird:
Die offenkundigste Änderung hat AMD hinsichtlich der Organisation der einzelnen Funktionseinheiten vorgenommen. Shader, TMUs und ROPs sind in sogenannten Shader Engines näher zusammengerückt, zwischen denen die Arbeitslast aufgeteilt wird. Jede dieser Shader Engines besteht aus einem Geometry Processor, einem Rasterizer, elf GCN-Compute-Units, 44 TMUs und 16 ROPs. Um die Effizienz des Front-Ends zu erhöhen, hat AMD die Parameter- und Positions-Caches vergrößert. Zudem soll die Geometry Shader Performance höher liegen, weil hierbei jetzt auch auf den LDS zugegriffen werden kann, sodass hierfür weniger Bandbreite zum GDDR5 verbraucht wird. Neben der Verdoppelung der Tessellatoren auf jetzt vier soll eine erneute Verbesserung der Pufferung im GDDR5 bei besonders hohen Tessellationsfaktoren für eine höhere Tessellationsleistung sorgen.
Mit Blick auf die GPGPU-Leistungsfähigkeit der überarbeiteten Architektur stehen jetzt insgesamt acht Asynchronous Compute Engines (ACE) zur Verfügung, die jeweils acht Queues verwalten können. Außerdem will AMD mit den GCN-Shadern jetzt bei bestimmten Rechenoperationen eine höhere Genauigkeit erreichen. Das Verhältnis zwischen der theoretisch maximal erzielbaren Rechenleistung mit doppelter und einfacher Genauigkeit wurde uns für die Radeon R9 290X mit einem Achtel angegeben.
An der Funktionalität der Multimediaeinheiten VCE und UVD gibt es keine Veränderungen gegenüber der Vorgängergeneration zu vermelden. Die UVD-Einheit auf der “Hawaii”-GPU kann also weiterhin keine 4K-Videos dekodieren.
Besonders stolz ist der Konzern darauf, dass trotz der Erhöhung des Transistor-Budgets gegenüber “Tahiti” um 44 % der Die im gezwungenermaßen weiterhin verwendeten 28-nm-Prozess lediglich um 24 % angewachsen ist. Dabei konnten 37 % mehr Shader-Einheiten und TMUs, eine Verdoppelung der ROPs und Graphics Engines, die Verbreiterung des Speicherinterfaces von 384 auf 512 Bit und zusätzliche DSPs für TrueAudio auf dem Chip realisiert werden. Möglich wurde dies unter anderem dadurch, dass das 512-Bit-Speicherinterface 20 % weniger Fläche benötigt als das auf höhere Frequenzen ausgelegte 384-Bit-Interface von “Tahiti”.
Überarbeitetes PowerTune
Bisher war PowerTune eher dazu gedacht, Lastspitzen anhand der Einheitenauslastung rechtzeitig zu erkennen, um durch gezielte Drosselung des GPU-Takts eine Überschreitung des definierten TDP-Spielraums/PowerTune-Limits zu verhindern. Mit der Radeon HD 7970 GHz Edition führte AMD dann einen sogenannten Turbo ein, was aber letztlich einfach nur ein zusätzlicher P‑State mit höherer Taktfrequenz und Spannung ist, der bei Bedarf von PowerTune eingebremst wird. AMD nutzte hierfür den Puffer, welcher zuvor bei der originalen Radeon HD 7970 nahezu in jeder Spielsituation verhindern sollte, dass die GPU von PowerTune gedrosselt werden muss. In beiden Fällen arbeitet PowerTune unabhängig von äußeren Einflüssen oder spezifischen Gegebenheiten des jeweiligen Systems, in welchem die Grafikkarte verbaut ist.
Bei der Radeon R9 290X hat AMD PowerTune deutlich überarbeitet, was auch Auswirkungen auf Steuerung von Takt und Spannung für die GPU hat. Fortan werden nämlich nur noch ein oberer und ein unterer P‑State definiert. Einen garantierten Basistakt gibt es nicht. In Abhängigkeit von der anliegenden Rechenlast wählt die GPU selbständig eine passende Kombination aus Taktfrequenz und Spannung zwischen den definierten Betriebspunkten. Ermöglicht wird dies durch das neue Interface zum Controller der Spannungswandler (SVI2), welches bereits für die FM2-APUs zum Einsatz kommt. Hierdurch ist eine Anpassung der Spannung innerhalb von ~10 μs in 255 Schritten von 6,25 mV zwischen 0,00 und 1,55 V möglich. Die sehr schnellen Spannungswechsel lassen sich realisieren, weil der Controller über das SVI2-Interface auch Telemetrie-Daten bezüglich Spannung und Stromstärke mit hoher Geschwindigkeit (40kHz Sampling, 20 Mbps Bandbreite) an die GPU zurücksendet. Die GPU muss also nicht eine definierte Zeitspanne abwarten, sondern bekommt ein Signal, wenn die angeforderte Spannung anliegt.
Das aufgebohrte PowerTune schätzt weiterhin die Leistungsaufnahme auf Basis der Einheitenauslastung ab, bezieht aber zusätzlich die Messdaten vom SVI2-Interface für Spannung und Stromstärke mit ein. Zusätzlich werden die Daten der über den Die verteilten Temperatursensoren verarbeitet. Auf Basis dieser Daten, der anliegenden Rechenlast und der definierten Limits für die Leistungsaufnahme, Temperatur und Lüftergeschwindigkeit legt PowerTune dann dynamisch die GPU-Taktfrequenz sowie zugehörige Spannung fest, um die höchstmögliche Performance zu erzielen.
Eine Temperaturlimitierung, wie sie bei NVIDIAs GeForce GTX Titan bei Standardeinstellungen zu beobachten ist, sollte wenn überhaupt nicht so stark ausgeprägt sein, weil AMD hier standardmäßig 95 °C festgelegt hat. Dies ist angeblich auch der Wert, bei dem ältere Modelle thermisch bedingt drosseln. Update: Das Studium der bisher veröffentlichten Artikel (z. B. HT4U) zeigt auf, dass wir hier einer Fehleinschätzung unterlagen. Die Radeon R9 290X scheint geradezu darauf optimiert zu sein, bei 95 °C betrieben zu werden. Limitierend wirkt zwar in der Tat nicht direkt die Temperatur, aber indirekt über die Begrenzung der maximalen Lüfterdrehzahl.
Zusammen mit PowerTune wurden auch die zugehörigen Regler im AMD-OverDrive-Menü des CCC überarbeitet. Um den Zusammenhang zwischen Taktfrequenz, Power-Limit und abzuführender Wärme besser zu verdeutlichen, wurden die Regler für die GPU-Taktfrequenz und das PowerTune-Limit in einem zweidimensionalen Diagramm zusammengefasst. Hier kann der gewünschte Betriebspunkt frei gewählt werden, wobei die farbliche Unterlegung die Größenordnung der abzuführenden Wärmemenge verdeutlicht. Zusätzlich können Besitzer einer Radeon R9 290X das Temperatur- und Lüfterdrehzahl-Limit den eigenen Wünschen entsprechend konfigurieren. Am bekannten Schieberegler für die Taktfrequenz, mit der der GDDR5 angesteuert wird, hat sich nichts verändert.
AMD will zudem dafür gesorgt haben, dass der Lüfter keine sprunghaften Drehzahländerungen vornimmt, sondern möglichst gleichmäßige Übergänge.
Mit Hilfe des BIOS-Schalter kann zusätzlich zwischen dem “Quiet Mode” und “Uber Mode” gewählt werden Allerdings erschließt sich uns hier angesichts der vielfältigen Einstellungsmöglichkeiten im CCC nicht so recht der Sinn. Denn laut AMD ist der einzige Unterschied zwischen beiden BIOS-Schalterpositionen das Lüfterdrehzahllimit, was offenbar im “Quiet Mode” bei 40 % liegt. Die höchstmögliche Performance ist demnach im “Uber Mode” (Limit: 55 %) erzielbar, was insbesondere bei schlecht belüfteten Gehäusen oder in CrossFire-Konfigurationen signifikant ins Gewicht fallen kann.
Update: Beispielsweise der Test von ComputerBase zeigt auf, dass die dynamische GPU-Taktrate im “Quiet Mode” in der Regel zwischen 800 und 900 MHz liegt und nur im “Uber Mode” nahezu durchgehend die 1.000 MHz gehalten werden können.
Update 2: Dem gegenüber zeigen die Messungen von AnandTech höhere durchschnittliche Taktfrequenzen im “Quiet Mode”. Hier liegt im Schnitt ein Takt oberhalb von 900 MHz an. Die unterschiedlichen Ergebnisse zeigen auf, wie stark die Performance der Radeon R9 290X von einem gut gekühlten Gehäuse abhängig ist.
CrossFire via XDMA
Beim Thema CrossFire geht AMD neue Wege. Die jüngeren GPUs “Hawaii” und “Bonaire” verfügen über eine XDMA getaufte Funktionseinheit, die für einen geordneten, direkten Datenaustausch zwischen den GPUs eines CrossFire-Gespanns über den PCIe-Bus sorgen soll. Dafür fallen die bisher notwendigen CrossFire-Brücken weg. XDMA ist laut AMD die Abkürzung für AMD CrossFire Direct Memory Access.
Von AMD wurde uns die Funktionalität wie folgt beschrieben: XDMA nutzt Speicherdirektzugriffe (Direct Memory Access), über die die zweite (und ggf. dritte und vierte) GPU ihre fertig berechneten Bilddaten direkt an einen kleinen Speicherbereich im Display-Block der primären GPU sendet. Diese Daten werden dann von der Display-Engine gelesen und an die Bildschirme ausgegeben. All dies geschieht ohne Interaktion mit der CPU oder unnötiges Umherkopieren zwischen den GPUs und dem Arbeitsspeicher.
Die neue XDMA-Technologie soll gegenüber der Verwendung von CrossFire-Brücken keine Nachteile hinsichtlich der Skalierung haben. Auf unsere Nachfrage hin zeigte sich AMD gar zuversichtlich, dass selbst bei Konfigurationen mit vier GPUs, die per PCIe 2.0 x8 angebunden sind, die volle Performance erreicht wird. AMD gibt sogar an, diese Technologie sei im speziellen für 4K/UHD-Auflösungen und die Multi-Monitor-Technologie Eyefinity entwickelt worden. Außerdem soll es wohl Vorteile beim Frame Pacing bringen.
Leider konnte uns AMD vor Redaktionsschluss noch keinen finalen Euro-Preis für Deutschland nennen. Angepeilt sind aber offenbar ca. 475,- Euro, was gegenüber den Konkurrenzprodukten von NVIDIA ein echter Kampfpreis ist. Ob Mantle oder TrueAudio zusätzliche Kaufargumente sind, kann derzeit schlicht nicht bewertet werden. Für ersteres ist bisher offiziell nur ein entsprechender Battlefield-4-Patch im Dezember diesen Jahres angekündigt und TrueAudio nutzen voraussichtlich erst im nächsten Jahr die ersten Spiele. Laut AMD sollen die Radeon R9 290X bereits ab heute verfügbar sein. Wie es mit der Verfügbarkeit aussieht, bleibt aber natürlich abzuwarten.
Links zum Thema:
- Microsoft Xbox One unterstützt AMDs Grafikschnittstelle Mantle (noch) nicht [2. Update] ()
- Details zu AMDs TrueAudio: Von VLIW und Verwandten ()
- Nähere Infos bezüglich Unterschieden zwischen Vorgängermodellen und Radeon R9 280X sowie R9 270X ()
- AMD Catalyst 13.11 Beta 1 für Windows und Linux ()
- AMD schickt die vulkanischen Inseln der Radeon R7 200 und R9 200 Serie ins Rennen ()
- AMD nennt Terminrahmen für Veröffentlichung von Phase 2 der Frame-
Pacing -Technologie mit Unterstützung für Eyefinity () - AMD Radeon R9 290 & 290X – nie wieder CrossFire-Brücken? ()