Viel wurde in den letzten Wochen spekuliert über AMDs neues Flaggschiff-Produkt. In den letzten Tagen vor dem Launch fanden sich sogar die meisten Folien der "Cayman"-Präsentation im Netz und erste stolze Besitzer meldeten munter Benchmarkwerte in diversen öffentlichen Foren. Heute lässt AMD offiziell die Katze aus dem Sack. Eines vorweg: herausgekommen ist kein "Tank-Killer". Vielmehr setzt AMD auch weiterhin auf seine Sweet-Spot-Strategie, auch wenn man sich mit dem 389 mm² Die (+16,5%) weiter vom selbst definierten Optimum der Die-Größe entfernt hat. Dies dürfte aber vor allem eine Notwendigkeit sein, die sich aus der Streichung des 32nm-Bulk-Prozesses sowohl bei TSMC als auch bei GlobalFoundries ergeben hat. Für den Refresh-Chip kam also erneut nur der 40nm Prozess bei TSMC in Frage. Die zusätzlichen 490 Millionen Transistoren (+22,8%) wurden in erster Linie in die Steigerung der Effizienz der "TeraScale 2 Unified Processing Architektur" gesteckt. Die rohe Rechenleistung des Chips ist sogar leicht gesunken gegenüber dem direkten Vorgänger "Cypress".
Erstmals seit Einführung der Unified-Shader setzt AMD beim "Cayman" nicht auf die bekannten VLIW-Einheiten mit fünf Slots sondern auf VLIW-Einheiten mit 4 Slots. Dadurch will der Chipentwickler dem Shader-Compiler die Arbeit erleichtern, was die Auslastung der Einheiten erhöhen soll. Nebenbei spart man ca. 10% Die-Fläche pro VLIW-Einheit ein. Jeweils 16 solcher "4D-Shader" bilden eine SIMD-Engine, die wiederum in zwei Blöcken zu je 12 SIMD-Engines mit eigener Graphics Engine sowie Ultra-Threaded Dispatch Processor gruppiert sind. Damit kommt der "Cayman" im Vollausbau auf insgesamt 1.536 Stream-Prozessoren bzw. 384 "4D-Shader". Da an jeder SIMD-Engine auch jeweils 4 Textur-Einheiten hängen, steigt deren Anzahl auf 96 Stück, während das Speicherinterface bei einer Breite von 256 Bit bleibt, was zu 32 ROPs führt. Diese hat AMD überarbeitet, sodass die Ausführungsgeschwindigkeit bestimmter Funktionen gegenüber der Vorgängergeneration verdoppelt oder gar vervierfacht wurde. Von den vorgenommenen Optimierungen soll vor allem die Anti-Aliasing-Leistung profitieren. Die zwei Graphics Engines mit jeweils einem eigenen Tessallator der achten Generation sollen dabei helfen, den Rückstand auf NVIDIA in Computerspielen mit starkem Einsatz von Tessallation zu verkürzen. Dazu wurden die Zwischenspeicher auf dem Chip vergrößert und zusätzlich die Möglichkeit geschaffen, Daten aus dem Tessallation-Vorgang auch in den Grafikspeicher auszulagern. Dadurch soll das Blockieren der gesamten GPU bei sehr hohen Tessallation-Faktoren verhindert werden, wie es noch beim "Cypress" geschehen konnte. Mit dem auf 2,64 Milliarden Transistoren und 389 mm² angewachsenen Chip zielt AMD auf die NVIDIA GeForce GTX 570.
Auch wenn die Modelle der AMD Radeon HD 6900 Serie erneut keine Besserung bei der Flimmerproblematik bringen, so werden zumindest erneut zusätzliche Anti-Aliasing-Modi angeboten. Die neuen EQAA-Modi (Enhanced Quality Anti-Aliasing) verwenden dieselbe Anzahl an Color-Samples wie MSAA, verdoppeln aber die Anzahl an Coverage-Samples, was die Bildqualität positiv beeinflussen soll. Da der Rechenaufwand für die Coverage-Samples geringer ist, soll laut AMD die Leistung bei Aktivierung EQAA-Modi nur geringfügig einbrechen. Aktuell wird EQAA nur von den überarbeiteten ROPs der Radeon HD 6900 unterstützt. Ein ähnliches Feature bietet NVDIA bereits seit längerem unter der Bezeichnung CSAA (Coverage Sampling Anti-Aliasing) an. Mit von der Partie ist natürlich auch MLAA (Morphological Anti-Aliasing), was AMD bereits zur Vorstellung der Radeon HD 6800 erstmals präsentiert hat und mittlerweile dank des AMD Catalyst 10.10e Hotfix ebenfalls auf allen Radeons der 5000er-Serie zugeschalten werden kann.
Das Feature des "Cayman"-Chips, was wohl für die meisten Diskussionen sorgen wird, ist die AMD PowerTune getaufte Technologie. Es handelt sich dabei um eine in den Die integrierte Technologie, die sicherstellen soll, dass der Grafikchip nie eine zuvor festgelegte maximale Leistungsaufnahme überschreitet. Dazu wird ständig die Auslastung der einzelnen Einheiten auf dem Chip überwacht und mittels eines Algorithmus daraus die aktuelle Leistungsaufnahme berechnet. Wird dabei eine Überschreitung der vorgegebenen Grenze vorhergesagt, drosselt sich die GPU eigenständig, ohne den P-state zu wechseln. Diese Anpassung der Taktraten (in 5 MHz Schritten) geschieht innerhalb von Mikrosekunden. Den Einsatz dieser Technologie begründet AMD zum einen durch den damit einhergehenden Schutz des Chips vor einer Überlastung, zum anderen erlaubt PowerTune höhere Taktraten, da der Sicherheitspuffer für die angegebene TDP kleiner ausfallen kann.
Die Parameter für den Algorithmus wurden durch interne Messungen bestimmt. Dazu wurden Computerspiele verwendet, die für eine besonders hohe Leistungsaufnahme, wie z.B. "Alien vs. Predator", bekannt sind. Während der Messung wurde die Gehäuse-Temperatur konstant auf 45°C gehalten. Damit auch künftige Computerspiele nicht von PowerTune eingebremst werden, hat AMD noch einen Sicherheitspuffer vorgesehen. Allerdings sei an der Stelle auch angemerkt, dass AMD nicht jedes verfügbare Spiel testen kann und dies auch nicht getan hat. Man gibt sich aber zuversichtlich, dass der vorgesehene Sicherheitspuffer ausreichend ist und es zu keinen Drosselungen in realen Computerspielen kommt. In einzelnen Benchmarks kann das aber schon anders aussehen. Dazu zählt auch 3DMark 11. Wer das Ausbremsen des Grafikchips ausschließen will, oder die maximale Leistungsaufnahme stärker begrenzen will, kann die Grenze im Overdrive-Menü des Catalyst Control Centers entsprechend um maximal 20% nach oben oder unten nachjustieren. Allerdings führt bereits das Anheben der Grenze ohne jegliches Übertakten bereits zu Erlöschen der Garantie.
Das Spitzenmodell AMD Radeon HD 6970 kann auf die vollen 1536 Stream-Prozessoren zurückgreifen und wird mit 880 MHz Chiptakt und 1.375 MHz Speichertakt befeuert. Dabei verbraucht die Grafikkarte unter Spiellelast laut AMD ca. 190 Watt. Der Grenzwert für PowerTune wurde auf 250 Watt festgelegt. Im Idle genehmigt sich die Karte noch akzeptable ca. 20 Watt.
Der kleinere Bruder wurde um zwei SIMD-Engines beschnitten, was 1408 noch verbliebenen Stream-Prozessoren entspricht. Bei der AMD Radeon HD 6950 liegt der Chiptakt bei 800 MHz und der Speichertakt bei 1.250 MHz. AMD gibt einen typischen Leistungsaufnahme in Computerspielen von ca. 140 Watt an. Der Grenzwert für PowerTune liegt hier bei 200 Watt und der Idle-Verbrauch bei ca. 20 Watt.
Beide Modelle setzen auf einen 2 GB großen Grafikspeicher, was vor allem bei hohen Bildqualitätseinstellungen und in CrossFire- Gespannen helfen soll. Gerade bei der CrossFire-Performance will AMD einige Fortschritte erzielt haben. Die neuen Radeon HD 6800 und HD 6900 sollen wesentlich besser skalieren. Inwiefern die Radeon HD 6900 zusätzlich von ihrer zweiten DMA-Engine profitieren können ist unklar. Bei den Display-Ausgängen wird das gleiche geboten, wie zuvor schon bei den AMD Radeon HD 6800. Es stehen zwei Mini DisplayPort 1.2, ein HDMI 1.4a und zwei DVI Anschluss zur Verfügung. Mit Mini DisplayPort 1.2 werden neue Konfigurationen für Eyefinity-Systeme möglich, da an jeden Port bis zu 3 Monitore angeschlossen werden können. Per HDMI 1.4a können 3D-Displays verbunden werden.
Die aktuellen Preisvorstellungen von AMD liegen bei einer Preisspanne von 329 bis 339 EURO für die AMD Radeon HD 6970 und 259 bis 269 EURO für die AMD Radeon HD 6950.
Diesen Artikel bookmarken oder senden an ...