Details zu AMDs TrueAudio: Von VLIW und Verwandten
Auf der GPU-Messe vor ein paar Tagen gab AMD erstmals bekannt, eine Audio-Beschleunigung mittels digitalen Signalprozessoren (DSP) anzubieten. Mittlerweile sind im Internet einige weitere Einzelheiten in Interviews mit AMD durchgesickert. Bereits alt ist die Information, dass TrueAudio keine Soundkarte ersetzt, jedoch kann man dies nicht oft genug erwähnen, da sich diese Falschinformation zäh im Internet hält. Zwei Folie aus der aktuellen Präsentation der Vulkaninsel-Reihe stellt diesen Sachverhalt deutlich dar:
Nach der Berechnung des Sounds erfolgt die Ausgabe also über die handelsüblichen Onboardsounds, USB, oder was man sonst noch an Audio-Geräten im PC hat.
Beim verwendeten DSPs fiel die Wahl auf Technik von Tensilica, die AMD bereits zur Video-Beschleunigung in der UVD-Einheit einsetzt:
Macht man sich auf die Suche nach dem Audio-Lieferanten, findet man Genaueres in Form von PDFs auf dessen Webseite. Tensilicas DSPs basieren auf einem CPU-Grundgerüst namens LX4, das die üblichen Verwaltungseinheiten wie Fetch/Decode und Load/Store bereit hält. Schon letztere sind aber konfigurierbar, wie man im nächsten Bild an der grau-blauen Farbgebung sieht:
L1-Caches, die AMD in Ihrer Lösung im Maximalausbau von 2x32 kB einsetzt, wie man im folgenden Bild links sehen kann, sind gar komplett optional.
Weitere Flexibilität gewinnt der Kunde dann bei der Auswahl der Funktionseinheiten. Dort kann man aus einer Vielzahl Optionen wählen:
AMD nutzt davon laut Ihrer TrueAudio-Übersichtsfolie oben die Audio-Erweiterung “HiFi EP”. Was diese Erweiterung leistet, sieht man in Tensilicas Übersicht der angebotenen Audio-Lösungen:
Die EP-Version ist also eine 24-Bit-VLIW-Architektur. Ja, man hat richtig gehört, die DSPs funktionieren nach dem gleichen Schema wie die GCN-Vorgängergeneration. Allerdings werden bei “HiFi EP” nur VLIW-Bündel aus 2 Befehlen geschnürt, nicht 4 oder gar 5 wie bei AMDs alten Grafikchips. Desweiteren stehen 3 Multiplikationsakkumulatoren (MAC) zur Verfügung, die die Rechenlast übernehmen. Im Gegensatz zu den im Bulldozer verwendeten FMACs wird zwischen der Addition und Multiplikation gerundet.
Was gewinnt man nun damit? Viel Rechenleistung, die aber nicht nur für 3D-Audioeffekte, wie den gezeigten Genaudio-Algorithmen, sondern auch zur Dekodierung für gewöhnliche MP3, MP4, DAB, OGG, WMA, und viele andere Audio-Codecs zur Verfügung steht. Insgesamt hält Tensilica dafür über 100 Softwarepakete bereit. Wie bereits früher berichtet, wird die CPU dadurch von allen Audioberechnungen befreit und somit entlastet. Laut eines Berichts bei Tech Report laufen die DSPs auf dem Radeon-HD-7790-Clone R7-260X mit 800 MHz. Da dies deutlich unter dem Shadertakt von 1100 MHz liegt, ist davon auszugehen, dass die DSPs bei den neueren AMD-GPUs durch ein eigenes Taktsignal versorgt werden. Nachprüfen kann man dies mangels geeigneter Auslesetools aber noch nicht. Auf alle Fälle wäre ein fixer DSP-Takt für die Programmierer vorteilhaft, da sie damit gezielt mit einem fixen Rechenleistungsbudget planen können. Dies benennt AMD auch auf folgender Folie:
Solche CPU-Entlastungen und bessere Planbarkeit stünden natürlich auch den beiden verwandten Spielkonsolen mit den Jaguar-Kernen gut zu Gesicht. Tatsächlich setzt auch Microsoft auf die gleiche Technik von Tensilicia. In einem Gespräch mit Eurogamer.net gaben die XBox-One-Entwickler folgende Details bekannt:
“The audio block was completely unique. That was designed by us in-house. It’s based on four tensilica DSP cores and several programmable processing engines. We break it up as one core running control, two cores running a lot of vector code for speech and one for general purpose DSP. We couple with that sample rate conversion, filtering, mixing, equalisation, dynamic range compensation then also the XMA audio block. The goal was to run 512 simultaneous voices for game audio as well as being able to do speech pre-processing for Kinect.”
Microsoft nutzt also 4 DSPs von Tensilica, die es ermöglichen, 512 Stimmen sowie Spracherkennung für Kinect zu steuern. Im Gegensatz zu Microsoft nutzt AMD nach Informationen von MaximumPC zwar nur 3 DSPs:
“AMD has since disclosed to us that it has three Tensilica DSPs on the die”
… jedoch dürfte der Verzicht eines DSPs durch das Fehlen von Kinect zu erklären sein. Für die Audio-Programmierer wäre somit die Effekterzeugung für die XBox und AMD ähnlich.
Weitere technische Details werden noch auf folgender Folie verraten:
Hier sieht man links unten im Eck, dass die DSPs einen eigenen Adressraum von 64 MByte im Grafikspeicher haben. Trotz Tensilicas Mitgliedschaft im HSA-Gremium kann von HSA bzw. hUMA zwischen GPU und DSP somit also keine Rede sein. In Hinblick auf die recht neue Mitgliedschaft und die lange Entwicklungszeit bei Grafikkarten durfte man aber auch nicht zuviel erwarten. Spannend wird es, wann die DSPs komplett ins HSA-Universum eingeklinkt werden, und ob die DSPs vielleicht auch auf einer APU zum Einsatz kommen werden.
Zum Ende noch die technischen Daten von AMDs TrueAudio-Lösung im Überblick:
- 3 Tensilica DSP cores
- Tensilica HiFi2 EP Audio Erweiterung
- Tensilica Xtensa SP Float support
- 32KB L1I- und L1D-Caches pro DSP core
- 8KB Scratch RAM für lokale Operationen pro DSP core
- 800 Mhz
- Vollintegration in der GPU
- Auf allen Grafikarten gleich
Und zum Abschluss noch eine Hörprobe von Genaudio für alle audiophilen Leser:
Quellen:
- Everything You Wanted to Know About AMD’s New TrueAudio Technology — Page 1|Maximum PC
- Tensilica HiFi 2 Audio DSP
- Digital Foundry: the complete Xbox One architects interview • Interviews • Eurogamer.net
- Xtensa LX4-Datenblatt
- Tensilica HiFi 2 Software Pakete
- AMD’s Radeon R7 260X graphics card reviewed — The Tech Report — Page 1.
Links zum Thema:
- Spezifikationen der AMD Radeon R9 290 und R9 290X durchgesickert [Update] ()
- AMD schickt die vulkanischen Inseln der Radeon R7 200 und R9 200 Serie ins Rennen ()
- Mantle halboffen für andere Hersteller, auch auf den Konsolen vertreten, zukünftiger Zeitvorteil bei Spielveröffentlichungen? ()
- AMDs Zukunftsstrategie: Weniger CPU-Last ()
- AMD mit eigener Programmierschnittstelle auf den Spuren von 3DFX: Das Ende von DirectX? ()
- AMD präsentiert neues Flagschiff und eigene Multikanal-Soundtechnologie ()
- AMD führt neues Namensschema bei Grafikkarten ein ()