Details zu AMDs TrueAudio: Von VLIW und Verwandten

Auf der GPU-Mes짯se vor ein paar Tagen gab AMD erst짯mals bekannt, eine Audio-Beschleu짯ni짯gung mit짯tels digi짯ta짯len Signal짯pro짯zes짯so짯ren (DSP) anzu짯bie짯ten. Mitt짯ler짯wei짯le sind im Inter짯net eini짯ge wei짯te짯re Ein짯zel짯hei짯ten in Inter짯views mit AMD durch짯ge짯si짯ckert. Bereits alt ist die Infor짯ma짯ti짯on, dass TrueAu짯dio kei짯ne Sound짯kar짯te ersetzt, jedoch kann man dies nicht oft genug erw채h짯nen, da sich die짯se Falsch짯in짯for짯ma짯ti짯on z채h im Inter짯net h채lt. Zwei Folie aus der aktu짯el짯len Pr채짯sen짯ta짯ti짯on der Vul짯kan짯in짯sel-Rei짯he stellt die짯sen Sach짯ver짯halt deut짯lich dar:

Nach der Berech짯nung des Sounds erfolgt die Aus짯ga짯be also 체ber die han짯dels짯체b짯li짯chen Onboard짯sounds, USB, oder was man sonst noch an Audio-Ger채짯ten im PC hat.

Beim ver짯wen짯de짯ten DSPs fiel die Wahl auf Tech짯nik von Ten짯si짯li짯ca, die AMD bereits zur Video-Beschleu짯ni짯gung in der UVD-Ein짯heit ein짯setzt:

Macht man sich auf die Suche nach dem Audio-Lie짯fe짯ran짯ten, fin짯det man Genaue짯res in Form von PDFs auf des짯sen Web짯sei짯te. Ten짯si짯li짯cas DSPs basie짯ren auf einem CPU-Grund짯ge짯r체st namens LX4, das die 체bli짯chen Ver짯wal짯tungs짯ein짯hei짯ten wie Fetch/Decode und Load/Store bereit h채lt. Schon letz짯te짯re sind aber kon짯fi짯gu짯rier짯bar, wie man im n채chs짯ten Bild an der grau-blau짯en Farb짯ge짯bung sieht:

L1-Caches, die AMD in Ihrer L철sung im Maxi짯mal짯aus짯bau von 2x32 kB ein짯setzt, wie man im fol짯gen짯den Bild links sehen kann, sind gar kom짯plett optional.

Wei짯te짯re Fle짯xi짯bi짯li짯t채t gewinnt der Kun짯de dann bei der Aus짯wahl der Funk짯ti짯ons짯ein짯hei짯ten. Dort kann man aus einer Viel짯zahl Optio짯nen w채hlen:

AMD nutzt davon laut Ihrer TrueAu짯dio-횥ber짯sichts짯fo짯lie oben die Audio-Erwei짯te짯rung 쏦iFi EP. Was die짯se Erwei짯te짯rung leis짯tet, sieht man in Ten짯si짯li짯cas 횥ber짯sicht der ange짯bo짯te짯nen Audio-L철sungen:

Die EP-Ver짯si짯on ist also eine 24-Bit-VLIW-Archi짯tek짯tur. Ja, man hat rich짯tig geh철rt, die DSPs funk짯tio짯nie짯ren nach dem glei짯chen Sche짯ma wie die GCN-Vor짯g채n짯ger짯ge짯ne짯ra짯ti짯on. Aller짯dings wer짯den bei 쏦iFi EP nur VLIW-B체n짯del aus 2 Befeh짯len geschn체rt, nicht 4 oder gar 5 wie bei AMDs alten Gra짯fik짯chips. Des짯wei짯te짯ren ste짯hen 3 Mul짯ti짯pli짯ka짯ti짯ons짯ak짯ku짯mu짯la짯to짯ren (MAC) zur Ver짯f체짯gung, die die Rechen짯last 체ber짯neh짯men. Im Gegen짯satz zu den im Bull짯do짯zer ver짯wen짯de짯ten FMACs wird zwi짯schen der Addi짯ti짯on und Mul짯ti짯pli짯ka짯ti짯on gerundet.

Was gewinnt man nun damit? Viel Rechen짯leis짯tung, die aber nicht nur f체r 3D-Audio짯ef짯fek짯te, wie den gezeig짯ten Genau짯dio-Algo짯rith짯men, son짯dern auch zur Deko짯die짯rung f체r gew철hn짯li짯che MP3, MP4, DAB, OGG, WMA, und vie짯le ande짯re Audio-Codecs zur Ver짯f체짯gung steht. Ins짯ge짯samt h채lt Ten짯si짯li짯ca daf체r 체ber 100 Soft짯ware짯pa짯ke짯te bereit. Wie bereits fr체짯her berich짯tet, wird die CPU  dadurch von allen Audio짯be짯rech짯nun짯gen befreit und somit ent짯las짯tet. Laut eines Berichts bei Tech Report lau짯fen die DSPs auf dem Rade짯on-HD-7790-Clo짯ne R7-260X mit 800 MHz. Da dies deut짯lich unter dem Shader짯takt von 1100 MHz liegt, ist davon aus짯zu짯ge짯hen, dass die DSPs bei den neue짯ren AMD-GPUs durch ein eige짯nes Takt짯si짯gnal ver짯sorgt wer짯den. Nach짯pr체짯fen kann man dies man짯gels geeig짯ne짯ter Aus짯le짯se짯tools aber noch nicht. Auf alle F채l짯le w채re ein fixer DSP-Takt f체r die Pro짯gram짯mie짯rer vor짯teil짯haft, da sie damit gezielt mit einem fixen Rechen짯leis짯tungs짯bud짯get pla짯nen k철n짯nen. Dies benennt AMD auch auf fol짯gen짯der Folie:

Sol짯che CPU-Ent짯las짯tun짯gen und bes짯se짯re Plan짯bar짯keit st체n짯den nat체r짯lich auch den bei짯den ver짯wand짯ten Spiel짯kon짯so짯len mit den Jagu짯ar-Ker짯nen gut zu Gesicht. Tat짯s채ch짯lich setzt auch Micro짯soft auf die glei짯che Tech짯nik von Ten짯si짯li짯cia. In einem Gespr채ch mit Eurogamer.net gaben die XBox-One-Ent짯wick짯ler fol짯gen짯de Details bekannt:

The audio block was com짯ple짯te짯ly uni짯que. That was desi짯gned by us in-house. It셲 based on four ten짯si짯li짯ca DSP cores and seve짯ral pro짯gramma짯ble pro짯ces짯sing engi짯nes. We break it up as one core run짯ning con짯trol, two cores run짯ning a lot of vec짯tor code for speech and one for gene짯ral pur짯po짯se DSP. We cou짯ple with that sam짯ple rate con짯ver짯si짯on, fil짯te짯ring, mixing, equa짯li짯sa짯ti짯on, dyna짯mic ran짯ge com짯pen짯sa짯ti짯on then also the XMA audio block. The goal was to run 512 simul짯ta짯neous voices for game audio as well as being able to do speech pre-pro짯ces짯sing for Kinect.

Micro짯soft nutzt also 4 DSPs von Ten짯si짯li짯ca, die es erm철g짯li짯chen, 512 Stim짯men sowie Sprach짯er짯ken짯nung f체r Kinect zu steu짯ern. Im Gegen짯satz zu Micro짯soft nutzt AMD nach Infor짯ma짯tio짯nen von Maxi짯mumPC zwar nur 3 DSPs:

AMD has sin짯ce dis짯c짯lo짯sed to us that it has three Ten짯si짯li짯ca DSPs on the die

jedoch d체rf짯te der Ver짯zicht eines DSPs durch das Feh짯len von Kinect zu erkl채짯ren sein. F체r die Audio-Pro짯gram짯mie짯rer w채re somit die Effekt짯er짯zeu짯gung f체r die XBox und AMD 채hnlich.

Wei짯te짯re tech짯ni짯sche Details wer짯den noch auf fol짯gen짯der Folie verraten:

Hier sieht man links unten im Eck, dass die DSPs einen eige짯nen Adress짯raum von 64 MByte im Gra짯fik짯spei짯cher haben. Trotz Ten짯si짯li짯cas Mit짯glied짯schaft im HSA-Gre짯mi짯um kann von HSA bzw. hUMA zwi짯schen GPU und DSP somit also kei짯ne Rede sein. In Hin짯blick auf die recht neue Mit짯glied짯schaft und die lan짯ge Ent짯wick짯lungs짯zeit bei Gra짯fik짯kar짯ten durf짯te man aber auch nicht zuviel erwar짯ten. Span짯nend wird es, wann die DSPs kom짯plett ins HSA-Uni짯ver짯sum ein짯ge짯klinkt wer짯den, und ob die DSPs viel짯leicht auch auf einer APU zum Ein짯satz kom짯men werden.

Zum Ende noch die tech짯ni짯schen Daten von AMDs TrueAu짯dio-L철sung im 횥berblick:

  • 3 Ten짯si짯li짯ca DSP cores
  • Ten짯si짯li짯ca HiFi2 EP Audio Erweiterung
  • Ten짯si짯li짯ca Xten짯sa SP Float support
  • 32KB L1I- und L1D-Caches pro DSP core
  • 8KB Scratch RAM f체r loka짯le Ope짯ra짯tio짯nen pro DSP core
  • 800 Mhz
  • Voll짯in짯te짯gra짯ti짯on in der GPU
  • Auf allen Gra짯fi짯kar짯ten gleich

Und zum Abschluss noch eine H철r짯pro짯be von Genau짯dio f체r alle audio짯phi짯len Leser:

Quel짯len: