AMD präsentiert Excavator und Carrizo auf der ISSCC 2015

Artikel-Index:

Stromspartechniken

Nicht nur der Pro­zes­sor­kern pro­fi­tier­te von AMDs GPU-Exper­ti­se. Die CPU-Inge­nieu­re schau­ten sich auch die GPU an und konn­ten dort durch einen bes­se­ren Mix von leis­tungs­stär­ke­ren und ver­lust­leis­tungs­är­me­ren Tran­sis­to­ren Ein­spa­run­gen erzie­len. Dadurch kann man AMD zufol­ge ent­we­der die GPU 10 % schnel­ler betrei­ben oder sich ein­fach mit 20 % Ver­brauchs­er­spar­nis begnügen:

Dabei wur­den im obi­gen lin­ken Dia­gramm bei Car­ri­zo die oran­ge­far­be­nen Punk­te Kave­ris durch die blau­en ersetzt. Je tie­fer man auf der “uni­ver­sal cur­ve” geht, des­to spar­sa­mer wer­den die Tran­sis­to­ren. Wie man sieht, hat AMD also bei der GPU einer­seits 32,7 % beson­ders spar­sa­me Tran­sis­to­ren ein­ge­setzt, ande­rer­seits 34,9 % rela­tiv schnel­le mit regu­lä­rer Schwell­span­nung (RVT) und somit hohem Strom­ver­brauch. Das Gros der Tran­sis­to­ren des Vor­gän­gers liegt dazwi­schen (nur 7,9 % Tran­sis­to­ren dar­über), unter dem Strich kommt auf die­se Wei­se den­noch eine Strom­erspar­nis oder eine höhe­re erziel­ba­re Takt­fre­quenz zustan­de. Die­se ermög­licht es Car­ri­zo — im Gegen­satz zu Kaveri —, auch bei den Low-Power-Model­len ab/unter 15 W TDP alle acht GPU-Rechen­ein­hei­ten in Betrieb zu hal­ten. Bei Kaveri muss­ten aus dem Grun­de des Ver­brauchs in die­sem TDP-Rah­men noch zwei Ein­hei­ten deak­ti­viert wer­den. Sowohl der CPU- als auch der GPU-Teil wur­den also spar­sa­mer. Man könn­te daher mei­nen, dass es das nun war, aber das Auf­ge­zähl­te allein reicht noch nicht für die ange­kün­dig­ten 40 % Verbrauchsersparnis.

Eine wei­te­re Neue­rung sind die “adap­ti­ven Span­nun­gen”. Dabei wird Span­nung im Nano­se­kun­den­be­reich über­wacht und bei star­ken Span­nungs­ein­brü­chen, die in einem weit­ver­zweig­ten Lie­fer­netz­werk immer vor­kom­men kön­nen, die Takt­fre­quenz für eine (sehr) kur­ze Zeit her­ab­ge­setzt. Anstatt also die Kern­span­nung sicher­heits­hal­ber kon­stant auf über­höh­tem Niveau zu hal­ten, sodass sie auch wäh­rend sehr kur­zer Span­nungs­ein­brü­che über der unte­ren Gren­ze des Erfor­der­li­chen liegt, setzt man die Kern­span­nung auf einen nied­ri­ge­ren Durch­schnitts­wert und nimmt dafür bei kur­zen Span­nungs­ein­brü­chen einen win­zi­gen Takt­fre­quenz­ein­bruch im Nano­se­kun­den­be­reich in Kauf. Sicher­lich ein guter Tausch:

Auf der rech­ten Sei­te sieht man die Aus­wir­kung auf CPU und GPU. Da sich bei­de Ein­hei­ten in unter­schied­li­chen Takt­be­rei­chen bewe­gen, das Dia­gramm indes­sen nor­ma­li­siert ist, dürf­te sich AMDs anpas­sen­de Span­nung v.a. im Takt­fre­quenz­be­reich zwi­schen ein und zwei GHz beson­ders posi­tiv aus­wir­ken. Dort sind Erspar­nis­se von 10 % bis zu 20 % zu erwarten.

Das war es aber immer noch nicht mit den Strom­sparknif­fen, einen hat AMD noch auf Lager und die­ser heißt selbst­an­pas­sen­de Span­nungs- und Takt­fre­quenz­ska­lie­rung (AVFS: adap­ti­ve vol­ta­ge and fre­quen­cy scaling):

Dies zielt dar­auf ab, aus einem bestimm­ten Stück Sili­zi­um das Maxi­ma­le her­aus­zu­ho­len. Dazu wer­den zehn Span­nungs- und Takt­fre­quenz­sen­so­ren über den Kern ver­teilt, die dann eine Rück­mel­dung über die Mög­lich­kei­ten der ein­zel­nen Chip­area­le und somit des gesam­ten Chips lie­fern. Die­ser kann der­ge­stalt mit den opti­ma­len Para­me­tern betrie­ben wer­den; es wird kei­ne Ener­gie ver­schwen­det, weil man eine zu hohe Kern­span­nung ansetzt. Damit wird aus einem schlech­ten Die sicher­lich kein Strom­spar­wun­der, viel­mehr hilft es eben etwas den Strom­durst zu zügeln. AVFS ermög­licht damit, dass sich jeder Chip selbst kali­briert. Dafür wird eine inter­ne Spannungs‑, Tem­pe­ra­tur- und Takt­fre­quenz­ta­bel­le ange­legt, die von der Sys­tem Manage­ment Unit (SMU, ver­mut­lich der ARM-A5-Kern) über­wacht und bei Ände­run­gen der P‑States ent­spre­chend genutzt wird.

Das war es nun mit den Strom­spar­tech­ni­ken — zumin­dest von denen im Betrieb. Opti­miert wur­de der­weil auch der Stand­by­mo­dus. Neu ist hier der soge­nann­te S0i3-Zustand. Die­ser Modus, der in Hin­blick auf den Strom­ver­brauch mit dem S3-Modus zu ver­glei­chen ist, spart Strom, indem so gut wie alle Chip­be­rei­che aus­ge­schal­tet wer­den. Das heißt, nicht nur das Takt­si­gnal (clock gated) wird gekappt, son­dern auch die Strom­zu­fuhr (power gated). Im Unter­schied zum nor­ma­len S3-Modus, den man als Benut­zer unter Win­dows expli­zit anfor­dern muss, wird der S0i3-Modus jedoch von der Ener­gie­ver­wal­tung des Betriebs­sys­tems akti­viert. Das heißt, es funk­tio­niert auto­ma­tisch im Hin­ter­grund wie das übli­che Absen­ken der Takt­fre­quenz in Idle-Zuständen:

Wie man auf der lin­ken Sei­te sehen kann, spart man im Ver­gleich zum Idle-Modus also ein Watt, wobei das Sys­tem zur sofor­ti­gen Wei­ter­ar­beit zur Ver­fü­gung steht; es muss aus kei­nem Stan­dy­mo­dus boo­ten. Ein Watt klingt zwar nicht nach viel, bei einem Mobil­ge­rät im Bat­te­rie­be­trieb zählt gleich­wohl bekannt­lich jedes Mil­li­watt. Nicht ver­kehrt ist auch der Kom­fort­vor­teil, da man auf das Schlie­ßen des Note­books in kur­zen Arbeits­pau­sen ver­zich­ten kann.