AMD stellt sechste APU-Generation “Carrizo” für Notebooks vor

Artikel-Index:

Auf der aktu­ell in Tai­pei statt­fin­den­den COMPUTEX 2015 hat AMD heu­te die “Carrizo”-APUs vor­ge­stellt, mit denen spe­zi­ell im Main­stream-Markt­seg­ment zwi­schen 400 und 700 US-Dol­lar ange­grif­fen wer­den soll. Hier möch­te AMD ver­lo­re­ne Markt­an­tei­le zurück­ge­win­nen. Damit dies gelin­gen kann, wur­de stark an der Ener­gie­ef­fi­zi­enz gear­bei­tet. AMD selbst spricht vom größ­ten Sprung in der Fir­men­ge­schich­te. Außer­dem sol­len sich die neu­en APUs, die offi­zi­ell als sechs­te Gene­ra­ti­on bezeich­net wer­den, beson­ders durch die Wie­der­ga­be von UHD-Vide­os aus­zeich­nen. Dazu wur­de die Rechen­leis­tung der UVD-Ein­heit deut­lich auf­ge­bohrt, sodass mit­tels HEVC-Codec (H.265) kom­pri­mier­te Vide­os mit einer Auf­lö­sung von 3840 × 2160 Pixeln bei einer Bild­wech­sel­ra­te von 60 Hz flüs­sig deko­diert wer­den kön­nen. Zudem bie­tet Car­ri­zo erst­mals vol­le Unter­stüt­zung für die HSA-Spe­zi­fi­ka­ti­on in Ver­si­on 1.0 und die Sicher­heits­tech­no­lo­gie ARM TrustZone.

Die tech­ni­schen High­lights der “Carrizo”-APU fasst AMD wie folgt zusammen:

Excavator”-CPU-Kerne: höhere IPC und Energieeffizienz

Seit der ISSCC im Febru­ar waren die meis­ten Eck­da­ten bereits bekannt:
Car­ri­zo wird 250 mm² groß, ein CPU-Modul wird 23 % klei­ner und der Strom­ver­brauch sinkt um 40 % ggü. Kaveri. Der Level-1-Daten­cache eines jeden Inte­ger-Clus­ters wur­de von 16 kB und vier­fa­cher Asso­zia­ti­vi­tät auf 32 kB und acht­fa­che Asso­zia­ti­vi­tät ver­grö­ßert. Damit dürf­te die Tref­fer­ra­te nach einer Dau­men­re­gel unge­fähr auf das Vier­fa­che anstei­gen. Neu­es hat AMD nun über des­sen Imple­men­tie­rung verraten:

Dem­nach konn­te AMD den Strom­ver­brauch des L1-Caches trotz des­sen Ver­dopp­lung hal­bie­ren. Sicher­lich kei­ne Klei­nig­keit, AMD scheint der­zeit ein beson­ders fähi­ges Inge­nieur­team zu haben. Das lässt für AMDs neue Zen-Archi­tek­tur durch­aus hof­fen. Aber zurück zum Excava­tor. Bei der aktu­el­len Prä­sen­ta­ti­on wur­de noch ein wei­te­res Detail bekannt gege­ben. Dem­nach hat AMD auch die Sprung­vor­her­sa­ge verbessert:

Statt bis­her 512 Ein­trä­gen wur­de die Anzahl der Ein­trä­ge des Sprung­ziel­puf­fers bei Excava­tor um die Hälf­te auf 768 ver­grö­ßert. Dies kommt etwas über­ra­schend, schließ­lich war eine gute Sprung­vor­her­sa­ge mit ein Haupt­vor­teil des Bull­do­zer­de­signs. Da eine Ein­heit für zwei Ker­ne bzw. Threads ver­ant­wort­lich ist, fiel sie auch bis­her schon recht groß­zü­gig aus. Mög­li­cher­wei­se ist die­se Ver­bes­se­rung schlicht eine Aus­wir­kung der HD-Libra­ri­es. Vor allem das Front-End mit dem Instruk­ti­ons­cache­kon­trol­ler pro­fi­tiert ja von AMDs Schrumpfkur:

Ver­mut­lich stan­den die Inge­nieu­re also schlicht vor dem sel­te­nen Luxus­pro­blem, plötz­lich Die-Platz zur Ver­fü­gung zu haben. Unter die­sen Rah­men­be­din­gun­gen bie­tet sich natür­lich eine aber­ma­li­ge Inves­ti­ti­on in eine bes­se­re Sprung­vor­her­sa­ge an.

Ein wei­te­rer Punkt der Sprung­vor­her­sa­ge betrifft die FPU. Die­se steht im Fal­le fal­scher Sprung­vor­her­sa­gen nun schnel­ler zur Ver­fü­gung als bis­her, da der “Flush” der (über­flüs­si­gen) Daten bei Excava­tor schnel­ler vonstattengeht.

Im Gegen­zug zur L1-Ver­dop­pe­lung hal­bier­te AMD den L2-Cache auf 1 MB pro Modul. Trotz­dem ver­spricht AMD für Excava­tor aber eine IPC-Ver­bes­se­rung von 9–13%:

Damit hat AMD sicher­lich alles rich­tig gemacht. Einer­seits spart man einen Groß­teil der Die-Flä­che durch zwei MB weni­ger L2-Cache, ande­rer­seits wird der Pro­zes­sor aber trotz­dem schnel­ler. Das erfreut den Kun­den, wäh­rend AMD die APU güns­ti­ger fer­ti­gen kann. Gleich­zei­tig wird auch noch der Strom­ver­brauch gedros­selt. Auf die Hin­ter­grün­de von AMDs Strom­sparknif­fen gin­gen wir bereits im ISSCC-Arti­kel ein, nun ver­riet AMD auch noch ein Detail, wie sich der Strom­ver­brauch auf die ein­zel­nen Chip­be­rei­che im Ver­gleich zur Kaveri-Gene­ra­ti­on ver­teilt und unterscheidet:

DDR4–Unterstützung

Offi­zi­ell wird Car­ri­zo mit DDR3-Unter­stü­zung bewor­ben, jedoch fand unser Foren­mit­glied Crash­test im gleich­zei­tig ver­öf­fent­lich­ten Pro­gram­mier­leit­fa­den meh­re­re Ein­trä­ge zu DDR4. Dem­nach besitzt Car­ri­zo also einen DDR4-Kon­trol­ler. Dies wird sogar für eine FM2+-Version beschrie­ben, was über­ra­schend ist, da Car­ri­zo (noch?) nicht für FM2+ ange­kün­digt ist. Jedoch darf man nicht alles für bare Mün­ze neh­men, was in Pro­gram­mier­leit­fä­den steht, schließ­lich ändert AMD des Öfte­ren die Pro­dukt­plä­ne. Fest­zu­hal­ten ist aber, dass das Car­ri­zo-Die mit DDR4-Spei­cher umge­hen kann, sodass z.B. eine AM4-Ver­si­on durch­aus mög­lich erscheint.

Optimierte GCN-GPU mit Unterstützung für HSA 1.0

Auf Sei­ten der GPU wur­de die Archi­tek­tur auf die drit­te GCN-Gene­ra­ti­on aktua­li­siert, die bis­her nur von der “Tonga”-GPU der Rade­on R9 285 bekannt ist. Damit ein­her geht ein effi­zi­en­te­res Front­end, wel­ches außer­dem eine höhe­re Tes­sel­la­ti­on-Leis­tung bie­tet. Die kom­pri­mier­te Über­tra­gung der Tex­tu­ren vom und zum Spei­cher (Del­ta Color Com­pres­si­on) soll für 5 bis 7 % mehr Gra­fik­leis­tung sor­gen. Zudem wird hard­ware­sei­tig erst­mals vol­le Unter­stüt­zung für die HSA-Spe­zi­fi­ka­ti­on der Ver­si­on 1.0 gebo­ten. Pas­send zum Start von Win­dows 10 wird wie bei allen ande­ren GCN-GPUs DirectX 12 unter­stützt. Aller­dings bleibt vor­erst unge­wiss, für wel­ches Fea­ture-Level dies genau gilt.

Um den vor­han­de­nen TDP-Spiel­raum effi­zi­en­ter nut­zen zu kön­nen, hat die GPU ihre eige­ne Span­nungs­ver­sor­gung bekom­men. Zuvor hin­gen North­bridge und GPU an der­sel­ben. Wegen der kon­se­quen­ten Aus­le­gung des Designs auf einen Bereich gerin­ger Leis­tungs­auf­nah­me konn­te in eben­je­nem die Ener­gie­ef­fi­zi­enz deut­lich gestei­gert wer­den. Zudem kön­nen jetzt auch bei 15 W TDP alle acht GCN-CUs genutzt werden.

Aufgebohrte UVD-Einheit

Neben der Unter­stüt­zung von UHD und HEVC haben die Inge­nieu­re erneut an einer Reduk­ti­on der Leis­tungs­auf­nah­me beim Abspie­len von Vide­os gear­bei­tet. Nor­ma­ler­wei­se wird das deko­dier­te Video zurück in den Spei­cher geschrie­ben, von dort für even­tu­el­le Bild­nach­be­ar­bei­tun­gen sowie Ska­lie­rung erneut gela­den und zurück­ge­schrie­ben, um schließ­lich noch­mals für die Bild­aus­ga­be aus dem Spei­cher gela­den zu wer­den. Für “Car­ri­zo” wur­de die Dis­play Engi­ne um die Fähig­keit zur Bild­ska­lie­rung erwei­tert, sodass ein Weg über den Spei­cher ein­ge­spart wer­den kann, wenn kei­ne Bild­nach­be­ar­bei­tung erfor­der­lich ist.
Die zwei­te Opti­mie­rung nutzt die mas­si­ve Erhö­hung der Rechen­ka­pa­zi­tät zur Deko­die­rung von UHD-Vide­os. Dadurch ist die UVD-Ein­heit in der Lage, FullHD-Vide­os viel schnel­ler zu deko­die­ren, als es erfor­der­lich ist. Sobald die ein­zel­nen Bil­der fer­tig berech­net sind, kann somit der Hard­ware­block abge­schal­tet und von der Span­nungs­zu­fuhr getrennt wer­den (Power Gating). Ins­ge­samt will AMD durch die­se Maß­nah­men eine dop­pelt so lan­ge Video­wie­der­ga­be im Akku­mo­dus gegen­über “Kaveri” ermöglichen.

Bereits in der Ver­gan­gen­heit hat­te AMD mit den Ent­wick­lern des Open-Source-Pro­jekts Hand­Bra­ke zusam­men­ge­ar­bei­tet, um die Deco­die­rung von Vide­os auf die UVD-Ein­heit und die Video­ska­lie­rung mit­tels Open­CL auf die GPU aus­zu­la­gern. Aktu­ell wird dar­an gear­bei­tet, dass das Video­tool zum Enco­die­ren im H.264-Codec an Stel­le der CPU die VCE-Ein­heit von APUs ver­wen­den kann. Die unten gezeig­ten Wer­te wur­den mit Beta-Trei­bern und einer Beta-Ver­si­on von Hand­bra­ke bei der Trans­ko­die­rung einer Video­da­tei gemes­sen (von 10 Mbps h.264 nach 5 Mbps h.264.CZN-52). Neben mög­li­chen Geschwin­dig­keits­vor­tei­len könn­te die Ver­wen­dung der Video Coding Engi­ne (VCE) im mobi­len Ein­satz die Akku­lauf­zeit ver­län­gern. Wann die Funk­tio­na­li­tät in einer sta­bi­len Ver­si­on ver­füg­bar wird, ist wie immer bei Open-Source-Pro­jek­ten nicht vorhersagbar.

Softwareunterstützung

Neben der bereits bekann­ten Ges­ten­steue­rung (AMD Ges­tu­re Con­trol), die ein­zig eine HD-Web­cam vor­aus­setzt, kön­nen Käu­fer eines “Carrizo”-Notebooks künf­tig AMD Loo­king Glass ver­wen­den. Mit Hil­fe die­ser Anwen­dung kann ein Such­in­dex für alle auf dem Mas­sen­spei­cher vor­han­de­nen Vide­os erstellt wer­den, wobei eine Gesichts­er­ken­nung sämt­li­che dar­in vor­kom­men­den Gesich­ter erfasst. Durch die nach­träg­li­che Zuord­nung von Namen durch den Anwen­der kann die Video­samm­lung gezielt nach Vide­os mit einer bestimm­ten Per­son durch­sucht wer­den. Um die gewal­ti­ge Daten­men­ge schnell ver­ar­bei­ten zu kön­nen, greift die Soft­ware auf die Rechen­leis­tung der GPU zurück.

Carrizo-Lineup

Zum Start besteht das Ange­bot ledig­lich aus je einem Modell in der FX‑, A10- und A8-Serie. Alle “Carrizo”-APUs nut­zen das FP4-Packa­ge, wer­den also auf dem Main­board fest ver­lö­tet. Aber­mals kön­nen die OEMs über die kon­fi­gu­rier­ba­re TDP einen Wert zwi­schen 12 und 35 W ein­stel­len, was natür­lich in ers­ter Linie einen Ein­fluss auf das Tur­bo­ver­hal­ten hat.

AMD gibt an, mit allen gro­ßen OEMs an Note­book­mo­del­len im anvi­sier­ten Preis­be­reich zwi­schen 400 bis 700 US-Dol­lar gear­bei­tet zu haben. Genannt wer­den spe­zi­ell ASUS, Acer, Leno­vo, Toshi­ba und HP. Ent­spre­chen­de Gerä­te sol­len zwi­schen Juni und August erschei­nen. Wann und ob all die­se dann auch nach Deutsch­land kom­men, bleibt aber unge­wiss. Viel­leicht hel­fen ja die Spie­le DiRT Ral­ly oder LEGO Bat­man 3: Jen­seits von Got­ham, wel­che als kos­ten­lo­se Drein­ga­be bei­gelegt wer­den können.

Sämt­li­che Foli­en fin­det ihr auf den nach­fol­gen­den bei­den Seiten.

Quel­le: AMD