AMD Piledriver vs. Steamroller vs. Excavator — Leistungsvergleich der Architekturen

Artikel-Index:

3rd Generation: Steamroller

(Auszug/Zusammenfassung aus der Mel­dung vom 29.08.2012)

Die 3. Gene­ra­ti­on der Bull­do­zer-Archi­tek­tur wur­de zuerst und bis dato ein­zig in der APU Kaveri ein­ge­setzt, wobei AMD auf den Foli­en von Steam­rol­lerB spricht, obwohl es zuvor kei­nen Steam­rol­lerA gege­ben hat­te — zumin­dest nicht als kauf­ba­res Pro­dukt. Hier hat AMD ver­sucht, wei­te­re Schwach­stel­len aus­zu­mer­zen. Am Pipe­line-Anfang gibt es wei­ter­hin einen gemein­sa­men Fetch-Schritt, was bedeu­tet, dass nach wie vor ein gemein­sa­mer Instruk­ti­ons-Cache genutzt wird. Sel­bi­ger wur­de aller­dings auf 96 kB ver­grö­ßert und die Asso­zia­ti­vi­tät ver­dop­pelt. Die augen­schein­lichs­te Ver­bes­se­rung sind jedoch die bei­den Deko­der je Modul. Zudem pro­kla­mier­te AMD immer­hin 30% weni­ger L1I-Cache-Fehl­schlä­ge bei Daten­bank-Anwen­dun­gen, die wohl für die­sen Fall eine Art schlimms­tes anzu­neh­men­des Sze­na­rio darstellen.

Zusätz­lich wur­de die Dis­patch-Band­brei­te pro Thread noch um 25% erwei­tert und die Anzahl der falsch vor­her­ge­sag­ten Sprün­ge um 20% redu­ziert. Unter dem Strich soll somit eine Stei­ge­rung von 30% Ops pro Cycle her­aus­kom­men. Geht man groß­zü­gi­ger­wei­se von einem x86-zu-µOp-Ver­hält­nis von 1:1 aus, könn­te man im bes­ten Fall dann auch von einer IPC-Stei­ge­rung um die­sen Betrag aus­ge­hen. AMD gibt an, die­se Stei­ge­rung bei einem Appli­ka­ti­ons­mix aus “digi­tal media”, “pro­duc­ti­vi­ty” und Spie­len berech­net zu haben.

Auf der zwei­ten Folie gibt AMD bekannt, die Spei­cher­ope­ra­tio­nen des L1-Caches in bedeu­ten­der Wei­se ver­bes­sert zu haben. Wei­te­re 5–10% Plus gibt es durch einen ver­bes­ser­ten Sche­du­ler. Außer­dem nennt AMD unter den Mikro­ar­chi­tek­tur-Ver­bes­se­run­gen zum Strom­ver­brauch noch Opti­mie­run­gen für Schlei­fen. Das klingt stark nach einem Loop-Puf­fer, wie ihn schon Jagu­ar bekom­men hat, wor­über in unse­rem Jagu­ar-Arti­kel mehr zu erfah­ren ist.

An ande­rer Stel­le muss­te Steam­rol­ler dage­gen Federn las­sen. So wur­de sei­ne FPU von bis­her 4 Pipe­lines zuguns­ten der Effi­zi­enz auf 3 ein­ge­dampft, was den Roh­durch­satz auf dem Papier um 25% redu­ziert. Aller­dings sol­len die Ver­lus­te durch ande­re Maß­nah­men wie­der aus­ge­gli­chen wor­den sein, sodass die vor­han­de­nen Pipe­lines bes­ser aus­ge­las­tet wer­den können.