AMD Piledriver vs. Steamroller vs. Excavator — Leistungsvergleich der Architekturen

Artikel-Index:

4th Generation: Excavator

(Auszug/Zusammenfassung aus der Mel­dung vom 03.06.2015)

Die Excava­tor-Imple­men­tie­rung “Car­ri­zo” ist 250 mm² groß, ein CPU-Modul wird 23 % klei­ner gegen­über dem Vor­gän­ger und der Strom­ver­brauch sinkt um 40 % ggü. Kaveri. Der Level-1-Daten­cache eines jeden Inte­ger-Clus­ters wur­de von 16 kB und vier­fa­cher Asso­zia­ti­vi­tät auf 32 kB und acht­fa­che Asso­zia­ti­vi­tät ver­grö­ßert. Damit dürf­te die Tref­fer­ra­te nach einer Dau­men­re­gel unge­fähr auf das Vier­fa­che anstei­gen. Neu­es hat AMD nun über des­sen Imple­men­tie­rung verraten:

Dem­nach konn­te AMD den Strom­ver­brauch des L1-Caches trotz des­sen Ver­dopp­lung hal­bie­ren. Bei der aktu­el­len Prä­sen­ta­ti­on wur­de noch ein wei­te­res Detail bekannt gege­ben. Dem­nach hat AMD auch die Sprung­vor­her­sa­ge verbessert:

Von bis­her 512 Ein­trä­gen wur­de die Anzahl der Ein­trä­ge des Sprung­ziel­puf­fers bei Excava­tor um die Hälf­te auf 768 ver­grö­ßert. Dies kommt etwas über­ra­schend, schließ­lich war eine gute Sprung­vor­her­sa­ge mit ein Haupt­vor­teil des Bull­do­zer­de­signs. Da eine Ein­heit für zwei Ker­ne oder eben Threads ver­ant­wort­lich ist, fiel sie bereits recht groß­zü­gig aus. Mög­li­cher­wei­se ist die­se Ver­bes­se­rung schlicht eine Aus­wir­kung der HD-Libra­ri­es. Vor allem das Front-End mit dem Instruk­ti­ons­cach­econ­trol­ler pro­fi­tiert ja von AMDs Schrumpfkur:

Ver­mut­lich stan­den die Inge­nieu­re also schlicht vor dem sel­te­nen Luxus­pro­blem, plötz­lich Die-Platz zur Ver­fü­gung zu haben. Unter die­sen Rah­men­be­din­gun­gen bie­tet sich natür­lich eine aber­ma­li­ge Inves­ti­ti­on in eine bes­se­re Sprung­vor­her­sa­ge an.

Ein wei­te­rer Punkt der Sprung­vor­her­sa­ge betrifft die FPU. Die­se steht im Fal­le fal­scher Sprung­vor­her­sa­gen nun schnel­ler zur Ver­fü­gung als bis­her, da der “Flush” der (über­flüs­si­gen) Daten bei Excava­tor schnel­ler vonstattengeht.

Im Gegen­zug zur L1-Ver­dop­pe­lung hal­bier­te AMD den L2-Cache auf 1 MB pro Modul. Trotz­dem ver­spricht AMD für Excava­tor eine IPC-Ver­bes­se­rung von 9 bis 13 %:

Damit hat AMD sicher­lich alles rich­tig gemacht. Einer­seits spart man einen Groß­teil der Die-Flä­che durch zwei MB weni­ger L2-Cache, ande­rer­seits wird der Pro­zes­sor den­noch schnel­ler. Das erfreut den Kun­den, wäh­rend AMD die APU güns­ti­ger fer­ti­gen kann. Gleich­zei­tig wird noch der Strom­ver­brauch gedros­selt. Auf die Hin­ter­grün­de von AMDs Strom­sparknif­fen gin­gen wir bereits im ISSCC-Arti­kel ein, nun ver­riet AMD auch noch ein Detail, wie sich der Strom­ver­brauch auf die ein­zel­nen Chip­be­rei­che im Ver­gleich zur Kaveri-Gene­ra­ti­on ver­teilt und unterscheidet: