Bei Bright Side of News hat man kürzlich offenbar einige interne Dokumente in die Finger bekommen, aus denen man nun nach und nach Infos durchsickern lässt. Vorgestern erst die "Kaveri unterstützt GDDR5" Story, und heute geht's weiter.
Angeblich aus einer Vorabversion des BIOS and Kernel Developer's Guide for AMD Family 15h Models 30h-3Fh Processors (derzeit noch nicht öffentlich einsehbar) stammen folgende Design-Details zum für Ende 2013 erwarteten "Bulldozer v3" alias "Steamroller" bzw. der APU mit Codenamen "Kaveri", die eben jene Steamroller-CPU-Kerne nutzen wird:
- Store to load forwarding optimization - Dispatch and retire up to 2 stores per cycle - Improved memfile, from last 3 stores to last 8 stores, and allow tracking of dependent stack operations. - Load queue (LDQ) size increased to 48, from 44. - Store queue (STQ) size increased to 32, from 24. - Increase dispatch bandwidth to 8 INT ops per cycle (4 to each core), from 4 INT ops per cycle (4 to just 1 core). 4 ops per cycle per core remains unchanged. - Accelerate SYSCALL/SYSRET. - Increased L2 BTB size from 5K to 10K and from 8 to 16 banks. - Improved loop prediction. - Increase PFB from 8 to 16 entries; the 8 additional entries can be used either for prefetch or as a loop buffer. - Increase snoop tag throughput. - Change from 4 to 3 FP pipe stages.
Zudem soll der L1-Instruction-Cache auf 96 KB vergrößert werden. Was bereits seit Mitte 2012 bekannt ist und von AMD bereits bestätigt wurde, sind die Änderungen am Front-End. So geht AMD mit Steamroller wieder einen Schritt zurück in Richtung "echtes" Multi-Core-Layout und spendiert Steamroller wieder einen eigenen Dekoder pro INT-Einheit. Derzeit werden bei Bulldozer und Piledriver die "Kerne" von einem gemeinsam genutzten Dekoder pro Modul gefüttert.
Diese Änderungen sollen vor allem der Single-Thread-IPC zu Gute kommen, einer Disziplin, bei der die Bulldozer-Architektur derzeit schwächelt. Werden keine parallel arbeitenden Anwendungen und/oder Anwendungen verwendet, die nicht von den neuen Befehlssätzen profitieren, ist pro Takt gerechnet die alte K10-Architektur oft schneller als die Bulldozer-Derivate. Das soll sich mit Steamroller wieder ändern.
Nach wie vor offen bleiben muss, ob die neuen Streamroller-Kerne lediglich in den Kaveri-APUs Verwendung finden - hier übrigens laut Leak mit bis zu 3 Compute-Units, also bis zu 6 "Kernen", wohingegen aktuelle APUs mit 2 CUs (4 "Kernen") auskommen müssen - oder ob der sogenannte Enthusiast-User nochmal mit einer Auffrischung der AM3+ Palette rechnen darf. Hierzu schweigen sich offizielle AMD Roadmaps nach wie vor aus.
Diesen Artikel bookmarken oder senden an ...