AMDs Excavator-Architektur kommt mit AVX2
Wie immer kommen erste belastbare Informationen zu neuen CPU-Architekturen von den Compilerbauern. Nun sind im GCC-Quellcode erstmals Zusätze für die “BDver4”-Architektur aufgetaucht, wobei es sich mit an Sicherheit grenzender Wahrscheinlichkeit um Excavator handelt. Bisher gab es bereits Anpassungen für BDver1, BDver2 und BDver3, worunter sich die Bulldozer‑, Piledriver- und Steamroller-Architekturen verbargen. Zur Erinnerung, AMDs Architektur-Fahrplan sieht so aus:
Was gibt es also zu berichten? Größte Neuerung, die zwar schon erwartet wurde, aber nun als sicher angenommen werden kann, ist die AVX2-Unterstützung. Intel hat AVX2 vor ein paar Monaten mit seiner Haswell-Architektur in den Markt gebracht. Grob betrachtet handelt es sich dabei um die Erweiterung von AVX auf Integer-Befehle. Bei AVX1 gab es nur Gleitkommainstruktionen. AMD hatte zwar schon ähnliches mit seiner eigenen Erweiterung XOP, allerdings gab es die nur für 128 Bit, während AVX2 natürlich wie AVX1 auch 256 Bit nutzen kann.
Zusätzlich zu AVX2 werden auch noch ein paar weniger bekannte Befehle unterstützt:
- MOVBE: Einzelne Instruktion, ursprünglich von Atom eingeführt, wird seit kurzem auch in allen anderen Chips implementiert
- BMI2: 8 zusätzliche Befehle zur Bit-Manipulation, ebenfalls mit Haswell eingeführt
- RDRAND: Zufallszahlengenerator zur besseren Verschlüsselung, eingeführt mit Ivy-Bridge
AMDs Excavator wird mit Haswell in Sachen Instruktionskompatibilität also fast gleichziehen. Nur fast, denn Intels neue TSX-Befehle, die ebenfalls mit Haswell eingeführt wurden und die Speicherverwaltung mittels Transaktionen ermöglicht, wird nicht genannt. Vermutlich ist dazu ein tieferer Eingriff in den Speicherkontroller nötig.
Spekulationen
Interessant wird sein, wie AMD die AVX2-Befehle implementieren wird. Es ist zu erwarten, dass AMD das FPU-Design ändern wird. Das erscheint bei Integerinstruktionen zwar erst einmal etwas merkwürdig, aber auch XOP lief schon auf der FPU, da die Integerregister nicht 128 Bit breit sind. An 256 Bit ist natürlich erst recht nicht zu denken.
Ob die FPU in Zuge dieser Neuerung auch gleich einen Ausbau auf 2x256 Bit bekommt, ist unbekannt. Nachdem die aktuelle Bulldozer-Architekturen schon keine Kostverächter in Sachen Energieumsetzung sind, sollte man dies aber wohl nicht vor einem Shrink auf den nächstkleineren Node erwarten. Nachdem AMD in letzter Zeit aber nur kleine Schritte macht, für den Serverbereich nächstes Jahr sogar noch einmal einen neuen Prozessor namens Warsaw mit Piledriver-Architektur statt Steamroller bringt, darf man wohl annehmen, dass Excavator kein großer Sprung sein wird und ebenfalls noch in 28 nm produziert wird.
Quellen:
- BDVer4-Patch in der GCC-Mailingliste
- BMI2 | Hardware Secrets.
- Intel Digital Random Number Generator (DRNG) Software Implementation Guide | Intel Developer Zone.
- Analysis of Haswell’s Transactional Memory.
- AMD aktualisiert Opteron-Roadmap bis 2014 — Berlin, Warsaw und Seattle sollen es richten [Update] — Planet 3DNow!
Links zum Thema:
- Verizon nutzt SeaMicro SM15000 Server von AMD für seine Enterprise Cloud [Update] ()
- AMD A10-6700T mit 45 W TDP in Deutschland lieferbar ()
- AMD arbeitet an APU mit ARM-Kernen für den Mobilmarkt ()
- AMD bringt die FX-9000 als “WOX” ()
- AMDs Zukunftsstrategie: Weniger CPU-Last ()
- Kaveri verschoben und keine neuen FX-Prozessoren von AMD [3. Update] ()