AMD Zen 3 Architektur im Detail - Änderungen – INT und FP Execution

Artikel-Index:

Einheiten

Sobald alle Befehle dekodiert und geladen sind, die Daten geholt und in der Queue bereit zur Bearbeitung, beginnt die eigentliche Berechnung durch die Ausführungseinheiten. Deren Anzahl hat AMD abermals erhöht, das Design ist also nochmal breiter geworden. Zen 3 hat nun nicht weniger als 16 Ausführungseinheiten nebeneinander je Kern (vorher 11).

Wie üblich bei allen AMD-Designs der letzten Jahrzehnte ist der Integer-Bereich getrennt vom Fließkomma-Bereich. Die INT-Scheduler fassen nun insgesamt 96 Einträge (vorher 92). Interessant ist aber, dass es nur noch 4 davon gibt (vorher 7). Die neuen Scheduler teilen sich nun jeweils eine ALU (Arithmetic Logic Unit) und eine AGU (Address Generation Unit). Laut AMD soll dies zu einer ausgeglicheneren Lastverteilung gemittelt über verschiedene Workloads führen. Leider geht AMD nicht tiefer darauf ein, wie es zu dieser Designentscheidung gekommen ist und wo man sich Vorteile davon verspricht.

Das Physical Register File hat nun 192 Einträge (vorher 180), der Re-order Buffer (ROB) 256 statt 224.

Auch bei der Fließkomma-Einheit setzt AMD voll auf kürzere Latenzen und höhere Bandbreite. Auch hier wurde der Scheduler vergrößert. An der Breite hat sich aber nichts geändert. Hier fand die letzte größere Designänderung bei der Umstellung von Zen 1 auf Zen 2 statt, wo die Breite von 128 auf 256 Bit erhöht wurde. Wie schon bei Zen 1/2 und Bulldozer ist die Fließkomma-Einheit als FMAC-Einheit ausgeführt, kann also Fused multiply-add und Multiply-Accumulate.

Befehlssatz

Abgesehen von der größeren Anzahl an Ausführungseinheiten hat AMD Zen 3 auch einen größeren Befehlssatz spendiert. Die CPU beherrscht also Befehle, die der Vorgänger noch nicht konnte. Im Gegensatz zu früheren Generationen, wo mit schmissigen Bezeichnungen wie SSE oder AVX ganze Befehlsfamilien eingebaut wurden, sind es dieses Mal nur einzelne Zusatzbefehle, die Zen 3 nun zum Vorteil gereichen sollen. Zum einen geht es um Sicherheitsfeatures – hier ist die Control-flow Enforcement Technology (CET) zu nennen, die vor Return Oriented Programming Attacken (ROP attack) schützen soll – zum anderen gibt es nun MPK (Speicherschutz) und VAES/VPCLMULQD (AVX2-Support) als neue Befehle. Insbesondere Vector AES könnte bei den Krypto-Minern auf Interesse stoßen, das nun in AVX2, also 256 Bit Breite ausgeführt ist. Erste Miner-Hersteller haben bereits angekündigt, es unterstützen zu wollen.

Smart Access Memory

Eigentlich ein Feature, das die kommende Radeon RX 6000 (RDNA2) mitbringt. Allerdings ist für die Nutzung ein Chipsatz der 500er Serie und ein Ryzen 5000 nötig. Damit kann der Prozessor auf den kompletten Speicherbereich der Radeon-Grafikkarte zugreifen, was in einigen Spielen zusätzlich ein paar Prozent Leistung freisetzen soll.