Planet 3DNow! Logo  

 
English Français Русский язык Español Italiano Japanese Chinese

FORUM AKTUELL

   

Sonntag, 1. April 2012

02:08 - Autor: Opteron

AMD arbeitet an Phenom II mit 8 Kernen - Update: Aprilscherz / April fool's joke

AMD-Logo
Nachdem AMD Ende 2011 bekannt gab, 10% seiner Mitarbeiter zu entlassen (wir berichteten), wobei es hauptsächlich die Marketingabteilung traf, war zu befürchten, dass der Informationsfluss an die Medien und Onlinepublikationen stark zurückgehen würde. Umso erfreuter waren wir, als ein Redaktionsmitglied aus seinem fast zweimonatigen Indienurlaub überraschenderweise mit neuem Material aus Bengaluru (früher: Bangalore) zurück kam. Er besuchte dort einen alten Studienfreund, der über sein Engagement in einem lokalen Sportverein enge und freundschaftliche Beziehungen zu mehreren Mitarbeiten einer uns gut bekannten Firma pflegt. Die abendlichen Treffs und Gespräche bei indischem Chai boten dabei Gelegenheit, um in großer Runde über Prozessorarchitekturen und Herstellungsprozessen fachzusimpeln. Um die ganzen Details erklären zu können müssen wir aber weit zurückgehen. Wir beginnen im Jahre 2007:

Der Anfang 2007
Damals wurde AMDs K10-Architektur vom Stapel gelassen und erblickte unter dem Namen "Phenom" das Licht der Mikroprozessorwelt. Auf Planet 3DNow! begleiteten wir die Einführung mit zwei Artikeln (#1, #2). Bei der damaligen Architektur-Präsentation in München betonte der damalige Technik-Direktor Giuseppe Amato besonders die Zukunftsfähigkeit des Designs. Genauso wie der allererste K8-Einkernprozessor (Sledgehammer) im Jahre 2003 schon für zwei Kerne vorbereitet war - was dann Jahre später mit dem AMD X2 Prozessoren ausgenutzt wurde - sei auch das K10-Design für die doppelte Anzahl der Kerne vorbereitet. Also acht anstatt der damals üblichen vier:
Zitat:
The crossbar switch of the K10 core is already prepared for up to 8 cores, Amato boasted. Amato wouldn't give even a vague timeframe for market availability of such a CPU, though he indicated the company is prepared for whatever the market demands. Amato made clear that octo-core is far away in the future – Shanghai will not get 8 cores.
Quelle: http://www.dailytech.com/AMD+Talks+Details+on+K10/article6918.htm

2010: 6-Kerne und ULK
Wie jeder AMD-Interessierte weiß, gab es nie einen 8-Kern-K10-Prozessor. Krönung der K10-Architektur waren die 2010 präsentierten Thuban-Prozessoren mit sechs Kernen, die dementsprechend als Phenom II X6 vermarktet werden. Planet 3DNow! berichtete gewohnt ausführlich in einer mehrteiligen Artikelserie (#1, #2 #3) darüber. Überraschend dabei war der fast gleichbleibende Stromverbrauch gegenüber den 4-Kern Vorgänger. Alle 6-Kerner ordneten sich im 125W-TDP Bereich ein, obwohl anfangs der Produktion sogar einige 4-Kerner ins 140W-Segment eingruppiert werden mußten. Die Erklärung für die Stromknausrigkeit der X6-Chips liegt laut Christopher Neugebauer (Technical Design Lead for AMD Phenom II X6 processor) im erstmalige Nutzen von ultra-low-K Dielektrika (Quelle, p.63). Damit wird die Isolation zwischen den verschiedenen Metallebenen eines Chips verbessert, sodass sich weniger parasitäre Kapazitäten zwischen den Lagen aufbauen können. Damit sinkt der Energieaufwand für den normalen Signaltransport in den Leiterbahnen, kurz: man kommt mit weniger Kernspannung aus. Statt um die ~1,40V werden nur ~1,25V benötigt.

2011: Holpriger Start für Bulldozer, Probleme mit 32 nm
2011 war dann als großes Jahr für die Bulldozer-Architektur geplant. Wir berichteten auch davon gewohnt ausführlich (#1, #2, #3). Zusammenfassend sei hier nur kurz erwähnt, das Vieles nicht so lief wie geplant. Zuerst musste der Verkaufsstart der Chips wegen Produktionsproblemen immer wieder verzögert werden. Statt im Frühjahr wurden die Bulldozerversionen erst im Herbst 2011 präsentiert. Nach dem Start gab es dann oftmals lange Gesichter. Zwar kann die Leistung beim Ausnutzen aller acht möglichen Threads oft überzeugen, aber der Stromverbrauch ist dabei eher unzeitgemäß - trotz einer kleineren Herstellungsprozess-Struktur von 32 nm. Letzteres sollte normalerweise den Stromverbrauch senken. Auffallend ist dabei wieder die relativ hohe Kernspannung um die 1,30V, die ein FX-Chip benötigt. Für einen kleineren Herstellungsprozess ist das im Vergleich zu der PhenomII-X6-Vorgängergeneration mit 45nm keine Verbesserung. Die Vermutung liegt nahe, dass kein ULK zum Einsatz kam. Diese Vermutung wurde später in einer offiziellen AMD Präsentation der Hotchips23-Veranstaltung bestätigt. Dort heißt es unter den Herstellungsparametern nur "Low-k":



(Quelle: http://hotchips.org/uploads/hc23/HC23.19.9-Desktop-CPUs/HC23.19.940-Bulldozer-White-AMD.pdf)


Vermutlich waren die Herstellungsprobleme zu groß, als das man die Probleme mit ULK unter Kontrolle bringen konnte. Der 45nm-Prozess war bei X6-Einführung schon viele Monate für die X4-Herstellung in Betrieb und lief somit weitgehenst störungsfrei mit einer hohen Ausbeute an guten Chips. Der 32nm-Prozess dagegen war nagelneu und man hatte schon genügend mit der besonders ambitionierten HKMG-Einführung (High-K-Metall-Gate) zu kämpfen. Im Gegensatz zu Intel und TSMC entschied man sich bei Globalfoundries das sogenannte "Gate-First" Verfahren zu verwenden. Dabei wird die Transistorbasis aus einem besonders gut leitendem Material (deswegen auch "high-K" und nicht "low-K" zuerst auf den Chip aufgetragen. Vorteil ist eine hohe Kompatibilität zu alten Verfahren, wodurch man sein Chipdesign nicht groß ändern muss. Außerdem wird eine kleinere Die-Fläche gegenüber dem Konkurrenzansatz "Gate-Last" benötigt. Der Nachteil sind aber eben Produktionsschwierigkeiten, denn nach dem Auftragen des Gates folgen noch mehrere Produktionsprozesse bei hohen Temperaturen, die das Gate in Mitleidenschaften ziehen oder gar zerstören könnten. Gate-Last wäre also die "Auf-Nummer-sicher-Lösung" gewesen, Gate-First dagegen eher die aus der Kategorie "Zockerlösung": Hohes Risiko für potentiell viel Gewinn in Form eines ~30% kleinerer Chip-Flächenverbrauchs. Mitte 2011 lief nach einer langen Durststrecke und mehrmaligen Personalwechsels bei Globalfoundries einigermaßen, aber von guten Yields oder gar des ULK-Einsatz war noch nicht zu träumen. Deshalb wurde damals ein Plan-B, für den Fall des Scheiterns entworfen.

Der Plan-B
Damit sind wir wieder am Beginn unseres Artikels. Als Ersatzlösung wurde ein Phenom-II-X8-Design aus Bengaluru genommen, das ein Team von vier Studenten ein Jahr zuvor als Master-Thesis projektierten. Im Rahmen eines dualen Ausbildungspaktes zwischen Forschung und Wirtschaft bekamen sie Zugang auf die originalen K10-Pläne und Bibliotheken. Die Elektrotechnikstudenten entwarfen dabei alle nötigen Routing- und Detailpläne, die fürs spätere Herstellen nötig gewesen wären. Nachdem drei der damaligen Studenten in der Zwischenzeit graduierten und bei AMD India angestellt wurden, waren die nötigen Fachmänner vorhanden. Um die Umsetzung nicht auch noch in die Länge zu ziehen wurde dabei am projektierten 45nm-Prozess festgehalten. Der Status des 32nm-Prozess' war außerdem ja nach wie vor unsicher und die Yields(Ausbeute) der X6-Chips im altbewährten 45nm-Prozess mittlerweile so hoch (deutlich über der 90% Marke), dass man es sich auch trauen konnte, einen noch größeren Chip herzustellen.

Besonderheiten des Phenom II X8
Mit dem 45nm-Prozess kennen wir bereits das erste Kuriosum des "Studentenprozessors". Dabei soll es aber nicht bleiben. Wie in der munteren Feierabendrunde erzählt wurde, entwarf das Studententeam damals einen Prozessor nach dem Motto "viel-hilft-viel", es war beim Schreiben der Arbeit schließlich nur ein hypothetischer Ansatz, ohne Chancen auf einen realen Einsatz. Deshalb sahen die Master-Studenten pro Kern volle 1MB L2-Cache vor. Der X6 muss mit nur 512 kB L2-Cache pro Kern auskommen, hat dabei aber ja sogar zwei Kerne weniger. Erst kürzlich bei den Llano-APUs, die ebenfalls noch auf der K10-Architektur basieren, sah AMD ebenfalls 1MB L2-Cache vor, da im kleineren 32nm-Prozess der Flächenverbrauch nicht mehr so groß ins Gewicht fällt. Beim Stichwort Llano sind wir auch schon beim nächten Punkt. Das "Husky-Design" der Llano-Kerne - manchmal auch K10.6 genannt - stand den Studenten vor knapp 2 Jahren leider noch nicht zur Verfügung, sodass der X8 weiterhin auf den Stand der Shangai- / Deneb- / Thuban-Generation ist. Aber zurück zu den Caches. Auch am L3-Cache wurde Hand angelegt, wenn auch nicht soviel wie am L2. Statt einer Verdopplung gab es nur eine Vergrößerung um 2MB auf 8MB L3-Cache. Als Bonus wurde der L3-Cache dafür in 2 Blöcke á 4MB aufgesplittet, was die Zugriffszeit deutlich verbessert. Bisher konnte pro Takt nur ein Kern auf den L3-Cache zugreifen. Mit vier Kernen geht das noch gut, sechs sind ok, aber bei 8 sollte man langsam an eine andere Lösung denken, was die Studentengruppe dann auch tat. Zum Vergleich: Das aktuelle Bulldozer-Design besitzt gar vier L3-Cacheblöcke á 2MB.

Das Stromverbrauchs-Problem
Soweit so gut, aber es bleibt das reale Problem des Stromverbrauchs. Die Caches verbrauchen eher weniger, das Problem sind die zwei zusätzlichen K10-Kerne. Beim X6 wurde das Problem wie erwähnt mit ULK gelöst, aber was macht man nun beim 8-Kerner, ohne die Taktfrequenzen zu arg beschneiden zu müssen? Die Lösung wurde hier ebenfalls schon erwähnt: HKMG. Da die Fertigungstoleranzen bei einem gröberen bzw. größeren Prozess ebenfalls größer sind, stellten die Produktionsprobleme bei 32 nm kein Problem dar. Außerdem war bei IBM der 45nm-Prozess bereits mit high-K-Metallgates getestet worden. Die ausgezeichneten Charakteristika kann man im folgenden Diagramm von realworldtech.com erkennen:


(Quelle: [url]http://www.realworldtech.com/page.cfm?ArticleID=rwt072109003617&p=11[/url] )


Je besser der Prozess, desto näher sind die Punkte dem oberen, rechten Diagramm-Eck. Neben den beiden 32nm-Prozessen von IBM/Globalfoundies und Intel, findet sich dort auch IBMs/Globalfoundries 45nm HKMG/ULK Prozess. Als einziger Nachteil bleibt eigentlich nur der höhere Flächenbedarf übrig, dafür erhält man aber den unschätzbar wertvollen Vorteil der hohen Ausbeute an funktionierenden Chips.

Das Die
Mittlerweile haben wir aber bereits 2012, die Produktion ist längst angefahren und erste Testchips in der Revision F0 laufen bereits in den Labors. Dank unseres direkten Drahtes können wir deshalb weltexklusiv ein Die-Foto des Phenom II X8 präsentieren:

AMD Phenom II X8
(Quelle: Eigene)


Deutlich kann man im oberen Drittel die 8 Kerne erkennen. Den Vieren in der oberen Reihe folgen nach dem "Meer" von 8x1MB L2-Cache (16 Blöcke, ungefähr in der Mitte des Bildes), vier Kerne darunter. Ganz am unteren Ende ist dann der L3-Cache zu sehen, jeweils 4MB links und rechts. Getauft wurde der Chip auf den Codenamen "Dharmachakra", ein Rad aus der buddhistischen Lehre mit 8 Speichen, die den Weg zur Befreiung symbolisieren sollen.

Vergleichstabelle mit aktuellen Chips
Um den neuen Chip besser einordnen zu können, haben wir uns die Mühe gemacht, in einer Tabelle alle bekannten Chips mit den wichtigsten Charakteristika aufzulisten. Die Reihenfolge von links nach rechts, nach der Kernanzahl sortiert.

CPU PhenomII X8 FX-8150 Xeon X7560 i7-3960X PhenomII X6-1100 i7-990X i7-2600K i7-965 PhenomII X4 980
Codename Dharmachakra Orochi Beckton Sandy-Bridge-E Thuban Gulftown Sandy-Bridge Nehalem Deneb
Sockel AM3/AM3+ AM3+ 1567 2011 AM2+/AM3/AM3+ 1366 1155 1366 AM2+/AM3/AM3+
Aktive Kerne 8 8 8 6 6 6 4 4 4
Herstellungsprozess 45nm SOI/HKMG/ULK 32nm SOI / HKMG 45nm HKMG 32nm HKMG 45nm SOI / ULK 32nm HKMG 32nm HKMG 45nm HKMG 45nm SOI
Chipfläche/Diegröße 494 mm² 315 mm² 684 mm² 435 mm² 346 mm² 240 mm² 216 mm² 263 mm² 258 mm²
L2-Cache-Größe 8 x 1 MB 4 x 2 MB 8 x 256 kB 6 x 256 kB 6 x 512 kB 6 x 256 kB 4 x 256 kB 4 x 256 kB 4 x 512 kB
L3-Cache-Größe 8 MB 8 MB 24 MB 15 MB 6 MB 12 MB 8 MB 8 MB 6 MB
Speicherkanäle 2xDDR3 2xDDR3 4xDDR3 4xDDR3 2xDDR2/3 3xDDR3 2xDDR3 3xDDR3 2xDDR2/3
Max. Speicherstandard DDR3-1600 DDR3-1866 DDR3-1066 DDR3-1600 DDR3-1333 DDR3-1066 DDR3-1333 DDR3-1066 DDR3-1333
Standardtakt 3,4 GHz 3,6 GHz 2,27 GHz 3,3 GHz 3,3 GHz 3,46 GHz 3,4 GHz 3,2 GHz 3,7 GHz
Max. Turbo bei 4 Threads 3,8 GHz 3,9 / 4,2 GHz 2,4 GHz 3,7 GHz 3,3 GHz 3,6 GHz 3,5 GHz 3,3 GHz 3,7 GHz
Max. Turbo bei 2 Threads 4,2 GHz 4,2 GHz 2,4 GHz 3,9 GHz 3,7 GHz 3,6 GHz 3,7 GHz 3,3 GHz 3,7 GHz
TDP 140W 125W 130W 130W 125W 130W 95W 130W 125W
Preis $288 $245 $3838 $990 $205 $999 $316 $990 $165

Wie man sieht ist AMDs neuer Chip nicht gerade klein. Im Vergleich zu Intels ehemaligem Server-Flagschiff "Beckton", wäre die Bezeichnung "riesig" aber unangebracht, "gut im Futter", träfe es wohl am Besten. Die Taktraten sehen ambitioniert aus, aber leider wird die neue CPU trotz HKMG und ULK eine TDP von 140W aufweisen. Wieviel davon Sicherheitsreserve und wie hoch der tatsächliche Stromverbrauch ist, müssen erste Test zeigen. Der Preis des X8 ist noch nicht festgelegt, laut unserer Quelle ist aber ein konkurrenzfähiger Preispunkt um 300 US-Dollar geplant. Als Launch-Termin ist - wie es sich für eine 8-Kern-CPU gehört - der 08.08.2012 eingeplant. Genau Produktnummern sind noch nicht bekannt, laut Gerüchten soll das Spitzenmodell aber die Typennummer "1880t" bekommen.

Fazit für 2012: Totgeglaubte leben länger: Acht K10-Kerne und 45nm
Wer hätte es gedacht, die K10-Architektur als auch der alte 45nm-Prozess frisch und munter im Jahre 2012. Oft wurde AMD kritisiert, dass man anstatt des missglückten Bulldozer-Designs doch besser einen PhenomII-X8 gebracht hätte, dies ist nun der Fall. Manchmal werden Wünsche doch wahr.

Update 02.04.2012:
Wie viele Leser bereits erkannt haben, handelt es sich bei diesem Artikel um unseren Aprilscherz. Ich hoffe dass es allen Spass gemacht hat.

English:
Many readers already recognized it: This article was our April fool's joke 2012. I hope everybody had fun reading it.

Links zum Thema:Quellen:
» Kommentare
Planet 3DNow! RSS XML Newsfeed Planet 3DNow! Newsfeed bei iGoogle-Seite hinzufügen Planet 3DNow! Newsfeed bei My Yahoo! hinzufügen Planet 3DNow! Newsfeed bei Microsoft Live hinzufügen Planet 3DNow! Newsfeed bei My AOL hinzufügen

Weitere News:
Intern: Umleitungsprobleme
Intern: Planet 3DNow! ab 18:00 Uhr eingeschränkt erreichbar
Never Settle Forever: AMD überlässt Zusammenstellung der Spielebündel seinen Kunden
Microsoft Patchday August 2013
Der Partner-Webwatch von Planet 3DNow! (13.08.2013)
Kühler- und Gehäuse-Webwatch (11.08.2013)
Ankündigung Microsoft Patchday August 2013
Vorerst kein Frame Pacing für AMD-Systeme mit Dual Graphics
Intern: kommende Woche eingeschränkte Erreichbarkeit auf Planet 3DNow!
Kaveri verschoben und keine neuen FX-Prozessoren von AMD [3. Update]
AMD plant Vorstellung neuer High-End-Grafikkarte Hawaii im September
Kaveri verschoben und keine neuen FX-Prozessoren von AMD [Update]
Der Partner-Webwatch von Planet 3DNow! (06.08.2013)
Kaveri verschoben und keine neuen FX-Prozessoren von AMD
AMD startet neue "Never-Settle-Forever"-Spielebündel für Radeon Grafikkarten
Neuer Artikel: SilverStone Fortress FT04 - Die Hardware steht Kopf

 

Nach oben

 

Copyright © 1999 - 2019 Planet 3DNow!
Datenschutzerklärung