News AMD zeigt erste Details zur Bulldozer-Architektur

Nero24

Administrator
Teammitglied
Mitglied seit
01.07.2000
Beiträge
24.066
Renomée
10.446
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2021
2009 sollte sie eigentlich vorgestellt werden, 2011 wird es nun werden, bis AMD die erste komplett neue Kern-Architektur seit dem AMD K7 im Jahr 1999 vorstellen wird. Dabei hielt sich AMD bisher bedeckt, was Details zum neuen Design betraf. Dies ließ natürlich allerhand Spielraum für <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1251380706">Spekulationen</A>.

<center><img src="http://www.planet3dnow.de/vbulletin/attachment.php?attachmentid=16949&stc=1&d=1258013985" alt="" border="1"></center>

Nun jedoch hat AMD erste Details zum Bulldozer veröffentlicht und Kenner der Architektur sehen sofort: da bleibt kein Stein auf dem anderen verglichen mit der Evolutionsreihe K7/K8/K9/K10.

Noch ist das Diagramm recht grob, will heißen man erkennt keine Details zu Busbreiten, Cacheanbindungen, etc. Aber bereits dieses Schema lässt erkennen, dass AMD hier ein paar völlig neue Ansätze realisiert.

Je zwei Kerne treten stets als Duett auf. Das heißt innerhalb dieses Verbundes gibt es lediglich eine Fetch-Einheit, einen Decoder und einen L2-Cache, allerdings zwei voneinander unabhängige Rechenwerke mit ihren jeweiligen Schedulern. Wie bisher gibt es einen für ALU und einen für FP.

<center><img src="http://www.planet3dnow.de/photoplog/file.php?n=8212&w=l" border="1" alt=""></center>

Wie dieses detailliertere Schaubild zeigt, werden L3-Cache und integrierte Northbridge allerdings weiterhin - wie beim K10 - shared für alle Kerne sein. Die Anzahl der ALU-Pipelines wurde offenbar von 3 auf 4 erweitert. Zudem kommt anscheinend eine neue FPU zum Einsatz. Wie breit wohl der Decoder sein muss, um zwei Kerne je 4 ALU-Pipelines und zwei FPUs mit nicht genannter Breite füttern zu können?

Gefertigt wird der Bulldozer in 32 nm SOI Strukturen in Kombination mit high-k Metal Gates, eine Technologie, die Intel bereits seit geraumer Zeit einsetzt und die AMD nach <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1204648113">ursprünglicher Sprachregelung</a> bereits bei einer 45 nm Evolutionsstufe einsetzen wollte.

<center><img src="http://www.planet3dnow.de/vbulletin/attachment.php?attachmentid=16950&stc=1&d=1258014773" border="1" alt=""></center>

Der Codename des ersten Prozessors nach Bulldozer-Architektur wird Zambezi heißen, die zugehörige Plattform Scorpius. Überraschend werden die nagelneuen High-End Prozessoren offenbar in den Sockel AM3 passen, was Upgrader vom Phenom II freuen wird, sofern der Mainboard-Hersteller entsprechende BIOS-Updates zur Verfügung stellt. Der Mainstream-Ableger der Plattform, eine APU nach <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1221724936">Fusion-Konzept</a>, hört auf den Codenamen Llano, die Plattform Lynx. Hier allerdings kommen noch K10-Kerne zum Einsatz, allerdings ebenfalls in 32 nm Strukturen.

Sowohl Zambezi, als auch LIano sollen im Jahr 2011 erscheinen, ebenso wie die Server-Variante des Bulldozer.
 
Kann es sein, dass diese Doppelarchitektur eine Antwort auf SMT ist?
 
Ja, der BD hat das sog. CMT (AMD nennt es anders), was Cluter-based Multi-threading bedeutet.
 
Je zwei Kerne treten stets als Duett auf. Das heißt innerhalb dieses Verbundes gibt es lediglich eine Fetch-Einheit, einen Decoder, einen L2-Cache und einen L3-Cache, allerdings zwei voneinander unabhängige Rechenwerke mit ihren jeweiligen Schedulern. Wie bisher gibt es einen für ALU und einen für FP. Die Anzahl der ALU-Pipelines wurde offenbar von 3 auf 4 erweitert. Zudem kommt anscheinend eine neue FPU zum Einsatz. Wie breit wohl der Decoder sein muss, um zwei Kerne je 4 ALU-Pipelines und zwei FPUs mit nicht genannter Breite füttern zu können?

Woraus entnimmst du, dass je zwei Kerne einen L3-Cache haben?
Auf dieser Folie befindet sich der L3 doch eindeutig außerhalb des Rechtecks, dass das Bulldozer Module repräsentiert.

file.php


Diese Folie trägt dann eher wieder zur Verwirrung bei, da auch der L3 grün umrandet ist. Aber logisch betrachtet, macht ein gemeinsamer von allen Kernen genutzter L3 Cache einfach mehr Sinn.
file.php



MfG @
 
Zuletzt bearbeitet:
Ya, ab in den AM3 damit ;) Wenn die Mobohersteller keinen Murks machen haben wir noch lange freude mit unseren aktuellen Boards :D
 
Woraus entnimmst du, dass je zwei Kerne einen L3-Cache haben?
Auf dieser Folie befindet sich der L3 doch eindeutig außerhalb des Rechtecks, dass das Bulldozer Module repräsentiert.
...und bei der im Artikel verwendeten Folie ist der L3-Cache innerhalb des Rechtecks *noahnung* Wobei eine mehrfach vorhandene NB eigentlich keinen Sinn macht, weswegen das Diagramm wohl "ungenau" ist... :-X Werde das Diagramm aus der Galerie noch zusätzlich mit reinnehmen.
 
Der Codename des ersten Prozessors nach Bulldozer-Architektur wird Zambezi heißen, die zugehörige Plattform Scorpius. Die Mainstream-Ableger davon, eine APU nach Fusion-Konzept, hören auf den Codenamen Llano, die Plattform Lynx.

Hab ich das jetzt in den falschen Hals bekommen? Llano wird auch auf Bulldozer beruhen? Dachte das sei "nur" eine geshrinkte K10 Architektur fusioniert mit einer GPU.

Mfg Byce
 
Überraschend werden die nagelneuen High-End Prozessoren offenbar in den Sockel AM3 passen, was Upgrader vom Phenom II freuen wird, sofern der Mainboard-Hersteller entsprechende BIOS-Updates zur Verfügung stellt.

Das der Zambezi in den Sockel AM3 passt ist in der Tat schön. Macht aber auch Sinn da AMD für die High-End bzw. Enthusiast Platform eine diskrete Grafikkarte vorsieht und da der Bulldozer da kein Fusion Konzept darstellt sehe ich kein Problem warum er nicht in den AM3 Sockel passen sollte.

Ich möchte allerdings anmerken das beim Llano nicht dabeisteht das er in die bisherigen Sockel passt und das halte ich auch für unwahrscheinlich da der Sockel AM3 nicht für die Grafikausgabe ausgelegt ist.

Grüße
Cres
 
Es wurde nicht nur ein Mal editiert, sondern wenn ich es recht mitbekommen habe, sogar zwei Mal. *suspect*

Danke für die Bestätigung, dass ich keine Tomaten auf den Augen habe!

Hab ich das jetzt in den falschen Hals bekommen? Llano wird auch auf Bulldozer beruhen? Dachte das sei "nur" eine geshrinkte K10 Architektur fusioniert mit einer GPU.

Mfg Byce

Llano basiert auf den Stars Cores und ist damit K10. Das wurde mehrfach bestätigt, sogar auf Nachfrage während der Q&A.
 
Also ich verstehe das fragliche Diagramm so, dass der L2-Cache für den Block aus zwei Kernen gilt, während L3 und NB von allen Kernen gemeinsam genutzt werden.
 
Auf der 2. Folie sieht es aber ein bisschen anders aus. Da ist das grün umrandete eine Bulldozermodul. Und dazu zählt der L3 und die NB.
Vllt. pro Bulldozermodul ein Speicherkanal und 2 MB L3 (da kommt man auch auf die speklierten 8MB L3)? Also bei 4 Modulen (8 Threads?) dann Quadchannel RAM ^^
 
Vllt. pro Bulldozermodul ein Speicherkanal und 2 MB L3 (da kommt man auch auf die speklierten 8MB L3)?
Da der L2 Cache schon shared (oder exklusiv für zwei Kerne je nach Sichtweise) ist, macht nur ein unified L3 Cache für alle Kerne Sinn.
Also bei 4 Modulen (8 Threads?) dann Quadchannel RAM ^^
Dann müsste er für den Sockel G34 kommen, was ausgeschlossen ist. Das wäre im Desktop Segment viel zu kostspielig. Dann bräuchte man sicher 8/10-Layer PCBs für die 256-Bit.
 
Ja, der BD hat das sog. CMT (AMD nennt es anders), was Cluter-based Multi-threading bedeutet.

- Spekulation an -
Das Diagramm sieht für mich auch entfernt verwandt mit einem Cell oder einer GPU aus. Also von dem her könnte BD auch das x86 Pendant zum Cell werden.

Die 256-bit Anbindung ist meiner Meinung nach auch eher unwahrscheinlich. Durch die Verwendung von DDR3 1866 Speicher hätte der Bulldozer von Haus aus schon um 40 % mehr Bandbreite als ein K10 mit 1333.
Die L3 Cache wird wohl eher zum Datenaustausch zwischen den Clustern dienen. Eine ähnliche Lösung wie bei Magny -Cours mit den HT Links wäre vielleciht auch ein Ansatz für die NB bei jedem Cluster nur wäre das nach meinem Dafürhalten zu langsam.

- Spekulation aus -
 
Na hoffen wir mal dass die Panierraupe dann am Ende ihrem Namen Ehre macht...
Wenn sie Klug sind, haben sie das Design so ausgelegt dass man z.B. auch 3 Int-Cluster verbauen könnte oder die FPU durch eine GPU ersetzen ;)
Modularität im Sinne von M-SPACE ;)
 
Zwei bisherige Erkenntnisse für mich aus dem Analyst Day 2009...

Thuban - ein Hexacore mit ~ 6 x 2,8 Ghz auf Phenom II Basis in 45nm erscheint Q1/Q2 2010 und ist vermutlich die letzte Upgrade CPU für Sockel Am2+ Boards..

Wenn jemand genauere Infos liefern kann, ob der Sambezi dovch AM2+ abwärtskompatibel sein soll, wäre das Klasse.

Zweitens: Arbeitsspeicher.
Wer heute noch stumpf behauptet, das bei Neukauf einer DDR3 basierten Plattform DDR3 2000 RAM nur sinnloser Overclocking Schrott ist - der wird von mir standrechtlich mit einem 2GB DDR2 RAMriegel gefüttert ;D

Grüße!
 
Wer heute noch stumpf behauptet, das bei Neukauf einer DDR3 basierten Plattform DDR3 2000 RAM nur sinnloser Overclocking Schrott ist...
Dann zeig mir mal eines. Was Geizhals listet beginnt bei 1,650 Volt. Damit ist es kein DDR3-RAM mehr. Der benötigt per Definition nur max. 1,575 Volt.

Also muss man doch wieder zu eingeschränkt DDR3-RAM kompatiblen DIMMs greifen, welche in ~ 70% der Mainboards Ärger bereiten.
 
Intel und AMD haben ihre DDR3 kompatiblem 45nm Prozessoren für bis zu 1,65 Volt freigegeben - bei DDR2 sind es 1,9 Volt. Die Speicherhersteller haben ihre eigenen Normen für ihre Produkte, das geht bei 1,35 volt los und endet bei ~2.0 Volt bei DDR3.. nun könnte man drüber spekulieren, on der Sambezi in 32nm nun nicht für 1,65 Volt freigegeben wird, aber das ist unwahrscheinlich..Derzeit sind +/- 10% Differenz von beiden X86 Anbietern genormt..
Die Jedec - und ich nehme an das du dich darauf beziehst - hat im Endkundenmarkt kein Relevanz. Weder rechtlicher Natur - im Falle von Garantien, Gewährleistungen - noch technischer Natur..

Grüße!
 
Zuletzt bearbeitet:
immernoch am3-sockel?
begrenzt man sich damit nicht schon wieder von vornherein??
aber es heißt ja auch nicht, das nicht doch noch ein neuer sockel kommt.

also ich fände es definitiv nicht schlimm, wenn er nicht mit dem am3 kompatibel wäre, dafür aber um ein VIELFACHES schneller ;)

die müssen bis 2011 viel aufholen, denn intel schläft nicht und klaut ihnen im letzten quartal schonwieder marktanteile...

mfg
 
Intel und AMD haben ihre DDR3 kompatiblem 45nm Prozessoren für bis zu 1,65 Volt freigegeben...
Nein, das ist ein verbreiteter Irrglaube. Diese Freigabe stammt von den Mainboardherstellern und nicht von Intel oder AMD.

Bei Intel heißt es (zum Core i5/i7):
intel80cd.png


Und bei AMD heißt es (zum Phenom II X3/X4):
amd44uh.png


Und was das im Fall von AMD bedeutet ergibt sich aus der JESD79-3 Norm:
jedecj5as.png

Weder rechtlicher Natur - im Falle von Garantien, Gewährleistungen - noch technischer Natur...
Auch das ist ein Irrtum. Die Herstellergarantien von AMD und Intel werden bei einem Betrieb außerhalb der Spezifikationen erlöschen.

Oder wenigstens die daraus resultierenden Schäden nicht abdecken. Hier dargelegt anhand der Garantiebestimmungen von AMD:
This limited warranty does not cover damages due to external causes, including improper use, (...)

Übertakten und das Arbeiten mit Überspannungen ist dabei der Paradefall (abseits der Verwendung als Schlüsselanhänger/Briefbeschwerer).
 
Zuletzt bearbeitet:
Ich hatte das mal hier zusammengefasst.


MfG @
 
@ SPINA
Die Bilder sagen nur aus, das die Memorycontroller Konform zur Jedec Norm sind..Das ist ja die Mindestvorraussetzung. Diese Mindestanforderungen erfüllen auch alle am markt erhältlichen Speichermodule..

Grüße!
 
Es wurde ja schon angemerkt, dass beim Llano kein Sockel angegeben ist. Wäre es nicht aber möglich, dass das von der integrierten GPU berechnete Bild per HT an die Northbridge gesandt wird und diese es dann weiter nach außen leitet? So könnte man hier auch auf einen neuen Sockel verzichten.
 
Diese Mindestanforderungen erfüllen auch alle am markt erhältlichen Speichermodule...!
Dann sag doch gleich, dass du DDR3-2000 Riegel kaufen und mit DDR3-1066 Werte laufen lassen möchtest. Das konnte so niemand ahnen. 8)
Ich hatte das mal hier zusammengefasst.
Du sprichst dort von 1,650 Volt bei Intel. Das stimmt schon, dass Intel diesen Wert anführt. Allerdings garantiert Intel dort weder die Funktionalität, noch die langfristige Reliabilität:

warning_165vddqyqpd.png


Meines Erachtens sollte man den Speicher nicht mit einer Standardspannung betreiben, welche Intel schon als beginnend kritisch ansieht. Eine Freigabe ist darin jedenfalls nicht zu sehen.
 
Zuletzt bearbeitet:
[..]

Meines Erachtens sollte man den Speicher nicht mit einer Standardspannung betreiben, welche Intel schon als beginnend kritisch ansieht. Eine Freigabe ist darin jedenfalls nicht zu sehen.

Das muss auch niemand machen. Die Mainboards stellen es ja selbst schon automatisch so ein.. Um bei Upgrade später mal DDR3 1866/DDR3 1600 mit einem Sambezi zu erzielen ergibt es heute Sinn sehr gute Ramriegel einzukaufen zum Beispiel DDR3 2000 RAM oder schneller der mit 1,65 Volt getestet ist..Bei langsamerer Frequenz wird er wohl kaum mehr Spannung benötigen - das gilt es wie bei jeder Systemkonfiguration im Hiblick auf "Stabilität und Reliabilität" dann auszutesten..
Man kann sich natürlich auch in 2 jahren nochmnal neuen schnelleren RAM einkaufen (in der Hoffnung, das es dann Speicher gibt, der die Frequenzen mit weniger Spannung schafft - hat dann aber in der "DDR3 Ära" doppelt eingekauft..) - oder alternativ auf Speicherperformance verzichten. Insofern kein Geldmangel besteht, der ein Argument wäre zu langsamen RAM zu greifen - gibts keinen plausiblen Grund heute nicht schon zu hochwertigeren Speichermodulen zu greifen - grade bei geplanter, späterer Aufrüstung. Und das hat nicht das geringste mit Overclocking zu tun - obwohl man diese Zusatzmöglichkeit - je nach Geschmack - schon heute haben kann..Der Phenom II hat derzeit ein durch die Architektur definiertes Limit bei DDR3 1904. Und da gibts schon Ramriegel, die das mit <1,65 Volt schaffen, auch wenn der Hersteller die Frequenz nicht offiziell freigegeben hat..

Grüße!

Dann sag doch gleich, dass du DDR3-2000 Riegel kaufen und mit DDR3-1066 Werte laufen lassen möchtest. Das konnte so niemand ahnen. 8)

Eigentlich hast du diese Rabullistik nicht nötig, oder? Dafür gabs übrigens ne negative von mir.
Begründung: Dir dürfte selbst klar sein, das die von dir verwendeten Begriffe und links aus den Technischen Dokumentationen und damit auch die Spannungen im Bezug auf Ramvoltage weder von ASUS, Gigabyte, Asrock, MSI, DFI usw. bei 99% der verkauftern Mainboards im Endconsumersegment verwendetz werden... Im Zusammenhang mit Garantien und Gewährleistungen würde demzufolge jede Garantie beim ersten Booten und abweg ins Bios erlöscht sein. Hunderttausende User können ihre Hardware nicht in Betrieb nehmen ohne die Garantie zu verwirken. Das ist insich sinnbefreit und keine Diskussionsbasis..

Rabulistik (von lateinisch rabire „toben“, oder von rabula „marktschreierischer Advokat“) ist die (zweifelhafte) „Kunst“, wortwörtlich „recht zu haben“ bei einer Sache, die inhaltlich unehrlich ist und nicht vertreten werden kann; also Wortverdreherei oder Haarspalterei. Jemand, der wortverdreherisch und unaufrichtig zu argumentieren versucht, wird Rabulist genannt.

Aus rechtswissenschaftlicher Sicht versteht man unter Rabulistik eine rechtsverdreherische und abwegige Argumentation oder Winkelzüge.
http://de.wikipedia.org/wiki/Rabulistik

Thema für mich erledigt..

Grüße!
 
Zuletzt bearbeitet:
Zurück
Oben Unten