News Bulldozer-Architektur unter der Lupe: Schwachstellen identifiziert

Na ja, der Bulldozer wird immer mit den Sandy Bridge Modellen verglichen die bekantlich eine geringere TDP vorweisen können. (IGP inklusive)


Wenn man wissen will wo AMD z. Z. steht muss man ihn schon mit dem Core i7 3960X vergleichen. Da die TDP fast gleich ist.

http://ht4u.net/reviews/2011/intel_.../index40.php?dummy=&advancedFilter=false&prod[]=AMD+FX-8150+[3%2C6+GHz%2C+4+Module%2C+CMT%2C+Turbo]&prod[]=Intel+Core+i7+3960X+[3%2C3+GHz%2C+6+Kerne%2C+HTT%2C+Turbo]

Insgesamt gesehen fehlen da mindestens 45%.

Da muss schon ein Wunder geschen wenn sie in zwei Jahren aufschliessen wollen.
HMmhm ... naja wenn sie mit dem neuen Clock-Grid wirklich 30% Strom einsparen können und das dann auch noch 1:1 in Leistung umsetzten könnten, wärens nur noch 15%. Soviel IPC-Plus sollte bis Steamroller eigentlich auch noch drin sein. Frage ist halt, ob das wirklich so 1:1 geht .. ich glaubs eher nicht ^^
Wie dem auch sei, Intel hat halt bis dahin Haswell und v.a. 22nm am Start. Da werden die Blauen weiter ähnlich vorne sein. Aber solange AMD nicht den gleichen Preis verlangt, wird man sich damit wohl arrangieren können. Der FX8150 kostet ja auch etwas weniger als der 3960 *g*
 
Nur das die dann für AM3+ sein sollen. Dort is bisher nix unter 95W , u. erst recht keiner mit 65 W.
OK, dafür sinds beim 3280SE auch "nur" 2,4GHz.
Frage mich allerd grad was da der Unterschied zu dem Opteron 3280 HE sein soll.

http://www.computerbase.de/news/2011-11/amd-kuendigt-stromsparende-1-sockel-server-cpus-an/
Na keiner, beidemale gehts um den 3280, nur haben sie in der "Jetzt verfügbar Meldung" fälschlicherweise 3200 geschrieben. Auf den japanischen Werbeschildern kann man aber ganz deutlich 3280 lesen ;)
 
Ich persönlich frage mich nur wieso der Bulldozer so fertig gemacht wird.
Im Gegensatz zu anderen alten CPUs arbeiten die Dinger stabil und schnell.

Ja sie könnten schneller sein, aber es ist auch von Grund auf ein neues Design.
Ist doch völlig klar das die Dinger jetzt langsam schneller werden.

Guckt eucht mal die Erste CPU mit K7 Technology an... 500MHz und die Leistung war... naja.
Dann stieg erstmal der Takt bis 1400Mhz
Dann kamen SSE + 3Dnow Prof. und der Takt stieg bis 2300MHz und wurde dabei stetig schneller (pro Mhz).
Jetzt bohrte AMD die CPU nochmal grundlegend auf und implementierte 64Bit.
die gab es dann bis 2800MHz, zeitgleich kamen dann die X2.
Und hat das ganze dann nochmal aufgebohrt und Phenom I X4 von 1800Mhz-2600Mhz rausgehauen.

Darauf basierte dann der Phenom II von 2,5-3,7Ghz mit bis zu 6Kernen.

Der Spass hat ingesamt 1999-2007 gedauert bist es dann zur schnellsten K7 based CPU überhaupt kam.

Also 8 Jahre.
Der Bulldozer kam 2011... hat also (wenn man betrachtet das die Technik immer schneller fortschreitet min. noch 4Jahre zum reifen zeit ;)
 
Guckt eucht mal die Erste CPU mit K7 Technology an... 500MHz und die Leistung war... naja
Man war zumindest deutlich schneller unterwegs als mit einem K6-II/III. Nur der hohe Stromverbrauch und die miserablen Chipsätze waren von Anfang an Schwachstellen.

Ich würde eher den Pentium 4 als Beispiel anführen. Der war zu Beginn kaum schneller als der Pentium III und kam erst später (Wechsel Willamette/Northwood) in Fahrt.
 
Eine CPU die eher ein Rückschritt ist, zumindest im Desktopbereich, ist nicht das, was man als Hersteller anbieten sollte.
Also, die T-Birds waren sehr gute CPU, und der Athlon XP war es größtenteils auch.
Vor allem, das waren CPU die sich Locker mit den Intel CPU messen bzw. auch überflügeln konnten.
Der Bullie kann ja nicht mal die Phenom in die Schranken weisen, von den Core i7 erst garnicht zu reden.
Tut mir leid, ich bin kein AMD schönredner.
 
Prima Zusammenfassung - so kann sich auch der interessierte Laie ein Bild machen.:)

Es zeigt sich immer mehr, dass BD irgendwie nicht zu ende gedacht wirkt und zu schnell auf den Markt kam - dem hingegen spricht die gefuehlte ewige Entwicklungszeit.

AMD kann es besser - denn wenn diese Dinge so stimmen, dann sind sie so auch AMD bekannt - und man wird diese Macken hoffentlich auswetzen...

Noch scheint das Modulkonzept eher zu behindern als den grossen Erfolg zu versprechen...oder truegt der Eindruck!?
.
EDIT :
.

...
Tut mir leid, ich bin kein AMD schönredner.

Wenn man ehrlich ist, hat AMD im absoluten Speedrennen auf dem Desktop erst einmal den Anschluss mit BD noch mehr verloren...aber es gibt Hoffnung.

Und wie heisst es so schoen - auch ein PhX4 reicht fuer 99%...dann tut es auch ein BD..,. ;-)
 
Ich würde eher den Pentium 4 als Beispiel anführen. Der war zu Beginn kaum schneller als der Pentium III und kam erst später (Wechsel Willamette/Northwood) in Fahrt.
Wesentlich langsamer war der Willamette, zumindest bei der Taktleistung.
Und dabei noch nicht mal die abgespeckten CPU mit normalen Ram und nicht RD-Ram.

Edit
@TNT
Klar da haste schon recht, aber dafür braucht man keine neue CPU Entwickeln die so gut wie keinen Vorteil bietet.
Zumindest hätte man erwarten können das AMD aus dem Phenom 1 was gelernt hätte.

Ach was solls.
Mein Zweikerner reicht doch auch Locker zu 100% für mich, und für die meisten "Normalos" ebenfalls.
Wenn ich sonst zuviel stromfressendes Gerümpel im PC habe, spare ich wenigstens bei der CPU ziemlich Watt ein.
 
Zuletzt bearbeitet:
...

Also 8 Jahre.
Der Bulldozer kam 2011... hat also (wenn man betrachtet das die Technik immer schneller fortschreitet min. noch 4Jahre zum reifen zeit ;)

Ich darf kurz bemerken, dass das zwar so gesehen werden kann - aber BD wird diese Zeit nicht haben - denn wenn es solange dauern sollte, sind bei AMD die Lichter schon fast aus in diesem Segment. Es muss also schneller fuer BD passieren....

Du muss was kommen und da wird was kommen..oder so...
 
Ich darf kurz bemerken, dass das zwar so gesehen werden kann - aber BD wird diese Zeit nicht haben - denn wenn es solange dauern sollte, sind bei AMD die Lichter schon fast aus in diesem Segment. Es muss also schneller fuer BD passieren....

Du muss was kommen und da wird was kommen..oder so...
Sehe ich anders. Brazos ist AMDs meistverkauftes Produkt, das geht weg als wärs gratis *g*
Je mehr sie in dem Segment wachsen, desto weniger stehen sie bei BD unter Druck und könne das Teil noch "päppeln" ;-)
Wie schon öfters gesagt: Steamroller muss es reißen, das muss AMDs Northwood werden :)

Wobei der Schritt von 32 auf 28nm eventuell recht mickrig ausfallen könnte. Wenns auch noch TSMC-28nm sein sollte, dann erst recht.
Ansonsten machen sie sich aber schon relativ viel Stress, nach Vishera soll 2013 ja anscheinend noch ne Art Vishera 2.0 kommen, also jedes Jahr ein kleines(?) Update, das geht eigentlich relativ fix.
Aber gut: Sie haben eben auch ziemlich viel zu tun *lol*
 
Prima Zusammenfassung - so kann sich auch der interessierte Laie ein Bild machen.:)

Es zeigt sich immer mehr, dass BD irgendwie nicht zu ende gedacht wirkt und zu schnell auf den Markt kam - dem hingegen spricht die gefuehlte ewige Entwicklungszeit.

AMD kann es besser - denn wenn diese Dinge so stimmen, dann sind sie so auch AMD bekannt - und man wird diese Macken hoffentlich auswetzen...

Noch scheint das Modulkonzept eher zu behindern als den grossen Erfolg zu versprechen...oder truegt der Eindruck!?

Quatsch.

Bulldozer kam/kommt wenn überhaupt zu spät. Hätte es mit Bulldozer@45nm geklappt, wäre man gegen Nehalem/Westmere angetreten und hätte u.U. @32nm sogar mit Sandy Bridge gleichziehen (P/W) können während man Fehler/Unzulänglichkeiten die sich im Massenbetrieb ergeben hätten, weitesgehend beseitigt hätte. Das hätte natürlich wiederum einen einigermaßen ausgereiften 32nm-Prozess vorausgesetzt.:P

Hätte/sollte/wäre/konnte.


@yasu Einfach nicht drauf reagieren (ich wäre beinahe auch dem Reflex erlegen konnte mich aber zurückhalten als ich sah, dass das Geschwafel niemanden tangiert:)).

Als Laie mit unzähligen imaginären Bachelor's und Master's degrees ist es halt einfach unwiderlegbare Behauptungen aufzustellen.
 
Sehe ich anders. Brazos ist AMDs meistverkauftes Produkt, das geht weg als wärs gratis *g*
Je mehr sie in dem Segment wachsen, desto weniger stehen sie bei BD unter Druck und könne das Teil noch "päppeln" ;-)...

Halt ich meinte ja nicht, dass bei AMD die Lichter ausgehen als ganzes, sondern in dem Segementen in denen BD die Fahne hochhalten muss. Ich bin mir sicher, dass da etwas kommt... aber ich bin mir auch sicher, dass BD nicht die Reifezeit bekommen kann, wie die 'K7' Architektur - mehr wollte ich gar nicht sagen...
.
EDIT :
.

Quatsch.

Bulldozer kam/kommt wenn überhaupt zu spät. Hätte es mit Bulldozer@45nm geklappt, wäre man gegen Nehalem/Westmere angetreten und hätte u.U. @32nm sogar mit Sandy Bridge gleichziehen (P/W) können während man Fehler/Unzulänglichkeiten die sich im Massenbetrieb ergeben hätten, weitesgehend beseitigt hätte. Das hätte natürlich wiederum einen einigermaßen ausgereiften 32nm-Prozess vorausgesetzt.:P

Hätte/sollte/wäre/konnte.

....
Nun ja, das ist wohl nun ganz grosse Wenn/Haette Spekulation... oder !??
Vielleicht haette ich schreiben sollen, dass Modulkonzept in Version I des BD, was scheinbar noch nicht ueberzeugend agieren kann!?
 
Sehe ich anders. Brazos ist AMDs meistverkauftes Produkt, das geht weg als wärs gratis *g*
Je mehr sie in dem Segment wachsen, desto weniger stehen sie bei BD unter Druck und könne das Teil noch "päppeln" ;-)

Ob es gut ist das sie nicht unter Druck stehen?

Je mehr Erfolg der Low-Performance-Sektor hat je weniger tut AMD im High-Performance-Bereich; ist zumindest meine Befürchtung :-/
 
Ob es gut ist das sie nicht unter Druck stehen?

Je mehr Erfolg der Low-Performance-Sektor hat je weniger tut AMD im High-Performance-Bereich; ist zumindest meine Befürchtung :-/
Ne passt schon, wie besagt, die hauen jetzt jedes Jahr ein neues Modell raus, das wird (hoffentlich ^^).
So ne Art Tack tuck tuck tuck *lol*
 
Vom Geräusch her gefällt mir ohnehin ein 1 Zylinder 4 Taktmotor besser als ein Wecker! *buck* *hust* hoffentlich beweist AMD genug Hub für die *tucks*...
 
Nun, das Meiste davon hatten wir ja schon im Wesentlichen zusammenspekuliert.
Das mit der L1-Bandbreite ist in der Tat etwas komisch und diese Einschränkung mit den Cache-Blocks, die im extremfall dafür sorgen dass nur 1 Operation pro Takt in den cache gehen kann ist irgendwie doof.
Das sind aber sachen die sich beheben lassen sollten.
Beim Decoder ist der Fall schwieriger, macht man ihn so breit dass er alles gleichzeitig befüttern kann, stellt sich die Frage was man durch CMT noch spart?
Möglicherweise würde es reichen eine "krumme" Zahl zu benutzen, also z.B. 5 Dekoder z.b. sodass man zwar noch eine ersparnis gegenüber 2 vollen cores hat, aber dennoch spitzen besser abfangen kann. Natürlich sollte das ding auch nicht komplett stillstehen wenns micro-Ops zu dekodieren gibt und die Penalty für viele Prefixes ist auch irgendwie happig.
Ein Redirect-Recovery-Cache zwischen Decoder und Int-cores könnte auch etwas Druck vom Frontend wegnehmen, gerade bei Schleifen.
Alles in Allem sieht mir das aber irgendwie so aus als wären behebbare Baustellen. Keien grundsätzlichen Architekturprobleme sondern eher sachen wo man denkt der Ingineur ist gegangen bevor BD fertig war und ein anderer musste das schnell fertigbasteln ohne genau zu verstehen wie das dedacht war.... *noahnung*
Wenigstens hat sich nun ein Fachkundiger das Ganze mal angesehen und die Schwächen detailiert aufgelistet. (Danke Dr. Agner Fog)
Nun kann man bei Trinity und Steamroller nachher genau die Punkte auf Verbesserungen abklopfen und sehen wo Fortschritte gemacht wurden.
Dennoch muss man Attestieren, dass BD es trotz all dieser Handbremsen (und sub-optimaler Fertigung) schafft, sich mit einem 2500K zu prügeln, also so total verkehrt kann die Architektur auch nicht sein.
Interessant wäre nun noch, genau die selben Daten mal bei einem Bobcat auszumessen und dann jeweils mit BD im single-Thread Betrieb zu vergleichen. Würde mich nicht wundern wenn die Katzen da besser dastünden.
 
:-/
Sehe ich anders. Brazos ist AMDs meistverkauftes Produkt, das geht weg als wärs gratis *g**

Was viel damit zu tun hat, dass es fast gratis ist ...... :]

Je mehr sie in dem Segment wachsen, desto weniger stehen sie bei BD unter Druck und könne das Teil noch "päppeln" ;-)
Wie schon öfters gesagt: Steamroller muss es reißen, das muss AMDs Northwood werden :)


Nordholz wird nicht reichen, inzwischen bräuchten die wohl eher dringlichst einen Conroe !!
Und das "kleine Schwarze" (Brazis&Co.) zaubert wohl mal ein kurzes Lächeln, bringt AMD aber mittelfristig nicht weiter, der Markt ist trotz seiner Grösse letztendlich überschaubar , der Gewinnanteil nicht gerade riesig und zudem gerät dieses Eckchen jetzt massiv unter Druck durch ARM !


Ansonsten machen sie sich aber schon relativ viel Stress, nach Vishera soll 2013 ja anscheinend noch ne Art Vishera 2.0 kommen, also jedes Jahr ein kleines(?) Update, das geht eigentlich relativ fix.

Papier,.... Papier ist geduldig !.... :-/

Mmoe
 
Es sei denn Haswell wird die IPC-Bombe schlechthin *buck* Aber technisch gibts dafür eigentlich keinen Hinweis. Sandy dürfte schon recht gut auf ne Durchschnitts-IPC von 2++ kommen, recht viel mehr geht eigentlich nicht. Außerdem geht Intel auch deutlich Richtung Energiesparen, sieht man schon bei Ivy. Anstatt ner 4 GHz Version wird die TDP auf 77W begrenzt.
Wobei Haswell wieder die gewohnten 95 W TDP hat. Und die braucht er sicherlich nicht nur aufgrund von mehr Takt. Warum IB so eine "krumme" TDP hat, ist mir unklar.


Na ja, der Bulldozer wird immer mit den Sandy Bridge Modellen verglichen die bekantlich eine geringere TDP vorweisen können. (IGP inklusive)


Wenn man wissen will wo AMD z. Z. steht muss man ihn schon mit dem Core i7 3960X vergleichen. Da die TDP fast gleich ist.

http://ht4u.net/reviews/2011/intel_.../index40.php?dummy=&advancedFilter=false&prod[]=AMD+FX-8150+[3%2C6+GHz%2C+4+Module%2C+CMT%2C+Turbo]&prod[]=Intel+Core+i7+3960X+[3%2C3+GHz%2C+6+Kerne%2C+HTT%2C+Turbo]

Insgesamt gesehen fehlen da mindestens 45%.
Es gibt nur ein 4- und ein 8-Kern SB-E Die. Die Modelle mit 6 Kernen, wie der i7-3960X, sind also teilkastrierte Modelle des 8-Kern Die. Vergleichen wir also doch mal mit einem teilkastrierten Orochi, wie dem FX-6100. Auch hier wurden 25% der Kerne abgeschaltet. Im Rating für Anwendungen (multi-threaded) liegt der i7-3960X 89% vorn, braucht dafür unter Volllast aber auch 88% mehr Energie. Wo du da das Fehlen von 45% siehst, ist mir unklar. Bezüglich Energieeffizienz nimmt sich das kaum was. Halt alles eine Frage des Blickwinkels. ;)
 
:-/

Was viel damit zu tun hat, dass es fast gratis ist ...... :]




Nordholz wird nicht reichen, inzwischen bräuchten die wohl eher dringlichst einen Conroe !!
Und das "kleine Schwarze" (Brazis&Co.) zaubert wohl mal ein kurzes Lächeln, bringt AMD aber mittelfristig nicht weiter, der Markt ist trotz seiner Grösse letztendlich überschaubar , der Gewinnanteil nicht gerade riesig und zudem gerät dieses Eckchen jetzt massiv unter Druck durch ARM !




Papier,.... Papier ist geduldig !.... :-/

Mmoe

Ich dachte immer der Gewinn ergibt sich durch Stückzahl x gewinn pro stück.
Das heisst, egal wie minimal der Gewinnanteil auch sein mag, 1. ist der absatzmarkt riesig, 2. kostet die Herstellung fast nichts und 3. versorge ich lieber 3 Milliarden chinesen für 10 dollar pro Stück als 10000 Enthusiasten für 200.
Von den R&D-Kosten ganz zu schweigen, die bei Brazos gerade zu minimal sein dürften gegenüber Bulldozer und co.
Wieviel Druck ARM in der Praxis wirklich ausüben kann muss sich erst noch zeigen. Tablets sind keine PCs, trotz aller Bemühungen zu irgendwelchen hybriden. Selbst windows 8 ist kein allheilmittel und wird ARM zwar etwas rückenwind geben, aber es läuft trotzdem noch lange nicht alles auf ARM.
Zumal die erstmal GPU-Leistung vom Schlage einer Radeon unter Beweis stellen müssen.
Samsung schafft es ja nichtmal die GPU des Galaxy S2 unter Android ans laufen zu kriegen. :]

Also noch ist nicht aller Tage Abend.
Man sollte auf dem Teppich bleiben und sich ansehen was da ist:
1. jede Menge GPU-KnowHow.
2. eine neue Architektur mit Potenzial, braucht etwas Pflege, aber ist nicht hoffnungslos.
3. Im Mobilbereich ist man mit einem quasi konkurrenzlosen Produkt herrvorragend Positioniert und kann das noch weiter ausbauen.

Ein "Conroe" (warum vergisst hier eigentlich jeder Banias, Dothan und Yonah?)
Ist auch kein Wundermittel.
Opteron wollte wohl damit ausdrücken dass Steamroller für BD in etwa das werden muss was Northwood für den P4 (Wilamette) war.
Zu meinen man schüttelt sich "mal eben" einen Conroe aus dem Ärmel ist utopisch. Und die alte Leier dass ein 32nm K10 besser gewesen wäre ist ebensowenig zielführend. Nicht zu beweisen. Nebenbei erwähnt Agner Fog zwar die 2-Fach auslegung der ALUs als potenziellen Bremsklotz, aber bei all den anderen Problemen ist das das allerkleinste übel. AMD hat (wiedereinmal) Probleme mit dem Frontend. Ebenso ist wie schon 1000 fach runtergebetet, das cachedesign auch nicht grade ausgeklügelt.
Hier scheint mir viel "drehmoment" verloren zu gehen. - Dennoch gibt es Paradedisziplinen und Codesequenzen wie anscheinend (zufällig oder nicht) einiges richtig machen und BD auf die richtige Art und Weise befüttern sodass er ordentlich rennt. *noahnung*
Erstmal sehen wie inwieweit Trinity/Piledriver die Ecken abschleift, man holt ja in Sachen Featureset (FMA3) auch wieder Richtung Ivy Bridge auf.
Wenn sie dann mit Steamroller noch die anderen Flaschenhälse angehen, ist bereits so einiges gekonnt IMHO. Die Integration der GPU hin zum Kohärenten Speicher wird auch noch einige ganz andere Möglichkeiten eröffnen. Sogesehen, kann man auch längerfristig noch eine Rolle spielen ohne sämtliche Benchmarks anzuführen.
 
Wobei Haswell wieder die gewohnten 95 W TDP hat. Und die braucht er sicherlich nicht nur aufgrund von mehr Takt. Warum IB so eine "krumme" TDP hat, ist mir unklar.



Es gibt nur ein 4- und ein 8-Kern SB-E Die. Die Modelle mit 6 Kernen, wie der i7-3960X, sind also teilkastrierte Modelle des 8-Kern Die. Vergleichen wir also doch mal mit einem teilkastrierten Orochi, wie dem FX-6100. Auch hier wurden 25% der Kerne abgeschaltet. Im Rating für Anwendungen (multi-threaded) liegt der i7-3960X 89% vorn, braucht dafür unter Volllast aber auch 88% mehr Energie. Wo du da das Fehlen von 45% siehst, ist mir unklar. Bezüglich Energieeffizienz nimmt sich das kaum was. Halt alles eine Frage des Blickwinkels. ;)
Es sind nicht 88%, sondern 60% (du hast wohl mit der TDP von 150Watt verglichen).
Was allerdings noch interessant wäre, die GFlop-Angabe zu Linpack (das Programm was HT4U für die Loadsimulation verwendet) bzw. die GFlop/Watt als irgendein Anwendungsmix.
 
Es sind nicht 88%, sondern 60% (du hast wohl mit der TDP von 150Watt verglichen).
Für maximalen Turbo werden aber 150 W erlaubt bzw benötigt. Und dann sind es eben 88% mehr, nicht 60%.
 
Zurück
Oben Unten