Bulldozer - AMD Fam 15h - allgemeiner Infothread

Sagt mal, hat mal jemand anderes außer dem Typen aus dem XS-Forum diese "Modul-Problematik" rekonstruiert bzw. nachgemacht?

Also, dass 4 "halbe" Module (4 Threads) wesentlich besser arbeiten als 2 volle Module (auch 4 Threads)?

Dazu will ich in einem kommenden Artikel noch etwas schreiben. Bisher habe ich lediglich in einer einzigen Anwendung 4C/4T mit 2C/4T verglichen. Ergebnis: 4C/4M war 15 Prozent schneller. Aber wie gesagt: Eine einzige Anwendung, zu mehr bin ich noch nicht gekommen.
 
Dazu will ich in einem kommenden Artikel noch etwas schreiben. Bisher habe ich lediglich in einer einzigen Anwendung 4C/4T mit 2C/4T verglichen. Ergebnis: 4C/4M war 15 Prozent schneller. Aber wie gesagt: Eine einzige Anwendung, zu mehr bin ich noch nicht gekommen.
Auf dich ist Verlass MIML ;D
War der Performance-Sprung beim XS-Nutzer nicht aber höher? ???
 
Du begehst weiterhin den Fehler Bulldozer-Server mit Bulldozer-Desktop gleichzusetzen.

Ja, sie basieren auf der gleichen Architektur, ja sie haben den gleiche Die und werden in der gleiche Produktionsstätte hergestellt.

Aber...Valencia und Interlagos arbeiten erstens bei deutlich... deutlich niedrigeren Basistakten (logisch, da Server) und dadurch deutlich sparsamer, nein es ist sogar möglich einen Interlagos 16K/8M Chip mit einer TDP von 85 Watt "herzustellen". Der läuft dann nur mit 1,6 GHz aber man hat dann eben 16 Kerne zur Verfügung, in einem Sockel. Das höchste der Gefühle ist ein mit 2,6 GHz getakteter Interlagos mit einer TDP von 140 Watt, das "alte" Magny-Cours Top-Modell hat 12 Kerne und taktet bei 2,5 GHz, und hat ebenfalls ein TDP von 140 Watt.

Dann gibt es Valencia 8-Kern Opterons mit einer TDP von 65 Watt und sogar EE-Versionen mit nur 35 Watt, die mit 2,5 GHz takten.

All das sagt uns dass GlobalFoundries offenkundig Probleme mit höheren Takten hat (FX-8150), denn die Leistungsaufnahme steigt mit Turbo enorm an und mit Übertaktung exorbitant. Und genau das sieht man beim Desktop-Bulldozer.

Und genau deswegen darf man nicht Bulldozer als Gesamtkonzept verteufeln, bloß weil er im Desktop nicht die übersteigerten Erwartungen erfüllt hat und sich nicht deutlich vom Vorgänger-Desktopprozessor abhebt.


Aber ich glaube das interessiert gar nicht. "Hier" (und damit meine ich natürlich nicht diesen Thread explizit) wird gar nicht darüber diskutiert warum Zambezi nicht funktioniert sondern es wird immer wieder explizit Bulldozer in seiner Gesamtheit herangezogen, wohlwissend dass man darüber abschließend gar nichts sagen kann.


Und genau deswegen ist deine Aussage nicht nur unfundiert, ohne Grundlage, sondern gefärbt von den Ergebnissen die du bei der "FX-Serie" gesehen hast. Diese auf Valencia und Interlagos zu projizieren ist unvernünftig.
.
EDIT :
.

Um das mit der Leistungsaufnahme nochmal zu verdeutlichen:


http://translate.googleusercontent....8.html&usg=ALkJrhgf04SDeZrU2CIYy-Uf1-9V3uQCpg (Fränglisch)

Fritz Benchmark Ergebnisse
IMG0033836.gif


Leistungsaufnahme der einzelnen Bulldozer-"Kernkonfigurationen"
IMG0033837.gif


Und die daraus folgende Effizienz
IMG0033838.gif


Der Turbo ist in diesem Beispiel schlicht zu ineffizient.

Um den oder die anderen Threads mal nicht zuzumüllen...

Die Erkenntnis dass Bulldozer ein Oberbegriff für die Architektur und daraus Desktop und Server Modelle abgeleitet werden ist ja nicht neu. Nur - das eine schließt das andere ja nicht grundsätzlich aus. Ein primär für Server designte Server CPU kann als Architektur auch gut für Desktop sein - solange wir über x86 reden ;) Das hat ein anderer X86 Hersteller in 45nm ja auch hinbekommen.
Ich hatte es ja bereits angesprochen. Stimmig wäre Zambezi für mich im Desktop als eine High-End Variante des Bobcat und bis 45 Watt TDP vermarktet. Das wäre ein neues Segment und es gäbe keine direkte Konkurrenz mit der sich Zambezi hätte messen lassen müssen.
Aber noch ist ja nicht aller Tage Abend. Die Architektur ist als Grundgerüst schon interessant - wenn man zwischen den Zeilen die diversen Reviews vergleicht ist Potenzial erkennbar.
 
@undone

you could also run 7-zip and x264 at the same time, to use more cores effectively.
And there may be a problem with turbo-function in such benchmarks, which kicks in if only half of the cores are used.
 
Auch wenn es schon vorbei ist will ich nochmal paar Zeilen zu JF schreiben:
1. Sehr schade wenn er solche E-mails bekommt aber leider zu erwarten
2. Das Problem zu unterscheiden zwischen Privat und einer Organisation gibt es immer, ich erinnere mal an diverse Beleidigungen an den Herrn von PCGH
3. Aber natürlich erwartet man das die mehr wissen und legt alles auf die Goldwaage. (der Cayman zieht Kreise....) jeder wußte er hat ein Sample usw bei JF natürlich ähnlich.

Trotz alledem kein Grund jemanden zu diffamieren und ich sehe es immer noch sehr positiv das er so viele Informationen weitergegeben hat.

@ Music vielen Dank das du sie Geschichte mit den "halben Modulen" nochmal auf den Grund gehst. Finde ich recht spannend.
 
Thanks,

IMG0033832.gif


the CMT gain average about 40% increase, still higher than SMT. Is it possible that an compiler or new software help CMT to gain more performance?
Sure definitley, Dresdenboy just wrote something fitting @XS:
http://www.xtremesystems.org/forums...nally-tested&p=4974341&viewfull=1#post4974341
It's somewhat screw up that amd advertise this as two cores but not hyperthreading. *noahnung*
It' better than HT, but worse than a real core. It is like the old question, if the glass is half full or half empty.
Of course marketing choose the viewpoint, that the glass is "half full" ...
---------

Ansonsten was mir gerade aufgefallen ist:

FX6Kerner sind lieferbar, FX4Kerner sind auch lieferbar ... 8 Kerner ... Fehlanzeige, sicherlich wegen den Serverchips.

Vielleicht ist eine Erklärung, wieso AMD FX in den Desktop gebracht hat, dass sie die teildefekten Chips abverkaufen können. Wenn die 8core Yields schlecht sind, gibts davon ja sicherlich ein paar ... *lol*
 
deaktiviertes CMT bringt aber wiederum nachteile in spielen wie BF3 & Anno. also auch nicht so Prickelnd. das sollte schon an bleiben. heißt das, wenn man CMT anlässt, ist der BD nicht zu empfehlen ? in welchem threat sollte ich denn fragen, kannst du mir mal einen link geben ?
 
Damit der Thread mal auch wieder nach vorne kommt, Kopie von Emmerdeur aus dem anderen Thread:

hatten wir das schon
In 2012, the company plans to launch Piledriver, which is expected to incorporate a number of IPC- and power-oriented improvements to the architecture. The first product planned with Piledriver’s enhancements is AMD’s Trinity APU, which we already saw running at IDF. Later, it’ll become a 32 nm-based CPU successor to today’s Zambezi desktop incarnation. How will Piledriver get its projected 10 to 15 percent speed up? AMD says one-third will come from IPC improvements like structure size increases (so, three to five percent) and two-thirds will come from power optimizations that reduce consumption, enabling higher frequencies at a constant TDP (another six to 10 percent).​
tomshardware.
 
In den ersten Shops sind die FX-8150 jetzt lieferbar, allerdings mit einem erhöhten Preis weil noch nicht alle Shops den haben.
 
die meisten hier spekulierten nachteile beziehen sich doch iergentwo auf die verständigungs probleme. wäre es also warscheinlich das die CPU,s mit weniger modulen weniger stark von den problemen betroffen sind ?
 
Mal doof gefragt, gibts eigentlich offizielle Dokumente über BDs Stromsparfähigkeiten abseits der Powergating ganzer Module?
Wenn man sich die Vergleichsmessungen zu SB so anschaut, ist entweder der Prozess für BD grottenschlecht, sodass er mit massiv höheren Spannungen laufen muss als geplant, oder er verschwendet irgendwo Strom.
Dass nicht belastete Module powergated werden ist ja ok und klar, aber wie siehts mit INT-Cores und der shared FPU bei nicht vorhandensein von entsprechendem Code aus?
so viel größer als ein SB-Kern ist ein BD-Modul doch auch nicht... *noahnung*
 
Mal doof gefragt, gibts eigentlich offizielle Dokumente über BDs Stromsparfähigkeiten abseits der Powergating ganzer Module?
Wenn man sich die Vergleichsmessungen zu SB so anschaut, ist entweder der Prozess für BD grottenschlecht, sodass er mit massiv höheren Spannungen laufen muss als geplant, oder er verschwendet irgendwo Strom.
Dass nicht belastete Module powergated werden ist ja ok und klar, aber wie siehts mit INT-Cores und der shared FPU bei nicht vorhandensein von entsprechendem Code aus?
so viel größer als ein SB-Kern ist ein BD-Modul doch auch nicht... *noahnung*
Der Bulldozer ist ganz passabel im Idle-Betrieb.

Von daher ist die 32nm Fertigung gar nicht so schlecht - aber wehe wenn der Takt hochgefahren wird -> Katastrophe bei 4,6 GHz.

MFG Bobo(2011)
 
Au Weiha :-/

Die Differenz im Energieverbrauch ist echt hoch :/
 
58 zu 69% Steigerung ist nicht wirklich der große Aufreger.

lg
__tom
 
58 zu 69% Steigerung ist nicht wirklich der große Aufreger. ...
- [100%] Also der Core i7 2600 mit 3,4 GHz erzeugt eine Systemlast von 146 Watt.
- [100%] Der FX 8150 BE mit 3,6 GHz provoziert eine Systemlast von 240 Watt.


Bei Übertaktung wirds peinlich für AMD:
- [158%] Also der Core i7 2600 mit 4,6 GHz hat eine Systemlast von 231 Watt (+ 85 Watt).
- [169%] Der FX 8150 BE mit 4,6 GHz hat hingegen eine Systemlast nun von 406 Watt (+ 166 Watt).

Deine Prozentzahlen sind zwar richtig - aber verwässern schlicht die Tatsache, dass ein übertakteter Core i7 2500 bei 4,6 GHz immer noch weniger Stromlast erzeugt, als ein Bulldozer-System bei 3,6 GHz -> Dabei ist der Bulldozer auf hohem Takt hin entwickelt worden, nicht der Core i7. ;)

MFG Bobo(2011)
 
100% wäre eine Verdoppelung

Das ist weder von 146 auf 231W der Fall, noch von 240 auf 406W .....
Keine Rede also von 158 und 169%

lg
__tom
 
Es geht aber UM die Steigerung zwischen normal und übertaktet.
 
Es geht aber UM die Steigerung zwischen normal und übertaktet.
Nö, es geht darum - dass AMD es schlicht nicht hin bekommen hat. Dein Argument mit der Nennung von Prozentzahlen sind bezuglos, wenn du nicht ein mal in Watt einen absoluten Bezugspunkt nennst.

Klaro - die Steigerung eines SandyBridge um 58% mehr klingt nicht so dramatisch, wenn der Bulldozer um 69 Prozent den Systemstrombedarf steigert ... ABER ...
Zu dumm nur, dass der Systemverbrauch bei Intel an sich schon deutlich niedriger ist (Das Bulldozer-System benötigt schon bei 3,6 GHz 66 Prozent mehr Strom als ein SandyBridge-System bei 3,4 GHz).

MFG Bobo(2011)
 
Waren alle Umstände gleich? Board, Netzteil, Karten im System, Speicher?
Absolutzahlen lassen sich nur mit gleichen Umständen vergleichen.
Der Rest ist FUD wie so oft.

Wie man zB. bei HT4U sieht ist der tatsächliche Verbrauch der FX im Idle nicht schlecht, wohl aber die Steigerung recht stark,
wie es eben dieser andere plakative Test zeigte.

lg
__tom
 
Zurück
Oben Unten