AMD Zen - 14nm, 8 Kerne, 95W TDP & DDR4?

http://www.golem.de/news/summit-rid...ie-intels-1-000-euro-core-i7-1608-122768.html

Summit Ridge
AMDs Zen-Chip ist so schnell wie Intels 1.000-Euro-Core-i7

Was für eine Show! AMD hat Summit Ridge vorgestellt und den Zen-basierten Prozessor gegen Intels neuen Achtkern-i7 antreten lassen. Beide Chips sind gleich flott, womit AMD nach über zehn Jahren wieder im High-End-Segment ein würdiger Gegner zu sein scheint.

Hört sich ja vielversprechend an. Wäre nice, mal wieder ein leistungsfähiges AMD-System kaufen zu können. Und vor allem, wenn Intel mal wieder ein bisschen Preisdruck bekäme.

Was ich allerdings nicht ganz verstehe: Wieso hat AMD den i7-6900K auf 3GHz runter getaktet? Der hat doch normalerweise einen Turbo von 3,7 GHz. Dann lief der ja nur auf Sparflamme. Hört sich natürlich erstmal nice an "so schnell wie Intels 1.000-Euro-Code-i7", aber entspricht somit nicht ganz der Wahrheit, da man für die 1.000€ 700MHz mehr bekommt. Und wie teuer wäre wohl so ein 3,7 GHz Summit Ridge (wenn AMD ihn denn auf diesen Takt bekommt)? Nehme mal nicht an, dass AMD den für den halben Preis verschleudern würde.

Wird AMD den 8-Kerner ebenfalls im Hochpreissegment einordnen oder werden die Intel einen ordentlichen Preiskampf bereiten? Entscheidend ist, was man in der 250-350€-Mittelklasse bekommen wird. Ich hoffe, dass AMD in der Preisklasse Intel ordentlich Druck machen kann.
 
Zuletzt bearbeitet:
Hab jetzt auch einen kurzen Artikel geschrieben, ging leider nicht früher, da die Mail nur ein paar Minuten vor NDA-Fall reinkam :(
http://www.planet3dnow.de/cms/26106-amd-praesentiert-zen-architektur/

--- Update ---

a+b) Auf 64 kB L1I 4-way gab es in Patenten keine Hinweise, die mir so aufgefallen wären. Aber vor einer Weile erfuhr ich die Zahl. ^^ 4-way ist doch besser, solange es von der Taktfrequenz her passt, oder?
Klar, aber entweder Kanter oder Agner schrieben irgendwo mal, dass die Ways für den Instruktionscache egal wären. Aber vielleicht braucht mans ja für SMT.
c?) Eigene Scheduler könnten mit "Dependency Chains" zusammenhängen. Da werden einzelne Befehlsketten identifiziert u. einem Scheduler zugeordnet, um da back-to-back ausgeführt zu werden. Und die Trennung ermöglicht auch noch ein schnelleres Scheduler-Design. Kommunikation zw. den Lanes kostet allerdings vermutlich einen Takt extra.
Das mit dem Takt ist klar, aber nichtmal das taktfreudige BD-Design hatte sowas, deswegen überrascht es mich jetzt, da Zen ja genau nicht auf Takt ausgelegt sein sollte.
Hätte jetzt höchstens einen Scheduler für 2 ALUs und einer AGU erwartet, also 3 Scheduler insgesamt, aber 7 ... holla ..
"Dependency Chains" .. hmm .. ist das ähnlich zu ner µOp-Cachezeile?
d) Wie auch immer die 1,75x abgebildet sind: Es bedeutet auch, dass in der Retirement Queue mehr Befehle stehen u. das wäre ggf. auch für FP gut.
Stimmt, die gibts auch noch, immerhin ein Pluspunkt ;)

@Lehmann:
Ja Nachteile wirds geben, bei AVX256/FMA--Code, recht viel mehr ist nicht zu erwarten, ich wüsste nicht wieso. Die Cache sind groß, die Puffer tief, endlich gibts auch nen µOp-Cache, die wichtigen Ausführungseinheiten sind gleich doppelt vorhanden, da kann nix schief gehen und wenn das nun schon bei Blender passt, ist das ein starkes Indiz, dass dem auch so ist ;)
 
Das sind auf jeden Fall gute Nachrichten. Von irgendwelchen geleakten Benchmarks aus Asien sollte man sich nicht wieder so hypen lassen wie bei der 480, das war absolut kontraproduktiv. Ich hoffe, dass der Launch Ende des Jahres glatt über die Bühne geht und die Journaille nichts findet, was sie negativ aufblasen können. Wenn dann die ersten Kinderkankheiten weg sind, kann ich hoffentlich meinen i7 in Rente schicken.

--- Update ---

Wieso hat AMD den i7-6900K auf 3GHz runter getaktet?

Damit man die IPC vergleichen kann. Dazu musste der Intel Chip runtergetaktet werden, weil das ZEN ES noch nicht so hoch takten kann.
 
Ja die Werte passen schon ....

Preislich würde ich den 8C/16T bei rd 500-700 Euro ansetzen ggü dem CorEI-7 69xx mit rd 1000 Euro passt dat schon

Board:
Naja so langsam kann man ja was raus rücken:
- AMD Myrtle (sieht man u.a. bei Computerbase) ist Dual-Channel DDR4 mit je 2 Slots/Channel
- Bristol Ridge AM4 läuft drauf - Dual Channel DDR4 bisher nur 2133
- Stoney Ridge AM4 läuft drauf - Single Channel DDR4 jedoch 2400 (IMC ist besser als der von BR-A1 obwohl nur halb so groß)
- Summit Ridge AM4 läuft drauf - Dual Channel DDR4 offiz. nur bis 2400 aber wurde schon etwas drüber getestet (inkl. 4000er)

Hinweis:
Summit Ridge ist jedoch nicht der echte Gegner der CorEier 69xx, dat wird was besseres (mehr Kerne und mehr RAM)
 
Was ich allerdings nicht ganz verstehe: Wieso hat AMD den i7-6900K auf 3GHz runter getaktet? Der hat doch normalerweise einen Turbo von 3,7 GHz. Dann lief der ja nur auf Sparflamme. Hört sich natürlich erstmal nice an "so schnell wie Intels 1.000-Euro-Code-i7", aber entspricht somit nicht ganz der Wahrheit, da man für die 1.000€ 700MHz mehr bekommt. Und wie teuer wäre wohl so ein 3,7 GHz Summit Ridge (wenn AMD ihn denn auf diesen Takt bekommt)? Nehme mal nicht an, dass AMD den für den halben Preis verschleudern würde.

Damit man die Beiden CPUs bei Taktgleichheit gegenüberstellen konnte.
 
Was nur nervt sind diese ewigen Verzögerungen. Jetzt scheint mehr oder weniger sicher, dass Summit Ridge erst 2017 erscheint, nachdem was wohl von AMD gesagt wurde. Also müssen die wohl doch größere Probleme bei GloFo haben, denn die Produktion könnte längst auf vollen Touren laufen.
 
Damit man die Beiden CPUs bei Taktgleichheit gegenüberstellen konnte.
Gut, das ist mir klar. Ich wollte eher darauf hinaus, dass Taktrate nunmal nichts aussagt (wie wir spätestens seit AMDs Performance-Rating wissen).

Ein aussagekräftiger Vergleich wäre gewesen, Prozessoren bei gleicher Leistungsaufnahme zu zeigen, oder noch besser: Bei gleichem Verkaufspreis.

Naja, immerhin wissen wir jetzt schonmal, dass AMD einen Prozessor hat, der bei gleichem Takt augenscheinlich eine vergleichbare Performance zeigt, wie ein Broadwell-E. Sagt zwar nicht viel aus, aber immerhin schonmal eine gute Nachricht. Muss man wohl geduldig bis nächstes Jahr warten (bis dahin wird so ein Broadwell-E allerdings auch nicht mehr soviel kosten, wie heute).
 
@Opteron
Schade, doch nur Dual Channel Memory bei AM4.
Da kann man nur auf ein paar gute Server Boards hoffen für Quad Channel. ;)

@Tunderbird 1400
Du hast dir fast die Antwort selbst geliefert, der Grund warum der Broadwell-E mit 3GHz läuft ist der selbe Verbrauch von beiden Systemen.
Ich glaube nicht das sie beim ZEN halbe Sachen machen, schon gar nicht wenn sie (Teamleader) den Ton angibt! ;)
 
Die 3ghz habe auch den Vorteil das man nicht im powerlimet rennt 95watt gegen 140 wobei es ja auch ne 140er geben könnte laut Sockel Eigenschaften
 
36 pcie lans sind doch etwas wenig ^^
Wieviele bekommst du denn momentan in der CPU?
20 Lanes?? (+SB)

Und beim Haswell-E und Broadwell-E Kastrat sind es auch üppige 28 Lanes, erst die ganz dicken 2011er Prozessoren bringen 40 Lanes...
Also das ist schon sehr ordentlich, für einen 'Low cost' Sockel...

Allerdings müssen wir erst mal schauen, wie das ganze dann letztendlich in der Praxis ausschaut, was mit wem geteilt ist und so weiter...
 
Meiner Meinung nach sollte man sich nicht in irgend einen Hype hineinziehen lassen, denn um so größer ist nachher die Enttäuschung.
Es gibt bestimmt auch bei Zen Dinge, die zu kritisieren sind - ich erinnere nur an die Negativ-Presse beim RX-Serien Launch.
Ganz klar. Letztendlich müssen wir die Dinger erst in den Händen haben.

Summit Ridge ist jedoch nicht der echte Gegner der CorEier 69xx, dat wird was besseres (mehr Kerne und mehr RAM)
Also noch mehr Kerne gegen die dicken i7? Heist daß die 8C/16T ZEN würden den doch nicht begegnen können?

Was nur nervt sind diese ewigen Verzögerungen. Jetzt scheint mehr oder weniger sicher, dass Summit Ridge erst 2017 erscheint, nachdem was wohl von AMD gesagt wurde. Also müssen die wohl doch größere Probleme bei GloFo haben, denn die Produktion könnte längst auf vollen Touren laufen.
Aber es ist doch keine. Das ist genau im Zeitplan. Natürlich fühlt es sich so an.

Bei CB schreibt man wegen AVX512, dass AMD da indirekt auf ZEN+ verwies.
 
Was ich allerdings nicht ganz verstehe: Wieso hat AMD den i7-6900K auf 3GHz runter getaktet? Der hat doch normalerweise einen Turbo von 3,7 GHz.
Bis 3,7 GHz dürfte der i7-6900K bei voller Auslastung aber nicht hochgehen. Da wird er vermutlich maximal 200-300 MHz über Basistakt kommen. Man wollte halt bei identischem Takt vergleichen, um die IPC Verbesserungen nochmal zu untermauern. Es wurde ja auch gesagt, dass Verkaufsexemplare höher getaktet sind. Also womöglich ähnlich wie der i7-6900K mit 3,2 GHz Basistakt. Was schon eine Hausnummer wäre. Immerhin wird der i7-6900K mit 140W TDP klassifiziert. Summit Ridge hingegen wurde bisher nur mit maximal 95W TDP angekündigt.


b) Eigene Scheduler pro INT-Pipe, schaut aus wie bei den K8/K10, wieso kein unified und haben die AGUs wirklich auch eigene Scheduler?
Nicht ganz. Bei "Stars" gab es Scheduler pro ALU/AGU-Pärchen. Würde mich aber auch mal interessieren, warum man wieder Abstand von einem Unified Scheduler nimmt. In der FPU ist er immerhin noch vorhanden.


Ansonsten, wenn die Blender Zahlen stimmen, dann wäre das schon sehr vielversprechend. Immerhin ist das eine von den Apps, die bei Benchmarks bisher am meisten Richtung Intel ausgeschlagen sind.
 
@Opteron
Schade, doch nur Dual Channel Memory bei AM4.
Da kann man nur auf ein paar gute Server Boards hoffen für Quad Channel. ;)
Ist schon ok, wirklich realistisch war die Idee ja nie. Dann muss man die Kohlen halt mit DDR4-4000 aus dem Feuer holen, soll das - vermutlich Rambus-Interface- mal beweisen, dass es die Lizenzgebühren wert ist ;)


[3DC]Payne;5111824 schrieb:
Und beim Haswell-E und Broadwell-E Kastrat sind es auch üppige 28 Lanes, erst die ganz dicken 2011er Prozessoren bringen 40 Lanes...
Also das ist schon sehr ordentlich, für einen 'Low cost' Sockel...

Allerdings müssen wir erst mal schauen, wie das ganze dann letztendlich in der Praxis ausschaut, was mit wem geteilt ist und so weiter...
Ich hoff mal auf 2x16 für Grafikkartenslots, 1x4 für die SB und dort dann weitere Lanes für den Kleinkram.

@gruffi:
Ja Päärchen, so wies jetzt eingezeichnet ist, ists ja noch schlimmer ^^ Und ja, merkwürdig, dass die FPU unified bleibt, aber das muss vielleicht wg. den Doubles so sein.

Weist Du zufällig, welche Befehle Blender hauptsächlich benützt?

--- Update ---

Bei CB schreibt man wegen AVX512, dass AMD da indirekt auf ZEN+ verwies.

Muss ich ehrlich gesagt nicht haben, wenns stattdessen nen Quad-Core-Cluster extra gäbe ;)
 
Aber es ist doch keine. Das ist genau im Zeitplan. Natürlich fühlt es sich so an.

Nein, alle Aussagen bisher waren Ende 2016, was Q4 heißt. Auch die offizielle Roadmap zeigt noch 2016. Es wurde jetzt aber wohl von Lisa gesagt, dass 2016 unwahrscheinlich ist.
 
Nein, alle Aussagen bisher waren Ende 2016, was Q4 heißt. Auch die offizielle Roadmap zeigt noch 2016. Es wurde jetzt aber wohl von Lisa gesagt, dass 2016 unwahrscheinlich ist.
Da war aber die Rede von wenigen Samples Ende 2016!
Oder worauf beziehst du dich nun?

Auf der anderen Straßenseite in einem Hotel, klingt irgendwie romantisch...
 
Es hieß auch mal es macht keinen Sinn AM4 ohne Summit Ridge zu launchen, jetzt will man den Launch von AM4 mit Bristol Ridge allein doch machen.
 
Es hieß auch mal es macht keinen Sinn AM4 ohne Summit Ridge zu launchen, jetzt will man den Launch von AM4 mit Bristol Ridge allein doch machen.
Das war aber auf meinem Mist gewachsen, sry 4 story!

Flächendekend, kennt die Auto-Korrektur nicht, ätsch...
 
Weist Du zufällig, welche Befehle Blender hauptsächlich benützt?
Nee, kann ich dir im Moment nicht sagen. Kanns im Moment leider auch schlecht testen.


Lustig ist ja, dass François Piednoël, "Performance Guru" bei Intel, sich jetzt darüber aufregt, dass angeblich auf dem Zen und dem i7 System unterschiedlicher Code ausgeführt wurde. Dazu dann noch solche Sprüche wie "you can't compare IPC when the code running is different, that is a basic of Performance turning". Das ausgerechnet aus dem Mund eines Intel Mitarbeiters. Die seit Jahren mit dem ICC nichts anderes machen, um die Konkurrenz schlechteer dastehen zu lassen. Comedy pur! Da scheint jemand echt die Hosen gestrichen voll zu haben. *lol*
 
Die anderen Websites sprechen davon, dass Blender FP-Lastig ist.
Prinzipiell wäre es übrigens wirklich möglich zwei verschiedene Codes laufen zu lassen: CPU auf dem C-Kernel von Blender (schnell) und CPU auf dem OpenCL-Kernel von Blender (etwas langsamer), ich halte das aber offen gesagt für mehr als unwahrscheinlich ;)
Die Testsysteme der Blenderfoundation sind übrigens Haswell aufwärts, einen AMD hab ich bei denen noch nie gesehen.
[Der letzte Openmovie wurde auch auf von Intel gesponsort und Sintel auf Intel-Systemen gerendert, einfach mal die Making-Ofs und den Abspann ansehen ;) ]
 
Zuletzt bearbeitet:
Glaube auch nicht, dass auf einem der Systeme via OpenCL gerendert wurde.

Unterschiedlichen Code auszuführen ist auch erst mal nicht unfair und macht, entgegen der Behauptung von François Piednoël, IPC Vergleiche auch nicht unzulässig. Man sollte dann aber möglichst optimalen Code auf dem jeweiligen System ausführen. Oder wenn man exakt den selben Code auf beiden Systemen ausführen lässt, dann sollte es generisch erzeugter Code ohne spezifische Herstelleroptimierungen sein. Für François Piednoël ist ein fairer IPC Vergleich aber wahrscheinlich nur, wenn auf allen Systemen Intel optimierter Code ausgeführt wird. *lol*
 
Nicht ganz. Bei "Stars" gab es Scheduler pro ALU/AGU-Pärchen. Würde mich aber auch mal interessieren, warum man wieder Abstand von einem Unified Scheduler nimmt. In der FPU ist er immerhin noch vorhanden.
Vermutlich sind die Gründe wieder: Power und Pipeline Delay. Ein breiter Unified Scheduler hat intern ständig viele Signale zu prüfen und Befehle zu tracken. Das kostet Energie, v.a. auch durch teils notwendige schnellere Logik/Transistorvarianten.

Das Prinzip hier könnten Dependency Chains sein: Befehle, die vorwiegend miteinander zu tun haben, werden dem gleichen Scheduler zugeordnet, da sowieso kein späterer Befehl unabhängig von früheren ausgeführt werden kann. Das ginge sogar in-Order ohne Leistungsverlust... Oh, da fällt mir etwas ein! Ein Patent... hehe, von Suzanne Plummer et.al.

Lustig ist ja, dass François Piednoël, "Performance Guru" bei Intel, sich jetzt darüber aufregt, dass angeblich auf dem Zen und dem i7 System unterschiedlicher Code ausgeführt wurde. Dazu dann noch solche Sprüche wie "you can't compare IPC when the code running is different, that is a basic of Performance turning". Das ausgerechnet aus dem Mund eines Intel Mitarbeiters. Die seit Jahren mit dem ICC nichts anderes machen, um die Konkurrenz schlechteer dastehen zu lassen. Comedy pur! Da scheint jemand echt die Hosen gestrichen voll zu haben. *lol*
Meine Vermutung: auf kaltem Fuß erwischt (ein Performance-Engineer soll bestimmt auch reporten, wie gut die Konkurrenz ist) und in den Defensivmodus gewechselt. So ähnlich war er vor nicht langer Zeit bzgl. Nvidias Deep Learning drauf.
 
Aber wie kommt der überhaupt darauf der Code (Blender?!) unterscheide sich auf beiden Systemen?
 
Aber wie kommt der überhaupt darauf der Code (Blender?!) unterscheide sich auf beiden Systemen?

Weil, wenn es das Blender ist welches ich vermute, auf Blender separate Module genutzt werden können, die, zu den schon von Haus aus vorhandenen Blender-Codes, anderen Code nutzen können.
 
Zurück
Oben Unten