K10 - der Trumpf im Ärmel

mocad_tom

Admiral Special
Mitglied seit
17.06.2004
Beiträge
1.234
Renomée
52
Ein bisschen schwingt immer mit, wenn über zukünftige AMD-Entwicklungen gesprochen wird, dass der K10 schon längst überfällig sein sollte.

http://babelfish.altavista.com/babe...ch.impress.co.jp/docs/2006/0503/kaigai267.htm

http://babelfish.altavista.com/babe...ch.impress.co.jp/docs/2006/0202/kaigai238.htm

http://www.the-inquirer.com/?article=20437

http://www.the-inquirer.com/?article=27421

Intel weiß zu dem Zeitpunkt wo sie diese Infos heraugegeben haben, das es K9 schon nicht mehr gibt:
bild.jpg

Ich denke es muss sich hierbei um den K10 handeln.

Dann macht wieder ein Gerücht die Runde:
http://aceshardware.com/forums/read_post.jsp?id=115160986&forumid=1

Nun sollte man im Hinterkopf behalten, das diese Anti-HT-Geschichten einiges an Forschung erforderte, erfordert, erfordern wird. Dennoch denke ich, das diese Technik schon erste Früchte tragen könnte - wenn auch nicht von 0 auf 100 gleich das erreicht wird was vollmundig zusammengereimt wurde. Mit anderen Worten, die Grundthese lässt sehr vieles zu, im praktischen Einsatz werden sich aber zuerst nur Teilaussagen implementieren lassen. Es lassen sich mit dem L1D-L1D-Link des Conroe und dem richtigen Compiler auch schon erste kleinere Sachen realisieren(Stichwort Cache warming).

attachment.php


Es finden sich sogar ein paar Errungenschaften des K9-Teams im K10 wieder. Zur Erinnerung, der K9 soll mächtig breit werden. Der K10-Kern hat im Prinzip auch diesen breiten Charakter. Der Aufbau der Execution-Units, die Crossbar vor den Execution-Units werden einiges mit dem K9 gemein haben.

Zusätzlich zum L1D-L1D-Link wäre hier noch ein schnelle Kopierfunktion für die Register sinnvol. Auch die Branch-Units könnten sich miteinander unterhalten. Diese For-Each-Loop aus OpenMP könnte sich auf Hardware-Ebene erledigen lassen. Evtl. wäre hier eine Befehlssatzerweiterung für diesen Zweck sinnvoll - einfach nur ein Kennzeichen ob es sich rentiert hier zu verzweigen. Diese Entscheindung wird im Vorfeld vom Compiler abgeprüft.

Grüße,
Tom

/Edit
Tauscht man beim Deerhound die K8L-Kerne durch K10-Kerne aus hat man mit der selben Infrastruktur ein 8-Kern-Monster.
Hier wird dann aber wieder garnicht über den K10 gesprochen:
http://www.theinquirer.net/?article=30042

Evtl. ist Bulldozer(spezialisierter Mobil-Chip) der K10. ;)
Hier nochmal die Bulldozer-News: http://www.the-inquirer.com/?article=31859
Evtl. ein K10 mit lastabhängig abschaltbaren Recheneinheiten, optimiert auf Performance/Watt.
 
Zuletzt bearbeitet:
Gute Arbeit! Sicher ist natürlich nichts, aber es läuft hier ja auch unter der Flagge der Spekulation.

Was ich zu der c't-Tabelle schon einmal anmerken wollte:
Der kleine Leistungsanstieg des fiktiven K9 QC mit 3 GHz gegenüber dem schnellsten Opteron DC ist viel zu klein, um der im K8L verbesserten FP-Leistung gerecht zu werden.
 
Gute Arbeit! Sicher ist natürlich nichts, aber es läuft hier ja auch unter der Flagge der Spekulation.

Was ich zu der c't-Tabelle schon einmal anmerken wollte:
Der kleine Leistungsanstieg des fiktiven K9 QC mit 3 GHz gegenüber dem schnellsten Opteron DC ist viel zu klein, um der im K8L verbesserten FP-Leistung gerecht zu werden.

Die Tabelle ist ja auch vom September letzen Jahres, da war vom K8L auch noch keine Rede.
 
Die Tabelle ist ja auch vom September letzen Jahres, da war vom K8L auch noch keine Rede.
Du meinst wohl eher vorletzten Jahres (2004), oder? Ich bin der Meinung, die ist total überholt. Ich habe damals schon nicht daran geglaubt, daß die Entwicklung so langsam voranschreitet. Zugegeben, es ging in den letzten 2 Jahren weniger voran als ich geglaubt habe. Trotzdem haben wir (oder werden im nächsten Monat) jetzt schon CPUs, die laut Tabelle angeblich erst 2007 kommen sollten. Seit doch mal ehrlich, im Q2 2007 kommt doch nicht erst ein 2.8GHz DualCore mit nur 41 SpecFP_rate, da sind wir ja praktisch jetzt schon (mit Suns Compiler schafft das die aktuelle 2.6GHz Version)! Da erwarte ich mir eher einen DualCore K8L (SpecFP_rate>=60). Und da Intel für Q1 07 einen Quadcore angekündigt hat, wird AMD da mit laufender 65nm Produktion wohl spätestens im Q2 nachziehen, oder?
Und um mit Conroe/Woodcrest mithalten zu können, gibt es wahrscheinlich noch dieses Jahr DualCore-Versionen mit >=3GHz.
 
soll der K8L nicht schon nativ als quadcore erscheinen?
 
Sorry für OT, aber manchmal überraschen mich die prognostischen Fähigkeiten des INQ mehr als man es ihm je zugetraut hätte:

BIOS updates will take AMD to dual core.

We estimate AMD in 2005 will go from less than five per cent of the X86 server marketshare to a lot more. It estimates 25% of the Xeon market while Intel estimates AMD may have 30% by the end of 2006.

For 2005, I think Intel will have a hard slog, but they have weapons other than CPU speed.

When Merom cored products come online, and the two fight it out over AMD's K10, it will be a new war altogether, starting over from zero.

Until then, AMD has the lead, technologically.

Und das ganze schon vor 1.5 Jahren im Dezember 2004. Da sag mal noch einer, der INQ lügt das Blaue vom Himmel. 8)
 
Seit doch mal ehrlich, im Q2 2007 kommt doch nicht erst ein 2.8GHz DualCore mit nur 41 SpecFP_rate, da sind wir ja praktisch jetzt schon (mit Suns Compiler schafft das die aktuelle 2.6GHz Version)! Da erwarte ich mir eher einen DualCore K8L (SpecFP_rate>=60). Und da Intel für Q1 07 einen Quadcore angekündigt hat, wird AMD da mit laufender 65nm Produktion wohl spätestens im Q2 nachziehen, oder?
Und um mit Conroe/Woodcrest mithalten zu können, gibt es wahrscheinlich noch dieses Jahr DualCore-Versionen mit >=3GHz.
Der Woodcrest ist auf jeden Fall viel versprechend. Ein frühes Dual Woodcrest (3000MHz) System mit einem Takt je Frontsidebus von (4x)333 MHz und PC2-4200 FB-DIMM DDR2-RAM ereicht laut der aktuellen c't 12/2006 (S. 31 ff.) unter Vewendung des Intel Compilers 9.0 folgende SPEC Werte:

int_base: 2868
fp_base: 2684
int_rate_base: 112
fp_rate_base: 75,5

Mal schauen, wie sich dann die Serienprozessoren verhalten. An der Plattform selbst wird sich ja nichts mehr verändern.
 
Hängt euch mal an der Tabelle nicht so auf.
Für manche scheint es wirklich ein rotes Tuch zu sein.
Tatsache ist aber, das Intel im April 05(Veröffentlichungstermin des Artikels) einen neuen Kern vermutete, zu dem Zeitpunkt war aber K9 schon klar abgekündigt.

K9 sollte heissen K10
Opteron+ sollte heissen K8L

Ich bin mir sicher, das Projektteam hat etwas gutes aufzubieten.
Ob der K10 dem K8L das Wasser abgraben kann? *noahnung*

Im Intel-Lager ist es ja so:
Seit einem Jahr werden praktisch keine Speed-Upgrades nachgeliefert, die Projektteams haben sich nur auf MCW konzentriert. Man sieht es auch mit Dempsey, so wenig Aufmerksamkeit das es fast wehtut.

Bei AMD läuft K8L gut, also wieso ein Schwenk? Weil er einfach nötig ist um ein neues Level zu erreichen. Nur was tun, wenn er am Anfang nicht gut taktet, was einfach unvermeidbar ist - komplexe Kerne fordern Aufmerksamkeit, handtuning.

Was tun, wenn man einen effizienten Kern hat, dieser eine hohe pro-Takt-Leistung aufweist, er aber nicht hochtakten kann, weil kritische Pfade noch nicht so richtig wollen. Man schiebt ihn aufs Mobile-Gleis und lässt ihn dort ein wenig reiffen.

Ich denke das man bei AMD ein Debakel wie beim Hammer-Launch vermeiden will, damals kam man schon sehr auf dem Zahnfleisch kriechend daher. C0 war erstes vernünftiges Silizium, CG war auch noch nicht ganz dort wo man hinwollte.

Grüße,
Tom
.
.
Edit:
Sorry für OT, aber manchmal überraschen mich die prognostischen Fähigkeiten des INQ mehr als man es ihm je zugetraut hätte:


....When Merom cored products come online, and the two fight it out over AMD's K10, it will be a new war altogether, starting over from zero.....
Mich hats auch fast "gegruselt" bei den 25% Server-Market-Share, wie konnte dies Charlie nur riechen. *noahnung*

Also -> wo ist nun der K10, das er lebt ist klar, spätestens seit dem Anti-HT-Gerücht.
In der Roadmap von Hiroshige Goto folgt auf Taylor(aktueller Turion X2) Tyler, hört sich mächtig langweilig an, fast ein Witz.
Bei Charlie wird Bulldozer genannt. *kopfkratz
Charlie nennt den Kern nach Deerhound Cerebus, Hiroshige nennt ihn Zamorra. *kopfkratz

Grüße,
Tom
 
Also -> wo ist nun der K10, das er lebt ist klar, spätestens seit dem Anti-HT-Gerücht.
ÖÖhm, kapiere die Frage nicht, steht doch im, von Dir verlinkten, Inq. Artikel:
Either way, if you were expecting the K10 in 2007, don't, and maybe not in 2008 either. To make up for it, there is a new chip called K8L to slot in the middle, but little is known about that, as yet.
Nachdem erst gerade was über den K8L verraten wurden, denke ich, dass zum K10 & "Anti HTh" auch demnächst nicht viel verraten wird.

ciao

Alex
 
K9 sollte heissen K10
Opteron+ sollte heissen K8L
Der Opteron+ sollte wohl eher die Revision F mit DDR2-Support sein. Die vorhergesagte Performance macht ja nicht gerade ein Sprung in der Tabelle.
Der K8L tritt jetzt an Stelle des K9, wobei ich allerdings glaube, daß da performancemäßig sogar mehr bei rumkommt als damals von der ct für ihren K9 vorhergesagt.

Da hier alle sich was aus den Fingern saugen, befrage ich auch mal meine Glaskugel.
[wilde Spekulation]
Der K8L kommt zum Jahreswechsel 06/07. Es gibt zwei Versionen:
1. Mobilvariante,
entspricht dem bereits bekannten Die-Foto des 65nm K8 (nur zusätzlich DualCore), keine 128Bit-FPU aus Stromspargründen, ansonsten aber alle internen Verbesserungen (pro-Takt-Leistung +10%), diese Variante wird auch für die Semprons und je nach Taktbarkeit sogar für die normalen A64X2 (wenn höher taktbar als Conroe) genutzt
2. Servervariante,
die "Vollversion" mit 128Bit-FPU (Integer +10%, Fließkomma +50%), debütiert in 65nm als Quadcore (mit L3?) in Q1 2007, da hier Stromverbrauch besonders wichtig und mit dem neuen Prozeß evtl. nicht auf Anhieb sehr hohe Taktraten erreicht werden können (für QuadCore nicht unbedingt nötig). Etwas später dann auch hochgetaktete DualCore-Versionen als A64FX (evtl auch mit L3, je nachdem was der ConroeXE schafft) oder auch A64X2.

Performance-Vorhersagen:
1 Sockel DualCore K8L mit 3GHz: specfp_rate 60
1 Sockel QuadCore K8L mit 2.6GHz: specfp_rate 85
2 Sockel DualCore K8L mit 3GHz: specfp_rate 110
2 Sockel QuadCore K8L mit 2.6GHz: specfp_rate 160
[/wilde Spekulation]
 
Zuletzt bearbeitet:
Der Woodcrest ist auf jeden Fall viel versprechend. Ein frühes Dual Woodcrest (3000MHz) System mit einem Takt je Frontsidebus von (4x)333 MHz und PC2-4200 FB-DIMM DDR2-RAM ereicht laut der aktuellen c't 12/2006 (S. 31 ff.) unter Vewendung des Intel Compilers 9.0 folgende SPEC Werte:

int_base: 2868
fp_base: 2684
int_rate_base: 112
fp_rate_base: 75,5

Mal schauen, wie sich dann die Serienprozessoren verhalten. An der Plattform selbst wird sich ja nichts mehr verändern.
Ja, der sieht gut aus. Es belibt halt die Frage wann und in welchen Mengen die 3 Ghz Woodcrest kommen. Man wird sich aber bei AMD auf diese 3Ghz einstellen müssen. Der wird ja auch weiterentwickelt. Das Problem ist das der Vorsprung so groß ist, das man mit Optimierung da nicht herankommen wird. Es ist also etwas neues Notwendig.
Beispiel SPEC int_base : Opteron 3Ghz ca 2000, Woodcrest 3Ghz ca. 3000. fp_base Opti 3Ghz 2365, WC 3GHz: 2561, SPEC_int_rate: Opteron 3Ghz: 47.5(2S), 90.5 (4S), 2*WC 3Ghz: 113. ... Opti 3Ghz: fp_rate: 52.3 (2S), 100 (4S)
 
>AMD is already planning a next generation mobile core - but that's slated for 2007 and may rely
>on some interesting form factors
http://www.the-inquirer.com/?article=20860

*noahnung*

Was könnte also Bulldozer sein?
Klar könnte ein mobiler 65nm Kern ziemlich wenig schlucken - ihn aber dann gleich Bulldozer zu nennen?

Dieses zu lange Trockentraining talentierter Teams bringt AMD nichts.

Grüße,
Tom
 
Zuletzt bearbeitet:
Ja, der sieht gut aus. Es belibt halt die Frage wann und in welchen Mengen die 3 Ghz Woodcrest kommen. Man wird sich aber bei AMD auf diese 3Ghz einstellen müssen. Der wird ja auch weiterentwickelt. Das Problem ist das der Vorsprung so groß ist, das man mit Optimierung da nicht herankommen wird. Es ist also etwas neues Notwendig.
Du mußt immer aufpassen, welche Werte verglichen werden. Zugegeben, im Integer-Bereich sieht der Conroe/Woodcrest ziemlich gut aus, bei SpecFP muß sich aber selbst ein aktueller Opteron nicht verstecken, man muß nur den richtigen Compiler benutzen (Sun für AMD).
Für ein 2 Sockelsystem mit 2.6GHz Opterons (285) kommt man dann auf eine SpecFP_rate 85.0 (76.5 base) Link zur spec.org.
Der 3GHz Woodcrest kommt mit dem neuesten Intel-Compiler momentan auf 75.5 (base=peak), Da muß AMD sich nun partout nicht verstecken, erst recht nicht mit dem neuen 2.8GHz Modell mit DDR2 (bei SpecFP bringt der wahrscheinlich mehr als irgendwo anders). Und der K8L kommt dann ja auch noch.
 
Was könnte also Bulldozer sein?
Klar könnte ein mobiler 65nm Kern ziemlich wenig schlucken - ihn aber dann gleich Bulldozer zu nennen?


auch wenn ich mich wiederhole, ich tue es gerne (der kürze wegen diesesmal ohne begründung): quad-core zum ende des jahres ´06. alles andere ist nichts, bringt nichts, reicht nicht. so simpel!

ich denke, es wird zeit, eine umfrage zu starten zu den einschätzungen... ;)
 
Du mußt immer aufpassen, welche Werte verglichen werden. Zugegeben, im Integer-Bereich sieht der Conroe/Woodcrest ziemlich gut aus, bei SpecFP muß sich aber selbst ein aktueller Opteron nicht verstecken, man muß nur den richtigen Compiler benutzen (Sun für AMD).
Für ein 2 Sockelsystem mit 2.6GHz Opterons (285) kommt man dann auf eine SpecFP_rate 85.0 (76.5 base) Link zur spec.org.
Der 3GHz Woodcrest kommt mit dem neuesten Intel-Compiler momentan auf 75.5 (base=peak), Da muß AMD sich nun partout nicht verstecken, erst recht nicht mit dem neuen 2.8GHz Modell mit DDR2 (bei SpecFP bringt der wahrscheinlich mehr als irgendwo anders). Und der K8L kommt dann ja auch noch.
Ja, das stimmt schon. Ich traue den SPEC Werten kaum. Seien es die von Intel oder SUN. Dort wird viel geschummelt und optimiert. Was dann in der Praxis herauskommt ist etwas anderes.
Ich wollte aber zeigen das es nicht nur ein paar Prozent sind, sondern das da zumindest in vielen Bereichen ein deutlicher Unterschied besteht. Mithin dieser also nicht durch ein paar Optimierungen / Taktsteigerungen aufgeholt werden kann, sondern grundlegendere Änderungen notwendig sind.
Beispiele: Lame: +40% gegenüber 2,8Ghz Opti, Cinebench 9.5 +41% gegenüber 2*Opti 280 (2,4Ghz), 3dmax +40% gegen O-280, POVray 3.7: 2*WC 3Ghz 155s - 2*Opteron 280 (2,4 Ghz) 279s. Linpack Linux 64 Bit 2.1.2 2*WC 3Ghz 26,8 (31,4 neuer Compiler) 2* Opteron 280 13,4.
Also abgesehen von den systhetischen Werten sieht das eher in die Richtung +40% bei 2 Sockelsystemen für den WC aus.
Da wird AMD also einiges tun müssen und das auch bald ankündigen.
Sicherlich wird es auch Bereiche geben wo der Opteron besser ist, aber das sind dann nicht sehr viele.
 
Bei den SPEC Benches, welche in der offiziellen Datenbank sind, glaube ich kaum, dass man dort von schummeln sprechen kann. Das müssen reproduzierbare Werte sein, sonst kommen sie nicht in die Liste
 
Tschuldigung, will nicht stören. ;)
Hier nochmal ein Kommentar, der sich ebenfalls über die Wortwahl Bulldozer wundert:

>Could Bulldozer be the quad core device that pushes Intel into the sea?
>I don't think AMD would use such a name unless it is something very special indeed.
http://www.the-inquirer.com/?article=32039

Und hier nochmal ein Artikel von Nebojsa Novakovic:
http://www.the-inquirer.com/?article=31649

Irgendwie sind sich die alle nicht einig:
Charlie: Cerebus
Nebosja: Cerberus
Hiroshige: Zamorra

Mein Tip: Bulldozer wirds schon richten ;)

Grüße,
Tom
 
mtb][sledgehammer;2749511 schrieb:
Bei den SPEC Benches, welche in der offiziellen Datenbank sind, glaube ich kaum, dass man dort von schummeln sprechen kann. Das müssen reproduzierbare Werte sein, sonst kommen sie nicht in die Liste
Ja, schummeln ist wohl der falsche Begriff.
Ich würde eher sagen die sind nicht so sehr Praxisrelevant. Ich sehe die wie die synthetischen Benchmarks mittlerweile. Da wird so viel optimiert (verschiedene Compiler, extra Bibliotheken etc.) das die Ergebnisse mit dem was in der Praxis vorkommt kaum etwas gemein haben.
Bei anderen Benches wird dann ein Speichersubsystem genommen das in keinem Verhältniss zum Rechner selber steht um Weltrekorde zu erzielen.
Ich wollte / will damit also nur sagen das 5% bei irgendwelchen SPEC-Werten zwar Anhaltspunkte für Stärken und Schwächen einer Architektur leifern können, aber nicht in das reale Verhalten übersetzt werden kann.
Bestes Beispiel ist der P4 vs A64: Der P4 konnte mit stark optimierten Code einiges von seinen theoretischen (und synthetischen) Werten umsetzen, brach aber ein wenn er normalen unoptimierten Code bekommen hat. Der A64 hat da eher alles gefressen und ist auch deshalb so erfolgreich.
 
reicht aber nur, wenn der conroe bei in etwa 2,6ghz bleibt. :P
Und nachdem er schon erfolgreich auf 4.5Ghz getaktet wurde, kann ich mir eben das nicht vorstellen. Klar, ist das keine serientaugliche Taktung, aber deutlich mehr Potential nach oben scheint beim Conroe vorhanden zu sein.
 
Knapp unter 5 Ghz ist der aktuelle Stand beim Conroe. Da lief auch SuperPI noch mit knapp über 10s
 
hm... mit super kühlung (kompressorkühlung) und vorselektiert.. bla bla! ;) Is zwar genial, aber ist so weltfremd, dass es definitiv keine Aussage über taktbarkeit bei normalbedingungen mehr zulässt.
 
Wenn ein FX mit eben der selben genialen Kühlung auf 3,8 Ghz kommt, während Vorserienprodukte des Conroe damit 5Ghz erreichen, lässt sich tendenziell schon eine Aussage ableiten.

Aber mal was anderes:

Ist der K8L nun der offizielle K8 Nachfolger, der AMDs Geschicke zwischen 2007 und schätzungsweise 2011 bestimmen soll? Oder kommt da 2009 noch irgendwas? Derzeit siehts nicht so richtig danach aus. Aber meiner Meinung nach, kommt der K8L schon nächstes Jahr zu spät. Ab 2008 wird er mit der Core 3 Architektur (Nehalem) zu kämpfen haben.

MfG
 
Zuletzt bearbeitet:
Zurück
Oben Unten