45 nm Phenom "Deneb" - erste Bilder und Benchmarks

Nero24

Administrator
Teammitglied
Mitglied seit
01.07.2000
Beiträge
24.066
Renomée
10.446
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2021
Oops, da war wohl irgendwo ein Leck bei einem asiatischen Hersteller? Wie berichtet hatte AMD bereits im März <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1204648113">erste Samples der kommenden 45 nm K10 Prozessoren an die System-Partner geschickt</a>, damit diese ihre Mainboards rechtzeitig für die neuen CPUs anpassen können.

Zufällig auf einer asiatischen Webseite, in diesem Fall itocp.com, sind nun die ersten Bilder, CPU-Z Screenshots und Benchmarks eines 45 nm Phenom mit Deneb-Kern aufgetaucht. Wie nicht anders zu erwarten verfügt die CPU über 6 MB Level 3 Cache statt nur 2 MB wie derzeit beim Agena. Das Stepping der CPU lautet RB-C0. Die Taktfrequenzen der beiden Modelle lagen bei 2.2 GHz und 2.3 GHz. Die VCore lag für ein 45 nm Modell erstaunlich hoch bei 1,225 V. Bei der offiziellen Modell-Bezeichnung stand lediglich Engineering Sample.

<center><pre><a href="http://www.planet3dnow.de/photoplog/index.php?n=2736"><img src="http://www.planet3dnow.de/photoplog/file.php?n=2736" border="1" alt="AMD Phenom Deneb"></a> <a href="http://www.planet3dnow.de/photoplog/index.php?n=2737"><img src="http://www.planet3dnow.de/photoplog/file.php?n=2737" border="0" alt="AMD Phenom Deneb"></a></pre><font size="1">Quelle: itocp.com</font></center>

Ermutigend waren die Overclocking-Resultate, sofern es sich bei dieser Veröffentlichung nicht um einen schlechten Scherz gehandelt hat. 2.8 GHz konnten die Tüftler noch ohne VCore-Erhöhung erreichen, das Ende der Fahnenstange war bei gut 3,44 GHz erreicht, wofür jedoch 1,500 V Kernspannung nötig waren.

Als Benchmark verwendeten die Jungs leider nur SuperPI 1M, einen sehr alten Benchmark, der keine SIMD-Befehle verwendet, kein SMT/SMP und auch nicht sonderlich gut mit der Speicher-Performance skaliert. Für das auf 3.0 GHz übertaktete Modell wurde eine SuperPI-Zeit von 23,55 s ermittelt. Zum Vergleich: der aktuelle 65 nm Phenom mit B3-Stepping erreichte <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=338464&garpg=7#content_start">in unserem letzten CPU-Test</a> bei 3.0 GHz eine Zeit von 25,25 s. Aufgrund welcher Optimierungen der Zeitvorteil von ca. 7 Prozent zu Stande kommt, kann man zum aktuellen Zeitpunkt natürlich nur vermuten. SuperPI 1M arbeitet mit einer Datengröße von ca. 8 MB (9,4 MB unter Last minus 1,4 MB für die GUI), insofern könnte hier allein der von 2 MB auf 6 MB vergrößerte L3-Cache bereits hauptausschlaggebend sein.

<center><pre><a href="http://www.planet3dnow.de/photoplog/index.php?n=2739"><img src="http://www.planet3dnow.de/photoplog/file.php?n=2739" border="1" alt="AMD Phenom Deneb"></a> <a href="http://www.planet3dnow.de/photoplog/index.php?n=2738"><img src="http://www.planet3dnow.de/photoplog/file.php?n=2738" border="1" alt="AMD Phenom Deneb"></a></pre><font size="1">Quelle: itocp.com</font></center>

Über derlei Minitests werden wir in den nächsten Wochen bis zu offiziellen Vorstellung des Shanghai/Deneb sicherlich noch desöfteren stolpern. Möglicherweise ergibt sich dann ein schärferes Bild aus einem breiteren Spektrum an Anwendungen.

<b>Links zum Thema:</b><ul><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1210190514">AMD Server Roadmap Update</a></li><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1209466070">AMDs 45 nm Prozessoren mit bis zu 2.8 GHz?</a></li><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1204724369">AMD führt 16-Kern Shanghai Server vor</a></li><li><a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=214148">SuperPI Benchmarks [Forum]</a></li></ul>
 
Ist doch ein gutes Zeichen, wenn die Meldung echt ist. Wird auch langsam Zeit. Ich glaube nicht dass die später Ausgelieferten 45er AMD-CPU nur 2,3GHz und so ein Vcore haben werden.
Also ein 2.5GHz pro Kern mit einer Vcore von 1v würd ich grade zum Verkäufer sagen, einmal zum Mitnehmen bitte :)
 
Die sind mutig ... zeigen da einfach die volle OPN ^^

Zur vcore. Naja Wunder sind nicht zu erwarten, da noch kein high-k eingesetzt wird, abgesehen davon ists ja noch ein Sampel. Aber schon mal gut zu sehen, dass sowas existiert ^^

ciao

Alex
 
k8 Architektur hinkt einfach nur noch hinterher jedenfalls im Desktop markt das suckt :[
 
Ist doch ein gutes Zeichen, wenn die Meldung echt ist. Wird auch langsam Zeit. Ich glaube nicht dass die später Ausgelieferten 45er AMD-CPU nur 2,3GHz und so ein Vcore haben werden.
Das sind ja ES und AMD könnte sicherlich noch einige Bereiche im Chip haben, die nur durch höhere Betriebsspannung gut takten.

Allerdings dauerte es bei AMD immer etwas, bis nach einem Shrink neue Takthöhen erreichbar waren.
Zumindest die ersten 1-2 Quartale dürfte 45nm aber eher bei low power, als beim Takt überzeugen. Im Opteron-Markt durchaus ausreichend für gute Verkäufe.

Beim Phenom dann vielleicht schon am Anfang 'Black Edition' mit mäßigen Starttakt (2,5 GHz ? ) und gutem OC-Potential.
 
Das sind ja ES und AMD könnte sicherlich noch einige Bereiche im Chip haben, die nur durch höhere Betriebsspannung gut takten.

Allerdings dauerte es bei AMD immer etwas, bis nach einem Shrink neue Takthöhen erreichbar waren.
Zumindest die ersten 1-2 Quartale dürfte 45nm aber eher bei low power, als beim Takt überzeugen. Im Opteron-Markt durchaus ausreichend für gute Verkäufe.

Beim Phenom dann vielleicht schon am Anfang 'Black Edition' mit mäßigen Starttakt (2,5 GHz ? ) und gutem OC-Potential.
Auf jeden fall da stimm ich dir zu.Nun 2.5Ghz bedeutet Du hast ein 10GHz System vor die stehen, wenn Du dann noch eine BE bekommst zu einem fairen Preis könnte das AMD wie groß ins Geschäft bringen, hoffen wir mal dass die Stoff geben und wir bald mehr infos in den Händen halten. Muß ich mir wohl langsam ein neues Board suchen was?! ;)
 
ch glaube nicht dass die später Ausgelieferten 45er AMD-CPU nur 2,3GHz und so ein Vcore haben werden.
Also ein 2.5GHz pro Kern mit einer Vcore von 1v würd ich grade zum Verkäufer sagen, einmal zum Mitnehmen bitte :)

Wollen mal hoffen, dass sich diesbezüglich bis zur Serie was tut !
Da die IPC-Steigerung dem Rotstift geopfert wurde sieht der Deneb (bei Servern siehts ev.anders aus...) nur Land auf dem Markt wenn er unter 60 Watten läuft sonst stinken die einfach zu sehr gegen Kentsfield & Co. ab.

Mmoe
 
Das ist dann wohl bei AMD für die naechsten Jahren der Weisheit letzter Schluss.
 
Auf jeden fall da stimm ich dir zu.Nun 2.5Ghz bedeutet Du hast ein 10GHz System vor die stehen, wenn Du dann noch eine BE bekommst zu einem fairen Preis könnte das AMD wie groß ins Geschäft bringen, hoffen wir mal dass die Stoff geben und wir bald mehr infos in den Händen halten. Muß ich mir wohl langsam ein neues Board suchen was?! ;)
Die Denebs stehen in der Roadmap schon als >9xxx drin, also muss das schon schneller sein:
6.png


Beste Nachricht an der Geschichte: Man ist im Zeitplan, oben stehen die Deneb Samples ja für Q3 in der Liste und die sind ja jetzt augenscheinlich angekommen ^^ Hört sich gut an :)

ciao

Alex
 
Allerdings dauerte es bei AMD immer etwas, bis nach einem Shrink neue Takthöhen erreichbar waren.
Zumindest die ersten 1-2 Quartale dürfte 45nm aber eher bei low power, als beim Takt überzeugen. Im Opteron-Markt durchaus ausreichend für gute Verkäufe.

Naja, dadurch das die 65nm-Phenoms diesmal nicht so gut liefen, dürfte 45nm gleich auch ganz oben in der Produktliste auftauchen. Die 2,6 GHz des 9950 sollte man mit 140W auf jeden Fall erreichen, und durch den größeren Cache wäre das Produkt dann auch schneller...

Beste Nachricht an der Geschichte: Man ist im Zeitplan, oben stehen die Deneb Samples ja für Q3 in der Liste und die sind ja jetzt augenscheinlich angekommen ^^ Hört sich gut an :)

Und nochwas: Die Terminangabe bei AMD ist mal nicht der letztmöglichste Termin! Das dritte Quartal hat ja gerade erst angefangen...
 
Auf jeden fall da stimm ich dir zu.Nun 2.5Ghz bedeutet Du hast ein 10GHz System vor die stehen,

Du weisst schon, das diese Rechnerei völliger Unsinn ist oder? Ich könnt da immer schmunzeln wenn ich diesen Quatsch lese. 4x 2,5 Ghz sind auch nur 4x 2,5 Ghz und keine 10!!!
 
Du weisst schon, das diese Rechnerei völliger Unsinn ist oder? Ich könnt da immer schmunzeln wenn ich diesen Quatsch lese. 4x 2,5 Ghz sind auch nur 4x 2,5 Ghz und keine 10!!!

Ich versteh aber jetzt diesen Einwand nicht.. *noahnung*
Es gibt sicher Bereiche in denen die Aussage des 10-GHz-Rechners nicht gilt.. vorallem wenn nur 1 Kern angesprochen wird..
Wenn ich aber von DC ausgehe ist es sicherlich ein 10-GHz-System! Ist im Grunde doch egal ob er eine CPU hätte die (würde es sie im PC-Bereich geben) 1 x 10 GHz rechnen könnte - die Leistung also in einer Instanz abgeben würde - oder 4 x 2,5 GHz rechnen würde! Die Leistung wäre i.G. die gleiche! 8)

Ich sag ja auch nicht mein Auto hat 4 x 50 PS - nur weils ein 4-Zylinder ist.. sondern das Wägelchen hat 200 PS... ;D
 
Wenn ich aber von DC ausgehe ist es sicherlich ein 10-GHz-System! Ist im Grunde doch egal ob er eine CPU hätte die (würde es sie im PC-Bereich geben) 1 x 10 GHz rechnen könnte - die Leistung also in einer Instanz abgeben würde - oder 4 x 2,5 GHz rechnen würde! Die Leistung wäre i.G. die gleiche! 8)

Du gehst von QC aus. ;)

Deine Rechnung stimmt natürlich nur bei 100% Multi-Threaded Anwendungen, ist klar. Wenn man jetzt mal nicht auf jeden Krümel etwas abgibt, dann kann man auch >90% Skalierung dazu zählen.
Trotzdem ist ein theoretischer Fehler dabei: Der Speichercontroller, Shader Cache und andere Bestandteile sind gleich schnell bzw. gleich groß, egal ob 1 oder 4 Kerne genutzt werden. Wir nur ein Kern genutzt, hat er da alles zur Verfügung, bei mehreren Kernen muss das geteilt werden.
 
Als Benchmark verwendeten die Jungs leider nur SuperPI 1M, einen sehr alten Benchmark, der keine SIMD-Befehle verwendet, kein SMT/SMP und auch nicht sonderlich gut mit der Speicher-Performance skaliert. Für das auf 3.0 GHz übertaktete Modell wurde eine SuperPI-Zeit von 23,55 s ermittelt. Zum Vergleich: der aktuelle 65 nm Phenom mit B3-Stepping erreichte <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=338464&garpg=7#content_start">in unserem letzten CPU-Test</a> bei 3.0 GHz eine Zeit von 25,25 s. Aufgrund welcher Optimierungen der Zeitvorteil von ca. 7 Prozent zu Stande kommt, kann man zum aktuellen Zeitpunkt natürlich nur vermuten. SuperPI 1M arbeitet mit einer Datengröße von ca. 8 MB (9,4 MB unter Last minus 1,4 MB für die GUI), insofern könnte hier allein der von 2 MB auf 6 MB vergrößerte L3-Cache bereits hauptausschlaggebend sein.
Allerdings habt ihr auch andere Settings verwendet. DRAM- und NB-Takt waren bei eurem Test zB höher. Von den Vergleichen, die ich bisher gesehen habe, lag der Vorsprung des K10.5 gegenüber dem K10 hier eher bei 10-15%. Nur durch Verbesserungen beim Cache kann ich mir das eigentlich nicht erklären. Spricht also eher dafür, dass auch einige Tweaks an der Architektur selbst greifen.
 
Ich sag ja auch nicht mein Auto hat 4 x 50 PS - nur weils ein 4-Zylinder ist.. sondern das Wägelchen hat 200 PS... ;D
Jo, aber die Gesamtleistung liegt auch einzeln abgreifbar an der Kurbelwelle ... wo liegen die 10 GHz beim K10 an ?

Nur durch Verbesserungen beim Cache kann ich mir das eigentlich nicht erklären. Spricht also eher dafür, dass auch einige Tweaks an der Architektur selbst greifen.
Ooch, zwischen Cache Hit und Mem Zugriff liegen immer noch Welten, das kann schon reichen.

ciao

Alex
 
Ooch, zwischen Cache Hit und Mem Zugriff liegen immer noch Welten, das kann schon reichen.
Naja, L1 und L2 werden wohl weitestgehend gleich geblieben sein. Vielleicht konnte man die Latenz des L2 senken, das dürfte aber keinen so grossen Ausschlag geben. Und der L3 war bisher ja kaum besser als der Speicherzugriff, zumindest was Single-Thread Szenarien betrifft.
 
Und der L3 war bisher ja kaum besser als der Speicherzugriff, zumindest was Single-Thread Szenarien betrifft.
Zugriffzeit oder Bandbreite ? Bandbreite geb ich Dir recht, bei der Zugriffszeit nicht (so man denn ohne Prefetcher mißt).

ciao

Alex
 
Liest sich alles richtig toll ;D
Dummerweise beruft sich alles auf einen Screenshot wo keiner weiß wo der herkommt ^^
 
Frequenzen kann man doch nicht einfach addieren! Außerdem ist der Vergleich zwischen Auto und CPU doch reiner Unsinn. Bei der CPU ist es eine Frequenz und beim Auto eine Leistung!
 
Jo, aber die Gesamtleistung liegt auch einzeln abgreifbar an der Kurbelwelle ... wo liegen die 10 GHz beim K10 an ?

Glaubstes nicht.. da bringt man mal ein gar nicht so schlechtes Beispiel.. dann wird das wieder zerpflückt.. :] *lol*
Die Gesamtleistung des 4-Kerners liegt natürlich dann am Sockel an.. ;D
Das mit DC hatte ich ja erwähnt und daß alle Kerne (und nicht nur einer) angesprochen werden müssen auch.. *noahnung*


Aber eigentlich gings ja um meine zukünftige CPU.. war schon fast soweit mir einen 9750 zu holen aber jetzt wird wohl meine 5000BE noch ein bisserl länger arbeiten dürfen um dann von einem Deneb abgelöst zu werden.. Mittlerweile ist ja abzusehen (hoff ich zumindest) daß es sie so in 4-5 Monaten (spätestens) zu kaufen gibt... (wehe jetzt kommt wieder einer daher und zerstört meine Hoffnung.. *nono* *joy*

außer der 9750 wird zum Schluß fast hergeschenkt.. dann.. hmmm :]



Frequenzen kann man doch nicht einfach addieren! Außerdem ist der Vergleich zwischen Auto und CPU doch reiner Unsinn. Bei der CPU ist es eine Frequenz und beim Auto eine Leistung!

..und bei der CPU sind die Frequenzen halt die Leistung.. was also stimmt daran nicht? Seid doch mal a bisserl flexibler... Im übrigen werden die Frequenzen natürlich nicht addiert.. aber die Leistung der CPU - entsprechende Programme natürlich vorausgesetzt.. und diese Leistung wird dann schon addiert - oder warum kauft man sich einen 4-Kerner statt einen Single-Core? Doch nicht weil ein Quadcore genauso schnell ist wie ein Singlecore... sondern weil einfach viel mehr Leistung abzurufen ist (eben mit den entsprechenden Anwendungen)..
für mich reichts jetzt aber zu dem Thema.. wenns jemand anders sieht - auch wurst.. kann ja wieder Singlecores kaufen..
 
Zuletzt bearbeitet:
Du gehst von QC aus. ;)

Deine Rechnung stimmt natürlich nur bei 100% Multi-Threaded Anwendungen, ist klar. Wenn man jetzt mal nicht auf jeden Krümel etwas abgibt, dann kann man auch >90% Skalierung dazu zählen.
Trotzdem ist ein theoretischer Fehler dabei: Der Speichercontroller, Shader Cache und andere Bestandteile sind gleich schnell bzw. gleich groß, egal ob 1 oder 4 Kerne genutzt werden. Wir nur ein Kern genutzt, hat er da alles zur Verfügung, bei mehreren Kernen muss das geteilt werden.

Also eine K10 mit 2,5 @10Ghz wäre ja auch nicht 4x so schnell (aus den gleichen Gründen wie oben beschreiben -> Mem- Controller, Cache...). Von daher ist es auch nicht sooo falsch und dürfte ein ähnliches leistungs Plus ergeben, aber richtig ist es noch lange nicht ;D

Ich denke man sollte einfach bei der Aussage 4 mal 2,5 Ghz bleiben, auch wenn manche es gerne Multiplizieren ;D
 
Wenn ich meinen Phenom auf 2.7 GHz takte hab ich schon die Leistung
von einem K8 mit 3 GHz. (pro Core)

Es wir die Leistung insgesamt verbesser.
Bei den DC ergebnissen nehmen sie Phenom und ein Q6xxx bei gleichem Takt überhaupt nichts. Beim Q9xxx schaut dass schon wieder anders aus.

Wenn man sich mal an die Leistung gewöhnt hat, und dann wieder mal an einem 3 GHz
Pentium sitzt .....;)
 
k8 Architektur hinkt einfach nur noch hinterher jedenfalls im Desktop markt das suckt :[


wie soll man das verstehen? Die K8 Architektur ist technologisch besser als das was Intel bis jetzt zu bieten hat. Ich verstehe warum jeder unzufrieden mit AMD ist. Die Leistungen sind doch spitze selbst ein Sempron ist doch ein Leistungswunder, im gegensatz zu dem was man früher in Form eines Duron/Celeron bekommt hat.

Intel nähert sich mit jeder CPU generation ja der K8 Architektur, sicher bei AMD stimmt die Leistung nicht so wie bei Intel. Aber so schlecht ist das nicht was AMD damals gezaubert hat.
 
Zugriffzeit oder Bandbreite ? Bandbreite geb ich Dir recht, bei der Zugriffszeit nicht (so man denn ohne Prefetcher mißt).
Eigentlich meinte ich den Zugriff, also die Latenzen. Hat sich denn seitdem etwas getan? Ich habe nur noch grob einige Zahlen kurz noch dem Launch im Kopf, wo die Latenz des L3 irgendwo bei 30-40 ns lag (iirc). So viel schlechter ist der Speicherzugriff letztendlich auch nicht (relativ gesehen). Und weit entfernt vom L2 oder gar L1. Zumal der effektive Nutzen mit jedem weiteren Level in der Hierarchie ja auch abnimmt. Ich bin daher eher skeptisch, dass der Leistungsgewinn bei Super Pi nur durch den L3 zustande kommen soll.
 
wie soll man das verstehen? Die K8 Architektur ist technologisch besser als das was Intel bis jetzt zu bieten hat. Ich verstehe warum jeder unzufrieden mit AMD ist. Die Leistungen sind doch spitze selbst ein Sempron ist doch ein Leistungswunder, im gegensatz zu dem was man früher in Form eines Duron/Celeron bekommt hat.

Intel nähert sich mit jeder CPU generation ja der K8 Architektur, sicher bei AMD stimmt die Leistung nicht so wie bei Intel. Aber so schlecht ist das nicht was AMD damals gezaubert hat.

Das ist wieder einmal eine typische Pauschalaussage. AMD hatte seinen Höhepunkt, führte eine längst überfällig, weil bereits wieder verstorbene 64 Bit Architektur nebst längst bekannter und realisierter Architekturmerkmal in einem maroden, veralteten x86-Design von Intel ein. Die Zeit steht nicht still und weil eben das von AMD verwendete (und beileibe nicht 'erfundene' Konzept) eher kanonische Züge aufweist, muß es bei Intel nun mal auch eingeführt werden. Und wird es. Und es führt dort offenbar zu einem Ergebnis, daß gemäß der Qualität der Basisarchitektur entsprechende Vorabergebnisse liefert.

Intel nähert sich beileibe nicht der K8-Architektur, im Gegenteil, man überholt sie gerade - und zwar mit ähnlichen Designkonzepten.

K8/K8L (alias K10) haben bemerkenswerte Leistungspotentiale - auf dem Papier. Wobei man fairerweise sagen muß, daß P4 eben dieses 'Potential' ebenfalls hatte, auf dem Papier. Man erinnere sich an die glorifizierenden Artikel in einem Magazin, das sich c't nennt. Anfangs sah man den Leistungsdefiziten der P4 gegenüber den Konkurrenten eher gelassen nach und dachte sich wohl es wird schon. Selbiges scheint bei AMD nun der Fall zu sein. K10 - ein von der PR-Maschinerie hochgelobter Hoffnungsträger erweist sich als Mittelmaß, sein 'Shrink' auf 45 nm wird selbst in eben selber PR Abteilung seiner 'IPC-Enhancements' beraubt - auf dem Papier! - was unter Anbetracht der Situation und des allgemeinen Gebarens doch höchst verdächtig erscheint.

AMD macht die notwendigen Schritte zur Verkleinerung, um aus seinem 65 nm Silizium, das Probleme mit Takfrequenzen über 2,7 GHz hat, mit 45 nm endlich an der 3 GHz Marke kratzen kann. Die Konkurrenz hat diese Grenze schon mit 65 nm überschritten, schon vergessen? Mal ganz zu schweigen von gewissen Hitzeproblemchen ...
 
Zurück
Oben Unten