PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Bulldozer - AMD Fam 15h - allgemeiner Infothread


Seiten : [1] 2 3 4 5 6

Opteron
30.08.2007, 09:12
Hiho,

nachdem hier jetzt schon wieder Informationen über den nächsten AMD "Hauptkern" durchsickern (ich nenn ihn mal K12), obwohl noch nicht mal der K10 erhältlich ist, mach ich mal nen neuen Thread auf. Ich werd da mal später noch die Infos der letzten Konferenz nachtragen. Bis jetzt poste ich aber nur die aktuellen SSE5 Infos vom Register:

According to AMD, the new extensions will bring a couple of major breakthroughs.

For one, AMD will follow the RISC crowd with support for 3-Operand Instructions - up from two. So, unlike in the past where you would do A plus B and then have to store the result of the operation in A or B, developers can now store the result in a third location. This should reduce the total number of instructions needed to perform certain tasks and require less effort on the part of developers to keep track of registers.

The support for 3-Operand Instructions allows AMD to roll out a "fused multiply accumulate" instruction as well. This melds multiplication and addition to permit "iterative calculations with one instruction."http://www.theregister.co.uk/2007/08/30/amd_sse5/

Also wird das ein noch RISC-artigeres Design. Spekulieren darf man jetzt über die restlichen "breakthroughs", sollen ja mehrere sein und es wurde nur einer genannt ;-)

Infos bei AMD:
http://developer.amd.com/sse5.jsp

und das >200 Seiten PDF für die neuen Befehle:
http://developer.amd.com/assets/sse5_43479_BDAPMU_3-00_8-27-07.pdf

Wäre nett, wenn das jemand mit Ahnung überfliegen könnte und Berichtenswertes hier postet :)

Abgesehen davon darf munter weiterspekuliert werden, reversed Hyperthreading wird wohl auch wieder ein Thema sein ;)

Edit, Einfügen weiterer Links:
heise Meldung:
http://www.heise.de/newsticker/meldung/95180 (Unterscheidet sich von allen andren Meldungen duch ein paar anschauliche (Code)Beispiele.)


ciao

Alex

P.S: Bin gespannt, wie Intel nun seine nächste SSE Version nennt .. vielleicht SSE5i ^^

Bobo_Oberon
30.08.2007, 09:44
Das scheint die x86-Variante von DECs Tarantula zu sein.

DEC hatte in dem EV-8 seine SIMD-Einheit (http://www.planet3dnow.de/vbulletin/showthread.php?p=1152687#post1152687) auch so auslegen wollen. Am Anfang der K9-Diskussion wurde das ja auch als eine Option für den Nachfolge-Prozessor des K8 angesehen.

Nun ja, halb richtig, wie es scheint, da zuerst 128 Bit breite Instruktionen (oder 2x 64 Bit, oder 4x 32 Bit) in einem Rutsch mit SSE4a bearbeitet werden können.

Vor einem 3-Operanden-Prozessor wollte man wohl im Vorfeld Engpässe beseitigen.

MFG Bobo(2007)

mtb][sledgehammer
30.08.2007, 10:07
Was mir zu dem Thema spontan einfällt: ursprünglich hatte (laut einer damaligen C't) AMD geplant schon im K8 eine 3 Operanden Sprache einzuführen; damals unter dem Namen Technical Floating POint Unit (TFP). Das wurde damals zugunsten von SSE2 dann doch umgeschmissen. Schön, dass AMD das Thema wieder aufgreift. Das dürfte vielen Anwendungen, insbesondere Videobearbeitung zugute kommen.

http://www.heise.de/newsticker/meldung/11163

Opteron
30.08.2007, 10:08
Das scheint die x86-Variante von DECs Tarantula zu sein.
Hmm ja eigentlich sollte man jetzt vom EV8 Design "klauen" ^^ Aber bevor wir weiterspekulieren, mit Tarantula meinst Du aber nicht die komplette Vector FPU wie hier beschrieben:
http://www.theinquirer.net/?article=24284
http://systems.cs.colorado.edu/ISCA2002/FinalPapers/X/EspasaR_Tarantula_final.pdf

Sondern nur die "normale" EV8 (Aranha, oder wie immer die Spinne hiess) Version, oder ? :)

Edit: @mtb][sledgehammer: Aja stimmt .. die TFP ... da war doch was:
Bei der FPU allerdings wurde AMD etwas mutiger. Zwar unterstützt sie logischerweise die klassischen FPU/MMX/3Dnow!-Modi, darüber hinaus hat AMD aber den Stack-Engpass mit einem neuen Modus gesprengt. Die FPU arbeitet dann als volle Drei-Adressmaschine mit einem Registersatz von ‘deutlich mehr’ als 8 Registern (vermutlich wohl 32). Von 1999 ^^ http://www.heise.de/ct/99/22/016/
Sieht wohl so aus, dass AMD da ein paar alte Sachen ausgegraben hat ;-)

ciao

Alex

Bobo_Oberon
30.08.2007, 10:26
Hmm ja eigentlich sollte man jetzt vom EV8 Design "klauen" ^^ Aber bevor wir weiterspekulieren, mit Tarantula meinst Du aber nicht die komplette Vector FPU wie hier beschrieben:
Ich verstehe darunter die geplante Erweiterung des EV-8 mit einer Vektoreinheit, eben "Tarantula". Das hatte HenryWince damals ja auch so beschrieben.

Schau mir mal gleich deine PDFs an 8)

MFG Bobo(2007)

Opteron
30.08.2007, 10:47
Ich verstehe darunter die geplante Erweiterung des EV-8 mit einer Vektoreinheit, eben "Tarantula". Das hatte HenryWince damals ja auch so beschrieben. Hmm ok, den Kommentar von Henry hab ich jetzt nicht mehr im Kopf, hab das PDF nur kurz überflogen, aber das schaut ja ziemlich massiv aus, das braucht man nur im HPC Bereich. Nachdem aber Bulldozer das erstemal im Fusion Chip für Notebooks auftauchen soll kann ich mir nicht vorstellen, dass ein tarantula Teil ins Notebook Segment mitgeschleppt wird.

Ausser ... ausser ... man findet ne clevere Art die Grafikausgabe damit zu rechnen ... ist ja wohl nicht soo viel Unterschied ;-)

Was auch noch dafür spräche ... 2009 ist 45nm oder 32nm aktuell ..da interssiert so ne Vectoreinheit wohl keinen mehr, selbst wenn die Register 1kb gross sind.

Aber Zwischenfrage soweit: TFP == Tarantula ? (klärt sich vielleicht, wenn ich Henrys Kommentar finde, heute Abend dann, oder Bobo ist schneller ;-))

ciao

Alex

cumec
30.08.2007, 11:09
Und laut den Folien vom Technical Analyst Day 2007 soll der Bulldozer ja bereits 8-16 cores im Sandtiger für server bringen.

Bobo_Oberon
30.08.2007, 11:31
Der erste EV-8 war noch ohne die Vektorerweiterung "Tarantula" entwickelt worden. Allerdings sollte der EV-8 (Alpha 21464) später mit einem sockelkompatiblen EV-8+ Prozessor ersetzt werden.

... Tarantula adds to the Alpha ISA new architectural state
in the form of 32 vector registers (v0..v31) and their associated
control registers: vector length (vl), vector stride
(vs), and vector mask (vm). Each vector register holds 128
64-bit values. The vl register is an 8-bit register that controls
the length of each vector operation. The vs register
is a 64-bit register that controls the stride between memory
locations accessed by vector memory operations. The vm
register is a 128-bit register used in instructions that operate
under mask. ...

To avoid long latency data transfers
back and forth between the Vbox ALUs and the EV8 scalar
register file (a 20-cycle round-trip delay), vector comparisons
store the resulting boolean vector in a full vector register.
This allows coding complex if-statements without
vector-scalar communication.
Es ist demnach nicht beides identisch, aber löst auf ähnliche Weise Fesseln der Gleitkommaeinheiten.

AMD hatte aber schon vorher eine Streaming-Einheit. SSE2 ist die technische Basis für x86-64-Vektoreinheiten. In so fern gehört diese elementar zu der AMD64 ISA.

Eine kommende AMD-CPU-Generation mit Grafikkern (Stichwort "Fusion [intern], "Torrenza" [extern]) ist (noch) nicht explizit in der AMD64 ISA. Wird es auch erst mal nicht, da AMD offensichtlich doch an einer TFP-Einheit (TFP = Technical Floating Point) gearbeitet hat.

Ehrlich gesagt bin ich sogar etwas erleichtert, dass AMD nach wie vor auch am eigentlichen Prozessorkern des K8/K10 weiter arbeitet und sich nicht ausschliesslich auf ATIs GPU-Kerne verlässt. Genau das ist die Frage, wie sich x86 mit dem Larrabee (http://www.orthy.de/index.php?option=com_content&task=view&id=4738&Itemid=86), Polaris (http://www.orthy.de/index.php?option=com_content&task=view&id=4686&Itemid=86), Fusion/Torrenza (http://www.orthy.de/index.php?option=com_content&task=view&id=4247&Itemid=86), Tesla (http://www.orthy.de/index.php?option=com_content&task=view&id=4836&Itemid=86) weiterentwickelt.

MFG Bobo(2007)

Opteron
30.08.2007, 12:55
Eine kommende AMD-CPU-Generation mit Grafikkern (Stichwort "Fusion [intern], "Torrenza" [extern]) ist (noch) nicht explizit in der AMD64 ISA. Wird es auch erst mal nicht, da AMD offensichtlich doch an einer TFP-Einheit (TFP = Technical Floating Point) gearbeitet hat. Stimmt auch wieder .. Fusion wird ja eher ein Zusammenbasteln mit einem Bulldozer Kern und einem extra Grafikkern. Ergo kann keine Grafikeinheit im K11 sein. Hier hab ich noch ne schöne Grafik gefunden:
http://common.ziffdavisinternet.com/util_get_image/16/0,1425,sz=1&i=168218,00.jpg
Quelle: http://www.extremetech.com/article2/0,1558,2177464,00.asp

Vector Shift & Rotate .. hmmmm

ciao

Alex

nonworkingrich
30.08.2007, 13:21
SSE4A hat gar keine Schnittmenge mit SSE4?
Und wann kommt SSSSE5ABCD? Warum werden die Bezeichnungen nicht mit dem Zufallsgenerator gemacht?

Ragas
30.08.2007, 15:29
Kann mir mal wer erklären warum es hier gerade gesondert um single threaded Anwendungen geht:
Der für das Jahr 2009 erwartete Bulldozer soll teilweise enorme Geschwindigkeitszuwächse für Single-Thread-Anwendungen bieten, die durch neue Befehle in SSE5 erreicht werden.

Kann es sein dass AMD auch Befehle Integrieren will, welche automatisch auf mehrere Prozessoren verteilt werden können??

Ich wollt nur nochmal die Andeutungen zu R-HT aufgreifen. ;D

NOFX
30.08.2007, 15:46
Kann mir mal wer erklären warum es hier gerade gesondert um single threaded Anwendungen geht:Die Multi-Thread-Performance zu vergrößern ist relativ einfach durch Erhöhung der Anzahl der Kerne möglich, und auch in etwa Das, was in den letzten ~2 Jahren fast ausschließlich gemacht wurde. Diese Technik bietet jedoch echte Vorteile für Single-Thread-Anwendungen, da die IPC pro Kern gesteigert wird.

Ragas
30.08.2007, 19:28
Die Multi-Thread-Performance zu vergrößern ist relativ einfach durch Erhöhung der Anzahl der Kerne möglich, und auch in etwa Das, was in den letzten ~2 Jahren fast ausschließlich gemacht wurde. Diese Technik bietet jedoch echte Vorteile für Single-Thread-Anwendungen, da die IPC pro Kern gesteigert wird.

naja gerade bei großen kernzahlen wird es wieder schwerer die Mltithread performance zu erhöhen, das die Effekte der Skalierung immer schwerwiegender werden. (98% skalierung pro kern kann bei 8 kernen schon ne ganze menge leistungsverlust bedeuten)

ich glaube nicht, dass man einfach auf eine verbesserung des einzelnen cores hinweist, sonst könnte man das ja beim k10 auch so machen.

laser114
30.08.2007, 20:15
SSE4A hat gar keine Schnittmenge mit SSE4?

Nein, SSE4A und SSE4 haben bis auf dem Namen nichts gemeinsam, die Menge der gemeinsamen Befehle ist genau Null.

Das die Befehlssätze überhaupt einen so ähnlichen Namen haben ist wohl den jeweiligen Marketingabteilungen zuzuschreiben. Dazu kommt ja auch noch, dass der Penryn nicht sämtliche SSE4-Befehle mitbringt, nur die meisten, nämlich 47 von 54. Das nennt man inzwischen SSE4.1, obwohl es weniger als SSE4 ist...

walljumper
31.08.2007, 00:32
In welchem Zeitraum soll den der Bulldozer vorgestellt werden? Ich meine gerade für AMD ist es schon etwas komisch jetzt schon etwas über die nächste Architektur bekannt zu geben. Muss der K10 eventuell nur eine kurze Zeit überbrücken?

Opteron
31.08.2007, 05:52
In welchem Zeitraum soll den der Bulldozer vorgestellt werden? Ich meine gerade für AMD ist es schon etwas komisch jetzt schon etwas über die nächste Architektur bekannt zu geben. Muss der K10 eventuell nur eine kurze Zeit überbrücken? Les mal den 4ten Beitrag über Dir, von Ragas 16:29, da stehts drin ;-)
Oder Du klickst auf einen der Links im ersten Beitrag, da stehts auch überall, teilweise sogar in der Überschrift ;-)

ciao

Alex

N1truX
31.08.2007, 08:06
Hört sich zumindet so an als müsste der K10 Kern nich all zu lange arbeiten. 2009 is lang, eben bis zum 31.12.2009, also noch etwas über 2 Jahre was ich für einen halbwegs realistischen Zeitraum halte.

Das Konzept hört sich schonmal echt gut an.

R-HT wäre natürlich ein Riesen Sprung nach vorne. Man könnte die Kernanzahl erhöhen und würde 1 Thread auf 2 Kerne verteilen und würde so fast zu 100% Skalieren. Aber ich kann mir das relativ schwer vorstellen da es ja immernoch das Prob gibt, das das Ergebnis des einen Kerns für das des anderen wichtig sein könnte.

Da müsste der Prozi erstmal wieder raten oder er wartet. Aber wenn am ende 50% mehr rauskommen wäre das schon genug^^

fogzone
31.08.2007, 12:32
naja ich denke 2009 ist da eher als richtwert zu nehmen. die verzögerungen des k10 haben ja gezeigt dass da ein halbes jahr mehr (weniger wohl kaum) immer mal drinne ist.

rkinet
01.09.2007, 09:01
Nein, SSE4A und SSE4 haben bis auf dem Namen nichts gemeinsam, die Menge der gemeinsamen Befehle ist genau Null.

Das die Befehlssätze überhaupt einen so ähnlichen Namen haben ist wohl den jeweiligen Marketingabteilungen zuzuschreiben. Dazu kommt ja auch noch, dass der Penryn nicht sämtliche SSE4-Befehle mitbringt, nur die meisten, nämlich 47 von 54. Das nennt man inzwischen SSE4.1, obwohl es weniger als SSE4 ist...
http://www.computerbase.de/news/hardware/prozessoren/amd/2007/august/amd_sse5_bulldozer/

Intel hat ja die SSE4 einfach wahllos zusammengestellt, damit etwas Neues entsteht.
Angeblich ist die Quadrawurzel des Geburtstages von Intel-Chef Paul Otellini dabei fest verdrahtet mit integriert worden ;D

SSE5 wird wohl ählich wie x86-64 von AMD als 'intelligentes Design' mit gut 2 Jahren Vorlauf zwischen Definition und Auslieferung vorbereitet.

nookie88
02.09.2007, 10:54
Paasend zum Thema:

Klick (http://www.hardtecs4u.com/?id=1188588288,1290,ht4u.php)


MfG nookie

fogzone
02.09.2007, 10:57
.....Es sollen mathematische bzw. logische Operationen zukünftig statt mit zweien mit drei Operanden ausgeführt werden können, beispielsweise beim häufig genutzten Fused Multiply Accumulate-Befehl, der einen Floating-Point auf die Multiplikation zweier anderer FP-Werte aufaddiert, in nur einem Arbeitszyklus. Die Nutzung dieser Möglichkeiten hat bereits bei Grafikkarten Leistungszuwächse erbracht.

amd fängt wohl an das know-how von ati zu nutzen und baut es in ihre cpus ein. ist wohl nur ein logischer schritt, da doch die gpus richtig viel rechenpower haben ;D

LinuS
02.09.2007, 13:56
Und wo liegt jetzt dieses Definitive? Ich mein, AMDs Lösung für den Bulldozer muss doch nicht die gleiche sein wie anno dazumal. Von daher kann es doch wohl auch sein, dass AMD sich für den Bulldozer Tipps bei ATI einholt.

nookie88
02.09.2007, 17:54
Patente pflückt man nicht von den Bäumen, vor allem dann nicht, wenn man sie schon hat ...

MFG Bobo(2007)


Sry deine Aussage macht irgendwie keinen Sinn.

Opteron
02.09.2007, 18:18
Sry deine Aussage macht irgendwie keinen Sinn.
Docht macht es .. und bitte hört jetzt mit dem OT hier auf. Bulldozer bekommt SSE5, alle Infos dazu stehen in der heise oder Register-Meldung (z.B. das AMD die Befehle von überallher abgeschaut hat (altivec, DSP Befehle usw.) und AMD hatte schon mal ne 3 Operanden FPU in der Schublade liegen. Die Wahrscheinlichkeit, dass ATi irgendwas damit zu tun hat, ist deshalb sehr gering.

Steht eigentlich auch schon alles hier im Thread .. man müßte nur lesen, bzw. die Links anklicken. Also das SSE5 Thema bitte für beendten betrachten, außer es gibt wieder was wirklich Neues dazu. Der Thread soll hier noch 2 Jahre überleben, das kann recht schnell unübersichtlich werden, was ich gerne vermeiden möchte.

ciao

Alex

N1truX
03.09.2007, 20:56
Docht macht es .. und bitte hört jetzt mit dem OT hier auf. Bulldozer bekommt SSE5, alle Infos dazu stehen in der heise oder Register-Meldung (z.B. das AMD die Befehle von überallher abgeschaut hat (altivec, DSP Befehle usw.) und AMD hatte schon mal ne 3 Operanden FPU in der Schublade liegen. Die Wahrscheinlichkeit, dass ATi irgendwas damit zu tun hat, ist deshalb sehr gering.

Steht eigentlich auch schon alles hier im Thread .. man müßte nur lesen, bzw. die Links anklicken. Also das SSE5 Thema bitte für beendten betrachten, außer es gibt wieder was wirklich Neues dazu. Der Thread soll hier noch 2 Jahre überleben, das kann recht schnell unübersichtlich werden, was ich gerne vermeiden möchte.

ciao

Alex
Ich kann mich täuschen, war auch weit vor meiner Aktiven PC zeit, aber hatte der K5 nich nen 3 Operanden FPU??? Irgendwas war an dem doch so besonders das der ne Extrem hohe IPC hatte, nur durch zu geringe Anbindung (SPU intern und FSB) diesen Vorteil nie nutzen konnte.

Bobo_Oberon
03.09.2007, 22:39
... hatte der K5 nich nen 3 Operanden FPU? ... So weit war man damals dann bei AMD doch nicht.

Die K5 FPU war auch nicht überragend. Die Integerrechenleistung war hingegen damals Spitzenklasse (bezogen auf den Takt).

Kurz ausgedrückt ermöglicht diese neue TFP-Einheit etwas, was bis dahin auf x86-CPUs noch nicht möglich war.

http://www.orthy.de/images/stories/bokill/AMD/SSE5/amds_sse5_multiplizieren_ansammeln.jpg
Quelle (http://www.orthy.de/index.php?option=com_content&task=view&id=4915&Itemid=86)

Derzeit können nur zwei Operatoren miteinander multipliziert werden. Die Addition erfordert wieder eine Rückspeicherung und Sicherung der Ergebnisse (was Zeit kostet).

Mit SSE5 will AMD diese Addition in einem Rutsch erledigen, innerhalb der Befehlspipeline.

MFG Bobo(2007)

Dresdenboy
04.09.2007, 11:59
@N1truX & Bobo_Oberon

Genau genommen hatte der K5 eine 3-Operanden-FPU und auch 3-Operanden-ALUs. Es ist bekannt, dass der Kern des K5 auf der Am 29000 RISC-Prozessor-Familie basierte, welche zu dieser Zeit eingestellt wurde. Diese RISC-CPU arbeitete mit 3-Operanden-Befehlen (http://www.amd.com/epd/29k/29kprog/29kprog.pdf).

Seit dem K6 (basierend auf dem Nx586) besteht kein solch offensichtlicher Zusammenhang des Kerns (nach den Decodern) zu einem vorhandenen CPU-Design. Aber schon eine effiziente Out-of-Order-Execution erfordert µOps, welche mit 3 Operanden arbeiten können.

Durch SSE5 (leider nicht schon in Form von TFP) wird so ein Feature für die x86-ISA zugänglich.

@alle
Mit ATI u. entspr. erworbenem Wissen hat SSE5 m.E. nichts zu tun. Was AMD da in die neuen Kerne bringen will, ist ja nun nichts Revolutionäres an sich. Nicht einmal für x86. Es werden im Prinzip nur die internen Möglichkeiten der Rechenwerke besser ausgenutzt u. geschickt erweitert. Eine FMAC-Operation ist nicht viel komplizierter als eine Multiplikation, da letztere ja schon ein paralleles Addieren sehr vieler Einzelwerte darstellt u. bei FMAC nun nur ein weiterer Wert hinzukommt.

cumec
04.09.2007, 12:58
Hier nochmal Infos zum Sandtiger und die Bestätigung des octacore-designs.
Eine andere Frage die sich mir stellt ist, dass eine PCIe2.0 Anbindung direkt auf die DIE gelangen soll?

http://www.tomshardware.com/de/8-Core-CPU-Sandtiger-Falcon-AMD,news-239863.html

gruß

cumec

Bobo_Oberon
04.09.2007, 17:20
... Eine andere Frage die sich mir stellt ist, dass eine PCIe2.0 Anbindung direkt auf die DIE gelangen soll? ...
http://www.orthy.de/images/stories/bokill/AMD/Analyst_Day_2007/falcon_erster_fusion.jpg
Quelle (http://www.orthy.de/index.php?option=com_content&task=view&id=4824&Itemid=38&limit=1&limitstart=7)

MFG Bobo(2007)

Headman
04.09.2007, 20:45
Die ersten Fusion Inkarnationen werden wohl darauf hinauslaufen, dass man einfach eine per HT angebundene Ati Northbridge (mit IGP und PciE 2.0 Controller) mit auf das Cpu Package verpflanzt.

Ragas
04.09.2007, 20:46
wird wohl für das umschalten zwischen integrierter und externet Grafikkarte benötigt.

rkinet
05.09.2007, 09:18
Die ersten Fusion Inkarnationen werden wohl darauf hinauslaufen, dass man einfach eine per HT angebundene Ati Northbridge (mit IGP und PciE 2.0 Controller) mit auf das Cpu Package verpflanzt.
wieder: http://www.tomshardware.com/de/8-Core-CPU-Sandtiger-Falcon-AMD,news-239863.html

Fusion erscheint eher als Modifizierung des 'Sandtiger' & 'Shanghai'-Designs.
Statt 8-Cores eben 2, dann die 6M-L3 des Shanghai als ges. Cache für 2* CPU und 1*GPU zuordnen und PCIe 2.0 aus dem 'Sandtiger'-Design nehmen.
Da könnten durchaus kompakte DIEs enstehen.

Auch sind heutige Standard GPUs aus Nothbridge-Lösungen bzgl. Taktpotential eher mäßig ausgelegt, während 45nm/ Fusion eher bis 3 GHz ermöglichen würde.
Ich könnte mir vorstellen, daß AMD die SSE5 um SMT-Fähigkeiten erweitert und so der GPU virtuelle Recheneinheiten in größerer Zahl zur Verfügung stellen kann.

Sie mir also wie viel mehr Neudesign als nur Integration von etablierter Hardware auf einem DIE aus.

Headman
05.09.2007, 11:06
wieder: http://www.tomshardware.com/de/8-Core-CPU-Sandtiger-Falcon-AMD,news-239863.html

Fusion erscheint eher als Modifizierung des 'Sandtiger' & 'Shanghai'-Designs.
Statt 8-Cores eben 2, dann die 6M-L3 des Shanghai als ges. Cache für 2* CPU und 1*GPU zuordnen und PCIe 2.0 aus dem 'Sandtiger'-Design nehmen.
Da könnten durchaus kompakte DIEs enstehen.

Auch sind heutige Standard GPUs aus Nothbridge-Lösungen bzgl. Taktpotential eher mäßig ausgelegt, während 45nm/ Fusion eher bis 3 GHz ermöglichen würde.
Ich könnte mir vorstellen, daß AMD die SSE5 um SMT-Fähigkeiten erweitert und so der GPU virtuelle Recheneinheiten in größerer Zahl zur Verfügung stellen kann.

Sie mir also wie viel mehr Neudesign als nur Integration von etablierter Hardware auf einem DIE aus.

Später vielleicht, aber momentan ist es ziemlich sicher das zumindest Falcon ein MCM wird und das der GPU-Teil bei TSMC gefertigt wird.

http://www.digitimes.com/bits_chips/a20070806PD201.html

gast_003
05.09.2007, 23:26
Was soll GDD3 sein und was hat das bei ner Server CPU verloren?
Bei google habe ich das nur im Zusammenhang mit Grafikkarten gefunden und gehe deshalb mal davon aus das es GDDR3 Grafikspeicher sein soll....wo wir jetzt wieder beim Thema "Was hat das bei ner Server CPU verloren?" wären.
Entweder hat der 8 Kern einen Grafikkern ohne integrierten Grafikspeicher mit drin, es soll DDR3 Speicher sein oder es ist schlicht Blödsinn.

Opteron
10.09.2007, 23:13
Nachdem ich grad nach Links für das "AMD will Quimonda(Infinieon) kaufen" Gerücht gesucht hat, hat mir google noch was zu G3MX ausgespuckt:

http://www.hothardware.com/News/More_AMD_G3MX_Details_Emerge/

Darin gehts um eine "Hydra" CPU, die 4 Speicherkanäle hat und daran dann DDR3(-1600) anspricht. Hört sich nach ner geballten Ladung Bandbreite an ^^
Naja die Kerne werden sicherlich Bulldozer sein, also wollt ich das hier mal erwähnen ;-)

Weiterer Vorteil der Lösung ... die CPU ist wieder unabhängig vom Speicherstandard. Dort wird nur der modifizierte HT3 Anschluss verbaut, das DDR2/DDR3/DDR4/DDRX Interface sitzt im externen G3MX chip.

ciao

Alex

LinuS
11.09.2007, 20:03
Dürfte der Vorteil der Unabhängigkeit ggü Speicherstandards aber nicht mit deutlich erhöhten Latenzen erkauft werden? Ich mein, so als Laie denk ich mal: "Super, der G3MX ist ein "Umweg" ähnlich dem externen Speichercontroler von früher" Naja, wahrscheinlich zählen im Servergeschäft Latenzen nicht so viel wie pure Bandbreite ;)
btw: theinquirer @träummodus ;) http://uk.theinquirer.net/?article=42282 was mich stutzig macht ist folgendes: but all that we can tell you now is that the AMD Fusion processor will be consisted out of one, two, three, four Bulldozer cores and a graphics part based on R700 architecture.

The name R700 was not mentioned anywhere, but has support for DirectX 10.1 API and second-generation UVD on one of the slides. AMD does not want to confirm the actual specs at the moment, but it is certain that this will not be a R600/700 design, but rather something new.
irgendwie hört sich das für mich widersprüchlichan. Zum einem soll der Fusion einen Grafikpart basierend auf r700 bekommen and a graphics part based on R700 architecture.
zum anderen wird dies aber wieder "dementiert": it is certain that this will not be a R600/700 design, but rather something new.

HenryWince
11.09.2007, 22:41
@Opteron
Weiterer Vorteil der Lösung ... die CPU ist wieder unabhängig vom Speicherstandard.

So weit geht G3MX nicht! Der Memorycontroller bleibt in der CPU, nur der DRAM-Controller wird auf die G3MX Chips ausgelagert (Siehe auch Pressemitteilung (http://www.inphi-corp.com/news/press/Inphi_CSMB_release.pdf) von Inphi zum IN16KXMX).

@LinuS

Bei G3MX geht es in erster Linie um hohe Memorykapazität bei moderatem Energieverbrauch. Die Konkurenz von G3MX ist FB-DIMM.

Unterschiede sind:

* FB-DIMM:
- 1 Buffer Chip pro DIMM Modul (der verbrät ganz schön Energie!)
- Die (Transfer-)Latenz steigt linear mit der Anzahl der Speicher-Module (=>Daisy-Chainig).
- Auf den FB-DIMM Modulen werden zwar DDR2/3 Chips verbaut, aber die Module selbst sind nicht Massenmarkttauglich => hoher Preis.

* G3MX:
- 1 Buffer für je 4 DIMM-Module
- Etwas höhere Latenz als direkt angebundene DDR3 Module
- Einsatz von normalen DDR3 Modulen (geringere Kosten!)

Höhere Bandbreiten, durch mehr mögliche Kanäle, sind ein gern gesehener Nebeneffekt.

Bezüglich des Grafikcores würde ich es so interpretieren: Die Grafikeinheit ist vom Aufbau her ähnlich zum R700, aber von der Implementierung nicht identisch. Das könnte z.B. einfach daran liegen, dass AMD Fusion nicht als MCM sondern als monolithischen Chip entwickelt.

nazgul99
11.09.2007, 23:48
@HenryWince: stimme deinen Ausführungen zu.

* G3MX:
- 1 Buffer für je 4 DIMM-Module
- Etwas höhere Latenz als direkt angebundene DDR3 Module
- Einsatz von normalen DDR3 Modulen (geringere Kosten!)

Höhere Bandbreiten, durch mehr mögliche Kanäle, sind ein gern gesehener Nebeneffekt.


Mit ungefähr gleicher Pinzahl für Ram wie bisher lassen sich so doppelt so viele Speicherkanäle anbinden -> doppelte Bandbreite je CPU-Sockel möglich (und auch sehr wichtig: doppelte Kapazität). Das ist bei 8 oder mehr Kernen je CPU auch ratsam. Wenn Suns Niagara (und IBM Power 7(?)) auf demselben Sockel laufen soll ohnehin, der nutzt heute schon 4 Speicherkanäle. Hothardware hat einen interessanten Artikel (http://www.hothardware.com/News/More_AMD_G3MX_Details_Emerge/) dazu.
The processors will still feature an on-die memory controller, but unlike current platforms it will be geared for DDR3 memory. The processors will interface with one or more G3MX chips, which in turn are connected to the memory ports. G3MX will act as a memory port extender for the memory controller in the CPU socket and provides a serial link to the RAM. Also, the electrical signaling between the memory controller and G3MX is based on HyperTransport 3.0.

Ich hatte auch erst gedacht, AMD würde den Memory-Controller wieder aus der CPU schmeißen, ist aber offenbar nicht der Fall. Witzig ist, daß der Downlink vom Ram 20 Lanes breit sein soll, während der Uplink nur 13 Lanes zählt. Ich vermute, daß AMD ermittelt hat, wie groß der Traffic vom/zum Ram typischerweise ist und die Lanes entsprechend asymmetrisch aufgeteilt. Groovy 8)
13 + 20 Lanes * 4 Kanäle ergibt 132 differnezielle Datenleitungen, bei 2x 64bit Ram sind's 128 solcher Paare, was jeweils noch an Steuerleitungen hinzukommt, weiß ich nicht.

Bobo_Oberon
12.09.2007, 02:09
... Wenn Suns Niagara (und IBM Power 7(?)) auf demselben Sockel laufen soll ohnehin, der nutzt heute schon 4 Speicherkanäle. ... Der Niagara 1 und Niagara 2 (http://www.orthy.de/index.php?option=com_content&task=view&id=4869&Itemid=85) sind fertige Produkte, selbst der Victoria Falls (Multisockel Niagara) ist fertig und sie werden nicht auf dem AMD-Sockel erscheinen. Sun hat für den Niagara 2 FB-DIMM eingeplant.

Auch bei IBM wird das Interesse an einem herstellerübergreifenden Sockel kaum, bis wenig vorhanden sein. Bislang hat IBM fleissig an dem PowerPC-Sockel nur an die eigenen Linien gedacht.
IBM treibt es ganz besonders bunt mit den verschiedensten Bussen/Links ... die sind auch im PCI-Express-Boot bei Intels Geneso (http://www.orthy.de/index.php?option=com_content&task=view&id=4271&Itemid=86) drin.

In der damaligen Presseerklärung von Inphi ist tatsächlich von einer Seriellen Schnittstelle die Rede, die vom AMD-Prozessor zu dem 3GM-Extender verlegt ist.

MFG Bobo(2007)

nazgul99
12.09.2007, 03:02
Ob Sun und IBM tatsächlich Infrastruktur mit AMD teilen wollen, werden wir sehen. Bei POWER(5/6/7?) scheint mir das noch unwahrscheinlicher als bei Niagara(1/2/3?), aber über die die POWER-CPUs umgebende Infrastruktur weiß ich auch so gut wie nichts. Selbstverständlich müßten jene CPUs (zumindest bestimmte Ableger) der beiden Hersteller und AMDs auf gemeinsame Interconnects gebracht werden, dafür hätten sie IIRC noch knapp 2 Jahre Zeit. Aber ob das tatsächlich passiert, ob vielleicht doch kein gemeinsamer Sockel, sondern z.B. nur HT-Nutzung bei Sun und/oder IBM dabei rauskommt (für Multi-Sockel bei Sun nächstes Jahr bietet sich's ja wirklich an), oder alles nur heiße Luft war, wer weiß...
Interessant wär's jedenfalls! Und zwischen DEC und AMD hat's das ja auch gegeben (EV6-Bus), in Compaqs kleinsten Servern tauchte sogar AMDs Irongate-Chipsatz (ich meine, der war's) auf. Einen gemeinsamen Sockel/Slot gab's dann doch nie, wird wohl auch niemand mehr herausbekommen, ob der wirklich geplant war. Dec nannte seinen IIRC Slot-B, klingt ja immerhin sehr verwandt zum Slot-A AMDs. (Edit: Hab da was zum Thema gefunden: http://findarticles.com/p/articles/mi_m0CGN/is_3690/ai_54997669 - ein Artikel vom 25. Juni 1999. Dort munkelt man, AMD plane eine "Slot B version of Athlon late this year")
In der damaligen Presseerklärung von Inphi ist tatsächlich von einer Seriellen Schnittstelle die Rede, die vom AMD-Prozessor zu dem 3GM-Extender verlegt ist.
Aus dem oben verlinkten HotHardware-Artikel:
Also, the electrical signaling between the memory controller and G3MX is based on HyperTransport 3.0.
Meinst du das?

Bobo_Oberon
12.09.2007, 09:18
Ich rate zur Vorsicht, ob die Zusammenarbeit im HyperTransport-Konsortium jenseits von der x86-64-Plattform weitergeht.

Sun setzt ganz auf Open Source und Zusammenarbeit zu Produkten, die die UltraSPARCs zusätzliche Fähigkeiten geben. Der Entwurf eines Niagara 1 mit einem FPGA auf dem gleichen Die ist solch ein Produkt.

Die Zusammenarbeit mit DEC ist schon deswegen nicht vergleichbar, weil AMD das EV-6 Protokoll für die K7 lizensierte und mit einer Ausgründung von DEC das HyperTransport-Protokoll zusammen entwarfen.

In dem PDF von Inphi ist nicht explizit die Rede von HyperTransport, sondern es ist dort "lediglich" die Rede von einem seriellen Datenprotokoll mit einer Bandbreite von derzeit 6 GB/s Bandbreite und mehr.

MFG Bobo(2007)

NeuerBenutzer
12.09.2007, 19:53
- Auf den FB-DIMM Modulen werden zwar DDR2/3 Chips verbaut, aber die Module selbst sind nicht Massenmarkttauglich => hoher Preis.

Also laut diesem Artikel (http://www.heise.de/newsticker/result.xhtml?url=/newsticker/meldung/93259&words=G3MX&T=G3MX%20) verbaut Intel, IBM und Sun FB-DIMM - wie kann man da von nicht Massenmarkttauglich sprechen??

Da sind eher die Registered DDR2/3-Module von AMD nicht Massenmarkttauglich, denn die werden nur noch von AMD benutzt. Die alten Sockel 604 Xeon gibt es ja nicht mehr zu kaufen.

Opteron
12.09.2007, 21:06
So weit geht G3MX nicht! Der Memorycontroller bleibt in der CPU, nur der DRAM-Controller wird auf die G3MX Chips ausgelagert ...Ahhh Der Unterscheid zw. Memory und DRAM Kontroller ... alles klar jetzt, hatte mich schon gewundert ;-) Danke fürs Richtigstellen *joy*

Auf den FB-DIMM Modulen werden zwar DDR2/3 Chips verbaut, aber die Module selbst sind nicht Massenmarkttauglich => hoher Preis.
Mittlerweile "geht" der Preis, wobei das wohl Ansichtssache ist (ca. 20-30 Euro teurer) aber beim nem dicken Server sollte das egal sein, schlimmer ist der Punkt mit dem Energieverbraten .. ;-(
Also laut diesem Artikel verbaut Intel, IBM und Sun FB-DIMM - wie kann man da von nicht Massenmarkttauglich sprechen??

Da sind eher die Registered DDR2/3-Module von AMD nicht Massenmarkttauglich, denn die werden nur noch von AMD benutzt. Die alten Sockel 604 Xeon gibt es ja nicht mehr zu kaufen.Prinzipiell richtig, aber jeder jammert über FBD, einziger Vorteil ist bei dem Konzept, dass man halt üppig Pins für den Speicher gegenüber einem DDR Interface spart. Aber G3MX schafft das eben jetzt auch, und hat nicht die von HenryWince genannten Nachteile. Selbst Intel will da wieder weg davon, es kommt demnächst z.B. auch ein neuer Einsiegs-Xeon-Chipsatz für reg. DDR2 raus:
http://www.theinquirer.net/default.aspx?article=42183

@Sun, IBM, Sockel teilen:
Bin z.Zt. wieder kritischer was das anbelangt. Sun T2 hat jetzt 4 FBDIMM Kanäle und die versorgen bis zu 64 threads (8 echte Kerne). In der SMP Version Victoria Falls sinds nur 2 FBD Kanäle, nächstes Jahr kommt Rock mit 16 Kernen und 32 threads, da sollten die 4 Kanäle auch noch reichen, aber 2009 .. wenn AMD dann auch 8 Kerne haben will, da hat Sun dann doch sicherlich auch wieder mehr Kerne @45nm, da brauchen die wieder mehr RAM-Bandbreite ... ausschließen möchte ich einen gemeinsamen Sockel nicht, man könnte ja mit Suns Wünschen designen z.B. 8 Kanäle ... und bei AMD liegen dann 4 davon brach .. aber naja auch irgendwie unpraktisch.

ciao

Alex

Opteron
20.09.2007, 06:58
Damit hier auch mal wieder was steht ;-)

http://www.theinquirer.net/default.aspx?article=42484

Fragt sich nur, ob dass das gleiche "won't" wie bei AMD64 ist. Wohl eher nicht, SSE5 ist nicht soo bedeutend, v.a. auch nur für HPC nötig, aber dennoch ne interessante Meldung.

Wenigstens die FPU Krone sollte AMD also ~2009 sicher sein, und Intel wird / muss dann wohl den Itanium dagegen setzen. Aber irgendwie kommt mir ein einzelner Nehalem Core ziemlich "groß" gegenüber einen 65nm Vertreter vor, und ich mein jetzt nicht den Cache ..

Warten wirs ab :)

Alex

p4z1f1st
20.09.2007, 08:35
Kann mir mal einer den tieferen Sinn dieses Textes erklären?
"Please pull your knob straight out of the wall to turn on water"

Ich meine, übersetzen kann ich mir den Satz schon, nur verstehe ich den das Sinnbild des Spruchs nicht *noahnung*

nazgul99
20.09.2007, 09:18
Kann mir mal einer den tieferen Sinn dieses Textes erklären?
"Please pull your knob straight out of the wall to turn on water"

Ich meine, übersetzen kann ich mir den Satz schon, nur verstehe ich den das Sinnbild des Spruchs nicht *noahnung*
Mike erzählt gern Anekdoten. Wahrscheinlich irgendwas mit nem verfrickelten (und vom sog. "engeneer" (lies: Monktör) wieder heilgefrickelten) Wasserhahn *noahnung*

Ragas
20.09.2007, 12:40
So jetzt reibt die Nachricht genügend DAUs unter die Nase und Intels verkäufe fallen. XD

mtb][sledgehammer
20.09.2007, 17:22
Damit hier auch mal wieder was steht ;-)

http://www.theinquirer.net/default.aspx?article=42484

Fragt sich nur, ob dass das gleiche "won't" wie bei AMD64 ist. Wohl eher nicht, SSE5 ist nicht soo bedeutend, v.a. auch nur für HPC nötig, aber dennoch ne interessante Meldung.
Also Multiply-Add (MA) Operationenbraucht man eigentlich überall. Angefangen bei JPG, über MP3 und Video. In diesen drei Anwendungen gibts eigentlich ausschließlich Fast-Fourier Transformationen (FFT), die am schnellsten mit MA Befehlen durchgeführt werden.
Bei anderen Anwendungen weiß ich leider nicht 100% bescheid. Aber auch dort ist die Kombination aus Multiplikation und Addtition IMO keine Seltenheit. Ergo bringt SSE5 auch dem Privatanwender eine Menge.

Ragas
20.11.2007, 13:37
Trotzdem stellt sich die Frage in wieweit AMD in der Lage sein wird die IPC des K11 gegenüber dem K10 zu verbessern.
Jetzt da man nach ersten Tests eine wesentlich bessere Übersicht hat kann man sagen, dass die bisher bekannten Verbesserungen und auch das Fusion-Konzept des K11 wohl nicht ausreichen werden um den K11 gegenüber eine neuen Intel-Architektur (mit der es der K11 auf jeden Fall zu tun bekommt, nach Intels Zeitplan Ende ´08 ) konkurrenzfähiger zu machen als es der K10 derzeit gegenüber Conroe/Penryn ist.

Da wird AMD definitiv ein bisschen mehr aus dem Stiefel zaubern müssen.

Ich glaube nicht, dass Fusion die einzige Neuerung am K11 sein wird. ;)

Zudem macht der K10 derzeit noch keinen ausgereiften Eindruck, ich kann mir durchaus vorstellen, dass er bis zum nächsten stepping zum Conroe aufschließen kann. Natürlich auf die gefahr hin, dass Intel dann schonwieder einen schritt weiter ist. *noahnung*

goldmund
20.11.2007, 15:16
Trotzdem stellt sich die Frage in wieweit AMD in der Lage sein wird die IPC des K11 gegenüber dem K10 zu verbessern.
Jetzt da man nach ersten Tests eine wesentlich bessere Übersicht hat kann man sagen, dass die bisher bekannten Verbesserungen und auch das Fusion-Konzept des K11 wohl nicht ausreichen werden um den K11 gegenüber eine neuen Intel-Architektur (mit der es der K11 auf jeden Fall zu tun bekommt, nach Intels Zeitplan Ende ´08 ) konkurrenzfähiger zu machen als es der K10 derzeit gegenüber Conroe/Penryn ist.

Da wird AMD definitiv ein bisschen mehr aus dem Stiefel zaubern müssen.
Viel Gesabbel ohne Inhalt.(keinerlei Begründung außer die derzeitge Situation) Trotz Verwendung des Konjunktivs.
Stellt sich die Frage inwieweit Intel die IPC noch verbessert.

rkinet
20.11.2007, 15:31
Trotzdem stellt sich die Frage in wieweit AMD in der Lage sein wird die IPC des K11 gegenüber dem K10 zu verbessern.
Jetzt da man nach ersten Tests eine wesentlich bessere Übersicht hat kann man sagen, dass die bisher bekannten Verbesserungen und auch das Fusion-Konzept des K11 wohl nicht ausreichen werden um den K11 gegenüber eine neuen Intel-Architektur (mit der es der K11 auf jeden Fall zu tun bekommt, nach Intels Zeitplan Ende ´08 ) konkurrenzfähiger zu machen als es der K10 derzeit gegenüber Conroe/Penryn ist.

Da wird AMD definitiv ein bisschen mehr aus dem Stiefel zaubern müssen.
AMD hat nicht vor von 3-fach auf 4-fach superskalar zu wechseln. Nur so wäre bei Integer noch etwas machbar. Bei der SSE sind optimierte Befehle sinnvoll, was aber an Kompatibilitätsproblemen mit Intel scheitern könnte.

Intel hat hingegen die 4-fach superskalar noch nicht ausgereizt bzw. dürfte eher deren Nutzung per SMT (HT) im Blick haben. Auch bei der SSE hat Intel ja Erfahrung mit SMT / HT.

Wenn AMD aber bei Bulldozer das Design entschlackt (ähnlich zu IBM) und dann Takt gewinnt läßt sich ein IPC-Nachteil gut kompensieren. Wobei IBM mit SMT arbeitet und SUN ebenso, da ist AMD ein Exot und hat eher damit Probleme.
Denn ein Quad-Core mit SMT - wie bei Intel geplant - hat gute Performance ohne bei der TDP groß nachzulegen. Ein echter Okta-Core darf bei eine 125 W TDP Socket nur ca. 12-13 W je Core benötigen. Das riecht eher nach 32nm Fertigung, während Intel per SMT und 45nm dies schon heute packt.

Opteron
20.11.2007, 19:10
Viel Gesabbel ohne Inhalt.(keinerlei Begründung außer die derzeitge Situation) Trotz Verwendung des Konjunktivs. Ich hätte es mal nicht so drastisch formuliert .. aber das ursprüngliche Posting bringt echt nix neues ... an diese Stelle:

Bitte haltet diesen Thread sauber ;-)

Wenn jemand was liest, was AMD planen könnte um die IPC zu verbessern, dann sehe ich ein Posting darüber gerne :)
Ansonsten braucht man nicht darüber zu diskutieren, ob AMD die IPC verbessern muss .. das ist glasklar und auch schon angekündigt, siehe Folien vom Analyst-Day: http://www.planet3dnow.de/vbulletin/showthread.php?p=3305288#post3305288

Vielleicht graben sie auch das ursprüngliche K9 Design aus ... 8fach superskalar klingt zwar gigantomanisch, aber das würde nur zu gut zu "Bulldozer" passen^^
Aber das erwähn ich hier auch nicht zum ersten Mal, man möge es mir verzeihen ;-)

Hintergrund, wer sich nicht mehr erinnert:
http://www.theinquirer.net/en/inquirer/news/2005/11/03/amds-k10-is-delayed-or-dead

Zum Verständnis: Mit K8L ist der jetzige Phenom/Barcelona gemeint ... und Merom ist die mobile Version vom Conroe / Core2 ; mit 2nd generation meint er wohl die 45nm Core2 CPUs. Tja Charlie hatte da wohl recht, er ist schon der Fähigste in der Inquirer Truppe...

ciao

Alex

rkinet
21.11.2007, 09:25
Wenn jemand was liest, was AMD planen könnte um die IPC zu verbessern, dann sehe ich ein Posting darüber gerne :)
Ansonsten braucht man nicht darüber zu diskutieren, ob AMD die IPC verbessern muss .. das ist glasklar und auch schon angekündigt, siehe Folien vom Analyst-Day: http://www.planet3dnow.de/vbulletin/showthread.php?p=3305288#post3305288
8 -16 Cores ... da wird AMD bei der TDP bzw. dem max. Takt sich sehr einschränken müssen.

Da ist Intel per 4* phys. Core zzgl. SMT = 8-fach Core in 45nm viel realistischer und die TDP wird passen auch bei Taktraten über 3 GHz.

AMD wirkt bei 8-16 Cores in 45nm unglaubwürdig. Auch geht Mitentwickler für SOI-45nm IBM in Richtung höheren Takt und nur im Nebeneffekt auf bessere Leistung/ Watt.

Aber warten wir mal den verschobenen Analystentag im Jan/Feb 2008 ab.
Angesichts der finnaziellen Lage bei AMD und der Konkurrenz Intel sind vielleicht diesmal realistische Zahlen und Produkte statt Werbe-pdf nötig.

larsbo
21.11.2007, 12:08
Vielleicht graben sie auch das ursprüngliche K9 Design aus ... 8fach superskalar klingt zwar gigantomanisch, aber das würde nur zu gut zu "Bulldozer" passen^^
Aber das erwähn ich hier auch nicht zum ersten Mal, man möge es mir verzeihen ;-)

Hintergrund, wer sich nicht mehr erinnert:
http://www.theinquirer.net/en/inquirer/news/2005/11/03/amds-k10-is-delayed-or-dead

Zum Verständnis: Mit K8L ist der jetzige Phenom/Barcelona gemeint ... und Merom ist die mobile Version vom Conroe / Core2 ; mit 2nd generation meint er wohl die 45nm Core2 CPUs. Tja Charlie hatte da wohl recht, er ist schon der Fähigste in der Inquirer Truppe...

Gabs eigentlich vor dieser Zeit (vor Herbst 2005) solche schönen Analyst-Day Folien von AMD, die codenamen erwähnten und etwas verrieten? Also so wie jetzt die Juli-2007 Folien mit dem Codenamen Bulldozer etc.........Dass man zwischenzeitlich mal an ganz neuen Cores gearbeitet hat, erscheint ja wahrscheinlich, dass es zumindest zunächst nicht erfolgreich war, sieht man am fast unveränderten Kern von Barcelona/Phenom, aber gab es je halb-offizielle Ankündigungen von AMD bzgl. dieser untergegangenen Projekte?

Auf jeden Fall darf man auf das "grounds-up core development" sehr gespannt sein. Das heißt ja nicht weniger, als ein von Grund auf neu entwickelter Kern. Wenn der wirklich so dermaßen von Grund auf neu ist, dann dürfte das völlige Spekulation sein, wie er aussieht. Spannend ist in jedem Falle, dass AMD die single-thread-Performance so dermaßen betont. Hoffen wir mal, dass wir 2009 einen würdigen K7-Nachfolger sehen, der ja immer noch mit allen seinen Anbauten in jedem AMD-Prozessor hockt......

Und sorry, falls das jetzt schon thread-spamming war, aber das musste ich los werden.

Opteron
21.11.2007, 13:43
Gabs eigentlich vor dieser Zeit (vor Herbst 2005) solche schönen Analyst-Day Folien von AMD, die codenamen erwähnten und etwas verrieten?
(...)
Und sorry, falls das jetzt schon thread-spamming war, aber das musste ich los werden. Na ernstgemeinte Fragen sind natürlich auch i.O., Spam ist eher der letze Beitrag von rkinet, der bringt auch nix neues, und er vergleicht AMD zum xten Mal mit IBM, obwohl das schon öfters gesagt wurde, dass man von den IBM Taktraten (4,7 GHz) überhaupt nicht auf AMD schließen kann, da IBM wieder auf ein in-order Design umgestellt hat.

Naja also zur Frage ... leider gabs da nichts Dahingehendes, das Einzige waren inoff. Gerüchte beim Inquirer.
"Lustig" bzw. eher schlecht ist z.B. die Nachricht über den Entwicklers des "ersten" K10:

http://www.theinquirer.net/en/inquirer/news/2004/06/13/k10-architect-leaves-amd

Da gibts nen link auf seinem Lebenslauf .. und was steht in Selbigem unter "aktuell":
Current: “Architecture Futures” team member, Nehalem Architecture Team. Intel/DEG/DAP/MAP/NAT/AF. Wenn AMD dann das alte K10 Design ausgräbt und der Nehalem ähnlich ausschaut wirds lustig ^^

ciao

Alex

rkinet
21.11.2007, 14:23
Na ernstgemeinte Fragen sind natürlich auch i.O., Spam ist eher der letze Beitrag von rkinet, der bringt auch nix neues, und er vergleicht AMD zum xten Mal mit IBM, obwohl das schon öfters gesagt wurde, dass man von den IBM Taktraten (4,7 GHz) überhaupt nicht auf AMD schließen kann, da IBM wieder auf ein in-order Design umgestellt hat.
Intel hat eine Wunder Out-of-order Technologie beim Penryn, die trotzdem über 4 GHz hinaus funktioniert ?
Der Design-wechsel soll +100% beim Takt erbringen ?
Und die Schaltzeiten einzelner Transitoren hängen vom übergeordneten Design hab - Nr.5 lebt !
Und ein K10 in 65nm muss langsamer als ein K8 in 90 nm aus der alten Fab30 sein, weil neue Designs aus neuen Fabs einfach langsamer sein müssen ?

Ein reiner Shrink bringt allein durch physikalische Vorteile gut +20%, etwas Feintuning am Transistor kann noch mehr heraus holen.
Die SOI-65nm des K10 müßte bei ca. +35% bis +45% vs. K8 liegen (wg. verbesserter Implemantierung von Ge), was IBM auch so ähnlich umsetzen kann.

Nur bei AMD sackt der Takt deutlich, bei Intel nicht. Wobei Intel das C2D - Designs weitgehend geschrumpft hat und per 45nm einige alte Leckstromprobleme kitten konnte.
Dazu kommen die Penryn aus der begrenzten D1D-Fertigung, die zwar sehr hochwertige Anlagen besitzt, dafür aber nicht Stückzahlen zum Selektieren nach Takt bietet.

Es ist alarmierend, da hier ein verpfuschtes Chipdesign beteiligt ist.
Und AMD hat dies sogar noch nicht einmal rechtzeitig erkannt, erkennen wollen bzw. per Parolen übertüncht. Diese Sackgasse gab es früher bei AMD nicht, aber AMD ist ja nur noch ein Gerippe an Fachkompetenz.
Was bei der hohen Latenzeit des 65nm K8 / Stepping G1 noch wie ein Sonderfall aussieht entwicklelt sich zum AMD-Normalfall - AMD packt selbst Standard-Aufgaben nicht mehr.
Dazu noch keine Stückzahlen am Markt, keine für die Medien zum testen - nicht einmal ES Vorserienmodell.


"Lustig" bzw. eher schlecht ist z.B. die Nachricht über den Entwicklers des "ersten" K10:

http://www.theinquirer.net/en/inquirer/news/2004/06/13/k10-architect-leaves-amd


Die Beschreibung jenes K10 aus 2004 passt nicht zum realen K10 des Jahres 2007.

Das klingt eher nach Post-Bulldozer - also ist der Barcelona doch eher ein K8L ?

Aber 'multithreading' ist genau das, was Intel sich bei seinen Design betrachtet.

Bobo_Oberon
21.11.2007, 15:28
... Naja also zur Frage ... leider gabs da nichts Dahingehendes, das Einzige waren inoff. Gerüchte beim Inquirer.
"Lustig" bzw. eher schlecht ist z.B. die Nachricht über den Entwicklers des "ersten" K10:

http://www.theinquirer.net/en/inquirer/news/2004/06/13/k10-architect-leaves-amd

Da gibts nen link auf seinem Lebenslauf .. und was steht in Selbigem unter "aktuell":
Wenn AMD dann das alte K10 Design ausgräbt und der Nehalem ähnlich ausschaut wirds lustig ^^ Na ja, so wie es aussieht, gehts bei Intel in die Richtung, die eigentlich vor Jahren schon mit DECs EV-8 beschrieben wurde ...

Dank deinem Link zur japanischen PC-Welt (http://translate.google.com/translate?u=http%3A%2F%2Fpc.watch.impress.co.jp%2Fdocs%2F2007%2F1023%2Fkaigai396.htm&langpair=ja%7Cen&hl=en&ie=UTF-8), scheint die Nehalem-Plattform in etwa das zu werden, was AMD einstmals in etwa mit "Windund" ausdrücken wollte. Eine schlanke x86-Prozessorarchitektur mit einer sehr schnellen Anbindung an die Peripherie und Speicher (über "Schlank" kann man sich bei dem Nehalem sicherlich streiten).

Intel modifiziert offenbar seine FB-DIMM-Roadmap dahingehend. Bei kleineren Systemen wird FB-DIMM nicht benötigt (-> DDR3 RAM) und auch bei den mittelgrossen Systemen kommt da eine modifizierte Speicheranbindung heraus, die an AMDs 3GMX-Extender erinnern.
Siehe auch: "Intel-Roadmap 2004 bis 2009 mit FB-DIMM2 und DDR3-Extender (http://www.orthy.de/index.php?option=com_content&task=view&id=5132&Itemid=86)".

Der Punkt ist, dass Intel offenbar nun Wert auf schnelle Systemanbindung Wert legt und dazu parallel SMT-Technologie nie ganz verbannen wollte (einstmals auch als "HyperThreading" vermarktet). Laut deinem Inquirer-Link wollte der frühe K10-Entwickler auch SMT integrieren.

Ich frage mich eigentlich immer noch, warum der Alpha EV-8 nie in einer anderen Form konsequent von Intel übernommen wurde ... nun ja, jetzt beschreitet Intel den Weg.

MFG Bobo(2007)

rkinet
21.11.2007, 16:06
http://www.realworldtech.com/includes/images/articles/EV8-Part2-Fig4.gif

Na ja, so wie es aussieht, gehts bei Intel in die Richtung, die eigentlich vor Jahren schon mit DECs EV-8 beschrieben wurde ...

..

Ich frage mich eigentlich immer noch, warum der Alpha EV-8 nie in einer anderen Form konsequent von Intel übernommen wurde ... nun ja, jetzt beschreitet Intel den Weg.
so wie hier: http://www.realworldtech.com/page.cfm?ArticleID=RWT122600000000&p=3
aus: http://www.orthy.de/index.php?option=com_glossary&Itemid=55&func=view&id=100

Wahrscheinlich ist eben auf den ersten Blick verlockender einfach echte Cores mehrfach auf Silicium zu bannen.
Aber die Tücken liegen dann im Detail, wie TDP der ganzen Konstruktion bei vielen physikalischen Cores oder hohe Ansprüche an die CrossBar.
Dafür eher die Chance gewohnte Taktregionen zu erreichen.

Intel macht wohl eine 'Bonsai-Umsetzung' indem einfach 4-fach superskalar und 2-fach SMT beim Nehalem zusammengeführt wird.
Wobei sich die Frage stellt, ob ein (alternativer) 4-fach Core mit je 4-fach SMT überhaupt genügend schnell noch mit Daten zu versorgbar wäre bei Taktraten deutlich jenseits von 3 GHz.

Dazu noch exklusive L2 und ein shared L3, der im Vergleich zum Barcelona auffällig nahe den L2 angebracht wird. Ggf. ist sogar die Latenzzeit variabel, je nachdem wie lange der Transferweg ist. Beim Barcelona ist der L3 recht wild an den Rand des DIEs plaziert worden, was auch nicht sehr taktfreudig wirkt.


Einen Dual-ported Instruction Cache hat sich AMD einmal patentieren lassen und die 'breite' SSE des K10 ähnelt obigen Design. Dafür fehlt aber im K10 die SMT-Fähigkeit.
Es sieht bei AMD also nach viel Stutzarbeit aus.

genervt
21.11.2007, 17:12
Conroe
http://www.computerbase.de/bild/article/592/7/
Barcelona
http://www.pcgameshardware.de/?menu=browser&mode=article&article_id=571820&entity_id=-1&image_id=595061&page=1
"...wild an den Rand des DIEs plaziert worden, was auch nicht sehr taktfreudig wirkt."
Wieso macht es Intel dann ganz genauso? :P

rkinet
21.11.2007, 19:03
Conroe
http://www.computerbase.de/bild/article/592/7/
Barcelona
http://www.pcgameshardware.de/?menu=browser&mode=article&article_id=571820&entity_id=-1&image_id=595061&page=1
"...wild an den Rand des DIEs plaziert worden, was auch nicht sehr taktfreudig wirkt."
Wieso macht es Intel dann ganz genauso? :P
Der Conroe ist um einiges kleiner als der Barcelona.

http://scr3.golem.de/?d=0711/AMD-Spider2&a=56051&s=19
Zudem ist der L3 recht aufwendig in das Design integriert und muss alle 4 Cores zzgl. Crossbar Switch bedienen können. Da können theoretisch 5 Units gleichzeitig Daten vom oder nach den L3 auslagern. Wobei die Steuerung = TLB kompakt irgendwo nahe der 4 L2 sitzen könnte. Zumindest beim Power6 funktioniert dies einwandfrei - http://www.realworldtech.com/page.cfm?ArticleID=RWT101606194731 , aber eben nur für 2 statt 4 Cores.

larsbo
22.11.2007, 15:51
Naja also zur Frage ... leider gabs da nichts Dahingehendes, das Einzige waren inoff. Gerüchte beim Inquirer.

OK, wollte ich nur wissen. D.h. eine Spekulation darüber, dass bulldozer aussehen wird, wie zwischenzeitlich schon mal geplante Projekte bringt einem eigentlich auch nichts, weil es auch zu diesen Projekten keine ernstzunehmenden Infos gibt. Bleibt also das "grounds-up core development" mal einfach so stehen.

"Lustig" bzw. eher schlecht ist z.B. die Nachricht über den Entwicklers des "ersten" K10:

http://www.theinquirer.net/en/inquirer/news/2004/06/13/k10-architect-leaves-amd

Da gibts nen link auf seinem Lebenslauf .. und was steht in Selbigem unter "aktuell":
Wenn AMD dann das alte K10 Design ausgräbt und der Nehalem ähnlich ausschaut wirds lustig ^^

ciao

Alex

Na ja, so viele CPU-Design-Gurus gibts ja nicht. Da sind viele von zwischen den Firmen hin- und hergewechselt. Außerdem wachsen neue Prozessordesign-Ideen auch nicht auf den Bäumen. Eigentlich kann man gelassen abwarten, die Alternativen sind fürs Design nicht so groß IMHO. Man kann mehr Funktionseinheiten parallel in einem Kern betreiben, also die Skalarität erhöhen, oder mehrere Kerne parallel als SMP betreiben, oder eine beliebige Kombination aus beidem. Das Intelsche SMT ist ja eine Mischung aus beidem, weil man der Software dabei ein bisschen die Verantwortung für parallelisierbare Threads aufhalsen will, die dann superskalar abgearbeitet werden sollen. Welches Konzept unter welchen Bedingungen besser aufgeht, muss man halt ausknobeln. Das dritte Konzept, lange Pipeline mit hohem Takt, ist ja letztlich beim P4 nicht aufgegangen, wobei auch das unter anderen Bedingungen durchaus wieder anders aussehen kann.

Intelektuelle Wunder und revolutionär neue Konzepte erwarte ich jedenfalls nicht in nächster Zeit bei der CPU Entwicklung. Es wird wohl alles darauf hinauslaufen, wie breit man sein Design machen will und wie effektiv das dann noch ist bei x86-code.


Aber wer weiß, vielleicht werden wir doch alle noch überrascht. Immerhin war Glew ja auf dem MPF2003 Vertreter des Meinung: "new microarchitectures can improve single thread performance". Wenn Intel in der Beziehung was ganz großes raushaut mit dem Nehalem, kann man nur hoffen, dass AMD sich damals noch ein bisschen was vom know-how ihres Mitarbeiters abgeschaut hat......Aber AMD sagt ja zumindest schon mal, dass sie mit Bulldozer auch hohe single thread performance im Auge hätten. Hatte man dem jetztigen K10 auch mal nachgesagt. Schaun mer mal


Ansonsten bin ich für den komplett hart-verdrahteten x86-Kern mit nicht mehr als 2 Takten Latenz für alle Instruktionen......*buck*

Opteron
22.11.2007, 15:54
Wenn Intel in der Beziehung was ganz großes raushaut mit dem Nehalem, kann man nur hoffen, dass AMD sich damals noch ein bisschen was vom know-how ihres Mitarbeiters abgeschaut hat...... "Groß" ist der richtige Ausdruck, hab auf einer Seite einen DIE-Größen Vergleich gesehen, danach ist ein Nehalem Kern (ohne L2/L3 Caches, Interconnects, IMC) Pi*Daumen 1,5 mal so groß wie Penryn .. also da wird einiges an Logik nachgelegt ...

ciao

Alex

rkinet
30.04.2008, 13:20
http://www.custompc.co.uk/news/602511/amd-next-cpu-architecture-will-be-completely-different.html%20

aus: http://www.theinquirer.net/gb/inquirer/news/2008/04/30/amd-cpu-radical-departure


if I (AMD’s ... Giuseppe Amato) look at the next generation architecture of our CPU, then it will definitely not be, how can I say, comparable with the Phenom. It will look completely different.’

Bulldozer doch mit erhöhter IPC für Single-Thread ?

Aber 'komplett neu' klingt nicht gut.
Intel packt per 4-fach superskalar und sehr schnellen Caches (L1, ab Nehalem auch L2) einen deutlichen IPC-Abstand zu AMD.

Weitgehend unbearbeitet ist die Effektivität der SSE bei eher Single-Thread Belastungen.
Hier wäre 3-fach oder 4-fach paralell nicht schlecht, was aber eher HT-Design bzw. eine shared SSE5 mit 4 -Units und SMT sinvoll machen würde.
Oder gleich die SSE shared für 4-8 Cores und dann massiv parallel (ähnlich den GPUs) anordnen.

Insgesamt läßt obiger Beitrag befürchten, dass sich AMD beim Bulldozer wieder in langatmiges Entwicklungsszenarium stürzt, während Intel Kompromiss-Designs zu sehr guten Erlösen auf den Markt bringt.

Ich bleibe dabei - AMD fehlt SMT und 4-fach superskalar bei den Integer-Units.
Wenn AMD sich an SMT gewöhnen könnte, dann wäre auch eine 4-fach SSE5 mit SMT und brachialer Rechenpower bei Single-Thread machbar.
Selbst bei Multit-Thread müßte eine SMT 4-fach SSE etwas mehr bringen (+25% durch Verwendung zeitweise nicht benötigter Resorcen ? ), als zwei einzelne 2-fache Fließkommaeinheiten ?* 128 Bit.

Wahrscheinlich wird AMD aber stur seinen Kurs weiter verfolgen, während Intel sich per SMT schon einen bequemen Performancevorsprung (Nehalem ca. 25% bis 35% ) geschaffen hat.

nazgul99
30.04.2008, 14:36
Mit Sturheit hat das vermutlich weniger zu tun: AMD hat einfach deutlich kleinere Entwicklungs- Ressourcen und Budgets als Intel. Der große Vorsprung mit K8 entstand ganz einfach, weil Intel massiv gepennt hatte (hier kann man mit Fug und Recht auch von Sturheit reden), der Riese ist jedoch aufgewacht. Schau dir doch mal VIA an - sind die auch stur? Ich würde sagen, sie machen einfach mit ihren Ressourcen das, was damit hinzubekommen ist und versuchen einen Nischenmarkt zu besetzen. Das funktioniert immer so lange, bis der Riese diesen auch entdeckt - siehe Transmeta.

Noch etwas: AMD hat es dringend nötig, seine Architektur gründlich zu erneuern, K8 und K10 gehen auf den K7 zurück, also 1999 wenn ich mich recht erinnere. Von 3- auf 4fache Skalarität umzustellen IST übrigens eine radikale Änderung, ebenso die Implementierung von Multi-Threading - wenn dies im ursprünglichen Design nicht vorgesehen war, wie etwa beim P4.

Peilo
30.04.2008, 15:43
naja, dringend ist es nicht.

Core2 geht auf Banias zurück und der widerum auf PIII. Und der ist von '98 oder so.

Es kommt immer nur darauf an was, wo und wie verbessert wird/aufgebohrt wird

hot
30.04.2008, 16:07
Na ja, die 4-Fache-Superskalarität schlägt jetzt so grosse Wellen auch nicht. Ich glaube da werden grosse Wellen geschlagen, wo keine sind. Lt. SPEC schlägt der 3-Fach-Superskalare K10 den 4-Fach-Superskalaren Core2 ja mehr als deutlich. BD wird eher dünner als breiter werden, wie ich das mitbekommen habe. Ich denke, man wird nicht auf 4-Fach umswitchen, weil es nach AMD-Masstäben zu wenig bringt.
Der Core2 lebt von seinem Cache und seinem sehr guten (Pre-)fetcher, ohne diese ausgeklügelten Techniken, die mit dem PentiumM entstanden, wäre der Core2 nichts. Der Core2 ist weitestgehend immun gegen hohe Speicherlatenzen, das ist seine grosse Stärke. Von der puren Rechenleistung her ist der K10 eher besser als der Core2 und damit auch besser als der Nehalem.

larsbo
30.04.2008, 16:18
http://www.custompc.co.uk/news/602511/amd-next-cpu-architecture-will-be-completely-different.html%20

aus: http://www.theinquirer.net/gb/inquirer/news/2008/04/30/amd-cpu-radical-departure




Bulldozer doch mit erhöhter IPC für Single-Thread ?

Das ist doch überhaupt garnichts neues......Genau das hat AMD doch schon auf den technology analyst days erzählt letztes Jahr, so wie der Inq es ja auch schreibt und verlinkt.....
Natürlich kommt eine erhöhte IPC auch für single-thread. Wenn man sich die single-thread Leistung der Intel-Konkurrenz anschaut, dann ist das auch bitter nötig (oder ein entsprechendes Hochtakt-Design, an das sich aber scheinbar seit P4 niemand mehr herantraut....). Nur ein bisschen am alten K7-Kern rumschrauben wird AMD nicht mehr viel helfen, sie müssen was neues raushauen.
Einziges echtes Problem bei Bulldozer ist nur, dass er zu spät kommt......
.
EDIT :
.
Na ja, die 4-Fache-Superskalarität schlägt jetzt so grosse Wellen auch nicht. Ich glaube da werden grosse Wellen geschlagen, wo keine sind. Lt. SPEC schlägt der 3-Fach-Superskalare K10 den 4-Fach-Superskalaren Core2 ja mehr als deutlich. BD wird eher dünner als breiter werden, wie ich das mitbekommen habe. Ich denke, man wird nicht auf 4-Fach umswitchen, weil es nach AMD-Masstäben zu wenig bringt.
Der Core2 lebt von seinem Cache und seinem sehr guten (Pre-)fetcher, ohne diese ausgeklügelten Techniken, die mit dem PentiumM entstanden, wäre der Core2 nichts. Der Core2 ist weitestgehend immun gegen hohe Speicherlatenzen, das ist seine grosse Stärke. Von der puren Rechenleistung her ist der K10 eher besser als der Core2 und damit auch besser als der Nehalem.

Nur Spec_rate, oder? Und da haut die bessere Anbindung durch. Im single-thread Spec sieht der K7ultra=K10 kein Land.....

Damit allen nochmal klar ist: Schaut Euch die Diagramme eines K7 und eines K8/10 mal an, der Kern ist praktisch unverändert, nur halt 64bit. Integerberechnungen und x87-Berechnungen, die in den L1 passen, laufen auf K7 praktisch genauso schnell pro Takt ab, wie auf einem K10!
Dagegen ist von PIII zu Core2 doch einiges dazugekommen......

hot
30.04.2008, 16:21
An x87 hat sich nichts geändert seit dem K7, das bestreitet auch keiner. Aber ich bezweifle ernsthaft, dass der BD bei x87 Code schneller sein wird - und so tragisch ist das auch nicht. Auch bei Intel wirds hier eher Rückschritte als Leistungssteigerungen von x87-Code pro Kern geben. Die Prioritäten liegen einfach woanders.

larsbo
30.04.2008, 16:24
An x87 hat sich nichts geändert seit dem K7, das bestreitet auch keiner. Und Integer etwa? Wo? Einzig SSE ist im K10 konkurrenzfähig bei gleichem Takt, den AMD aber noch nicht erreicht........ Aber ich bezweifle ernsthaft, dass der BD bei x87 Code schneller sein wird. Auch bei Intel wirds hier eher Rückschritte geben. Sollte auch nur ein Beispiel sein. Natürlich wird er da nicht schneller sein, wozu auch, wird kaum noch gebraucht.....

cumec
30.04.2008, 16:36
Den x87er-teil sehe ich selber auch nicht mehr als sooo wichtig an. Schließlich hat MS die unterstützung für x87er unter Vista64 offiziell gekappt und nutzt stattdessen SSE, was auch Sinn macht. Man kann also davon ausgehen das x87er Code in Zukunft immer weniger implementiert wird...

gruß

cumec

rkinet
30.04.2008, 16:47
Und Integer etwa? Wo? Einzig SSE ist im K10 konkurrenzfähig bei gleichem Takt, den AMD aber noch nicht erreicht.....
Das dürfte auch als Damokles-Schwert über dem Bulldozer hängen.

Wenn er nicht taktet, dann ist er sein Entwicklungsgeld nicht wert.

4-fach superskalar kannte schon die Alpha-CPU.
Für x86-64 dürfte aber 4-fach superskalar nur wichtig für SMT sein, da so genügend freie Resourcen für zwei virtuelle CPUs vorhanden sind.

Insgesamt sollte AMD mehr auf Takt und SMT gehen, was dann gedrosselt im Mobilbereich noch mindestens mittlere Performance ergibt.
Es ist wirklich genau zu überlegen, ob man mit CPUs jenseits von 2*2 (SMT / X2) = 4 virtuellen Cores als kleiner Hersteller wie AMD je Stückzahlen im Mobilbereich erreichen kann.
Gepaart mit großzügig eDRAM wäre da schon Marktpräsenz denkbar.

Man könnte sogar das Basisdesign des Alpha EV8 mit 4-fach SMT (siehe unten) als recht ideales Design für Mobilanwendungen betrachten.
Bei Single-Thread oder unsymmetrischer Multi-Thred Belastung würde das Ding abgehen wie ein Rakete.
Bei 2 Thread leicht gedrosselt vs. echtem Dual-Core sein und bei 3-4 Threads gemütlich aber mit Volllast aller Units arbeiten.

AMD kann sich wg. nachlassender Nachfrage für HighEnd Opterone jetzt eher wieder auf Mainstream konzentrieren.
Und beim Opteron auf virtuelle Software-/IT-Designs, die aber auch SMT gut auslasten.

Vielleicht ist Bulldozer ein Design in Anlehnung an den 'Alpha EV8'.
Allerdings hat AMD dazu noch nichts verkündet.

Opteron
30.04.2008, 18:16
Für x86-64 dürfte aber 4-fach superskalar nur wichtig für SMT sein, da so genügend freie Resourcen für zwei virtuelle CPUs vorhanden sind.
Du vermixt da 2 Sachen ... Superskalar hat direkt nichts mit SMT zu tun. Die "freien Resourcen", die Du ansprichst, ist das Backend, also die execution units, AMD hat da 6 (3 Int, 3 FP). Gefüttert werden die durch ein 3 µOps pro Takt, prinzipiell und sehr vereinfacht gesehen wäre also noch Luft für 3 mehr µOps. Egal ob das front-end jetzt 3fach oder 4fach ist.

Wenn man jetzt die Superskalarität erhöht, also das Front-End aufbohrt, dann muss man auch beim back-end nachlegen, um im best case alles in einem Rutsch abarbeiten zu können. Blöderweise bringt eine höhere Superskalarität mit steigender Komplexität aber immer weniger, deswegen ist SMT dann quasi ein "Muss", ansonsten ideln die ~12 execution units (beim EV8 ) nur vor sich hin:
If the IPC of our hypothetical EV8 on a specific program is 2.5, that means on average, 5.5 opportunities to execute an Alpha instruction are lost every clock cycle. That is equivalent to at least 10 billion potential instructions lost every second. What simultaneous multithreading (SMT) provides is a relatively straightforward and inexpensive means to recover a portion of these lost instructions and helps close the huge gap between potential and actual instruction throughput. SMT achieves this by giving the EV8 the ability to fetch instructions from one, two or three extra threads (points of execution within a program) and issue them in otherwise wasted instruction slots left by single thread program execution. Research suggests that four way SMT can increase the IPC of an eight issue wide processor like the EV8 from about 2.5 to the range of 4 to 5.5, or roughly double the single threaded throughput [2].
http://www.realworldtech.com/page.cfm?ArticleID=RWT011601000000

Also bitte front-end / back-end unterscheiden :)

Ich träume schon länger davon (spätestens seit P4 / Itanium Zeiten), dass irgendeine CPU Firma sich endlich des alten EV8 Design erbarmt, und die Ansätze dort irgendwie / teilweise implementiert, aber ich denke dass das ein Traum bleibt, auch wenn sich Bulldozer ziemlich "brutal" anhört :)

ciao

Alex

P.S: Danke fürs thread hochholen ^^

wadenbeisser
01.05.2008, 06:35
Ich bleibe dabei - AMD fehlt SMT und 4-fach superskalar bei den Integer-Units.
Wenn AMD sich an SMT gewöhnen könnte, dann wäre auch eine 4-fach SSE5 mit SMT und brachialer Rechenpower bei Single-Thread machbar.
Selbst bei Multit-Thread müßte eine SMT 4-fach SSE etwas mehr bringen (+25% durch Verwendung zeitweise nicht benötigter Resorcen ? ), als zwei einzelne 2-fache Fließkommaeinheiten ?* 128 Bit.
Auf welches Marktsegment beziehst du dich?
SMT für den Desktop/Mobile Markt bringt dir in punkto Rechenwerkauslastung erst dann was, wenn die Anwendungen entsprechend mit mehreren Kernen umgehen können. Dieses ist allerdings bei multicore Prozessoren und einer Softwareumgebung die nur mit 2-4 Kernen umgehen kann mehr oder weniger witzlos. Auch das Multitasking entfällt dabei größtenteils als Argument, denn was bringen ach so viele virtuelle Kerne, wenn diese durch dei Software nicht genutzt werden können?
Im Server/Workstation Markt ist der bisherige K10 wiederum sehr gut aufgestellt und schlägt mit weniger Taktfrequenz die 4-fach superskalaren Modelle der Konkurrenz.
Interessant finde ich allerdings die shaderähnliche Vernetzung der SSE Einheiten, allerdings dürfte dafür wiederum einen neuen Befehlssatz nach sich ziehen und ob diese Konstruktion dann abwärtskompatibel ist...?

rkinet
01.05.2008, 14:08
Auf welches Marktsegment beziehst du dich?
SMT für den Desktop/Mobile Markt bringt dir in punkto Rechenwerkauslastung erst dann was, wenn die Anwendungen entsprechend mit mehreren Kernen umgehen können. Dieses ist allerdings bei multicore Prozessoren und einer Softwareumgebung die nur mit 2-4 Kernen umgehen kann mehr oder weniger witzlos. Auch das Multitasking entfällt dabei größtenteils als Argument, denn was bringen ach so viele virtuelle Kerne, wenn diese durch dei Software nicht genutzt werden können?
http://www.theinquirer.net/gb/inquirer/news/2008/04/30/push-software-fit-parallel

Es werden Anstrengungen von AMD, Intel und anderen eingeleitet um beim Computer die Anwendungen deutlich stärker zu parallelisieren.
Die extrene Anwendung 'Suchmaschinen' zeigt ja schon heute, wie hocheffektiv damit gearbeitet werden kann. Beim Client dürfte aber eher Zukunftsanwendungen wie Text-/Bildauswertung davon profitieren.

Für überschaubere Zeiträume und Fertigungstechnologien (45-40-32-22nm) sind aber relativ wenige Core im Mobilbereich und Mainstream-Desktop sinnvoll auslastbar.

Das Design Alpha EV8 - http://emer.org/Family/Joel/Professional/papers/1999-upforum-smt.ppt nutzt viele Units shared und hat daher natürlich Schwächen bei voller Beastung. Dafür können Dual-Thread Situationen zügig bearbeitet wrden und Single-Thread hätte leichte Vorteile bei Integer (ähnlich Intel 4-fach superskalare Pipeline) und deutlichere bei SSE-Anwendungen.

Die Zielgruppe wäre hier Mobilmarkt und Mainstream-Desktop, in der späten Phase noch embedded Designs.

Im Serverbereich wären virtuelle Maschinen mit Bedarf an typ 1-4 virtuellen CPUs ohne Vollast gute Kandidaten.
Die eigentliche CPU könnte dann mehrere solcher 4-fach SMT Designs enthalten.
Schlechter wäre das Design, wenn gleichmäßig viel Rechenleistung und viele CPUs je virtueller Maschine benötigt werden. Hier könnte man aber im Zuge der Shrinks die SMT-Nutzung je physikalischen Core auf 2 bzw. sogar 1 Core zurückfahren und ggf. sogar gezielt Teildeaktivierungen durchführen.

Der aktuelle Ansatz bei AMD ist bezgl. HighEnd sinnvoller, dafür verliert er Effektivität und vor bekommt TDP-Nachteile im mainstream und Mobilbereich.
Der von Intel vorgebrachte Nehalem-Bausastz mit minimal 2 Cores zzgl 2-fach SMT ist im Vergleich zum EV8 Design energetisch ungünstiger, aber trotzdem deutlich günstiger als ein reiner K10 Dual-Core oder Triple-Core. Auch bzgl. Bulldozer sind noch keine Nachteile erkennbar.

Alles hängt natürlich von den Kundenwünschen ab.
Sind 2011 Notebooks unter 4 physikalischen Cores unverkäuflich, dann ist obiges Design Käse.
Streiken die Käufer ab 25 Watt max (CPU incl. GPU) und unter 4h typ. Akkulaufzeit dann verkauft sich ein 4-fach SMT Design ähnlich EV8 'wie heiße Semmel' (*)
Selbst Intel käme ins schwitzen trotz 32nm und Nehalem.

zu (*) - http://www.heise.de/newsticker/Atom-CPU-Nachfrage-ueberrollt-Intel--/meldung/107277
Der Intel 'Atom' läuft extrem gut und überfordert bis Q3'08 die Kapazität bei Intel.
Allerdings sind erst H2'2008 die beiden anderen 45nm Fabs voll in Betrieb.

wadenbeisser
01.05.2008, 15:11
Ist jetzt vielleicht ein wenig zu sehr offtopic von mir aber wäre es nicht möglich OS seitig eine virtuelle Umgebung zu schaffen, welche die Programme von den Rechenwerken abkoppelt und die Arbeit auf die einzelnen Kerne verteilt? So dass also den Programme die gesammte Rechenleistung zur Verfügung steht ohne Rücksicht auf die Anzahl an Kernen Rücksicht nehmen zu müssen.

Opteron
01.05.2008, 15:32
zu (*) - http://www.heise.de/newsticker/Atom-CPU-Nachfrage-ueberrollt-Intel--/meldung/107277
Der Intel 'Atom' läuft extrem gut und überfordert bis Q3'08 die Kapazität bei Intel.
Allerdings sind erst H2'2008 die beiden anderen 45nm Fabs voll in Betrieb.
Jo schon krass, v.a. wenn man bedenkt, dass Intel da 2500 CPUs pro 300mm wafer (http://blogs.zdnet.com/Ou/?p=1037)bekommt. Könnte mir wirklich gut vorstellen, dass die ULV Ausbeute etwas schlecht ist, aber egal.

Ansonsten noch zum Alpha EV8: Das schöne daran war ja, dass 2fach SMT bei den vielen Exec Units soviel brachte wie ein echter 2ter Kern. Das ist schon optimal. Im Extremfall hat man super single thread Performance durch die 8fache SSkalarität, und wenn das nichts brachte, dann könnte man die Units mit SMT auslasten ... da sieht man mal, dass da jemand gedacht hatte ^^ SMT bei P4 und jetzt auch bei Nehalem bringt zwar auch was, aber niemals soviel. Das hätte quasi den ähnlichen Effekt wie das "reversed Hyperthreading", das immer mal durch die Schlagzeilen geistert.


@wadenbeisser:
Was meist Du mit Rechenwerk und Kerne ? Execution units ? Die sind integraler Bestandteil eines "Kerns" ... also von daher weiß ich jetzt nicht, was Du wo hinverteilen willst.

ciao

Alex

wadenbeisser
01.05.2008, 15:46
Mit Rechenwerk meinte ich die Kerne (den Prozessor)....egal ob Virtuell (SMT) oder nicht.
Somit wären unausgelastete Rechenwerke bei einem Programm welches Rechenleistung fordert theoretisch fast unmöglich.....das ist ja auch das Hauptproblem heutiger Multicore Prozessoren.
Das Programm muss speziell darauf ausgelegt sein aber mit meiner Spinnerei würde das OS die lastverteilung übernehmen und die programme bekommen von der Anzahl der kerne des Prozessors nix mit. Auch wäre eine feste Aufteilung der gesammten Rechenleistung für verschiedene Programme denkbar.....ganz optimistisch gesehen könnte man dann sogar noch eine oder mehrere GPUs mit einbinden.

rkinet
01.05.2008, 15:57
Jo schon krass, v.a. wenn man bedenkt, dass Intel da 2500 CPUs pro 300mm wafer (http://blogs.zdnet.com/Ou/?p=1037)bekommt. Könnte mir wirklich gut vorstellen, dass die ULV Ausbeute etwas schlecht ist, aber egal.
http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=3272&p=4

Intel hat erst ab Q3'2008 genügend Fertigungskapazität für 45nm. In Q2'2008 sind nur 15-18% un 45nm möglich.
Die Atom-Reihe ist niedrig angesetzt, aber die Erlöse sind bei den größeren Designs höher.
Nachdem Apple jetzt durchgängig den 6M-Penryn einsetzt (und keine 3M-Penryn wie viele andere) ist die Lage in Q2'2008 schon angespannt.

Ansonsten noch zum Alpha EV8: Das schöne daran war ja, dass 2fach SMT bei den vielen Exec Units soviel brachte wie ein echter 2ter Kern. Das ist schon optimal. Im Extremfall hat man super single thread Performance durch die 8fache SSkalarität, und wenn das nichts brachte, dann könnte man die Units mit SMT auslasten ... da sieht man mal, dass da jemand gedacht hatte ^^ SMT bei P4 und jetzt auch bei Nehalem bringt zwar auch was, aber niemals soviel. Das hätte quasi den ähnlichen Effekt wie das "reversed Hyperthreading", das immer mal durch die Schlagzeilen geistert.
Genau daher wäre so ein Design für typ. Single-/ Dual-Core Geräte mit zeitweise mehr parallelen Threads eine sinnvolle Sache.
Hohe IPC bei Single-Thread bedeutet im Mobilbereich durchaus dann kürzere Phasen mit max. TDP (bei voll hoch geschalteter Peripherie wie Links/ DRAM-Kontroller), was insgesamt Strom sparen hilft.
Und die Geräte fühlen sich 'schneller an'.

Für Server etc. aber ein nur teilweise erfolgversprechendes Design, aber AMD will ja verstärkt im Mainstream punkten.

Der Erfolg des Intel Atom und früherer low power Designs wie Centrino sind eine gute Referenz für die Wünsche der Käufer. Angesichts des Überhanges an Rechenpower für viele Anwender kann naives Multicore mit rel. hoher TDP keine sinnvolle Produktplanung sein.

Opteron
01.05.2008, 18:36
Mit Rechenwerk meinte ich die Kerne (den Prozessor)....egal ob Virtuell (SMT) oder nicht. Ok, dann noch die Frage was Du mit "Kernen" meinst, doch nicht wieder Rechenwerke (Kerne?).
Wenn ich das richtig verstehe, dann meinst Du "einfach" nur revered Hyperthreading mittels Software.

Die Betriebsysteme weisen heute schon den Threads die einzelnen CPU-Kerne zu, wenn Du jetzt willst, dass 1 Programm/Thread, gleichzeitg auf mehreren Kernen läuft, dann bräuchte es sowas wie "reversed Hyperthreading". In Software hat sowas aber wohl keinen Zweck, da es zu langsam wäre.

Wenn sich das OS um die einzelnen µOps eines Programms kümmern müßte, wäre das viel zu komplex, meiner Meinung nach.

@rkinet:
Danke für den anandterch Link, dass Intels 45nm Kapazitäten begrenzt sind ist klar, aber gleich soviel ^^ Ich dachte, da wäre inzwischen schon die 2. Fab angelaufen.
Der Erfolg des Intel Atom und früherer low power Designs wie Centrino sind eine gute Referenz für die Wünsche der Käufer. Angesichts des Überhanges an Rechenpower für viele Anwender kann natives Multicore mit rel. hoher TDP keine sinnvolle Produktplanung sein.Du vergißt bei der TDP, dass man den 2. Kern quasi für umsonst bekommt. So ein Teil wäre natürlich kein Stromsparwunder, aber wenn dann im 2-4 thread Betrieb der 1Kerner so schnell wie ein echter 2Kerner wäre, dann spart das massig Energie/Strom etc. ^^

Sagen wir mal so ein Kern würde, sagen wir mal die 1,5fache Leistung eines "normalen" Single-cores verbraten, dann wäre das immer noch besser als die 2fache Leistung eines echten dual cores. Eigentlich ein Patentrezept für *die* desktop CPU. Ich hoffe AMD übernimmt da irgendwas, und wenns nur 6fach Superskalar mit 2fach SMT ist, reicht ja auch schon ^^
Dann noch die 32 8192bit breiten FPU Register des EV8-Tarantula für die K11 SSE Abteilung dazu, dann kann Intel mit dem "putzigen" 256bit AVX einpacken ^^

Aber darüber haben wir schon vor 5 Jahren fabuliert ...

Offiziell hat AMD ja auch noch den Bobcat auf der Liste, also da sollte AMD dann mal keine Rücksicht auf den Stromsparmarkt nehmen müssen.

ciao

Alex

P.S: Netter Tippfehler:
naives Multicore

wadenbeisser
02.05.2008, 15:48
Die das zu realisieren wäre kann ich auch nicht sagen, da mir hierfür entsprechende Kenntnisse fehlen. Es wäre allerdings ein Weg aus der bisherigen starren Konstruktion. Wenn man den gerüchten zu zeiten der K8L Spekulation glauben mag, dann hatte offenbar auch AMD schonmal darüber nachgedacht und in diese Richtung geforscht. Nannte sich das hier nicht anti-HTT?
dieses von dir benannte "revered Hyperthreading" wäre natürlich auch in einer Hardware/Software Kombination denkbar, da der von mir verfolgte Grundgedanke lediglich darin besteht das die Programme herzlich wenig davon mitbekommen wieviele Kerne der Prozessor nun wirklich besitzt und somit derzeitige diskussionen um Multicore Prozessoren vom Tisch wären. Das Einbinden von grafikkarten zur Berechnung könnte man vielleicht ähnlich handhaben wie das Ansprechen der SSE Einheiten derzeitiger Prozessoren.

Das nötige Entwicklungspotential für eine solche Plattform sehe ich durch den Aufkauf von ATI durchaus als gegeben aber wie es dabei Softwareseitig ausschaut....?

Wie gesagt...vielleicht alles ein wenig zu offtopic meinerseits aber es spiegelt meine Gedankengänge zu derzeitigen Problemen bei der multicore Diskussion und einer effektiven Nutzung der Grakas ausserhalb des 3D Marktes (wie z.B. bei Folding@Home) wieder. :)

Opteron
02.05.2008, 16:14
Die das zu realisieren wäre kann ich auch nicht sagen, da mir hierfür entsprechende Kenntnisse fehlen. Es wäre allerdings ein Weg aus der bisherigen starren Konstruktion. Wenn man den gerüchten zu zeiten der K8L Spekulation glauben mag, dann hatte offenbar auch AMD schonmal darüber nachgedacht und in diese Richtung geforscht. Nannte sich das hier nicht anti-HTT?
dieses von dir benannte "revered Hyperthreading" wäre natürlich auch in einer Hardware/Software Kombination denkbar, da der von mir verfolgte Grundgedanke lediglich darin besteht das die Programme herzlich wenig davon mitbekommen wieviele Kerne der Prozessor nun wirklich besitzt und somit derzeitige diskussionen um Multicore Prozessoren vom Tisch wären. Das Einbinden von grafikkarten zur Berechnung könnte man vielleicht ähnlich handhaben wie das Ansprechen der SSE Einheiten derzeitiger Prozessoren.

Das nötige Entwicklungspotential für eine solche Plattform sehe ich durch den Aufkauf von ATI durchaus als gegeben aber wie es dabei Softwareseitig ausschaut....?

Wie gesagt...vielleicht alles ein wenig zu offtopic meinerseits aber es spiegelt meine Gedankengänge zu derzeitigen Problemen bei der multicore Diskussion und einer effektiven Nutzung der Grakas ausserhalb des 3D Marktes (wie z.B. bei Folding@Home) wieder. :) Jo "anti-HTT" ist nur ein andrer Name für reversed Hyperthreading, das meint das Gleiche ^^

Der von Dir angesprochene Punkt der integrierten Grafikkarte ist schon interessant, da ist die Frage, ob die Programmierung desselben irgendwie/irgendwann als "SSEx" in den x86 Befehlssatz aufgenommen wird, oder nicht. Wäre dann aber schon ne dicke Erweiterung.

Ansonsten hat Deine Idee wohl etwas von der Transmeta Idee. Da lief ja auch Codemorphing Software auf einer 128bit CPU. Die Software hat die x86 Befehle dabei in interne Datenhäppchen für die properitäre CPU übersetzt. Je nachdem was diese CPU halt zur Verfügung stellte, wurden da die Daten verteilt. Dürfte nicht so schwierig sein, da die Daten dann auf einen Grafikkern zu verteilen, wenn er integriert werden würde. Transmeta hat sich leider aber nicht durchgesetzt, Problem war vielleicht auch, dass die Software ~20MB vom RAM brauchte, was für kleine embedded Geräte zuviel war, für notebooks/desktops war der Chip dafür zu langsam und die ULV Intel Chips verbrauchten dann auch nicht mehr Strom.

Offtopic ist hier nichts, vielleicht baut AMD ja Codemorphing in den K11 ein, nachdem nichts bekannt ist, darf man über alles spekulieren ;-)

ciao

Alex

wadenbeisser
02.05.2008, 16:27
Ich bin mir jetzt nicht sicher welcher Prozessor das war aber bei einem kommenden Modell war ja im Blockaufbau auch ein PCIe Controller mit eigearbeitet...vielleicht ein Indiz für eine entsprechende Forschung zur Einbindung der Grafikkarte in die Berechnungen der CPU?

Opteron
02.05.2008, 16:30
Ich bin mir jetzt nicht sicher welcher Prozessor das war aber bei einem kommenden Modell war ja im Blockaufbau auch ein PCIe Controller mit eigearbeitet...vielleicht ein Indiz für eine entsprechende Forschung zur Einbindung der Grafikkarte in die Berechnungen der CPU?
Hmmmm integrierter PCIe ... das wird der SocketG hoffentlich bringen, und darüber hab ich auch schon öfters spekuliert, aber ein Blockschaltbild hab ich damit noch nicht gesehen.

Wobei, ich glaub beim Fusion wars mal mit drauf. Ansonsten hat das im Moment nur Sun.

Es ist dir Frage, wie das integriert werden soll. In der ersten Generation wird das wohl eher ein MCM werden, d.h. man müßte ein Ati Grafik DIE irgendwie mit nem AMD CPU Die verbinden. Also entweder nen Ati Chip mit Hypertransport, oder ne AMD CPU mit PCIe. Letzteres ist wohl sinnvoller, weswegen ich das auch immer gerne propagiere :)

Frage ist dann aber, wie der Ati Chip an den Hauptspeicherzugriff kommt .. naja abwarten :)

ciao

Alex

rkinet
02.05.2008, 16:46
Ich bin mir jetzt nicht sicher welcher Prozessor das war aber bei einem kommenden Modell war ja im Blockaufbau auch ein PCIe Controller mit eigearbeitet...vielleicht ein Indiz für eine entsprechende Forschung zur Einbindung der Grafikkarte in die Berechnungen der CPU?
Intel integriert indirekt ja auch direkt PCIe im Havendale - http://sunnytalkstech.blogspot.com/2007/11/complete-nehalem-details-leaked.html

Wobei die PCIe Schnittstelle locker auch über eine Bridge laufen könnte, besonders wenn HTr verwendet würde.

Bei der GPU wird heute bei ATI 'Ultra Threated' verwendet, bei x86-64 aber separate Cores mit 3-fach superskalar Design. Ok, bei der Grafik wird zwar auch spekulativ gearbeitet, aber nur verworfen, wenn eigentlich verdeckte Bildbereiche betroffen wären.
Das Verteilen von vielen Threads incl.spekualtiven erinnert nun wiederum an den Alpha EV8.
Aber SSE und Stream Processing Units könnte ggf. fusionieren, was hocheffekte SSE-Performance ODER DirectX-Operationen bedeuten würde. Oft kämen die sich nicht in die Quere, wie beim encoding oder Signalverarbeitung / Spracherkennung.

http://pics.computerbase.de/1/7/3/7/4/122_m.png


Aber bisher war bei AMD nichts in dieser Richtung erkennbar.
'Swift' wird lediglich eine (Dual ?! ) K10-Variante mit DirectX10 Grafik auf dem 45nm DIE.
Intels Havendale eben die Nehalem-Basisversion mit 2*2 Cores.

Dazu kommt jetzt per Intel 'Atom' eine deutlich schwächere Ergänzung, die aber bei der TDP glänzen kann.
Das ist auf längere Sicht aber Unsin, denn Strombedarf durch unnütze Units ist ein Akzeptanzproblem. Etwas hilft abschalten/ Tiefschlaf der nicht benötigten Komponenten, aber ein wirklich integriertes Design wäre besser für die Zukunft.

hendrikhey
02.05.2008, 16:50
dieses von dir benannte "revered Hyperthreading" wäre natürlich auch in einer Hardware/Software Kombination denkbar, da der von mir verfolgte Grundgedanke lediglich darin besteht das die Programme herzlich wenig davon mitbekommen wieviele Kerne der Prozessor nun wirklich besitzt und somit derzeitige diskussionen um Multicore Prozessoren vom Tisch wären. Das Einbinden von grafikkarten zur Berechnung könnte man vielleicht ähnlich handhaben wie das Ansprechen der SSE Einheiten derzeitiger Prozessoren.
Anti-HTT würde allerdings teilweise bestimmt auch zu Leistungseinbußen führen.

Ein Beispiel aus der Spielewelt:
Du läufst mit Deinem Ego in einem Shooter durch die Gegend und schießt wild in der Gegend rum.

Ein Zweikerner (oder mehr) könnte folgende Aufgaben zeitgleich berechnen, da mehr Threads verarbeitet werden:
Sound (sofern Onboard-Codec), Physik, danach Wind und Gittermodelle.

Dein Zweikerner, der aber nur über einen Thread verfügt, berechnet dann alles nacheinander.

Ich kann mir vorstellen, dass Letzteres langsamer wäre als die erste Rechnung.

wadenbeisser
03.05.2008, 14:57
Hast du dabei auch bedacht das im zweiten Szenario die einzelnen Kerne auch nur die halbe Leistung haben und eine solche festlegung sehr hinderlich ist, wenn einer der Kerne nicht ausgelastet werden kann und somit dessen restliche Rechenleistung brach liegt? Genau dieses Problem haben derzeit die Quadcores mehr als deutlich.

Nicht umsonst sprach ich allgemein von multicore Prozessoren und nicht umsonst sprach ich ebenfalls von der Möglichkeit einer erneuten Aufteilung der Rechenleistung.
Auch wäre eine feste Aufteilung der gesammten Rechenleistung für verschiedene Programme denkbar

@Opteron
Ich denke es war das Schaubild des Fusion Projetzs, welches ich im Hinterkopf hatte.
Das mit dem Zugriff des Grafikchips auf den Hauptspeicher sehe ich im übrigen als garkein Problem an, da ja bereits heutige Chips es bereits beherrschen (Auslagen von Texturen, shared memory Lösungen usw.) und die interne Berechnung innerhalb des sehr viel schnelleren Grafikspeichers der Grafikkarte ablaufen könnte. Bestrebungen die Grafikchips als Rechenkarten zu vermarkten gab es meiner meinung nach sogar schon zu Zeiten der x1800/x1900 und wird eingeschränkt sogar schon bei Folding@Home genutzt.

@rkinet
Wie gesagt...die GPU würde dann in der Form eines neuen Befehlssatzes angesprochen werden. Würde man 2 Technologien bestehend aus dem Fusion Projekt und der Hybrid Crossfire Geschichte mit der Berechnung in der Grafikkarte kombinieren können, dann wäre der Befehlssatz auf der einen Seite ein fester Bestandteil der CPU und wäre per schnellerer Grafikkarte auch noch rechenleistungstechnisch aufrüstbar.
das es mit derzeitigen Grafikkarte nicht allso warscheinlich wäre dürfte klar sei aber entsprechende Anpassungen der Shaderarchitektur wären bei kommenden Modellen durchaus denkbar.
.
EDIT :
.
Bestrebungen zur Einbindung der GPU in die Rechenleistung bestehen offenbar bereits heute:http://www.computerbase.de/news/hardware/supercomputer/2008/april/neuer_300-tflop-supercomputer_96_gpus/

rkinet
04.05.2008, 10:23
@rkinet
Wie gesagt...die GPU würde dann in der Form eines neuen Befehlssatzes angesprochen werden. Würde man 2 Technologien bestehend aus dem Fusion Projekt und der Hybrid Crossfire Geschichte mit der Berechnung in der Grafikkarte kombinieren können, dann wäre der Befehlssatz auf der einen Seite ein fester Bestandteil der CPU und wäre per schnellerer Grafikkarte auch noch rechenleistungstechnisch aufrüstbar.
das es mit derzeitigen Grafikkarte nicht allso warscheinlich wäre dürfte klar sei aber entsprechende Anpassungen der Shaderarchitektur wären bei kommenden Modellen durchaus denkbar.
Beide Welten (CPU und GPU) müssen fusionieren gerade wenn die Fertigung auf dem gleichen DIE erfolgt.
Wobei ich bei der SSE noch den Bedarf an SMT sehe, da typ. Grafikaufgaben massiv parallel arbeiten aber bei ehere bescheidenen Taktraten.
Die SSE könnte z.B. 1-4 fach (variabel) mit SMT arbeiten und dann z.B. bei 600 MHz IDLE z.B. 64 Shader für DirectX nutzen, bei 1,8 GHz aber 192 und bei 2,4 GHz 256 virtuelle Shaderfunktionalitäten.
Ebenso sind bei einer GPU im Minimum 8 MB local frame buffer nötig, was bei 12 MB als eDRAM also entweder genügend für GPU und CPU ergäbe.
Der local frame buffer wäre auch energiesparender nutzbar als der permanete Zugriff auf das extrene DRAM heutiger onborad-Designs oder gesondereter Grafikkarten.

Es gibt also einiges an Möglichkeiten eine 'Überflieger Mobil CPU <> GPU" und auch eine Mainstream-Desktop CPU zu entwickeln.
Wenn bei ca. 2-4 Cores und perfomanter Floatingpoint die Entwicklung verharrt (allenfalls die Zahl der Floating Point Units sich erhöht) und nur geringere TDP bzw. steigende Taktraten von Bedeutung sind, dann bildet sich schon ein Basisdesign heraus.

Opteron
08.05.2008, 11:19
Das wars dann erstmal wieder mit den Bulldozer news:

(...) The two biggest things are they aren't up to snuff core for core, and Bulldozer is looking wounded if not dead. (...)

The most distressing part is Bulldozer. Much was made of it not being on the roadmaps last December, but that was a tempest in a tea kettle. The real problems have come out since then, and the only way to say it is that the architecture is a huge flop.

No, this isn't to say that it won't be fast or meet every spec that it was meant to, simply that it can't be done on a 45nm process. This means that it will be on the 32nm node pushing it out to late late 2010 best case.Q: http://www.theinquirer.net/gb/inquirer/news/2008/05/07/amd-roadmap-restores-bit

Bis da wieder was durchsickert wirds wohl 2009 ...

ciao

Alex

cumec
08.05.2008, 11:22
jo, und hier nochmal der inquirer auf deutsch zu dem thema.

http://www.theinquirer.de/2008/05/08/bringt_die_neue_amdroadmap_verlorenes_vertrauen_zuruck.html

schade, das wars dann fürs erste...

raven-666
08.05.2008, 11:50
und langsam auch mit amd

hot
08.05.2008, 12:19
Sao Paulo = BD?

Opteron
08.05.2008, 12:25
Sao Paulo = BD?
Nö, wie kommste da drauf ? Das sind nur 6 K10 Kerne im neuen Socket G. In Letzteren wird dann später auch Bulldozer platz nehmen, wenn er irgendwann kommen sollte ...

ciao

Alex

hot
08.05.2008, 12:31
Wie kommt man darauf, dass es K10 sein müssen? Gibts dazu genaueres? Bisher kann es doch beides sein. Auf der Roadmap gibts nur Northbridge-Features.

rkinet
08.05.2008, 13:08
jo, und hier nochmal der inquirer auf deutsch zu dem thema.

http://www.theinquirer.de/2008/05/08/bringt_die_neue_amdroadmap_verlorenes_vertrauen_zuruck.html

schade, das wars dann fürs erste...
Das kann man so sagen.

AMD muss zudem per K10 eine neue Serverplattform und dann auch noch (übergangsweise) in 45nm Technik einführen.

Das zieht sich wie ein Kaugummi und die IPC oder TDP hat kaum neue Dimensionen im Visier.

Opteron
08.05.2008, 13:14
Wie kommt man darauf, dass es K10 sein müssen? Gibts dazu genaueres? Bisher kann es doch beides sein. Auf der Roadmap gibts nur Northbridge-Features.
Wenn das Bulldozer wäre, dann würde das gaaaaaaanz groß mit roter Schrift auf grellgelben Grund stehen ;-)
Du hast recht, 100%ig ausschließen kann mans nicht, aber 99,999999% ;-)

ciao

Alex

hot
08.05.2008, 13:32
Nö, nicht zwingend.

Opteron
08.05.2008, 14:20
Nö, nicht zwingend.
Ja klar, träumen kann man ja immer .. von reversed HT, Taktraten jenseits von 3 Ghz, Kernen ohne Ende, SSE5 mit 1024bit Registern oder eben einen 12 Kern Bulldozer 2010 ... das zeichnet den hardcore AMD Fan aus ;-)

ciao

Alex

rkinet
08.05.2008, 15:37
Ja klar, träumen kann man ja immer .. von reversed HT, Taktraten jenseits von 3 Ghz, Kernen ohne Ende, SSE5 mit 1024bit Registern oder eben einen 12 Kern Bulldozer 2010 ... das zeichnet den hardcore AMD Fan aus
also 12* 2,2 GHz = 26,4 GHz ... 3 GHz war gestern ;D

Hier liegt die reale Zukunft von AMD:
- http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1207000861
- http://www.golem.de/0805/59564.html

Da sollten doch 32 Cores bei <10 Watt umgerechnet machbar sein ?

Jetzt noch per Transmeta-Idee 'reversed HT' einführen und SuperPI liegt unter 5s bei 10 Watt TDP.
Da könnte Intel nur noch die weiße Flagge hießen ...

hot
08.05.2008, 16:07
Ja klar, träumen kann man ja immer .. von reversed HT, Taktraten jenseits von 3 Ghz, Kernen ohne Ende, SSE5 mit 1024bit Registern oder eben einen 12 Kern Bulldozer 2010 ... das zeichnet den hardcore AMD Fan aus ;-)

ciao

Alex
Was heißt träumen, ich glaub eher jeder träumt von seinem eigenen Krempel. Und mit "Hardcorefan" hat das mal beileibe nix zu tun.
Nur ist es halt möglich und soo unwahrscheinlich ist es nun auch wieder nicht. AMD gibt nicht umsonst keine CPU-Kerntypen an, sondern zählt nur Features auf, die diese CPUs sowieso haben werden. Ich denke, eine solche Entscheidung, dürfte selbst bei AMD noch nicht feststehen - es kommt halt wohl eher darauf an, wie man mit dem BD voran kommt. Nur sollte man sich von sowas verabschieden, dass der BD ein "Wunderding" ist. AMD hat in den schwierigsten Zeiten das Blaue vom Himmel versprochen um zu überleben und wahnwitzige Fahrpläne vorgegeben. Es hat geklappt, die Analysten habens gefressen.
Nur stellt sich eben bei einem solchen Unternehmen die Frage: Ist er wirtschaftlich überhaupt sinnvoll? Wenn dieser wieder gecancelt wird, bleibts halt bei dem K7 Nachfolger K10. Es ist nunmal eine Tatsache, das viel schlechter geredet wurde beim K10 als es tatsächlich ist. Es gibt eine Userbewegung im Umbruch, die die Stärken des K10 erkannt hat und diese auch nach Außen tragen. Das Hardwareluxx-Forum ist ein gutes Beispiel dafür.
Wenn BD wirklich nicht so pralle ist, kommt er halt nicht, dann bleibts halt bei Altbewährtem, ist bei Intel ja ebenfalls nicht anders. Nur läufts jetzt halt wie immer: Montreal kommt nicht, BD kommt nicht oder später und schon wird wieder Untergangsstimmung verbreitet. Immer heißt es, es kann nicht schlimmer werden, die sind bald pleite, wenn die beim K10 bleiben, sind sie verloren... jaja, ne is klar. Das hat man schon zu K5 Zeiten prognostiziert.
Dabei ist die 6-Kern-Variante wirtschaftlich gesehen ein klasse Schachzug. Er ist recht einfach zu implementieren, das KnowHow ist ja da und problemlos auch für die Fertigung realisierbar. Wahrscheinlich ist man damit kostentechnisch viel besser dran, als mit einem möglichen Montreal, welcher ja eh nur für den Serverbereich bestimmt war. Im Nachhinein ist der Montreal ein derart ehrgeiziges Projekt gewesen, dass einem Zweifel kommen, ob der überhaupt tatsächlich in Planung war. Man kümmert sich nun halt um bessere Fertigung, mehr Takt, Optimierungen usw. Es sollte viel zu schnell vorwärts gehen, wäre man den Weg gegangen, wäre es sicherlich aus gewesen. Bei einem solch riskanten vorgehen - neue CPU-Kerne, neue Infrastrukturen usw. kann man sich ganz schnell so verschätzen, das alles zu spät ist. Ich sehe die neue Roadmap eher als "Gesundungskurs", weil AMD genau das macht, was sie immer erfolgreich gemacht haben: Bewährte Techniken weiterverwenden. Der K10 ist taufrisch und das Design ist immernoch potent.

rkinet
08.05.2008, 16:44
AMD hat in den schwierigsten Zeiten das Blaue vom Himmel versprochen um zu überleben und wahnwitzige Fahrpläne vorgegeben. Es hat geklappt, die Analysten habens gefressen.
...
Dabei ist die 6-Kern-Variante wirtschaftlich gesehen ein klasse Schachzug. Er ist recht einfach zu implementieren, das KnowHow ist ja da und problemlos auch für die Fertigung realisierbar.
Der 12-fach Core in 45nm ist aber auch halbseiden.
Das wären umgerechnet 3* 45 Watt als Quad in 45nm was bei AMD und Intel schon grenzwertig wird.
Lt. http://www.tomshardware.com/de/QX9300-Quad-Core-Extreme-Intel,news-240702.html
packt Intel als Superselektion Penryn die 4* 2,53 GHz bei 45 Watt.
Intel stellt aber viel mehr Penryn her als AMD je per Hexacore.
Ebenso wäre ein 65 Watt Hexacore nut <<2,5 GHz vorstellbar, also eher 2,2 bis 2,3 GHz bestenfalls.

Ich sehe die neue Roadmap eher als "Gesundungskurs", weil AMD genau das macht, was sie immer erfolgreich gemacht haben: Bewährte Techniken weiterverwenden. Der K10 ist taufrisch und das Design ist immernoch potent.
Der K10 ist das einzig verfügbare für AMD.

Was aber fehlt ist ein nativer Triple-Core mit kompakten L3 (also eDRAM).
AMD wird es vs. Nehalem sehr schwer haben, aber der Penryn wird noch lange direkter Konkurrent im Mainstream sein.
Die hohen IDLE-TDPs der Barcelona-Cores dürften sich bei 45nm reduzieren, aber wird bleiben immer noch oberhalb der K8 / eher 11-13 Watt.
Dies wird sich beim Propus (Quad ohne L3) nicht bessern, aber ein nativer Triple-Core läge wieder deutlich unter 10 Watt. Das ergäbe dann ein rundes Produkt, was 2009/10 noch umsatzträchtig wäre.

Hier sind also Schwächen vorhanden - weder der Barcelona kann Ende 2008 bis Mitte 2009 überzeugen (daher wohl noch den 3,1 GHz K8 G2), noch ist der Propus ohne L3 ein beachtenswertes Produkt. AMD hat es also geschafft den K10 in der miesest möglichen Kombination im wichtigen Mainstream einzuplanen.
Und hier treffen die Designs auf den 3M-Penryn und den 6M-Penryn, wobei sogar der 3M-Penryn in vielen Bereichen davon zieht.

Opteron
08.05.2008, 17:15
Ich denke, eine solche Entscheidung, dürfte selbst bei AMD noch nicht feststehen - es kommt halt wohl eher darauf an, wie man mit dem BD voran kommt. Wenn dieser wieder gecancelt wird, bleibts halt bei dem K10. Klar .. AMD kündigen nen Chip an, und weiß selber nicht, was drin ist .. sei mir nicht böse aber da kann ich nur schreiben: selten so gelacht ..

Nur ist es halt möglich und soo unwahrscheinlich ist es nun auch wieder nicht.Jo das ist der Unterschied zw. unseren Positionen, für mich ist ein Bulldozer 6 Kerner in 45nm Fantasterei für dich nicht sooo unwahrscheinlich. Genau wissen wirs in 2 Jahren (ausser AMD verschiebt es wieder ^^)

Edit:
Der K10 ist taufrisch und das Design ist immernoch potentJo,wird der Nehalem den K10 in nem halben Jahr recht alt aussehen lassen, außer das Design ist langsamer als Penryn ;-)

Warten wirs ab

Alex

aylano
08.05.2008, 18:49
AMD Q1 2008 Earnings Call Transcript @ April 17, 2008

Derrick R. Meyer
The Bulldozer core is in development in 45-nanometer technology and we’ll be sampling that in 2009.
http://seekingalpha.com/article/72812-amd-q1-2008-earnings-call-transcript?page=10

Die Meldung war vor einem Monat. Was kann es für einen Grund geben, so vieles in kurzer Zeit zu ändern???

And then we’ll be introducing a new platform architecture later 2009, early 2010.
Immerhin hat man die Plattform-Einführung kaum verschoben.

Opteron
08.05.2008, 18:53
Die Meldung war vor einem Monat. Was kann es für einen Grund geben, so vieles in kurzer Zeit zu ändern??? Das fragt sich hier jeder ...

Edit:
heise stochert auch nur im Nebel ...
http://www.heise.de/newsticker/Wann-kommt-die-naechste-AMD-Prozessorarchitektur--/meldung/107646

ciao

Alex

aylano
08.05.2008, 19:33
Das fragt sich hier jeder ...
Danke für die Antwort.
Ich dachte, es gibt schon eine Vermutung die ich überlesen habe.

heise stochert auch nur im Nebel ...
http://www.heise.de/newsticker/Wann-...meldung/107646
Interessanter Artikel.
Aber das Chaotische ist eigentlich daran, dass wir noch immer nicht wissen bzw. offiziell, welche IPC-Verbesserungen der Shanghai haben wird bzw. wie die Puma-Notebooks ungefähr aussehen (Ghz zu 35Watt, gibts LV & ULV-CPUs?)
Und wie "Asset-Light" aussieht.
Und das eben zu einer Zeit, in dem AMDs-Bilanz & Produkt-Aussicht der nächsten Zeit recht schlecht aussieht.

Eigentlich seltsam, diese weiterhin-Weigerung. Als ob AMD es nicht nötig hat, ihr Image etwas aufzupolieren.
Abgesehen davon, dass man von Bobcat nichts hört. Nicht einmal, warum es beim Technologie-Day in Dec 2008 nicht mehr erwähnt wurde. Und das zu einer Zeit in der Atom ordentlich auftrumpft.

Ach ja, und zuletzt finde ich interessant, dass 32nm auch nicht erwähnt wird.
Denn zwischen den Analysten-& Technologie-Days zwischen Mitte 2006 & Ende 2007 wurde der Fertigungsfahrplan kaum/nicht verschoben, indem 32nm dann Früh 2010 eingeführt wird. Und aufeinmal wird wieder nichts davon erzählt.

Irgendwie hat AMD gerade eine Schizophrene Info-Veröffentlichung a la manche Infos werden gesagt und manche (aufeinmal) nicht.

Nun ja, was dahinter steckt, werden wir zu mindestens im Ansatz bald sehen a la RV770 & 790GX & Puma sollen ja in einem Monat präsentiert werden.

Crashman
08.05.2008, 20:45
Tja, das ist für AMD eine sehr bittere Entwicklung.

Anscheinend hat man sich wirklich sehr lange auf den Lorbeeren ausgeruht und Probleme verschwiegen. Getreu dem Motto: Augen zu und durch....bis die Wand kommt.

Wenn AMD weiterhin als eigenständiger Konzern überleben will, sehe ich nur wenige Chancen:

1. Sie bieten eine insgesamt verdammt gute Kombination aus CPU, Chipsatz und Grafik, welche über die Schwächen der CPU hinweghilft

2. Der Grafikbereich läuft exzellent und kann den CPU Bereich stützen

3. Fusion auf K10 Basis besitzt eine wesentlich bessere Grafik als das vergleichbare Intel Produkt

4. Nehalem hat Anlaufschwierigkeiten


Vielleicht brauchts auch ein paar Szenarios gemeinsam.

Ich nehme jedenfalls an, dass im CPU Bereich zumindest bis 2011 ein deutlicher Leistungsrückstand herrschen wird.

MfG

larsbo
08.05.2008, 23:18
Sao Paulo = BD?

Da diese Frage ja nun hitzige Debatten entfacht hat, zitier ich mal pipin aus den news zur neuen Server-Roadmap hier, der offenbar die Telefonkonferenz gelesen hat (ich nicht....): "Für das erste Halbjahr 2010 ist dann mit dem "Sao Paulo" ein verbesserter nativer Sechskern-Prozessor geplant, der als Basis für den Multichip-Prozessor "Magny-Cours" dient.

Laut AMD wird die CPU-Performance der Einzelkerne im Vergleich zum "Istanbul" dabei nur moderat zulegen, dafür sollen Verbesserungen der Plattform "Maranello" zum Tragen kommen. Für "Maranello" bietet AMD erstmals wieder neue Server-Chipsätze (AMD RD890S und RD870S) für Multi-Prozessorsysteme an."

Also, Istanbul ist letztlich nur ein Shanghai mit 6 Kernen. Shanghai wird abgesehen vom größeren L3 vermutlich keine IPC-Änderungen haben. Und wenn Sao Paulo gegenüber Istanbul nur moderat zulegen soll, dann ists entweder nicht Bulldozer, oder Bulldozer ist nicht das, was AMD Mitte letzten Jahres versprochen hat....(wobei das ja noch Phil Hester versprochen hatte, der ja nun (vermutlich mit Bulldozer) bei AMD weg ist....).*suspect*

Nee, nee, allein die Tatsache, dass auf einer Server-Roadmap bis 2010 der Name Bulldozer, der ja schon vorher klar kommuniziert wurde, plötzlich nicht mehr auftaucht, ist für mich ein klares Zeichen, dass AMD schon wieder eine Kern-Entwicklung durchs Klo gespült hat. Vermutlich haben sie das ja auch schon mit dem ursprünglich geplanten K8-Nachfolge-Kern gemacht, aber damals haben sie wenigstens noch nichts darüber verlauten lassen, während Bulldozer wie gesagt schon klar kommuniziert war.

Ich frage mich ernsthaft, was AMD eigentlich 2010 noch verkaufen will, wenn Intel einen Kern mit besserer IPC und genau so guter Anbindung und genauso guter Multicore-Skalierung liefert......Wenn Intel bis dahin wirklich sogar schon den nächsten Kern (Nehalem-Nachfolger Sandy Bridge!) raus hat, dann gute Nacht!

Es mag ja sein, dass AMD sparen muss, nein, es ist ganz sicher, dass AMD sparen muss. Aber eins ist auch klar, an der Entwicklung zu sparen wird AMD das Genick ganz sicher brechen. Wer im x86 Mainstream (einschl. Server-Mainstream) mitschwimmen will, muss maximal innovativ sein. Wer zwei-drei Jahre zurückfällt, ist weg vom Fenster. Da kann man dann nur noch Nischen besetzen, wie Via es mit seinen Prozessoren macht.....

p4z1f1st
09.05.2008, 09:18
Ihr geht alle irgendwie davon aus, dass der Nehalem 0 Anlaufschwierigkeiten haben wird...versteh ich nicht

hot
09.05.2008, 10:37
@larsbo: Gut, dann ist ja BD endgültig vom Tisch. Das wollte ich ja auch nur hören bzw. lesen.
Ich glaub, man braucht auch bei Shanghai nicht auf Wunder hoffen. Es gibt halt nur Verbesserungen im Detail, aber keinen grossen Wurf. Daran wird sich bis Sao Paulo auch nichts ändern. Da sind mal eben 2 Jahre R&D-Planung und etliche Konzepte in den Boden gestampft worden - was da genau passiert ist spekulativ.
Was mich bei der Sache etwas wurmt, ist, dass man ein 6-Kern Design auch nicht mal eben so aus dem Boden stampft. eine solche Entwicklung muss es schon länger geben.

Ihr geht alle irgendwie davon aus, dass der Nehalem 0 Anlaufschwierigkeiten haben wird...versteh ich nicht

Man geht ja auch davon aus, dass der K10 ach so unterlegen ist ggü. dem Core2 - was ebenfalls nicht stimmt.

Klar .. AMD kündigen nen Chip an, und weiß selber nicht, was drin ist .. sei mir nicht böse aber da kann ich nur schreiben: selten so gelacht ..[...]
Tjo denn lach du mal. Sicherlich wird AMD wissen was drin ist, nur die Praxis ist halt was anderes als die Theorie. Und wenn der tatsächliche BD in der Simulation schon nicht der Erwartungen erfüllt und/oder die praktische Fertigung unrentabel ist, gibts halt keinen. Wie gesagt, die Ankündigungen überschlugen sich ja förmlich und kamen genau in den kritischsten Zeitpunkten in 2007, während der K10 Verschiebung. Wie ernst man sowas nehmen kann, sieht man ja jetzt.

p4z1f1st
09.05.2008, 10:43
Ich glaube auch eher, dass der Istanbul eine Art "Plan B" war der in der Schublade verweilt hat für den Fall, dass der K10 nicht zu Potte kommt.
Die Idee mit den 6 Kernen statt "nur" 4 und/oder 8 wird wohl aber schon länger bei beiden (Intel & AMD) im Kopf geschwirrt haben...spätestens seit dem ersten DualCore, sprich dem PentiumD.

hot
09.05.2008, 10:54
Im Nachhinein war das von Anfang an schon seltsam. Ich hab mich davon aber auch arg beeinflussen lassen. Man macht doch die eigene Architektur, die grade das Licht der Welt erblickt nicht madig, in dem man einen "Superkern" ankündigt und gleich ne bessere Northbridge als den Nabel der Welt hinstellt (grosspurige Montreal bzw. Sandtiger-Ankündigungen). Das gesamte Marketingvorgehen war arg komisch, zumal der K10 in den SPEC-Werten ja super darsteht. Es war doch klar, dass man diese neue Architektur erstmal 2-3 Jahre halten muss, bis was neues kommen kann.

larsbo
09.05.2008, 11:55
Ihr geht alle irgendwie davon aus, dass der Nehalem 0 Anlaufschwierigkeiten haben wird...versteh ich nicht

Na ja, erstmal bin ich immer gerne optimistisch.....:) war ich bei K10 auch.

Klar, auch Intel hatte mal nicht so glückliche Griffe, z.B. der schon fast legendäre i820 mit dem MTH (Caminogate.....). Aber auch damals war Intel nicht völlig drauf angewiesen auf den Erfolg des i820, es gab genug Alternativen aus dem eigenen Haus. Und das gilt bei Einführung des Nehalem doch absolut auch! Es ist doch nicht so, dass Intel sich mit dem aktuellen Core2 samt dazugehörigen Chipsätzen verstecken müsste! Sollte es tatsächlich (entgegen meinen Erwartungen) einige Anlaufprobleme mit Nehalem geben, dann werden die Leute eben weiter Core2 kaufen bis die Sache Rund läuft.

Nach allem, was man über Nehalem weiß, ist mit großartigen Umbrüchen im Kern selber ja nicht zu rechnen. Aus meiner Sicht ist der Schritt von C2 zu Nehalem für Intel das, was der Schritt von K7 zu K8 für AMD war. Single-thread über alle Apps ist der C2 schon bei gleichem Takt ne Ecke schneller als der K10, das wird mit Nehalem noch ein paar Prozent besser (vermutlich insbesondere bei 64bit code). Dazu kommt die Anbindung, die die gleiche Qualität haben dürfte, wie die AMD Version. Meine Prognose ist daher, dass Intel mit dem Nehalem nicht nur wie jetzt in 32bit single-thread Spec sehr gut aussehen wird, sondern auch noch in 64bit und Spec_rate. Die einzige offene Frage ist eigentlich, wie der Takt aussehen wird. Aber eben weil die Flaschenhälse außerhalb des eigentlichen Kerns alle weg sind, wird sich Intel bei Nehalem deutlich niedrigere Taktraten im Vergleich zum K10 leisten können.

Das alles vorherzusehen, das ist keine Hexerei. Beim Wechsel auf die P4-Architektur und später wieder "zurück" zu Core/Core2, war das vor Erscheinen der entsprechenden Prozessoren deutlich schwieriger abzuschätzen.

wadenbeisser
09.05.2008, 12:28
Immer schön vorsichtig mit Gerüchten aus Newsmeldungen sein und nicht vergessen das es sich dabei um Gerüchte und nicht um Tatsachen handelt.
Relativ kurz vor erscheinen der B3 Steppings tauchten auch irgendwelche Top-News mit ner angeblich neuen Roadmap auf, in denen man bereits an der Namensgebung der B3 Phenoms erkennen konnte wie asbach uralt die war, denn darin hieß der 2,4GHz Phenom im B3 Stepping noch Phenom 9700. Bereits einige monate zuvor tauchten hingegen Mitteilungen auf in denen eindeutig hervor ging das die B3 Steppings mit ner "50" enden und sich somit eindeutig von den B2 Modellen abgrenzen.

Vielleicht handelt es sich dabei auch nur um gezielt gestreute Falschinformationen um Informationslecks herauszufinden.

larsbo
09.05.2008, 12:44
Vielleicht handelt es sich dabei auch nur um gezielt gestreute Falschinformationen um Informationslecks herauszufinden.

;D

Sehr geil, das ist was für richtige Verschwörungstheoretiker. Wenn uns Verlautbarungen aus offizieller AMD-Quelle nicht passen, dann ist ganz klar, dass AMD bewusst lügt, um uns alle zu verwirren, damit nachher die Überraschung umso schöner wird, dass doch noch ganz tolle neue Produkte viel früher als erwartet kommen..........*suspect**suspect**suspect* 8)

Mal ernsthaft, das war alles im Rahmen einer Telefonkonferenz von Randy Allen, bei AMD ganz hoch offiziell für Server/Workstation zuständig, einen Tag vor der Hauptversammlung veröffentlicht. Wenn man in der Branche nichts zu zukünftigen Projekten sagen will, dann hält man die Klappe, aber erzählt keinen Käse!

wadenbeisser
09.05.2008, 12:57
Offizielle Aussagen sind etwas anderes als grüchte oder informationen die irgendwo durchgesickert sind.
Wer das nicht kapiert dem ist nicht mehr zu helfen.

larsbo
09.05.2008, 14:03
Ja, dann weiß ich allerdings nicht so recht, was Du mit dem Post aussagen wolltest, auf den ich gerade, zugegebener maßen etwas sarkastisch-ironisch, geantwortet habe.....???

Sowohl die "Ankündigung" von Bulldozer Mitte 2007 als auch die Server-Roadmap gestern waren offizielle Dokumente aus dem Hause AMD.Auf was bezieht sich denn sonst Deine Feststellung "Vielleicht handelt es sich dabei auch nur um gezielt gestreute Falschinformationen um Informationslecks herauszufinden."? Wir diskutieren hier gerade die ganze Zeit die neue Server-Roadmap. Du nicht?

rkinet
09.05.2008, 14:19
Wenn man in der Branche nichts zu zukünftigen Projekten sagen will, dann hält man die Klappe, aber erzählt keinen Käse!
http://www.marketwatch.com/news/story/amd-chief-says-changes-afoot/story.aspx?guid=%7B0F21B765%2D2D81%2D4C04%2D8974%2D7E6A01A444F8%7D&tool=1&dist=bigcharts&symb=AMD&sid=373

"We are re-architecting the business so that our financial success is not invariably dependent on continuous component performance leadership over a rich and dominant competitor," Ruiz said.
Analyst Roger Kay of Endpoint Technologies Associates said the statement was vague, adding, "I don't know how to parse it."
Onkel Ruiz konnte zumindest gestern Worte sagen, die selbst Analysten nicht entschlüsseln konnte.

Die Info zur Server-Roadmap war aber angesichts der nichtssagenden Hauptversammlung angebracht und im Vorfeld ideal plaziert.
Der Hexa-Core klingt voll glaubwürdig, der 12-fach Core in 45nm recht schief.

larsbo
09.05.2008, 14:31
Hoffen wir mal, dass Ruiz Aussage nicht bedeutet, dass sie sich für die Zukunft lieber eine bequeme Nische suchen, wo sie keine Spitzenleistung bringen müssen und trotzdem ein gutes Auskommen haben können.......Drew Prairie hat ja auch gleich dahingehend zurückgerudert. Warten wirs ab. Ganz spannend wird natürlich auch die Frage, was denn nun eigentlich wirklich mit asset-light gemeint ist. Spannende Zeiten für AMD......

rkinet
09.05.2008, 14:46
Ganz spannend wird natürlich auch die Frage, was denn nun eigentlich wirklich mit asset-light gemeint ist. Spannende Zeiten für AMD......
So oder so - ohne einen 'K11' kommt AMD in den nächsten Jahren nicht weiter.

Selbst wenn H.Ruiz die DD-Fabs an Intel verschenkt und dazu im Gegenzug jährlich 50.000 Wafer kostenlos bekäme - Designs machen, DIEs testen, verpacken, bewerben etc. kostet auch Geld und irgendwann will auch einen K8 oder K10 keiner mehr haben.
Ohne CPUs keine Chipsatzerlöse, ohne Chipsätze keine unabhängige CPU-Linie.

AMD muss ich langsam sogar wg. VIA sorgen, besonders wenn die frühzeitig einen Shrink auf 32nm für ihre CPU durchführen.

Ich befürchte bei AMD hat man noch nicht kapiert wie massiv der Drang in Richtung low power besonders im Mobilbereich geht.
VIA ist da heute schon mit im Boot, Intel besonders gut.
Die vagen Ideen von AMD errinnern mich an den Versuch die Dampflokomotiven zu retten indem man den Heizer einspart und die Tickets laufend im Preis reduziert.

hot
09.05.2008, 15:05
Das ist Quatsch. Der K10 ist potent genug um damit weiterzumachen - zumindest bis 2011.

larsbo
09.05.2008, 15:11
Auch wenn wir uns leider wieder sehr weit vom eigentlichen Thema wegbewegen.....

K10 reicht höchstens, wenn Intel aus welchem Grund auch immer länger als erwartet auf C2 samt klassischem FSB etc. kleben bleibt im Massengeschäft. Spätestens, wenn Nehalem auch im Mainstream ankommt, wüsste ich nicht, was AMD mit K10 noch gegenhalten will.........

Opteron
09.05.2008, 15:44
K10 reicht höchstens, wenn Intel aus welchem Grund auch immer länger als erwartet auf C2 samt klassischem FSB etc. kleben bleibt im Massengeschäft. Spätestens, wenn Nehalem auch im Mainstream ankommt, wüsste ich nicht, was AMD mit K10 noch gegenhalten will......... Mann muss differenzieren, für viele Serveranwendungen reicht der K10, wenn man nur genügend Kerne hat. Für single thread Anwendungen dagegen braucht man IPC und da wird es bekantermaßen beim K10 nicht recht viel besser. Sollte SSE5 mit Shanghai kommen, gäbs vielleicht noch ne Möglichkeit (wenigstens für Neukompilate), aber nachdem da bei der Konferenz wieder nichts zu hören war, bin ich wieder etwas pessimistischer.
Wie auch immer, Intel hat bessere Karten auf dem Papier, der Nehalem hat ne hohe IPC, und mit aktiviertem HT schafft der auch in Serveranwendungen einiges weg.

Ich könnte mir aber vorstellen, dass Intel dessen Einführung verzögert. D.h. den Nehalem schön im Premium Segment läßt, also nur als Extreme Ausführung für den Desktop und für 2/4P Server.

Und ja langsam wirds OT.. grob gesehen ist das nur noch ne "K10 reicht" - "nein" - "doch" - "nein" - "doch" Abfolge. Die Meinungen sind wohl festgefahren, weitere Diskussion bringt meines Erachtens nichts mehr.

ciao

Alex

rkinet
09.05.2008, 16:02
Das ist Quatsch. Der K10 ist potent genug um damit weiterzumachen - zumindest bis 2011.
Es geht hier aber um den K11

Auch wenn AMD überraschend jetzt den K11 für H2'2009 vorstellen würde, wäre der 'alte' K10 noch lange in 2010 im Verkauf.

AMD selbst ersetzt ja lt. jüngster Opteron-Roadmap den K10 / bis Istanbul in 2010 durch neue Cores.

Für den So.AM3 / Opteron 1000er Reihe ist gar kein Hexacore vorgesehen und nur ein 'Suzuka' mit DDR3.

Night<eye>
09.05.2008, 19:21
der Jetzige K10 ist gut genug um sich gegen den jetzigen C2Q zu schlagen

wenn wir jetzt von intels 45nm vorteil absehen.

allerdings wird der k10 gegen den nehalem wirklich schwächeln.

da muss amd wieder mit kampfpreisen arbeiten oder sie werden kunden verlieren.

und amd tuhen diese preis kämpfe nicht sehr gut.

wenn der K11 (oder wie auch immer die neue architektur heißen wird) nicht vor 2011 raus kommt wirds nicht besser für amd.

für 2011 ist sandy bridge geplant.

wenn Intel dass einhält müsste amd,s (K11) noch einen größeren technologischen sprung aufholen als 2009 gegen den nehalem schon.

ich bin mir nicht sicher ob der K11 wirklich den Nehalem Defenetiv übertrumpfen wird, aber falls doch, ist die frage ob er mit dem sandy bridge mithalten kann.

ich hoffe amd wird es überleben und uns überraschen.

Bobo_Oberon
10.05.2008, 08:43
Das ist Quatsch. Der K10 ist potent genug um damit weiterzumachen - zumindest bis 2011. Reflektiere deine Aussage mit engen AMD-Partnern:

-> Sun hat seit über einem Jahr wieder ein Abkommen mit Intel und führt seit Sommer 2007 erste Sun-Produkte mit Intels Xeons.

-> Vor wenigen Tagen hat Cray bekanntgegeben, dass sie zukünftig (auch/nur?) Intel-Prozessoren in ihre Supercomputer-Designs berücksichtigen werden.

-> Wo hört das Desktop-Preisgefüge bei AMDs CPU-Spitzenprodukten auf und wo fängt Intels Quadcore-Preisgefüge an?

Nur weil AMD laut im Wald immer wieder "Costumer-Centric" pfeifft, bedeutet das noch lange nicht, dass sie auch wirklich marktgerechte Produkte fertigen. Im Grund genommen ist es eine Armutserklärung von AMD, dass es sie geben müsse, weil sonst der x86-Markt zu teure Intelprozessoren kaufen "muss".

Die Begründung bei einem leistungsfähigen AMD-Prozessor müsste lauten, dass es bei einem AMD-x86-Spitzenprodukt keine Wahl im Markt geben dürfe, da diese die technische Spitze darstellen ... und AMD fast jeden Preis dafür verlangen kann. Die Zeiten sind noch gar nicht so lange her, als AMD mit ihren Prozessoren an der 700-Dollar Grenze locker verkaufen konnte.

MFG Bobo(2008 )

hot
10.05.2008, 08:52
Auch und grade singlethreaded tut sich nicht nicht viel zu heute, denn da ist Nehalem genausowenig/viel besser als der Core2.
Bobo, du hast zwar recht, aber da ändert sich die Softwaresituation auch im Desktopsegment langsam.
Das Schlimme ist, dass AMD die eigentlich sehr leistungsfähigen CPUs verschleudern muss, weil Anno1701 z.B. und Cinebench nicht schnell genug ist. Das Traurige ist, dass der K10 vor allem unter schlechten Reviews leidet, die auf keinen Fall die tatsächliche Leistungsfähigkeit widerspiegeln im Desktop-Bereich. Und das geht absolut querbet, von CB angefangen, über Intel-Resource-Center-Anand usw... Man muss sich mal genau angucken, was da getestet wird vor allem im Spielebereich.

Es geht hier aber um den K11

Auch wenn AMD überraschend jetzt den K11 für H2'2009 vorstellen würde, wäre der 'alte' K10 noch lange in 2010 im Verkauf.

AMD selbst ersetzt ja lt. jüngster Opteron-Roadmap den K10 / bis Istanbul in 2010 durch neue Cores.

Für den So.AM3 / Opteron 1000er Reihe ist gar kein Hexacore vorgesehen und nur ein 'Suzuka' mit DDR3.

Wenn die Rev.D ein Hexacore ist, wandert der in alle Bereiche. Und es kann gut sein, dass es den K11 garnicht mehr gibt. Der K10 ist natürlich noch bis 2011 aktuell, was aber auch nicht tragisch ist, wenn Details und Fertigung weiterhin verbessert werden.

Markus Everson
10.05.2008, 09:37
Ich frage mich ernsthaft, was AMD eigentlich 2010 noch verkaufen will, wenn Intel einen Kern mit besserer IPC und genau so guter Anbindung und genauso guter Multicore-Skalierung liefert......

Das war die Beschreibung des Itanium, der antrat um alle Server-Prozessoren aus dem Ring zu fegen. Auf dem Papier war er der schnellste, der beste, der skalierungsfähigste und überhaupt das beste seit geschnittenem Brot.

Also ich finde das nicht sehr nett dass Du hier so in der offenen Intel-Wunde rumbohrst. Nur weil der Itanium ein _TOTALER und DAUERHAFTER ROHRKREPIERER_ ist der auch in der xten Generation nicht mal ansatzweise das leistet was er auf dem Papier schon von anfang an können sollte muss Intel doch nicht auch beim Nehalem versagen.

Nein wirklich, ich glaube ganz ganz fest daran dass ALLE versprechen die Intel abgibt IMMER vollständig ernst zu nehmen sind. Auch die immensen Taktsteigerungen der Quadcores wurden ja schließlich so wie angekündigt alle erzielt.

--
Wer Ironie findet darf sie behalten
.
EDIT :
.
Es ist doch nicht so, dass Intel sich mit dem aktuellen Core2 samt dazugehörigen Chipsätzen verstecken müsste!

Im Serverbereich hat das FSB-Konzept aber schon vor einiger Zeit seine letzten Lebenszeichen von sich gegeben und modert seitdem vor sich hin. Zuletzt wurden
mit diesem Monster-Chipsatz (Edit: Caneland) noch ein paar Stromstöße in den schon halb verfaulten
Leichnam gejagt um aus den Zuckungen auf noch vorhandenes Leben zu schließen -
aber das wars auch schon. FSB ist tot und Intels Reputation im Servermarkt wäre mit einem fehlerhaften Nehalem ebenso schnell beschädigt wie es derzeit die von AMD ist.

Allerdings hat Intel seit der Einführung des Pentium-M (der kam nach Netburst, richtig?) im X86-Bereich nicht wirklich viel falsch gemacht. Die Jungs dort haben einiges drauf, das muss man ihnen lassen.

Bobo_Oberon
10.05.2008, 10:42
... Das Schlimme ist, dass AMD die eigentlich sehr leistungsfähigen CPUs verschleudern muss, weil Anno1701 z.B. und Cinebench nicht schnell genug ist. ... Wenn AMD auch im Desktopsegment erfolgreich verkaufen will, mit hohen Margen ... dann muss sich AMD mit entsprechend leistungsgesteigerten Prozessoren dem Core 2 stellen.

Das Traurige ist, dass der K10 vor allem unter schlechten Reviews leidet, die auf keinen Fall die tatsächliche Leistungsfähigkeit widerspiegeln im Desktop-Bereich. ... Was ist denn "tatsächliche" Leistungsfähigkeit? Das Vermeiden von WinRAR-Benches bei AMDs B2-K10-Stepping?

Aufgespießt - Mit dem K8 in die Herzen der Nutzer:
Selbst der IPC-Vorteil bei AMDs SSE4.a wird derzeit nicht im Konsumer- und Einstiegssegment angeboten. Von K10-Kernen im Sempron, oder auch in Dualcore-Kernen ist nicht die Spur zu sehen. Eine publikumsgerechte PR für einen Instruktionssatz stelle ich mir da anders vor.
Stattdessen wird nochmals alter Wein in neuen Schläuchen (wieder geändertes Namens-Ratingsystem) abgefüllt. Die K8-Kerne sind dadurch nicht die eine Spur besser geworden, ja sogar schlechter, wenn man G-Steppings gegenüber dem F-Stepping als Vergleich nimmt. Ist dieses das sagenumwobene "Costumer Centric" bei AMD?

Publikumswirksame PR:
Was ich damit sagen will. AMD schafft es nicht mal die wenigen Optionen publikumswirksam und vor allem massenwirksam herauszukehren. Für einen Spiele-Publisher für den Spiele-Massenmarkt hat es derzeit noch keinen Sinn AMDs Vektor-Einheitenerweiterung besonders zu berücksichtigen.

AMD-Partner:
AMD kann glücklich sein, wenn deren engen Partner Sun (Solaris 10, nun auch als Open Source-Betriebssystem) und Cray (Linux) dies in "ihren" Betriebssystemen auf der einen oder anderen Weise mit berücksichtigen.
Fragt sich nun, wie lange noch AMD-Partner AMD durchschleppen werden.

Virtualisierung:
Bei den Virtualisierungsfeatures scheint AMD zwar gut positioniert zu sein ... wenn nicht der unselige TLB-Bug hier Sun, IBM, HP, Cray direkt ihnen in die Fresse geschlagen hätte. Genau dort (Virtualisierung mit Hardwareunterstützung) war AMD gefordert und ist mit dem B2-Stepping daran gescheitert.
IBM (z10-Quadcore), Sun (Niagara 2 + Victoria Falls) hingegen haben in ihren CPU-Prunkstücken auch dort die Messlatte für Virtualisierung noch ein Stück höher gelegt.

Langsamer Link für schnelle Server:
Das andere Paradoxon ist HyperTransport 3.0. Es wird derzeit im Desktopbereich verwendet. Immer noch ist davon im Serverbereich nichts aktuell zu sehen.
-> Multicore- und Streaming-Computung für durchsatzstarke AMD-Server mit einem angegrautem Linkstandard?! Dabei wollte AMD doch besonders dort auftrumpfen mit ihrer "Direct Connect"-Architektur.
Schlimmer noch. AMD muss sich im Profisegment auch seinen erstarkten "Partnern" IBM und vor allem Sun stellen. Die haben nachgelegt mit ihren Flaggschiffen und Stück für Stück ebenso ihren Beitrag zu Streaming- und Multicore-Computing geleistet inklusive Crypto- und Virtualisierungstechnik.

Fazit:
Nochmal zum mitschreiben:
Dort wo AMD nachlegen kann, macht AMD es nicht.
Dort wo man versagt, wird schleppend Besserung eingeführt, oder vertagt es.
Das ist kein schlichtes "Benchmarkproblem mehr mit den "falschen" Benchmarks (http://www.planet3dnow.de/vbulletin/showthread.php?t=137038)!

MFG Bobo(2008 )

larsbo
10.05.2008, 11:13
Das war die Beschreibung des Itanium, der antrat um alle Server-Prozessoren aus dem Ring zu fegen. Auf dem Papier war er der schnellste, der beste, der skalierungsfähigste und überhaupt das beste seit geschnittenem Brot.

Also ich finde das nicht sehr nett dass Du hier so in der offenen Intel-Wunde rumbohrst. Nur weil der Itanium ein _TOTALER und DAUERHAFTER ROHRKREPIERER_ ist der auch in der xten Generation nicht mal ansatzweise das leistet was er auf dem Papier schon von anfang an können sollte muss Intel doch nicht auch beim Nehalem versagen.

Nein wirklich, ich glaube ganz ganz fest daran dass ALLE versprechen die Intel abgibt IMMER vollständig ernst zu nehmen sind. Auch die immensen Taktsteigerungen der Quadcores wurden ja schließlich so wie angekündigt alle erzielt.

--
Wer Ironie findet darf sie behalten
.
EDIT :
.


Im Serverbereich hat das FSB-Konzept aber schon vor einiger Zeit seine letzten Lebenszeichen von sich gegeben und modert seitdem vor sich hin. Zuletzt wurden
mit diesem Monster-Chipsatz (Edit: Caneland) noch ein paar Stromstöße in den schon halb verfaulten
Leichnam gejagt um aus den Zuckungen auf noch vorhandenes Leben zu schließen -
aber das wars auch schon. FSB ist tot und Intels Reputation im Servermarkt wäre mit einem fehlerhaften Nehalem ebenso schnell beschädigt wie es derzeit die von AMD ist.

Allerdings hat Intel seit der Einführung des Pentium-M (der kam nach Netburst, richtig?) im X86-Bereich nicht wirklich viel falsch gemacht. Die Jungs dort haben einiges drauf, das muss man ihnen lassen.

Ja klar, man kann sich alles auch zurechtlegen.....

AMD macht Verluste, weil sie die besseren Produkte haben.....

Die große Verschwörung der "ich such mir die für AMD schlechtesten Benches raus"-Reviewer sorgt seit Mitte 2006 dafür, dass AMD im schlechten Licht dasteht, obwohl sie die besseren CPUs haben.(an hot gerichtet)

Für eine modernde Leiche macht Intel ganz gut Umsatz mit seinen Xeons und hält doch ganz erstaunliche Marktanteile. Natürlich sind die Server-Einkäufer alles totale IT-Zombies ohne Ahnung und korrupt sowieso......Überhaupt sind alle korrupt, Sun und Cray, alle PC- und Serverhersteller, die gemeinen Compiler-Hersteller und Software-Schmieden, der Blödmarkt genauso wie der kleine PC-Schrauber um die Ecke, und ganz besonders die vielen korrupten PC-Käufer......

Wer hier auch Ironie findet, darf sie auch behalten.
Wobei ich der letzte wäre, der bestreiten würde, dass für 4-Sockel-Systeme ein Opteron die bessere Wahl ist.

Itanium war ein komplett neues Abenteuer. Nehalem dagegen nimmt einen leicht verbesserten, schon jetzt unzweifelhaft sehr guten (momentan besten x86)-Kern Core2 und bindet ihn sehr gut an Speicher und Peripherie bzw. für Server an andere Prozessoren im SMP an. Wenn link und Speicherkontroller funktionieren, ist das ein idiotensicheres Konzept, um die Leistung weiter zu verbessern, übrigens natürlich auch die single-thread IPC. Wenns nicht funktioniert, werden sie es auch nicht rausbringen. Allenfalls das Risiko, ein nativen Quad zu bauen, gehen sie noch zusätzlich ein.....Intel wird mit Nehalem den besseren Kern in einer genauso guten Speicher/Peripherie/CPU-Anbindung haben.

Natürlich werden auch in Nehalem bugs schlummern, wie in jedem Prozessor. Aber das Grundkonzept ist straightforward, und gerade deshalb stehen die Chancen gut, dass es erfolgreich sein wird.

Ich klink mich mit diesem Statement jetzt aus, solange es nichts neues zu Bulldozer zu vermelden gibt. Die Befürchtung bleibt, dass es recht lange dauern könnte, bis es wieder was zu posten gibt. Vielleicht werd ich auch nie wieder was hier posten.*suspect*

hot
10.05.2008, 13:29
[...]

Die große Verschwörung der "ich such mir die für AMD schlechtesten Benches raus"-Reviewer sorgt seit Mitte 2006 dafür, dass AMD im schlechten Licht dasteht, obwohl sie die besseren CPUs haben.(an hot gerichtet)[...]

Ich weiss sehr gut, wie sich das anhört. Ich würds ja auch einfach abtun, wenn die Diskräpanz zwischen offiziellen Reviews und Usererfahrung nicht so gewaltig wäre. So einfach isses aber nicht, da muss man schonmal seine eigenen grauenz Zellen anstrengen. Komischerweise ist der Phenom bei MT-Benchmarks sehr stark (Spiele: CMR-Dirt, AC, LP uvm.). Und noch komischer ist, dass ausgerechnet diese Games gemieden werden wie der Teufel das Weihwasser. Siehe als gutes Beispiel CB. Normalerweise testet man bei CB CoJ und Oblivion mit. Dann der CPU-Test und was wird getestet? Das sind entweder alte Schinken oder Games die mit MT so garnichts am Hut haben. Dabei sieht die Zukunft der PC-Games doch genau anders aus: XBox-Umsetzungen, soweit das Auge reicht. Alle Hersteller grosser Engines gehen in diese Richtung, also wird genau diese Art Software (speziell im Beriech Spiele) in Zukunft den PC dominieren und eben nicht Dinosaurier wie Farcry, Quake4 oder Anno1701.
Und weiter gehts: Bei Reviews wird nahezu immer ein XP32 verwendet, wenns DX10 Games gibt wird Vista32 verwendet. Es gibt aber schon etliche PC-Titel, die von LAA profitieren, ganz zu schweigen davon, dass 4GB-RAM für 60€ zu haben sind...
Die Reviewpraxis ist einfach nur mehr als lächerlich, die bei vielen Sites an den Tag gelegt wird...
Da kommt da ein ehemaliger Intelnutzer daher, kauft sich einen Phenom und stellt überrascht fest: oh der Phenom ist ja eigentlich schneller als ein Core2-Quad - welch Überraschung!
http://www.forumdeluxx.de/forum/showthread.php?t=479512
AMD hat nicht mit der Langsamkeit des eigenen Prozessors zu kämpfen, sondern mit dem ganzen Drumrum.
Und: Es laufen auch nicht umsonst so viele Wettbewerbsklagen in so vielen Ländern. Verschwörungstheorieren gut und schön, aber das hier was im Busch ist und nicht alles mit rechten Dingen läuft, sieht ein Blinder mit Krückstock.

Ich will AMD nicht von jeder Schuld reinwaschen: Der Phenom ist genau dann grottig ggü. dem Core2, wenn man es mit Singlethreaded bzw. Pseudothreaded 32Bit (x87)-Code zu tun hat. Diese Schwäche besteht definitiv und ist vor allem bei Strategiegames wie SC, C&C3, Anno1701 akut da. Und es gibt noch einiges an entsprechender Software auf dem Markt und diese muss ebenfalls berücksichtigt werden. Aber das Ganze wird viel zu einseitig angegangen, es wird kaum differenziert.
Das Marketing von AMD war gelinde gesagt Scheisse, und der TLB-Bug war tödlich - das ist Fakt und das werde ich nie bestreiten.

rkinet
10.05.2008, 13:32
Ja klar, man kann sich alles auch zurechtlegen.....

AMD macht Verluste, weil sie die besseren Produkte haben.....

Die große Verschwörung der "ich such mir die für AMD schlechtesten Benches raus"-Reviewer sorgt seit Mitte 2006 dafür, dass AMD im schlechten Licht dasteht, obwohl sie die besseren CPUs haben.(an hot gerichtet)

Für eine modernde Leiche macht Intel ganz gut Umsatz mit seinen Xeons und hält doch ganz erstaunliche Marktanteile. Natürlich sind die Server-Einkäufer alles totale IT-Zombies ohne Ahnung und korrupt sowieso......Überhaupt sind alle korrupt, Sun und Cray, alle PC- und Serverhersteller, die gemeinen Compiler-Hersteller und Software-Schmieden, der Blödmarkt genauso wie der kleine PC-Schrauber um die Ecke, und ganz besonders die vielen korrupten PC-Käufer......
Wobei Intel tatsächlich langatmig und sich eigentlich langweilig weiter entwickelt hat.
Seit 2003 / Prescott wird beim L2 aufgerüstet und HT gepflegt.
Nach dem Netburst-Crash leuchtet zunächst nur der PIII im Yonah am Himmel, aber auch wiederum per 2M-shared L2 üppig ausgestattet.
Dann kam der C2D mit 4-fach superskalar, verbesserten Latenzzeiten beim FSB und eben primitiv noch mehr L2.
Beim Nehalem rutzsch wieder SMT per erweitertem HT rein.

Für einen Weltkonzern hat Intel nur mässig Entwicklungsarbeit geleistet.
AMD hingegen hat selbst beim 45nm Quad-Propus nur L2 auf K7-Barton Niveau anzubieten und die die K10 Cacheperformance hebt sich insgesamt nur leicht vom Ur-K8 ab.AMD hat letztlich die Weiterentwicklung von Standardfeatures im Core einschlafen lassen. Dafür aber den Core dubios verlangsamt durch Features, die keiner benötigt.
Und jetzt laufen die Kunden weg.

Wobei dies ja nicht nur das AMD-Geschäft, sondern auch die ATI-Sparte vs. nVidia jämmerlich einbrach.
Aktuell kann ATI mit tollen Produkten gerade sich noch stabil am Markt halten - http://www.heise.de/newsticker/Nvidia-steigert-Nettogewinn-um-34-Prozent--/meldung/107659
Es kann also nicht nur an der bösen Intel und dem k10 liegen - der ganze ATI/AMD Laden ist krank ... und das Geld geht aus.
Die Hoffnung auf H2'2008 ist angesichts der späten 45nm Shanghai-Massenauslieferung und im Umfeld der 3M-Penryn bis ersten Nehalem Flut eine Illusion.
Und Intel nutzt die (alten) 65nm Fabs noch für performante Chipsätze, während in DD die halben Kapazitäten still stehen.

hot
10.05.2008, 13:40
[...]
AMD hingegen hat selbst beim 45nm Quad-Propus nur L2 auf K7-Barton Niveau anzubieten und die die K10 Cacheperformance hebt sich insgesamt nur leicht vom Ur-K8 ab.AMD hat letztlich die Weiterentwicklung von Standardfeatures im Core einschlafen lassen. Dafür aber den Core dubios verlangsamt durch Features, die keiner benötigt.
Und jetzt laufen die Kunden weg.

Nur das das keine technischen Gründe hat. Genauer gesagt geht Intel sogar mehr auf AMD zu, was die Technik angeht. Intel verkleinert Caches und verlangsamt sie mit Nehalem sogar verhältnismässig. So geschrieben ist das einfach unwahr. Und: Es wird auch kein Kern dubios verlangsamt. Ein K10-Kern ist, wenn das Umfeld stimmt, immer schneller als ein K8-Kern. Da verlangsamt sich garnichts. Die Kunden laufen vor allem wegen einseitiger Berichterstattung und Eskapaden TLB-Bug weg. Wie sich der Propus und Daneb schlagen werden, sehen wir, wenn Daneb und Propus draussen sind und nicht früher. Selbiges gilt für Nehalem.

Wobei dies ja nicht nur das AMD-Geschäft, sondern auch die ATI-Sparte vs. nVidia jämmerlich einbrach.
Aktuell kann ATI mit tollen Produkten gerade sich noch stabil am Markt halten - http://www.heise.de/newsticker/Nvidia-steigert-Nettogewinn-um-34-Prozent--/meldung/107659
Es kann also nicht nur an der bösen Intel und dem k10 liegen - der ganze ATI/AMD Laden ist krank ... und das Geld geht aus.
Die Hoffnung auf H2'2008 ist angesichts der späten 45nm Shanghai-Massenauslieferung und im Umfeld der 3M-Penryn bis ersten Nehalem Flut eine Illusion.
Und Intel nutzt die (alten) 65nm Fabs noch für performante Chipsätze, während in DD die halben Kapazitäten still stehen.
Es liegt an sehr vielen Faktoren. Die Schwächen des K10 und Fehler im Management sind nur ein Teil des Ganzen. Es ist vielmehr viel zu einsetig, das alles nur auf AMD zu schieben.

Und es geht schon wieder los: Untergangsstimmung und Miesmacherei allerorts. Irgendwie ist das ne Krankheit in diesem Forum...

Was die Performance des Phenom angeht, also die Praxis mit dem Phenom: Hat überhaupt schonmal jemand von euch einen Phenom auf einem halbwegs aktuellen Board in den Fingern gehabt und getestet? Hört sich irgendwie alles so nach Hörensagen an, was zum K10 geschrieben wird von bestimmten Leuten. Da werden einfach Sachen undifferenzier betrachtet vorausgesetzt, die so einfach unwahr sind.

rkinet
10.05.2008, 14:00
...Es liegt an sehr vielen Faktoren. Die Schwächen des K10 und Fehler im Management sind nur ein Teil des Ganzen. Es ist vielmehr viel zu einsetig, das alles nur auf AMD zu schieben.

Und es geht schon wieder los: Untergangsstimmung und Miesmacherei allerorts. Irgendwie ist das ne Krankheit in diesem Forum...
Die Schwächen des K10 waren nun wirklich keine unvermeidbarer Nebeneffekt bei der Entwicklung hochkomplexer CPUs.

AMD konnte zwar sicher sein, dass Intel nach Aufkauf der Alpha-Crew auf 4-fach superskalar Design geht.
Aber zu 50% schon und zu andere 50% dann als Alternative HT inside.
Damit war der K10 aber schon auf dem Schreibtisch der Emtwickler und des AMD-Managements geschwächt vs. Intel.

Der Aufkauf der Z-RAM Lizenz Anfang 2006 zeigte, dass AMD damals noch das Problem große Caches bei letzlich hohen Kosten für beduetend hielt - http://www.computerbase.de/news/hardware/prozessoren/amd/2006/januar/amd_z-ram_caches/
Per Propus / 45nm hat man die Ignoranz vs. jenem Problem nur noch verdeutlicht.

AMD hält sich weder an die Vorgaben des Marktführers Intel, noch an absehbare Notwendigkeiten wie größere Caches oder SMT (haben IBM und Intel, VIA noch nicht).

Ingesamt macht das AMD Mangement nun seit einigen Jahren nur noch das, was die selbst wollen. Der Rest der Welt wurde ignoriert und gebaut oder gelabelt (s. BE-2350) wie es eben beim Umdrunk nach einer Golf-Tour so einem einfällt und H.Ruiz dann abnickt.
Jede Firma, die die Kunden ignoriert und die Konkurrenz nur herablassend beobachtet wird aber früher oder später scheitern. Und diese Erkenntnis ist kein des 'planetd3dnow-Forum'. Ich habe zumindest hier einen AMD x2 5000+ stehen und keinen C2D wie schon viele Andere. Ich wollte auf X3 umrüsten, aber 20 Watt IDLE verschlechtert meine TDP-Situation im typ. Office / Internet-Gebrauch zu deutlich. Und 20 Watt IDLE machen C'n'Q zur Farce, obwohl gerade C'n'Q per SOI immer noch die geringste IDLE-TDP ergibt.

AMD hat seit dem Weggang von Fred Weber offensichtlich bei der Technik gemurkst und auch keine brauchbaren Roadmaps mehr erstellt.
Aktuel kann man schon die Sektkorken knallen lassen, wenn der 45nm Istanbul wirklich kommt. Wobei sich hier schon abzeichnet, kein Opteron 1xxx mit Hexacore und damit der Desktop auch fraglich wird. Intel hat hingegen bereits den 6-fach Westmere auf der Roadmap.
AMD müßte sich nur 5min Zeit nehmen um die PowerPoint Folien für So.AM3 um den Hexacore für H2'2009 zu ergänzen und 1min für den AMD-CEO der deutlich verkündet wir leifern ihn auch für So.AM3 aus. 6 min - und AMD hätte zumindest an einer kleinen Stelle einen Lichtblick und Umsatzbringer aufgeführt.

hot
10.05.2008, 14:08
Das da einige Fehlentscheidungen gefällt worden ist doch klar. Aber ohne das Stromsparmarketing hätte man noch schlechter dargestanden. Natürlich kann man damit nicht die ganze Firma unterhalten. Und ATI verdaut grade die R600 Zeit. Das wär ein hartes Pflaster, keine Frage. Aber das ist ja nicht auf AMDs Mist gewachsen. Die Schwäche von ATI kam natürlich am ungünstigsten Zeitpunkt während der grossen CPU-Verschiebung - aber man ist ja mit RV670 und RV770 auf einem guten Weg.
Das die ATI übernahme überlebenswichtig war, wird aber an Swift deutlich.

Um nochmal zu Sun, Cray und co. zu kommen: Natürlich steigen die auf Intel um. Montreal ist nicht mehr, G3MX ist nicht mehr, warum sollten die bei AMD bleiben? Bei Intel bekommt man einen Beckton mit FBDIMMs und 4QPI-Links, das Ganze garniert mit SMT! Natürlich wechseln die zu Intel, würd ich auch tun. Es ist ja schon erstaunlich genug, dass man überhaupt solange mit der Bekanntgabe des Intel-Wechsels gewartet hat, also quasi bis zu dem Zeitpunkt, an dem offiziell klar war, dass es definitiv keinen Montreal geben wird. Da noch weiter nach Gründen zu suchen finde ich überflüssig, die liegen auf der Hand. Und: Davon kann man nicht unbedingt Rückschlüsse auf den Shanghai ziehen. Dazu unterscheiden sich die Anwendungsfelder zu stark.

rkinet
10.05.2008, 14:16
Das da einige Fehlentscheidungen gefällt worden ist doch klar.

Um nochmal zu Sun, Cray und co. zu kommen: Natürlich steigen die auf Intel um. Montreal ist nicht mehr, G3MX ist nicht mehr, warum sollten die bei AMD bleiben? Bei Intel bekommt man einen Beckton mit FBDIMMs und 4QPI-Links, das Ganze garniert mit SMT! Natürlich wechseln die zu Intel, würd ich auch tun. Es ist ja schon erstaunlich genug, dass man überhaupt solange mit der Bekanntgabe gewartet hat, also quasi bis zu dem Zeitpunkt, an dem offiziell klar war, dass es definitiv keinen Montreal geben wird.
Das AMD eine gemeinsame Socket-Entwicklung mit IBM somit kippt ist nur mit Entsetzen festzuhalten.

Intel fusioniert Itanium und x86-64, AMD und IBM separieren.
Für IBM weniger ein Problem, für AMD angesichts der Situation der Firma schon ein Sargnagel.

Die Situation ist also verfahren ohne Ende ...

wadenbeisser
10.05.2008, 15:39
Meine Fresse, wat nen Kindergarten hier.....
Rkinet tanzt wie immer auf einem ach so nötigen, größeren Cache rum ohne jemals einen beweis erbracht zu haben, das es bei AMDs konzept auch nur ansatzweise das von ihm versprochene bringt (beim Nehalem wird der L2 ja bekannter weise auf 256k zusammengestutzt, was beim Monster L2 des Core2 eher auf ein FSB bedingtes Workaround schließen läßt). Dann wird noch gejault das Serverhersteller zu Zeiten der eingestellten BA Opterons zu Konkurrenzprodukten greifen, ohne auf die B3 Opterons einzugehen. Dazu noch die eeeewige Diskussion zum Thema tatsächliche Leistungsfähigkeit, wo bei div. benches in reviews auch fast immer die selbe Software genutzt wird (oh Wunder wenn dann alle das gleiche Ergebnis haben....) und am dollsten fand ich das Kommentar
Ja klar, man kann sich alles auch zurechtlegen.....
AMD macht Verluste, weil sie die besseren Produkte haben.....
welches genauso aussagen könnte das die netburst Architektur besser war als die des K8, da Intel ja damit bessere Umsätze und Gewinne hatte. Dann wird noch angefangen bei den Grafikchips rumzuspielen und im ewigen "AMD bringt nix auf die Reihe" gegröhle wird wie immer ignoriert das beim Nehalen vor allem das nachgeholt wird was AMD schon seit Jahren hat (FSB abschaffen, integrierter Speichercontroller, natives Design, 3 stufiges Cache Design...). Alle Welt lobt die Verbesserungen in den Himmel und erwartet die selben Performancesteigerungen wie damals beim Wechsel vom K7 zum K8 ohne zu wissen wie weit Intel durch den aufgebohrten L2 bereits den Vorteilen des integrierten Speichercontrollers entgegenwirken konnte.

Das schärfste ann allem ist allerdings das ihr hier MEGA OFFTOPIC seit und ich offe das sich ein MOD dazu erbarmt das Topic mal auszumisten.
Reißt euch mal am Riemen, geht woanders spielen oder bleibt mal beim Thema...

p4z1f1st
10.05.2008, 15:49
So gaaaaaaaaanz Offtopic ist das alles ja meiner Meinung nach nicht.
Es schießt mehr über das Ziel hinaus ;)

wadenbeisser
10.05.2008, 15:59
Der ganze Ramsch hat so ziemlich 0 mit einem K11 zu tuen, sondern es wird mit derzeitigen Produkten, dem Nehalem und zu allem überfluss mit grafikproduklten um sich geschmissen....wie offtopic kann man den noch sein? Wird demnächst noch von kühen erzählt, weil deren Mist zur Stromerzeugung mittels Biomasse genutzt werden kann und damit eventuell ein K11 mal versorgt wird?

Markus Everson
10.05.2008, 18:16
Ja klar, man kann sich alles auch zurechtlegen.....

AMD macht Verluste, weil sie die besseren Produkte haben.....

Die große Verschwörung der "ich such mir die für AMD schlechtesten Benches raus"-Reviewer sorgt seit Mitte 2006 dafür, dass AMD im schlechten Licht dasteht, obwohl sie die besseren CPUs haben.(an hot gerichtet)

Wieso Fullqottelst Du meinen Post um dann offensichtlich jemand völlig anderem zu antworten?

Für eine modernde Leiche macht Intel ganz gut Umsatz mit seinen Xeons und hält doch ganz erstaunliche Marktanteile.

Das ist richtig. Aber angesichts des bisherigen Barcelona leicht zu verstehen.

Natürlich sind die Server-Einkäufer alles totale IT-Zombies ohne Ahnung und korrupt sowieso......Überhaupt sind alle korrupt, Sun und Cray, alle PC- und Serverhersteller, die gemeinen Compiler-Hersteller und Software-Schmieden, der Blödmarkt genauso wie der kleine PC-Schrauber um die Ecke, und ganz besonders die vielen korrupten PC-Käufer......

Nochmal: Warum postest Du das unter dem Fullgeqottel meines Posts?


Wer hier auch Ironie findet, darf sie auch behalten.

Ironie als Ersatz für Diskussion ist lahm.

Itanium war ein komplett neues Abenteuer. Nehalem dagegen nimmt einen leicht verbesserten, schon jetzt unzweifelhaft sehr guten (momentan besten x86)-Kern Core2 und bindet ihn sehr gut an Speicher und Peripherie bzw. für Server an andere Prozessoren im SMP an.

Sowohl der Speichercontroller als auch QPI sind neu. Ob sie sehr gut angebunden sind oder nicht zeigt erst die Praxis bzw. das real zu kaufende Produkt. Womit wir wieder bei meinem Kernargument sind: Auf dem Papier und der Ankündigung war der Itanium das beste seit geschnittenem Brot - dummerweise aber auch nur dort.

Wenn link und Speicherkontroller funktionieren, ist das ein idiotensicheres Konzept

Ebenso wie das Konzept des Barcelona funktioniert hätte wenn er mit 3 GHz gestartet wäre.
Hätte müsste sollte....-> Papier, geduldig...

Wenns nicht funktioniert, werden sie es auch nicht rausbringen.

Ebensowenig wie den PIII@1,1GHz, den PIV mit 3,8 GHz, Netburst-Xeons MP.

Du verstehst was ich meine?

Intel wird mit Nehalem den besseren Kern in einer genauso guten Speicher/Peripherie/CPU-Anbindung haben.

Ach ja, wir sind ja hier im Frei aus der Luft gegriffenen Spekulationsthread. Also darf ich auch:

Intel wird mit Nehalem den besseren Kern haben der aber durch einen unbrauchbaren Speichercontroller extrem ausgebremst wird, durch mieses QPI-Design noch schlechter Skaliert als C2D und wieder durch den Speichercontroller auch noch extrem zickig sein wird was den Speichertyp angeht.

Natürlich werden auch in Nehalem bugs schlummern, wie in jedem Prozessor. Und da Speichercontroller und Interconnect extrem sensibel auf solche Bugs reagieren wird Nehalem total floppen und erst der Nachfolger wieder brauchbar sein.

JCDenton
10.05.2008, 18:33
[...]

Ebensowenig wie den PIII@1,1GHz, den PIV mit 3,8 GHz, Netburst-Xeons MP.

Du verstehst was ich meine?

[...]


Naja, alle diese Produkte waren ja mehr oder weniger "Panikentwicklungen" als AMD Intel technologisch bei den *löten hatte - heute könnte Intel es sich bestimmt leisten den Nehalem abzusägen oder zu verschieben falls sich gravierende Probleme ergäben.

mfG

denton

p4z1f1st
10.05.2008, 18:47
Prinzipiell könnten sie das eigentlich GAR NICHT - dann würden ihnen doch wieder die Supercomputer-entwickler zu AMD weglaufen...den der K10 ist einfach nicht schlecht (wie hot das gut erfasst hat). Je mehr CPUs in das System eingebunden werden, umso mehr stinkt der Xeon ab.
Verschieben ist also nicht.
Einen 4+4 "Thread-CPU" (4reale + 4virtuelle) braucht kein Privatanwender...

raven-666
10.05.2008, 22:55
sorry für die verwirrung. nochmal anders formuliert: larsbo schreibt von wegen amd hat bessere produkte und fährt verluste ein.... irgendwo ist gestanden, amd braucht mindestens 25% marktanteil um überleben zu können. ich glaube nciht, daß intel mit dem nehalem eine technologische kröte auf den markt bringt und daß amd derzeit auch nur ansatzweise das potential hat aufzuholen.

p4z1f1st
11.05.2008, 00:36
was hat amd davon? die zahlen müssen passen...

Versteh den Wirrwarr aus 2 Halbsätzen leider nicht. Kann dir daher auch nicht wirklich antworten (da nicht mal ersichtlich ist, ob du dich auf meinen Post beziehst).

hot
11.05.2008, 09:32
Wenn AMD auch im Desktopsegment erfolgreich verkaufen will, mit hohen Margen ... dann muss sich AMD mit entsprechend leistungsgesteigerten Prozessoren dem Core 2 stellen.

Er ist entsprechend leistungsfähig. Es wird nur durch einseitige Berichterstattung nicht deutlich.

Was ist denn "tatsächliche" Leistungsfähigkeit? Das Vermeiden von WinRAR-Benches bei AMDs B2-K10-Stepping?
[...]
Lustigerweise wurde der B2 eigentlich immer ohne TLB-Bug gebencht, aber oft mit alter Software oder sehr einseitger Softwareauswahl, das ist viel eher das Problem. Die Anwendungsbenches gingen ja oftmals, aber die Spieleauswahl war oft sehr unpassend und Differenzierung der Leistungsfähigkeit findet man äußerst selten.

Und die ganzen Horrormeldungen kannst du dir auch sparen. Wie gesagt, AMD geht es schlecht, das bezweifelt niemand. Aber nur am K10 liegt das definitiv nicht.

Ja klar, man kann sich alles auch zurechtlegen.....

AMD macht Verluste, weil sie die besseren Produkte haben.....
[...]
AMD macht Verluste, trotz, dass sie ein konkurrenzfähiges Produkt haben. Bleib mal auf dem Teppich, sicher ist ein 2,5GHz getakteter K10 nicht unbedingt ein Ersatz für einen 9770, aber das behauptet hier auch niemand. Der K10 wird nur oft viel schlechter gemacht als er tatsächlich ist.

Und Vergleiche gegen Nehalem darf man sich bitteschön schenken, das weiß heute einfach noch niemand. Intel tauscht den schnellen Riesencache gegen einen schnellen Winzling und einen langsamen Riesencache aus, ich glaub das wird gerne mal verdrängt... Wie schnell Nehalem vs. Shanghai ist kann man aufgrund fehlender genauer Infos einfach nicht abschätzen.
Und von Supercomputerherstellern Rückschlüsse zu ziehen ist einfach bescheuert. Intel bringt 6 und 8-Kerner, AMD nicht. Wo soll dann ein Supercomputerhersteller oder Hersteller grosser Server denn bitteschön hingehen?

Opteron
11.05.2008, 10:22
Jungs nochmal zum mitlesen ...

Hier gehts um den K11. Das ist was andres als der K10 ...
Alle Mutmaßungen, Spekulationen, Meinungen, Gedanken, Kaffeesatzleserei, etc. pp über den K10 haben hier nichts zu suchen.

Postet das bitte im K10 Thread:
http://www.planet3dnow.de/vbulletin/showthread.php?p=3599765#post3599765

Ansonsten bitte ich den Mod, dass hier dicht gemacht wird, hat ja sonst keinen Zweck.

Vielen Dank

Alex

Opteron
13.11.2008, 18:06
Soo es gab mal wieder neue Codenames:

http://www.bilder-space.de/upload/13.11lfiqzWZIYk2NpkR.jpg

Die CPUs ab 2011 sind Bulldozer Cores, Ontario ist ein Bobcat Core.

Liano ist inkl. GPU also ein Mitglied der Fusion Familie.

< Diskussion zur K10 Familie, also bis 2010 bitte im K10 Thread > ;-)

ciao

Alex

Emploi
13.11.2008, 18:18
Was ist APU..? Gesellschaftlich gesehen muss ich da immer an einen Affen denken.

Dienstlich gesehen an ein Hilfstriebwerk (auxiliary power unit (http://de.wikipedia.org/wiki/Hilfstriebwerk)), kann ich mir aber bei AMD gar nicht vorstellen das die so Etwas (weder einen Affen noch ein Hilfstriebwerk) brauchen. Oder meinen die eine APU in Form der AMD Fusion Geschichte? Dann müsste ja Ontario auch ein Mitglied der Fusion Familie sein. *noahnung*

Opteron
13.11.2008, 18:25
Was ist APU..? Gesellschaftlich gesehen muss ich da immer an einen Affen denken.
APU ist der gleiche Chip wie die GPU. Der Unterschied ist der, dass die GPU die Grafik aussgibt, währenddessen der Chip bei der APU irgendwelche Berechnungen beschleunigt (accelerated), andres Wort dafür: GPGPU.

Prinzipiell hast Du recht, der Ontario ist dann auch ein Fusion, nur eben mit Bobcat CPU.

ciao

Alex

Dragonfly
13.11.2008, 18:41
Gibt es schon Informationen zu Caspian? Handelt es sich hierbei um die erste mobile K10 CPU oder ist das nur ein Die-Shrink des Griffin?

Opteron
13.11.2008, 18:51
Gibt es schon Informationen zu Caspian? Handelt es sich hierbei um die erste mobile K10 CPU oder ist das nur ein Die-Shrink des Griffin?
Ist vor 2011 -> Also kein Bulldozer -> flascher Thread.

Frag bitte im K10 Thread nochmal, sonst gibt das Chaos pur (siehe oben).

Sorry, aber geht nicht anders.

Alex

Green_Ranger
13.11.2008, 21:47
Warum heißt der Prozessor eigendlich K12 und nicht K11?

Ich bin leicht verwirrt, da
K10 -> Phenom I
K10.5 -> Phenom II
K11 -> ????
K12 -> Bulldozer

Was ist aus dem K11 geworden, aus kostengründen übersprungen?

Crashtest
13.11.2008, 22:20
K11 : sind die neuen S1 CPUs - Puma Plattform also Athlon x2-qp ; Sempron SI, Turion ZM und RM ; siehe http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/43373.pdf

wobei die eigentlich nicht "K11" verdienen : sind aufgemotzte K8 mit einigen Stromfeatures des K10 aber ohne SSSE3, SSE4a, SSE5, movbe, popcnt ....

Opteron
13.11.2008, 23:04
... der 32nm Prozeß soll schon Mitte 2010 fertig sein.

http://www.bilder-space.de/upload/14.11XjvOSB8EWjIxNFF.jpg

Man beachte die Info links unten im Eck... sieht dann eigentlich gut für einen Bulldozer-Opteron gegen Ende 2010 aus.

ciao

Alex

P.S: Hab das Posting editiert, fall sich jemand wundern sollte :)

Bayushi
14.11.2008, 17:51
Nach der Folie will ja AMD 3 32nm Verfahren einsetzen? Ich dachte das sie bei 32nm auf SOI verzzichten wollen. Naja wenn SOI in 32nm was bringt solls mir recht sein.....

laser114
15.11.2008, 14:45
SOI für die Prozessoren (und die APUs), die Bulk-Verfahren sind dann für andere Chips geplant (Grafik, Chipsätze und natürlich Auftragsfertigung für andere Unternehmen), die ja The Foundry Company dann anstrebt. Fab 36 wird nur SOI fertigen, Fab 38 & Fab 4X werden beides machen (SOI & Bulk).

rkinet
15.11.2008, 15:17
SOI für die Prozessoren (und die APUs), die Bulk-Verfahren sind dann für andere Chips geplant (Grafik, Chipsätze und natürlich Auftragsfertigung für andere Unternehmen), ...
SOI bietet schon Vorteile.

Allerdings muss AMD nun noch länger die 'Fusion' hinaus schieben und alternativ BGA-Varianten von CPUs für den boomenden Budget-low Power Bereich nachschieben.

Bei der Yukon-Plattform wird jetzt 1* CPU in SOI-65nm, dazu die alte 690E Northbridge und noch eine Southbridge benötigt. Aber Geld dafür gibts wenig.
Schon nvidia versuchte per 1-Chip Chipsatz Kosten zu sparen bzw. Kostenvorteile für Mainboardhersteller zu bewirken.
Ein kombinierter Chip von AMD wäre extrem günstiger im Vergleich zum 'Atom'-Design welches Intel eh Mitte 2009 auf 2 Chips reduziert.

Machbar, wenn AMD CPU & GPU für Bulk entwickelt hätte. Da hätte vielleicht sogar 55nm bei TMSC gereicht für so eine Single-Core Lösung.

N1truX
16.11.2008, 08:21
... der 32nm Prozeß soll schon Mitte 2010 fertig sein.

http://www.bilder-space.de/upload/14.11XjvOSB8EWjIxNFF.jpg

Man beachte die Info links unten im Eck... sieht dann eigentlich gut für einen Bulldozer-Opteron gegen Ende 2010 aus.
Hatte zu 32nm hier (http://www.ati-forum.de/allgemein/news-archiv/p5248-neue-infos-über-den-k10-5-und-32nm-bei-amd-new-info´s-about-k10-5-and-32nm-by-amd/#post5248) auch schon mal was geschrieben und die Quelle kommt direkt aus der AMD Entwicklungsabteilung ;) Also kein Marketing BlaBla^^

Opteron
16.11.2008, 11:15
Also kein Marketing BlaBla^^ Naja, im Artikel schriebst Du von Testchips "in wenigen Monaten".
Das wird jetzt laut dem Bildchen aber eher Q4/09 frühestens, also 1 Jahr später, und selbst das ist nur bulk ...
Wenn ich mich recht erinenre, dann wollte AMD schon bei 45nm zu Intel aufschließen.

Hoffen wir, dass es diesmal klappt, ist auf alle Fäle günstiger, da man die Nasslitographie schon beherrscht.

ciao

Alex

larsbo
17.11.2008, 08:40
Soo es gab mal wieder neue Codenames:

http://www.bilder-space.de/upload/13.11lfiqzWZIYk2NpkR.jpg

Die CPUs ab 2011 sind Bulldozer Cores,

Hab mir nicht die Mühe gemacht, Transcripts zu lesen. Ist das sicher, dass die 2011er Bulldozer sind? In der ursprünglichen Fassung, wie Bulldozer sein sollte?

hot
17.11.2008, 09:45
Na da bin ich mal gespannt: Wie war denn die ursprüngliche Form des BD? Bisher ist das nur ein Begriff, nichts weiter. MMn ist das eine Weiterentwicklung des K10, vllt. sogar etwas entschlackt. Orochi wird sicherlich mit den 8-Kern-Opterons Ende 2010 identisch sein, er hat ja auch keine APU, das muss ein externer Grafikchip besorgen.

Opteron
17.11.2008, 10:19
Hab mir nicht die Mühe gemacht, Transcripts zu lesen. Ist das sicher, dass die 2011er Bulldozer sind? In der ursprünglichen Fassung, wie Bulldozer sein sollte?
Öhm kennst Du die ursprüngliche Fassung ? Ich kenn bisher nur den Namen :)
Und ja, der fiel bei der Präsentation. Wenn ich nichts im Konjunktiv schreibe, dann stimmt das auch :)

Die CPUs ab 2011 sind Bulldozer Cores, Ontario ist ein Bobcat Core.
@hot:
Jo entweder 8 Kerne, oder dickere 4 mit SMT.
Das einzigste Fuselstücken Info, kam bisher vom Inquirer, der schrieb mal, dass Bulldozer zu groß in 45nm werden würde.

ciao

Alex

Bayushi
17.11.2008, 10:27
Na da bin ich mal gespannt: Wie war denn die ursprüngliche Form des BD? Bisher ist das nur ein Begriff, nichts weiter. MMn ist das eine Weiterentwicklung des K10, vllt. sogar etwas entschlackt. Orochi wird sicherlich mit den 8-Kern-Opterons Ende 2010 identisch sein, er hat ja auch keine APU, das muss ein externer Grafikchip besorgen.

Wie genau der BD aussehen wird kann dir keiner sagen, nur das es eine neue Architektur werden soll und eben keine Überarbeitung.
Zu Orochi: Ich sehe in 2011 noch keine Sinn in 8 Core Prozessoren für Desktop, sollange sich bei den Softwareunternehmn sich da nix ändert im einbinden von Multicore. Mit dem wagen >4 lässt sich AMD das aber noch offen. Wenn 8 Core bisdahin sinnvoll ist werden sie den wohl auch brigen, wenn nicht dann nicht. Ich seh da eher 6 Cores als max, lass mich aber gerne eines besseren beleren (Softwareentwickler anschau).

Der Llano wird wohl den nach meiner Dragon-Platform nächstes Jahr das nächste System. Ich habe im Fusion Spekulations Thread schon angedeutet das ich im Sinne der "Balanced Plattform" mit Spiele APUs vorstellen kann. Das macht aus meiner Sicht den PC als Spieleplattform auch für Ottonormal Kunden interessanter und vorallem auch zugänglicher. Bei einem guten Bundel von CPU und GPU müsster sich der Kunde nur noch entscheiden wieviel Spieleleistung er braucht und nicht mehr den Kopf über "GHz von CPU Kern zu Leistung von GPU damit der eine das ander nicht ausbremmst" zerbrechen.

Woerns
17.11.2008, 10:59
@laser114
Fab 36 wird nur SOI fertigen, Fab 38 & Fab 4X werden beides machen (SOI & Bulk).

Hast Du mehr zu dieser Info, z.B. einen Link?
Ich habe bisher noch nichts darüber gahört, dass in FAB38 auch SOI implementiert wird und hätte zunächst nur bulk vermutet, bzw. zusätzlich auch noch den HKMG Prozess, wenn er soweit ist.
MfG

hot
17.11.2008, 15:15
SOI und HKMGs sind Optionen, die nach Bedarf zum Einsatz kommen. Bei 45nm gibts aber wohl keine HKMG, auch bei 32nm gibts HKMG nur für High-End und Stromsparprozesse. Die TFC wird sich offen halten, wo welche Anlangen hingebaut werden, ich bezweifle, dass das jetzt schon feststeht. Es ist aber klar, dass die Fab36 voll auf 45nm umgestellt werden soll bis Mitte 2009, da bis dahin keine anderen Produkte als AMD-CPUs zu erwarten sind, wird sie also logischerweise voll 45nm SOI fertigen müssen. Bei der Fab38 könnten dann die ersten Aufträge abgearbeitet werden, die kein SOI erfordern.

Bis Ende 2010 ist noch ne Weile. Bis dahin ist MT etabliert und 4 Kerne sind absoluter Standard. Wieso soll es dann nicht zu 8 Kernen kommen? Halte ich für sehr wahrscheinlich. Vllt. gibts ja sogar 8 Kerne mit SMT ;). Obwohl AMD ja noch nie was von SMT gehalten hat... Ich bin halt nur der Meinung, dass es keine komplexeren Kerne als die jetzigen mehr geben wird sondern eher schlankere, es steht jedem frei eine andere Meinung zu haben ;).

Woerns
17.11.2008, 15:47
SOI und HKMGs sind Optionen, die nach Bedarf zum Einsatz kommen.

So sehe ich das im Prinzip auch. Der erste Kunde der Foundry ist ja AMD selbst. Insofern liegt es auf der Hand, dass auch in FAB38 ein SOI Prozess installiert wird. Mich interessiert, ob es dazu schon Aussagen seitens AMD gegeben hat, oder wenigstens "Gemunkel" in News Seiten jenseits von Fudzilla & Co. MfG

Opteron
17.11.2008, 16:24
So sehe ich das im Prinzip auch. Der erste Kunde der Foundry ist ja AMD selbst. Insofern liegt es auf der Hand, dass auch in FAB38 ein SOI Prozess installiert wird. Ja, aber die haben auch der Präsentation gesagt, dass sie in Fab 38 erstmal ATi GPUs und Chipsätze fertigen wollen, bulk halt ...
Les Dir vielleicht mal den Transscript durch bzw. durchforste nach FAB38. Vielleicht haben die da auch gesagt, ob es nur bulk geben wird, oder nicht.


ciao

Alex

laser114
17.11.2008, 17:33
So sehe ich das im Prinzip auch. Der erste Kunde der Foundry ist ja AMD selbst. Insofern liegt es auf der Hand, dass auch in FAB38 ein SOI Prozess installiert wird. Mich interessiert, ob es dazu schon Aussagen seitens AMD gegeben hat, oder wenigstens "Gemunkel" in News Seiten jenseits von Fudzilla & Co. MfG

Steht exakt so wie ich es oben schrieb in der Präsentation von Grose jetzt am Analyst Day.

Bayushi
17.11.2008, 18:11
Bis Ende 2010 ist noch ne Weile. Bis dahin ist MT etabliert und 4 Kerne sind absoluter Standard. Wieso soll es dann nicht zu 8 Kernen kommen? Halte ich für sehr wahrscheinlich. Vllt. gibts ja sogar 8 Kerne mit SMT . Obwohl AMD ja noch nie was von SMT gehalten hat... Ich bin halt nur der Meinung, dass es keine komplexeren Kerne als die jetzigen mehr geben wird sondern eher schlankere, es steht jedem frei eine andere Meinung zu haben .

Ich seh es das mit den Kernen noch nich so prositiv... aber wir werden sehn. Wünsches wert wäre es alle mal das die Software da endlich den sprung zum Multi Core macht, denn vermeiden lässt sich das eh nicht. Die Leistungzuwachs durch Kernoptimierung ist zwar da, aber MC bring einfach mehr für weniger aufwand auf Hardware seite.

dekaisi
17.11.2008, 19:59
Ja, aber die haben auch der Präsentation gesagt, dass sie in Fab 38 erstmal ATi GPUs und Chipsätze fertigen wollen, bulk halt ...
Les Dir vielleicht mal den Transscript durch bzw. durchforste nach FAB38. Vielleicht haben die da auch gesagt, ob es nur bulk geben wird, oder nicht.



Ja aber so einfach ist das nicht.
erstmal muss man einen Bulk Prozess haben, dann evtl. Tools dafür kaufen und Rampen.
Schon dabei wird bestimmt min 1Jahr flöten gehen.

Und es wird in Sinne Foundry bestimmt nicht nur Bulk sein, man muss ja haufen Produkte Produzieren können um rentable zu sein.

Und dann ist da noch TSMC (http://www.tsmc.com/english/default.htm)
Die ja wahnsinne Kosten Investieren um nicht Produktion zu verlieren, wobei da fällt mir ein :D Probleme Nvidia und TSMC (http://www.gamestar.de/hardware/news/vermischtes/1949104/nvidia.html)

Opteron
17.11.2008, 20:05
Ja aber so einfach ist das nicht.
erstmal muss man einen Bulk Prozess haben, dann evtl. Tools dafür kaufen und Rampen.
Schon dabei wird bestimmt min 1Jahr flöten gehen.
Jo, deswegen wird die FAB38 ja jetzt ausgerüstet und dann im H2/09 online gehen, was andres hab ich auch nicht behauptet :)
Und es wird in Sinne Foundry bestimmt nicht nur Bulk sein, man muss ja haufen Produkte Produzieren können um rentable zu sein.
Hmm wieso nicht ? Bulk in der 38, SOI in der 36 würde doch reichen.
Aber egal, laut Laser wird die 38er eh ne Kombifab.

ciao

Alex

Woerns
17.11.2008, 20:33
@laser114
@Opteron
Danke für die Hinweise.
In der Präsentation von Doug Grose kann ich die Info leider nicht finden. http://www.amd.com/us-en/assets/content_type/DownloadableAssets/DougGroseAMD2008AnalystDay11-13-08.pdf

Die Folien 3 und 4 gehen auf das Jetzt und Später der FABs 36 und 38 ein, aber beinhalten eben nicht zwingend die Aussage, dass in FAB38 auch SOI implementiert wird.
Hat er das vielleicht mündlich hinzugefügt?
MfG

PS:
In dieser Foundry Präsentation http://www.amd.com/us-en/assets/content_type/DownloadableAssets/TheFoundryCompanyAMD2008AnalystDayBreakout11-13-08.pdf steht es auch nicht drin, und mehr hat Doug afaik nicht vorgetragen.

laser114
17.11.2008, 21:17
Die Folien 3 und 4 gehen auf das Jetzt und Später der FABs 36 und 38 ein, aber beinhalten eben nicht zwingend die Aussage, dass in FAB38 auch SOI implementiert wird.
Hat er das vielleicht mündlich hinzugefügt?

Hmm, das kann ich dir jetzt auch nicht sagen. Ich hatte das mit Fab 38 so auch irgendwo mitbekommen, und die Folie 4 hatte das für mich bestätigt. Mit 100%iger Sicherheit kann ich jetzt auch nicht für garantieren. *noahnung*
Am besten hier meldet sich noch mal jemand der den Webcast gesehen hat.

pipin
17.11.2008, 23:00
@laser114
@Opteron
Danke für die Hinweise.
In der Präsentation von Doug Grose kann ich die Info leider nicht finden. http://www.amd.com/us-en/assets/content_type/DownloadableAssets/DougGroseAMD2008AnalystDay11-13-08.pdf

Die Folien 3 und 4 gehen auf das Jetzt und Später der FABs 36 und 38 ein, aber beinhalten eben nicht zwingend die Aussage, dass in FAB38 auch SOI implementiert wird.
Hat er das vielleicht mündlich hinzugefügt?
MfG

PS:
In dieser Foundry Präsentation http://www.amd.com/us-en/assets/content_type/DownloadableAssets/TheFoundryCompanyAMD2008AnalystDayBreakout11-13-08.pdf steht es auch nicht drin, und mehr hat Doug afaik nicht vorgetragen.



Hier bitte.

Edit: Wobei ich grad sehe, die Folie ist auch nicht eindeutig.

Bobo_Oberon
18.11.2008, 07:32
Hier bitte.

Edit: Wobei ich grad sehe, die Folie ist auch nicht eindeutig. Nun ja ... mit der Nachbarfolie ists aber schon recht eindeutig: http://www.testticker.de/files/2008/images/20081114_amd_analyst/amd_analyst-day_2008_05.JPG Quelle (http://www.pc-professionell.de/news/2008/11/14/amd__quadcore_notebooks_ab_2010__22_nm_ab_2011) Ich interpretiere das so, dass die aktuelle Fab 36 nur SOI-Technik verwenden wird ... auch bis zur 32 nm-Technik.

Die Fab 38 hingegen wird sowohl Bulk-, als auch SOI (http://www.orthy.de/index.php?option=com_glossary&Itemid=55&func=view&id=58)-Halbleiter fertigen. Die Fab 4xx in New York am Standort Luther Forest scheint auch für Bulk-, als auch SOI-Technik ausgelegt zu werden. Die Fab 4xx soll 22 nm-Technik zukünftig beherrschen.

MFG Bobo(2008 )

Woerns
18.11.2008, 09:42
Die Folie 3 beschreibt den derzeitigen Stand vor Asset-Smart. Die Folie 4 sagt aus, was in der Zuklunft geplant ist:

http://www.testticker.de/files/2008/images/20081114_amd_analyst/amd_analyst-day_2008_06.JPG

Die Aussage links interpretiere ich so, dass CPU und APU innerhalb der nächsten 12-36 Monate in 65/45/32nm SOI und bulk hergestellt und auf FAB36, FAB38 und FAB4x verteilt werden. Nichts Genaues zu FAB38 also.

Wer belastbare Infos rauskriegt, bitte posten. Ich wäre sehr daran interessiert. MfG

PS: Nebenbei interessant, dass Chartered komplett aus dem Rennen ist.

rkinet
18.11.2008, 11:54
Die Aussage links interpretiere ich so, dass CPU und APU innerhalb der nächsten 12-36 Monate in 65/45/32nm SOI und bulk hergestellt und auf FAB36, FAB38 und FAB4x verteilt werden. Nichts Genaues zu FAB38 also.
Die Fab36 dürfte per 45nm locker ab Mitte 2009 den CPU Bedarf von AMD abdecken.

Die Fab38 kann daher eher im Umfeld Bulk Umsätze generieren.

Ich tippe mal, dass AMD /Foundary zukünftig massiv je nach Auftragslage die Fabs nutzen wird.

Die AMD-Kernprodukte reichen ja nicht aus um alle Fabs auszulasten.

hot
18.11.2008, 15:09
Da wär ich vorsichtig. Das kommt immer auf die Nachfrage an. AMD hat immer eher daran gelitten, zuwenig Fertigungskapazität zu haben.

S.I.
18.11.2008, 16:52
hallo rkinet!

Wenn ich das richtig interpretiere, so könnte es also sein, das Dresden sehr bald genug Deneb's
produziert - was zu hoffen ist - um sehr bald die Dinger auf den Markt zu kippen?
Man munkelt ja, das die tatsächlich schon fleißig produzieren...und testen...

Zu hoffen und wünschen wäre es ja!

-Ebenso, das die ersten doch schon zum Weihnachtsgeschäft erhältlich sein werden (?)
-und - das sie in den vorhandenen AM2+ Boards, zum. Gigabyte und Asus ohne weiteres laufen (spätestens mit Bios-Update- obwohl ich wünschen würde, die würden den erweiterten L3 Cache auch so erkennen!!)

Mit freundlichen Grüßen

m.r.

Bobo_Oberon
18.11.2008, 17:46
... PS: Nebenbei interessant, dass Chartered komplett aus dem Rennen ist. Ja .. in der Tat, das dachte ich mir auch schon ...

Und das, obwohl sie AMDs Fertigungstechnik APM lizensiert hatten

MFG Bobo(2008 )

rkinet
18.11.2008, 17:51
hallo rkinet!

Wenn ich das richtig interpretiere, so könnte es also sein, das Dresden sehr bald genug Deneb's
produziert - was zu hoffen ist - um sehr bald die Dinger auf den Markt zu kippen?
Man munkelt ja, das die tatsächlich schon fleißig produzieren...und testen... .
AMD wird wie geplant zunächst die Opteron-Kunden beliefern und dann leicht auf Halde fertigen um Anf. Januar den Desktop zu versorgen.

Danach geht es Schlag auf Schlag mit 45nm CPUs.

Lt. http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1226599272 kann man kaum erkennen ob AMD beim K10 noch Verbesserungen bringt oder einfach nur die GPU integriert.

Ab 2009 haben wir Quadcore überall im Desktop, aber 2010 dann im Mobilbereich.
Da ist die Frage nach 'K12' bzw. Optimierungen bei Single-Thread müssig, wobei Intel per Nahalem zumindest im 2*2 Mainstream und low power Vorteile hat.
Ggf. auch ein HT-Single-Core in der Nehalem-Klasse.

Aber die aktuelle Roadmap von AMD läßt 'Abschied vom K12' vermuten und eher Hoffnung auf gute SOI-Fertigung mit hohen Taktraten.
Wenn SOI-32nm die fast 4 GHz in Serien knacken könnte, dann wäre K12 nur noch marginal interessant und IPC-Nachteile vs. Nehalem (der taktet nur normal wie auch der bisherige Core2) in der Praxis vernachlässigbar.

Sorgen macht mit der Mobilmarkt, hier könnte verstärkt SMT-Technik von Intel low power bei guter Performance mischen, was ein nativer K10 Quad nicht kontern könnte.

Und Akkulaufzeit bei guter Performance bringt nun einmal viel Kohle.

S.I.
18.11.2008, 18:04
Danke für die Antwort!

Es müsste aber noch ne ganze Zeit eigentlich doch mit 3 GHz rum reichen bei 4 Kernen, insbesondere, da die aufwendigsten Operationen ja zu 80%+ von der/den GPU ('s) *²übernommen werden, denk ich mal...oder siehst Du das anders?
*² bei Grafikoperationen

Mit freundlichen Grüßen

m.r.

TNT
18.11.2008, 18:09
...Aber die aktuelle Roadmap von AMD läßt 'Abschied vom K12' vermuten...

Sorgen macht mit der Mobilmarkt, hier könnte verstärkt SMT-Technik von Intel low power bei guter Performance mischen, was ein nativer K10 Quad nicht kontern könnte.

Und Akkulaufzeit bei guter Performance bringt nun einmal viel Kohle.

Ich will nicht hoffen, dass der K12 engemottet wurde - entwicklen nun alle bei AMD nur noch Multi... und nicht mehr Core..!?
Wo ist die Abteilung 'hin'?

Sicherlich ist es richtig, dass irgendwann der IPC Nachteil nicht mehr so stark wiegt (aber wie lange muss man noch warten bis es mit der 'Software' klappt?).

Aber man kann auch nicht ewig 'einfach' weitere Kerne anflanschen - denn dann laufen TDP und Fertigungskosten aus dem Ruder....
Man stelle sich vor AMD muesste immer 1-2 Kerne mehr als Intel einsetzen um in etwa pari zusein - kein dauerhaft gute Geschaeftsgrundlage (dabei lassen wir Intels Fertigungskostenvorteil mal ganz ausser acht).

Opteron
18.11.2008, 19:57
Ja .. in der Tat, das dachte ich mir auch schon ...

Und das, obwohl sie AMDs Fertigungstechnik APM lizensiert hatten
Chartered sucht angeblich grad nen Käufer ..

http://www.digitimes.com/news/a20081113PD206.html

ciao

Alex

Woerns
19.11.2008, 09:55
Chartered könnte ja auch mal in Dubai anfragen. ;)
Sieht so aus, als ob man in Singapur zu weit weg ist vom Geschehen in Taiwan, um als Foundry überleben zu können. SMIC überlebt nur, weil China es subventioniert. Eigentlich bleibt da nur IBM als größere Foundry übrig, die jenseits von Taiwan Gewinne erwirtschaftet.

Chartered stand übrigens mit dem Rücken zur Wand, als es mit AMD über die CPU-Herstellung handelseinig wurde. AMD wird in etwa gesagt haben, dass es die Rechnung nicht komplett in Geld bezahlen kann, aber dafür APM zu bieten hat. Chartered brauchte den Auftrag und musste, um weiterhin eine gute Figur machen zu können, in das Loblied um APM mit einstimmen. Ich bezweifele, dass Chartered APM überhaupt noch einsetzt, wo es nicht mehr für AMD produziert. MfG

Creskra
19.11.2008, 17:58
Was heißt nicht mehr produziert... man hat doch schon öfters gesehen das die immernoch Verkauften 6400+ in 90nm Produktionsdaten haben die es eigentlich nicht mehr geben dürfte da AMD selbst kein 90nm mehr produziert. Die werden immer noch bei Chartered gefertigt.

Woerns
19.11.2008, 22:01
Das Produktionsdatum gibt vielleicht nur den Tag an, an dem der Dice in Malaysia ins Package gekommen ist. Das kann viel später sein, als er in Dresden vom Band gelaufen ist. MfG
.
EDIT :
.
@Chartered
In einer älteren News hieß es noch, dass der AMD-Chartered Deal unter ATIC bestehen bleibt.
http://www.pcmag.com/article2/0,2817,2331941,00.asp
"...And what of Chartered Semiconductor? In 2004, AMD signed a deal with Chartered for additional capacity. That deal remains in place, according to AMD spokesman Drew Prairie. "They have been augmenting our existing capacity and we will still have limited capabilities to deploy them as needed moving forward," Prairie said in an email following the conference call...."
MfG

Opteron
20.11.2008, 00:09
Komisch, Bulldozer fehlt auf der Server Roadmap:
http://enthusiast.hardocp.com/images/articles/1226686077QpvgXSeTBC_1_18_l.jpg

Sonst startet AMD doch immer damit neue CPUs als ServerCPUs einzuführen ...
und was soll der (*) da ... "planned product launch dates" ... da ist nur alles schwarz und nix "geplanned" ...

ciao

Alex

Malajo
20.11.2008, 01:56
Das Produktionsdatum gibt vielleicht nur den Tag an, an dem der Dice in Malaysia ins Package gekommen ist. Das kann viel später sein, als er in Dresden vom Band gelaufen ist. MfG

es kommen weiterhin 90nm DH von Chartered

rkinet
20.11.2008, 09:28
Komisch, Bulldozer fehlt auf der Server Roadmap:
...
Sonst startet AMD doch immer damit neue CPUs als ServerCPUs einzuführen ...
und was soll der (*) da ... "planned product launch dates" ... da ist nur alles schwarz und nix "geplanned" ...
Außer 'many Cores' steht da nichts, was für K12 verwendbar wäre.

Realistisch ist, dass AMD den K12 gestoppt hat und voll auf Fertigungsoptimierungen setzt.
10-20% mehr IPC lassen sich durch 20-30% höhere Taktraten ersetzen. IBM packt schon höhere Werte, da könnte AMD sich statt auf den K12 einfach auf Speed Path Detektion beim K10 konzentrieren, was ggf. effektiver als ein neuer Core ist.

Höhere Anzahl an Cores, ergänzt um höhere Taktraten besonders bei unsymmetrischer Belastung, also geringere Gesamt TDP und DIE-Temperatur.
Wäre billiger zu haben und ein hochoptimierter K10 ist auch im Mobilbereich verwendbar.

S.I.
20.11.2008, 09:31
Hi,

Was denkt ihr, was wird sich AMD mit dem Deneb trauen... Meint ihr, das die auch gleich neben dem angekündigten 2,8 & 3,0 Deneb für AM2+ nen 3,2 und 3,4 oder so rausbringen?
Irgentwie ist ja schon erstaunlich wie sehr die sich zurückhalten, was die Taktbarkeit betrifft, finde ich.
Also wenn der jetzige 9850 leicht statt 2,5 @ 2,7 Ghz macht und der 9950 statt 2,6 leicht 3,0 GHz macht... und das mit den Standardlüftern, denk ich das die bisher übervorsichtig waren (Naja die Dinger müssen auch in einem Bürogebäude in Brasilien bei 43°C laufen, ich weis...)
Man (AMD) könnte ja die Kühlung noch verbessern - wie schon mal geschrieben mit vom Werk her einfacher kleiner Wakü um den Prozessor....
Also ich würde mal richtig Gas geben, wenn ich da was zu sagen hätte, samt ausgibigen Testläuften auch bei 43°C Raumtemp-Umgebung ...
und dann einen nach dem anderen auf den Markt werfen:
Dezember 08 die 2,8 + 3GHz, dann im Januar gleich 3,2 und 3,4 Ghz mit Wakü und gleich noch nen FX hinterher mit Wakü und 3,5 GHz oder so...
So wie es ja gemunkelt wird ist die Taktbarkeit höher, als man dachte...:] bei Denebs
Ebenso würd ich Grakas auf den Markt schütten in allen erdenklichen Konfigurationen
Wenn nicht jetzt, wann denn dann, auf was wartet AMD denn?

Grüße
m.r.

Opteron
20.11.2008, 10:12
Außer 'many Cores' steht da nichts, was für K12 verwendbar wäre.
Ich seh nochnichtmal "many Cores" ... wie besagt tote Hose, schwarzer Bildschirm ...
Realistisch ist, dass AMD den K12 gestoppt hat und voll auf Fertigungsoptimierungen setzt. Naja, was würde das bringen. Fertigungsoptimierungen hat Intel auch ... ich denke mal "positiver" und behaupte einfach mal, dass AMD mit der Bulldozerentwicklung noch nicht angefangen hat ;D*lol**suspect*

@SystemIntegrator:
Deneb ist K10 -> falscher Thread :)
Wenn in der Zwischenzeit keiner antwortet, dann kopier Deinen Beitrag einfach in den K10 Thread, und lösch die Version hier.

ciao

Alex

TNT
20.11.2008, 10:24
...Ich seh nochnichtmal "many Cores" ... wie besagt tote Hose, schwarzer Bildschirm ...
Naja, was würde das bringen. Fertigungsoptimierungen hat Intel auch ... ich denke mal "positiver" und behaupte einfach mal, dass AMD mit der Bulldozerentwicklung noch nicht angefangen hat ;D*lol**suspect*...


Ja, dann gute Nacht!
Nicht angefangen - wie schnell kann man denn so ein Design aus dem Boden stampfen?

Wer und wo werden denn die 'Cores' von AMD designet?
Hat man da geschlafen? Oder verrannt?

Klar, das sind erst einmal Vermutungen - aber es ist schon recht still um AMDs naechstes 'Core' Design geworden...

S.I.
20.11.2008, 10:30
hi Alex,

Der Deneb ist doch ein naher Verwandter des Bulldozers, also sei nich allzustreng zu den Beiden...
Und ob der K12 kommt, ist ja auch nur ne Planung, bzw. Papierentwurf, oder?

L.G.
Micha

Opteron
20.11.2008, 10:50
Der Deneb ist doch ein naher Verwandter des Bulldozers, also sei nich allzustreng zu den Beiden...
Und ob der K12 kommt, ist ja auch nur ne Planung, bzw. Papierentwurf, oder?

Also ich hatte den Thread Titel so gemeint, dass K12 == Bulldozer ist.
Wie die Kerne ausschauen werden, weiss im Moment keiner, aber laut den einzigen Informationen der allerersten "Analystenshow", soll das Teil komplett neu sei, also nichts mehr mit K8/K10 zu tun haben.

Deswegen die strikte Trennung. Mag sein, dass sich später herausstellt, dass das Bulldozer doch nur ein aufgebrezelter K10 ist, aber nachdem es hier eh schon nen K10 Thread gibt, und Deneb definitiv ein K10 ist, bist Du mit Deneb in jedem Fall besser im K10 Thread aufgehoben :)

@TNT:
Hab das geschrieben, da ich mich an nen Kommentar von Bobo erinnerte, beim K10 kam nach der Präsentation letztes Jahr mehr oder weniger raus, dass AMD mit dessen Entwicklung ziemlich spät begonnen hatte. (Lange) zuvor hatten wir uns quasi hier im Forum die Köpfe heiß geredet, obwohl noch nicht mal AMD wusste, was da alles rein kommt :)

ciao

Alex

hot
20.11.2008, 15:59
Da möcht ich auch garnicht wissen, wieviele Designs letztendlich in der Tonne landen. Ich denke, dass die Designentwicklung heutzutage schon deutlich schneller geht, als noch vor Jahren. Allerdings wird auch die Vorhersagerei immer schwieriger, was denn die Konkurrenz jetzt schönes basteln könnte und/oder was gebraucht wird in 2-4 Jahren. Der BD (falls man das so nennen möchte) ist sicherlich schon in Entwicklung, will heißen, man tastet sich an das Optimum ran, nachdem man zig Elemente reingenommen und wieder rausgekegelt hat - mal schauen was da übrigbleibt. Eins ist aber klar: Sollte das Ergebnis nicht ansprechend sein, also die Performance nicht den Erwartungen entsprechen, gibts wieder einen 3x3 Aufguss á la K7-K10. Beim K6 war noch sehr deutlich, wo die Schwächen liegen, und wo man richtig zuschlagen muss beim Deisgn, das ist heute deutlich schwieriger, man weiss halt nicht, was man dabei rauskriegt. Man muss ja auch immer die Wirtschaftlichkeit mit beachten bei sowas. In der Hinsicht war sogar damals der K7 ein Risiko. Da hat auch noch keiner auch nur entfernt geahnt, dass der mal bis 2,3GHz hochgehen würde ;). Das ist fast das 5-Fache des Anfangstaktes des K7.
MMn wird in 2011, spätestens aber 2012, 2013 eher weniger IPC pro Kern gebraucht, aber dafür mehr Kerne und SMT gepaart mit etwas mehr Takt (3,5-4,5GHz). Intel hat ja schon heute damit angefangen, siehe Atom und Nehalem. Der Nehalem hat eine deutliche Cache-Schlankheitskur hinter sich, dafür ist der Uncore-Beriech sehr fett (zu fett für meinen Geschmack - wer braucht einen 192Bit-RAM-Controller in einer CPU? MMn kompletter Unsinn, aber das ist ja keine Referenz).

Opteron
20.11.2008, 16:24
MMn wird in 2011, spätestens aber 2012, 2013 eher weniger IPC pro Kern gebraucht, aber dafür mehr Kerne und SMT gepaart mit etwas mehr Takt (3,5-4,5GHz).
Jein ... selbst wenn die Software immer "paralleler" verzweigt wird, sinkt mMn nicht der Bedarf eines IPC starken, dicken Kernes.
Bin deswegen Fan des Cell Konzepts und freue mich deshalb auch auf Fusion :)
Super Kompromiss, denke ich.
Bei Intel bin ich deswegen skeptischer. 80 "doofe" x86 Kerne, und sonst nichts.
Intel hat ja schon heute damit angefangen, siehe Atom und Nehalem. Der Nehalem hat eine deutliche Cache-Schlankheitskur hinter sich, dafür ist der Uncore-Beriech sehr fett (zu fett für meinen Geschmack - wer braucht einen 192Bit-RAM-Controller in einer CPU? MMn kompletter Unsinn, aber das ist ja keine Referenz).
Apropos 192bit, nochmal zurück zu AMD. Auf dem letzten Plan, den ich gepostet hab, steht doch noch Socket G34, also letztlich noch ein Lebenszeichen des Sockels und somit auch 256bit... allerdings haben sie bei Magny Cours und Sao Paulo die Kernangaben weggelassen .. schon komisch *kopfkratz.

Zum Nehalem L2 Cache:
Der ist mMn 100% nur so knapp ausgefallen, weil irgendjemand das inklusiv Cache Design als Prämisse vorgab. Ist ja auch toll in MP Systemen, vereinfacht die Speicherverwaltung ungemein.
Aber sonst wird der "winz-L2" v.a. im Hyperthreadningbetrieb nicht viele Hits haben.

In die Nische könnte AMD mit dem Bulldozer steuern. Prinzipiell reicht doch schon ein etwas breiterer K10 aus. 1 MB L2 pro Kern, 1-2 FPU FUs mehr, 2-3 INT FUs mehr, breiterer 4-6 way Decoder (soviel halt mit den FUs Sinn macht), Intels Loop Detector / L0 Cache dazu und natürlich SMT. Fertig, mit sowas wär ich "schon" zufrieden und das sollte eigentlich auch machbar sein.

Den Rest macht dann die angeflanschte APU/GPU/Vectore Unit (eventuell muss deswegen die FPU eigentlich auch nicht vergrößert werden) ;-)

Das Sahnestückchen wird wohl die Crossbar / NB werden, die muss breit genug sein, ein 256bit Speicherinterface darf da nicht abgebremst werden. Aber vielleicht baut AMD ja den Hub der R700 ein ^^

ciao

Alex

TNT
20.11.2008, 17:12
MMn wird in 2011, spätestens aber 2012, 2013 eher weniger IPC pro Kern gebraucht, aber dafür mehr Kerne und SMT gepaart mit etwas mehr Takt (3,5-4,5GHz). Intel hat ja schon heute damit angefangen, siehe Atom und Nehalem. Der Nehalem hat eine deutliche Cache-Schlankheitskur hinter sich, dafür ist der Uncore-Beriech sehr fett (zu fett für meinen Geschmack - wer braucht einen 192Bit-RAM-Controller in einer CPU? MMn kompletter Unsinn, aber das ist ja keine Referenz).

Das sehe ich aehnllich, dass langfristig nicht mehr die IPC pro Kern und Takt ins Unendliche gesteigert werden muss, da es ja davon viele gibt und auch irgendwann jede Wald- und Wiesensoftware MultiCores zunutzen weiss. Aber dahin ist noch ein langer Weg...
Davor benoetig AMD dringend etwas Neues um bei der IPC dennoch aufzuholen - am besten ein Design das von einem kleinen Core ('Bobcat') bis hin zum full scale Bulldozer skalieren kann. Ich meine mich auch an solche 'Ankuendigungen' erinnern zu koennen...

Fakt ist aber, dass AMD in der Fertigung und Core Design Intel im machbaren Takt unterlegen ist - sprich ein Shanghai muesst schon einige 100 Mhz (500 Mhz?*) schneller sein als ein i7 Nehalem, um durch die Bank mit Ausnahmen in beide Richtungen mitzuhalten.

Hoher Takt kommt AMD aber sehr teuer in der Produktion/Auslese als auch in TDP - besser waere es einen Core zuhaben mit besserer IPC und somit fuer die gleiche Leistung
Wieviele Cores koennte denn AMD selektieren, die mit extrem hohem Takt laufen koennten?
Brauchbare Anzahlen kann AMD in diesem speed bin vermutlich gar nicht liefern.

Sprich ein besserer Core, der eine bessere IPC hat, braucht naturgemaess weniger Takt fuer eine aehnliche Leistung - weniger Takt bedeutet in der Regel weniger Verbrauch, kleinerer speed bin, hoehere Ausbeute... etc.

Ich denke, dass sich etwas auf Coreebene tun muss, damit AMD bei Intel mithalten kann - und damit meine ich nicht nur das absolute Highperformance Segment. Eventuell sind hybrid Designs eine Loesung - vielleicht unterschiedliche starke/grosse Cores auf einer Die...

Nicht zuletzt da AMD SMT nicht 'kann' (ich habe immer gelesen, dass SMT sich nicht mit der K7/K8/K10.5 Architektur vertraegt oder Sinn macht), sollte da etwas passieren, damit man Intel ein wenig die Stirn bieten kann.

Aber wenn das alles so einfach waere, haette es AMD schon gemacht - oder haben sie das 'Core' Design wegrationalisiert?

Hat jemand Vorstellungen wie das CoreDesign bei AMD ablaeuft?
Zeitlicher Rahmen in etwa?

* Ok - einfach mal spekuliert an dieser Ecke

S.I.
20.11.2008, 17:16
hi,

aber die jetzigen Phenoms können deutlich mehr Takt, als offiziell freigegeben...
wäre nur ne Sache von ggf. noch besseren Kühlern...
denke, die sind da einfach übervorsichtig

Mit freundlichen Grüßen
m.r

TNT
20.11.2008, 21:27
hi,

aber die jetzigen Phenoms können deutlich mehr Takt, als offiziell freigegeben...
wäre nur ne Sache von ggf. noch besseren Kühlern...
denke, die sind da einfach übervorsichtig

Mit freundlichen Grüßen
m.r

Du vergisst eins, dass die CPUs gewisse Spezifikationen einhalten muessen von TDP ganz zu schweigen. Nicht jede CPU, die vom Wafer ausgeschnitten wird, ist gleich - gleich taktfreudig, gleich Strom verbrauchend , etc.\
Diese werden in Speed Bins eingeteilt. Die CPUs/Dies einer Bin leben dann z.B. als 9550 oder andere als 9650 weiter usw.
Je nach Bedarf wird auch noch mal umgemodelt - wenn z.B. mehr 9850 bestellt werden, kommen die vielleicht teilweise aus dem Bin fuer 9950.
Das einzige was sicher ist, dass die CPU gemaess ihrer Spezifikation arbeitet.D.h. zum Beispiel, einen gewissen Takt zu erreichen und dabei eine gewisse max. Verlustleistung zuhaben.

Auch wenn man mit viel Kuehlung die CPU hochpruegeln koennte, wird sich kein serioeser CPU Hersteller sich hinstellen und dies garantieren - selbst die BE CPUs haben ihre Spezifikation. Wenn AMD koennte (und es wirtschaftlich Sinn machen wuerde), wuerden wir sicher CPUs mit Takten jenseits der 3Ghz sehen - schon zu anfang - solange zumindest wie man Intel 'hinterherhinkt'.
Ich denke nicht, dass AMD uebervorsichtig ist.

Die Massen der CPUs landen in Haenden von Herstellern, denen gewisse Dinge garantiert werden, so dass sie entsprechend kostenoptimiert ein System entwickeln und herstellen koennen

Die Overclocker Gemeinde ist zahlenmaessig eher voellig unbedeutend - als Imagetraeger aber nicht zu verachten.

Sorry aber irgendwie merke ich gerade, dass wir hier ziemlich OT sind. Sorry!

Bobo_Oberon
20.11.2008, 21:41
... Nicht zuletzt da AMD SMT nicht 'kann' (ich habe immer gelesen, dass SMT sich nicht mit der K7/K8/K10.5 Architektur vertraegt oder Sinn macht), sollte da etwas passieren, damit man Intel ein wenig die Stirn bieten kann. ... Meiner Meinung nach ist das eine urbane Legende ...

Ich denke, dass AMD den Validierungsaufwand bei einer SMT-Variante schlicht vermeiden will und dann lieber gleich auf einen weiteren zusätzlichen Kern setzt.

Andere mächtige rechenstarke Micro-Architekturen scheuen den SMT-Aufwand nicht. MIPS bietet hohe IPC-Werte (Instruktionen pro Takt [Clock] ) pro Takt und auch die SPARC, z6/z10, Power-Architektur bieten mitunter hohe IPC-Werte ...

Ich denke schon, dass SMT-Technik Sinn macht, der Nehalem machts ja vor mit einem Prozessorkern, der in weiter Ferne vom Pentium M abstammt und dennoch wieder Intels "HyperThreading" hoffähig macht.

In Anbetracht von AMDs Design-Desaster mit dem TLB-Bug muss man fast schon froh sein, das sie SMT-Technik nicht auf den Plan hatten (oder womöglich doch ... und verzettelten sich hoffnungslos beim K9? ).

MFG Bobo(2008 )

rkinet
21.11.2008, 20:53
Meiner Meinung nach ist das eine urbane Legende ...

Ich denke, dass AMD den Validierungsaufwand bei einer SMT-Variante schlicht vermeiden will und dann lieber gleich auf einen weiteren zusätzlichen Kern setzt.

....
In Anbetracht von AMDs Design-Desaster mit dem TLB-Bug muss man fast schon froh sein, das sie SMT-Technik nicht auf den Plan hatten (oder womöglich doch ... und verzettelten sich hoffnungslos beim K9? ).
SMT macht bei low power Single-Core und im Mobilbereich Sinn.

Bei Servern ist zwar mehr Geschwindigkeit möglich, aber viel gewaltiger ist dies auch nicht.
Beim Desktop = Westmere wird es recht fragwürdig, ob die 12 Cores wirklich noch in der Praxis Performance bringen vs. 6-fach Core.

Ein 'Atom'-Konkurrent in 45nm und Single-Core zzgl. SMT - das wäre low power und würde trotzdem Multithread gut abarbeiten können.

Im Mobilbereich würde ein 2*2 Core für einige rechenkritische Anwendungen (Encoding, Decoding, Games ? ) etwas bringen ohne in TDP-Probleme zu geraten.

AMD hat sich vor Jahren auf den Opteron fixiert und nun kommen Mobilmarkt (Standard / Netbook) unerwartet als Aufgabe.

S.I.
21.11.2008, 21:07
sagt mal, (aber nicht mit Wafern werfen!) welche Fabs sind eigentlich nochmal in Dresden?

grüße
mr

Opteron
21.11.2008, 21:41
sagt mal, (aber nicht mit Wafern werfen!) welche Fabs sind eigentlich nochmal in Dresden? Na komm, das liefert Dir aber nun wirklich jede halbwegs sinnvolle google Suche :)

http://www.newglobalfoundry.com/techsvcs.aspx

ciao

Alex

S.I.
24.11.2008, 20:10
hi Alex,

stimmt, wo ist mein Hirn manchmal, ja, man ist versucht einfach einfache Fragen hier zu stellen, die man selbst googeln könnte, stimmt schon!

weil einfach einfach einfach ist...
das googeln vergess ich tatsächlich immer wieder -kopfklatsch*

Grüße
Micha

TNT
11.01.2009, 23:49
Konnte vielleicht jemand beim oder nach dem launch vom Deneb etwas ueber die naechste Entwicklung/Core von AMD herausbekommen?

Wenn ich das hier richtig lese, weiss man vom 'K12' noch recht wenig - nicht einmal der Name ist ganz sicher.. ;-)!

Opteron
12.01.2009, 09:43
Konnte vielleicht jemand beim oder nach dem launch vom Deneb etwas ueber die naechste Entwicklung/Core von AMD herausbekommen?
Nö, da gibts nichts Neues, mal schauen, ob bei der Cebit irgendwas durchsickert, aber selbst wenn, wird das nicht recht viel mehr als Cachegrößen oder unterstützte Befehlssätze (AVX ? / SSE5) sein.

Im Moment gibts einfach noch zuwenig Anhaltspunkte(eingentlich gibts überhaupt noch keine), das Teil wird alle paar Monate ein paar Monate rausgeschoben, das wars dann ^^

ciao

Alex

larsbo
14.01.2009, 10:43
Ich vermute ja weiterhin, dass das, was mal zwischenzeitlich als Bulldozer auf den AMD-Folien aufgetaucht war (ganz neuer Kern, bessere IPC etc....) inzwischen versenkt wurde. Warum sonst hätte das ganze schlagartig wieder von den Roadmaps verschwinden sollen? Wenn es also einen Bulldozer geben wird, dann wird das was anderes sein, als ursprünglich gedacht. Was im Prinzip natürlich für uns egal sein kann, denn was im Detail Bulldozer1 hätte sein sollen, wissen wir ja auch nicht.....*buck*

Benutzt AMD die Bezeichnung Bulldozer eigentlich momentan offiziell auf Roadmaps?

Aber für AMD ist das natürlich schon wichtig, es beschleicht einen doch das Gefühl, dass die seit K8 einen Haufen angefangener Designs in die Ablage Rund haben wandern lassen.....Vielleicht plaudert ja mal ein Entwickler in 30 Jahren Details aus, interessant wärs schon.

Opteron
14.01.2009, 11:44
Benutzt AMD die Bezeichnung Bulldozer eigentlich momentan offiziell auf Roadmaps?
Da gilt nachwievor Posting 145:

http://www.planet3dnow.de/vbulletin/showthread.php?p=3779917#post3779917

Antwort auf Deine Frage ist also ein deutliches Jein ;-)
Auf der Roadmap steht nichts, aber die AMDler nehmen das Wort noch in den Mund.
Unterschied ist wohl, dass Bulldozer einen einzigen Kern meint, Llano etc. dann den ganzen Chip mit x Bulldozer Cores und GPU, HTr, NB ...

ciao

Alex

rkinet
14.01.2009, 13:08
Ich vermute ja weiterhin, dass das, was mal zwischenzeitlich als Bulldozer auf den AMD-Folien aufgetaucht war (ganz neuer Kern, bessere IPC etc....) inzwischen versenkt wurde.
Wenn man das OC-Potential des Shanghai/ Deneb sieht und die Quälerei beim Barcelona dann ist eigentlich ein gutes Core und ein Shrink auf 32nm mehr wert als 10% mehr IPC.

AMD hat ja noch Luft bei der L2-Größe, der vielleicht 1M oder sogar 2M (32nm ? , 22nm) bei guter Perfromance packen könnte.
Dazu noch Lösungen bei L3 um die brachiale Cachestrategie von Intel zu kontern.

Mein Liebling bleibt hier das eDRAM, was 50% an Platz und 75% - 85% an Transistoranzahl bei gleicher Größe zu SRAM spart. Und eDRAM ist problemlos skalierbar, wie ja schon die heutigen gigantischen DRAM-Chips zeigen.

Dr@
17.10.2011, 00:34
Weil bisher noch nicht verlinkt:

So here's the story on IPC from my perspective.

The original design goal was higher IPC. Back before we had taped out the first processors the discussion came up. I am not allowed to say anything in public that hasn't been vetted past engineering. I specifically asked the engineering team about IPC and they replied that they expected higher IPC and I was cleared on that statement.

In my estimation, I made the IPC stament on XS and I don't recall making it other places (but I am sure that my comments were reposted.)

This is not a case of me lying, this is a case of me being wrong. And that happens to all of us. There is no way that I would intentionally say something that I did not believe to be true because a.) the interenet is a permanent record and b.) eventually you'll have to answer to those comments.

In these different forums that I would frequent, I have made thousands of posts about the product, always trying to help people understand the technology. Everything was done with the intention of being informative. I never made client performance predictions and was very clear on correcting people who took server benchmarks and tried to correlate client performance, because it just doesn't work like that.

Since the launch I haven't really been in any forums because I was in Seattle all week with MSFT. Once the product launched, I started receiving lots of hate mail. If I had a dollar for every message that used the word f*** I would have enough money to buy myself a bulldozer server.

Early on there were a lot of people that said I was crazy for trying to talk to the enthusiast community, but I persisted, the occasional idiot is something that everyone has to put up with from time to time. But the volume of hate messages that I received has unfortunately convinced me that I was wrong.

I was doing this on my own time, it was not part of my job. And because of that, I don't really feel compelled to take any more abuse.

All of the statements that I have made at the time were statements that I believed to be true. I am no more a liar than Paul Otellini when he said IB would ship in Q4. He is not a liar, he is giving the best information he has at the time and things change. If you are going to extend courtesy to others when their statements don't pan out, you should do that with everyone.

Thanks to exarkun and some of the others that have had a reasonable response in all of this. Too many people were waiting to attack, it's almost like they don't really care, maybe they just like to fight.
Quelle (http://forums.anandtech.com/showthread.php?p=32421412&highlight=#post32421412)

Nach der Erfahrung wird es wohl so schnell niemanden bei AMD mehr geben, der Freizeit dafür opfert.

AMD’s two-core Bulldozer module [1,2] implements the AMD x86-64 microarchitecture in an 11-layer 32-nm SOI HKMG technology. The 40-instruction outof-order unified integer scheduler issues up to four operations per cycle and supports single-cycle wake-up of dependent operations. The 2.37mm2 integer execution unit supports single-cycle data bypass among four independent functional units. Compared to previous AMD x86-64 cores [3-6], project goals reduce the number of FO4 inverter delays per cycle by more than 20%, while maintaining constant IPC, to achieve higher frequency and performance in the same power envelope, even with increased core counts.
Quelle: ISSCC 2011 / SESSION 4 / ENTERPRISE PROCESSORS & COMPONENTS / 4.6
"40-Entry Unified Out-of-Order Scheduler and Integer Execution Unit for the AMD Bulldozer x86-64 Core"

sompe
17.10.2011, 01:01
Was fuer Kindskoepfe verschicken solche Nachrichten? :o

Opteron
17.10.2011, 01:10
Was fuer Kindskoepfe verschicken solche Nachrichten? :o
Das Internet ist groß ;-)

sompe
17.10.2011, 01:22
*Beitrag hier rueber schieb*

Das Internet ist groß ;-)
Noch groesser als die lange Weile und das Ego vieler User, ich weiss aber sowas ist einfach nur fehl am Platz.
OK, die vorlaeufige Leistung des Bulli ist im Desktop Segment im Bezug auf den Preis recht enttaeuschend aber wem es nicht reicht, der kauft einfach was anderes und die Preise passen sich dementsprechend an.
Wenn die Desktop Marktanteile dann zusammenbrechen wird vielleicht doch noch was ansprechendes nachgeschoben aber fuer die Masse sind die Fusionsprodukte vermutlich deutlich interessanter.

DarklightOrange
17.10.2011, 01:33
AMD hat sich die Suppe aber auch selbst eingebrockt. Das Marketing war nicht ehrlich und mittlerweile kann man den Kunden auch nicht mehr so einfach für dumm verkaufen. Ich meine selbst Branchenriesen wie Saturn haben mittlerweile ihr Vertriebskonzept um Internetangebote ergänzt. Selbst für Laien ist es mittlerweile schwieriger Testberichte und Usermeinungen NICHT beim Produktkauf zu begegnen als umgekehrt...Dem Kunden ist ehrliches, seriöses Marketing lieber als WischiWaschi... Das JF-AMD nicht gleich AMD ist, sondern als Privatperson in den Foren unterwegs war haben wohl viele auch einfach vergessen. Hinzu kommt, dass wie Opteron gesagt hat das Internet ja eben auch groß ist...Viele Idioten unterwegs..(Denke die Wortwahl trifft auf Personen zu die andere per E-Mail in der Art und Weise beleidigen)..

Opteron
17.10.2011, 01:37
@sompe (http://www.planet3dnow.de/vbulletin/member.php?u=53501)
Klar, Du hast ja recht, aber wer das internet kennt, und sich darüber wundert, kennt das Internet nicht wirklich ;-)

JF hat den Fehler gemacht über Performance zu reden. Hätte er sich allein auf Feature / Zeitpunkt u.a. bezogen, wär das nie passiert ;-)
Ich war damals wirklich überrascht, dass er Äußerungen zur Performance macht. Die Aussgen dazu sind ja nicht umsonst immer so schwammig ;-)

Apropos .. da fällt mir die Balken-Grafik mit den (wahrscheinlichen Specwerten) wieder ein. Die müßte man jetzt auch mal nachmessen ^^ Gibts irgendwo schon SpecWerte? ;-)

http://www.abload.de/img/kaigai_10wzfh.jpg

Die alte Grafik ist auch nett:

http://www.abload.de/img/1_amd_bulldozerhkgt.jpg

Eventuell war das Irrtum, dass es sich um Server/HPC IPC handelte. Wie man weiß hängt die IPC an den Programmen. Der Pfeil ist bei Client aber wohl nicht umsonst so "niedlich". 2007 wußte man das also wohl schon ... ;-)
Edit: Wobei der Pfeil halt schon irgendwie länger ist, auch bei Client. Man rechnete also schon mit nem Plus ...

Edit2:
@DarklightOrange (http://www.planet3dnow.de/vbulletin/member.php?u=60828):
Tja er sagt halt, dass es zum Zeitpunk, als er das sagte noch obige (zweite) Grafik gültig war. Wieso sollte er lügen, jetzt ist das Geschrei riesengroß. Das kann keiner wollen.

DarklightOrange
17.10.2011, 02:02
^^ Opteron hat ein echt gutes Gedächtnis was Folien betrifft *buck*

Yo, was JF betrifft. Ich fand das bisher immer sehr symphatisch dass er hier und da mal im XS und auf SemiAccurate sich überhaupt zu Wort gemeldet hat - aber überbewertet hab ich dem seine Privatmeinung nie und er hat eigentlich auch nie so den "Marketing Guy" gespielt wie ihm das manche zu Unrecht nachgesagt haben.
Die Marketingfehler hat AMD in den hochoffiziellen Mitteilungen gemacht - siehe auch den Folien und den Terminen ;-) Was die Sache eigentlich noch schlimmer macht...Gut - in dem einen Punkt hat JF vielleicht echt den Fehler gemacht und wurde zu konkret - aber genau das fand ich irgendwie syphatisch und machte den UNterschied zum reinen Marketing Guy aus (da denke ich an so Jungs wie auf den letzten AMD Themenabenden: § Keine Aussage zu Produkten die nicht kaufbar sind)

sompe
17.10.2011, 02:14
@Opteron
Ich bin schon lange genug im i-net unterwegs und habe genug AMD vs. Intel bzw. ATI vs nvidia Wort Schlachten miterlebt um mich nicht wirklich darueber zu wundern aber eine Quelle mit dem technischen Sachverstaendnis so zu verjagen ist mehr als......na ich will das mal nicht weiter ausschmuecken.
Ich fuer meinen Teil hatte mir irgendwie mehr erhofft aber als das 4 Modul Modell als 8 Kerner bezeichnet wurde haette ich vielleicht mistrauischer werden sollen.
Aber um ehrlich zu sein.....mir reicht(e) selbst die Leistung meines X4 940 zum zocken und der X6 ist bereits deutlich mehr als ich brauche, da kaum ein Programm alle Kerne nutzt (selbst der Benchmark von Windows 7 lastet nur 4 Kerne aus *lol*) und so massiv nutze ich auch kein multitasking.

OBrian
17.10.2011, 06:33
Das Problem ist aber auch, daß dem Marketing an sich wenig Vertrauen entgegengebraucht wird, was üblicherweise ja auch genau richtig ist. Oder glaubt irgendjemand, daß das neue Waschmittel XY jetzt noch weißer wäscht?

Und wenn sich eine Führungspersönlichkeit im Marketing einer Frma mit "echte Namensinitialen-Bindestrich-Firmenname" in einem Forum anmeldet, dann wirkt es immer wie eine Schutzbehauptung, er würde nur seine eigene Meinung vertreten. Viel wahrscheinlicher ist doch, daß er seinen Job macht, d.h. die Kunden über die Produkte der Firma möglichst so anzulügen, daß sie möglichst viel davon kaufen.

Ich meine, man weiß es ja nicht, aber wenn er wirklich nur privat unterwegs ist, dann hätte er sich besser anonym anmelden sollen.

Abgesehen davon wundert es mich, daß jemand, der in so einem amoralischen Job arbeitet, so dünnhäutig ist. Ist ja wie ein Profikiller, der kein Blut sehen kann.

Letztlich sind die Hatemails ja auch nicht persönlich gegen ihn gedacht (selbst wenn sie so formuliert sind), sondern ein Ausdruck der Verärgerung der Leute über ihre eigene Naivität, die eigentlich hätten wissen sollen, daß man Marketingaussagen nicht trauen darf. Aber ein bißchen glaubt man es eben doch immer. Oder wer wäre nicht überrascht, wenn das neue Persil mit "jetzt neue Formel mit 30% mehr Waschkraft für noch weißere Wäsche" nicht mal mehr die Flecken rauskriegt, die das alte rausbekam? Bei einer Änderung eines Produktes geht man doch immer von einer Verbesserung aus.

sompe
17.10.2011, 06:43
Also wenn ich in meiner Schulzeit im Bezug auf Werbung was gelernt habe, dann das man seine Kunden nicht anlügen darf...aber ebend auch nicht die ganze Wahrheit sagen muss und das münze ich ebend auch mal auf das Marketing an sich um.
Bezogen auf den Bulli im Desktop Markt heißt es für mich das er zwar ein schnelles Produkt ist aber so garnicht zu den Software Gegebenheiten passt und dementsprechend nur selten aus den Puschen kommt.

Das konnte man letztenendes auch schon auf die X6 Modelle ummünzen und die effektive Leistung steht und fällt mit der Anzahl der genutzten Kerne.

OBrian
17.10.2011, 06:50
In der Werbung wird doch immer die größte Lüge zur Wahrheit erhoben. Natürlich keine blanken Lügen wie 1+1=3, weil man dann sofort Klagen am Hals hat. Aber was ist an "ohne Zusatzstoff Glutamat" denn nicht gelogen, wenn das Glutamat nicht als Zusatzstoff, sondern als Zutat drin ist? Rechtliche Spitzfindigkeiten, um Klagen zu vermeiden, aber in keinster Weise ehrlich im moralischen Sinn. Oder nimm die Bank"berater" (die man besser als Verkäufer bezeichnet), die unbedarften Privatanlegern Lehman-Zertifikate angedreht haben, die haben sicher nicht klar gesagt "wenn die Bank Pleite geht, ist das Geld futsch. Zwar nicht so irre wahrscheinlich, aber möglich, daher sollten sie auf keinen Fall so viel Geld auf einmal da anlegen", stattdessen kam bestimmt nur das Wort "Emittentenrisiko" einmal kurz im Kleingedruckten vor, um Klagen zu vermeiden.

Umgemünzt auf diesen Fall hätte JF-AMD auch dazu sagen können "Die theoretische IPC steigt, aber nur bei Software, die optimal auf die Architektur ausgelegt ist, bei altem Code kann es auch anders aussehen". Ich wette, sowas haben die Ingenieure ihm auch gesagt, aber das ist dann irgendwie untern Tisch gefallen. Sowas aber auch.

sompe
17.10.2011, 07:11
Dann zähle mal definitive Lügen der Werbung auf.
Bestes Beispiel sind ja die typischen "bis zu" Angaben, die herzlich wenig über den realen Nutzen unter Alltagsbedingungen aussagen. Eine weitere Floskel sind Angaben von wegen x% mehr Inhalt...."mehr Inhalt als bei was?" heißt da die Gegenfrage.
Bezogen auf eine Deo Sorte die ich hatte bedeutete der Aufdruck "genau so viel wie bisher aber x% mehr als bei der neuen, noch kommenen Verpackung". Der Hersteller will seinen Kunden also über den Tisch ziehen und es ist höchste Zeit die Marke zu wechseln.

Natürlich sind das alles Spitzfindigkeiten, denn genau darum geht es letztenendes in der Werbung. Stelle deine Stärken ins Rampenlicht aber verschweige die Nachteile und verpacke all das in einer ansprechenden Formulierung.


Um aber auf das Thema wieder zurück zu kommen....gerade weil er so dünnhäutig reagiert könnte man vermuten das es ebend nicht geschäftlich sondern privat war oder wie würdest du reagieren wenn du einmmal privat und einmal beruflich beleidigt wirst?

OBrian
17.10.2011, 07:25
Das kann ja wirklich sein, aber als Außenstehender weiß man es nicht und es ist eben doch gut möglich, daß es nicht privat war. Dann war es aber ein Fehler, sich als AMD-Mann zu outen. Will jetzt nicht behaupten, daß er selbst schuld ist an den Beleidigungen, aber er hätte ganz allgemein ahnen können, daß er bei Verfehlungen seines Unternehmens als Zielscheibe für negatives Feedback herhalten muß, wenn er sich so als Ziel anbietet. Aber er fand es offenbar gut, wenn ihm dadurch mehr Beachtung zuteil wurde als einem 0815-Forenuser. So ist das nun mal, jede Medaille hat zwei Seiten.

sompe
17.10.2011, 08:18
Ich bin auch aussenstehender und habe das noch aus meiner Schulzeit behalten....frage mich bitte nicht warum ich mir solche Banalitäten merke aber das zu wissen macht vieles einfacher. *g*

Das es ein Fehler war sich zu outen ist gut möglich aber wie hätte man dann die Infos aufgenommen?
Und nein...es gibt keinen Freibrief für Anfeindungen, nur weil derjenige bei einer gerade unbeliebten Firma arbeitet, für seine Einschätzungen etwas mehr Hintergrundwissen besaß aber dabei daneben lag.
Einfach mal auf den gesunden Menschenverstand zurückbesinnen und sich fragen wie man selbst reagieren würde.
Wie du selbst schreibst hat die Medaille 2 Seiten...ist es die Beachtung oder einfach nur Offenheit?

OBrian
17.10.2011, 10:32
Man weiß es ja eben nicht. Wie gesagt, es macht nur keinen guten Eindruck.

Hätte er sich anonym angemeldet und nur von Zeit zu Zeit gesagt "ich kenn einen bei AMD, der behauptet dies und das" und hätte sich das als richtig herausgestellt, dann hätte er sich im Forum ja auch eine gewisse Reputation erarbeitet. Wäre dann aber trotzdem jetzt nicht als Lügner abgestempelt worden, sondern man hätte es unter "naja, dann haben sie ihm wohl nicht alles gesagt" oder "dann hat er es wohl falsch mitbekommen" verbucht.

Wenn man irgendwo erkennbar als Repräsentant unterwegs ist, dann kann man noch so oft behaupten, das wäre ja alles eigene Meinung usw. Ist doch hier genauso, wenn ein P3D-Redaktionsmitglied was sagt, dann gilt das auch gleichzeitig als Redaktionsstandpunkt, da muß sich der ein oder andere hier auch mal zurücknehmen. Es ist nämlich völlig irrelevant, wie man selber das gemeint hat, sondern entscheidend ist immer nur, wie andere das aufnehmen, und da hat man wenig Chancen im Nachhinein noch was dran zu ändern.

amdfanuwe
17.10.2011, 11:28
Dann zähle mal definitive Lügen der Werbung auf.

Intelwerbung:
Sichtbar intelligent.

p4z1f1st
17.10.2011, 11:42
Sagt mal, hat mal jemand anderes außer dem Typen aus dem XS-Forum diese "Modul-Problematik" rekonstruiert bzw. nachgemacht?

Also, dass 4 "halbe" Module (4 Threads) wesentlich besser arbeiten als 2 volle Module (auch 4 Threads)?

MusicIsMyLife
17.10.2011, 11:51
Sagt mal, hat mal jemand anderes außer dem Typen aus dem XS-Forum diese "Modul-Problematik" rekonstruiert bzw. nachgemacht?

Also, dass 4 "halbe" Module (4 Threads) wesentlich besser arbeiten als 2 volle Module (auch 4 Threads)?

Dazu will ich in einem kommenden Artikel noch etwas schreiben. Bisher habe ich lediglich in einer einzigen Anwendung 4C/4T mit 2C/4T verglichen. Ergebnis: 4C/4M war 15 Prozent schneller. Aber wie gesagt: Eine einzige Anwendung, zu mehr bin ich noch nicht gekommen.

ceVoIX
17.10.2011, 12:20
Hoffe das ist der richtige Thread dafür, für die Boinc User hier der FX-8120 (z.Z. auf Position 9): http://de.boincstats.com/stats/host_cpu_stats.php?pr=bo&teamid=&st=0&or=8

[MTB]JackTheRipper
17.10.2011, 12:27
Hoffe das ist der richtige Thread dafür, für die Boinc User hier der FX-8120 (z.Z. auf Position 9): http://de.boincstats.com/stats/host_cpu_stats.php?pr=bo&teamid=&st=0&or=8
Da sollte statt CPU Auswertung eher GPU Auswertung stehen. BoincStats scheint hier noch nicht zu unterscheiden.

p4z1f1st
17.10.2011, 12:50
Dazu will ich in einem kommenden Artikel noch etwas schreiben. Bisher habe ich lediglich in einer einzigen Anwendung 4C/4T mit 2C/4T verglichen. Ergebnis: 4C/4M war 15 Prozent schneller. Aber wie gesagt: Eine einzige Anwendung, zu mehr bin ich noch nicht gekommen.
Auf dich ist Verlass MIML ;D
War der Performance-Sprung beim XS-Nutzer nicht aber höher? ???

Dresdenboy
17.10.2011, 14:27
Auf dich ist Verlass MIML ;D
War der Performance-Sprung beim XS-Nutzer nicht aber höher? ???

Noch ein Test (schon paarmal hier verlinkt):
http://www.hardware.fr/articles/842-9/efficacite-cmt.html

DarklightOrange
17.10.2011, 15:31
Du begehst weiterhin den Fehler Bulldozer-Server mit Bulldozer-Desktop gleichzusetzen.

Ja, sie basieren auf der gleichen Architektur, ja sie haben den gleiche Die und werden in der gleiche Produktionsstätte hergestellt.

Aber...Valencia und Interlagos arbeiten erstens bei deutlich... deutlich niedrigeren Basistakten (logisch, da Server) und dadurch deutlich sparsamer, nein es ist sogar möglich einen Interlagos 16K/8M Chip mit einer TDP von 85 Watt "herzustellen". Der läuft dann nur mit 1,6 GHz aber man hat dann eben 16 Kerne zur Verfügung, in einem Sockel. Das höchste der Gefühle ist ein mit 2,6 GHz getakteter Interlagos mit einer TDP von 140 Watt, das "alte" Magny-Cours Top-Modell hat 12 Kerne und taktet bei 2,5 GHz, und hat ebenfalls ein TDP von 140 Watt.

Dann gibt es Valencia 8-Kern Opterons mit einer TDP von 65 Watt und sogar EE-Versionen mit nur 35 Watt, die mit 2,5 GHz takten.

All das sagt uns dass GlobalFoundries offenkundig Probleme mit höheren Takten hat (FX-8150), denn die Leistungsaufnahme steigt mit Turbo enorm an und mit Übertaktung exorbitant. Und genau das sieht man beim Desktop-Bulldozer.

Und genau deswegen darf man nicht Bulldozer als Gesamtkonzept verteufeln, bloß weil er im Desktop nicht die übersteigerten Erwartungen erfüllt hat und sich nicht deutlich vom Vorgänger-Desktopprozessor abhebt.


Aber ich glaube das interessiert gar nicht. "Hier" (und damit meine ich natürlich nicht diesen Thread explizit) wird gar nicht darüber diskutiert warum Zambezi nicht funktioniert sondern es wird immer wieder explizit Bulldozer in seiner Gesamtheit herangezogen, wohlwissend dass man darüber abschließend gar nichts sagen kann.


Und genau deswegen ist deine Aussage nicht nur unfundiert, ohne Grundlage, sondern gefärbt von den Ergebnissen die du bei der "FX-Serie" gesehen hast. Diese auf Valencia und Interlagos zu projizieren ist unvernünftig.
.
EDIT :
.
Um das mit der Leistungsaufnahme nochmal zu verdeutlichen:


http://translate.googleusercontent.com/translate_c?hl=de&ie=UTF8&prev=_t&rurl=translate.google.com&sl=auto&tl=en&twu=1&u=http://www.hardware.fr/articles/842-10/cmt-turbo-core-2-0-windows-8.html&usg=ALkJrhgf04SDeZrU2CIYy-Uf1-9V3uQCpg (Fränglisch)

Fritz Benchmark Ergebnisse
http://www.hardware.fr/medias/photos_news/00/33/IMG0033836.gif

Leistungsaufnahme der einzelnen Bulldozer-"Kernkonfigurationen"
http://www.hardware.fr/medias/photos_news/00/33/IMG0033837.gif

Und die daraus folgende Effizienz
http://www.hardware.fr/medias/photos_news/00/33/IMG0033838.gif

Der Turbo ist in diesem Beispiel schlicht zu ineffizient.

Um den oder die anderen Threads mal nicht zuzumüllen...

Die Erkenntnis dass Bulldozer ein Oberbegriff für die Architektur und daraus Desktop und Server Modelle abgeleitet werden ist ja nicht neu. Nur - das eine schließt das andere ja nicht grundsätzlich aus. Ein primär für Server designte Server CPU kann als Architektur auch gut für Desktop sein - solange wir über x86 reden ;) Das hat ein anderer X86 Hersteller in 45nm ja auch hinbekommen.
Ich hatte es ja bereits angesprochen. Stimmig wäre Zambezi für mich im Desktop als eine High-End Variante des Bobcat und bis 45 Watt TDP vermarktet. Das wäre ein neues Segment und es gäbe keine direkte Konkurrenz mit der sich Zambezi hätte messen lassen müssen.
Aber noch ist ja nicht aller Tage Abend. Die Architektur ist als Grundgerüst schon interessant - wenn man zwischen den Zeilen die diversen Reviews vergleicht ist Potenzial erkennbar.

yasu
17.10.2011, 15:44
Um den oder die anderen Threads mal nicht zuzumüllen...

Besten Dank! :)

undone
17.10.2011, 16:10
Noch ein Test (schon paarmal hier verlinkt):
http://www.hardware.fr/articles/842-9/efficacite-cmt.html

Thanks,

http://www.hardware.fr/medias/photos_news/00/33/IMG0033832.gif

the CMT gain average about 40% increase, still higher than SMT. Is it possible that an compiler or new software help CMT to gain more performance?

It's somewhat screw up that amd advertise this as two cores but not hyperthreading. *noahnung*

HITCHER
17.10.2011, 16:25
@undone

you could also run 7-zip and x264 at the same time, to use more cores effectively.
And there may be a problem with turbo-function in such benchmarks, which kicks in if only half of the cores are used.

Stryki
17.10.2011, 21:20
Auch wenn es schon vorbei ist will ich nochmal paar Zeilen zu JF schreiben:
1. Sehr schade wenn er solche E-mails bekommt aber leider zu erwarten
2. Das Problem zu unterscheiden zwischen Privat und einer Organisation gibt es immer, ich erinnere mal an diverse Beleidigungen an den Herrn von PCGH
3. Aber natürlich erwartet man das die mehr wissen und legt alles auf die Goldwaage. (der Cayman zieht Kreise....) jeder wußte er hat ein Sample usw bei JF natürlich ähnlich.

Trotz alledem kein Grund jemanden zu diffamieren und ich sehe es immer noch sehr positiv das er so viele Informationen weitergegeben hat.

@ Music vielen Dank das du sie Geschichte mit den "halben Modulen" nochmal auf den Grund gehst. Finde ich recht spannend.

Opteron
17.10.2011, 21:39
Thanks,

http://www.hardware.fr/medias/photos_news/00/33/IMG0033832.gif

the CMT gain average about 40% increase, still higher than SMT. Is it possible that an compiler or new software help CMT to gain more performance?

Sure definitley, Dresdenboy just wrote something fitting @XS:
http://www.xtremesystems.org/forums/showthread.php?275786-AMD-FX-8150-Bulldozer-finally-tested&p=4974341&viewfull=1#post4974341
It's somewhat screw up that amd advertise this as two cores but not hyperthreading. *noahnung*It' better than HT, but worse than a real core. It is like the old question, if the glass is half full or half empty.
Of course marketing choose the viewpoint, that the glass is "half full" ...
---------

Ansonsten was mir gerade aufgefallen ist:

FX6Kerner sind lieferbar, FX4Kerner sind auch lieferbar ... 8 Kerner ... Fehlanzeige, sicherlich wegen den Serverchips.

Vielleicht ist eine Erklärung, wieso AMD FX in den Desktop gebracht hat, dass sie die teildefekten Chips abverkaufen können. Wenn die 8core Yields schlecht sind, gibts davon ja sicherlich ein paar ... *lol*

Night<eye>
19.10.2011, 19:09
deaktiviertes CMT bringt aber wiederum nachteile in spielen wie BF3 & Anno. also auch nicht so Prickelnd. das sollte schon an bleiben. heißt das, wenn man CMT anlässt, ist der BD nicht zu empfehlen ? in welchem threat sollte ich denn fragen, kannst du mir mal einen link geben ?

Opteron
19.10.2011, 21:05
Damit der Thread mal auch wieder nach vorne kommt, Kopie von Emmerdeur aus dem anderen Thread:

hatten wir das schon
In 2012, the company plans to launch Piledriver, which is expected to incorporate a number of IPC- and power-oriented improvements to the architecture. The first product planned with Piledriver’s enhancements is AMD’s Trinity APU, which we already saw running at IDF. Later, it’ll become a 32 nm-based CPU successor to today’s Zambezi desktop incarnation. How will Piledriver get its projected 10 to 15 percent speed up? AMD says one-third will come from IPC improvements like structure size increases (so, three to five percent) and two-thirds will come from power optimizations that reduce consumption, enabling higher frequencies at a constant TDP (another six to 10 percent).
tomshardware.

ceVoIX
19.10.2011, 22:09
In den ersten Shops sind die FX-8150 jetzt lieferbar, allerdings mit einem erhöhten Preis weil noch nicht alle Shops den haben.

Night<eye>
19.10.2011, 22:54
die meisten hier spekulierten nachteile beziehen sich doch iergentwo auf die verständigungs probleme. wäre es also warscheinlich das die CPU,s mit weniger modulen weniger stark von den problemen betroffen sind ?

Ge0rgy
21.10.2011, 11:17
Mal doof gefragt, gibts eigentlich offizielle Dokumente über BDs Stromsparfähigkeiten abseits der Powergating ganzer Module?
Wenn man sich die Vergleichsmessungen zu SB so anschaut, ist entweder der Prozess für BD grottenschlecht, sodass er mit massiv höheren Spannungen laufen muss als geplant, oder er verschwendet irgendwo Strom.
Dass nicht belastete Module powergated werden ist ja ok und klar, aber wie siehts mit INT-Cores und der shared FPU bei nicht vorhandensein von entsprechendem Code aus?
so viel größer als ein SB-Kern ist ein BD-Modul doch auch nicht... *noahnung*

Bobo_Oberon
21.10.2011, 18:55
Mal doof gefragt, gibts eigentlich offizielle Dokumente über BDs Stromsparfähigkeiten abseits der Powergating ganzer Module?
Wenn man sich die Vergleichsmessungen zu SB so anschaut, ist entweder der Prozess für BD grottenschlecht, sodass er mit massiv höheren Spannungen laufen muss als geplant, oder er verschwendet irgendwo Strom.
Dass nicht belastete Module powergated werden ist ja ok und klar, aber wie siehts mit INT-Cores und der shared FPU bei nicht vorhandensein von entsprechendem Code aus?
so viel größer als ein SB-Kern ist ein BD-Modul doch auch nicht... *noahnung* Der Bulldozer ist ganz passabel im Idle-Betrieb (http://techreport.com/articles.x/21813/16).

Von daher ist die 32nm Fertigung gar nicht so schlecht - aber wehe wenn der Takt hochgefahren wird -> Katastrophe bei 4,6 GHz (http://www.kitguru.net/components/cpu/zardon/power-consumption-fx-8150-v-i5-2500k-v-i7-2600k/).

MFG Bobo(2011)

(AM)(D)evil
21.10.2011, 19:32
Au Weiha :-/

Die Differenz im Energieverbrauch ist echt hoch :/

tomturbo
21.10.2011, 19:45
58 zu 69% Steigerung ist nicht wirklich der große Aufreger.

lg
__tom

Bobo_Oberon
21.10.2011, 20:04
58 zu 69% Steigerung ist nicht wirklich der große Aufreger. ... - [100%] Also der Core i7 2600 mit 3,4 GHz erzeugt eine Systemlast von 146 Watt.
- [100%] Der FX 8150 BE mit 3,6 GHz provoziert eine Systemlast von 240 Watt.


Bei Übertaktung wirds peinlich für AMD:
- [158%] Also der Core i7 2600 mit 4,6 GHz hat eine Systemlast von 231 Watt (+ 85 Watt).
- [169%] Der FX 8150 BE mit 4,6 GHz hat hingegen eine Systemlast nun von 406 Watt (+ 166 Watt).

Deine Prozentzahlen sind zwar richtig - aber verwässern schlicht die Tatsache, dass ein übertakteter Core i7 2500 bei 4,6 GHz immer noch weniger Stromlast erzeugt, als ein Bulldozer-System bei 3,6 GHz -> Dabei ist der Bulldozer auf hohem Takt hin entwickelt worden, nicht der Core i7. ;)

MFG Bobo(2011)

tomturbo
21.10.2011, 20:23
100% wäre eine Verdoppelung

Das ist weder von 146 auf 231W der Fall, noch von 240 auf 406W .....
Keine Rede also von 158 und 169%

lg
__tom

Twodee
21.10.2011, 20:26
Nö - er schreibt ja nicht UM 100%

tomturbo
21.10.2011, 20:29
Es geht aber UM die Steigerung zwischen normal und übertaktet.

Bobo_Oberon
21.10.2011, 20:35
Es geht aber UM die Steigerung zwischen normal und übertaktet. Nö, es geht darum - dass AMD es schlicht nicht hin bekommen hat. Dein Argument mit der Nennung von Prozentzahlen sind bezuglos, wenn du nicht ein mal in Watt einen absoluten Bezugspunkt nennst.

Klaro - die Steigerung eines SandyBridge um 58% mehr klingt nicht so dramatisch, wenn der Bulldozer um 69 Prozent den Systemstrombedarf steigert ... ABER ...
Zu dumm nur, dass der Systemverbrauch bei Intel an sich schon deutlich niedriger ist (Das Bulldozer-System benötigt schon bei 3,6 GHz 66 Prozent mehr Strom als ein SandyBridge-System bei 3,4 GHz).

MFG Bobo(2011)

tomturbo
21.10.2011, 20:43
Waren alle Umstände gleich? Board, Netzteil, Karten im System, Speicher?
Absolutzahlen lassen sich nur mit gleichen Umständen vergleichen.
Der Rest ist FUD wie so oft.

Wie man zB. bei HT4U sieht ist der tatsächliche Verbrauch der FX im Idle nicht schlecht, wohl aber die Steigerung recht stark,
wie es eben dieser andere plakative Test zeigte.

lg
__tom



Copyright © 1999 - 2011 Planet 3DNow!
Rechtliche Hinweise