Intel Nehalem

... aber JEDER HIER weiß, dass der Nehalem den Todesstoß hinterm Rücken versteckt hält...eure Wahrsagerkugeln hätte ich gerne...
So weit will ich gar nicht gehen ... aber der Nehalem wird insbesondere dort verbessert (Stichwort QuickPath alias "CSI"), wo AMD mit ihrem HyperTransport-Link und dem integriertem Speicherkontroller bislang immer noch, trotz starkem Core 2, dezent, bis überzeugend gut vorne lag.

In wie weit QuickPath und integrierter Speicherkontroller bei dem Nehalem wirken werden kann ich derzeit nicht sagen ... von Nachteil wird dies sicher nicht sein.

MFG Bobo(2008 )
 
Was ich nicht verstehe: Der Nehalem ist nicht draußen, die bisher gezeigten/geleakten Benches sind nicht SOOOOOOOOO apokalyptisch für AMD, aber JEDER HIER weiß, dass der Nehalem den Todesstoß hinterm Rücken versteckt hält...eure Wahrsagerkugeln hätte ich gerne...

Ganz einfach. Weil der Speichercontroller und die HT-Ähnliche Anbindung selbst pessimistisch betrachtet einen ähnlichen Schub bringen dürften wie es bei AMD der Fall war.
 
Ganz einfach. Weil der Speichercontroller und die HT-Ähnliche Anbindung selbst pessimistisch betrachtet einen ähnlichen Schub bringen dürften wie es bei AMD der Fall war.

Der Nehalem wir Highend und somit teuer und nicht in Massen verkauft. Der Shanghai dürfte mit den Penryn gut in Schach halten (wenn die ersten Benches, Stromverbrauch und OC Tests stimmen) und da spielt die nächsten 1 bis 1,5 Jahre die Musik.
 
Der Nehalem wir Highend und somit teuer und nicht in Massen verkauft. Der Shanghai dürfte mit den Penryn gut in Schach halten (wenn die ersten Benches, Stromverbrauch und OC Tests stimmen) und da spielt die nächsten 1 bis 1,5 Jahre die Musik.


Stimmt aber spätestens nächstes Jahr dürfte der Nehalem wenn es keine Verspätungen gibt auch für den Massenmarkt erhältlich sein.

Und der Shanghai muss sich erstmal beweisen. Man kann über Intel sagen was man will aber deren Angaben sind meistens realistischer als die von AMD.

Ich hätte übrigens auch nichts dagegen wenn AMD wieder aufholt.
 
Vor allem bügelt der Nehalem (vermutlich) die Schwächen der bisherigen Architektur im Server- und HPC-Bereich aus. Und zwar die Skalierung über viele Kerne/Sockel (plus ein wenig 64bit Verbesserungen). WENN es so kommt, wie man es nach aktueller Datenlage erwarten darf, dann dürfte Intel ganz entspannt auch bei Spec_rate benches an AMD vorbeiziehen.

Der normale Desktop, auch der ausgeprägte Spiele-PC, kommt weiterhin wunderbar auch noch mit dual-core aus. Für diese Art Anwendungen kann Intel noch sehr gut mit dem Penryn für ein Jahr leben. Für die Mehrzahl der dort relevanten Anwendungen wird auch der Deneb pro Takt nicht an Penryn vorbeiziehen. Und den Takt von Penryn muss AMD auch erstmal liefern.......
 
Der Nehalem wir Highend und somit teuer und nicht in Massen verkauft. Der Shanghai dürfte mit den Penryn gut in Schach halten (wenn die ersten Benches, Stromverbrauch und OC Tests stimmen) und da spielt die nächsten 1 bis 1,5 Jahre die Musik.
Jo, aber wieviele Leute kaufen sich nicht heuzutage nen QuadCore Intel, obwohl sie den eigentlich nicht brauchen .. der billigste nehalem wird anfangs wohl so bei ~€250 plus nem teureren board liegen, die meisten hardware freaks werden sich das schon leisten ...

Aber naja mal abwarten, der 45nm Phenom könnte mit weniger Verlustleistung und dem vergrößertem Cache punkten.

ciao

Alex
 
warum baut AMD eigentlich keine SMT Kopie ein ? patent frage oder technisch nicht möglich ?
 
Zuletzt bearbeitet:
warum baut AMD eigentlich keine SMT Kopie ein ? patent frage oder technisch nicht möglich ?
Weil sich kein AMD Entwickler damit auskennt ^^

on topic: wieder mal ein Nehalem Test:
http://www.hexus.net/content/item.php?item=15015&page=1

Der Chip lief mit 2,93 GHz und Triple channel DDR3-1066. Als AMD Vergleich gibts ein 9950 System mit 2,6 GHz.
Bei Cinebench und povray (multithreaded), ist der Nehalem dank HTh nicht weniger als doppelt so schnell wie der K10, leider geben die hexus Leute nicht die cinebench single-thread Ergebnisse an :(

ciao

Alex
 
Müßte der K10 nicht genügend (im normal fall???) brachliegende Units haben [bedingt durch lange Pipeline und mehrfach vorhandene Units], um überhaupt Vorteile aus SMT ziehen zu können? Das war doch einer der Gründe warum SMT beim P4 u.U. sinnvoll war, oder? Beim Core2+ (kurze Pipeline) ist es ja die 4-fach superskalar ausgelegte Architektur [die der K10 nicht hat, bzw. nur 3fach] , welche nicht immer optimal ausgelastet werden kann. Oder täusche ich mich da?
 
Das mit dem superskalar ist immer so ne Sache, genaugenommen bezieht sich das nur auf die Int-Einheiten. Besser ist es, wenn man von den Funcional Units (FU) / Funtkionseinheiten spricht, davon gibts bei AMD 9 Stück, da sind also genügend, um von HT einen Vorteil zu haben. Ausserdem ist ja auch das "Verstecken der Speicherlatenz" ein Hauptvorteil von SMT, das hätte mit der Unitanzahl sogar rein gar nichts zu tun.

ciao

Alex
 
Jo, aber wieviele Leute kaufen sich nicht heuzutage nen QuadCore Intel, obwohl sie den eigentlich nicht brauchen .. der billigste nehalem wird anfangs wohl so bei ~€250 plus nem teureren board liegen, die meisten hardware freaks werden sich das schon leisten ...

Aber naja mal abwarten, der 45nm Phenom könnte mit weniger Verlustleistung und dem vergrößertem Cache punkten.

ciao

Alex


Die wenigsten kaufen sich eigentlich einen Quadcore das tun meistens nur die Freak so wie ich.

IM OEM-Geschäft setzt sich der Quadcore langsam auch durch aber auch nur weil ein Q6600 gerade so schön preiswert ist. Siehe die neuen Rechner von Medion.
 
Die wenigsten kaufen sich eigentlich einen Quadcore das tun meistens nur die Freak so wie ich.

IM OEM-Geschäft setzt sich der Quadcore langsam auch durch aber auch nur weil ein Q6600 gerade so schön preiswert ist. Siehe die neuen Rechner von Medion.

Freak?

Was sind dann leute die 7 Quads und mehr besitzen? ;D
 
Freak?

Was sind dann leute die 7 Quads und mehr besitzen? ;D

Chruncher.... ;D

Mich würde ja interessieren, wie der Nahelem bei verschiedenen Distributed Computing Projekten abschneidet. (Damit kann ich irgendwie besser vergleichen als mit Cinebenches o.ä. *buck* )

Grüße
 
Mich würde ja interessieren, wie der Nahelem bei verschiedenen Distributed Computing Projekten abschneidet. (Damit kann ich irgendwie besser vergleichen als mit Cinebenches o.ä. *buck* )
Durch HTh sicherlich ähnlich viel wie bei cinebench / winrar. Gefahr ist nur die Speicherbandbreite & Caches. Bei DC lässt man ja mehrere Prozesse mit unterschiedlichen Daten laufen, das beansprucht das Speichersubsystem viel mehr als cinebench, das ja nur 1 Bild berechnet. Allerdings sollte Nehalem mit dem Triple DDR3 und 8 MB L3 genügend Bandbreite haben.

Ich würde also Pi*Daumen sagen, dass man bei DC ähnliche Speed wie bei cinebench erreicht, allerdings mit der deutlichen Ausnahme der "Monster" Projekte bei denen die WUs ~200 MB RAM (und viel mehr) brauchen. Da wird dann bei 8 Threads vielleicht sogar der Triple MC zu eng, bzw. die 8 MB L3 zu klein.

Was passiert, wenn man zuwenig Bandbreite hat, sieht man am Atom Chip. Bei Cinebench erreicht man durch HT ~50% Mehrleistung, bei 2xSeti erreicht man dagegen nichts. Ein P4 mit HT dagegen ist auch mit 2 Seti Prozessen ~30% schneller, der hat aber halt auch ein Dual channel RAM Interface. Wenn es den kommenden dual core Atom 330 mit nem dual channel Chipsatz gäbe (am besten gleich DDR3), wär das stromverbrauchstechnisch sicherlich ein sehr guter Crunsh Prozessor.

@Oi!Olli:
Deswegen meinte ich ja, dass sich die "Freaks" (die heute schon nen QuadCore haben) auch nen Nehalem leisten werden :)

ciao

Alex
 
Zuletzt bearbeitet:
Weil sich kein AMD Entwickler damit auskennt ^^

on topic: wieder mal ein Nehalem Test:
http://www.hexus.net/content/item.php?item=15015&page=1

Der Chip lief mit 2,93 GHz und Triple channel DDR3-1066. Als AMD Vergleich gibts ein 9950 System mit 2,6 GHz.
Bei Cinebench und povray (multithreaded), ist der Nehalem dank HTh nicht weniger als doppelt so schnell wie der K10, leider geben die hexus Leute nicht die cinebench single-thread Ergebnisse an :(

ciao

Alex

Wenn ich mir aber die anderen Benches so an sehe sind es überschlagen etwa 20%. Das ist in etwa das was wischen x2 und C2D liegt, also nicht uneinholbar. HT wird dem Nehalem im Heimbereich nur bei Codieren helfen sonst eher die CPU bremsen, leider gibt es immer noch zu wenig Software die 4 Kerne unterstützt, beim Nehalem müsste die Software 8(!!!) Kerne unterstützen mir fällt da nur h.264 ein.

Im Server- Bereich werden sich natürlich alle Freuen und Intel hat ein Ziel wahrscheinlich erreicht AMD's Opteron aus dem lukrativen Servermarkt zudrängen. Dumm nur das der Barcelona/Shanghai dafür entwickelt wurde und AMD nun weder im Home- noch Servermarkt richtig Punkten kann. Hoffen wir auf einen Opteron 2 nach dem Shangai und das dieser Hilft die lange Durststrecke die AMD noch vor sich hat zu überwinden.

EDIT:
2x etwas -> etwa
 
Zuletzt bearbeitet:
Wenn ich mir aber die anderen Benches so an sehe sind es überschlagen etwas 20%. Das ist in etwas das was wischen x2 und C2D liegt, also nicht uneinholbar.
Jo single-thread wird sicherlich nicht übermäßig beschleunigt, aber es reicht auf alle Fälle um AMD in Schach zu halten. Ich wär ja schon froh, wenn es der Deneb/Shanghai auf C2Q Niveau schaffen würde, sowohl IPC- als auch taktfrequenzmäßig.

Zum Serverthema:
AMD schaut da v.a. im virtualisierten Umfeld sehr stark aus (wg. nested tabels):
http://searchservervirtualization.techtarget.com/news/article/0,289142,sid94_gci1322012,00.html

Nehalem wird da wohl gleichziehen, aber AMD legt nächstes Jahr dann mit den neuen Mainboards mit HT3 zwischen den CPUs, und der RD8xx Chipsatz mit zusätzlicher I/O Virtualisierung nach. Mal schauen, wie es dann bei Intel bestellt ist...

ciao

Alex
 
Zuletzt bearbeitet:
Nehalem wird da wohl gleichziehen, aber AMD legt nächstes Jahr dann mit den neuen Mainboards mit HT3 zwischen den CPUs, und der RD8xx Chipsatz mit zusätzlicher I/O Virtualisierung nach. Mal schauen, wie es dann bei Intel bestellt ist...

ciao

Alex

Dazu kommt ja noch der 6 Kerner Istanbul. Letztendlich zeigts doch das Intel auch nur mit Wasser kocht und der Nehalem keine Wundercpu ist. Für den Serverbereich seh ich eigentlich kaum große Probleme. Über Performance/Preis wird man immernoch sehr gut mithalten können da Kosten/Nutzen immernoch im Vordergrund stehen.

Bin auch gespannt wie schnell sich die Softwareindustrie im Desktopbereich auf die Architekturen von Nehalem und K10 forciert.
 
Zuletzt bearbeitet:
Anandtech hat ne Art IDF Blog:
http://www.anandtech.com/cpuchipsets/intel/showdoc.aspx?i=3377

Ziemlich viele Infos dort.

Vielleicht das interessanteste Feature für die "Freaks"
4:15PM - Turbo mode will be available in i7. This will allow the CPU to actually increase single threaded performance by increasing frequency of cores dynamically. When not all cores are in use, there will be more head room (meaning single threaded apps will see a benefit from having cores not in use). Note that this is a different turbo mode from what we've had in Penryn, Intel is actually promising a performance boost here.

Damit sollten dann auch dual core Spiele schneller laufen.

ciao

Alex
 
Damit sollten dann auch dual core Spiele schneller laufen.
In der Theorie gut, in der Praxis wird man es sehen ob der scheduler es schafft die Prozesse auf einem Core zu halten, denn wenn er, wie bei SMP üblich, die Prozesse ständig migriert bringt das genau nichts....

lg
__tom
 
In der Theorie gut, in der Praxis wird man es sehen ob der scheduler es schafft die Prozesse auf einem Core zu halten, denn wenn er, wie bei SMP üblich, die Prozesse ständig migriert bringt das genau nichts....
Da gibts 2 unterschiedliche Modi.

Der besten Modus hängt vom OS ab, wie Du es beschrieben hast, der etwas schwächere "overclocker" Modus geht auch mit 4 aktiven Cores, die wenig beansprucht (d.h. <TDP) sind. siehe Seite 125 im Nehalem PDF:

http://intel.wingateweb.com/US08/published/sessions/NGMS001/SF08_NGMS001_100s.pdf

Wieviel Mehrleistung das dann bringen wird ... *noahnung*

ciao

Alex
 
PCGamesHardware:
IDF San Francisco 2008: Beeindruckende Nehalem-Benchmarkwerte
3x soviel Leistung wie ein Core 2 Extreme QX9770 im Cinebench-R10 :o

Oh je hoffentlich bleibt das die Ausnahmen, sonst ist AMD wirklich weg vom Fenster :(
cb hat die besseren Screenshots:
http://www.computerbase.de/news/har...el/2008/august/idf_benchmarks_intels_nehalem/

Frage mich, was die hexus Typen gemessen haben, die hatten bei cinebench nur 17000 Punkte. Zwar mit nur 3 GHz statt 3,2 GHhz, aber soviel sollte das nun wirklich nicht ausmachen. Aber naja, war wohl ne künstliche Bremse eingebaut, hat man ja oft bei Testsystemen.

cb hat auch noch einen Spielebench, dort wirken sich die vielen Threads bei nem Spiel Lost Colonies ebenfalls positiv aus, ansonsten sollte Nehalem bei Spielen aber nicht viel verbessern, schreib zumindest Anand (und ich bin der gleichen Meinung):
In a previous post I told you that most games really like the huge L2 of the Core family. With Nehalem they are getting a 32 KB L1 with a 4 cycle latency, next a very small (compared to the older Intel CPUs) 256 KB L2 cache with 12 cycle latency and after that a pretty slow 40 cycle 8 MB L3. When running on Penryn, they used to get a 3 cycle L1 and a 14 cycle 6144 KB L2. That is a 24 times larger L2 than Nehalem!
http://www.anandtech.com/weblog/showpost.aspx?i=480

Laut Intel IDF Datenblatt hat der L2 zwar 10 cycles, was toll ist, aber nicht die Einschätzung ändert :)

Edit:
Hatten wir die Seite hier schon mal:

http://www.nehalemnews.com/ ?

ganz hübsch ...

ciao

Alex
 
Zuletzt bearbeitet:
Frage mich, was die hexus Typen gemessen haben, die hatten bei cinebench nur 17000 Punkte. Zwar mit nur 3 GHz statt 3,2 GHhz, aber soviel sollte das nun wirklich nicht ausmachen. Aber naja, war wohl ne künstliche Bremse eingebaut, hat man ja oft bei Testsystemen.

Denke eher die haben es irgendwie geschafft den Cinema4d 11.0 renderer in cinebench 10 zu implementieren also quasi eine Cinebench11 Version. Der Unterschied zwischen Cinema4d 10 und 11 renderer ist brachial, in Zahlen ausgedrückt ca 2.5x so schnell (was dann auch perfekt passt 2.5*17000=42500). Ansonsten wirken die Werte ja einfach unrealistisch, Nehalem wird zware besser skalieren ist aber niemals 3 mal so schnell, das glaub ich einfach nicht. ;D

Übrigens packt mein kleiner Phenom den QX9770 auch locker

cinebench11o8m.jpg


;D
 
Zuletzt bearbeitet:
Zurück
Oben Unten