Intel 8-Kerne gegen AMD 8-Kerne in iX 3/07

nazgul99

Grand Admiral Special
Mitglied seit
01.05.2005
Beiträge
3.592
Renomée
224
Standort
Irgendwo in der Nähe
Seite 72ff.
(ich hab das Ganze hier heute Vormittag auch auf Ace's gepostet, falls sich einer wundert)

- 4 Opteron 8218, 16 GByte Ram
- 2 Xeon 5355, 16 GByte Ram

Also: gleich viele Cores (acht), gleich viel Ram, gleich viel Plattenplatz (300GB). Der Rest stimmt hoffentlich auch möglichst weitgehend überein. Der Test ist von Ralph Hülsenbusch, wer ihn kennt, weiß daß er kein Spinner ist.

(Edit: Link auf die abfotografierte Grafik aus dem Heft auf Verlangen seitens P3D entfernt. Kein Problem, P3D soll meinetwegen keinen Prozess an den Hals bekommen 8))

X = Xeon X5355 2.6 GHz
O = Opteron 8218 2.6 GHz
64/32 bitness
L = Linux
W = Windows
T = thread count
Code:
[FONT="monospace"]
                          X64L  X32L  O64L  O32L  X64W  O32W
SPECint_base2006 1T       13.8  14.6   9.2   9.6  14.5   9.4
SPECfp_base2006 1T        13.8  12.9  10.7   9.7  13.5   9.4
SPECint_rate_base2006 8T  52.0  58.0  67.0  71.0  51.0  67.0
SPECfp_rate_base2006 8T   40.0  37.0  61.0  64.0  36.0  57.0
[/FONT]

Ich finde das Ganze besonders interessant in Bezug auf Barcelona, den Werten nach kann es gut sein, daß die von AMD angegebenen Werte (FP mindestens 40% schneller als Cloverton in vielen Anwendungen) tatsächlich stimmen könnten. Natürlich ist SPECfp sehr Ram-Bandbreitenabhängig, diese wird bei Barcelona 50% oder 40% (falls RDDR2-800) geringer sein als bei Opteron-F3. Der Takt wird 8% oder so (2,4 GHz vs. getestete 2,6 GHz, ich weiß daß es Taktvoraussagen gibt, aber wir wissen nicht wie akkurat sie sind) niedriger sein, 20% niedriger gegen einen zu erwartenden 3GHz Cloverton.

Preis-Performance-Kalkulation:
Dieses und dieses System mit 4x Opteron 8218 and 8x 1GB RDDR2-667 bzw. Xeon X5355 mit 8x 1GB FB667, konfiguriert, alles andere Default. Dazu habe ich desn Stromverbrauch nur von CPUs und Ram kalkuliert (ob die Opteron-Preise von vor oder nach der Preissenkung stammen, weiß ich nicht):
Opteron: €7361, 4x95W + 8x2W = 396W
Xeon: €5453, 2x120W + 8x6W = 288W

Mit HE-Opteron 8218 (68W, gerade auf den Markt gebracht): 288W auch für Opteron, Preis dann wieder anders, aber dank Preissenkung vielleicht auch nicht.

Edit: Bestätigung. 8218 sinkt von $1514 auf $1165, 8218HE wird $1340 kosten, also 77% und 89% der derzeitigen Preise. Das wären theoretisch €1278 oder €637 Ersparnis in Euro, 4 CPUs, incl. USt. Dann Xeon-Preis vs. Opteron = 90% oder bei Opteron_Strom = Xeon-Strom Xeon-Preis = 81% Opteron-Preis. Sehr theoretisch natürlich. (Ende Edit)

Der Xeon-Preis ist 74%, Stromverbrauch 78% (HE: 100%) im Verhältnis zum Opteron. Performance ist grob 66% (worst-for-Opteron fp_rate O/X32L). Selbiges O/X32L: 82%.

Ich weiß, dies sind willkürlich ausgewählte Barebones (der erste Google-Treffer den ich für das SuperMicro-Barebone fand gegen ein Intel-eigenes Barebone). Xeon-Systeme dieser Art (1HE) kann man sicher auch mit 4 3,5"-Platten finden, Opteron bietet doppelt so viele Ram-Slots ("günstige" 32GB, bis zu 64GB), nur einen Steckkarten-Slots, Xeon wiederum gibt's mit redundanter Power, Opteron x4 1HE wohl nicht. Den Stromverbrauch der Chipsätze und anderen Geraffels weiß ich nicht. Beim Xeon spart man in vielen Fällen Lizenzen (wenn's um Sockel-Zahl geht).

Es sieht also so aus, als könnten sogar gegenwärtige Opteron-Systeme in einigen Anwendungsfällen gegen Cloverton anstinken, sicher aber (und das ist das eigentlich Interessante für mich) Barcelona. 8)
 
Zuletzt bearbeitet:
Hi,


auf hexus.tv war ein live Interview mit dem Leiter der Server Abteilung und die 40% beziehen sich auf single threaded Anwendungen,bei multi threaded kann es auch mehr als 100% sein.
Das konnte ich dem Text entnehmen.Ist zwar Marketing,aber ein Funken wir schon wahr sein.



mfg
 
auf hexus.tv war ein live Interview mit dem Leiter der Server Abteilung und die 40% beziehen sich auf single threaded Anwendungen,bei multi threaded kann es auch mehr als 100% sein.
Das konnte ich dem Text entnehmen.Ist zwar Marketing,aber ein Funken wir schon wahr sein.
Das wäre krasser als krass. Gibt's einen Link dazu? Oder senden die nur 'live' ohne Archiv?

EDIT:
Gefunden: http://www.hexus.tv/show.php?show=28 LOL, Gesponsort von Intel 8)
Pat Patla, von dem stammen auch die bisherigen 40% Aussagen.
So wie ich das verstanden hab, gibt er weiterhin 40% "in a wide range of server applications" an, im Kontext (er sollte auf single threaded antworten, er hat aber drum rum manövriert) klang das nach multi-threaded. Für single-threaded im best case gab er 80% an. Es gab in dem Kontext einmal eine Aussage (02:58 ) "one hundred ... klitzekleine Pause ... twenty-eight bit" .. blafasel SSE-breite, vielleicht hast du die Stelle falsch verstanden (hatte an der stelle im ersten Moment auch gedacht, ich hör was mit 100)?

02:26 "40% advantage over Cloverton in the time frame when we launch our Barcelona Product for many server application workloads"
usw. Nachfrage nach single threaded:
03:24 "Er depending on the application anywhere upto 80% faster"
 
Zuletzt bearbeitet:
das [ code ] tag hilft beim formatieren.
Danke, geändert, ist aber immernoch Proportionalschrift mit zu schmalen Leerzeichen.
Aha:
HTML:
[CODE][FONT="monospace"]
funktioniert! 8)

Anmerkung: ich hab die "Verdammt"-Zeile, auf die du reagiert hast, rausgenommen. Nicht daß sich einer wundert auf was du da antwortest ;D
 
Diese 80% Verbesserung riecht allerdings etwas nach der Steigerung, die man durch einfache Coreverdoppelung bekommt. Immerhin darf man nicht vergessen, daß er nur von Barcelona redet, der ja nur als Quad kommt, die davon abgeleiteten DualCores kommen ja später und wohl nur für den Desktop, was ja nicht seine Sparte ist. Die bisherigen Sockel F-Opterons sind ja alle DualCores. Wenn man also den neuen Opteron gegen den aktuellen Opteron hält, hat man immer automatisch einen Coreverdoppelung, die man - wenn man ein halbwegs fähiger Marketingmensch ist - eben nicht seriöserweise rausrechnet.

Andererseits wären +80% für eine Coreverdoppelung, bei der jeder Core auch noch im IPC verbessert wurde, nicht berauschend, sogar ziemlich mies (wie der Test oben zeigt, sind ja bei der Opteron-Plattformarchitektur annähernd 100% zu erwarten, bei unveränderten Cores). Aber dabei darf man auch nicht vergessen, daß die Taktfrequenzen wiederum mehrere hundert MHz niedriger werden. Als geschickter Marketingfritze würde man auch das geflissentlich und skrupellos vermischen, um einen schön unsauberen Äpfel-Birnen-Vergleichssalat zu bekommen, mit dem man alles mögliche und gleichzeitig das Gegenteil davon beweisen kann.
 
Zuletzt bearbeitet:
In einem anderen Interview hat Patla (IIRC) maximal 320% Geschwindigkeit für SSE im Vergleich zu den gegenwärtigen DualCores bei gleicher Taktgeschwindigkeit angegeben. Die 80% gelten klar für core-for-core, selbe Taktfrequenz.

Mal kurz veranschaulicht: angenommen, du willst 32bit-Werte per SSE bearbeiten, so kannst du bei einer 64bit SSE-Unit zwei davon auf einmal durchschieben, bei SSE128 doppelt so viele. Sofern die vorherigen Stufen mithalten natürlich, deshalb MAXIMAL 80%, nicht 100. Gleiches gilt für 64bit-Werte, bei einem 128bit-wert heißt es für K8 (wieder IIRC) das Ding in 2 Takten zu verarbeiten, SSE128 kann das logischerweise in einem.
Deubel wenn ich wüßte wo ich das herzuhaben meine, wo gibt's denn 128bit SSE-Werte? Double Precision (skalar) ist schon bloß 64 Bit breit.
 
Das kann dann aber wirklich nur in wenigen Spezialfällen auch in ebenso hohe Gesamtperformance umgemünzt werden, oder? Ich meine, sonst hätten AMD und Intel das ja alles viel früher gemacht, wenn es so einfach wäre. Einfach haufenweise gleich 256bittige oder noch besser 512bit-SSE-Einheiten hinklatschen, et voilà! das Teil geht ab wie der sprichwörtliche Stubentiger des Altbundeskanzlers. So kanns ja auch nicht gehen.
 
Das kann dann aber wirklich nur in wenigen Spezialfällen auch in ebenso hohe Gesamtperformance umgemünzt werden, oder?
Jupp. Nur wenn der Code zu maximalem Anteil aus SSE-Befehlen und passenden mit gleichem Befehl zu bearbeitenden besteht.
Ich meine, sonst hätten AMD und Intel das ja alles viel früher gemacht, wenn es so einfach wäre. Einfach haufenweise gleich 256bittige oder noch besser 512bit-SSE-Einheiten hinklatschen, et voilà! das Teil geht ab wie der sprichwörtliche Stubentiger des Altbundeskanzlers. So kanns ja auch nicht gehen.
Dummerweise kostet das Transistoren, das größere Problem wird aber sein, daß man die SSE-Einheit auch füttern muß, bei 256bit wärde also vermutlich nur ein Bruchteil der Steigerung möglich, wenn es jetzt schon Brems-Effekte gibt. Schließlich sind die Caches und somit auch das restliche Speichersystem mit 128bit angebunden (gegenwärtig 64bit Caches, 128bit Ram, daher kein Fullspeed-Ram-Zugriff bei DDR2-800 unterhalb 3,2 GHz Core-Frequenz). Obendrein bestehen nur ein paar Applikationen zu signifikanten Teilen aus SSE-Befehlen, das Ganze lohnt also nur bedingt. Es ist wie immer eine Frage der gesunden Mischung :-)

Ich laß mich gern von besser wissenden korrigieren, wenn hier (bestimmt) was nicht stimmt 8)
 
Naja ich hab ja auch null Ahnung, versuche nur Gehörtes zusammenzureimen, ohne dabei zu euphorisch zu werden, denn dann wird man regelmäßig enttäuscht (nicht nur bei Computerspielen^^). *noahnung*

Übrigens: Hab ich nicht gelesen, daß sie den Cache jetzt endlich auch mit 128bit angekoppelt haben?
 
Naja ich hab ja auch null Ahnung, versuche nur Gehörtes zusammenzureimen, ohne dabei zu euphorisch zu werden, denn dann wird man regelmäßig enttäuscht (nicht nur bei Computerspielen^^). *noahnung*
Gute Taktik :) Natürlich werden wir erst "wissen", wenn harte Fakten vorliegen.
Übrigens: Hab ich nicht gelesen, daß sie den Cache jetzt endlich auch mit 128bit angekoppelt haben?
Hab ich doch geschrieben: "Schließlich sind die Caches und somit auch das restliche Speichersystem mit 128bit angebunden (gegenwärtig 64bit Caches ...)"

Edit: Das hier kannte ich noch nicht:
http://www.behardware.com/news/8484/amd-to-demonstrate-the-quad-core.html

Boah sind die Fotos beknackt ;D

46% für Spec_fp, laut einer Quelle im Ace's Forum SPECfp_rate_2000. Und 13% für TPC OLTP. Letzteres ist ein Datenbank/Integer-Wert, mehr weiß ich darüber nicht. Beide Werte im Vergleich zu Xeon X5355. Mit einem 3,0 GHz Xeon könnte Intel theoretisch den TPC-Wert beinahe einholen (3 GHz = 112% von 2,67 GHz).
 
Zuletzt bearbeitet:
So wie ich ihn verstanden habe auf hexus.tv bezogen sich die 80% auf die alte K8 Technologie.Abwarten und Tee trinken,da kommt schon was schönes.;D


mfg
 
So wie ich ihn verstanden habe auf hexus.tv bezogen sich die 80% auf die alte K8 Technologie.Abwarten und Tee trinken,da kommt schon was schönes.;D
Ähm ja, hast recht. Bin mit den vielen Zahlen mittlerweile völlig durcheinander :-/
 
X = Xeon X5355 2.6 GHz
O = Opteron 8218 2.6 GHz
64/32 bitness
L = Linux
W = Windows
T = thread count
Code:
[FONT="monospace"]
                          X64L  X32L  O64L  O32L  X64W  O32W
SPECint_base2006 1T       13.8  14.6   9.2   9.6  14.5   9.4
SPECfp_base2006 1T        13.8  12.9  10.7   9.7  13.5   9.4
SPECint_rate_base2006 8T  52.0  58.0  67.0  71.0  51.0  67.0
SPECfp_rate_base2006 8T   40.0  37.0  61.0  64.0  36.0  57.0
[/FONT]
Die Vernetzung per Hypertransport ist das absolute Plus des Opteron, das selbst die schlechtere IPC ausgleicht.

Der Barcelona wird hier noch etwas nachholen und auch bei der IPC-Integer zulegen.
Dafür aber bei Taktraten zwischen 2 und 2,5 GHz starten, was bei den schnellsten 90nm Opteronen im Verbund die Leistung wieder relativiert.
Ebenso ist das Taktpotential des Xeon nicht schlecht und per 45nm hat Intel noch Reserven in der Hand.

Nach dem Überflieger Opteron seit 2003 und dem Überflieger Conroe u.ä. sieht es bald nach einem Kopf an Kopf Rennen bei Servern mit wenigen Cores/ Sockets und klaren Vorteil bei vielen Cores für AMD aus.

Ich erwarte daher, daß auch im Desktop/ Notebook Bereich die Performance von Intel und AMD sich annähern werden.
 
Der Barcelona wird hier noch etwas nachholen und auch bei der IPC-Integer zulegen.
Dafür aber bei Taktraten zwischen 2 und 2,5 GHz starten, was bei den schnellsten 90nm Opteronen im Verbund die Leistung wieder relativiert.
Ebenso ist das Taktpotential des Xeon nicht schlecht und per 45nm hat Intel noch Reserven in der Hand.
Das Taktpotenzial mag hoch sein, bei 4 Kernen ist es aber klar durch die TDP begrenzt. Ich würde nicht so schnell mit einem 4-Core-Xeon oberhalb 3 GHz rechnen. Was 45nm angeht: AMD gibt an, schon ein halbes Jahr später nachzuziehen, so ist das "Zwischenhoch" für Intel recht kurz.
Gute Chancen für AMD im (mehr-Sockel-)Server-Bereich jedenfalls. Wie auf dem Desktop und mit Notebooks aussieht, ist eine andere Frage. Letztere bekommen in Kürze neuen Shub durch den 690er Chipsatz, dessen Stromsparmöglichkeiten und die Möglichkeit, (stromhungrige) diskrete Grafik nur im Bedarfsfall zu aktivieren - es wird dauern, bis Intel oder Nvidia da nachziehen können. Als nächstes folgen dann die K8L-2-Core-Notebook-CPUs (4-Core ~35W sicher erst in 45nm), allerdings nicht vor 3Q07.
Desktop: wieder Barcelona, etwas früher im 3. Quartal. Und die 2-Kern-Variante. Im Integer-Bereich wird der es immernoch nicht zu leicht haben gegen Core 2 Quad, vermutlich ein Patt. Bei FP/SSE dürfte AMD auch auf dem Desktop (1 Sockel) klar obsiegen, fragt sich nur, wie sich der ganze Mix auf die verschiedenen Benchmarks niederschlägt. Für den Fall der Fälle gibt's dann natürlich noch die 2-Sockel-Lösung, die Intel vor CSI, native Quadcore und ODMC nicht wird übertrumpfen können.
 
Zurück
Oben Unten