Wie stark profitiert der Core2 vom L2-Cache?

NOFX

Grand Admiral Special
Mitglied seit
02.09.2002
Beiträge
4.532
Renomée
287
Standort
Brühl
  • RCN Russia
  • Spinhenge ESL
Genau dieser Frage sind die Kollegen von NordicHardware nachgegangen und haben drei Prozessoren mit 1MB, 2MB und 4MB Shared-L2-Cache miteinander verglichen.

Bei den getesteten CPUs handelt es sich um einen Core2 Duo E6320 (4MB), einen E6300 (2MB) und einen Pentium E2160 (1MB). Um gleiche Voraussetzungen zu schaffen wurden alle Prozessoren auf einen Takt von 2,33GHz (7*333MHz) getaktet und unterscheiden sich nur noch durch die Größe des L2-Caches; die Virtualisierungstechniken einmal außen vor gelassen.

Der Vorsprung des 4MB-Modells gegenüber seinem kleinsten Bruder liegt im Rahmen von 0 bis gut 20%, wobei vor allem die 3DMark-Versionen, SuperPi und Spiele den vorhandenen Mehrspeicher honorieren.

<b>Link:</b> <a href="http://www.nordichardware.com/Reviews/?page=1&skrivelse=514" target="b">Intel Core 2 Duo Performance: L2 cache</a>
 
Ich hab mal ausgerechnet wieviel das durchnittlich bringt. Der Core 2 Duo E6320 (4MB) bringt durchschnittlich 7,7% mehr Performance als der Pentium E2140 (1MB) und der Core 2 Duo E6300 (2MB) bringt durschnittlich 4,5% mehr Performance als der Pentium E2140 (1MB).
Schade, dass AMD nicht so effizient arbeitet, dass die sich auch derartige Caches leisten können.
 
Schade, dass AMD nicht so effizient arbeitet, dass die sich auch derartige Caches leisten können.

hä?! Der K8-Architektur (u.ä.) bringen so große Caches garnichts, da der intergrierte Memorycontroler die CPU besser mit Daten versorgt, als der FSB von Intel.

Btw. Ist AMD um einiges kleiner als Intel, was dafür sorgt, dass sie es sich nicht leisten können für einen relativ geringen leistungsvorteil soviel Die-Fläche zu verschwenden.
 
Mit den neuen AMDs wird alles anders. :)

Zum ersten L3 Cache und zum zweiten vermutlich bald z-RAM.
 
Ich hab mal ausgerechnet wieviel das durchnittlich bringt. Der Core 2 Duo E6320 (4MB) bringt durchschnittlich 7,7% mehr Performance als der Pentium E2140 (1MB) und der Core 2 Duo E6300 (2MB) bringt durschnittlich 4,5% mehr Performance als der Pentium E2140 (1MB).
Schade, dass AMD nicht so effizient arbeitet, dass die sich auch derartige Caches leisten können.
7,7% klingt nach nichts, aber der Unterschied X2 6400+ und X2 6000+ beträgt 'nur' 6,7% und AMD schafft sich angefangen von der TDP da viele Probleme durch solche Taktorgien.

Die aktuellen 512k L2 je Core hatte schon der Barton /2003 und da betrug der ges.DRAM-Speicher im PC typ. 256M bis 512M. Heute haben wird bei Vista 2G als Sollwert, aber der L2 wuchs nicht passend an.

Bei Spielen ist der L2 von Vorteil, was aber Interesse der größten Käufergruppen bei Intel und AMD darstellt. AMD sieht nur nach der Opteron-Kundschaft und geht daher leider mit Bonsai-Speichern in den Markt. Nachdem Stepping G1 für L2 bis 2M je Core gerüstet ist sind die 512k schon ein Jammer.

Im übrigen greift der C2D auch sehr schnell auf das DRAM was sich beim Penryn nochmals verbessern soll. Damit sind die Zahlen C2D und K8 vergleichbar und decken sich teils mit Untersuchungen am K8.
Der shared-L2 bringt bei einseitig belasteten Cores für den unter Last arbeitenden Core nochmals Vorteile. In jenem Sinne ist ein C2D optimal für die Hauptkunden designed, während der K8 und K10 unter dem Blickwinkel Server-Applikation entworfen wurde.

Wahrscheinlich könnte der K10 per eDRAM als L3 trotz nur 512k-L2 perfekt gegen den Penryn punkten und währe in der Fertigung ein 'Billig-Design'. Aber, das AMD-Management kennt nur Opteron (und Verluste je Quartal) aber hat keinen winzigen Blick in Richtung Bedarf seiner Mainstream-Kunden.
Auchdem gibt es ab Q1'08 genügend Fertigungskapazität um auch Cache üppig auszuliefern. Ich tippe mal, das der Marktzwang dann in Q2'08 AMD dazu bringen wird nur die L3-Variante des Dual-Core K10 noch im Mainstream zu plazieren und den K10 ohne L3 zu streichen. Aber wie immer wird AMD dies erst kurzfristig entscheiden bzw. anhand rückläufiger Verkaufszahlen.
Intel gibt 2008 bei geringfügig höherer Latenzzeit beim DRAM-Zugriff die 6M Cache als Vorgabe im Mainstream offensichtlich vor. AMD wird da mithalten müssen oder eben wieder gigantische Verluste einfahren. In der Entwicklung hingenen sind große L3 für den K10 sehr kostengünstig, müßten aber jetzt/frühzeitig gestartet werden. Nachdem bei AMD dafür keine Anzeichen verfügbar sind wirds eben wieder Dumping-Preise - AMD lernt es waohl nie ???
 
das fand ich ma interessant :)
Danke für den Vergleich

Ich hab mich auch schon gefragt, wieviel schneller mein Sys werden wird, wenn es den Core2Duo E6320 drin hat, statt wie jetzt den 6300....
Unmerklich schneller also :)
 
Der größere Cache bringt bei AMD so gut wie nix, das stimmt schon, aber mit dem L3-Cache wird, wenn dieser dann größer ist (so 4MB oder so) dann schon einiges an Performance zurückgewonnen.

Ich persönlich werd mir vermutlich einen 6000+ EE zulegen und schaun ob ich ihn auf 3,2GHz bring um die DDR2-800 voll auszunutzen. Bei meinem 4400+ (2,1 GHz) hab ichs immerhin auf 2,9GHz geschafft. Beim 6000+ bräuchte ich dann ja nur 200Mhz übertakten, das sollte schaffbar sein.

Rein rechnerisch reicht ein Ref-Takt von 214 bereits aus um 401 MHz RAM-Takt zu erreichen, also ich erkenn im 3000+ EE das was der XP 3200+ für Sockel-A war, mit einem Übertaktungsbonus.

Bis die Quad Phenom dann mal so 3GHz haben und in einem gutem Stepping erscheinen dauerts noch bis nächstes Jahr schätz ich, und somit wär ich mit dieser Wahl dann bestens bedient
 
Zuletzt bearbeitet:
Der größere Cache bringt bei AMD so gut wie nix, das stimmt schon, aber mit dem L3-Cache wird, wenn dieser dann größer ist (so 4MB oder so) dann schon einiges an Performance zurückgewonnen.
AMD 'spielt' schon seit Beginn des K8 beim Cache, s. 3200+/ 3000+ bei 1M /512k L2.
Oder dem 90nm X2 3600+ mit 2* 256k oder jüngst X2 TK-53 mobil.
Dann noch die Semprone ...

Viele Untersuchungen beim K8 stammen zudem noch aus längst vergangenen Zeiten mit kompakteren Applikationen und Netburst als Vergleich.

Es wird Zeit für genauere Untersuchungen bzgl. Cache, wobei man sich C2D-ähnliche Ergebnisse vorstellen kann.

Größe L3 bringen AMD sicherlich auch etwas, nur hierzu gibt es nur für 45nm und Shanghai = 6M schon Informationen. Intel hingegen wird beim Desktop per Penryn ab 2008 dann 6M-Cache im Dual-Core Mainstream plazieren und 12M beim Quad.
Auch ein K10 kann die Wartezeit auf das DRAM nicht wegzaubern, was ihm beim Spar-Cache-Design von AMD bei einigen Applikationen Nachteile einbringen wird.
 
Die aktuellen 512k L2 je Core hatte schon der Barton /2003 und da betrug der ges.DRAM-Speicher im PC typ. 256M bis 512M. Heute haben wird bei Vista 2G als Sollwert, aber der L2 wuchs nicht passend an.

Bei Spielen ist der L2 von Vorteil, was aber Interesse der größten Käufergruppen bei Intel und AMD darstellt. AMD sieht nur nach der Opteron-Kundschaft und geht daher leider mit Bonsai-Speichern in den Markt. Nachdem Stepping G1 für L2 bis 2M je Core gerüstet ist sind die 512k schon ein Jammer.

Im übrigen greift der C2D auch sehr schnell auf das DRAM was sich beim Penryn nochmals verbessern soll. Damit sind die Zahlen C2D und K8 vergleichbar und decken sich teils mit Untersuchungen am K8.
Der shared-L2 bringt bei einseitig belasteten Cores für den unter Last arbeitenden Core nochmals Vorteile. In jenem Sinne ist ein C2D optimal für die Hauptkunden designed, während der K8 und K10 unter dem Blickwinkel Server-Applikation entworfen wurde.

Wahrscheinlich könnte der K10 per eDRAM als L3 trotz nur 512k-L2 perfekt gegen den Penryn punkten und währe in der Fertigung ein 'Billig-Design'. Aber, das AMD-Management kennt nur Opteron (und Verluste je Quartal) aber hat keinen winzigen Blick in Richtung Bedarf seiner Mainstream-Kunden.
Auchdem gibt es ab Q1'08 genügend Fertigungskapazität um auch Cache üppig auszuliefern. Ich tippe mal, das der Marktzwang dann in Q2'08 AMD dazu bringen wird nur die L3-Variante des Dual-Core K10 noch im Mainstream zu plazieren und den K10 ohne L3 zu streichen. Aber wie immer wird AMD dies erst kurzfristig entscheiden bzw. anhand rückläufiger Verkaufszahlen.
Intel gibt 2008 bei geringfügig höherer Latenzzeit beim DRAM-Zugriff die 6M Cache als Vorgabe im Mainstream offensichtlich vor. AMD wird da mithalten müssen oder eben wieder gigantische Verluste einfahren. In der Entwicklung hingenen sind große L3 für den K10 sehr kostengünstig, müßten aber jetzt/frühzeitig gestartet werden. Nachdem bei AMD dafür keine Anzeichen verfügbar sind wirds eben wieder Dumping-Preise - AMD lernt es waohl nie ???

Oh Gott! Wie kann man nur so einen gequirlten Schwachsinn reden?! *nein*

Sorry rkinet.
 
Zuletzt bearbeitet:
hä?! Der K8-Architektur (u.ä.) bringen so große Caches garnichts, da der intergrierte Memorycontroler die CPU besser mit Daten versorgt, als der FSB von Intel.
Das ist nicht richtig. Zu Zeiten des P4 waren die Latenzen des Speicherzugriffs deutlich höher weil die Cachezeilen doppelt so lang waren. Mit dem C2D-Kern ist das aber weggefallen (64 Byte Cachezeilen statt 128 Byte lange) und die FSB-Frequenz ist gestiegen; dadurch bewegen sich die Latenzen nur einen Hauch überhalb derer des K8-Kerns und der Durchsatz (der aber gegenüber den Latenzen zweitrangig ist) ist auch nicht viel niedriger.
Der K8 würde mit Sicherheit von solch großen Caches gleichermaßen wie der C2D-Kern profitierne (relativ zu seinem eigenen Durchsatz, nicht absolut).
[/color]
Die aktuellen 512k L2 je Core hatte schon der Barton /2003 und da betrug der ges.DRAM-Speicher im PC typ. 256M bis 512M. Heute haben wird bei Vista 2G als Sollwert, aber der L2 wuchs nicht passend an.
Muss er auch garnicht gleichermaßen, denn die Working-Sets wachsen nicht in gleichem Maße wie der RAM-Bedarf der Anwendungen.
Im übrigen greift der C2D auch sehr schnell auf das DRAM was sich beim Penryn nochmals verbessern soll. Damit sind die Zahlen C2D und K8 vergleichbar und decken sich teils mit Untersuchungen am K8.
Der maßgeblichste Faktor ist die Latenz, und die der C2D-Systeme mit DDR2/3-SDRAM ist jetzt schon nur geringfügig über derer der gleichwertigen K8-Systeme. Ich find das schon beeindruckend, dass der FSB-Overhead auf ein derart niedriges Niveau geschrumpft wurde (ist eine Sache des Takts und der gegenüber dem P4 kürzeren Cachezeilen).
Auchdem gibt es ab Q1'08 genügend Fertigungskapazität um auch Cache üppig auszuliefern. ...
Äh, glaub ich nicht. Das ist auch eine Sache des Absatzes wie kostengünstig man produzieren kann (Fixkosten halt). Und der Absatz ist bei Intel um eine Größenordnung größer.
Intel gibt 2008 bei geringfügig höherer Latenzzeit beim DRAM-Zugriff die 6M Cache als Vorgabe im Mainstream offensichtlich vor. ...
Woher weißt Du, dass die Latenz bei den 6M-Caches wachsen wird?
Der größere Cache bringt bei AMD so gut wie nix, das stimmt schon, aber mit dem L3-Cache wird, wenn dieser dann größer ist (so 4MB oder so) dann schon einiges an Performance zurückgewonnen.
Ersteres ist Quatsch und letzteres wiederspricht dem auch. Keine Ahnung was Du dir da zurechtreimst.
 
Ich hab vor kurzem von einem 4600+ auf einen 6000+@3,2Ghz aufgerüstet. Bei der Kodierung eines Films mit Flaskmpeg haben sich die FPS nahezu verdoppelt. Daß das ausschließlich von den 800Mhz mehr Takt kommen soll kann ich mir schwer vorstellen. Von daher dürfte ein größerer Cache bei der K8-Architektur durchaus auch seine Vorteile bringen.
 
AMD 'spielt' schon seit Beginn des K8 beim Cache, s. 3200+/ 3000+ bei 1M /512k L2.
Oder dem 90nm X2 3600+ mit 2* 256k oder jüngst X2 TK-53 mobil.
Dann noch die Semprone ...

Viele Untersuchungen beim K8 stammen zudem noch aus längst vergangenen Zeiten mit kompakteren Applikationen und Netburst als Vergleich.

Es wird Zeit für genauere Untersuchungen bzgl. Cache, wobei man sich C2D-ähnliche Ergebnisse vorstellen kann.

Größe L3 bringen AMD sicherlich auch etwas, nur hierzu gibt es nur für 45nm und Shanghai = 6M schon Informationen. Intel hingegen wird beim Desktop per Penryn ab 2008 dann 6M-Cache im Dual-Core Mainstream plazieren und 12M beim Quad.
Auch ein K10 kann die Wartezeit auf das DRAM nicht wegzaubern, was ihm beim Spar-Cache-Design von AMD bei einigen Applikationen Nachteile einbringen wird.

Aus Nullinformation kann man sich sehr schnell Mist zusammenreimen, der vielleicht auch noch professionell klingt und davon bist Du ein Meister. Gratulation! Du solltest im Management und in der Entwiclung von AMD arbeiten, denn da arbeiten nur Amateure. *Ironie*

Jetzt mal außerhalb der Ironie. Der Mainstream-Markt erfordert keine großen Caches, denn der achtet seltener darauf. Da werden vielleicht noch Tests gelesen und dann hört es eigentlich schon auf. AMD hat doch bestens bewiesen, dass er nicht all zu hoch sein muss, wenn die Plattform+Architektur entsprechend entworfen worden.
 
Zuletzt bearbeitet:
Zurück
Oben Unten