Ergebnis 1 bis 1 von 1
  1. Beitrag #1
    Themenstarter
    Redaktion
    Redaktion
    Avatar von MusicIsMyLife
    • Mein System
      Notebook
      Modell: HP DV7-2225sg
      Desktopsystem
      Prozessor: Intel Core i7-5960X
      Mainboard: ASRock X99 OC Formula/3.1
      Kühlung: EK Water Blocks EK-Supreme HF
      Arbeitsspeicher: 4x 8 GB G.Skill RipjawsV F4-3600C17D-16GVK (2 Kits)
      Grafikkarte: 2x ASUS GeForce GTX Titan X
      Display: 40" Philips BDM4065UC (3840x2160), 27" ASUS ROG Swift PG279Q (2560x1440)
      Festplatte(n): 2x Crucial M500 960 GB im Raid0 (Datenhalde), Crucial C300 256 GB (Windows und eigene Dateien)
      Optische Laufwerke: LG CH08LS10 Blu-ray Disc-Player
      Soundkarte: Sound Blaster Recon3D
      Gehäuse: Little Devil LD PC-V8 Reverse
      Netzteil: Enermax MaxRevo 1350 Watt
      Betriebssystem(e): Windows 10 Professional
      Browser: Opera

    Registriert seit
    22.02.2002
    Ort
    in der Nähe von Cottbus
    Beiträge
    13.200
    Danke
    214
    Gedankt 1.754 Mal für 144 Themen
    Blog-Einträge
    1

    AMD Phenom II X4 Deneb - 45 nm für den Desktop

    AMD Phenom II Deneb - Titelbild


    Heute ist es genau 1 Jahr, 1 Monat und 9 Tage her, dass wir auf Planet 3DNow! unser erstes Phenom-Review veröffentlichten. Was wir damals noch nicht ahnten: Die Monate nach dem K10-Launch sollten turbulent werden: TLB-Bug, Auslieferungsstopp der Server-Varianten des K10 und zudem noch mangelnde Skalierung bzw. relativ hohe Leistungsaufnahmen der neuen CPUs bereiteten vielen interessierten Anwendern schlaflose Nächte - und dem Hersteller sowieso. Selbst die Einführung des neuen B3-Steppings zu Beginn des Jahres 2008 sorgte nicht für den erhofften Durchbruch für AMD. Es musste also etwas größeres passieren.

    Der Phenom sollte 2007 ein Erfolg für AMD werden, doch wie wir wissen, kam es alles anders. Heute nun steht eine neue Ausbaustufe in den Startlöchern. Aber dieses Mal sind die Vorzeichen wesentlich besser. So kursieren bereits seit mehreren Wochen Benchmark-Ergebnisse im Internet, die Grund zur Hoffnung geben für AMD. Auch Übertaktungsergebnisse scheinen den Enthusiasten Mut zu machen, sodass der zweite Anlauf des K10, der Deneb (Codename) bzw. Phenom II (offizieller Markenname), zu dem Prozessor avancieren könnte, welcher der Phenom 2007 hätte werden sollen.

    Im heutigen Review widmen wir uns dem Deneb in gewohnter Planet 3DNow!-Manier. Auf den folgenden Seiten werden wir sowohl die technische Seite von AMDs ersten 45 nm-Desktop-Chips beleuchten, als auch die Performance gegenüber einer Vielzahl von anderen Prozessoren. Verschiedene Betrachtungsweisen der Ergebnisse sollten für jeden interessierten Leser Erkenntnisse bereithalten.

    Viel Vergnügen beim Lesen!
    [break=Der Deneb im Detail - Rückblende K7]

    Ein Blick zurück


    Wenn wir heute über die Technik des AMD Phenom II "Deneb" philosophieren, kommen wir nicht umhin auch seine direkten Vorgänger wenigstens kurz zu streifen, um zu verstehen wieso der Deneb so konzipiert ist und nicht anders.

    AMD K7


    Die Konzeption, die Intention hinter der Architektur des Phenom II, ist nicht neu. Deneb ist kein Prozessor, der auf dem weißen Blatt Papier entstanden ist. Nicht deswegen, weil der neue 45 nm Prozessor-Kern im Prinzip bereits vor einigen Wochen in Form des Server-Prozessors Shanghai eingeführt wurde. Nein, der Deneb hat seine Wurzeln im K7, der bereits 1999 das Licht der Welt erblickte. Damals hat AMD seine letzte wirklich auf keinem Vorgänger basierende, nagelneue Kern-Architektur präsentiert. Entsprechend erfolgreich war der unter dem Label 'Athlon' firmierende Prozessor. Nicht nur, dass er den damals Markt führenden Intel Pentium III Prozessor in Sachen Leistung überflügeln konnte, AMD gelang es mit der ersten Ausbaustufe des K7 auch das prestigeträchtige Gigahertz-Rennen für sich zu entscheiden, das damals auch weit über die IT-Presse hinaus für großes Aufsehen sorgte.


    AMD hatte die Jahre zuvor mit dem K5 und dem K6 viel Lehrgeld bezahlen müssen. Zwar konnten diese CPUs in bestimmten Teilbereichen sehr gute bis hervorragende Leistung erzielen, allerdings waren ihre Talente zu einseitig. Das extreme Low-Latency Layout zusammen mit den aufwändigen Branch-Predictors war kompromisslos auf hohe Leistung pro Takt und kurze Durchlaufzeiten durch die Pipelines ausgelegt. Die Folge war, dass AMD erhebliche Schwierigkeiten hatte den K6 und noch mehr den K5 auf eine konkurrenzfähige Taktfrequenz zu bekommen. Zudem hatte AMD bzw. NexGen, die für den K6 verantwortlich zeichneten, das Thema Fließkomma-Leistung vernachlässigt, was aus damaliger Sicht verständlich war, sich im Rückblick jedoch als Boomarang entpuppte. Bis Mitte der 90er Jahre spielten mathematische Co-Prozessoren im Endkunden-Markt noch kaum eine Rolle. Bis zum 386er war der Co-Prozessor nicht einmal zwingend Bestandteil der CPU, sondern wurde bei Bedarf als zusätzlicher Chip in einen zweiten CPU-Sockel gesteckt. Fließkomma-Leistung wurde (für Endkunden) erst wichtig, als die ersten 3D-Spiele aufkamen - und das fällt genau in die Zeit, in der K5 und K6 auf den Markt kamen. Entsprechend schlecht schnitten diese Prozessoren auf diesem Gebiet ab. Daran änderte auch die später nachgeschobene 3DNow! SIMD-Einheit für den K6-2 nichts, da kaum ein Spiele-Entwickler diese zusätzlichen Befehle nutzte.

    Die jahrelange Unterlegenheit der K5 und K6 Prozessoren auf dem immer wichtiger werdenden Spiele-Markt scheint damals ihre Spuren hinterlassen zu haben, denn bei der Entwicklung des Nachfolgers namens K7 galt für die AMD-Entwickler ganz offenbar "klotzen, nicht kleckern". Während der K6 nur eine non-pipelined FPU besaß, durfte der K7 auf nicht weniger als drei Fließkomma-Pipelines zurückgreifen. Unter anderem aus diesem Grund wurde der Athlon in den Jahren 1999 und 2000 der Liebling der Gamer - ein Ruf, der in Stammtischgesprächen noch heute nachhallt wenn mal wieder die ewige Frage AMD oder Intel debattiert wird.


    Auch sonst blieb bei der Entwicklung des K7 kein Stein auf dem anderen. Das Three-Issue Design mit einem 3-fach Dekoder, doppelt so langen ALU-Pipelines wie beim K6 und riesigen Level 1 Caches von je 64 KB für Code und Daten sorgte für ordentlich Durchsatz. Zudem fußte der K7 nicht mehr auf einer abgelegten, veralterten Infrastruktur von Intel, sondern auf einer brandneuen Plattform (zuerst Slot A, später Sockel A) mit DDR-Frontside-Bus und viel Entwicklungspotenzial. Neben dem Sockel 7 hat bisher keine x86-Infrastruktur länger überlebt als der Sockel A.
    [break=Der Deneb im Detail - Rückblende K8 und K9]

    AMD K8


    Im Jahr 2003 brachte AMD den lange ersehnten K8 alias 'Hammer'; im April zuerst in Form des Server-Prozessors Opteron (Codename Sledgehammer), später im September in Form des Athlon 64 (Sockel 754; Codename Clawhammer). In Sachen Infrastruktur wurde erheblich umgebaut. So verpflanzte AMD den Memory-Controller, der bei einer klassischen Plattform im Chipsatz auf dem Mainboard saß, direkt in den Prozessor. So fiel nicht nur der Flaschenhals Frontside-Bus weg, auch die Latenzzeiten beim Zugriff auf den Arbeitsspeicher konnten so dramatisch verkürzt werden. Während die damals gängige Athlon XP Plattform mit VIA KT600 Chipsatz (externer Memory-Controller in der Northbridge) bei unseren Latenztests im Mittel etwa 130 CPU-Takte von der Anforderung bis zur Lieferung der Daten verschwendete, lagen die Werte beim Athlon 64 mit integriertem Memory-Controller nur noch bei ca. 65. Kurze Zeit später wurde der Memory-Controller von 64-Bit auf 128-Bit Dual-Channel aufgeweitet (Sockel 939), was zusätzlich zu den kurzen Latenzen auch noch den Datendurchsatz verbesserte.


    Flaschenhals FSB: AMD Athlon XP System mit nForce2 Chipsatz


    AMD Athlon 64 System

    Um trotzdem noch mit dem Rest der Infrastruktur kommunizieren zu können, spendierte AMD dem K8 bis zu drei HyperTransport-Links, die nicht nur für CPU-zu-Chipsatz Kommunikation (Single Sockel Plattform) genutzt wurden, sondern auch für CPU-zu-CPU Kommunikation in Multi-Sockel Plattformen. Das war der Durchbruch für AMD auf dem Servermarkt, auf dem AMD bis dahin keinen Fuß in die Tür brachte. Dem Opteron-Prozessor waren die Voraussetzungen für ideale Multi-Sockel-Fähigkeit auf den Leib geschneidert. Erstmals konnte im x86-Bereich eine ccNUMA-Plattform realisiert werden, in der jede Opteron-CPU einen Node darstellte. Die Skalierfähigkeit übertraf die der Konkurrenz mit klassischem FSB, auf dem sämtlicher Datentransfer abgewickelt werden musste, deutlich. Dass AMD mit dem K8 auch den neuen 64-Bit Betriebsmodus x64-64 alias AMD64 alias Long-Mode einführte, der heute auch bei Intel-Prozessoren Industriestandard ist und der Grundstein dafür, dass x64-kompatible Server auch mit deutlich mehr als 4 GB RAM noch auf dem Markt mitmischen dürfen, ist nur als zusätzliches Pfund zu werten.


    Doch nicht nur im Server-Markt konnte der K8 punkten, auch im Desktop-Bereich hatte AMD nach dem Erscheinen etwa drei Jahre lang wieder praktisch durchgehend die Performance-Krone inne. Natürlich nicht nur durch eigenen Verdienst, sondern auch, weil Intel sich in ein Abenteuer namens Netburst-Architektur (Pentium 4) verstiegen hatte und erst spät erkannte, dass der eingeschlagene Weg eine Sackgasse war.

    Aber bei allem Drumherum: in Sachen Kernarchitektur müssen selbst Insider schon sehr genau auf das Design-Diagramm blicken, um zu erkennen, ob sie einen K7 oder K8 vor sich liegen haben - so ähnlich sind sich die beiden hier.

    AMD Dual-Core K8 (inoffiziell K9)


    Ursprünglich sollte der K9 'Greyhound' ein komplett neues CPU-Design werden. Als AMD jedoch 2005 seinen ersten Dual-Core K8 in Form der AMD Athlon 64 X2 Prozessoren auf den Markt brachte, wurde diese Bezeichnung inoffiziell für die Dual-Core K8 Prozessoren verwendet. Offiziell taucht die Bezeichnung K9 nirgendwo bei AMD auf.

    Interessant ist, dass AMD bereits auf der CeBIT 2001 hinter vorgehaltener Hand verlauten ließ, dass beim K8 zwei CPU-Kerne auf einem Silizium-Plättchen ("Die") möglich sind. Allerdings war der Herstellungsprozess damals noch nicht so weit, um das realisieren zu können. Das Die wäre zu groß geworden, der Stromverbrauch zu hoch. Erst mit der Einführung des 90 nm Herstellungsverfahrens wurden die Strukturen kompakt genug, um zwei K8-Kerne auf ein Die belichten zu können. Diese CPUs sind - entsprechend weiterentwickelt - bis heute auf dem Markt.

    65 nm Prozess ein Flop?


    Im Jahr 2006 stellte AMD die Produktion der Dual-Core Prozessoren von 90 nm auf 65 nm um. Ein gängiger Routine-Prozess alle paar Jahre möchte man meinen. Doch dieses Mal waren die Umstände anders. Normalerweise schlägt man mit einem sogenannten Die-Shrink gleich mehrere Fliegen mit einer Klappe. Durch die kleineren Kerne passen mehr auf einen Wafer, weshalb die Kosten für den Hersteller sinken. Interessanter für den Kunden dagegen ist, dass ein Die-Shrink normalerweise weniger Stromverbrauch und/oder höhere Taktfrequenzen bei gleicher Architektur bedeutet. Dieses Mal jedoch muss irgendetwas schiefgegangen sein, denn weder konnten die 65 nm AMD-Prozessoren höher getaktet werden, noch verbrauchten sie weniger Strom. So ist bis heute der am höchsten getaktete Dual-Core K8 ein 90 nm Produkt (Athlon 64 X2 6400+ mit 3,2 GHz). Auf der anderen Seite werden die extrem Strom sparenden SFF Prozessoren mit lediglich 35 W TDP (z.B. Athlon 64 X2 3800+ EE SFF) ebenfalls noch in 90 nm gefertigt - bis heute. Wie gesagt: das ist keine Visitenkarte für den 65 nm Prozess von AMD.
    [break=Der Deneb im Detail - Rückblende K10]

    Das AMD K10 Desaster


    Im Jahr 2007 führte AMD (wie üblich mit ein paar Monaten Verspätung) den neuen K10 Prozessor ein, zuerst wieder in Form der Quad-Core Opteron Prozessoren für den Servermarkt, im November als Phenom für den High-End User. Hier war es sicherlich nicht von Vorteil, dass der K10 in jenem 65 nm Herstellungsverfahren produziert wurde, das sich schon beim Dual-Core K8 nicht bewährt hatte. So kam was kommen musste: der K10 erreichte bei weitem nicht die Taktfrequenzen, die notwendig gewesen wären, um gegenüber der wieder erstarkten Konkurrenz aus dem Hause Intel (Core 2 Familie) zu bestehen. Bei 2,3 GHz war anfangs Schluss. Außerdem genehmigte sich der K10 auch noch einen Extraschluck aus der Steckdose. Niedrige Taktfrequenz und trotzdem ein hoher Stromverbrauch. So stand das bei der Entwicklung sicher nicht im Lastenheft. Zu allem Überfluss schlich sich auch noch ein wenig prestigeträchtiger Bug in das K10-Design, über den wir auf Planet 3DNow! in den letzten 14 Monaten mehr als genug berichtet haben, weshalb wir auf einen ausführlichen Exkurs an dieser Stelle verzichten. Die Folge war ein mehrmonatiger Lieferstopp bei den Quad-Core Opterons und ein halbgarer, leistungsmindernder BIOS-Patch, der den Ruf des AMD Phenom ruinierte noch ehe er richtig auf dem Markt war.


    Dabei sah das Konzept auf dem Papier ganz gut aus. Auch der K10 ist kein brandneues CPU-Design. Die Kerne selbst gleichen jenen des K8 beinahe wie ein Ei dem anderen, abgesehen davon dass statt lediglich zweien nun vier Kerne auf einem Die sitzen. Neu dagegen war die Abkopplung des Memory-Controllers heraus aus den eigentlichen CPU-Kernen in eine On-Die Northbridge - bei Intels Core i7 Uncore-Bereich genannt - die mit einem eigenen Taktsignal versorgt wurde. So muss bei Onboard-Grafiklösungen mit UMA-Speicher nicht jedes Mal die CPU aufgeweckt werden, wenn die GPU Daten aus dem VRAM benötigt. Zusätzlich wurde in die On-Die Northbridge ein 2 MB großer Level 3 Cache gepflanzt, der neben den direkt integrierten je 512 KB großen und mit vollem CPU-Takt laufenden dedicated L2-Caches als zusätzlicher shared Last-Level Puffer dient und obendrein die Inter-Core-Kommunikation unterstützen soll. Abgerundet wurde der Umbau im "Uncore" Bereich durch einen neuen HyperTransport-Link, der nun die Spezifikation 3.0 unterstützte und eine höhere Bandbreite zur Infrastruktur bereitstellen konnte. Optional konnte der User einen neuen Unganged Betriebsmodus des Memory-Controllers verwenden, bei dem statt eines kombinierten 128-Bit Controllers zwei voneinander unabhängige 64-Bit Controller ihren Dienst verrichteten mit dem Zweck eine bessere Leistung in Umgebungen mit mehreren voneinander unabhängig laufenden Prozessen zu erreichen.

    Abgesehen davon beschränkten sich die Weiterentwicklungen an den Kernen selbst auf ein paar Details gegenüber dem K8. Größere TLBs zum Beispiel, eine 128-Bit SSE Einheit, ein paar zusätzliche SIMD-Befehle, die AMD zum Schrecken aller Programmierer SSE4a nannte, obwohl sie keine Teilmenge von Intels SSE4.x Befehlssatz sind und breiter angebundene Level 2 Caches.
    [BREAK=Die Schwächen des 65 nm K10]
    Die Strategie der stetigen Evolution hätte auch aufgehen können. In der Praxis erreicht ein K10 je nach Software pro Takt pro Kern tatsächlich eine 10-15 Prozent bessere Leistung, als ein K8. Man spricht hier von einem höheren IPC (bzw. seltener von einem niedrigeren CPI). Pi-mal-Daumen ist ein K10-Kern dank seiner Detail-Optimierungen bei 2,3 GHz ungefähr so schnell, wie ein K8-Kern bei 2,6 GHz. Zudem kann der K10 vier Kerne in die Waagschale werfen, während der K8 mit zweien auskommen muss, was multithreaded Anwendungen zusätzlich beschleunigt. Allerdings kommt ein höherer IPC nur dann in Form einer höheren Leistung beim User an, wenn der Hersteller nicht gleichzeitig die Taktfrequenz massiv senken muss. Gegenüber den 3,2 GHz des schnellsten K8 konnte der K10 anfangs aber nur 2,3 GHz dagegen setzen. Da hilft auch ein 15 Prozent höherer IPC nichts, wenn andererseits die Taktfrequenz um 30 Prozent reduziert wird. Ob die schlechte Taktbarkeit nur am zweifelhaften 65 nm Verfahren von AMD lag oder auch zusätzliche Ursachen im Design (Speed-Pathes, Signalübersprechungen, etc.) hatte, können wir an dieser Stelle natürlich nicht beantworten.

    Zudem konnte sich der viel gerühmte L3-Cache nicht durchgehend bewähren. Zwar ist mehr Cache grundsätzlich positiv zu bewerten, da die Wahrscheinlichkeit sinkt Daten aus dem quälend langsamen RAM holen zu müssen. Als zusätzliche Cachestufe implementiert erhöht er jedoch auch die Latenz, da nun auch noch in einer dritten Cachestufe nachgesehen werden muss ehe ein Cache-Miss feststeht. In diesem Fall sind beim K10 bereits mehr Taktzyklen als beim K8 verstrichen, bevor die Daten dann letztendlich doch aus dem RAM angefordert werden müssen. Der Vorteil der niedrigen Latenzzeiten, die der K8 durch die Integration des Memory-Controllers in die CPU geschenkt bekam, war beim K10 zum Teil wieder dahin. Man könnte sagen: der Level 3 Cache des K10 ist mit nur 2 MB zu klein, um den Nachteil der längeren Latenzen aufzuwiegen.


    Latenzen K8


    Latenzen K10: ca. 40 CPU-Taktzyklen mehr Wartezeit beim Zugriff auf das RAM.

    An dieser Stelle verweisen wir auf unseren Kuma-Artikel, wo wir uns über mehrere Seiten hinweg mit dem Für und Wider L3-Cache befassen.

    Zusammenfassend hatte AMD beim K10 eine ganze Reihe von Punkten, die es zu verbessern galt:
    - hoher Stromverbrauch
    - schlechte Skalierbarkeit in Sachen Taktfrequenz
    - zu geringes Leistungsplus (pro Kern) gegenüber dem K8
    [break=Der Deneb im Detail - Der "K10.5"]

    Der AMD Phenom II "Deneb"


    So war der K10 sicher kein Produkt, an dem AMD angesichts beinaher Perfektion keine Angriffpunkte gefunden hätte, um die Hebel der Weiterentwicklung anzusetzen.


    Den suboptimalen 65 nm Herstellungsprozess wird der Deneb - in der Presse oft scherzhaft "K10.5" genannt - durch die Umstellung auf 45 nm Strukturen "automatisch" los. Dabei handelt es sich nicht um einen simplen Shrink. AMD stellte zusätzlich zu den kleineren Strukturen auf das sogenannte Immersions-Lithographie-Verfahren um. Damit soll es möglich sein, kleine Strukturen wesentlich präziser zu belichten. Zudem konnte laut AMD auch die Anzahl an Arbeitsschritten bis zum fertigen Die reduziert werden, was Kosten spart und die Produktionszeit verkürzt. Ein high-k Dielektrikum auf Metall-Basis wie es bei Intel schon seit den Penryn-Prozessoren verwendet wird, soll erst in einer späteren Ausbaustufe Verwendung finden.


    Aber auch ohne Metall-Gates verspricht AMD einen erheblich niedrigeren Stromverbrauch. So soll ein 2,7 GHz Deneb gegenüber einem 2,3 GHz Agena trotz höherer Taktfrequenz eine 35 Prozent niedrigere Leistungsaufnahme im Leerlauf haben und selbst unter Volllast soll er immer noch 10 Prozent sparsamer sein - bei 400 MHz mehr Taktfrequenz, mehr Cache und entsprechend höherer Leistung. Ausgedrückt in CPU-Leistung pro Watt verspricht AMD gar eine 50-prozentige Verbesserung. Das sind große Worte, denen Taten folgen müssen.

    Höhere Taktfrequenz
    Während beim 65 nm Phenom mit Agena-Kern bei 2,6 GHz das Ende der Fahnenstange erreicht war (Vorstellung mit 2,3 GHz), kommt der 45 nm Phenom II Deneb vom Start weg mit 3,0 GHz auf den Markt. Daher kommen rechnerisch 15 Prozent Mehrleistung gegenüber dem bisherigen Topmodell schon alleine von der höheren Taktfrequenz, die nun im Bereich der schnellsten Intel-Prozessoren liegt, die aktuell mit bis zu 3,2 GHz zu haben sind.


    Größerer Last Level Cache
    Durch die kleineren Strukturen des 45 nm Prozesses hatte AMD nun die Möglichkeit, den umstrittenen Level 3 Cache von 2 MB auf 6 MB zu vergrößern ohne dies mit überdimensionaler Die-Größe bezahlen zu müssen. Damit verschiebt sich das Gleichgewicht "Penalty durch die zusätzliche Cachestufe" vs. "Höhere Hitrate durch größeren Cache" zu Gunsten des letzteren. Zudem will AMD die Cache-Latenz des L3-Cache verbessert haben, die bisher - gemessen mit CPU-Z Latency - allenfalls als mittelmäßig zu bewerten war. Die Assoziativität des L3-Caches wurde von 32-fach auf 48-fach erhöht.

    Intelligenterer Prefetch-Algorithmus
    Weiteres Potenzial verspricht sich AMD durch einen verbesserten Prefetch-Algorithmus, der Daten basierend unter anderem auf den Ergebnissen der Sprungvorhersage auf Verdacht in den Cache lädt. Ob AMD wirklich einen intelligenteren Algorithmus einsetzt oder - mit dem 3 mal so großen L3-Cache im Rücken - nun einfach exzessiver Gebrauch von Prefetching macht, sei mal dahin gestellt.

    Core Probe Bandwidth erhöht
    Ferner verspricht AMD durch ein Feature namens "2x Core Probe Bandwidth" eine schnellere Herstellung bzw. Wahrung der Cache-Kohärenz, da das Intervall, in dem Snoop-Signale ausgesendet werden, halbiert worden sein soll. Vorwiegend kommt dies dem Server-Ableger Shanghai in Multi-Sockel-Systemen zu Gute, aber laut AMD sollen auch die Single-Sockel-Denebs davon profitieren. Jeden dritten Takt soll der "K10.5" nun ein Probe-Signal aussenden können gegenüber jedem sechsten beim ursprünglichen K10.

    Rapid Virtualization Indexing
    In Bezug auf Virtualisierung, die im Server-Bereich immer mehr an Bedeutung gewinnt, verspricht AMD ebenfalls eine höhere Leistung dank Rapid Virtualization Indexing und Tagged TLBs. Beides führt dazu, dass der Prozessor schneller zwischen zwei VMs mit eigenen Speicheradressen umschalten kann. Im Desktop-Markt sicherlich eine zu vernachlässigende Kunst, auf Servern mit vielen virtualisierten Maschinen jedoch ist das für den Zwillingsbruder Shanghai ein willkommenes Feature.

    Smart Fetch
    Den Energiebedarf noch zusätzlich zu senken ist die Aufgabe einer Smart Fetch genannten Funktion. Diese kopiert den Inhalt des L1- und L2-Caches eines schlafenden Kerns in den von allen Kernen direkt adressierbaren L3-Cache, so dass darauf zugegriffen werden kann ohne den betreffenden Kern zu wecken und ihn in einen niedrigeren P-State zu versetzen. Im Endeffekt spart dies Energie und reduziert die Abwärme.

    Bugs beseitigt
    Neben dem berüchtigten Erratum 298 alias TLB-Bug besaßen die 65 nm Phenoms noch eine Reihe weiterer "Unpässlichkeiten", sogenannte Errata. Im Grunde ist das nichts ungewöhnliches - jedes komplexe Produkt wie ein Prozessor mit mehreren Millionen Transistoren - hat Fehler. Selbst beim nagelneuen Intel Core i7 sind bereits über 70 Bugs bekannt bzw. dokumentiert, obwohl er erst ein paar Wochen auf dem Markt ist. Die Frage ist immer nur wie schwerwiegend sie sind. Meist handelt es sich dabei um Kleinigkeiten, die allenfalls die BIOS-Programmierer oder Compiler-Entwickler interessieren müssen. Beim 65 nm K10 jedoch (Stepping BA, B2 und B3) waren auch Sachen dabei, die im ungünstigen Fall den Endanwender tangieren konnten, wie etwa das Erratum 355 - "DRAM Read Errors May Occur at Memory Speeds Higher than DDR2-800". Das konnte für Endkunden durchaus ärgerliche Folgen haben - nämlich, dass ein Phenom mit DDR2-1066 Speicher, für die er offiziell eine Freigabe besitzt, unter Umständen nicht stabil arbeitete. Dieser Fehler ist nun mit dem C2-Stepping des Deneb gefixt, ebenso wie die unbrauchbaren Temperatur-Messungen der internen Dioden ("Inaccurate Temperature Measurement"). Wie gesagt: in Sachen Bugfixing war AMD wirklich gründlich. So wurden tatsächlich alle Bugs der bisherigen K10-Prozessoren gefixt, die nicht mit "no fix planed" gekennzeichnet waren.


    Natürlich sind auch ein paar neue Bugs hinzu gekommen. Einige davon wurden erst jetzt entdeckt, welche die gesamte K10-Reihe betreffen (Stepping BA, B2, B3, C2), einige dagegen betreffen nur den Shanghai bzw. Deneb. Ein paar Sachen sind dabei - z.B. "DRAM May Fail Training on Cold Reset" - welche Endkunden gelegentlich über den Weg laufen könnten, einige werden in der Praxis niemals auftreten - z.B. "System May Hang if Core Frequency is Even Divisor of Northbridge Clock" - solange AMD keine Prozessoren herstellt, bei denen das der Fall ist. Relevant könnte es höchstens für (Northbridge-)Übertakter oder (Kern-)Untertakter werden, wenn sie Kernfrequenz und Northbridge-/L3-Takt zufällig auf die selbe Frequenz setzen.

    Leistungsversprechen


    Dass eine Dragon-Plattform gemäß Gerüchteküche um bis zu 30 Prozent schneller sein soll als eine Spider hatten wir berichtet. Seit den Dragon Tech Days, bei denen wir vor Ort in Austin/Texas waren, ist auch bekannt woraus genau diese Verbesserungen resultieren - zumindest laut AMD:
    • Etwa 3% kommen durch Verbesserungen der IPC zu Stande. Diese kommen hauptsächlich durch Verbesserungen der Branch Prediction, des TLB und der Pipeline.
    • Etwa 10% beträgt der Unterschied durch die höhere Taktfrequenz
    • Etwa 10% durch den größeren L3-Cache
    • Und zuletzt noch mal etwa 5% durch den Umstieg von DDR2 auf DDR3-Speicher - das kommt allerdings erst in ein paar Monaten.

    [break=Der Deneb im Detail - Alles auf einen Blick]


    Phenom X4

    Phenom II X4

    Core i7

    Codename

    Agena

    Deneb

    Bloomfield

    Einführung

    November 2007

    Januar 2009

    November 2008

    Familie

    K10

    K10

    Nehalem

    Anzahl Kerne real/logisch

    4/4

    4/4

    4/8

    Level 1 Cache Daten

    4x 64 KB dedicated

    4x 64 KB dedicated

    4x 32 KB dedicated

    Level 1 Cache Instruktionen

    4x 64 KB dedicated

    4x 64 KB dedicated

    4x 32 KB dedicated

    Level 1 Cache Assoziativität

    2-fach

    2-fach

    8-/4-fach

    Level 2 Cache

    4x 512 KB dedicated unified

    4x 512 KB dedicated unified

    4x 256 KB dedicated unified

    Level 2 Cache Assoziativität

    16-fach

    16-fach

    8-fach

    Level 3 Cache

    1x 2 MB shared unified

    1x 6 MB shared unified

    1x 8 MB shared unified

    Level 3 Cache Assoziativität

    32-fach

    48-fach

    16-fach

    Cacheverwaltung

    Exklusiv

    Exklusiv

    Inklusiv

    Befehlssätze

    x86, x86-64, MMX+, 3DNow!+, SSE, SSE2, SSE3, SSE4a, AMD-V

    x86, x86-64, MMX+, 3DNow!+, SSE, SSE2, SSE3, SSE4a, AMD-V

    X86, x86-64, MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, Intel VT

    Herstellungsprozess

    65 nm SOI

    45 nm SOI

    45 nm

    Die-Fläche

    285 mm²

    258 mm²

    263 mm²

    Anzahl Transistoren

    463 Millionen

    758 Millionen

    731 Millionen

    Stepping

    B2, B3

    C2

    C0

    Sockel

    AM2+

    AM2+, AM3

    LGA1366

    Memory-Controller

    Dual-Channel

    128-Bit Ganged
    oder
    2x 64-Bit Unganged

    Dual-Channel

    128-Bit Ganged
    oder
    2x 64-Bit Unganged

    Triple-Channel

    Speicher-Support

    DDR2 bis DDR2-1066

    DDR2 bis DDR2-1066 (AM2+)

    DDR3 bis DDR3-1333 (AM3)

    DDR3 bis DDR3-1066

    Taktfrequenz (Topmodell)

    2600 MHz (X4 9950 BE)

    3000 MHz (X4 940 BE)

    3200 MHz (965 XE)

    Stromverbrauch (TDP)

    65 W bis 140 W

    95 W bis 125 W

    130 W

    Anbindung zur Infrastruktur

    HyperTransport 3.0

    HyperTransport 3.0

    QuickPath Interconnect


    [break=Schlussfolgerungen für Aufrüster]
    Wer die letzten Seiten des Artikels aufmerksam studiert hat, der wird feststellen, dass zwar Änderungen gegenüber dem Phenom eingearbeitet wurden, das Konzept des Denebs aber noch immer das Gleiche ist: Ein nativer Quad-Core, bestückt mit einer dritten Cache-Stufe.

    Beim Launch des Phenom im Jahr 2007 war eines der heißesten Argumente pro Phenom die Aufrüstbarkeit. So brauchte nur ein BIOS-Update vorgenommen werden und schon sollte der K10 auch in bewährten AM2-Platinen lauffähig sein. Doch wie wir heute wissen, wurde genau dieser Aspekt nur halbherzig umgesetzt und viele Mainboard-Besitzer mit AM2-Hauptplatinen mussten in die Röhre schauen.

    Genau wie der "originale" Phenom benötigt auch der Deneb aka Phenom II ein BIOS-Update, um in aktuellen Mainboards zu laufen. So wurden bereits im Vorfeld des Launches viele Hersteller aktiv und haben Listen herausgegeben, welche ihrer Mainboards denn Deneb-kompatibel seien:
    Erstaunlich zu diesem Zeitpunkt war die relativ hohe Anzahl an unterstützenden Mainboards. Diese Tatsache führte dazu, dass in unserem Mainboard-Forum darüber spekuliert wurde, ob nicht jedes Mainboard, welches den Phenom unterstützt, auch prinzipiell für den Einsatz des Deneb geeignet wäre - auch ohne BIOS-Update.

    An dieser Stelle kommen wir zum einleitenden Absatz dieser Seite zurück: Das Konzept hinter dem Deneb als nativer Quad-Core mit einer dritten Cache-Stufe ist unverändert. Das lässt genau den Schluss zu, der bereits im Forum diskutiert wurde. Nämlich, dass es in der Tat möglich sein könnte, den Deneb ohne BIOS-Update zu betreiben. Gesagt, getan.

    Wir haben unser Deneb-Sample auf das Referenz-Mainboard, ein Gigabyte GA-MA790FX-DQ6, in dem Wissen gesetzt, dass das darauf befindliche BIOS F5 vom 21.05.2008 definitiv keine Deneb-Unterstützung bietet. Das System postete anstandslos:

    Postscreen Gigabyte GA-MA790FX-DQ6 mit AMD Phenom II X4 940 ohne BIOS-Update


    Der Phenom II X4 940 wird als "AMD Processor model unknown" erkannt und funktioniert tadellos (soweit das die sehr knappen Tests überhaupt zu bescheinigen vermögen). Wir kennen zusätzlich zu unserem Referenz-Mainboard noch zwei weitere Hauptplatinen von FOXCONN, bei denen die Situation exakt gleich ausfällt. Somit besteht durchaus die Möglichkeit, dass der Deneb, auch wenn der Hersteller eines Mainboards keine explizite Freigabe erteilt, lauffähig ist.

    Wer die Rechnung ohne den Wirt macht...

    Das soeben beschriebene Szenario ist jedoch nicht für den produktiven Einsatz zu empfehlen. Denn obwohl der Prozessor augenscheinlich läuft, so sind die technischen Voraussetzungen theoretisch nicht gegeben:
    • Update des Microcodes im BIOS
    • Einarbeitung von Workarounds für aufgetretene Errata
    • unter Umständen ein BIOS-Chip mit unzureichender Kapazität

    Microcode-Updates sowie sonstige Updates eines BIOS (z.B. ein BIOS-Update der IGP) bedingen, dass die Größe des BIOS-Files im Laufe eines Produktzyklusses ansteigen kann. Sollte ein Mainboard-Hersteller das BIOS eines AM2 oder AM2+ -Mainboards in seiner Größe knapp kalkuliert haben, so kann es vorkommen, dass die Kapazität des verbauten BIOS-Chips nicht mehr ausreicht, um die zusätzlichen Updates für den Deneb aufzunehmen. In diesen Fällen wird es kein passendes BIOS für das entsprechende Mainboard geben, welches den Phenom II unterstützt - selbst dann nicht, wenn die Hardware der Platine technisch dazu in der Lage wäre.

    An dieser Stelle wäre die Lösung praktikabel, einfach einen Deneb einzusetzen. Doch hierbei ist äußerste Vorsicht geboten. Mit den Updates für den Deneb werden gleichzeitig Workarounds für bekannte Errata eingearbeitet. Betreibt man den Deneb ohne Update, so läuft der Prozessor mit allen Fehlern die er besitzt. User einer solchen Konstellation kommen nie in den Genuss von Workarounds und müssen mit der Gefahr leben, dass Fehler auftreten und es zu Instabilitäten kommen kann.

    Der Einsatz von AMDs Phenom II könnte also auf vielen (allen?) Mainboards möglich sein, welche bereits den ursprünglichen Phenom mit einer TDP (Thermal Design Power) von 125 Watt unterstützen. Doch diese Lösung ist nur etwas für Bastler und risikobewusste User - für sicherheitsbewusste Anwender ist sie nicht zu empfehlen.
    [break=Unser Deneb-Sample im Detail]
    Nach der langen Vorrede mit vielen technischen Aspekten wollen wir uns nun endlich dem Phenom II in der Realität widmen. Hierzu als erstes zwei Fotos unseres Probanden.

    AMD Phenom II Deneb - Foto des Prozessors


    Das Topmodel des Phenom II hört auf den Namen "AMD Phenom II X4 940". Unser Sample wurde in der 43. Kalenderwoche 2008 hergestellt.

    AMD Phenom II Deneb - Foto des Prozessors


    Zugegeben, die Rückseite hält keine Überraschungen bereit - für das Foto hätten wir jeden beliebigen AM2 / AM2+ -Prozessor verwenden können.

    AMD Phenom II Deneb - CPU-Z CPU


    Das Modell X4 940 taktet mit 3,0 GHz (Referenztakt 200 MHz x Multiplikator 15) und besitzt eine Betriebsspannung von 1,35 Volt. Der HT-Link sowie die integrierte Northbridge (IMC + L3-Cache) wird mit 1,8 GHz Taktfrequenz betrieben.

    Leider tendiert das verwendete Gigabyte GA-MA790GP-DS4H dazu, die Spannung leicht über den spezifizierten Wert anzuheben, sodass im Normalfall 0,024 - 0,026 Volt zuviel angezeigt (und auch genutzt) werden.

    AMD Phenom II Deneb - CPU-Z Cache


    Der shared L3-Cache wird jetzt 48-fach assoziativ angesprochen (wie bereits im Theorieteil dieses Artikels beschrieben).

    AMD Phenom II Deneb - CPU-Z Speicher


    In puncto RAM ändert sich nichts. Der Deneb unterstützt wie sein Vorgänger DDR2-1066, was im Gegensatz zum Phenom "I" aber wesentlich besser funktioniert. Während es mit dem originalen Phenom auf vielen Boards Probleme mit DDR2-1066 gab und gibt, funktionierte diese Einstellung auf 4 von uns getesteten Mainboards auf Anhieb tadellos und stabil.

    Nach wie vor wird der Speichertakt vom Referenztakt mittels eines Verhältnisses abgeleitet. Dadurch kann gewährleistet werden, dass der Speichertakt unabhängig vom gewählten CPU-Multiplikator mit vollen DDR2-1066 angesprochen werden kann (anders, als das beim K8 mit DDR2-800 der Fall war). Mehr dazu in unserem AMD Phenom (K10) Overclocking Guide.

    AMD Phenom II Deneb - CPU-Z Cool'n'Quiet


    Aktiviert man Cool'n'Quiet, so taktet der Prozessor auf 800 MHz herunter. Hierzu wird der Multiplikator auf 4 verändert, der HT-Link sowie die Northbridge bleiben vom Takt her unverändert. Hier gibt es gravierende Unterschiede zum 65 nm Phenom, der im Cool'n'Quiet Modus grundsätzlich nur auf die Hälfte des Standard-Takts zurückschaltete. Beim X4 9950 sind dies immerhin noch 1300 MHz.

    Die Spannung des Phenom II wird gleichzeitig auf 1,0 Volt abgesenkt. Auch bei diesem Screenshot schlägt die Tendenz des Gigabyte-Mainboards zu, die Spannung leicht über der Vorgabe bereitzustellen.

    AMD Phenom II Deneb - CPU-Z Latency


    Ein Test mit dem CPU-Z Latency-Tool darf natürlich auch nicht fehlen. Wobei sich auf den ersten Blick erst einmal Ernüchterung einstellt (abgesehen davon, dass das Tool die Größe des Last-Level Cache falsch ausliest). Mit 3 bzw. 15 CPU-Takten liegt die Latenz beim Zugriff auf den L1- und L2-Cache erwartungsgemäß exakt auf dem Niveau des Vorgängers. Beim Zugriff auf den nicht mit CPU-Takt laufenden L3-Cache jedoch muss man die Latenzen zuerst in eine absolute Latenzzeit umrechnen, ehe man Vergleiche anstellen kann. Bei unserem mit 3.0 GHz laufenden Phenom II sind es 55 CPU-Takte, was 18,3 ns Latenzzeit entspricht. Zum Vergleich: beim Phenom 9500 aus dem ersten Review waren es noch 48 CPU-Takte bei 2.2 GHz, was 21,8 ns Latenzzeit entspricht. Da beide Modelle mit gleichem Northbridge-Takt von 1800 MHz arbeiten (im Gegensatz zu den 65-nm Phenom-Modellen ab dem X4 9850, bei denen die NB mit 2000 MHz läuft) kann man die Zugriffszeit gut vergleichen. Und offenbar gab es in der Tat minimale Verbesserungen in Sachen L3-Latenz. Doch dazu später im Benchmark-Teil des Artikels ausführlichst mehr.
    [break=Die Testsysteme im Überblick]
    Im Rahmen der Tests für das heutige Review kamen gleich mehrere Testsysteme zum Einsatz. Dies ist der Tatsache "geschuldet", dass wir unseren Lesern möglichst viele Vergleichswerte präsentieren wollen. Die Hardware sieht dabei so aus:

    Testsystem Sockel AM2+
    • Prozessoren:
      • AMD Phenom II X4 940
      • AMD Phenom X4 9850 BE
      • AMD Phenom X3 8750 BE
      • AMD Athlon 7750 BE
      • AMD Phenom X4 9600 BE
      • AMD Athlon 64 X2 6400+
    • Mainboard (Referenz): Gigabyte GA-MA790GP-DS4H (BIOS F3m)
    • Arbeitsspeicher: 2x 1 GByte Corsair TWIN2X2048-8500C5DF (5-5-5-15 2T)
    • Grafikkarte: ZOTAC GTX 280 AMP!
    • Netzteil: be quiet! Dark Power Pro 530 Watt
    • Festplatte: Seagate ST3250410AS (SATA, 7.200/min
    • Gehäuse: Chieftec Mesh CH-01 Midi-Tower
    • Energiemessgerät: Voltcraft Energy Monitor 3000


    Testsystem Sockel 775
    • Prozessoren:
      • Intel Core 2 Extreme QX9770
      • Intel Core 2 Duo E8600
    • Mainboard: Intel DX48BT2 (BIOS BT1893P)
    • Arbeitsspeicher: 2x 1 GByte OCZ3P1600EB2GK
    • Grafikkarte: ZOTAC GTX 280 AMP!
    • Netzteil: be quiet! Dark Power Pro 530 Watt
    • Festplatte: Seagate ST3250410AS (SATA, 7.200/min
    • Gehäuse: Chieftec Mesh CH-01 Midi-Tower
    • Energiemessgerät: Voltcraft Energy Monitor 3000


    Testsystem Sockel 1366
    • Prozessor: Intel Core i7 965 XE
    • Mainboard: Intel DX58SO (BIOS SO2786P)
    • Arbeitsspeicher:
      • 2x 1 GByte Cellshock PC3-14400
      • 1x 1 GByte OCZ PC3-16000
    • Grafikkarte: ZOTAC GTX 280 AMP!
    • Netzteil: be quiet! Dark Power Pro 530 Watt
    • Festplatte: Seagate ST3250410AS (SATA, 7.200/min
    • Gehäuse: Chieftec Mesh CH-01 Midi-Tower
    • Energiemessgerät: Voltcraft Energy Monitor 3000


    Auf der Software-Seite sehen die Systeme so aus:

    verwendete Software / TreiberVersion / Bemerkungen
    Windows Vista Ultimate
    64 Bit, Service Pack 1
    DirectX
    10, Juni-Update 2008
    Grafikkartentreiber
    ForceWare 180.48
    Chipsatz-/Mainboardtreiber
    aktuelle Version des Herstellers
    Everest
    4.60, Build 1500
    WinRAR
    3.71d
    XMPEG
    5.03, Build 5.0.8.84
    XviD
    1.2.-127
    Avidemux
    2.4.3
    POV-Ray
    3.7, Beta 27
    Cinebench
    R10, 64 Bit
    Crysis
    Demo
    Crysis Benchmark Tool
    1.0.0.5
    UT3
    Demo
    UT3-Bench
    0.2.0.35
    Doom 3
    Demo
    Quake 3
    Quake 3 Arena
    q3bench
    v2.00 Public Beta
    3DMark Vantage
    Advanced, Build 1.0.1, ohne Feature Tests
    PCMark Vantage
    Advanced, Build 1.0.0
    BOINC
    6.2.19


    Unser Test-Parcours soll einen guten Querschnitt durch den Alltagsbetrieb eines PCs bilden. 32 Bit- und 64 Bit-Anwendungen sind vertreten, ältere Spiele wechseln sich mit neueren ab, Video-Encoding und Rendering sind vertreten und selbst Distributed Computing spielt eine Rolle. Das alles sind Anwendungen, die im Alltag auftreten können und zeigen so einen guten Querschnitt durch das Anforderungsprofil eines heutigen Prozessors.
    [break=Danksagung]
    Ein Artikel wie das heutige Review, welches die stattliche Zahl von über 40 Seiten erreicht, ist für eine "ehrenamtliche" Redaktion immer eine große Herausforderung. Das Interesse unserer Leser und die (selbstverständlich berechtigte) Forderung nach möglichst vielen Vergleichswerten sind oftmals ein Kraftakt. Denn gemäß dem "Gesetz der größten Gemeinheiten" fehlt es natürlich immer genau an der Hardware, die als Vergleichsobjekt sinnvoll, ja fast schon unumgänglich ist.

    Doch an dieser Stelle können wir uns gleich auf mehrere Partner verlassen, die uns - wie schon bei vergangenen Reviews - tatkräftig unterstützt haben. Einer dieser Partner ist die TOPAS GBS Datentechnik in Cottbus. Herr Hundro, Mitarbeiter von TOPAS, hat uns für die Tests mit einem Athlon 64 X2 6400+, einem Intel Core 2 Duo E8600 sowie Arbeitsspeicher vom Typ DDR3 ausgestattet.

    AMD Phenom II Deneb - Titelbild


    Ein weiterer Partner ist zwar auch aus vergangenen Reviews auf Planet 3DNow! bekannt, jedoch in einer völlig anderen Nische: FOXCONN. Wer sich die Mainboard-Tests auf Planet 3DNow! anschaut, wird mehrfach über Platinen von FOXCONN stolpern. Kein Wunder, da wir in den letzten zwei Jahren eine große Vielfalt an Mainboards (und Chipsätzen) testen konnten. Herr Krohn von FOXCONN hat uns für die Overclocking-Tests dieses Reviews mit einem FOXCONN Destroyer ausgestattet, welches vor kurzem durch unser Review-Parcours geschickt wurde. Doch mit der Board-Leihstellung noch nicht genug.

    Wir erhielten unser erstes AMD Phenom II-Sample für die Vorabtests nicht etwa von AMD direkt, sondern von FOXCONN. Von den Prozessoren, die für die Entwicklungsarbeit in Sachen BIOS durch AMD bereitgestellt wurden, übersandte uns Herr Krohn ein Exemplar, sodass wir frühzeitig mit den Arbeiten zum heutigen Review beginnen konnten.

    Neben der TOPAS GBS Datentechnik und FOXCONN wurden wir noch von anderen Herstellern unterstützt. AMD sandte uns ebenfalls ein Deneb-Sample (samt Gigabyte GA-MA790GP-DS4H-Mainboard), zusätzlich noch einen AMD Phenom X3 8750 BE als Vergleichs-Prozessor, Intel stellte ein Core i7-System zur Verfügung und letztendlich zeichneten Corsair sowie OCZ für einen Teil des verwendeten DDR2- und DDR3-Speichers verantwortlich.

    An dieser Stelle also herzlichen Dank an alle Partner, denen wir es zu verdanken haben, dass Reviews in solchem Umfang überhaupt erst möglich sind.
    [break=Vorwort zu den Benchmarks]
    Bevor wir (endlich) zu dem Teil übergehen, in welchem wir die Performance von verschiedenen Prozessoren vergleichen, möchten wir vorab noch einige wichtige Informationen zum Benchmark-Teil geben. Denn wer uns kennt weiß, dass wir nicht einfach so CPUs verbauen, durch unseren Parcours schicken und letztendlich vielleicht Äpfel mit Birnen vergleichen.

    Oberste Priorität haben bei uns Vergleiche bei gleicher Taktrate. Dadurch lässt sich zuverlässig erkennen, welche Architektur bei welcher Anwendung Vorteile hat. Das ist jedoch nur die halbe Wahrheit, da es in der Praxis meist CPUs mit unterschiedlichen Taktraten gibt. Und genau aus diesem Grund haben wir gleich mehrere Szenarien vergleichen.

    Benchmarks Teil 1: Vergleich bei 2,5 GHz

    Im ersten Teil unseres Benchmark-Abschnittes haben wir sämtliche Tests mit allen uns zur Verfügung stehenden Prozessoren bei 2,5 GHz Taktfrequenz durchgeführt. Die CPUs liefen dabei wie folgt:
    • AMD Phenom II X4 940 BE: 200 x 12,5 - 1,8 GHz NB-Takt - DDR2-1066
    • AMD Phenom X4 9850 BE: 200 x 12,5 - 2 GHz NB-Takt - DDR2-1066
    • AMD Phenom X3 8750 BE: 200 x 12,5 - 1,8 GHz NB-Takt - DDR2-1066
    • AMD Phenom X4 9600 BE: 200 x 12,5 - 1,8 GHz NB-Takt - DDR2-1066
    • AMD Athlon 7750 BE: 200 x 12,5 - 1,8 GHz NB-Takt - DDR2-1066
    • AMD Athlon 64 X2 6400+: 200 x 12,5 - DDR2-714
    • Intel Core 2 Duo E8600: 333 x 7,5 - DDR3-1333
    • Intel Core 2 Extreme QX9770: 333 x 7,5 - DDR3-1333
    • Intel Core i7 965 XE: 133 x 19 - 4,8 GHz QPI-Takt, DDR3-1066 - Turbo-Modus deaktiviert

    Mit Ausnahme des i7 liefen alle Prozessoren exakt bei 2,5 GHz, während der jeweilige FSB bzw. Referenztakt spezifikationsgerecht eingestellt wurde.

    Beim Core i7 fehlte der passende Multiplikator, um genau bei 2.500 MHz zu landen. Er wurde daher mit 2.533 MHz betrieben, was die kleinstmögliche Abweichung darstellte.

    Benchmarks Teil 2: Vergleich bei 3 GHz

    Auch bei 3 GHz - dem Standardtakt des Phenom II X4 940 - haben wir die Performance verglichen.

    • AMD Phenom II X4 940 BE: 200 x 15 - 1,8 GHz NB-Takt - DDR2-1066
    • AMD Phenom X4 9850 BE: 200 x 15 - 2 GHz NB-Takt - DDR2-1066
    • AMD Phenom X3 8750 BE: 200 x 15 - 1,8 GHz NB-Takt - DDR2-1066
    • AMD Athlon 7750 BE: 200 x 15 - 1,8 GHz NB-Takt - DDR2-1066
    • AMD Athlon 64 X2 6400+: 200 x 15 - DDR2-750
    • Intel Core 2 Duo E8600: 333 x 9 - DDR3-1333
    • Intel Core 2 Extreme QX9770: 333 x 9 - DDR3-1333
    • Intel Core i7 965 XE: 133 x 22 - 4,8 GHz QPI-Takt, DDR3-1066 - Turbo-Modus deaktiviert

    Unser Phenom im B2-Stepping musste in dieser Runde die Segel streichen, da er 3 GHz nicht erreicht. Bei den restlichen Prozessoren war dies jedoch kein Problem, weshalb wir diese - wieder mit Ausnahme des i7 - bei exakt 3 GHz vergleichen konnten.

    Beim i7 hatten wir die Wahl, entweder 2,93 oder 3,06 GHz zu verwenden. Wir entschieden uns für den niedrigeren Takt von 2,93 GHz, da dies exakt der Original-Frequenz eines Intel Core i7 940 entspricht.

    Benchmarks Teil 3: Vergleich der jeweils schnellsten Prozessoren (High End)

    Im dritten Teil wollten wir wissen, welche Performance pro Generation maximal möglich ist, wieviel Leistung ein Kunde also vom jeweiligen Hersteller offiziell kaufen kann. Es ist also ein Vergleich der jeweiligen Topmodelle. Aus diesem Grund haben wir folgende Szenarien getestet:
    • AMD Phenom II X4 940 BE: 200 x 15 = 3000 MHz - 1,8 GHz NB-Takt - DDR2-1066
    • AMD Phenom X4 9950 BE: 200 x 13 = 2600 MHz - 2 GHz NB-Takt - DDR2-1066
    • AMD Athlon 64 X2 6400+: 200 x 16 = 3200 MHz - DDR2-800
    • Intel Core 2 Duo E8600: 333 x 10 = 3333 MHz - DDR3-1333
    • Intel Core 2 Extreme QX9770: 400 x 8 = 3200 MHz - DDR3-1600
    • Intel Core i7 965 XE: 133 x 24 = 3200 MHz - 6,4 GHz QPI-Takt, DDR3-1066 - Turbo-Modus aktiviert

    Mit Ausnahme eines Phenom X4 9950 haben uns für das heutige Review jeweils die schnellsten Prozessoren zur Verfügung gestanden, welche Enduser kaufen können. Diese haben wir entsprechend ihrer Spezifikationen verglichen. Der Phenom X4 9950 wurde mit Hilfe des X4 9850 simuliert.

    Benchmarks Teil 4: Skalierung des Deneb

    Abschließend haben wir den neuen Deneb noch mit einer Taktrate von 3,5 GHz durch alle Benchmarks geschickt und mit den bisher erzielten Ergebnissen verglichen:
    • AMD Phenom II X4 940 BE: 200 x 12,5 - 1,8 GHz NB-Takt - DDR2-1066
    • AMD Phenom II X4 940 BE: 200 x 15 - 1,8 GHz NB-Takt - DDR2-1066
    • AMD Phenom II X4 940 BE: 200 x 17,5 - 1,8 GHz NB-Takt - DDR2-1066
    • AMD Phenom II X4 940 BE: 200 x 15 - 2,2 GHz NB-Takt - DDR2-1066

    Dank Vergleichswerten bei 2,5 GHz, 3 GHz und 3,5 GHz lässt sich erkennen, wie der Phenom II mit steigendem Takt skaliert. Ebenso ist eine Tendenz erkennbar, welche Performance bei zukünftigen CPUs zu erwarten ist, welche mit einer anderen Taktrate released werden.

    Wir hoffen, durch die Auswahl der Tests und der verglichenen Prozessoren ein möglichst breites Spektrum an Informationen abzudecken, sodass für jeden Leser ein interessanter Aspekt sichtbar wird. Doch nun genug der Vorrede - auf zu den Benchmarks!
    [break=2,5 GHz: Everest Memory Benchmark, WinRAR]
    Everest


    Everest von Lavalys hat sich in letzter Zeit zu einem populären Benchmark entwickelt. Viele nutzen ihn, die Versionsabhängigkeit ist nicht so ausgeprägt wie bei SiSoft Sandra und auch bei uns im Forum lassen sich viele Vergleichswerte finden. Aus diesem Grund nutzen wir den integrierten Memory-Benchmark von Everest, um den Speicherdurchsatz beim Lesen, Schreiben und kopieren sowie die Speicherlatenz zu messen. Dabei kommt die Programmversion 4.60 mit Build 1.500 zum Einsatz.

    Everest


    Speicherdurchsatz: Lesen


    Phenom I und Phenom II liegen nahezu gleichauf. Hingegen können sich die Intel-CPUs absetzen, der Core i7 dank integriertem Triple-Channel Speichercontroller samt DDR3-RAM sogar mehr als deutlich.

    Speicherdurchsatz: Schreiben


    Auch den Write-Test dominieren die Intel-Prozessoren, der Deneb kann sich hingegen von den restlichen AMD-CPUs absetzen.

    Speicherdurchsatz: Kopieren


    Den Copy-Test entscheidet ebenfalls der i7 für sich. Die Penryn-Prozessoren müssen sich hier mit hinteren Plätzen begnügen, der Deneb übernimmt hingegen Platz 2.

    Speicherlatenz


    Gleiches Bild bei der Speicherlatenz. Platz 1 für den i7, Platz 2 für den Phenom II.


    WinRAR


    Auch bei WinRAR wird immer auf gleichem Weg getestet: Es wird ein ca. 4,5 Gigabyte großes RAR-Archiv mit gemischtem Inhalt geöffnet und anschließend der integrierte Benchmark laufen gelassen. WinRAR reagiert äußerst feinfühlig auf Speicher-Latenzen.

    WinRAR"


    WinRAR


    Im WinRAR zeigt der Deneb, was in ihm steckt. Mit mehr als 300 KByte Vorsprung wird sowohl der Penryn-Quad-Core mit seinen 12 MByte L2-Cache als auch die gesamte Konkurrenz aus eigenem Hause in die Tasche gesteckt. Der i7 zieht hingegen wieder einsam seine Kreise um sämtliche Konkurrenz - IMC samt Triple-Channel-DDR3 machen es möglich.
    [break=2,5 GHz: XMPEG, Avidemux, H.264]
    XMPEG + XviD / Avidemux + h.264


    Wenn es um Video-Encoding bzw. -Decoding geht, so gibt es unzählige Variationen und Ausgestaltungen von Software. Viele Programme und noch mehr Codecs lassen dem Enduser die Qual der Wahl. Dabei ist die Nutzung der Ressourcen genauso vielfältig wie die Software selbst: Einige Programme bzw. Codecs können maximal einen Prozessorkern ansprechen, andere wiederum nehmen alles, was sie an Leistung bekommen können - schwer, dabei einen Querschnitt abzubilden.

    Wir haben mit der Wahl von XMPEG in Verbindung mit dem XviD-Codec sowie Avidemux in Verbindung mit dem H.264-Codec versucht, diesen Querschnitt zu finden. Während XMPEG mit dem zum Teststart aktuellen XviD-Codec 1.2 Beta kaum mehr als einen Prozessorkern beansprucht, nutzt Avidemux dank H.264-Codec jede zur Verfügung stehende Ressource. In beiden Fällen wandeln wir je ein Referenz-Video um und messen dabei die benötigte Zeit.

    XMPEG


    XMPEG + XviD


    Auch im XMPEG sehen wir die bereits "gewohnte" Hirarchie. Intels Bloomfield dominiert, Platz 2 gebührt dem Phenom II.


    Avidemux


    Avidemux + H.264


    Auch im Avidemux bleibt es beim zweiten Rang für den neuen X4 940. Allerdings siegt nicht wie gewohnt der i7 sondern der Yorkfield. Intels Bloomfield muss sich trotz massivem Multi-Threading auf Platz 3 einreihen.


    Da das Encodieren eines Videos einen Aspekt darstellt, das Abspielen eines Videos hingegen einen völlig anderen, spielen wir ein vorgefertigtes mit h2.64-Codec erstelltes Video im Windows Media Player ab und messen mittels der Windows Leistungsanzeige die auftretende Prozessorlast.

    Perfmon


    CPU-Last Wiedergabe h.264-Video


    Je mehr Kerne (inklusive Threads), desto weniger CPU-Last. So kann das Fazit unseres Last-Tests ausfallen, wobei sich der Deneb hinter den Intel-Quad-Cores einreihen muss.
    [break=2,5 GHz: POV-Ray, Cinebench]
    POV-Ray


    Auch der Punkt Rendering darf in unserem Parcours nicht fehlen. Für diesen Bereich nutzen wir 2 Programme, die unterschiedliche Anwendungsgebiete haben.

    Auf der einen Seite kommt POV-Ray zum Einsatz. Dabei handelt es sich um ein Raytracer-Programm, welches im Benchmark-Modus eine vorgefertigte 3D-Szene berechnet. Gemessen wird die dafür benötigte Zeit.

    POV-Ray


    POV-Ray


    Gegen die Kraft von 8 gleichzeitig rechnenden Threads beim Bloomfield ist kein Kraut gewachsen. Unser Phenom II macht seine Sache jedoch gut und weist den Yorkfield in die Schranken.


    Cinebench


    Auf der anderen Seite nutzen wir das bekannte Renderprogramm Cinebench in der aktuellen Version R10. Cinebench basiert auf der Cinema 4D-Software von Maxon und liegt in einer 64 Bit-Version vor, welche wir natürlich nutzen. Wir lassen den Benchmark hintereinander erst auf einem Prozessorkern und dann auf allen Kernen laufen, notieren die jeweiligen Ergebnisse sowie den Speedup-Faktor.

    Cinebench


    Cinebench 1 CPU


    Cinebench ist wieder fest in Intel-Hand. Mit gebührendem Abstand belegt der X4 940 Platz 4 in der Rangliste, kann sich hingegen auch relativ deutlich von der hauseigenen Konkurrenz absetzen.

    Cinebench x CPU


    In der Multiprozessor-Berechnung schmilzt der Abstand zum Penryn-Quad, mit knapp 500 Punkten fällt er jedoch noch merklich aus.

    Cinebench Multiprocessor Speedup


    Der Deneb besitzt den etwas besseren Speedup-Faktor gegenüber dem Penryn. Zusätzlich muss er sich sogar gegen die bewährten Agena-Prozessoren geschlagen geben. Bemerkenswert sind auch die glatt 2,00 des Athlon X2 Kuma, die eigentlich ein nicht erreichbares theoretisches Ideal darstellen.
    [break=2,5 GHz: Crysis, UT3]
    Crysis


    Crysis ist ein DirectX 10-Spiel, welches einen integrierten CPU-Benchmark in 64 Bit bietet. Wir lassen diesen Benchmark mit Hilfe des kostenlosen "Crysis Benchmark-Tools" hintereinander in den Auflösungen 1024x768, 1280x1024 sowie 1600x1200 jeweils mit dem Detail-Level "High" laufen.

    Crysis


    Sicher könnte man darüber nachdenken, immer häufiger anzutreffende Auflösungen im Widescreen-Format zu nutzen. Da wir mit diesem System jedoch keine Grafikkarten testen und die Vergleichbarkeit lediglich unter den Mainboards bzw. Prozessoren gegeben sein soll, bleiben wir den bisher genutzten Auflösungen treu.

    Crysis 1024x768


    Crysis 1280x1024


    Crysis 1600x1200


    In niedrigen Auflösungen muss sich der Phenom II gegenüber der Intel-Konkurrenz deutlich hintenan stellen. Mit zunehmender (praxisnaher) Auflösung (und somit zunehmender GPU-Limitierung) wird der Rückstand des Deneb auf den Penryn deutlich kleiner, sodass es bei 1600x1200 Bildpunkten im Prinzip keine nennenswerten Unterschiede mehr gibt. Einzig der i7 dreht auch hier Kreise um die Konkurrenz.


    UT3


    Unreal Tournament bzw. dessen Game-Engine ist ein Beispiel für gute Systemausnutzung. Hier spielt die Grafikleistung eine weniger gewichtige Rolle - stattdessen skaliert das Spiel mit der Anzahl der Prozessorkernen und ist somit ideal für einen Systemvergleich.

    UT3


    Findige Programmierer haben ein kleines, kostenloses Tool namens "UT3-Bench" geschrieben, welches wir für unsere Benchmarks nutzen. Auch hier nutzen wir die Auflösungen von 1024x768, 1280x1024 sowie 1600x1200 und lassen den Benchmark mit der Map vCTF-Suspense_fly jeweils 60 Sekunden laufen. Vor den Durchläufen wird jedoch noch der von Haus aus eingebautet Frame-Limiter deaktiviert.

    UT3 1024x768


    UT3 1280x1024


    UT3 1600x1200


    Unreal Tournament 3 ist trotz massiver Multi-Threaded-Berechnung nicht die Paradedisziplin des Bloomfield-Prozessors. Dieser wird vom Phenom II auf Abstand gehalten, während der Yorkfield wiederum deutlich vor selbigem liegt.
    [break=2,5 GHz: Doom 3, Quake 3]
    Doom 3


    Doom 3 stellt unseren Vertreter der etwas älteren Spiele dar, was insgesamt zu einem guten Querschnitt durch die Spielewelt führt. Wieder kommen die 3 bekannten Auflösungen mit "Ultra Details" zum Einsatz. Gewertet wird jeweils der zweite Durchlauf, da beim ersten Durchlauf starke Nachladeruckler auftreten und dadurch das Ergebnis verfälschen.

    Doom 3


    Doom 3 1024x768


    Doom 3 1280x1024


    Doom 3 1600x1200


    Der Deneb muss sich der Intel-Armada relativ deutlich geschlagen geben, hält hingegen die hauseigene Konkurrenz auf Abstand.


    Quake 3


    Einige werden beim Lesen der Überschrift "Quake 3" schmunzeln. Verständlich, denn dieses Spiel hat bereits einige Jahre auf dem Buckel. Als aktuell kann man es also nicht mehr bezeichnen. Doch warum nutzen wir diese Software noch immer?

    Quake 3 reagiert wie kaum ein anderes Programm auf das Memory-Subsystem eines PCs. Ob Speichertakt, Latenzen oder verschiedene Speicherbestückungen - es gibt kaum eine Situation, in der Quake 3 nicht darauf reagiert. Damit erhebt sich dieses Tool zum unverzichtbaren Bestandteil unseres Benchmark-Parcours.

    Quake 3


    Für unsere Benchmarks nutzen wir "Q3Bench" und lassen die Map "Demo001" in den Auflösungen 640x480 mit normalen Details sowie 1024x768 mit maximalen Details jeweils 2x durchlaufen. Gewertet wird der zweite Durchlauf, da das Ergebnis des ersten Durchlaufs durch das erstmalige Laden verfälscht wird.

    Quake 3 640x480


    Quake 3 1024x768


    Im Quake3-Benchmark wiederholt sich das Bild von Doom 3. Der Deneb belegt den 1. Platz - hinter den Intel-CPUs.
    [break=2,5 GHz: 3DMark Vantage, PCMark Vantage]
    3DMark Vantage


    Zum Abschluss unseres Benchmark-Parcours statten wir Futuremark noch einen Besuch ab. Obwohl die Benchmarks aus diesem Hause derzeit heftig umstritten sind (wir berichteten), gehören sie noch immer zu den beliebtesten Vergleichsmöglichkeiten.

    Futuremark bietet mit 3DMark Vantage bzw. PCMark Vantage zwei Programme an, die ausschließlich unter Windows Vista laufen. PCMark liegt zudem in einer 64 Bit-Version vor, welche wir nutzen. 3DMark Vantage lassen wir im vorgefertigten Performance-Preset laufen (High- bzw. Extreme-Preset sind aufgrund des verwendeten Monitors nicht zugänglich).

    3DMark Vantage Performance


    3DMark Vantage Performance


    3DMark Vantage Performance Gesamt


    3DMark Vantage Performance CPU


    3DMark Vantage ist Intel-dominiert. Sowohl beim Gesamtergebnis als auch beim CPU-Test liegen die blauen Prozessoren (weit) vorne.


    PCMark Vantage


    Der PCMark bietet verschiedene Suiten, die unterschiedliche Bereiche des PCs testen. Wir nutzen neben dem Standard-Durchlauf noch zusätzlich die Speicher- sowie Gaming-Suite und können somit ein detailliertes Ergebnis erzielen.

    Da während des Festplatten-Tests Daten auf die Festplatte geschrieben bzw. von der Festplatte gelesen werden, ist eine fragmentierte Festplatte tödlich für ein nachvollziehbares Resultat. Aus diesem Grund spendieren wir PCMark eine eigene 5 Gbyte große Partition, die bei jedem System vor der Installation von PCMark formatiert und nach der Installation defragmentiert wird. Verfälschungen können dadurch nicht auftreten.

    PCMark Vantage


    PCMark Vantage gesamt


    PCMark Vantage Memory


    PCMark Vantage Gaming


    Zwischen Yorkfield und Deneb geht es relativ eng zu. Lediglich Bloomfield kann sich hier noch absetzen.
    [break=2,5 GHz: BOINC, Leistungsaufnahme]
    BOINC


    Viele Forenmitglieder von Planet 3DNow! betreiben Distributed Computing als Hobby und stellen dabei die nicht benötigte Rechenzeit ihres Computers der Wissenschaft zur Verfügung. Planet 3DNow! rangiert dank der vielen fleißigen Mitglieder unter den Top 10-Teams weltweit - kein Wunder also, dass wir einen Distributed Computing-Benchmark in unser Prozessor-Review eingebaut haben. Es kommt die aktuelle BOINC-Version 6.2.19 zum Einsatz, deren integrierter Benchmark genutzt wird.

    Der Benchmark errechnet jeweils die Leistungsfähigkeit eines Prozessorkerns. Um auch ein ungefähres Bild der Leistungsfähigkeit des gesamten Prozessors geben zu können, haben wir die erzielten Einzelergebnisse mit der jeweiligen Anzahl der gleichzeitig berechenbaren Threads multipliziert.

    Grund für diese Herangehensweise sind zwei Aspekte. Erstens war es zeitlich nicht möglich, die tatsächliche Leistungsfähigkeit der Prozessoren durch das Berechnen von echten Workunits zu ermitteln. Aufgrund der Vielzahl der CPUs hätten wir allein für diese Zahlen mehrere Tage benötigt - Zeit, die für andere interessante Aspekte gefehlt hätte. Zweitens können die Ergebnisse auch von Projekt zu Projekt schwanken, weshalb wir uns der Kritik, ein möglicherweise AMD- oder Intel-freundliches Projekt ausgewählt zu haben, nicht stellen wollten. Hier verweisen wir auf unser Distributed Computing Forum, wo in den nächsten Tagen sicherlich erste Laufzeiten des Phenom II in unterschiedlichen Projekten gepostet werden.

     BOINC floating point MIPS (Whetstone) - gesamte CPU


    Alle AMD-Prozessoren nehmen sich im Ergebnis der Whetstone-Berechnung nichts. Dem i7 liegt dieser Test nicht ganz, weshalb er sich nur an die letzte Stelle setzen kann.

     BOINC floating point MIPS (Whetstone) - pro Kern


    Dank der maximal 8 gleichzeitig berechenbaren Workunits kann der Bloomfield-Prozessor insgesamt deutlich punkten. Der Deneb lässt selbstverständlich den Wolfdale hinter sich, liegt selbst hingegen knapp hinter dem Yorkfield.

     BOINC integer MIPS (Dhrystone) - gesamte CPU


    Die Dhrystone-Berechnung, welche sehr cachelastig ausgeführt wird, schmeckt sowohl dem Deneb als auch dem Bloomfield besser.

     BOINC integer MIPS (Dhrystone) - pro Kern


    Hochgerechnet auf die Anzahl der zu berechnenden Workunits bleibt Intels i7 unangefochten Nummer 1, Intels Penryn hat gegen die AMD-Konkurrenz jedoch nichts mehr zu lachen.



    Leistungsaufnahme


    Wie viel Strom verbraucht der aktuelle PC? Die Antwort auf diese Frage darf natürlich nicht fehlen. Aus diesem Grund messen wir die Leistungsaufnahme in bestimmten Szenarien mittels des Voltcraft Energy Monitor 3000. Dabei messen wir die Leistungsaufnahme des Gesamtsystems, jedoch ohne Monitor.

    Leistungsaufnahme Prime95 64 Bit


    Zwar platziert sich der Phenom II nur auf Platz 3, er ist jedoch der erste Prozessor im Ergebnisdiagramm, welcher mehr als 2 Kerne besitzt. Neben der Tatsache, dass der X4 940 bei 2,5 GHz weniger Strom verbraucht als die Quad-Core-Pendants von Intel, wird selbst der Toliman überflügelt - obwohl dieser einen Kern weniger versorgen muss.

    Leistungsaufnahme Idle ohne Cool'n'Quiet


    Im Idle-Betrieb ohne aktiviertes Cool'n'Quiet (bzw. Speedstep) wird der X4 940 nur noch vom Athlon 64 X2 sowie vom Wolfdale geschlagen. Alle anderen Prozessoren lässt er gekonnt hinter sich.

    Leistungsaufnahme Idle mit Cool'n'Quiet


    Mit aktivierter Stromspar-Einstellung bietet der Bloomfield die beste Leistungsaufnahme, dicht gefolgt vom alten Athlon 64 X2 im F3-Stepping. Dann folgt bereits der Deneb mit einem ordentlichen Polster zum Yorkfield.
    [break=3 GHz: Everest Memory Benchmark, WinRAR]
    Jetzt gehen wir eine Stufe höher und vergleichen die Performance bei 3 GHz - der Standard-Taktrate des X4 940.

    Everest


    Speicherdurchsatz: Lesen


    Speicherdurchsatz: Schreiben


    Speicherdurchsatz: Kopieren


    Speicherlatenz


    Im Grunde genommen hat sich das Bild im Everest-Speicherbenchmark nicht großartig verändert - mit einer Ausnahme. Der K8-Kern in Person des Athlon 64 X2 legt deutlich zu - in allen Bereichen. Er skaliert am Besten mit steigendem Prozessortakt, da der Takt des integrierten Speichercontrollers dem Prozessortakt entspricht und somit deutlich angehoben wurde (nicht zu vergessen der Speichertakt selbst, der aufgrund eines günstigeren Teilers ebenfalls schneller läuft). Bei allen anderen CPUs blieb der Takt des Speichercontrollers identisch, was die nahezu unveränderten Werte erklärt.


    WinRAR


    WinRAR


    Auch im WinRAR ändert sich das Bild mit höherem CPU-Takt kaum. Am deutlichsten kann auch hier der Athlon 64 X2 zulegen - was an seinem letzten Platz jedoch nichts ändert.
    [break=3 GHz: XMPEG, Avidemux, H.264]
    XMPEG + XviD


    XMPEG + XviD


    Dank 500 MHz mehr Taktfrequenz verringern sich die Berechnungszeiten deutlich, die Rangfolge bleibt jedoch auch bei 3 GHz bestehen. i7 vor Deneb, gefolgt vom Penryn sowie dem Agena-Kern.


    Avidemux + h.264


    Avidemux + H.264


    Ebenfalls schneller, jedoch in der Reihenfolge unverändert, präsentiert sich Avidemux.


    Prozessorlast bei h.264-Wiedergabe


    CPU-Last Wiedergabe h.264-Video


    Die Reihenfolge der Ergebnisse bleibt unverändert. Interessant ist hingegen, dass die Intel-Prozessoren trotz 20 Prozent mehr Takt kaum an Prozessorlast gegenüber 2.500 MHz verlieren. Daher wird der Abstand vom Deneb zum Penryn deutlich kleiner.
    [break=3 GHz: POV-Ray, Cinebench]
    POV-Ray


    POV-Ray


    AMDs Phenom II kann seinen Vorsprung im POV-Ray-Benchmark gegenüber dem Penryn auch bei 3 GHz behaupten. Unangefochten die Nummer 1 ist noch immer Intels i7.

    Cinebench


    Cinebench 1 CPU


    Cinebench x CPU


    Cinebench Multiprocessor Speedup


    Alle Prozessoren skalieren sehr ähnlich mit 500 MHz Mehrtakt. Im Speedup-Faktor muss sich der Deneb wieder dem Agena-Quad-Core geschlagen geben.
    [break=3 GHz: Crysis, UT3]
    Crysis


    Crysis 1024x768


    Crysis 1280x1024


    Crysis 1600x1200


    Während die meisten CPUs recht deutlich beim Sprung von 2.500 auf 3.000 MHz zulegen, bleibt der i7 bei fast identischen Frameraten stehen. In hohen Auflösungen scheint aber auch der Deneb schlechter zu skalieren, da der Abstand zum Penryn bei 1600x1200 Bildpunkten wächst.

    UT3


    UT3 1024x768


    UT3 1280x1024


    UT3 1600x1200


    Unreal Tournament hält keine besonderen Überraschungen bereit. Alle Prozessoren skalieren ähnlich mit ihrem Takt, wobei es der Penryn am Besten macht. Platz 2 jeweils für AMDs neues Flaggschiff.
    [break=3 GHz: Doom 3, Quake 3]
    Doom 3


    Doom 3 1024x768


    Doom 3 1280x1024


    Doom 3 1600x1200


    Keine Änderung der Rangordnung bei Doom 3. Die Reihenfolge bleibt auch bei 3 GHz unverändert.


    Quake 3


    Quake 3 640x480


    Quake 3 1024x768


    Quake 3 bestätigt das Bild ein weiteres Mal. Auffällig ist, dass der Vorsprung des i7 gegenüber dem restlichen Starterfeld schmilzt.
    [break=3 GHz: 3DMark Vantage, PCMark Vantage]
    3DMark Vantage Performance


    3DMark Vantage Performance Gesamt


    3DMark Vantage Performance CPU


    Erneut bleibt festzustellen, dass die Rangordnung unverändert bleibt, der i7 allerdings nicht ganz so gut skaliert, wie Penryn und Deneb.


    PCMark Vantage


    PCMark Vantage gesamt


    PCMark Vantage Memory


    PCMark Vantage Gaming


    Eine Wachablösung gibt es im Gesamt-Score zu beobachten. Der Vorsprung in der Gaming-Suite des PCMark des Deneb gegenüber dem Penryn wächst an, wodurch es im Gesamt-Score zum Platztausch zwischen beiden CPUs kommt.
    [break=3 GHz: BOINC, Leistungsaufnahme]
    BOINC


     BOINC floating point MIPS (Whetstone) - gesamte CPU


     BOINC floating point MIPS (Whetstone) - pro Kern


     BOINC integer MIPS (Dhrystone) - gesamte CPU


     BOINC integer MIPS (Dhrystone) - pro Kern


    BOINC bietet ebenfalls eine unveränderte Rangordnung, in der sich unser Phenom II im vorderen Feld platziert.


    Leistungsaufnahme


    Leistungsaufnahme Prime95 64 Bit


    Erneut avanciert der Deneb zum genügsamsten Prozessor mit mehr als 2 Kernen. Die Reihenfolge der Ergebnisse bleibt auch bei 3 GHz unverändert.

    Interessant an diesem Diagramm ist zudem die sehr hohe Leistungsaufnahme des Agena-Quad-Cores. Diese hat jedoch auch ihre Ursache: Die genutzte vCore. Während der verwendete Phenom X4 9850 BE unter Windows XP 32 Bit bei 3 GHz noch mit Standard-Spannung lief, musste es für den stabilen Betrieb unter Windows Vista 64 Bit deutlich mehr Spannung sein - genau genommen fast 1,5 Volt.

    Dieses Ergebnis demonstriert eindrucksvoll die Probleme, welche AMD mit dem Phenom in 65 nm hat bzw. hatte. Für höhere Taktraten unter 64 Bit scheint deutlich mehr Spannung notwendig, was aber weder aus Sicht der Temperatur noch der Verlustleistung realisierbar war. Der neue Deneb macht es hier besser und verlangt bei 3 GHz deutlich weniger Strom aus der Steckdose.

    Leistungsaufnahme Idle ohne Cool'n'Quiet


    Ohne aktivierte Stromsparmechanismen macht sich die hohe Betriebsspannung beim Agena ebenfalls negativ bemerkbar. Der Deneb kann sich hingegen sogar auf gleiche Höhe mit dem F3-Stepping des Athlon 64 setzen.

    Leistungsaufnahme Idle mit Cool'n'Quiet


    Ein Bild mit nahezu identischen Ergebnissen ergibt sich unter Verwendung der Stromsparmechanismen.
    [break=High-End: Everest Memory Benchmark, WinRAR]
    Im nun folgenden Teil unseres Artikels schauen wir uns die Performance der jeweils schnellsten Prozessoren an, die für die jeweilige Plattform erhältlich sind.

    Everest


    Speicherdurchsatz: Lesen


    Im Vergleich der schnellsten Prozessoren bleibt für AMDs Deneb nur der letzte Platz. Selbst der mittlerweile betagte Athlon 64 X2 ist hier schneller.

    Speicherdurchsatz: Schreiben


    Auch beim Write-Durchsatz hält der AM2-Prozessor die AMD-Fahnen hoch, der Deneb kann sich hier aber immerhin deutlich vom High-End-Vorgänger 9950 absetzen.

    Speicherdurchsatz: Kopieren


    Der Copy-Durchsatz ist wieder AMD-Gebiet. Bis auf den i7, welcher dank Triple-Channel und DDR3 hervorragende Bandbreiten liefert, überflügelt der Deneb alle anderen CPUs.

    Speicherlatenz


    Einmal mehr glänzt der i7 mit Platz 1 im Diagramm, die Latenz beider Phenom-Varianten liegt gleichauf.


    WinRAR


    WinRAR


    Die Dominanz des i7 steht außer Frage, der Hauptkonkurrent des X4 940 ist der QX9770. Und der kann sich nur unwesentlich vor den X4 setzen, obwohl er satte 200 MHz schneller ist und zudem auf FSB 1600 samt DDR3-1600 zurückgreifen kann.
    [break=High-End: XMPEG, Avidemux, H.264]
    XMPEG + XviD

    XMPEG + XviD


    Auch beim Encoding mittels XMPEG kann sich der fast 4x so teure QX9770 nicht richtig in Szene setzen.


    Avidemux + h.264


    Avidemux + H.264


    Bei gleicher Taktrate hält AMDs Deneb Intels Bloomfield in Schach. Läuft dieser aber mit vollem Takt (dank Turbo-Modus mit 3.333 MHz), so setzt er sich knapp vor den X4 940 - etwa 5 Prozent Vorteil bei etwa dreifachem Preis.


    Prozessorlast bei h.264-Wiedergabe


    CPU-Last Wiedergabe h.264-Video


    De facto identische Ergebnisse für QX9770 und X4 940 in Sachen Prozessorlast. Lediglich Intels Bloomfield weist deutlich weniger Last auf.
    [break=High-End: POV-Ray, Cinebench]
    POV-Ray


    POV-Ray


    Gegen den i7 965 XE ist kein Kraut gewachsen. Den QX9770 schlägt der Deneb absolut gesehen zwar denkbar knapp, aufgrund des um 200 MHz niedrigeren Taktes jedoch recht deutlich.


    Cinebench


    Cinebench 1 CPU


    Dank des Turbo-Modus, in welchem der i7 965 XE mit satten 3.466 MHz taktet, spielt der i7 in einer anderen Liga. In diesem Test muss sich der Deneb auch allen anderen Intel-CPUs geschlagen geben, welche zwischen 200 und 466 MHz mehr Taktfrequenz aufweisen. Die hauseigene Konkurrenz wird jedoch problemlos überflügelt.

    Cinebench x CPU


    Mit ca. 1.800 Punkten beträgt der Rückstand etwa 15 Prozent gegenüber dem QX9770. Eine ordentliche Leistung für den deutlich preiswerteren Deneb.

    Cinebench Multiprocessor Speedup


    QX9770 und X4 940 sind beim Speedup-Faktor nahezu gleichauf. Auch hier kann sich der ältere Agena-Phenom in Szene setzen.
    [break=High-End: Crysis, UT3]
    Crysis


    Crysis 1024x768


    In niedriger Auflösung wird der Phenom II deutlich von beiden Extreme-Varianten von Intel geschlagen.

    Crysis 1280x1024


    In 1280x1024 wird der Abstand zur Spitze deutlich geringer, der Anschluss ist jedoch noch nicht geschafft.

    Crysis 1600x1200


    In 1600x1200 muss der Deneb wieder etwas abreißen lassen und reiht sich hinter den Intel-CPUs ein.


    UT3


    UT3 1024x768


    UT3 1280x1024


    UT3 1600x1200


    Im Unreal Tournament 3 hält der Deneb in allen Auflösungen den Core i7 965 XE in Schach. Den QX9770 muss er hingegen ziehen lassen.
    [break=High-End: Doom 3, Quake 3]
    Doom 3


    Doom 3 1024x768


    Doom 3 1280x1024


    Doom 3 1600x1200


    Eine klare Rangordnung gibt es im Doom 3 zu beobachten. Der Phenom 9950 wird deutlich überflügelt, zu den Intel-CPUs ist jedoch ein noch deutlicherer Rückstand zu verzeichnen.


    Quake 3


    Quake 3 640x480


    Quake 3 1024x768


    Gleiches gilt für Quake 3.
    [break=High-End: 3DMark Vantage, PCMark Vantage]
    3DMark Vantage Performance


    3DMark Vantage Performance Gesamt


    3DMark Vantage Performance CPU


    Platz 3 für den X4 940. Phenom I sowie die Dual-Cores werden deutlich überflügelt, Intels Extreme-CPUs sind jedoch nicht in Reichweite.


    PCMark Vantage


    PCMark Vantage gesamt


    PCMark Vantage Memory


    PCMark Vantage Gaming


    Platz 3 für den Deneb auch im PCMark Vantage. In der Gaming-Suite sind X4 940 und QX9770 sogar gleichauf.
    [break=High-End: BOINC, Leistungsaufnahme]
    BOINC


     BOINC floating point MIPS (Whetstone) - gesamte CPU


    Beim Einzelkern-Ergebnis muss sich der Deneb nicht nur den Intel-CPUs geschlagen geben, selbst der schneller getaktete X2 6400+ zieht hier an ihm vorbei.

     BOINC floating point MIPS (Whetstone) - pro Kern


    Dank 4 Kerne sieht die Welt insgesamt aber wieder besser aus, Platz 3 mit rund 10 Prozent Rückstand auf den QX9770.

     BOINC integer MIPS (Dhrystone) - gesamte CPU


    In der Dhrystone-Berechnung hat der X2 auch beim Einzelkern-Ergebnis keine Chance. Der Deneb reiht sich knapp hinter dem Sockel 775-Quad ein.

     BOINC integer MIPS (Dhrystone) - pro Kern


    Unangefochten an Platz 1 steht der i7. QX9770 und X4 940 Seite an Seite auf den Plätzen 2 und 3.


    Leistungsaufnahme


    Leistungsaufnahme Prime95 64 Bit


    AMDs Deneb ist der genügsamste Quad-Core-Prozessor. Zudem ist der Abstand zum schnellsten AMD Dual-Core denkbar knapp.

    Leistungsaufnahme Idle ohne Cool'n'Quiet


    Gleiches Bild im Idle-Betrieb ohne Cool'n'Quiet. Hier wird aber sogar der X2 6400+ geschlagen.

    Leistungsaufnahme Idle mit Cool'n'Quiet


    Mit aktivierter Stromspareinstellung muss sich der X4 940 wiederum dem X2-CPU geschlagen geben. Interessant ist vor allem auch, dass Intels C1E/EIST-Einstellung eine enorme Einsparung bringt, die den i7 965XE sogar auf Platz 1 des Diagramms katapultiert.
    [break=Skalierung: Everest Memory Benchmark, WinRAR]
    Kommen wir nun zu einem weiteren interessanten Aspekt - der Skalierung mit der Taktfrequenz. In erster Linie stand für uns die Frage im Raum, wie es um die Performance steht, wenn man den Prozessortakt verändert. Deshalb haben wir alle Benchmarks erst mit 2,5 GHz, dann mit 3,0 GHz und abschließend mit 3,5 GHz durchgeführt. Diese 3 Testreihen wurden jeweils mit dem Standard-Northbridge-Takt von 1,8 GHz durchgeführt.

    Ganz zum Schluss wollten wir noch wissen, wie die Performance bei erhöhtem Northbridgetakt aussieht. Da unser Deneb-Sample aus dem Stand mit 2,2 GHz Northbridgetakt lief (inklusive Prime-Stabilität versteht sich), haben wir eine Testreihe mit 3 GHz CPU- und 2,2 GHz NB-Takt durchgeführt und die Ergebnisse ebenfalls mit in die Diagramme der folgenden Seiten aufgenommen.

    Everest


    Speicherdurchsatz: Lesen


    Speicherdurchsatz: Schreiben


    Speicherdurchsatz: Kopieren


    Speicherlatenz


    WinRAR skaliert zwar mit dem CPU-Takt, allerdings bei weitem nicht so, wie das mit einem erhöhten Northbridgetakt der Fall ist. Das ist jedoch auch nicht sehr überraschend, da der integrierte Speichercontroller mit genau diesem NB-Takt läuft und somit auf eine höhere Bandbreite zurückgreifen kann.


    WinRAR


    WinRAR


    Auch WinRAR, im Allgemeinen sehr latenzempfindlich, zeigt das gleiche Bild wie Everest. Die Erhöhung des NB-Taktes um 400 MHz bringt mehr als die Anhebung des CPU-Taktes um 500 MHz.
    [break=Skalierung: XMPEG, Avidemux, H.264]
    XMPEG + XviD


    XMPEG + XviD


    Während XMPEG mit dem Prozessortakt nahezu linear skaliert, bringt ein erhöhter NB-Takt nur einen eingeschränkten Vorteil.


    Avidemux + h.264


    Avidemux + H.264


    Avidemux spricht ebenfalls sehr gut auf die CPU-Taktrate an, die NB-Taktrate hat aber keinen Einfluss auf die Performance.


    Prozessorlast bei h.264-Wiedergabe


    CPU-Last Wiedergabe h.264-Video


    Auch bei der Prozessorlast bringt die Erhöhung des NB-Taktes keinen Vorteil. Die Erhöhung des CPU-Taktes bringt nur bis zu einem gewissen Punkt einen positiven Effekt mit sich.
    [break=Skalierung: POV-Ray, Cinebench]
    POV-Ray


    POV-Ray


    POV-Ray ist sehr prozessorlastig. Kein Wunder, dass dieser Test gut mit der Taktfrequenz der CPU skaliert. Der NB-Takt spielt hier ein weiteres Mal eine untergeordnete Rolle.


    Cinebench


    Cinebench 1 CPU


    Cinebench x CPU


    Cinebench Multiprocessor Speedup


    Für Cinebench gilt die gleiche Aussage wie bei POV-Ray. Mehr Prozessor-MHz werden dankend angenommen, auf die Anhebung des NB-Taktes kann in diesen Benchmarks allerdings verzichtet werden.
    [break=Skalierung: Crysis, UT3]
    Crysis


    Crysis 1024x768


    Crysis 1280x1024


    Crysis 1600x1200


    Ein gesteigerter Northbridge-Takt bringt im Crysis-CPU-Benchmark signifikante Vorteile. Zwar fallen diese nicht ganz so groß aus, wie bei 500 MHz mehr CPU-Takt, wenn man beides jedoch kombinieren würde, so hätte man ein ansehnliches Performance-Plus.


    UT3


    UT3 1024x768


    UT3 1280x1024


    UT3 1600x1200


    Gleiches Bild im Unreal Tournament 3. Auch hier bringen 400 MHz mehr NB-Takt einen deutlichen Performance-Zuwachs.
    [break=Skalierung: Doom 3, Quake 3]
    Doom 3


    Doom 3 1024x768


    Doom 3 1280x1024


    Doom 3 1600x1200


    Auch Doom 3 profitiert von höherem Northbridgetakt - allerdings nicht in dem Maße wie von höherem CPU-Takt.


    Quake 3


    Quake 3 640x480


    Quake 3 1024x768


    Gleiches Bild auch im Quake 3-Benchmark.
    [break=Skalierung: 3DMark Vantage, PCMark Vantage]
    3DMark Vantage Performance


    3DMark Vantage Performance Gesamt


    3DMark Vantage Performance CPU


    Während das Gesamtergebnis des 3DMark Vantage nur bedingt durch höheren CPU- sowie NB-Takt profitiert, skaliert das Ergebnis des CPU-Testes nahezu linear mit der Taktfrequenz. 40 Prozent mehr CPU-Takt resultieren in 36 Prozent mehr Punkten.


    PCMark Vantage


    PCMark Vantage gesamt


    PCMark Vantage Memory


    Das Gesamtergebnis sowie das Ergebnis der Memory-Suite reagieren auf den Prozessortakt, nicht jedoch auf den Northbridgetakt.

    PCMark Vantage Gaming


    Die Gaming-Suite kann jedoch auch Profit aus der Erhöhung des NB-Taktes schlagen - was die Ergebnisse der Spielebenchmarks der vergangenen Seiten des Artikels bestätigt.
    [break=Skalierung: BOINC, Leistungsaufnahme]
    BOINC


     BOINC floating point MIPS (Whetstone) - gesamte CPU


     BOINC floating point MIPS (Whetstone) - pro Kern


     BOINC integer MIPS (Dhrystone) - gesamte CPU


     BOINC integer MIPS (Dhrystone) - pro Kern


    Im gesamten BOINC-Test spielt einzig und allein die Taktrate des Prozessors eine Rolle. Die Northbridge kann man hier getrost vernachlässigen.


    Leistungsaufnahme


    Leistungsaufnahme Prime95 64 Bit


    Eine Erhöhung des NB-Taktes hat (sofern man die NB-Spannung beibehält) keine negativen Auswirkungen auf die Leistungsaufnahme. Um jedoch dauerhaft mit 3,5 GHz stabil arbeiten zu können, mussten wir die Prozessorspannung um 0,1 Volt auf 1,45 Volt erhöhen. Daher kommt auch der erhöhte Leistungsbedarf, welcher aber noch immer auf fast identischem Niveau eines Phenom mit Agena-Kern bei 2,5 GHz liegt.

    Leistungsaufnahme Idle ohne Cool'n'Quiet


    Leistungsaufnahme Idle mit Cool'n'Quiet


    Bei der Leistungsaufnahme im Idle-Betrieb gibt es kaum Unterschiede zwischen den verschiedenen Taktraten. Interessant ist zudem, dass der Deneb selbst bei erhöhter Betriebsspannung im Idle-Modus ohne CnQ keine signifikant höhere Leistungsaufnahme aufweist - ganz im Gegensatz zum Ur-K10.

    Nachdem wir uns nun auch die Skalierung des Deneb mit steigender Taktrate angeschaut haben, gibt es zwei Aspekte, die wir aus den Diagrammen der letzten Seiten mitnehmen:

    1. AMDs Deneb skaliert mit steigender CPU-Taktrate. Dabei ist sowohl in Sachen Performance als auch in Sachen Leistungsaufnahme kein Flaschenhals auszumachen, welcher weitere Evolutionsstufen dieser CPU ähnlich wie beim Agena-Phenom behindern würde.

    2. Die Erhöhung des Northbridge-Taktes hat bei weitem nicht in allen Tests einen Vorteil gebracht. Allerdings bringt die Erhöhung auch keine Nachteile mit sich und in den Tests, die davon profitieren, fällt der Vorteil meist signifikant aus. AMD würde also gut daran tun, mit kommenden Prozessorvarianten gleichzeitig einen höheren Northbridgetakt einzuführen.
    [break=Preis-/Leistungsverhältnis]
    Auf den vorangegangenen Seiten gab es ausreichend Gelegenheit, sich über die Performance des Deneb zu informieren. Aus Sicht der technischen Daten (3 GHz Taktfrequenz, 4 Kerne sowie 45 nm-Fertigung) sind die Haupt-Konkurrenten im Intel-Lager der Intel Core 2 Quad Q9650 sowie der Intel Core i7 940, welche beide ebenfalls in 45 nm gefertigt werden, 4 Kerne besitzen und eine Taktfrequenz von 3 GHz (bzw. im Falle des i7 940 mit 2,93 GHz leicht darunter) aufweisen. Je nach herangezogenem Szenario duelliert sich der Deneb mal mit dem Q9650, mal mit dem i7 940 und manchmal muss er beide Prozessoren ziehen lassen.

    Doch neben der absoluten Leistungsfähigkeit einer CPU lässt sich noch ein weiterer Aspekt zum Vergleich untereinander heranziehen: Das Preis-/Leistungsverhältnis. Wie viel Leistung erhält der Käufer für sein Geld? Welche CPU weist das bessere Verhältnis zwischen Preis und der gebotenen Leistung auf? Dieser Frage wollen wir auf dieser Seite des Artikels nachgehen.

    Basis für die Daten der folgenden Tabelle sind die Benchmarkergebnisse bei 3 GHz (Ergebnisse siehe Seite 20 - 26 dieses Artikels). Die Ergebnisse des AMD Phenom II Deneb werden dabei als 100 % angesetzt. Werte bei der Konkurrenz von über 100 Prozent bedeuten, dass die jeweilige CPU dort besser abgeschnitten hat, Werte unter 100 Prozent bedeuten ein schlechteres Abschneiden gegenüber dem Deneb.


    Phenom II
    X4 940

    Core 2 Quad
    Q9650

    Core i7
    940

    Everest Memory Read

    100 %

    108,3 %

    165,5 %

    Everest Memory Write

    100 %

    116,3 %

    195,9 %

    Everest Memory Copy

    100 %

    74,1 %

    161,7 %

    Everest Memory Latency

    100 %

    88,2 %

    128,4 %

    WinRAR

    100 %

    88 %

    152,9 %

    XMPEG + XviD

    100 %

    93,3 %

    108,7 %

    Avidemux + h.264

    100 %

    105,1 %

    95,8 %

    CPU-Last h.264

    100 %

    104,5 %

    156,8 %

    POV-Ray

    100 %

    91,5 %

    130,8 %

    Cinebench 1 CPU

    100 %

    106,1 %

    118,9 %

    Cinebench x-CPU

    100 %

    103,4 %

    133,6 %

    Cinebench Speedup

    100 %

    97,5 %

    112,4 %

    Crysis 1024x768

    100 %

    110 %

    114,4 %

    Crysis 1280x1024

    100 %

    100,8 %

    106,9 %

    Crysis 1600x1200

    100 %

    107,3 %

    108,5 %

    UT3 1024x768

    100 %

    111,4 %

    87,4 %

    UT3 1280x1024

    100 %

    112,5 %

    88,7 %

    UT3 1600x1200

    100 %

    106,8 %

    87,9 %

    Doom 3 1024x768

    100 %

    111,8 %

    117,7 %

    Doom 3 1280x1024

    100 %

    117,2 %

    121,6 %

    Doom 3 1600x1200

    100 %

    112,3 %

    115,1 %

    Quake 3 640x480

    100 %

    116,5 %

    124,5 %

    Quake 3 1024x768

    100 %

    115,1 %

    120,8 %

    3DMark Vantage Performance Gesamt

    100 %

    105,7 %

    112,9 %

    3DMark Vantage CPU

    100 %

    120,4 %

    174,1 %

    PCMark Vantage Gesamt

    100 %

    97,3 %

    112,4 %

    PCMark Vantage Memory

    100 %

    108,9 %

    113,5 %

    PCMark Vantage Gaming

    100 %

    92,5 %

    134,7 %

    BOINC Whetstone (Kern)

    100 %

    103,4 %

    91 %

    BOINC Whetstone (CPU)

    100 %

    103,4 %

    182,1 %

    BOINC Dhrystone (Kern)

    100 %

    92,3 %

    101,7 %

    BOINC Dhrystone (CPU)

    100 %

    92,3 %

    203,3 %

    Leistungsaufnahme Prime95

    100 %

    97,7 %

    99,1 %

    Leistungsaufnahme Idle (ohne CnQ)

    100 %

    91,2 %

    96,4 %

    Leistungsaufnahme Idle (mit CnQ)

    100 %

    90,5 %

    108,6 %

    Gesamtwertung

    100 %

    102,7 %

    125,3 %



    Über unseren kompletten Benchmarkparcours gemittelt rechnet Intels Core 2 Quad Q9650 gerade einmal 2,7 Prozent schneller bzw. erzielt im Schnitt ein um 2,7 Prozent besseres Ergebnis. Intels Core i7 940 erzielt im Schnitt ein um 25,3 Prozent besseres Ergebnis. Jedoch müssen wir hierbei beachten, dass wir den i7 um das Feature Turbo-Modus beschnitten haben, weil wir den Vergleich bei gleicher Taktrate in den Vordergrund gestellt haben. Mit aktiviertem Turbo-Modus würde der Vorsprung noch etwas größer ausfallen, Quantensprünge sind jedoch nicht zu erwarten. Doch was bedeuten diese Zahlen im Vergleich zum jeweiligen Preis?


    Phenom II
    X4 940

    Core 2 Quad
    Q9650

    Core i7
    940

    Gesamtleistung

    100 %

    102,7 %

    125,3 %

    aktueller Preis

    285 Euro
    (lt. Angabe AMD)

    ab ca. 451 Euro
    (Stand: 07.01.2009)

    ab ca. 480 Euro
    (Stand: 07.01.2009)

    Preisdifferenz

    100 %

    ca. 158 %

    ca. 168 %



    Obwohl im Schnitt nicht einmal 3 Prozent schneller, schlägt Intels Q9650 mit einem um fast 60 Prozent höheren Preis zu Buche. Etwas freundlicher sieht das Bild beim i7 940 aus, dennoch stehen den durchschnittlichen 25,3 Prozent Performancevorteil (exklusive Turbo-Modus) satte 68 Prozent Mehrpreis entgegen.

    Hinzu kommen auf Intel-Seite die im Schnitt höheren Anschaffungskosten für entsprechende Mainboards sowie DDR3-RAM. Die jeweiligen Preise lassen wir in unserer Rechnung allerdings außen vor, da unterschiedliche Ansprüche an die Ausstattung einer Hauptplatine auch deren Preis beeinflusst. Als einziger, preislich gesicherter Fakt bleibt festzuhalten, dass für eine Hauptplatine für Intels Sockel 1366, auf welchem die aktuellen Modelle des Intel Core i7 laufen (darunter selbstverständlich auch der i7 940), mit mindestens 189 Euro (Stand: 07.01.2009) zu Buche schlagen.
    [break=Unter- und Übertakten]
    Es folgen nun zwei weitere Aspekte, die viele unserer Leser interessieren werden. Auf den letzten Seiten konnten wir uns bereits davon überzeugen, dass unser Deneb-Exemplar problemlos mit 3,5 GHz betrieben werden kann. Allerdings wirft die dafür notwendige Erhöhung der Betriebsspannung die Frage auf, wie weit der Deneb denn überhaupt mit seiner spezifizierten VCore von 1,35 Volt übertaktet werden kann.

    Auf der anderen Seite steht für viele User die Frage im Raum, wieviel Einsparpotenzial AMDs neue Desktop-CPU bietet. Interessant sind hierbei zwei Aspekte: Erstens, wie weit man die Spannung bei Standardtakt herabsetzen kann und zweitens, wie weit man Spannung und Takt absenken kann, um so wenig wie möglich Energie zu verbrauchen.

    Aus diesem Grund haben wir uns den Deneb in verschiedensten Kombinationen angeschaut und mit Taktraten sowie Spannungen "gespielt". Als Messlatte für Stabilität diente uns jeweils der 1024k-Test von Prime95 64 Bit. Lief dieser ohne Rechenfehler durch, galt die Einstellung für uns als stabil - wohlwissend, dass dieser doch recht kurze Test keine finalen Rückschlüsse auf die Stabilität zulässt. Fakt ist, dass man Stabilität nicht nachweisen kann - Instabilität hingegen schon. In der Praxis zeigt sich, dass ein System, welches den 1024k-Test im Prime95 besteht (Dauer ca. 15 Minuten), eine grundlegende Stabilität mit sich bringt, die für unseren Testparcours ausreicht. Aus diesem Grund verzichten wir auf tagelange Prime- und/oder BOINC-Exzesse - und natürlich aufgrund des Zeitfaktors.

    Overclocking bei Standard-Spannung
    Ein Klick auf das Bild öffnet eine vergrößerte Version.


    Bei Standardspannung, die beim Gigabyte GA-MA790GP-DS4H zu allem Überfluss noch um ca. 0,03 Volt zu hoch angesetzt wird, konnten wir "nur" 3.350 MHz erreichen. Wollten wir höher hinaus, quittierte uns das System jeden Versuch mit einem Bluescreen. Von anderen Redaktionen haben wir erfahren, dass 3,5 bis 3,6 GHz stabil erreicht wurden, wobei diese Redaktionen nach unserem Kenntnisstand alle eine 32 Bit Windows-Version einsetzen. Möglicherweise liegt in der Verwendung unseres 64 Bit-Windows die Ursache begraben, weshalb wir im Vergleich zu anderen Redaktionen "nur" rund 11,6 % mehr Takt bei Standardspannung herausholen konnten. Denn bekanntlich "ticken" die Uhren bei Verwendung eines 64 Bit Betriebssystems noch etwas anders, was die Be- und Auslastung der CPU anbelangt.

    Wir haben uns jedoch auch die Frage gestellt, inwieweit wir möglicherweise durch das verwendete Gigabyte-Mainboard gehandicapt wurden. Aus diesem Grund haben wir das Übertaktungspotenzial auch noch auf anderen Mainboards getestet, dazu jedoch auf der nächsten Seite mehr. Jetzt wollen wir erstmal einen Blick auf die verschiedenen Verbrauchswerte im Idle-Betrieb sowie unter Last werfen, wenn Takt und Spannung angepasst wird.

    Leistungsaufnahme bei Über- und Untertaktung - load mit Prime95


    Leistungsaufnahme bei Über- und Untertaktung - Idle ohne Cool'n'Quiet


    Neben der ohnehin akzeptablen Leistungsaufnahme des Deneb lassen sich noch einige Watt durch Absenkung von Takt bzw. Spannung sparen. Somit kann der Phenom II noch ein gutes Stück in seiner Energie-Effizienz gesteigert werden - AMD hat also mit der Aussage über die Verbesserung der Leistungsaufnahme nicht geflunkert. Während bei Standardtakt die Absenkung um immerhin 0,1 Volt funktionierte, konnten wir den Prozessor bei 2 GHz mit eingestellten 1,000 Volt betreiben - was real in 1,024 Volt resultierte.

    Insgesamt konnten wir die Leistungsaufnahme des Gesamtsystems unter Last durch Veränderung der Prozessorspannung sowie der Spannung der integrierten Northbridge um 27 Watt senken. Taktet man die CPU zusätzlich noch herunter, lassen sich bis zu 76 Watt sparen - Prozessorvarianten mit einer niedrigeren TDP-Klasse als 125 Watt dürfte somit nichts im Wege stehen. Selbstverständlich ist das gezeigte Ergebnis einzig und allein auf unsere CPU anwendbar und nicht 1:1 auf jeden anderen Deneb übertragbar. Allerdings zeigt es das Potenzial, welches im Deneb steckt.
    [break=ACC oder nicht ACC - Das ist hier die Frage!]
    Viele unserer Leser nennen ein Mainboard mit der (mittlerweile betagten) Southbridge SB600 oder einen NVIDIA-Chipsatz ihr Eigen. Wie wir inzwischen wissen, bietet AMDs SB750 zusätzlich das Feature ACC - Advanced Clock Calibration. Damit soll sich das Übertaktungspotenzial der Phenom-CPUs (auch oder vor allem der älteren Agena-Phenoms) signifikant steigern lassen. Laut AMD-Verlautbarungen sollen damit bis zu 300 MHz Mehrtakt möglich sein.

    User von Mainboards ohne SB750 (damit sind auch Besitzer von Boards mit NVIDIA-Chipsätzen eingeschlossen) werden sich nun natürlich fragen, ob es signifikante Unterschiede in puncto Übertaktbarkeit auf verschiedenen Platinen gibt. Wir haben diese Frage zum Anlass genommen und die Übertaktbarkeit auf 4 verschiedenen Mainboards miteinander verglichen. Verwendet wurden diese Exemplare:
    • Gigabyte GA-MA790GP-DS4H (790GX / SB750)
    • Gigabyte GA-MA790FX-DQ6 (790FX / SB600)
    • FOXCONN Destroyer (nForce 780a SLI)
    • FOXCONN A79A-S (790FX / SB750)

    Schritt 1 war die Überprüfung, welche Hauptplatine den höchsten CPU-Takt bei Standardspannung erreicht. Im 2. Schritt haben wir die Spannung bei Standardtakt soweit wie möglich abgesenkt. Als letzter Schritt folgte dann die Verringerung der Taktfrequenz auf 2,0 GHz und die Absenkung der vCore auf den kleinstmöglichen Wert.

    Taktratenvergleich SB600 / SB750 / nForce 780a


    Die Vermutung der letzten Seite, dass wir womöglich etwas durch das verwendete 790GX-Mainboard eingebremst wurden, war nicht ganz unbegründet. Tatsächlich schafft es unser Gigabyte GA-MA790FX-DQ6, die CPU bei eingestellter Standardspannung um satte 124 MHz weiter zu übertakten, als dies beim kleineren Bruder mit 790GX-Chipsatz der Fall ist. Da hilft auch kein ACC beim GA-MA790GP-DS4H, denn trotz verschiedener Tests konnten wir keine signifikanten Taktsteigerungen bei Standardspannung erzielen.

    Auch das FOXCONN Destroyer, ebenfalls ohne SB750 unterwegs, überflügelt unser heute genutztes 790GX/SB750-Mainboard. Platz 2 geht zudem ebenfalls an ein Mainboard mit 790FX-Chipsatz, welches aber zusätzlich noch eine SB750 sein eigen nennt.

    Da insgesamt alle Hauptplatinen ihre Eigenheiten haben, haben wir alle 4 Boards miteinander in puncto Leistungsaufnahme und Betriebsspannung überprüft.

    VCore-Vergleich SB600 / SB750 / nForce 780a


    Wenn es um die minimale Betriebsspannung geht, zeigen beide 790FX-Platinen die besten Leistungen.

    Leistungsaufnahme SB600 / SB750 / nForce 780a - load mit Prime95 64 Bit


    Leistungsaufnahme ist hier aber ein anderes Thema. Durch die üppige Ausstattung der 790FX-Mainboards (schließlich ist dieser Chipsatz noch immer AMDs High-End-Chipsatz) können sowohl das Gigabyte GA-MA790FX-DQ6 als auch das FOXCONN A79A-S nicht sonderlich glänzen.

    Taktratenvergleich SB600 / SB750 / nForce 780a


    Gleiches Bild auch im Idle-Betrieb. Beide 790FX-Platinen können nicht mit der 790GX-Platine von Gigabyte mithalten. Nebenbei bemerkt tanzt das FOXCONN Destroyer hier völlig aus der Reihe, da man sich laut eigener Aussage auf andere Dinge konzentriert als die Idle-Leistungsaufnahme.

    Die vorangegangenen Diagramme zeigen uns eindrucksvoll, dass die Southbridge SB750 allein nicht ausschlaggebend für ein gutes oder schlechtes Übertaktungspotenzial ist. User von Mainboards mit älteren Chipsätzen (oder Chipsätzen von anderen Herstellern) brauchen nicht befürchten, allein aufgrund der Southbridge ein vermindertes OC-Potenzial zur Verfügung zu haben. Viel wichtiger ist es, dass sowohl Design als auch die BIOS-Programmierung zumindest zum Teil auf das Overclocking ausgerichtet ist.
    [break=Extrem-Overclocking]
    Von Extrem-Overclocking spricht man dann, wenn Kühlmethoden jenseits der Wasserkühlung verwendet werden. Kompressoren, Trockeneis oder gar flüssiger Stickstoff sind dann gefragt - allerdings haben alle diese Methoden eines gemeinsam: Nur die wenigsten Varianten sind für den Alltagsbetrieb brauchbar. Lediglich Kompressorkühlungen können theoretisch im Alltag verwendet werden.

    Trotz dieser nicht praxistauglichen Verwendung wird das Thema Extrem-Overclocking für viele Hersteller immer wichtiger. Der Grund hierfür ist das Prestige, was sich durch das Erzielen von Benchmark-Rekorden erzielen lässt - dabei sind diese Kühlungen nur Mittel zum Zweck. Und gerade auf dem Gebiet der extremen Kühlmethoden hat AMD seit einigen Jahren das Nachsehen, da die CPUs dieses Unternehmens sehr oft bei Verwendung von negativen Temperaturen den Dienst verweigerten (durch den sogenannten Coldbug).

    Mit AMDs Deneb gehört dieser Nachteil aber der Vergangenheit an. Tiefe Temperaturen sind nun kein Problem mehr, was in Verbindung mit hohen Prozessorspannungen zu sehr hohen Prozessortaktraten führen kann. Nicht umsonst hat uns AMD vor einigen Wochen nach Austin in Texas eingeladen, um dort erste Erfahrungen mit dem Phenom II sammeln zu können. Und live vor Ort zeigte man ein erstes System, welches mittels flüssigen Stickstoffs mehr als 6 GHz Prozessortakt erreichte. Zum Vergleich: Der bis dahin weltweit am höchsten getaktete AMD-Prozessor ist ein AMD Athlon 64 X2 5400+ BE, welcher mit 4.295 MHz lief.

    Zusammen mit den Kollegen von BenchBrothers sowie von der AwardFabrik haben wir am 20. Dezember 2008 erste eigene Übertaktungsversuche mittels extremer Kühlmethoden unternommen. Ein paar der dabei erzielten Ergebnisse wollen wir unseren Lesern nicht vorenthalten, wenngleich sie keinen Einfluss auf unsere "Wertung" des Phenom II haben.

    Hexus PiFast
    Ein Klick auf das Bild öffnet eine vergrößerte Version.


    Hexus PiFast lief noch bei 5.830 MHz durch.

    SuperPI 1M
    Ein Klick auf das Bild öffnet eine vergrößerte Version.


    SuperPI 1M ebenfalls. Die Zeit von 12,3 Sekunden wird vielen Core 2-Usern Tränen vor Lachen in die Augen treiben, da diese Zeit mit einem Core 2-Prozessor schon bei weniger als 4 GHz zu schaffen ist. Doch einmal mehr muss hier als Bezug der bisherige Rekord mit einem AMD-Prozessor als Vergleich herhalten - und dieser lag vor dem Deneb bei 19,9 Sekunden. Und gegenüber diesem wurde die Zeit bisher bereits um mehr als ein Drittel verbessert.

    3DMark06
    Ein Klick auf das Bild öffnet eine vergrößerte Version.


    Den 3DMark06 konnten wir auch noch über 5 GHz durchlaufen lassen. Das Ergebnis von fast 22.000 Punkten mit einer einzigen, nicht übertakteten GPU kann sich dabei ebenfalls sehen lassen.

    Insgesamt scheint der Deneb auch unter extremen Bedingungen (endlich) wieder Spaß zu bereiten, auch wenn er die Performance-Krone in verschiedenen Benchmarks noch immer verfehlt. Allerdings ist der Vorsprung von Intel je nach Benchmark deutlich geschrumpft oder sogar egalisiert. Für viele Enthusiasten wird das bedeuten, auch AMD wieder in die engere Wahl zu nehmen, wenn es ums Extrem-OC geht.
    [break=Fazit]
    AMD Phenom II Deneb - Titelbild


    44 Seiten rund um den Deneb liegen nun hinter uns. Über 100 Ergebnisdiagramme mit über 800 Einzelergebnissen machen die vergangenen Seiten zum wahrscheinlich umfangreichsten Artikel, den es in der Historie von Planet 3DNow! gibt. Und das alles für einen Prozessor!

    AMDs Phenom II X4 940, Codename Deneb, zeigt in allen Lebenslagen eine ansprechende Leistung. Überall mittendrin statt nur dabei, duelliert er sich teilweise mit Intels Q9650, teilweise mit dem i7 940 - beides die direkten Konkurrenten (aus technischer Sicht). Während der X4 940 überall gute Leistungen zeigt, sind i7 940 und Q9650 teilweise sehr gut, teilweise schwächeln sie aber auch. Dieser Tatsache verdankt der Phenom II den Umstand, dass er gemittelt über unseren Benchmark-Parcours weniger als 3 Prozent hinter dem Core 2 Quad Q9650 von Intel liegt. Der Rückstand des X4 940 gegenüber dem Core i7 940 fällt mit 25 Prozent schon deutlicher aus.

    Fakt ist, dass AMDs Deneb in jeder von uns genutzten Anwendung seinen Meister findet. In jedem Test (mit einer Ausnahme, dazu aber gleich mehr) gibt es einen Intel-Prozessor, der ein besseres Ergebnis abliefert. Je nach Anwendung ist es mal der Q9650, mal der i7 940. Da sowohl Q9650 als auch i7 940 nicht das jeweils schnellste Modell der Serie sind, muss man neidlos anerkennen, dass aus Performance-Sicht Intel noch immer die schnelleren CPUs herstellt. Wer Performance um jeden Preis will, der wird nach wie vor nur mit entsprechender Intel-Hardware zufriedengestellt - muss diese aber auch zum Teil teuer bezahlen.

    Betrachtet aus Preis-/Leistungssicht bedeutet das einen deutlichen Ausschlag des Pendels zugunsten AMD. Denn während Intels Prozessoren (derzeit) deutlich über 400 Euro kosten (Quelle: Geizhals.at/de), schlägt AMDs Topmodel offiziell mit 285 Euro zu Buche - erste Listungen deuten sogar auf niedrigere Preise hin. Schon allein die Preise der Prozessoren bedeuten ein besseres Preis-/Leistungsverhältnis auf Seiten von AMD. Wenn man die Mainboard-Preise für die jeweiligen Plattformen betrachtet, kann sich das Verhältnis je nach Wahl der Platine sogar noch weiter verbessern. Denn im Durchschnitt sind Mainboards für den Sockel AM2+ von AMD deutlich preiswerter als die Platinen für den Sockel LGA775 - und erst recht für den Sockel 1366.

    AMD hat mit dem Deneb also einen großen Schritt nach vorn getan. Die IPC wurde verbessert, die Übertaktbarkeit stimmt und auch die Leistungsaufnahme wurde gesenkt. Unsere Messungen des Stromverbrauchs haben gezeigt, dass ein auf 3,5 GHz übertakteter und mit 0,1 Volt über Default versorgter Deneb gleich viel verbraucht wie ein nicht übertakteter Phenom X4 9950 der 125 Watt-Klasse bei Standardtakt und Standardspannung (vom X4 9950 der 140 Watt-Klasse wollen wir erst garnicht sprechen). Die akzeptable Leistungsaufnahme (natürlich ist weniger immer wünschenswert) macht den X4 940 zum genügsamsten Quad-Core in unserem Teilnehmerfeld, was durchaus einen Achtungserfolg darstellt - wer hätte das nach dem Agena-Phenom schon erwartet. Zudem ist auch ordentlich Potenzial für Spannungsabsenkungen vorhanden, was die Leistungsaufnahme weiter verbessern kann und vor allem für Leistung-pro-Watt-Enthusiasten interessant sein sollte.

    Während unserer umfangreichen Tests ist uns kein Punkt aufgefallen, der einen echten Flaschenhals für die Entwicklung des Deneb darstellen könnte. Anders als beim Agena-Phenom bleibt die Leistungsaufnahme auch bei der Erhöhung der VCore auf einem akzeptablen Niveau, sodass die Hitzeentwicklung im Rahmen bleibt. Auch an anderen Stellen konnten wir keine Problem ausmachen, die zukünftige Modelle des Deneb in die eine oder andere Richtung limitieren.

    Lediglich der Northbridgetakt von 1,8 GHz ist ein Kritikpunkt, welchen wir äußern wollen. Zwar stellt dieser Takt kein Problem dar, teilweise (so hat unser Skalierungs-Vergleich gezeigt) profitiert der Deneb aber enorm von einem erhöhten Northbridgetakt. Da der integrierte Speichercontroller mit diesem Takt läuft, wird die Speicherbandbreite deutlich gesteigert, was sich in vielen Anwendungen im Ergebnis niederschlägt. Aus unserer Sicht sollte AMD hier nachlegen und Deneb-Varianten mit höherem Northbridgetakt einführen, um die Leistung pro MHz weiter zu steigern.

    Alles in allem ist AMDs Phenom II ein guter Allround-Prozessor mit einem gegenüber der Konkurrenz sehr guten Preis-/Leistungsverhältnis, weshalb er zum derzeitigen Kenntnisstand eine klare Kaufempfehlung erhält.

    Planet 3DNow! Award für den AMD Phenom II Deneb


    ...und AMD hat noch einen Pfeil im Köcher. Sowohl der Intel Core i7, als auch die Sockel LGA775 Quad-Core Systeme von Intel durften bereits auf DDR3-Speicher zurückgreifen, während der "Deneb" zum aktuellen Zeitpunkt noch mit dem Sockel AM2+ und DDR2-Speicher auskommen muss. Weitere Leistungssteigerungen verspricht AMD mit der Einführung des Sockel AM3 und DDR3-Speicher in einigen Wochen. Zudem sind mit DDR3-Speicher aufgrund der niedrigeren Betriebsspannung (noch) bessere Werte in Sachen Stromverbrauch zu erwarten - was wir auf Planet 3DNow! natürlich ausführlich hinterfragen und austesten werden wenn es soweit ist.

    The Good:
    Das hat uns gefallen
    • stark verbesserte Leistungsaufnahme
    • sehr gute Allround-Leistung
    • sehr gutes Preis-/Leistungsverhältnis
    The Bad:
    Das hat uns weniger gefallen
    • "nur" 1,8 GHz Northbridgetakt


    ...weitere Artikel
    ...diesen Artikel im Forum diskutieren

  2. Die folgenden 2 Benutzer sagen Danke zu MusicIsMyLife für diesen nützlichen Beitrag:

    heiko-soft (17.09.2011), Scour (14.03.2011)

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •  
Single Sign On provided by vBSSO