Diese Suchfunktion durchforstet alle Meldungen, die auf der Startseite zu lesen waren. Die Reviews, der FAQ-Bereich und das Forum werden nicht tangiert.
- Um das Forum zu durchsuchen, bitte hier klicken. - Um die Downloads zu durchsuchen, bitte hier klicken.
Bis die ersten "Bulldozer"-Prozessoren, wie von AMD während des 2010 Analyst Day angekündigt, im zweiten Quartal 2011 erscheinen werden, müssen die aktuellen K10.5 Prozessoren die Stellung halten. Um das Angebot an Phenom II und Athlon II Prozessoren auch weiterhin attraktiv zu halten, sind weitere neue Modelle mit höheren Taktraten und gesenkter TDP geplant. Die folgenden Roadmaps sind einer offenbar von AMD stammenden Präsentation entnommen wurden, die Planet 3DNow! vorliegt.
Im ersten Quartal 2011 soll demnach mit dem Phenom II X6 1100T ein neues Topmodel erscheinen. Bleibt AMD seiner aktuellen Nomenklatur treu, dann wird der neue Six-Core einen Standardtakt von 3,4 GHz besitzen. Bis zu drei Kerne können dank der AMD Turbo CORE Technologie auf 3,8 GHz automatisch übertaktet werden. Außerdem wird es nun endlich die schon länger erwartete Version des AMD Phenom II X6 1055T mit einer TDP von nur 95 Watt geben.
Das Quad-Core-Programm wird ebenfalls mit einem Takt-Update versorgt. Der neue AMD Phenom X4 975 mit einer Taktfrequenz von 3,6 GHz wird dann der am höchsten getaktete AMD Prozessor werden. Nach unten rundet der AMD Phenom II X2 565 mit 3,4 GHz das Phenom-Angebot ab.
Gegenüber unserem letzten Roadmap-Update hat sich auch einiges bei den Athlon II und Sempron Prozessoren getan. So werden der AMD Athlon II X2 265 (3,3 GHz) und der AMD Sempron 150 (2,9 GHz) doch erst im ersten Quartal 2011 verfügbar. Im neuen Jahr sollen zudem der AMD Athlon II X4 650 (3,2 GHz) und der AMD Athlon II X3 455 (3,3 GHz) das Athlon-Angebot verstärken. Im Laufe des nächsten Jahres plant AMD dann seine Athlon II Prozessoren durch die erste Generation APUs (Accelerated Processing Unit) abzulösen.
Im nächsten Jahr will AMD mit gleich 3 Plattformen angreifen. Die neue High-End-Plattform "Scorpius" für das Jahr 2011 wird natürlich auf der "Bulldozer"-CPU "Zambezi" basieren, die im 32nm-SOI-Prozess bei GlobalFoundries gefertigt wird. Für den "Zambezi" wird der neue Sockel AM3+ eingeführt, der abwärtskompatibel zu aktuellen AM3-CPUs ist. Dazu gesellt sich die neue Chipsatzserie AMD 9xx, die wohl nur ein kleineres Update der aktuellen ist, und eine diskrete Grafikkarte der AMD-Radeon-HD-6000-Serie ("Northern Islands"). "Zambezi" besitzt im Vollausbau 4 "Bulldozer"-Module mit insgesamt 8 MiB L2-Cache, einen 8 MiB L3-Cache und einen integrierten Speichercontroller, der DDR3-1866 DIMMs unterstützt. Jedes "Bulldozer"-Modul besteht aus zwei Integer-Kernen, einer 256-bit FPU und einem 2 MiB L2-Cache. Die FPU wird von beiden Kernen eines Moduls parallel genutzt. Jeder Kern kann nur einen Thread gleichzeitig bearbeiten, was für den ganzen Prozessor maximal 8 parallel laufende Threads bedeutet. Es ist nicht möglich den gleichen Thread auf beiden Kernen eines Moduls gleichzeitig laufen zu lassen. Dafür können aber durch die AMD Turbo CORE 2.0 Technologie einzelne Kerne übertaktet werden. Für die Server-Versionen hat AMD bereits angekündigt, dass es auch möglich sei, alle Kerne eines Prozessors gleichzeitig vollautomatisch um 500 MHz zu übertakten. Zu den Desktop-Versionen wollte man noch keine genaueren Angaben machen. Fest steht lediglich, dass AMD durch das "Digital APM Module" sehr genau messen will, wie hoch die aktuelle Leistungsaufnahme einzelner Einheiten ist, um so zu bestimmen, welche Reserven für den Turbo-Modus bestehen. Dabei soll jederzeit die Einhaltung der TDP gewährleistet sein.
In der zweiten Jahreshälfte wird sich dann die "Lynx"-Plattform dazu gesellen und den oberen Mainstream abdecken. Der wichtigste Bestandteil von "Lynx", die APU "Llano", hat sich auf Grund einer zu langsam ansteigenden Yield-Kurve um einige Monate verspätet. Ursprünglich wollte AMD bereits im vierten Quartal 2010 mit der Auslieferung beginnen. Auf dem Analyst Day gab sich das Management aber erneut zuversichtlich, den neuen Zeitplan einhalten zu können. Man habe die Probleme im Griff. Der neue Zeitplan sieht die Belieferung der Kunden im ersten Halbjahr 2011 vor, sodass im Sommer erste Systeme verfügbar werden sollen. Da der "Zambezi" als nagelneues Design den gleichen 32nm-SOI Prozess nutzt, aber bereits fast ein Quartal früher auf den Markt kommt, kann der eigentliche Prozess nicht der Schuldige sein. Hier liegt vielmehr die Vermutung nahe, die Probleme mit der Ausbeute könnten dem Umstand geschuldet sein, dass AMD erstmals GPU-Technologie in einem SOI-Prozess bei GlobalFoundries herstellen lässt.
Der "Llano"-Die besteht aus vier modifizierten K10.5 Kernen (Codename: "Husky") mit jeweils 1 MiB L2-Cache, einem GPU-Kern, UVD3-Einheit, PCI-Express-Ports sowie dem integrierten Speichercontroller, der DIMMs mit einer maximalen Geschwindigkeit von DDR3-1600 ansprechen kann. Wie viele Stream-Prozessoren AMD verbaut hat, ist nach wie vor unklar. Die Kombination aus CPU- und GPU-Kernen soll aber eine Leistung von 500 GFLOPs erreichen, was ungefähr einer ATI Radeon HD 5570 entspricht. Auch hier kommt für die CPU-Kerne die AMD Turbo CORE 2.0 Technologie in Verbindung mit der Digital APM Technologie zum Einsatz. Kombiniert wird der "Llano" mit dem "Hudson" D3 FCH (Fusion Controller Hub), was erstmals auch bis zu vier USB3-Ports anbietet. Obwohl AMD für den GPU-Teil der APU bereits die Performance einer heutigen diskreten Grafikkarte spricht, kann die APU auch mit einer solchen zusätzlich kombiniert werden.
Den unteren Mainstream will man mit der "Brazos"-Plattform bedienen. Auch hier kommen APUs zum Einsatz. "Zacate" (18 Watt TDP) wird mit dem "Hudson" D1 FCH zu seht kostengünstigen Systemen kombiniert. Über die weiteren Einzelheiten der Plattform hatten wir bereits berichtet. Außerdem sind bereits einige Preview-Artikel mit ersten Benchmark-Ergebnissen (User-News) erschienen.
Durch die Produktneuvorstellungen ändern sich die Mindestanforderungen für die einzelnen VISION-Klassen. Außerdem ist eine weitere Klasse – "HD Internet" - hinzugekommen. In der Aufstellung verbergen sich hinter den Bezeichnungen "AMD Dual-Core E-3xx" und "AMD Single-Core E-2xx" die "Zacate"-APUs. Im ersten Halbjahr 2011 sieht AMD folgende Mindestanforderungen für die fünf Aufkleber vor:
Im ATI-Forum sind auch schon konkretere Zeitpläne für die neuen Prozessoren im Jahr 2011 aufgetaucht, die angeblich aus einer "unternehmensnahe Quellen" stammen sollen. Auch wenn es sich nur um PowerPoint-Folien handelt, so lässt die Positionierung des Balkens für die Markteinführung der ersten "Zambezi"-Prozessoren erahnen, dass AMD hier den Geburtstag des K8 "Hammer" im Auge hat, der das Licht der Welt offiziell am 22. April 2003 erblickte. Laut der Folie sollen zunächst zwei Modelle mit acht Kernen und einer TDP von 125 bzw. 95 Watt angeboten werden. Später sollen dann Modelle folgen, bei denen ein oder zwei "Bulldozer"-Module deaktiviert sind.
Außerdem wird eine Roadmap für die APUs gezeigt. Wie von AMD bereits öffentlich kommuniziert, hat die Auslieferung der "Zacate" APUs (18 Watt TDP) bereits begonnen. Der Llano soll nach öffentlicher Darstellung von AMD im ersten Halbjahr folgen. Laut dieser Roadmap wird der "Llano" für den Desktop im dritten Quartal mit zwei bis vier CPU-Kernen im dritten Quartal 2011 mit TDP-Werten zwischen 65 und 100 Watt starten.
Auf der Folie wird noch eine Geschwindigkeit von DDR3-1333 für den Speichercontroller des "Zacate" angegeben. Dies war wohl auch ursprünglich so von AMD geplant. Laut den Preview-Artikeln haben die finalen Chips allerdings nicht die Qualifizierung dafür bei der angestrebten TDP von 18 Watt geschafft, sodass der "Zacate" mit DDR3-1066 auskommen muss.
Alljährlich findet bei AMD der Financial Analyst Day statt. Dort präsentiert man die laufenden Zahlen, und, was für die interessierte IT-Welt viel wichtiger ist, man stellt zukünftige Hoffnungsträger vor. Dieses Jahr steht zweifelsohne AMD Fusion im Vordergrund, doch dazu später mehr.
Für den Erfolg im Jahr 2010 gibt man verschiedene Faktoren an. So konnte man den Titel des Marktführers unter den diskreten Grafiklösungen verteidigen und seine Produktlinie mit der neuen AMD Radeon HD 6000er Serie erneut günstig platzieren. Vor allem im mobilen Bereich ist AMD unangefochten Marktführer bei DirectX 11-Lösungen. Ebenso konnte man mit Lenovo und Sony im Businessbereich seine Position weiter ausbauen.
Aber auch die Server-Sparte konnte sich erneut mit dem Launch der AMD Opteron 6000 & 4000 Serien nach einer kleinen Durststrecke wieder zeigen. Nach Innovationen wie der 64bit-Erweiterung und dem ersten nativen Multicore-Design möchte man mit „Bulldozer“ wieder einen Riesenschritt nach vorne machen. Die Eckdaten lesen sich jedenfalls vielversprechend. Bis 2012 sollen 20 Kerne in einer einzelnen CPU ermöglicht werden. Aber auch die Leistung pro Kern, vor allem die oftmals erwähnte IPC (instructions per clock), soll steigen. Die mit den AMD Phenom II X6-Prozessoren eingeführte Turbo-Funktion wird erweitert und soll nun folgend alle Kerne automatisch um 500 MHz übertakten können. Bis jetzt war dies nur auf 3 von 6 Kernen beschränkt. Im Desktop soll der Bulldozer schon im zweiten Quartal mit acht Integer-Kernen (vier Bulldozer-Module) erscheinen.
In der Zukunft wird noch viel mehr als bisher schon der Fokus auf AMDs Fusion-Strategie liegen, entsprechend sind auch die Roadmaps für kommende Innovation ausgelegt. Man integriert eine GPU in die CPU und deklariert es als neu entstandene APU (Accelerated processor units). So kann man von einem System-On-A-Chip sprechen (SOC). Alle wichtigen Bausteine der Systemarchitektur vereinen sich auf dem DIE – CPU, GPU, Northbridge, nur um die wichtigsten Bestandteile zu nennen. Weitere Chips sind nur im Falle einer weiteren Anschlussvielfalt nötig. So verfügen viele Mainboards beispielsweise über Extra-Lösungen für USB 3.0, die meist von NEC stammen. Die Bandbreite für die integrierte GPU steigt um den Faktor drei an, als es mit den heutigen IGP-Lösungen möglich ist. Plattformen wie OpenCL und DirectCompute ermöglichen die Nutzung der Rechenleistung integrierter GPU-Kerne für die Beschleunigung allgemeiner Rechenaufgaben. Laut AMD ein Schritt infolge der gestiegenen Anforderungen der Kunden. Folgend lassen sich auch weitere GPUs in den Arbeitsraum integrieren per PCIe, also wie gewohnt mit Hilfe einer Erweiterungskarte. So soll die Nutzung der GPU-Recheneinheiten zukünftig größtenteils nativ geschehen, um die höchste Leistung herauszuholen. Hierbei wird die GPU-Ansteuerung (Rechnen per GPU) fest in das System integriert. Vor allem Mitarbeiter der Softwareschmieden wie Corel und ArcSoft sprachen sich für die hohe Leistungsfähigkeit aus. Es seien Anwendungen möglich, an die man heute noch nicht denkt. Den Taktschlag der künftigen Innovationen gibt man auch gleich vor. So will der kleine x86-Riese jedes Jahr eine neue APU auf den Markt bringen.
Unspektakulär und ohne weitere Details zur Hardware zeigte man lauffähige Modelle der Notebook-Plattform „Brazos“, der Desktop-Plattform „Llano“ und aus dem Server-Bereich „Zambezi“. „Brazos“ wird voraussichtlich im Januar erscheinen und soll vor allem mit einer ordentlichen Leistung und langer Akkulaufzeit (bis zu 10.5 Stunden) bei 9 W („Ontario“ APU) bzw. 18 W („Zacate“ APU) punkten. Mit einer Ankündigung von bereits 100+ „Design Wins“ zeigt man, dass die Plattform bereits jetzt bei den OEMs Anklang findet. AMDs Sprecher ließen auch verlauten, dass ihre Chips noch nie zuvor in so vielen Produkten zum Einsatz kamen. Auf einer Folie der Partner konnte man auch Apple sehen und somit könnte es auch schon bald soweit sein, dass man hier mit einer Fusion-Lösung rechnen kann. In der „Llano“-Demo wurde die Wiedergabe eines HD-Films gezeigt während gleichzeitig das DirectX-11-Spiel "Herr der Ringe Online" lief. Die Probleme bei der Fertigungsausbeute will man mittlerweile im Griff haben. Am Marktstart im Sommer 2011 hat sich nichts geändert. Die groß angekündigte Vorführung von „Zambezi“ mit 8 Kernen lief auch ohne großes Spektakel ab, denn mehr als ein HD-Video und der Taskmanager war hier leider nicht zu sehen. Wieder einmal verlor man kein Wort über die Leistungsaufnahme der beiden letzten Plattformen. Es wurde jedoch immer wieder betont, dass man sehr viel Wert auf die Leistung pro Watt legt.
Demonstration der AMD Fusion Technologie
Sämtliche Folien vom AMD 2010 Financial Analyst Day gibt es hier:
Seit dem AMD zu den Geschäftszahlen für das zweite Quartal 2010 Schwierigkeiten beim Hochfahren des neuen 32nm HKMG Prozesses bei GlobalFoundries in Dresden bekanntgeben musste, ist es ruhig geworden um die "große" APU. Die Ausbeute (Yield) an funktionsfähigen "Llano"-Dies, die immerhin ca. eine Milliarde Transistoren umfassen, hat sich nicht wie ursprünglich erhofft entwickelt. Deswegen hat das Unternehmen nach Absprache mit seinen Kunden den "Ontario" - die zweite, kleinere APU - vorgezogen und die Massenfertigung des "Llano" um ein paar Monate nach hinten verschoben. Aktuell geht man von einem Start der Massenfertigung des "Llano" in der ersten Jahreshälfte 2011 aus, sodass erste Produkte im Sommer verfügbar werden könnten. In jedem Fall soll der "Llano" noch vor dem Desktop-"Bulldozer" - "Zambezi" - auf den Markt kommen.
Während der "Ontario" auf die Kombination aus zwei neu entwickelten x86-"Bobcat"-Kernen und einem DirectX 11 Grafikkern setzt, kommt im "Llano" die wohl letzte Ausbaustufe der aktuellen K10-Kernarchitektur zum Einsatz. Außerdem wird der große Fusion-Prozessor über den wesentlich potenteren DirectX 11 Grafikkern verfügen. Mit beiden APUs will AMD vor allem im Notebook- ("Llano") und Netbook-Markt ("Bobcat") punkten und die Akkulaufzeit auf bis zu 10 Stunden ("Ontario") verlängern.
Auf dem AMD Technical Forum and Exhibition 2010 hat der kleinere x86-Riese jetzt erstmals eine öffentliche Demo eines "Llano"-Systems gezeigt. Um die kombinierte CPU- und GPU-Rechenleistung des Fusion-Prozessors zu zeigen, liefen drei Workloads unter Windows 7 bei voller Auslastung der vier verfügbaren x86-CPU-Kerne. Parallel wurde die Zahl Pi auf 32 Millionen Stellen genau berechnet, ein HD Video von einer Blu-ray disc wiedergegeben und zusätzlich lief noch die nBody DirectCompute Anwendung von Microsoft, die eine Rechenleistung von 30 GFLOPs erreichte.
AMD hat auf der IFA 2010 die unter dem Codenamen „Ontario“ entwickelte APU (Accelerated Processing Unit) erstmals in einer Live-Demo der Fachpresse in Deutschland vorgeführt. Dabei kam das gleiche System zum Einsatz, was bereits bei der Präsentation auf der Coputex 2010 im Juni Verwendung fand. Im Einzelgespräch mit John Taylor, dem Produktmanager für die Fusion-Prozessoren, wurde uns nochmals bestätigt, dass die Auslieferung der ersten APU an die Kunden vorzeitig noch im vierten Quartal 2010 erfolgen wird und darauf basierende Produkte sehr früh im ersten Quartal 2011 erhältlich sein sollen. Auf die zweite wesentlich potentere APU „Llano“ werden interessierte Kunden allerdings noch wesentlich länger warten müssen, laut AMD soll der Launch erst spät im zweiten Quartal 2011 erfolgen. Damit ist wohl erst im zweiten Halbjahr mit einer breiten Verfügbarkeit entsprechender Produkte zu rechnen. Wie man uns nochmals bestätigte, wird die Leistungsfähigkeit der x86-Kerne des „Llano“ oberhalb der aktuellen AMD Phenom II liegen. Während der gezeigte „Llano“-Die nur begutachtet werden durfte, waren Fotos vom „Ontario“ erlaubt. In untenstehendem Bild hält John Taylor in seiner rechten Hand einen „Ontario“ und in der linken zum Vergleich einen aktuellen Quad-Core-Notebookprozessor „Champlain“.
Der „Ontario“-Die besteht aus zwei Out-of-Order x86 „Bobcat“-Kernen mit jeweils 512 KiB L2-Cache, einem DirectX 11 GPU-Kern, einer UVD3-Einheit, dem integrierte Memory-Controller sowie den „Platform Interfaces“, die über entsprechende Hochgeschwindigkeitsbusse miteinander verbunden sind. Zu den Fähigkeiten des Grafikteils und dessen Anbindung will man auch weiterhin keine genaueren Angaben machen, technologisch soll er aber auf der aktuellen Radeon HD 5000 Serie basieren. Die genaue Anzahl der Shader (VLIW-Einheiten) wollte John Taylor natürlich ebenfalls noch nicht preisgeben. Durch die direkte Anbindung an die x86-Kerne auf dem selben Die und dem daraus resultierenden Wegfall des PCIe-Bottlenecks soll die Energieeffizienz enorm gesteigert werden. John Taylor sprach mehrfach von Akkulaufzeiten oberhalb von zehn Stunden. Zu den Fähigkeiten der neuen UVD3-Einheit hielt man sich auch bedeckt, mit ihr soll aber die Beschleunigung weiterer Codecs unterstützt werden.
Ein neues Informationshäppchen gab es dann aber doch noch. Der bereits seit einer Weile umhergeisternde Codename „Zacate“ wurde bestätigt. Dabei handelt es sich um die 18 Watt TDP Version des „Ontario“ (9 Watt TDP), die dank höherer Taktfrequenzen eine höhere Performance bieten soll. Mit dem „Zacate“ zielt man auf den unteren Mainstream des Notebook- und Desktop-Marktes. Der „Ontario“ soll dagegen in Netbooks verbaut werden, dabei aber eine höhere Leistung als die aktuellen Atom-Prozessoren von Intel bieten. (Hans de Vries hat einen interessanten Vergleich der beiden Dies veröffentlicht) Zudem wird es den „Ontario“ als Embedded-Version geben. Alle Varianten werden im BGA-Package ausgeliefert und müssen daher fest auf der jeweiligen Platine verlötet werden, was eine besonders niedrige Bauhöhe ermöglicht. Da die Fusion-Prozessoren nicht unter einem eigenen Namen vermarktet werden sollen, bedeutet dies, dass auf dem „Zacate“ oder „Ontario“ basierende Produkte schlicht in die VISION-Klasse eingruppiert werden. In den höheren VISION-Klassen kommt dann die zweite APU „Llano“ zum Einsatz. Parallel zur Entwicklung der APUs will AMD mit wichtigen Partner-Firmen ein entsprechendes Software-Ökosystem erschaffen, damit Endkunden auch von den neuen Fähigkeiten der Fusion-Prozessoren profitieren können. Konkretere Details hierzu wurden aber nicht genannt.
Abschließend wurden uns dann noch ein paar Demos auf der „Zacate“-Entwicklungsplattform gezeigt. Leider durften von dem System keine Fotos gemacht werden. Zunächst zeigte man die bereits bekannten Performance Tests mit dem Internet Explorer 8 (IE8) und im Vergleich dazu mit dem Preview des kommenden IE9, der Direct2D zur Beschleunigung des Renderings nutzt. Der Test taugt aber nicht wirklich zur Demonstration der Leistungsfähigkeit einer APU, da die erzielten Ergebnisse (60 FPS im Flying Images Tests und Browser Flip Test) auch mit aktuellen Systemen der VISION-Klasse erzielbar sind. Eigentlich zeigt der Test nur die grottige Performance des IE8 (ca. 8 FPS) auf. Als zweite Demo wurde das Computerspiel „City of Heroes" gezeigt. Das Spiel lief subjektiv bei stark reduzierten Einstellungen flüssig. In der dritten Demo wurde die APU zur Wiedergabe eines 1080p HD-Videos genutzt, was die integrierte UVD3-Einheit problemlos meisterte. Abschließend durfte das „Ontario“-Testsystem noch ein paar flüssige Folienübergänge berechnen. Die wesentlich anspruchsvolleren Folienübergänge, für die Microsoft PowerPoint 2010 die GPU zur Berechnung nutzt, waren absolut flüssig. Alle Demos sollen in der nativen Auflösung des Displays von 1366 x 768 gelaufen sein. Der kleine Aluminiumkühler auf der APU wurde dabei unter Last gerade handwarm.
Nun hat AMD ja kürzlich die Katze aus dem Sack gelassen und einige wichtige und interessante Informationen zur kommenden Prozessor-Architektur "Bulldozer" veröffentlicht. Die erste neue Architektur seit dem K8 von 2003 und das erste wirklich neue Kern-Design seit dem K7 von 1999. Logisch, dass sich alle Augen darauf richten.
Es hätte auch so schön und einfach werden können. Gemäß älteren Folien sollte der Desktop-Bulldozer die gleiche Infrastruktur verwenden können, wie die aktuellen Sockel AM3 Phenoms. Das hätte für potenzielle Kunden heissen können: es ist egal, ob ich heute oder Ende 2011 einkaufe, ich bekomme eine zukunftsichere Plattform, die ich jetzt mit einem günstigen K10 betreiben kann (z.B. AMD Phenom II X4 945), und nächstes Jahr dann einen Bulldozer 1:1 nachrüsten kann, ohne dabei wieder die Plattform wechseln zu müssen.
Leider hat sich dieses Szenario zerschlagen, nachdem wie berichtet bekannt geworden ist, dass der Bulldozer einen aufgefrischten Sockel namens AM3+ benötigen wird. Zwar wird es möglich sein, aktuelle AM3-Prozessoren in AM3+ Mainboards zu betreiben, aber es wird nicht möglich sein, einen kommenden Bulldozer in einem aktuellen AM3-Mainboard einzusetzen.
Und das wirft natürlich Fragen auf. Soll ich jetzt noch - ein knappes Jahr vor einem radikalen Architektur-Wechsel - in eine AMD-Plattform investieren, die ich später nicht mit einem Bulldozer werde aufrüsten können? Oder überwiegt aktuell der Preisvorteil, schließlich ist ein Sechs-Kern AMD Phenom II X6 1055T ab 175 EUR zu bekommen und günstige AMD 870/SB850 Mainboards dazu ab 75 EUR. Das sind ja - für diese Leistung - keine Investionen im Sinne eines ehemaligen AMD Athlon 64 FX, der damals alleine schon 799 US-Dollar gekostet hat. Und sollte der Bulldozer in Sachen Leistung halten, was seine Eckdaten jetzt versprechen, wird er sicherlich auch kein 175 EUR Schnäppchen werden.
Daher interessiert uns angesichts der geänderten Rahmenbedingungen: was tun unsere Leser? Jetzt billig kaufen oder warten?
In den letzten Tagen gab es einige Unklarheiten bezüglich der Kompatibilität der kommenden "Bulldozer"-Prozessoren zu aktuellen Mainboards. Die Aussagen der AMD-Vertreter während der Vorab-Briefings zur Hot Chips zu diesem Thema waren teilweise widersprüchlich. Deswegen haben wir direkt bei AMD nachgefragt und um eine Erklärung des Sachverhaltes gebeten.
Wie Planet 3DNow! soeben offiziell von AMD bestätigt wurde, werden die kommenden Desktop-Prozessoren, die auf der neuen x86 "Bulldozer"-Architektur basieren, nicht zu aktuellen Sockel AM3 Mainboards kompatibel sein. Für den „Zambezi“ wird ein neuer Sockel mit der Bezeichnung AM3+ eingeführt, der aber abwärtskompatibel ist. Es können also AM3 Prozessoren auf dem neuen AM3+ Sockel verbaut werden.
Wie in der unten angefügten Begründung von AMD erklärt wird, sollte der Desktop-"Bulldozer" ursprünglich zum Sockel AM3 kompatibel sein. So war es auch auf diversen Roadmaps angegeben. Laut AMD hat sich während der Entwicklung allerdings abgezeichnet, dass nicht alle geplanten neuen Features auf diese Art umsetzbar sind. Deswegen hat man sich gegen die Kompatibilität zum aktuellen Sockel AM3 entschieden, um die maximale Performance aus den neuen Produkten herausholen zu können.
"The existing G34 and C32 server infrastructure will support the new Bulldozer-based server products. In order for AMD’s desktop offering to fully leverage the capabilities of Bulldozer, an enhanced AM3+ socket will be introduced that supports Bulldozer and is backward-compatible with our existing AM3 CPU offerings."
"When we initially set out on the path to Bulldozer we were hoping for AM3 compatibility, but further along the process we realized that we had a choice to make based on some of the features that we wanted to bring with Bulldozer. We could either provide AM3 support and lose some of the capabilities of the new Bulldozer architecture or, we could choose the AM3+ socket which would allow the Bulldozer-base Zambezi to have greater performance and capability.
The majority of the computer buying public will not upgrade their processors, but enthusiasts do. When we did the analysis it was clear that the customers who were most likely to upgrade an AM3 motherboard to a Bulldozer would want the features and capability that would only be delivered in the new AM3+ sockets. A classic Catch-22.
Why not do both you ask? Just make a second model that only works in AM3? First, because that would greatly increase the cost and infrastructure of bringing the product to market, which would drive up the cost of the product (for both AMD and its partners). Secondly, adding an additional product would double the time involved in many of the development steps.
So in the end, delivering an AM3 capability would bring you a less featured product that was more expensive and later to market. Instead we chose the path of the AM3+ socket, which is a path that we hope will bring you a better priced product, with greater performance and more features - on time.
When we looked at the market for AM3 upgrades, it was clear that the folks most interested in an AM3-based product were the enthusiasts. This is one set of customers that we know are not willing to settle for second best when it comes to performance, so we definitely needed to ensure that our new architecture would meet their demanding needs, for both high performance and overclockability. We believe they will see that in AM3+."
AMD hat in Form von John Fruehe (JF) mit zwei Einträgen den neuen „Bulldozer Blog“ gestartet. Über den neuen Block will das Unternehmen bis zum Launch der neuen „Bulldozer-Architektur“ Stück für Stück weitere Informationen und Details preisgeben. Dabei soll es von Zeit zu Zeit auch Blogeinträge geben, die den Nachfolger der aktuelle AMD Phenom II mit dem Codenamen „Zambezi“ thematisieren. Unter anderem will man nach der Hot Chips Konferenz, auf der AMD seine beiden neuen x86-Architekturen „Bulldozer“ (High-End) und „Bobcat“ (Low-End) vorstellen wird, die dort präsentierten Details auch im Block für die breite Öffentlichkeit aufbereiten. Zudem wird es erneut einen „20 Questions Blog“ geben, in dem JF Fragen(*) beantworten will, die zuvor per E-Mail an AMD eingesendet werden können. Aber nicht nur die Marketingabteilung soll in dem neuen Blog zu Wort kommen, sondern auch die Entwickler, die hinter dem „Bulldozer“ stehen. Abgerundet werden soll das Ganze kurz vor dem Launch durch Produktdemonstrationen per Video.
Für die Leser der Spekulationsthreads hier auf Planet 3DNow! enthalten die beiden ersten Einträge nicht viel Neues. Wirklich neu ist nur die Information, dass der Bulldozer neben den normalen DDR3 DIMMs (1,5 V) und den DDR3L DIMMs (1,35 V), mit denen bereits die aktuellen Plattformen AMD Opteron 6100 (Sockel G34) und AMD Opteron 4100 (Sockel C32) umgehen können, auch künftige „Load Reduced DIMMs“ und solche mit einer auf nur noch 1.25 V gesenkten Betriebsspannung unterstützen wird.
(*) Nicht beantwortet werden Fragen zu bestimmten Benchmarks, Preisen, genauem Datum der Markteinführung oder den Plattformen der Geschäftspartner.
Für alle Anderen hier eine kleine Zusammenfassung der bisher bekannten offiziellen Informationen zu AMDs „Bulldozer“:
AMD will im nächsten Jahr drei Prozessoren auf Basis der neuen „Bulldozer-Architektur auf den Markt bringen. „Orochi“ ist der Codename, unter dem die neuen Kerne (eigentlich Module) der ersten „Bulldozer-Generation“ entwickelt werden. Jedes Modul wird aus zwei Integer-Kernen mit jeweils 4 Pipelines, einer 256-bit FMAC FPU und einem L2-Cache (2 MiB ?) bestehen. Die von beiden Kernen zusammen genutzte FPU kann sowohl mit voller Breite von einem der beiden Kerne als auch von beiden gleichzeitig mit jeweils halber Breite genutzt werden. Angeblich soll der Wechsel zwischen den beiden Modi pro Takt möglich sein. FMAC steht dabei für Fused Multiply-Accumulate. Die FPU kann also mit einem Befehl eine Multiplikation und eine Addition ausführen. Das erhöht nicht nur den Durchsatz, sondern auch die Genauigkeit, da das Runden zwischen den beiden Operationen entfällt. Zudem werden sämtliche SIMD-Befehlssätze bis einschließlich AVX unterstützt. Mehr dazu gibt’s in Opterons Artikel „AMDs SSE5 ist tot - lang lebe AVX“.
Mehrere dieser „Bulldozer-Module“ werden mit einer Northbridge bestehend aus L3-Cache (> 8 MiB), Memory-Controller (unterstützt größeren Speicherausbau) und HyperTransport-Links auf einem Die kombiniert. Zu einem späteren Zeitpunkt wird sich noch ein Grafikkern dazugesellen. Damit die hohe Leistungsfähigkeit bei wenig parallelisierten Code nicht völlig verpufft, verknüpft AMD bei allen „Bulldozer-Prozessoren“ ein stark verbessertes Powermanagement mit einem gegenüber dem „Thuban“ aufgebohrten Turbo-Modus. Die Fertigung der Chips im 32nm SOI HKMG Prozess übernimmt GlobalFoundries. Angeblich wird die Verschiebung der APU Llano - die den gleichen Prozess nutzt - wegen Problemen mit der Ausbeute keinen Einfluss auf die Markteinführung des ersten „Bulldozers“ haben. Während des Webcasts zu den Geschäftszahlen des zweiten Quartals hat der CEO von AMD Derrick R. Meyer verkündet, der Tape-Out des ersten „Bulldozer-Dies“ sei im abgelaufenen Quartal erfolgt.
Auf diesen Funktionseinheiten aufbauend wird es drei verschiedene Prozessoren geben, die allesamt für einen Marktstart im Jahr 2011 geplant sind - genauer lässt sich AMD derzeit nicht festnageln. Dazu gehören der „Interlagos“ mit 12 und 16 Integer-Kernen (2 „Valencia-Dies“ als MCM) und der „Valencia“ mit 6 und 8 Integer-Kernen (3 oder 4 „Bulldozer-Module“) für den Server-Markt sowie „Zambezi“ mit 4 bis 8 Integer-Kernen (2 bis 4 „Bulldozer-Module“) für den Desktop-Markt. Ob sich das „Valencia-Die“ vom „Zambezi-Die“ unterscheidet, oder ob ähnlich wie bei „Shanghai“ und „Deneb“ das gleiche verwendet wird, ist unklar. JF jedenfalls besteht darauf, dass sich zukünftige Server-Dies stärker von ihren Desktopgegenstücken unterscheiden werden.
Für die Server-Prozessoren garantiert AMD schon heute, dass sie zu den aktuellen 6000er und 4000er Plattformen nach einem BIOS-Update kompatibel sind. Ob das auch für die AM3-Plattform im Desktop-Markt gilt, ist noch nicht 100%ig gesichert, aber wahrscheinlich. Die Angabe Sockel AM3r2 bzw. AM3 in den bisherigen Roadmaps darf jedenfalls als Indiz für eine Abwärtskompatibilität gewertet werden. AM3r2 dürfte eine neue Revision des Sockel AM3 sein, sodass ein Package AM3r2 Prozessor genauso zum Sockel AM3 kompatibel ist, wie es bei Package AM2+ Prozessoren und dem Sockel AM2 bereits der Fall ist. Natürlich besteht die Möglichkeit, dass dann nicht alle neuen Funktionen des „Zambezi“ auch auf der älteren Plattform genutzt werden können.
Performanceabschätzung von AMD
Kommen wir zu den von JF im Blog veröffentlichten Performanceabschätzungen. Er prognostiziert in einzelnen Anwendungen für den Vergleich zwischen „Interlagos“ mit 16 Kernen und dem „Magny-Cours“ (AMD Opteron 6100) mit derer 12 eine maximale Leistungssteigerung von 50% bei gleichbleibender Leistungsaufnahme. Zieht man jedoch 33% für die erhöhte Kernzahl ab, bleiben nur noch 17 Prozentpunkte übrig. Diese können aus der von Grund auf neuentwickelten Architektur (+12,5% IPC ?) resultieren, wären aber genauso gut durch Taktsteigerungen erreichbar, die der neue 32nm SOI HKMG Prozess durchaus erlauben könnte. Die Welt ist aber nicht so einfach gestrickt, denn sogar hochoptimierte Anwendungen skalieren nicht linear mit der Kernzahl. Selbst bei theoretisch optimal mit der Threadanzahl skalierender Software müsste die Northbridge erstmal die 16 Kerne mit ausreichend Daten füttern können, wozu die der aktuellen K10 Prozessoren sicher nicht in der Lage wäre. Außerdem steigt der prozessorinterne Verwaltungsaufwand (Overhead) um beispielsweise die Cachekohärenz zu gewährleisten. Aus dieser Angabe von JF lässt sich demnach nicht wirklich auf die maximale Leistungsfähigkeit eines einzelnen „Interlagos-Kernes“ schließen, zumal AMD die neue Architektur auf einen möglichst hohen Durchsatz bei hoher Threadanzahl optimiert haben will.
Wirklich neu sind die Angaben nicht. Bereits am 25. November 2009 hatte der gleiche Produkt-Manager eine Performancesteigerung von 60 bis 80% für den „Interlagos“ gegenüber dem „Magny-Cours“ prognostiziert. Allerdings basierte diese Schätzung auf der Leistungsfähigkeit des „Istanbuls“. Da die Performance der AMD Opteron 6100 allerdings letztlich höher ist als damals vorhergesagt, hat man die Prognose jetzt angepasst. Damit ergibt sich aktuell folgendes Bild:
Was hat das aber für eine Bedeutung für den „Zambezi“?
Die Frage lässt sich auf Grund dieser Daten nicht beantworten. Da sich der „Zambezi“ in einem völlig anderen Software-Umfeld beweisen muss und zudem weder ein MCM-Design ist noch in Mehrsockelsystemen eingesetzt wird. Der höchst wahrscheinlich wesentlich aggressiver arbeitende Turbo wird für einen zusätzlichen Schub sorgen, wenn nicht alle Kerne ausgelastet sind. Gerade Games und andere typische Software im Desktop-Umfeld kann auch heute meist wenig mit mehr als 2 oder 4 Kernen anfangen, sodass der Turbo hier einen wesentlich größeren Effekt haben kann als bei typischen Server-Anwendungen. Zu allen über die rohe Performance herausgehenden Fakten, die bei einer Kaufentscheidung normalerweise ebenfalls zu berücksichtigen sind (z.B. Preis, Verfügbarkeit, TDP, Leistungsaufnahme im Idle usw.), ist bisher überhaupt nichts bekannt.
Nach den Präsentationen auf der Hot Chips Konferenz am 24. August und zum diesjährigen AMD Financial Analyst Day am 9. November wissen wir hoffentlich mehr Details über die neue Architektur, was dann eine erste seriöse Abschätzung für die Leistungsfähigkeit der Desktopprodukte ermöglichen könnte.
2009 sollte sie eigentlich vorgestellt werden, 2011 wird es nun werden, bis AMD die erste komplett neue Kern-Architektur seit dem AMD K7 im Jahr 1999 vorstellen wird. Dabei hielt sich AMD bisher bedeckt, was Details zum neuen Design betraf. Dies ließ natürlich allerhand Spielraum für Spekulationen.
Nun jedoch hat AMD erste Details zum Bulldozer veröffentlicht und Kenner der Architektur sehen sofort: da bleibt kein Stein auf dem anderen verglichen mit der Evolutionsreihe K7/K8/K9/K10.
Noch ist das Diagramm recht grob, will heißen man erkennt keine Details zu Busbreiten, Cacheanbindungen, etc. Aber bereits dieses Schema lässt erkennen, dass AMD hier ein paar völlig neue Ansätze realisiert.
Je zwei Kerne treten stets als Duett auf. Das heißt innerhalb dieses Verbundes gibt es lediglich eine Fetch-Einheit, einen Decoder und einen L2-Cache, allerdings zwei voneinander unabhängige Rechenwerke mit ihren jeweiligen Schedulern. Wie bisher gibt es einen für ALU und einen für FP.
Wie dieses detailliertere Schaubild zeigt, werden L3-Cache und integrierte Northbridge allerdings weiterhin - wie beim K10 - shared für alle Kerne sein. Die Anzahl der ALU-Pipelines wurde offenbar von 3 auf 4 erweitert. Zudem kommt anscheinend eine neue FPU zum Einsatz. Wie breit wohl der Decoder sein muss, um zwei Kerne je 4 ALU-Pipelines und zwei FPUs mit nicht genannter Breite füttern zu können?
Gefertigt wird der Bulldozer in 32 nm SOI Strukturen in Kombination mit high-k Metal Gates, eine Technologie, die Intel bereits seit geraumer Zeit einsetzt und die AMD nach ursprünglicher Sprachregelung bereits bei einer 45 nm Evolutionsstufe einsetzen wollte.
Der Codename des ersten Prozessors nach Bulldozer-Architektur wird Zambezi heißen, die zugehörige Plattform Scorpius. Überraschend werden die nagelneuen High-End Prozessoren offenbar in den Sockel AM3 passen, was Upgrader vom Phenom II freuen wird, sofern der Mainboard-Hersteller entsprechende BIOS-Updates zur Verfügung stellt. Der Mainstream-Ableger der Plattform, eine APU nach Fusion-Konzept, hört auf den Codenamen Llano, die Plattform Lynx. Hier allerdings kommen noch K10-Kerne zum Einsatz, allerdings ebenfalls in 32 nm Strukturen.
Sowohl Zambezi, als auch LIano sollen im Jahr 2011 erscheinen, ebenso wie die Server-Variante des Bulldozer.
In Japan hat AMD während der DIY PC Expo 2009 (31.10 bis 1.11. in Tokyo) bereits einen Ausblick auf seine Plattform Roadmaps gegeben, deren Details wohl auch bei dem in der kommenden Woche stattfindenden Financial Analyst Day 2009 besprochen werden (wir berichteten). Bei den geplanten Desktop-Plattformen bis 2011 werden neben den Codenamen auch Details zum ersten Fusion-Prozessor von AMD genannt.
Nachdem man mit der Einführung des Phenom I begonnen hatte, die Desktop-Plattformen mit Tiernamen (Spinne) zu bezeichnen, werden nun fast ausschließlich Tiernamen benutzt, die auch ein Sternbild darstellen. Was einen gewissen Einklang mit der Tatsache schafft, dass man bei den Codenamen von Prozessor-Kernen zumindest bis in Jahr 2010 noch Sternnamen nutzen wird.
AMD unterscheidet im Desktopbereich zwischen Performance (Prozessoren mit 95 Watt TPD oder mehr) und Mainstream (Prozessoren von 45 bis 95 Watt).
Der Mainstream wird aktuell von den Plattformen "Pisces" und "Kodiak" besetzt, die beide im September vorgestellt wurden. "Kodiak" ist dabei die Variante für den Business-Bereich.
Beide Plattformen sollen 2010 von "Dorado" (Schwertfisch) abgelöst werden, die dann bei den diskreten Grafikkarten auf die neuen "Evergreen"-Grafikchips der AMD ATI Radeon 5000er Serie setzen wird. Zusätzlich wird die neue Plattform auf eine Southbridge der 800er-Generation setzen. Dadurch wird SATA 6Gb/s (SATA III) unterstützt.
Spannender wird es dann 2011, wenn die Plattform "Lynx" (Luchs) erscheinen soll. Diese wird dann auf die "Llano"-APU (Accelerated Processing Unit) setzen. Dabei handelt es sich um den ersten Fusion-Prozessor von AMD, bei dem eine Grafikeinheit in den Prozessor aufgenommen wird. In der APU werden dann bis zu vier CPU-Kerne, eine Grafikeinheit mit DirectX 11 und UVD 3.0 Unterstützung, sowie ein PCI-Express Controller gebündelt. Die Fertigung soll in 32nm erfolgen.
Als weitere Bestandteile der Plattform sind die "Hudson D-Series" Southbridge, sowie diskrete Grafikkarten auf Basis der 32nm "Northern Islands" Grafikchips geplant.
Der Performance-Bereich soll 2010 mit der Plattform "Leo" (Löwe) aufwarten. Hier werden neben dem Sechskern-Prozessor "Thuban" (wir berichteten) die neuen Chipsätze und Southbridges der 800er-Serie als Features benannt. Bei den diskreten Grafikkarten wird auf die neuen "Evergreen"-Grafikchips der AMD ATI Radeon 5000er Serie gesetzt.
2011 folgt dann die "Scorpius"-Plattform (Skorpion), in der eine 32nm CPU auf Basis von mindestens vier "Zambezi"-Kernen zum Einsatz kommt. Wie schon beim "Llano" wechselt man hier bei den Codenamen ebenfalls auf die Bezeichnung eines Flusses. Während für den Unterbau keine neuen Chipsätze genannt werden, sind auch hier diskrete Grafikkarten auf Basis der 32nm "Northern Islands" Grafikchips vorgesehen.
Diesen Artikel bookmarken oder senden an ...