Kaveri - der Trinity Nachfolger

FredD

Gesperrt
Mitglied seit
25.01.2011
Beiträge
2.472
Renomée
43
Trinity steht vor der Türe. Damit hat der Nachfolger "Kaveri" einen eigenen Thread verdient.


Cauvery, Kaveri
n
(Placename) a river in S India, rising in the Western Ghats and flowing southeast to the Bay of Bengal. Length: 765 km (475 miles)

thefreedictionary.com



Anhänge:

Whitepaper zur heterogenen Systemarchitektur (HSA)
Get ready for next Generation APU (Zusammenfassung zu HSA, Dispatch, OpenCL, hUMA, GCN)
BIOS and Kernel Developer’s Guide (BKDG) for AMD Family 15h Models 30h-3Fh Processors
 
Zuletzt bearbeitet:
Kann das Kindergartengezänk jetzt bitte mal aufhören? 8-(
 
file.php

e5dca2a620.jpg


Plattform: "Indus" (Mobile)

Features:

CPU: Steamroller (BDver3?)
GPU: NG Fusion Graphics (GCN?)
 
Die neuen Roadmaps (1) und (2) sind im Zuge des Analysten-Tags herausgekommen, gemeinsam mit etlichen netten Präsentationen zu HSA. Ach ja, Raider heißt jetzt Twix und Fusion HSA. Ein paar Folien aus dem Präsentations-Feuerwerk sind zumindest erwähnenswert, so (3) und (4). Das in einer etwas älteren Folie (5) erwähnte "bi-directional Power Mgmt" müsste dann das große Fusion-Feature von Trinity sein; mit GCN wird dann das große Feature von Kaveri vermutlich die C++ Unterstützung durch die GPU und die weitere Zusammenführung des CPU/GPU- Adressraums. Auf einer angestaubten Folie von Phil Rodgers, Juni 2011 (6), die Charlie aufgegabelt hat, wird die Idee der GPU als Co-Prozessor nochmal recht nett veranschaulicht. Kaveri dürfte aus der Fusion-Perspektive m.M. ein größerer Schritt nach vorne werden.

1)
file.php


2)
file.php


3)
attachment.php


4)
amd_evolution_heterogzoqza.jpg


5)
600x385px-LL-04c21593_hsa.png


6)
afds_rogers_commandssvkb5.jpg
 
Zuletzt bearbeitet:
Als grünes Gegenstück zu den Ambitionen Intels Transactional Synchronization in Haswell wird man relativ schnell über das AMD Forschungsprojekt "Velox" fündig. Transactional Memory dürfte so etwas wie eine Schlüsseltechnologie für den Fusion/HSA Ansatz sein.

AMD - ASF:
http://developer.amd.com/tools/ASF/Pages/default.aspx

Diese Entwicklung seitens Intel und auch die deutliche Zunahme der Shaderzahl kann durchaus mit AMD's Aktivitäten (ASF, Fusion) zusammenhängen.
 
Hier habe ich noch ein nettes paper dazu gefunden:
eurosys 2010
Wenn ich mir die Tech-Roadmaps so ansehe, obwohl in dieser Hinsicht sehr wage, schätze ich einen Produkteinsatz dieser Technologie für bestenfalls den Kaveri-Nachfolger ab 2014 ein.

EDIT: Sollte durch Transactional Memory nicht auch Spekulatives Multithreading "vereinfacht" werden?
 
Zuletzt bearbeitet:
Hier habe ich noch ein nettes paper dazu gefunden:
eurosys 2010
Wenn ich mir die Tech-Roadmaps so ansehe, obwohl in dieser Hinsicht sehr wage, schätze ich einen Produkteinsatz dieser Technologie für bestenfalls den Kaveri-Nachfolger ab 2014 ein.

EDIT: Sollte durch Transactional Memory nicht auch Spekulatives Multithreading "vereinfacht" werden?
Das ist eine interessante Präsentation!

Aber spMT hat damit bedingt zu tun. Erst einmal geht es um typische parallel ablaufende Zugriffe in Mehrprozessorsystemen.
 
Ich muss meine Frage selbst beantworten, wenn auch die Quellen nur teilweise frei zugänglich sind:

U.a.
Exploiting Speculative Thread-Level Parallelism Based on Transactional Memory

(Im Ausblick)
Employing Transactional Memory and Helper Threads to Speedup Dijkstra’s Algorithm

L. Porter, B. Choi, and D. Tullsen, “Mapping out a path from hardware transactional memory to speculative multithreading,” in Proc. 18th Int’l Conf. on Parallel Architectures and Compilation Techniques (PACT’09), 2009

Aber das geht schon etwas zu weit vom Thema "Kaveri" weg.
 
Zur GPU von Kaveri auf nordichardware:

"..Documents from AMD have revealed specifications for Kaveri [...] it will get 8 GCN units, which is the exact same as Radeon HD 7750 [...] Kaveri has performance over 1 TFLOPS, or more precise 1050 GFLOPS [...] which means the GPU will contribute the most. Radeon HD 7750 with its 512 Radeon cores is currently at 819 GFLOPS with a clock frequency at 800 MHz. Kaveri would need a graphics circuit at 900 MHz and 921.6 GFLOPS to reach 1049.6 GFLOPS..."
 
Aus dem GF-Thread:

Interessant auch diese Aussagen von Thomas Seifert:

"We will have 28-nanometer APU products at both foundries. So we will have 28-nanometer APU products at GLOBALFOUNDRIES"

und

"If you look at the roadmaps that we have presented at Financial Analyst Day, there is a 28-nanometer successor product to Trinity on the roadmap that we will ramp next year, and that is also manufactured at GLOBALFOUNDRIES."

Damit dürften die Steamroller-based Produkte gemeint sein, die offenbar weiterhin bei GF produziert werden sollen. Aber erst in 2013. Ob ich daraus schließen soll, dass auch GFs 28nm-Prozess erst in 2013 "mature" ist?

Laut einer Pressemitteilung von September 2009 wären sie damit 3 stolze Jahre behind. Erst Müller-Brot, nu Dresden, keiner kriegts gebacken :]
Zumindest sollte damit geklärt sein, wo die Kaveris vom Band rollern, wenngleich ich selbst bei offiziellen Mitteilungen von AMD und GF äußerst vorsichtig wäre.
 
Nicht zwangsläufig. Da Trinity jetzt gerade erst kommt, braucht Kaveri auch erst 2013 zu kommen. Und was erst nächstes Jahr kommt, muß auch nicht jetzt schon mit super Ausbeute in Masse produzierbar sein. Das paßt schon alles gut zusammen, ohne Verzögerungen.

Wenn Kaveris Marktstart Mitte 2013 noch nicht absehbar ist, dann können wir über Verzögerungen oder Probleme reden.
 
Das glaube ich nicht. Trinity wird nur ein sehr kurzes Leben haben und als bald eingestellt werden. Und Kaveri vorgezogen, da die Leistung von Trinity wohl jetzt schon zu schwach sein soll.
 
Das glaube ich nicht. Trinity wird nur ein sehr kurzes Leben haben und als bald eingestellt werden. Und Kaveri vorgezogen, da die Leistung von Trinity wohl jetzt schon zu schwach sein soll.

Das klingt nicht gut. Gleich nochmal so eine Pleite? Kaveri ist auf AMDs Roadmaps erst für 2013 eingezeichnet und ebenso wurde es doch auf der Konferenz kommuniziert, oder?

Wenn aber Kaveri wirklich schon dieses Jahr kommen sollte, umso besser.
 
Das mit dem kurzen Leben sieht mir eher wie ein Grundsatz der neuen Produktstrategie für Fusion aus.
Die Entwicklung in "kleinen Schritten" lässt sich gut kombinieren mit dem modularen Design der Bulldozer Architektur einerseits und den im Vergleich zu früheren CPUs deutlich rascheren Produktzyklen der GPU-Entwicklung andererseits. Letztlich sind Produktzyklen im Bereich von gut 1 Jahr auch der Takt, den Branchenriese Intel vorgibt. Einzig die Foundries lassen sich da nicht so leicht synchronisieren.
Aber bei dem Thema gibt es für Kaveri ohnehin noch zu viele Unbekannte.
28nm steht fest, aber welches und mit welchen "Schmankerln"? bulk, HPP, gate first, und wieder ohne ULK?
 
Das glaube ich nicht. Trinity wird nur ein sehr kurzes Leben haben und als bald eingestellt werden. Und Kaveri vorgezogen, da die Leistung von Trinity wohl jetzt schon zu schwach sein soll.
Echt?
Die Prototypen gehen doch bis 4,2Ghz. Da dann noch die (kleinen) IPC Verbesserungen oben drauf und es sollte doch was Gutes dabei rauskommen. Grafik ist auch besser und Stromverbrauch auch, erstmal gibts ja ein 17W-Teil für subnotbooks.

Bisher war ich Trinity gegenüber eigentlich recht positiv eingestellt. Klar, Kaveri setz noch eins nach, erstens Steamroller (mit wahrscheinlich größerem IPC-Sprung) zweitens die gute GNC-Grafik und dann noch den 28nm Vorteil. Aber das ist bei Nachfolgeprodukten doch immer so ;-)
 
Vor allen Dingen bringt dekaisi keine Beweise für seine Behauptungen, die er auch in einem anderen thread wiederkaut. Nichts gegen gesunde Skepsis, aber wenn diese nur auf persönlicher Entäuschung (schamlose Unterstellung von mir) basiert, dann sollte man doch etwas vorsichtiger mit den ultimativen Wörtern und Wortgruppen "wird" und "werden", bzw. "jetzt schon ... sein soll".

Das möchte ich dann erst einmal mit Quellen (oder zumindest nachvollziehbaren Indizien) unterfüttert haben.
 
Unsinn, was sollen wir uns mit Konjunktiv rumschlagen. Das ist das Spekulationsforum, über ungelegte Eier weiß sowieso niemand was, also gibt es auch keine Quellen, die den Namen verdienen.


Kurzes Leben oder weniger biologisch bezogen kurze Produktzyklen sind sicher beabsichtigt, aber ein Jahr ist schon relativ kurz. Früher wurde ein Die unverändert über mehrere Jahre durchgezogen und mit ein paar Taktupgrades versehen, erhielt bestenfalls Revisionen, die aber nur die Produktion vereinfacht haben, aber am Produkt an sich nichts geändert haben.

Trinity ist auch nicht schwach. Sicher ist es nichts für Spitzenleistung, aber das ist ja auch nicht das Ziel. Llano ist schon ziemlich attraktiv, aber mit halbierter TDP bei gleicher Leistungsfähigkeit wird Trinity fast ein Selbstläufer. Immerhin sind das dann gamingfähige Ultrabooks, Intel kriegt das auch mit noch so aufgebohrter Grafik nicht hin, nur mit extra Chip, Geforce oder Radeon, jedenfalls teurer und höhere TDP. Ich will nicht behaupten, daß Intel gar nichts mehr verkaufen kann, aber AMD dürfte mit Trinity wohl ein paar Marktanteile dazugewinnen.
 
Kurzes Leben oder weniger biologisch bezogen kurze Produktzyklen sind sicher beabsichtigt, aber ein Jahr ist schon relativ kurz. Früher wurde ein Die unverändert über mehrere Jahre durchgezogen und mit ein paar Taktupgrades versehen, erhielt bestenfalls Revisionen, die aber nur die Produktion vereinfacht haben, aber am Produkt an sich nichts geändert haben.

Schon richtig. Andererseits war das dem Aufwand für ein neues Produkt geschuldet. Wenn sich dieser Aufwand zum Beispiel indem man halbautomatisiert Cores tauscht oder wechselnde Module zur APU zusammenstellt reduziert dann kriegt man - nach einer Berechnung der bayrischen Akademie für Milchwirtschaft - bei gleicher Mannstärke häufigere Produktwechsel hin.
 
@OBrian

Gut dann kommunizieren wir hier ab heute nur noch im Indikativ.:]


1 Jahr Produktzyklus gibt es schon seit Jahren. Das hat Intel eingeführt und ist damit (nach außen hin) gut gefahren. Das setzte in der Vergangenheit, und für Intel weiterhin, natürlich hohe finanzielle Mittel voraus, seit AMD ihre Designs teilweise synthetisiert (wie zum Beispiel Brazos) ist das Ganze erheblich leichter geworden (eigentlich eine Spekulation, aber das brauche ich ja so nicht mehr kennzeichnen) und AMD kann (eigentlich könnte) Kabini (Brazos-Nachfolger) nun entweder bei TSMC oder GF fertigen lassen. Man hat sich für TSMC entschieden, und bei GF gecancelt, weil GF Probleme mit dem 28nm Node hat/haben wird (eigentlich könnte).
Das ist(/wäre) normalerweise ein großes Problem, da es den Unterschied gate last/gate first bei TSMC bzw. GF gibt, aber man kann nun innerhalb eines Jahres (eigentlich eine reine Spekulation) das Ganze für den anderen Fab-Partner ummodeln um dann 2013 mit dem neuen Design zu starten.
 
Das glaube ich nicht. Trinity wird nur ein sehr kurzes Leben haben und als bald eingestellt werden. Und Kaveri vorgezogen, da die Leistung von Trinity wohl jetzt schon zu schwach sein soll.

Eigentlich würde Trinity doch ohnehin nicht in einem Segment spielen, in dem Leistung eine übergeordnete Rolle spielt. Das Verhältnis aus Preis/Verbrauch/Leistung muss stimmen, wenn 1 und 2 sehr gut sein sollten, dann wäre es auch ok, wenn 3 nur auf +-0 mit Llano rauskommen sollte. Leider scheint die Chipfläche nicht besonders gering zu sein, wenn ich mich korrekt an frühere Meldungen erinnere, womit es schon schwieriger werden könnte mit 1 und 2.
 
Naja, wieviel Strom Trinity dann wirklich braucht hängt ja dank Powergating nur noch sekundär von der Transistorenmenge ab, sondern eher davon wieviele von denen gleichzeitig an sind.
Selbst unter "Volllast" schaltet nicht zwangsläufig jeder Transistor.
Bis jetzt sprechen die Trinity-Gerüchte jedenfalls eher selten eine negative Sprache. Abgesehen davon dass allgemein klar ist dass er es in Sachen CPU nicht mit IB wird aufnehmen können.
 
Ich weise immer wieder gerne darauf hin, dass letztendlich neben der viel zu hohen VCore auch der 7/8/900er Chipsatz sehr ineffizient ist und daher bei Bulldozer das ein oder andere Watt zuviel verbrät. Die FCH sind deutlich effizienter, zusammen mit besserer Fertigung könnten/sollten sich die realen LA-Werte des Gesamtsystems deutlich nach unten bewegen.
 
Zurück
Oben Unten