R1000 Spekulationsthread

Na gleichzeitiges Multithreading gibts bei GPUs doch schon ewig. Les mal den letzten Absatz in Gipsels alten Artikel:
http://www.planet3dnow.de/vbulletin/showthread.php?t=362621&garpg=4#content_start
Wenn man das unbedingt in Kategorien pressen muß, dann machen heutige Radeons kein SMT, sondern eine Kombination von zwei Formen des temporal Multithreading.
In einer SIMD-Engine wird am ehesten sowas wie zweifach fine grained (vertical/interleaved) Multithreading (einzelne Instruktionen), auch barrel processing genannt, benutzt. Das Ganze in Kombination mit coarse grained (block) Multithreading (an Clause Grenzen).

Die neue Architektur wird einen Mischmasch aus interleaved Multithreading (jeden Takt werden Befehle für einen anderen SIMD-Block abgesetzt, das geht round robin) und (maximal 5fach) SMT benutzen. Es können in einem Takt Befehle aus mehreren Wavefronts an die einzelnen Subtypen der Einheiten gegeben werden, also ein Vektorbefehl von Wavefront A + ein Skalarbefehl einer anderen Wavefront B + ein LDS-Befehl von Wavefront C + ein Speicherzugriff von Wavefront D + ein Branch von Wavefront E (gibt noch Export/GDS-Anweisungen als 6te Kategorie, aber mehr als 5 pro Takt gehen nicht; Barrieren, Befehle zum Setzen von Prioritäten, Halt-Befehle usw. werden direkt von den Instruktion-Buffern verabeitet, zählen zu den 5/Takt also nicht dazu). Das bleibt aber alles strikt in-order und die Abhängigkeiten zwischen Befehlen sind höchstwahrscheinlich durch die Pipelinestruktur garantiert aufgelöst, so daß der Scheduler die nicht verfolgen muß (außer für Speicherzugriffe, damit wird der Scheduler deutlich einfacher als bei Fermi). Obendrauf kommt natürlich wieder das coarse grained block Multithreading.

Bei Fermi gibt es 2fach SMT dynamisch kombiniert mit interleaved Multithreading. Und natürlich auch wieder das coarse grained block Multithreading. Der Scheduler verfolgt aber auch die Abhängigkeiten zwischen den Instruktionen eines Warps, womit auch unabhängige Instruktionen eines Warps entweder gleichzeitig (GF104-SMs) oder innerhalb der Ausführungslatenz scheduled werden können. Dies macht die Scheduler deutlich komplizierter, dies ist wegen der hohen Latenzen bei Fermi (18+ Takte) aber auch erforderlich.
 
Was mich gerade stört, ist der Punkt, dass eben doch nicht so ganz klar ist, wann die neue Architektur kommt. Heise will wissen, dass sie erst in der übernächsten Generation kommt und Anandtech weiß gar nichts genaueres.

Einzig XBit und PC Perspective wollen in Erfahrung gebracht habe, dass die neue Architektur bereits Ende diesen Jahres kommt.


Alle berichten von der gleichen Veranstaltung.


Anand schrieb:
At no point has AMD specified when a GPU will appear using GCN will appear, so it’s very much a guessing game. What we know for a fact is that Trinity – the 2012 Bulldozer APU – will not use GCN, it will be based on Cayman’s VLIW4 architecture. Because Trinity will be VLIW4, it’s likely-to-certain that AMD will have midrange and low-end video cards using VLIW4 because of the importance they place on being able to Crossfire with the APU.
 
Was mich gerade stört, ist der Punkt, dass eben doch nicht so ganz klar ist, wann die neue Architektur kommt. Heise will wissen,
"wissen" würde ich das nicht nennen das ist Spekulation pur.
Ob AMD tatsächlich noch in diesem Jahr erste Chips mit der neuen Architektur auf den Markt bringt, ist ungewiss – wahrscheinlicher ist, dass AMD zunächst die bestehenden VLIW4-Chips im 28-Nanometer-Verfahren auf den Markt bringt und später eine High-End-Grafikkarte mit der neuen Architektur präsentiert.
xbitlabs hat ein Zitat (also Orginalaussage) vom R.Bergmann, und PCper hat es aus der Q&A Session nach dem Vortrag von John Taylor und Eric Demers, das hat mMn Gewicht, wieso sollten sie Lügen verbreiten?

Außerdem gibts ja nachwievor die Zwischenlösung wie beim Caymanstart, das Meiste in 28nm und VLIW4, und den neuen Chip nur im high-end Segment. Da könnte die heise Meldung sogar halbwegs richtig sein, zB Q3 den VLIW4 Refresh in 28nm und in Q4 dann das neue Teil.

Edit:
Anandtech spekuliert über die gleiche Option, wenn man da bei Deinem Zitat weiterliest:
At no point has AMD specified when a GPU will appear using GCN will appear, so it’s very much a guessing game. What we know for a fact is that Trinity – the 2012 Bulldozer APU – will not use GCN, it will be based on Cayman’s VLIW4 architecture. Because Trinity will be VLIW4, it’s likely-to-certain that AMD will have midrange and low-end video cards using VLIW4 because of the importance they place on being able to Crossfire with the APU. Does this mean AMD will do another split launch, with high-end parts using one architecture while everything else is a generation behind? It’s possible, but we wouldn’t make at bets at this point in time. Certainly it looks like it will be 2013 before GCN has a chance to become a top-to-bottom architecture, so the question is what the top discrete GPU will be for AMD by the start of 2012.
@Gipsel:
Danke, dass das nicht 100% das gleiche wie CPU SMT ist, war klar (z.B. die Registerbenutzung, bei Intel SMT hat jeder Thread eigene Register), aber was da ganz genau wie funktioniert nicht ;-) Danke für die Erklärung.
 
Zuletzt bearbeitet:
Dagegen spricht:

28 nm Refresh (wäre zu definieren, was für Dich ein Refresh ist) wird es nicht geben, weil es keinen Sinn macht und dies Seifert auch so gesagt hat.

Hatte er hier am 17. Mai gesagt: "AMD to Present at J.P. Morgan Technology"

Da war auch die rede davon, dass die 28nm-Teile auf der VLIW4-Architektur der Caymans aufbauen würden.

Leider exitiert die Aufzeichnung nicht mehr.

Seifert ist halt auch nur ein Finanzmann, daher ist nicht sicher ob er da voll durchsieht.


Gibt es für das Bergmann-Zitat noch eine weitere unabhängige Quelle? Ist schon komisch, dass heise und Anand diese Ankündigung nicht mitbekommen haben wollen.


Die Keynote von Eric Demers steht ja zum Abruf bereit, allerdings ist das Video defekt. Jedenfalls stürzt der Flash Player bei mir unter diversen Browsern und System bei Minute 7:23 ab.

Ich kann mich aber nicht daran erinnern, dass die beiden während der Q&A gesagt hätten, wann die ersten Produkte auf den Markt kommen, die die neue Architektur nutzen.
 
Abstürzen tut bei mir nichts, aber es geht nicht weiter :(
Ich sehs mal so, die PCper Leute (ah jetzt hat das Flash Plugin doch den Löffel abgegeben ^^), waren vor Ort. Zuerst meinten sie auch, dass das nichts bis Ende 2011 wird, aber dann haben sie jemanden gesprochen, der das bestätigte. Obs privat war, oder offiziell in den Q&A, keine Ahnung.

Auf alle Fälle glaub ich kaum, dass sie zum Flunkern neigen, wie besagt, zuerst dachte die auch, dass nichts kommt.

Mit refresh meinte ich nen VLIW4 Refresh in 28nm, z.B. Cayman Shrik, sollte in 28nm doch ne nette Mittelklasse GPU abgeben ;-)

Vielleicht sickert ja noch was durch, mal abwarten.

Falls es noch jemanden interessiert, die PDFs sind jetzt auch online:
http://developer.amd.com/DOCUMENTATION/PRESENTATIONS/Pages/default.aspx

ciao

Alex
 
Zuletzt bearbeitet:
Dagegen spricht:

28 nm Refresh (wäre zu definieren, was für Dich ein Refresh ist) wird es nicht geben, weil es keinen Sinn macht

Macht es mehr Sinn als erst eine bestehende 40nm Architektur durch eine neue 40nm Architktur und diese dann durch eine wiederum neue 28nm Architektur abzulösen? M.M.n. nicht. AMD hat das beim Llano gemacht, aber übliche und bewährte Vorgehensweise ist das absolut nicht.
 
M.M.n. nicht. AMD hat das beim Llano gemacht, aber übliche und bewährte Vorgehensweise ist das absolut nicht.

AMD hat der fehlende 32nm Prozess schon massiv ausgebremst, und nV aufhohlen lassen. Wenn man sich wieder absetzen will muss man seine Vorteile nutzen die man hat und die sind bei AMD GPU das sie besser darin sind neue Prozesse nutzbar zu machen. In den Anandtech Artikeln zur Entstehungsgeschichte der R700,R800 und R900 haben die AMD Interview Partner sehr deutlich gemacht das man viel Manpower in das Überführen in einen neuen Prozess investiert, ich denke AMD sollte und kann das nutzen um für 28nm die neue Architektur zu bringen und sich von nV wieder absetzen zu können.
 
AMD hat der fehlende 32nm Prozess schon massiv ausgebremst, und nV aufhohlen lassen. Wenn man sich wieder absetzen will muss man seine Vorteile nutzen die man hat und die sind bei AMD GPU das sie besser darin sind neue Prozesse nutzbar zu machen. In den Anandtech Artikeln zur Entstehungsgeschichte der R700,R800 und R900 haben die AMD Interview Partner sehr deutlich gemacht das man viel Manpower in das Überführen in einen neuen Prozess investiert, ich denke AMD sollte und kann das nutzen um für 28nm die neue Architektur zu bringen und sich von nV wieder absetzen zu können.

Wo hat sich bitte jemals amd absetzen können? oder meinst du die zeit bis fermi rauskam?
 
[ Als GF100 herauskam, konnte Fermi lediglich über den Stromverbrauch und die Tesselation punkten. Was man sogleich angepriesen hat, wie die beste Erfindung seit geschnitten Brot. Grafik? Wer brauchts, was rockt sind Tesselation und CUDA - naja und PhysX, aber der ganze Rest aus Effizienz und Leistungsfähigkeit... gänzlich überschätzt. Das war doch der Tenor zu der Zeit. Teildeaktivierte Heizplatten waren die ersten Fermis.

Achja und dann war da noch das DX11, das vorher vollkommen unwichtig war und auf einmal, nachdem Mister Woodscrews es auch in der Karte hatte, das elementare Muss wurde. *lol* ]
 
Wo hat sich bitte jemals amd absetzen können? oder meinst du die zeit bis fermi rauskam?

AMD war mit dem Übergang in neue Fertigungstechnik von 65nm->55nm-40nm schneller als nV, dazu kommt das AMD seit der HD4000 Serie es geschafft hat innerhalb von 3 Monaten das gesamte Line-Up auf die neue Generation umzustellen. AMD war hier um einiges aggressiver als nV und hatte daher einen Vorsprung. Ich rede hier nicht von Leistung, sondern davon das die next Generation in neuer Fertigung immer von AMD kam in den letzten Jahren und nV mit seinen Produkten nachgezogen kam.
 
AMD reportedly has completed the tape-out of its next-generation GPU, codenamed Southern Islands, on Taiwan Semiconductor Manufacturing Company's (TSMC) 28nm process with High-k Metal Gate (HKMG) technology, according to a Chinese-language Commercial Times report. The chip is set to expected to enter mass produciton at the end of 2011.
http://www.digitimes.com/news/a20110617PB200.html

Entweder redet AMD ein bischen Mist/Irreführend oder es steckt was interessantes dahinter.
Wenn jetzt vor kurzem das Tape-Outs von South-Island-TSMC war, (hört sich irgendwie nach Mehrzahl an), dann wird es kaum Karten vor 2012 geben können.
3 Monate für Prototyp (A10-Stepping?) und 3 Monate für die Produktion.

Also, wenn AMD jetzt schon 28nm-GPUs für 2011 verspricht, dann müssten sie doch ziemlich sicher sein, was auf einer jetzt "unbekannte GPUs" (von GF?) hindeuten könnte, die 1-2 Monate früher kommt. Eventuell sogar etwa High-End-28nm von GF und Low-end/Mainstream von TSMC oder umgekehrt.
(In 1Q gabs ja auch schon Aussagen von Tape-Outs)

Soviel ich weiß sprach aber AMD auch schon offiziell von 32nm-GPUs Mitte 2010, die sie nicht einhalten konnten. Und das zu einem Zeitpunkt, wo die Fertigung noch ziemlich sehr schlecht war.

PS
Commenting on questions whether AMD will outsource its production to Globalfoundries or Taiwan Semiconductor Manufacturing Company (TSMC), Bergman only said that both firms will have the chance to produce the 28nm products for AMD.
http://www.digitimes.com/news/a20110616PD204.html

Die Frage ist, wann die Entscheidung fällt, welcher dann zum einsatz kommt.
Nachdem oder Bevor das Desgin für den jeweiligen Hersteller entwickelt wurde.

Um kurzfristig zu entscheiden, müssten sie für beide Hersteller eine Maske entwickeln (was ja mit 20nm viel leichter sein soll, als noch mit 28nm), weil man so 1 Jahr davor eher nicht so genau wissen kann, wie gut einer in einem Jahr sein wird.
 
Zuletzt bearbeitet:
Naja ich glaube eher, dass sie damit einmal Southern Islands meinen und einmal Krishna und net soo arg zweigleisig fahren...

Und wer sagt, dass sie alle Tape Outs erst jüngst hatten. Wenn sie noch Chips bis Ende des Jahres rausbringen wollen, kann ja sein, dass sie schon einige vor ein paar Monaten raushatten und jüngst eben die letzten, evtl low end, da diese meistens immer zu letzt kommen.

Womit ich immernoch in Gedanken spiele, ob sie gar ein Multichipdesign anplanen mit der neuen GPU Architektur. Würde 64 SIMDs pro CU bedeuten...
 
Zuletzt bearbeitet:
kann ja sein, dass sie schon einige vor ein paar Monaten raushatten und jüngst eben die letzten, evtl low end, da diese meistens immer zu letzt kommen.

Da ich traditionell meistens immer mit nur wenigen Ausnahmen gelegentlich LowEnd kaufe hoffe ich mal da da auch einige LowEnd GPUn zuweilen meistens schon vorher kommen.

<scmnr>
 
Wär dieser Ringbus bei Multichip GPUs nicht von Vorteil?
Nur einmal RAM aufm PCB. Könnte mir da sowas ähnliches vorstellen wie bei Intel nur halt mit einzelnen CUs. Oder steigt dadurch die Latenz?
 
Lepus schrieb:
Wenn sie noch Chips bis Ende des Jahres rausbringen wollen, kann ja sein, dass sie schon einige vor ein paar Monaten raushatten und jüngst eben die letzten, evtl low end, da diese meistens immer zu letzt kommen.
Das ist ja die Sache.
Die Frage ist, wie Irreführend die Aussagen sind.
Digitimes schreibt ja nicht umsonst
"AMD reportedly has completed the tape-out of its next-generation GPU, codenamed Southern Islands"

Completed the Tape-Out next-Gen-GPU von Southern Island könnte Mehrzahl sein, da Southern Islands Mehre Inselns sind und somit eigentlich alle Inseln.
Completed hört sich ja an, wie wenn das Tape-Out (von mehreren Dies) über einen Zeitraum gegangen ist und es keinen mehr gibt. Somit könnte es, wie du es vermutest, schon erstere Tape-Outs fertig sein.

Dazu hatte AMD in den letzten Jahren nicht so oft bzw. garnicht einen Tape-Out bekanntgegeben.
Somit gibts auch kaum "Erfahrung" wie man offizielle Tape-Out-Aussagen bewerten muss.

Und wie genau der PR-Sprecher die Aussage überlegt hat und somit Foren-User unabsichtlich unbewusst irritiert (siehe Interpretationen oben) bzw. uns bewusst Irreführt, um etwas aber nicht zu viel zu sagen, wissen wir ja auch nicht.
 
Dazu hatte AMD in den letzten Jahren nicht so oft bzw. garnicht einen Tape-Out bekanntgegeben.
Somit gibts auch kaum "Erfahrung" wie man offizielle Tape-Out-Aussagen bewerten muss.

AMD reportedly has completed the tape-out of its next-generation GPU, codenamed Southern Islands, on Taiwan Semiconductor Manufacturing Company's (TSMC) 28nm process with High-k Metal Gate (HKMG) technology, according to a Chinese-language Commercial Times report

Also offiziell von AMD bekannt gegeben?
 
Ich denke/dachte, es wurden offizielle Aussagen getätigt.

Wenn nicht, dann wurde offiziell schon so viel gesagt wie noch nie.

Thomas Seifert

So we obviously, work hard to keep our OpEx under tight control. In the second quarter, we see some -- a couple of 28-nanometer tape-outs hitting R&D costs.
...
Yes. So I think we were quite open on our last call, so our foundry strategy has not changed. We are pleased with the progress we see. As I said, we expect several 28-nanometer tape-outs during the current quarter. And we balance our loading according to risk performance and price. But we also said that there is, of course, a natural incentive for us at this point to work closely with GLOBALFOUNDRY, and that is, of course, something we continue to do.
...
I said it's going to be around $620 million for operating expenses in total, but it includes, as I said, the first couple of 28-nanometer tape-outs already.

http://seekingalpha.com/article/264...1-results-earnings-call-transcript?part=qanda

O
 
Mit vielen Worten nichts gesagt. Oder habe ich eine Aussage überlesen?
In diesem Quartal wird nicht nur ein Produkt als abgeschlossener fertiger 28nm-Entwurf die Planungsphase verlassen, sondern mehrere.

Das ist in so fern nicht ganz überraschend; weil ja neben den klassischen Grafikchips auch der Ontario-Nachfolger mit überarbeitetem Bobcat-Kernen geplant war.

Über den Start einer Massenfertigung (und wo!) sagt das aber tatsächlich noch gar nichts aus ;D

MFG Bobo(2011)
 
Zurück
Oben Unten