App installieren
How to install the app on iOS
Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: This feature may not be available in some browsers.
Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Spekulationsthread: Was kommt 2011+
- Ersteller Ge0rgy
- Erstellt am
BavarianRealist
Grand Admiral Special
- Mitglied seit
- 06.02.2010
- Beiträge
- 3.358
- Renomée
- 80
@28nm-HKGM von GF:
Globalfoundries würde kaum im Nachhinein die Kapazitätsplanungen weiter ausdehen, hätten sie Zweifel, dass diese auch benötigt werden. Dass nun jetzt im Nachhinein gleich weitere Erweiterungen geplant sind, dürfte wohl bedeuten, dass GF von seinen entwickelten Prozessen sehr überzeugt sein dürfte. Man hat vermutlich abgewartet, wie GF die 28nm-Schwierigkeiten löst. Und vermutlich hat man dieses sehr gut gelöst.
==> Meine Schlussfolgerung: GFs 32nm-SOI als auch 28nm-HKGM-Prozesse sollten SEHR GUT werden!
Wir hatten schon mal diese Diskussion, ob GFs Gate-First Vor- oder eher Nachteile gegenüber Gate-Last hat. Der entscheidende Vorteil ist im letzten Slide (hier: http://www.anandtech.com/show/3750/globalfoundries-plans-to-expand-dresden-and-ny-fabs-in-anticipation-of-2822nm) erwähnt:
"Design Compatibility with 45/40nm"
Das sollte bedeuten, dass AMD seine CPUs als auch GPUs auch viel schneller/einfacher/günstiger auf 28nm-HKMG portieren können sollte, als sie etwa für den 28nm-Prozess bei TSMC bräuchten.
Zudem heißt es in dem Slide zum 28nm-HKMG:
"Ramping Production in 2010"
Globalfoundries würde kaum im Nachhinein die Kapazitätsplanungen weiter ausdehen, hätten sie Zweifel, dass diese auch benötigt werden. Dass nun jetzt im Nachhinein gleich weitere Erweiterungen geplant sind, dürfte wohl bedeuten, dass GF von seinen entwickelten Prozessen sehr überzeugt sein dürfte. Man hat vermutlich abgewartet, wie GF die 28nm-Schwierigkeiten löst. Und vermutlich hat man dieses sehr gut gelöst.
==> Meine Schlussfolgerung: GFs 32nm-SOI als auch 28nm-HKGM-Prozesse sollten SEHR GUT werden!
Wir hatten schon mal diese Diskussion, ob GFs Gate-First Vor- oder eher Nachteile gegenüber Gate-Last hat. Der entscheidende Vorteil ist im letzten Slide (hier: http://www.anandtech.com/show/3750/globalfoundries-plans-to-expand-dresden-and-ny-fabs-in-anticipation-of-2822nm) erwähnt:
"Design Compatibility with 45/40nm"
Das sollte bedeuten, dass AMD seine CPUs als auch GPUs auch viel schneller/einfacher/günstiger auf 28nm-HKMG portieren können sollte, als sie etwa für den 28nm-Prozess bei TSMC bräuchten.
Zudem heißt es in dem Slide zum 28nm-HKMG:
"Ramping Production in 2010"
Dresdenboy
Redaktion
☆☆☆☆☆☆
Weitere Infos zu GF:
http://pc.watch.impress.co.jp/docs/column/kaigai/20100608_372754.html
http://pc.watch.impress.co.jp/docs/column/kaigai/20100608_372754.html
Dr@
Grand Admiral Special
- Mitglied seit
- 19.05.2009
- Beiträge
- 12.791
- Renomée
- 4.066
- Standort
- Baden-Württemberg
- Aktuelle Projekte
- Collatz Conjecture
- Meine Systeme
- Zacate E-350 APU
- BOINC-Statistiken
- Mein Laptop
- FSC Lifebook S2110, HP Pavilion dm3-1010eg
- Prozessor
- Turion 64 MT37, Neo X2 L335, E-350
- Mainboard
- E35M1-I DELUXE
- Speicher
- 2x1 GiB DDR-333, 2x2 GiB DDR2-800, 2x2 GiB DDR3-1333
- Grafikprozessor
- RADEON XPRESS 200m, HD 3200, HD 4330, HD 6310
- Display
- 13,3", 13,3" , Dell UltraSharp U2311H
- HDD
- 100 GB, 320 GB, 120 GB +500 GB
- Optisches Laufwerk
- DVD-Brenner
- Betriebssystem
- WinXP SP3, Vista SP2, Win7 SP1 64-bit
- Webbrowser
- Firefox 13
Auf den Folien steht aber nichts neues!
http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1269291520
http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1269291520
Opteron
Redaktion
☆☆☆☆☆☆
Hmm da ist mal wieder Zeit für ne Milchmädchenrechnung. Denn auf einer Folie steht, dass die 32nm SOI HKMG "performance" 50% besser als bei 45nm wäre.
Performance wird wie immer der übliche Mix aus Takt & Verlustleistung sein. Bleiben wir also also mal in den gleichen TDP Bändern, und kalkulieren damit den Taktspielraum beim K10 Design:
Aktuell in 45nm gibts 45W Propus mit max. 2,4 GHz. +50% ergäben damit dann 3,6 GHz für Llano (ohne GPU). Für die Sabine Desktop Plattform sollte man mit mehr TDP die 3,6 GHz inkl. GPU locker erreichen.
Für <30W Mobile CPUs wird man wohl weiterhin unter 3 GHz bleiben müssen. Aber naja, immerhin hat man ja die 4 Kerne plus GPU, ist ja auch was.
Ach und noch zum Spass das Ganze noch bei 125W:
z.Zt. 3,4 GHz +50% -> 5,1 GHz
Also da sollten doch für Zambezi 4 GHz locker-flockig drin sein, auch wenn so ein Bulldozer Modul "etwas" dicker als ein K10 Kern ausfallen wird
ciao
Alex
Zuletzt bearbeitet:
Ich bilde mir ein, nicht Performance-Steigerung sondern Energie-Einsparungen gelesen zu haben.Opteron schrieb:Performance wird wie immer der übliche Mix aus Takt & Verlustleistung sein. Bleiben wir also also mal in den gleichen TDP Bändern, und kalkulieren damit den Taktspielraum beim K10 Design:
Bei 40% Energie-Einsparungen hat das dann s0 20-30% mehr Takt/Transistoren usw bedeutet.
Immerhin kommt ja High-K & 32nm und eventuell Ultra-Low-K gleichzeitig und da erwarte ich mir schon einen größeren Sprung als üblich. Vorallem, wenn man sah, wie viel High-K bei Intel und Ultra-Low-K bei Thuban gebracht hat.
Oder ist das wirklich nur Einbildung?
Zuletzt bearbeitet:
Opteron
Redaktion
☆☆☆☆☆☆
Naja, das sind 2 eigenständige Punkte, hatte es oben auch verlinkt:Ich bilde mir ein, nicht Performance-Steigerung sondern Energie-Einsparungen gelesen zu haben.
Performance ist im Produktionsbereich ganz genau genommen auf den Transistor bezogen, aber davon hängt dann Takt / Verlustleistung ab.Denn auf einer Folie steht,
ciao
Alex
rkinet
Grand Admiral Special
http://pc.watch.impress.co.jp/img/pcw/docs/372/754/html/4.jpg.html
Da steht bzgl. SOI nur noch DD und 32nm ... off Limit ?!
Dafür wird 28nm mehrfach aufgeführt und scheint in den nächsten Jahren dominat zu werden ?!
Per 22nm/20nm ab 2013 / New York ist auch offen ob das CPUs oder GPUs / Fusion betrifft.
gruffi
Grand Admiral Special
- Mitglied seit
- 08.03.2008
- Beiträge
- 5.393
- Renomée
- 65
- Standort
- vorhanden
- Prozessor
- AMD Ryzen 5 1600
- Mainboard
- MSI B350M PRO-VDH
- Kühlung
- Wraith Spire
- Speicher
- 2x 8 GB DDR4-2400 CL16
- Grafikprozessor
- XFX Radeon R7 260X
- Display
- LG W2361
- SSD
- Crucial CT250BX100SSD1
- HDD
- Toshiba DT01ACA200
- Optisches Laufwerk
- LG Blu-Ray-Brenner BH16NS40
- Soundkarte
- Realtek HD Audio
- Gehäuse
- Sharkoon MA-I1000
- Netzteil
- be quiet! Pure Power 9 350W
- Betriebssystem
- Windows 10 Professional 64-bit
- Webbrowser
- Mozilla Firefox
- Verschiedenes
- https://valid.x86.fr/mb4f0j
Ist das so üblich? Bei Performance gehe ich eigentlich immer von den Schaltzeiten der Transistoren aus. Über Takt und Verlustleistung der finalen Prozessoren sagt das erstmal recht wenig.Performance wird wie immer der übliche Mix aus Takt & Verlustleistung sein.
Opteron
Redaktion
☆☆☆☆☆☆
Stand doch auch schon da:Ist das so üblich? Bei Performance gehe ich eigentlich immer von den Schaltzeiten der Transistoren aus. Über Takt und Verlustleistung der finalen Prozessoren sagt das erstmal recht wenig.
Performance ist im Produktionsbereich ganz genau genommen auf den Transistor bezogen, aber davon hängt dann Takt / Verlustleistung ab.
Alles was ich finden konnte.
Na ja, da werden immer so von ca. 20% performance-Steigerung berichtet.
Also, da hören sich die 50% für 32nm mal nicht so schlecht an. Die Frage bleibt, ob die gleich am Anfang erreicht werden.
Sind eigentlich schon die Air-Caps umgesetzt worden?
Metal-Gates kommen AFAIK mit 32nm.
PS: jetzt sehe ich gerade, wo man 2007 auch nur von 20% "Mehr"-Performance von 32nm ausging.
Vielleicht war das damals so, weil man vielleicht dachte, z.B. ULK in 45nm in allen Dies zu produzieren, sowie High-K integiert zu haben.
Also, statt von 45nm-Ultra-Low-K & High-K/Metal-Gates zu 32nm-Air-Gaps mit 20%-MehrPerformance, dürfte es zu
45nm zu 32nm-Ultra-Low-K & High-K/Metal-Gates mit 50% Mehr-Performance gemeint sein, da ULK noch nicht weitflächig eingesetzt wird.
Ich würde mal daumen-mal-Pi schätzen, dass die Zeit für die Air-Caps-Integration zu kurz war und eventuell wie ULK als 32nm-Option kommt oder erst mit 22nm.
Na ja, da werden immer so von ca. 20% performance-Steigerung berichtet.
Also, da hören sich die 50% für 32nm mal nicht so schlecht an. Die Frage bleibt, ob die gleich am Anfang erreicht werden.
Sind eigentlich schon die Air-Caps umgesetzt worden?
Metal-Gates kommen AFAIK mit 32nm.
PS: jetzt sehe ich gerade, wo man 2007 auch nur von 20% "Mehr"-Performance von 32nm ausging.
Vielleicht war das damals so, weil man vielleicht dachte, z.B. ULK in 45nm in allen Dies zu produzieren, sowie High-K integiert zu haben.
Also, statt von 45nm-Ultra-Low-K & High-K/Metal-Gates zu 32nm-Air-Gaps mit 20%-MehrPerformance, dürfte es zu
45nm zu 32nm-Ultra-Low-K & High-K/Metal-Gates mit 50% Mehr-Performance gemeint sein, da ULK noch nicht weitflächig eingesetzt wird.
Ich würde mal daumen-mal-Pi schätzen, dass die Zeit für die Air-Caps-Integration zu kurz war und eventuell wie ULK als 32nm-Option kommt oder erst mit 22nm.
Zuletzt bearbeitet:
Dresdenboy
Redaktion
☆☆☆☆☆☆
@aylano:
Es sind Air-Gaps.
@all:
Was haben wir denn hier:
Es sind Air-Gaps.
@all:
Was haben wir denn hier:
Link: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.114.8855Advanced Micro Devices, Architecture/PerformanceModeling Group - Sunnyvale, CA, USA, Co-op Engineer, May – August 2005
• Performed performance analysis of hardware data prefetchers and runahead execution.
mibo
Grand Admiral Special
- Mitglied seit
- 05.01.2003
- Beiträge
- 2.297
- Renomée
- 65
- Standort
- Hannover
- Mein Laptop
- Lenovo T450s
- Prozessor
- Ryzen 5800X3D
- Mainboard
- ASUS B550M-PLUS
- Kühlung
- Noctua NH-U12P
- Speicher
- 2x16GB DDR4 ECC
- Grafikprozessor
- AMD 6700XT
- Display
- HP X27i
- SSD
- Samsung 860EVO, 960EVO, WD 850X
- Optisches Laufwerk
- DVD-Brenner :-)
- Netzteil
- BQ Dark Power 12 750W
- Betriebssystem
- Suse Tumbleweed / Win10 64Bit
- Webbrowser
- Firefox
@aylano:
Es sind Air-Gaps.
Ist nicht die Kapazität dieser Luft-Spalten das Interessante? Oder, welchem Zweck dienen die noch?
Opteron
Redaktion
☆☆☆☆☆☆
Hmm .. 2005, war das nicht die Zeit, als Andy Glew bei AMD war ?
Dresdenboy
Redaktion
☆☆☆☆☆☆
@mibo:
Stimmt. Aber Gaps und Caps sind verschiedene Dinge.
Noch etwas Background von dem, der das bei AMD gemacht hat (hier aber mit Intel):
http://www.ece.cmu.edu/~omutlu/pub/mutlu_hpca03_talk.pdf
Ich habe doch nur mal geschaut, wofür 4 OOO pipelines ohne SMT u. Checkpoints gut sein könnten. Siehe auch Diskussionen bei AMDZone und SemiAccurate.
Übrigens war der Ontario-Wafer in einer Box, wie sie auch bei GF benutzt wird (zu sehen z.B. bei Fudzillas 32nm GF Report). Hans spekuliert doch schon, dass es 28 nm Dies waren.
Stimmt. Aber Gaps und Caps sind verschiedene Dinge.
Ja ja, das passt alles schön ins KonzeptHmm .. 2005, war das nicht die Zeit, als Andy Glew bei AMD war ?
Noch etwas Background von dem, der das bei AMD gemacht hat (hier aber mit Intel):
http://www.ece.cmu.edu/~omutlu/pub/mutlu_hpca03_talk.pdf
Ich habe doch nur mal geschaut, wofür 4 OOO pipelines ohne SMT u. Checkpoints gut sein könnten. Siehe auch Diskussionen bei AMDZone und SemiAccurate.
Übrigens war der Ontario-Wafer in einer Box, wie sie auch bei GF benutzt wird (zu sehen z.B. bei Fudzillas 32nm GF Report). Hans spekuliert doch schon, dass es 28 nm Dies waren.
Zuletzt bearbeitet:
Lynxeye
Admiral Special
- Mitglied seit
- 26.10.2007
- Beiträge
- 1.107
- Renomée
- 60
- Standort
- Sachsen
- Mein Laptop
- Lifebook T1010
- Prozessor
- AMD FX 8150
- Mainboard
- Gigabyte GA-970A-UD3
- Kühlung
- Zalman Reserator 1 Plus
- Speicher
- 4x8GB DDR3-1600 G.Skill Ripjaws
- Grafikprozessor
- ASUS ENGTX 260
- Display
- 19" AOC LM928 (1280x1024), V7 21" (1680x1050)
- HDD
- Crucial M4 128GB, 500GB WD Caviar 24/7 Edition
- Optisches Laufwerk
- DVD Multibrenner LG GSA-4167B
- Soundkarte
- Creative Audigy 2 ZS
- Gehäuse
- Amacrox Spidertower
- Netzteil
- Enermax Liberty 500W
- Betriebssystem
- Fedora 17
- Webbrowser
- Firefox
- Verschiedenes
- komplett Silent durch passive Wasserkühlug
Ist nicht die Kapazität dieser Luft-Spalten das Interessante? Oder, welchem Zweck dienen die noch?
Das ist teilweise richtig. Luft stellt ein Ultra-Low-k Material dar. Dadurch können die parasitären Leitungskapazitäten gesenkt werden und damit die Taktfrequenz erhöht werden. Allerdings heißt es nicht "Caps" da die Kondensatorwirkung nur parasitär ist und man diese eher versucht zu vermeiden, als mit dieser zu arbeiten.
mibo
Grand Admiral Special
- Mitglied seit
- 05.01.2003
- Beiträge
- 2.297
- Renomée
- 65
- Standort
- Hannover
- Mein Laptop
- Lenovo T450s
- Prozessor
- Ryzen 5800X3D
- Mainboard
- ASUS B550M-PLUS
- Kühlung
- Noctua NH-U12P
- Speicher
- 2x16GB DDR4 ECC
- Grafikprozessor
- AMD 6700XT
- Display
- HP X27i
- SSD
- Samsung 860EVO, 960EVO, WD 850X
- Optisches Laufwerk
- DVD-Brenner :-)
- Netzteil
- BQ Dark Power 12 750W
- Betriebssystem
- Suse Tumbleweed / Win10 64Bit
- Webbrowser
- Firefox
Das ist teilweise richtig. Luft stellt ein Ultra-Low-k Material dar. Dadurch können die parasitären Leitungskapazitäten gesenkt werden und damit die Taktfrequenz erhöht werden. Allerdings heißt es nicht "Caps" da die Kondensatorwirkung nur parasitär ist und man diese eher versucht zu vermeiden, als mit dieser zu arbeiten.
Danke für die Erklärung.
Ich dachte, dass man deshalb die air gaps auch als caps bezeichnet, weil deren Kapazität das Wichtige ist. Aber Deine Erklärung ergibt Sinn.
Triskaine
Lt. Commander
- Mitglied seit
- 19.01.2009
- Beiträge
- 105
- Renomée
- 12
Übrigens war der Ontario-Wafer in einer Box, wie sie auch bei GF benutzt wird (zu sehen z.B. bei Fudzillas 32nm GF Report). Hans spekuliert doch schon, dass es 28 nm Dies waren.
Auch GF bietet einen 40 nm Low Power Prozess an, der laut Roadmap seit Anfang dieses Quartals in risk production ist.
gehört nicht zum thema aber egal
mich würde mal interessieren welche Architektur eigentlich ursprünglich nach dem K8 geplant war, K10 ist ja nur ein verbesserter K8, AMD soll ja einige neue Architekturen unabhängig von Bulldozer verworfen haben, ist dazu noch einiges bekannt?
mich würde mal interessieren welche Architektur eigentlich ursprünglich nach dem K8 geplant war, K10 ist ja nur ein verbesserter K8, AMD soll ja einige neue Architekturen unabhängig von Bulldozer verworfen haben, ist dazu noch einiges bekannt?
Triskaine
Lt. Commander
- Mitglied seit
- 19.01.2009
- Beiträge
- 105
- Renomée
- 12
gehört nicht zum thema aber egal
mich würde mal interessieren welche Architektur eigentlich ursprünglich nach dem K8 geplant war, K10 ist ja nur ein verbesserter K8, AMD soll ja einige neue Architekturen unabhängig von Bulldozer verworfen haben, ist dazu noch einiges bekannt?
Laut Charlie gab es bei bei AMD zwei Architekturen zwischen Hammer und Barcelona, die beide aber aufgegeben wurden.
Die eine Architektur zielte darauf einen Netburst ähnlichen Takt mit der selben bis höheren IPC eines K8 zu erreichen. Das ist aber, offensichtlich, an der selben Stromverbrauchs- und Wärmeproblematik gescheitert die später auch Prescott den Garaus machte.
Die nächste war eine sehr komplexe, auf massiv parallele Programme ausgelegte Architekur, die FB-DIMM verwendet hätte. Allerdings waren FB-DIMMs dann doof , die Single-Thread Performance zu niedrig und der Stromverbrauch zu hoch, also hat man den Stecker gezogen.
also 2 uninteressante Architekturen, der P4 hat es gezeigt und auf der anderen Seite hatte der K10 zuwenig IPC, 3,6 Ghz @140w ist das max. beim K10.5 @45nm, höhere Taktraten sind nur in 32nm möglich. Ich bin schon gespannt ob ein Llano ohne IGP mit 4 Ghz @125w kommt...
Ragas
Grand Admiral Special
- Mitglied seit
- 24.05.2005
- Beiträge
- 4.470
- Renomée
- 85
- Prozessor
- AMD Athlon 64 X2 3800+ @2520MHz; 1,4V; 53°C
- Mainboard
- Asus A8N-E
- Kühlung
- Thermaltake Sonic Tower (doppelt belüftet)
- Speicher
- 4x Infineon DDR400 512MB @207MHz
- Grafikprozessor
- Nvidia GeForce FX 7800GT
- Display
- 1.: 24", Samsung SyncMaster 2443BW, 1920x1200 TFT 2.: 19", Schneider, 1280x1024 CRT
- HDD
- Seagate Sata1 200GB 7200rpm, 2x250GB Seagate SATA2 im Raid0
- Optisches Laufwerk
- DVDBrenner LG GSA 4167
- Soundkarte
- Creative X-Fi Extreme Music
- Gehäuse
- Thermaltake Soprano Silber
- Netzteil
- Be-quiet! Darkpower 470W
- Betriebssystem
- Windows XP; Linux Mandriva 2007.1 (Kernel: 2.6.22.2 Ragas-Edition :D )
- Webbrowser
- Firefox
- Verschiedenes
- -Lüftersteuerung: Aerogate3
Laut Charlie gab es bei bei AMD zwei Architekturen zwischen Hammer und Barcelona, die beide aber aufgegeben wurden.
Die eine Architektur zielte darauf einen Netburst ähnlichen Takt mit der selben bis höheren IPC eines K8 zu erreichen. Das ist aber, offensichtlich, an der selben Stromverbrauchs- und Wärmeproblematik gescheitert die später auch Prescott den Garaus machte.
Die nächste war eine sehr komplexe, auf massiv parallele Programme ausgelegte Architekur, die FB-DIMM verwendet hätte. Allerdings waren FB-DIMMs dann doof , die Single-Thread Performance zu niedrig und der Stromverbrauch zu hoch, also hat man den Stecker gezogen.
Wobei man nicht vergessen sollte, dass trotz allem die besten Ideen dieser Architekturen am ende im Bulldozer stecken werden. zum Beispiel kann das Design mit shared FP von der zweiten genannten Architektur stammen und der ersten genannten könnte Bulldozer einige low latency Strukturen verdanken ... es kursierte ja auch etwas von höherem Takt an bestimmten Einheiten des BD.
Was ich sagen will ist nur, dass nicht alles von vorherigen versuchen für umsonst war, es gibt den Ingenieuren einen viel besseren Überblick über was geht und was nicht und einen Schatz an neuen guten Ideen die man jetzt in den BD bauen kann.
Opteron
Redaktion
☆☆☆☆☆☆
Die Compilerbauer plaudern wieder mal aus dem Nähkästchen:
ciao
Alex
http://gcc.gnu.org/ml/gcc/2010-06/msg00402.htmlHi,
We are in the process of adding a feature to GCC to take advantage of a new hardware feature in the latest AMD micro processor. This feature requires a certain mix, ordering and alignments in instruction sequences to obtain the expected hardware performance.
I am asking the community to review this high level implementation design and give me direction or advice.
The new hardware issues two windows of the size N bytes of instructions in every cycle. It goes into accelerate mode if the windows have the right combination of instructions or alignments. Our goal is to maximize the IPC by proper instruction scheduling and alignments.
Here is a summary of the most important requirements:
a) Maximum of N instructions per window.
b) An instruction may cross the first window.
c) Each window can have maximum of x memory loads and y memory stores .
d) The total number of immediate constants in the instructions of a window should not exceed k.
e) The first window must be aligned on 16 byte boundary.
f) A Window set terminates when a branch exists in a window.
g) The number of allowed prefixes varies for instructions.
h) A window set needs to be padded by prefixes in instructions or terminated by nops to ensure adherence to the rules.
ciao
Alex
Dresdenboy
Redaktion
☆☆☆☆☆☆
Cool. Das GCC Posting habe ich mir mal ausgedruckt für unterwegs. V.a.: Was ist der "accelerate mode"? High frequency?Die Compilerbauer plaudern wieder mal aus dem Nähkästchen:
http://gcc.gnu.org/ml/gcc/2010-06/msg00402.html
ciao
Alex
Opteron
Redaktion
☆☆☆☆☆☆
Ist die Frage, über was sich das "window" nun erstreckt ... nur Fetch oder Fetch+Decode ?Cool. Das GCC Posting habe ich mir mal ausgedruckt für unterwegs. V.a.: Was ist der "accelerate mode"? High frequency?
In letzterem Fall könnte man sich überlegen, dass er FastPath Instr. damit meint. Aber wenns nur um Fetch geht ...
Ich les mal bei Gelegenheit nochmal das Decoder Patent durch, vielleicht findet sich da was.
mocad_tom
Admiral Special
- Mitglied seit
- 17.06.2004
- Beiträge
- 1.234
- Renomée
- 52
Mag sich jetzt ein bisschen blauäugig anhören - aber geht es, dass man eine CPU von OoO auf In-Order umschaltet, um sich Shadow-Register/Register Renaming/Reordering..... zu sparen.
Während Phasen ohne Branches werden stur alle Execution Units ausgelastet, die Anordnung der Befehle wird statisch zur Compile-Time vorgegeben. Ein paar Pipeline-Stages werden übersprungen/kurzgeschlossen, weil sie nicht benötigt werden.
Während Phasen ohne Branches werden stur alle Execution Units ausgelastet, die Anordnung der Befehle wird statisch zur Compile-Time vorgegeben. Ein paar Pipeline-Stages werden übersprungen/kurzgeschlossen, weil sie nicht benötigt werden.
Ähnliche Themen
- Antworten
- 17
- Aufrufe
- 2K
- Antworten
- 19
- Aufrufe
- 3K
- Antworten
- 0
- Aufrufe
- 793