News AMD K6-III Prozessor wird 11 Jahre alt

Nero24 · 26.02.2010

Heute vor genau 11 Jahren hat AMD seinen K6-III Prozessor <a href="http://www.amd.com/us/press-releases/Pages/Press_Release_833.aspx" target="_blank">offiziell vorgestellt</a>. Dabei handelte es sich um einen K6-2 alias K6 3D Prozessor, der um einen 256 KB großen L2-Cache erweitert worden war.

<center><img src="http://www.planet3dnow.de/vbulletin/attachment.php?attachmentid=18080&stc=1&d=1267175339" border="1" alt="AMD K6-III Die-Shot"></center>

Der AMD K6-III war damals die neueste Ausbaustufe des von NexGen zugekauften K6 Prozessor-Designs. Die Anbindung zur Außenwelt fußte beim K6 noch auf der von Intel bereits ausgemusterten Sockel 7 Plattform, die auch mit AMDs "Super 7" Erweiterung (100 MHz Frontside-Bus statt 66 MHz und AGP 1.0 statt nur PCI) nie den Infrastruktur-Flaschenhals völlig ablegen konnte.

Zudem sprangen auf den Super 7 Zug damals nur die taiwanesischen Chipsatz-Hersteller ALi, VIA und SiS auf, die zu jener Zeit noch nicht wirklich vollends ausgereifte Plattformen bieten konnten wie wir sie heute beinahe in Perfektion gewohnt sind.

<center><img src="http://www.planet3dnow.de/vbulletin/attachment.php?attachmentid=18081&stc=1&d=1267175339" alt="" border="1"></center>

Insofern war der AMD K6-III damals ein Meilenstein, da er - wie schon kurz zuvor der Intel Celeron mit Mendocino-Core - erstmals im x86-Bereich einen Fullspeed L2-Cache direkt auf dem Die realisierte. Damit konnte nicht einmal der ein halbes Jahr später eingeführte AMD "K7" Athlon dienen, der wie der damals aktuelle Intel Pentium III "Katmai" nur auf L2 Cache zurückgreifen konnte, der auf einer gemeinsamen Slot-Karte untergebracht war. Die Fertigungstechnologie mit 250 nm war damals noch nicht so weit.

Da die Super 7 Plattform ohnehin schon von der langsamen und ineffizienten Infrastruktur gebremst wurde, war der AMD K6-III damals ein riesen Schritt vorwärts für AMD. Endlich konnten die zur Laufzeit wichtigen Daten im Cache gehalten werden, was dem K6-III gegenüber dem K6-2 ohne On-Die L2-Cache einen enormen Leistungsvorsprung bescherte. Der damals auf Sockel 7/Super 7 Plattformen übliche Cache auf dem Mainboard wanderte beim K6-III von der zweiten in die dritte Cachestufe (L3-Cache). Die Architektur bedingte schwache Fließkomma-Leistung konnte er jedoch logischerweise nie ablegen, jedoch beflügelte der Fullspeed On-Die L2-Cache die Leistung der K6-Baureihe wie kaum für möglich gehalten. Endlich wurde sichtbar, wie gut und effizient das NexGen Low-Latency Design, das auf kurze Durchlaufzeiten eines Befehls ausgelegt war, weniger auf möglichst hohen Durchsatz oder gar möglichst hohe Taktfrequenz, zumindest im ALU-Bereich war. Hier verweisen wir gerne auf einen unserer <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=352912">Artikel von 2000</a>.

Verantwortlich für diese damals außergewöhnliche ALU-Leistung war zum einen die kurze Pipeline, die im Falle eines Stalls keinen großen Penalty nach sich zog, der große L1-Cache von 32 KB Daten und 32 KB Instruktionen, die für damalige Verhältnisse riesigen TLBs, sowie der äußerst ausgefeilte Branch-Predictor. Zudem hatte AMD etliche damals übliche Maschinen-Befehle "in Hardware" verdrahtet ("Short decodable"), zum Beispiel den LOOP-Befehl, was Schleifen, die damit realisiert waren, erheblich beschleunigte. Allerdings wurde damit auch das ein oder andere <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1026799879">Kompatibilitätsproblem</a> heraufbeschworen, da z.B. einige Microsoft-Programmierer nicht damit gerechnet hatten, dass dieser Schleifenbefehl, den sie als Zeitverzögerung bei der Initialisierung von Gerätetreibern nutzten, so schnell abgearbeitet werden würde. Verständnisschwierigkeiten bei der Software-Auswahl machte hin und wieder - gerade im Linux-Umfeld - auch, dass der K6/-2/-III zwar von der Architektur her mit mehreren Pipelines, Register Renaming, Out-of-Order Execution etc. alle Merkmale der 686-Architektur trug und von AMD auch als Widersacher der "80686" Pentium Pro/-II/-III vermarktet wurde, jedoch nur zum 586-Befehlssatz kompatibel war. Die viel gepriesene 3DNow! SIMD-Einheit konnte ihn bei Spielen und Multimedia-Anwendungen meist auch nicht beflügeln, da die Programmierer die 3DNow! Befehle explizit hätten nutzen müssen, was bis auf ein paar halbgare Quake III Arena und LAME-Patches nie wirklich geschehen ist.

Toppen konnten die K6-III Leistung später nur noch einmal die eigentlich für Notebooks gedachten <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=352923">AMD K6-2+ und K6-III+ Prozessoren</a>, die dank der 180 nm Bauweise (statt 250 nm) mehr Taktpotenzial und/oder weniger Stromverbrauch, sowie Teile der Enhanced 3DNow! Technologie des mittlerweile bereits eingeführten AMD Athlon boten. Allerdings waren diese Prozessoren - bei bis auf ein paar wenigen Freaks - im Mainstream nicht mehr relevant, da zu dieser Zeit (2000) bereits die K7-Prozessoren bei praktisch jedem Benchmark von Sieg zu Sieg eilten und der K6-Plattform daher kaum noch jemand eine Träne nachweinte - eben bis auf ein paar Insider, die den K6-III heute noch für seine hohe IPC im ALU-Bereich huldigen. Und ehe der Einwand kommt: ja, der AMD K5 war bei der reinen ALU Pro-Takt Performance noch einmal besser...

<b>Links zum Thema:</b><ul><li><a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1207000861">Planet 3DNow! Aprilscherz 2008: AMD greift beim Phenom-Nachfolger auf K6 Design-Elemente zurück</a></li></ul>

Ragas · 26.02.2010

Schön

Aber ... was soll uns das jetzt sagen ... willst du andeuten, dass AMD euren Aprilscherz doch wahr macht?!

*buck*

8)

(und warum gabs keinen Artikel zum 10. Geburtstag?!)

Nero24 · 26.02.2010

Interessieren würds mich nach wie vor

Der K6-Kern war ja winzig von der Die-Fläche her, und das schon mit 250 nm. Man shrinke den K6 auf aktuelle 45 nm, pflanze 16 davon auf ein Die (was ja angesichts der Winzigkeit kein Problem wäre), je eine aktuelle K10.5 SIMD-Einheit dazu und einen entsprechend großen shared L2-Cache...

600-650 MHz waren schon bei den 180 nm K6-2+ OClern möglich. In 45 nm könnten die Kerne als gut und gerne 1500-2000 MHz liefern; und das bei der extrem kurzen Pipeline und bei der enormen ALU-Leistung. Dazu die SIMD-Einheit des aktuellen Phenom II und - um die wirtschaftlich darstellbare Die-Fläche aufzufüllen - einen RIIIIIIIIIIIIIIIIIIIEEEEEEEEEEEEESIGEN shared L2-Cache im Stile des Core 2 Duo Penryn; natürlich in der Infrastruktur des aktuellen K10 mit integriertem Dual-Channel DDR3-1333 Memory-Controller.

Ich denke da würden einige Augen machen was da abgeht

Bob Rooney · 26.02.2010

Nero24 schrieb:
Die viel gepriesene 3DNow! SIMD-Einheit konnte ihn bei Spielen und Multimedia-Anwendungen meist auch nicht beflügeln, da die Programmierer die 3DNow! Befehle explizit hätten nutzen müssen, was bis auf ein paar halbgare Quake III Arena und LAME-Patches nie wirklich geschehen ist.

Ich glaube mich zu erinnern, daß die Patches hauptsächlich Quake II betroffen hatten, Quake III war deutlich später...
Außerdem war einer der Hauptvorteile des "Caches on the die", daß die CPUs im Gegensatz zu den jeweiligen Chipsätzen mehr als (glaub ich) 32MB cachen konnten. Da hatte doch irgendwie der ALI Aladin so seine Probleme.... lang lang ists her...

Nero24 · 26.02.2010

Bob Rooney schrieb:
Ich glaube mich zu erinnern, daß die Patches hauptsächlich Quake II betroffen hatten, Quake III war deutlich später...

Ne, für Quake III Arena gabs die Shugashack Speed DLLs

Weiß ich sicher, weil wir damals (2001-2002) unsere Mainboard-Test damit gebencht hatten.

Außerdem war einer der Hauptvorteile des "Caches on the die", daß die CPUs im Gegensatz zu den jeweiligen Chipsätzen mehr als (glaub ich) 32MB cachen konnten. Da hatte doch irgendwie der ALI Aladin so seine Probleme.... lang lang ists her...

Ganz so krass wars nicht. Die E-Revision des ALi Aladdin V konnte nur 128 MB RAM cachen. Spätere G-Revisionen dann 512 MB (mit 512 KB Cache) bzw. 4 GB (mit den seltenen 1024 KB Cache).

Der On-Die L2-Cache des K6-III dagegen war vor buggy On-Board Caches gefeit; der konnte immer die mit 32-Bit Adressen ansprechbaren vollen 4 GB RAM cachen; nicht dass es damals einen Sockel 7 Chipsatz gegeben hätte, der so viel RAM verwalten hätte können, aber egal

Damals waren RAM-Größen von 64-256 MB SDRAM PC-100 üblich.

FalconFly · 26.02.2010

Vergessen sollte man nicht, dass 3dfx damals eine spezielles 3DNow! MiniGL bereitstellte (dessen Urversion ein Teil des Quake II 3DNow! Patches war).

Damit liessen sich viele OpenGL-basierende Titel auf dem K6-2 ganz ordentlich universell beschleunigen, was aufgrund der Verbreitung der Voodoo-Karten durchaus praktisch war

[P3D] Crazy_Chris · 26.02.2010

Ich hab den K6 zu "Lebzeiten" zwar wo es nur ging gemieden aber trotzdem herzlichen Glücksstrumpf.

*party*

Stami · 26.02.2010

Ich hatte damals ein K6-III+ System mit einem Epox MVP3 G5, das mit 2MB L3 Cache.
Mehr ging fast nicht in Super7 Zeiten.

Schön wars damals...

Vor allem dieses Forum war das K6 Forum überhaupt, leider scheint das Archiv nicht mehr zu existieren.
http://www.amdzone.com/phpbb3/viewforum.php?f=4

Stami

Bugfixer · 26.02.2010

Na dann alles Gute zum Geburtstag!

Da werd ich doch zur Feier des Tages meinen alten K6-3 400 mit einer Voodoo 3 3000
anschmeissen und eine Runde 3Dnow! - befeuertes Quake spielen.
Bevor er dann als Testobjekt für einen Softwarerouter wieder arbeiten darf.
Ich weiss noch, wie ich damals auf einer LAN war und mir gegenüber ein Typ saß mit
einem nagelneuen Pentium 2 - 400 System mit 2 Voodoo2 im SLI - Verbund.
Und er in Quake 2 dank des Patches kaum schneller war als mein 333er K6-2

Als AMD - Fan muss man die kleinen Momente des Triumphs auskosten.

P.S. Das Epox MVP3 hatte ich auch mal in Kombination mit einem K6-3 450.
Das war richtig richtig schnell!! Hätte man nicht gewusst dass da ein K6 drin
ist hätte man es nicht geglaubt. Für mich stellte dieses Board zusammen mit
einem K6-3 den absoluten Gipfel der Sockel 7 - Ära dar.

Shinzon · 26.02.2010

War ein geiler Prozessor.
Habe mit meinen SS7-System auf K6-III Basis auf den LAN-Parties den Pentium-Besitzern beim Laden von Command & Conquer Tiberian Sun das Fürchten gelehrt

.

MfG

[P3D] Crazy_Chris · 26.02.2010

Bugfixer schrieb:
Als AMD - Fan muss man die kleinen Momente des Triumphs auskosten.

Anfang 2000 war ich mit meinen nagelneuen Slot A K7 500Mhz @ 800Mhz auf einer LAN und neben mir saß einer mit einem K6-2 System und hat sich übelst abgemüht da Counterstrike so schlecht lief.

Ich hatte natürlich nichtmal Ansatzweise solche Probleme und als ich ihm sagte das da in meiner Kiste auch ein AMD steckt, hat er mir das einfach nicht glauben wollen. *lol*

Erst die Anzeige in der Systemsteuerung hat ihn überzeugen können.

enct · 26.02.2010

ein system mit dem cpu hatte ich auch mal - war aber leider total langsam und der intel-konkurrenz ziemlich unterlegen. zum glück hat sich das heute geändert und der amd-fan kann auf wirklich starke hardware setzen!

Bugfixer · 26.02.2010

K6 und Counterstrike, das war so ein Thema für sich

Mit der richtigen Grafikkarte
und den richtigen Treibern vor allem lief es super, aber wehe du hattest eine 3Dfx drin
und keinen gepimpten Treiber. Der K6 war kein Leistungswunder, ebenso wie die späten
3Dfx ohne die entsprechende Softwareanpassung. Aber wenn man dann mit viel Gebastel
alles richtig eingerichtet hatte, dann lief er doch gut. Bin dann allersings auch von dem K6 -2
333 auf einen Celeron 450@525 auf einem Abit BE6 umgestiegen und später dann wieder
zurück zu AMD mit einem 750er Duron. Die K6 - Ära ist mir im Gedächtnis geblieben als
die Zeit mit dem meisten herumtweaken mit Treibern und Configs, der Celeron mit dem BE6
als eines der stabilsten und unproblematischten Systeme, das ich je hatte und die Duron - Ära
war geprägt von dem mistigen VIA - Chipsatz und Soundblaster - Problemen.
Aber als alter AMDler ist man ja leidensfähig, wobei ich finde, dass es seit dem K8 keine solchen
Probleme mehr gibt in dem Maße wie früher). (Subjektiv und gefühlsmässig)

Opteron · 26.02.2010

Nero24 schrieb:
600-650 MHz waren schon bei den 180 nm K6-2+ OClern möglich.

Das höchste was ich mal gesehen hatte waren 716 Mhz.
Interessant als Nebenbemerkung ist auch noch, dass der Kern als 0,13µm Testdesign herhalten musste. Leider kamen die aber natürlich nicht auf den Markt.

SummaSummarum muss man sagen, dass das Teil einfach eine zu schlechte FPU hatte, da hilft die beste INT Einheit nicht, wenn der DVD Film ruckelt. Und das ruckelte, selbst bei 600 MHz (hab selbst ewig daran herumgebastelt .. bei schnellen Szenen half nichts).

ciao

Alex

Tomahawk · 26.02.2010

Da werden Erinnerung wach: Einen K6-III 400 hatte ich auch. Wie damals die ganze Riege von AMD-Prozessoren (K6-2 350, K6-2 500, K5-PR133).

Aber der K6-III war zu Beginn sehr teuer, gerade im Vergleich zum günstigen K6-2.

Firewired · 26.02.2010

Um ein Haar hätte ich mir damals einen K6-III 450 gekauft, aber dann kam, für mich bissl unerwartet, der Athlon auf den Markt. Was ein Glück! Intel kam und kommt eben einfach nicht in Frage

Dann wurde es eben ein Athlon 500 auf dem SD11. Damit war dann das hart verdiente Ferienjob Geld wech *noahnung*

Twodee · 26.02.2010

Nero24 schrieb:
Interessieren würds mich nach wie vor Der K6-Kern war ja winzig von der Die-Fläche her, und das schon mit 250 nm. Man shrinke den K6 auf aktuelle 45 nm, pflanze 16 davon auf ein Die (was ja angesichts der Winzigkeit kein Problem wäre), je eine aktuelle K10.5 SIMD-Einheit dazu und einen entsprechend großen shared L2-Cache...

600-650 MHz waren schon bei den 180 nm K6-2+ OClern möglich. In 45 nm könnten die Kerne als gut und gerne 1500-2000 MHz liefern; und das bei der extrem kurzen Pipeline und bei der enormen ALU-Leistung. Dazu die SIMD-Einheit des aktuellen Phenom II und - um die wirtschaftlich darstellbare Die-Fläche aufzufüllen - einen RIIIIIIIIIIIIIIIIIIIEEEEEEEEEEEEESIGEN shared L2-Cache im Stile des Core 2 Duo Penryn; natürlich in der Infrastruktur des aktuellen K10 mit integriertem Dual-Channel DDR3-1333 Memory-Controller.

Ich denke da würden einige Augen machen was da abgeht

Wie ist denn die proMhz-INT-Leistung des K6-x verglichen mit heutigen CPUs ala i7 bzw. Phenom2 und Yorkfield?

Soweit ich mich erinnere war der K6-2+ damals in INT nicht übermäßig schneller als ein PIII, und dieser in Form eines Yorkfields dürfte proMhz gesehen heute nicht langsamer geworden sein, oder?

Nero24 · 26.02.2010

Twodee schrieb:
Wie ist denn die proMhz-INT-Leistung des K6-x verglichen mit heutigen CPUs ala i7 bzw. Phenom2 und Yorkfield?

Soweit ich mich erinnere war der K6-2+ damals in INT nicht übermäßig schneller als ein PIII, und dieser in Form eines Yorkfields dürfte proMhz gesehen heute nicht langsamer geworden sein, oder?

Das kann man so nicht verallgemeinern. Die theoretische Raw-Performance des K6-Kerns war auch im ALU-Bereich nicht überragend. Zudem hatte er nur einen 2-fach Dekoder.

Nein, der größte Vorteil des K6-III war, dass er aufgrund seiner Architektur die Funktionseinheiten praktisch mit jedem noch so popeligen Code voll auslasten konnte. Der Branch-Predictor hatte eine höhere Treffercode, als der des späteren K7, sodass die Sprungvorhersage nur selten daneben lag. Und falls doch, war der Penalty nicht groß, da keine kilometerlangen Pipelines geleert werden mussten, um mit der richtigen Branch wieder von vorne zu beginnen. Zudem machten dem K6-Kern kleine Schleifen kaum was aus, die damals noch durchaus üblich waren, um Codegröße zu sparen.
Oder anders formuliert: je unoptimierter und schlechter der Code war, desto besser war der K6-III gegenüber dem Intel Pentium II/III, sofern keine FPU-Befehle vorkamen.

Twodee · 26.02.2010

Nero24 schrieb:
Das kann man so nicht verallgemeinern. Die theoretische Raw-Performance des K6-Kerns war auch im ALU-Bereich nicht überragend. Zudem hatte er nur einen 2-fach Dekoder.

Nein, der größte Vorteil des K6-III war, dass er aufgrund seiner Architektur die Funktionseinheiten praktisch mit jedem noch so popeligen Code voll auslasten konnte. Der Branch-Predictor hatte eine höhere Treffercode, als der des späteren K7, sodass die Sprungvorhersage nur selten daneben lag. Und falls doch, war der Penalty nicht groß, da keine kilometerlangen Pipelines geleert werden mussten, um mit der richtigen Branch wieder von vorne zu beginnen. Zudem machten dem K6-Kern kleine Schleifen kaum was aus, die damals noch durchaus üblich waren, um Codegröße zu sparen.
Oder anders formuliert: je unoptimierter und schlechter der Code war, desto besser war der K6-III gegenüber dem Intel Pentium II/III, sofern keine FPU-Befehle vorkamen.

Aber eben diese Architektur =>kurze Pipeline<= verhindert doch hohe Taktfrequenzen, deswegen würde es nie eine K6 ähnliche Kopie mit 1Ghz+ geben.

Rotzlöffel · 26.02.2010

Also ich war schon sehr verliebt in meinen K6-2+. Liebe macht ja bekanntlich blind...mit jedem installierten Tweak, freigeschalteten Registern oder aktivierten Modi (write-back) kam man sich um so mehr, wie ein Maschinenflüsterer vor.

Performance hat gereicht um auf den Athlon in der Sockelvariante zu warten. Aber alles eine Frage des Standpunkts

Nero24 · 26.02.2010

Twodee schrieb:
Aber eben diese Architektur =>kurze Pipeline<= verhindert doch hohe Taktfrequenzen, deswegen würde es nie eine K6 ähnliche Kopie mit 1Ghz+ geben.

Kurze Pipelines sind schlecht für hohe Taktfrequenzen. Aber die Pipeline-Länge ist ja nicht das einzige Kriterium dafür. Ebenso spielt die Fertigungstechnik eine Rolle. Da AMD nie einen K6 mit <180 nm veröffentlicht hat, kann niemand sagen, wie hoch das Design skalieren könnte und wo heute mit 45 nm SOI die Grenzen dafür wären. Ob bei 1 GHz, bei 1,5 GHz oder bei 2 GHz - wer weiß

p4z1f1st · 26.02.2010

Ich hatte noch einen K6-2 mit 300MHz...oh Gott, war das Ding lahm gegen den Pentium2-300 eines Freundes *buck*

Twodee · 26.02.2010

Soweit mir bekannt ist hat Intel*, AMD und IBM die Pipeline verlängert trotz neuerer Fertigungstechnik

(* Den Schritt von P4 auf Core widerspricht dem zwar, ist aber zu vernachlässigen, da Core der eigentliche Nachfolger von PM/PIII war)

Nero24 · 26.02.2010

Twodee schrieb:
Soweit mir bekannt ist hat Intel*, AMD und IBM die Pipeline verlängert trotz neuerer Fertigungstechnik

Klar, sonst wären wir heute nicht bei 3 bis 3,5 GHz

Es ist halt ein Zielkonflikt und ein Abwägen, um den besten Mittelweg zu finden bei aktuell gängigem Code. Was passiert, wenn man die Pipelines zu stark verlängert um hohe Taktfrequenzen erreichen zu können, hat man ja mit dem Pentium 4 gesehen. Hohe Drehzahl, aber kein Umpf dahinter

sofern er nicht hochoptimierten Code vorgesetzt bekam, der dafür sorgte, dass um Gottes Willen niemals die Pipelines geleert werden mussten aufgrund von mispredicted Branches oder sonst was.

Am besten wären natürlich kurze Pipelines UND hohe Taktbarkeit, aber das ist halt ein Zielkonflikt wie bei so vielem. Ganz sicher würde ein K6-III in 45 nm aber nicht bei 600 MHz festklemmen.

Crashtest · 26.02.2010

tja mein K6-III 500 liegt in meiner Prozi-Kiste neben :
K6-200
K6-2-450
2 Dualcore Opterons 2216
2 Dualcore Opterons 2222
nem Quadcore 2382
nem Quadcore 8380

ach und alle Prozis gehen noch !!!!

nur für die SS7 CPUs habsch derzeit kein Board (RAM, NT, usw wären noch da ) *lol*

News AMD K6-III Prozessor wird 11 Jahre alt

Administrator

Grand Admiral Special

Administrator

Fleet Captain Special

Administrator

Admiral Special

Grand Admiral Special

Vice Admiral Special

Vice Admiral Special

Vice Admiral Special

Grand Admiral Special

Cadet

Vice Admiral Special

Redaktion☆☆☆☆☆☆

Admiral Special

Admiral Special

Lord of the Stats, Special, ,

Administrator

Lord of the Stats, Special, ,

Commodore Special

Administrator

Grand Admiral Special

Lord of the Stats, Special, ,

Administrator

Redaktion☆☆☆☆☆☆

Ähnliche Themen

Redaktion
☆☆☆☆☆☆

Redaktion
☆☆☆☆☆☆