PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Wie bekomme ich die aufgeklebten Kükos ab?


Fruchtnektar
07.01.2004, 20:35
Naja es steht schon oben. Habe hier einige Pentiums die ich gerne ansehnlich in meiner Sammlung platzieren möchte.

Leider sind auf denen diese hässlichen Kükos drauf festgeklebt. Meine Frage: Wie bekomme ich diese Teile da runter ohne die CPU oder das Package zu beschädigen? Ich habe es schon mt einem Fön versucht die Kükos warm zu machen in der Hoffnung das der Kleber weich wird aber Fehlanzeige.

Ich habe also keine Ahnung mehr. Habt ihr noch irgendeinen Tipp? Oder gibt es dafür sogar spezial-Werkzeug?

Bob Rooney
07.01.2004, 21:17
ab damit in die Tiefkühltruhe.

Wenn der Prozzi schön kalt ist, läßt sich ein Kühlkörper relativ einfach abziehen. Und schön eine Plastiktüte drumrum machen, daß sich kein Kondenswasser am Prozzi bildet.

Gruß Bob Rooney

Fruchtnektar
08.01.2004, 10:13
Jooo, danke werde ich gleich mal ausprobieren.

Fruchtnektar
08.01.2004, 12:35
Einen von drei hab ich mit der Methode abbekommen, aber die anderen weigern sich weiterhin... Hat noch jemand einen Vorschlag?

i_hasser
08.01.2004, 12:43
Wenn du ihn tiefgekühlt hast versuch mal den Kükö mit nem Messer abzuhebeln. Was für Pendulums sinds denn? 1/MMX/Pro?

Fruchtnektar
08.01.2004, 12:45
P1 sind es.... die ohne Gold Cap also kerniges Keramik :D

Habe sie noch mal in die Wüste Gobi geschickt in der Hoffnung das die Kükos explodieren wie die Kokosnuss gestern beim Raab in der Mikrowelle wo er sich richtig bei erschreckt hat :)

i_hasser
08.01.2004, 12:56
Früher war der garnet mal schlecht, aber inzwischen schau ich den auch net mehr.

Die Goldcaps gabs ja nur bei den Socket4 Pendulums. Auch komisch, Intel hat die abgeschafft und AMD hat sie eingeführt (der 5k86 für Socket5 hatte noch keine, der K5 hatte sie).


Manchmal tuts auch ein kleines Hämmerchen (betonung liegt auf KLEIN - also nix mit dem 2kg Benno ;)) - sanfte Gewalt eben ;)

Fruchtnektar
08.01.2004, 12:59
Es gibt auch Sockel 7 Pendulums (wie du so schön zu sagen pflegst) mit Gold Cap. Gibt nicht viele davon weil die größtenteils an Intel zurückgeschickt worden sind, da die größtenteils den Pentium-Bugs aufwiesen. Habe einen Pentium 75 mit GoldCap Sockel 7 (genaugenommen Sockel 5 sind ja meschanisch aber gleich)

i_hasser
08.01.2004, 15:24
Wusst ich noch net - hab mit den alten Pendulums (;)) nicht so viel zu tun gehabt.

Mir ist Socket5 aber lieber - eine Socket7 CPU läuft nicht in einem Socket5 Board, weil es unter den 3.5V für den Socket7 ja erst bei 2.8V weitergeht -> bruzel bruzel (was mich noch nicht davon abgehalten hat 2 PMMX in mein Dual-Socket5 zu stecken *chatt*).


Ist ja aber auch egal, bei den P1 weis mans ja - was mich immer stört ist, wenn bei Ebay vollmündung von einem Socket7 DualBoard gesprochen wird - den P1 gabs zwar auch mit 166MHz, aber die Socket5 Dualos schaffen meißt nicht über P1-100.

Fruchtnektar
08.01.2004, 15:57
Habe mich in letzer Zeit ein bischen mehr mit den Prozzis auseinandergesetzt dehalb muss ich dich korrigieren: ;) der größte Sockel 5 Prozzi ist der 133MHz. Den gibbet auch noch mit verheizenden V. Diese Teile waren der Burner (im wahrsten Sinne des Wortes).

Ich erstelle gerade eine Liste mit den technischen Merkmalen der x86er vom Pentium 1 an (P-60 im Sockel 4). Da habe ich dann auch den ein oder anderen Exot dabei wie den C6 von Winchip oder den NexGen (war der x86 Kompatibel?) und den Media GX von Cyrix.

Stimmt bei E-Gay versuchen die immer einen zu verschaukeln. Dann heißt es da Pentium II Server Version und dabei handelt es sich dann um einen Desktop PII mit ECC Cache (war gar nicht so selten auch in Desktops drin, weil kaum teurer) und nicht wie man denkt um einen PII-Xeon.

i_hasser
08.01.2004, 16:49
Stimmt, das andere sind alles PMMX (hab 4 P1 und 2 P1MMX - da kommt man schon leicht durcheinander ;)).

Ich nehm die P1/MMX auch praktisch nie, daher steh ich da nicht so drinnen. Wenn irgendwas mit Socket5 ist greif ich immer zum K5 - eine schnellere Socket5 CPU gibts net 8)

Der K5 mit 116MHz zersägt auf einem EDO Board locker den P1 mit 133MHz. Wenn mein Bench fertig ist wird da gebencht was das Zeug hält, dann reiß ich auch mal das EDO Board aus meinem Router raus (bei SDRam ist der P1 nämlich wieder schneller).

i_hasser
08.01.2004, 16:52
PS Ich muss dich leider doch enttäuschen - http://www.cpu-museum.de/?m=Intel&f=Pentium-S+%2F+P54C

Der P54C war der Socket5 P1, und den gibts sogar mit 200MHz und bei 166MHz ist er noch im normalen Keramik Package zu haben.



Bei gleicher Taktrate ist der K5 aber trotzdem schneller ;)

Fruchtnektar
08.01.2004, 16:53
Hab auch nen X5 und ein EISA Board (War doch Isa mit nem ungedrehten PCI dahinter?). Das Board leider zu Hause und den X5 hier.... wieviel MHz hat den der X5? Habe den AMx586 P75 ADW-133. Was hat der nu? 133MHz oder 75?

Fruchtnektar
08.01.2004, 16:58
Original geschrieben von intel_hasser
PS Ich muss dich leider doch enttäuschen - http://www.cpu-museum.de/?m=Intel&f=Pentium-S+%2F+P54C

Der P54C war der Socket5 P1, und den gibts sogar mit 200MHz und bei 166MHz ist er noch im normalen Keramik Package zu haben.



Bei gleicher Taktrate ist der K5 aber trotzdem schneller ;)

Man weiß es noch nicht genau. hier steht nur bis 166MHz(Overdrive)und 133MHz (kein Overdrive) daruaf stütze ich mich ;D

http://sandpile.org/impl/p54.htm

i_hasser
08.01.2004, 17:13
Der X5 ist ja wieder ein anderer Prozz.

X5 (5x86): Hochgezüchteter 486er, Architekturbedingt braucht der deutlich mehr Taktrate als ein 586er, der 160MHz X5 kommt gerade so auf einen Pentium1-100MHz.

K5 (5k86): Technologisch extrem fortschrittlicher 586er (schon mit RISC Kern, 6 Stufige Pipeline) - besaß ein Rating, das aber leicht überzogen war. Einen gleichgetakteten P1 zersägt er trotzdem ;D
Der K5 ist der modernste 586er den es gibt.

Fruchtnektar
08.01.2004, 17:17
Der X5 ist doch "Quadpumped" oder wie das früher auch hieß oder?

K5 PR75+
K5 PR90+
K5 PR100+
K5 PR120+
K5 PR133+
K5 PR150+
K5 PR166+
K5 PR200+

Das sind die K5 die ich in meiner Liste habe...... der 200er burnt dann richtig....
Wie sieht es mit FPU aus.... Integer ist der K5 bestimmt schneller als der P1 aber FPU?

i_hasser
08.01.2004, 18:16
Naja, die FPU hält sich recht wacker ist aber nicht wirklich schnell.

Integermäßig zersägt ein 133MHz K5 einen 166MHz P1-MMX (wenn ich die Werte richtig im Kopf hab).
(Dabei war der PMMX nochmal ein völliges Redesign und da werkelte auch ein RISC Kern, wohingegen der P1 noch einen CISC Kern hatte)

Nur wird bei den alten Spielen etc. eben die FPU so gut wie garnet gebraucht, weil viele Sachen so optimiert sind, dass sie ohne FPU auskommen oder es sind wirklich nur wenige Operationen.
Die FPU Geschwindigkeit hat sich nämlich überproportional zur Integer-Leistung gesteigert. Die ALU meines Athlons ist glaub ich ca. 30mal so schnell wie mein 386er, die FPU ist 45mal so schnell.
Beim X5 sind die Werte noch ziemlich gleich. Meinen 386er hab ich aber auch schon eine sehr gute FPU spendiert - zb. die Intel 387 waren deutlich langsamer.



Was meinst du mit Quadpumped? Der interne Multiplikator ist je nach Modell 3 oder 4 (der 150MHz X5 hat einen Multi von 3, 133 und 166MHz haben 4).

Der K5-PR200 war sehr selten und wurde von AMD nie ofiziell vorgestellt. Der PR200 läuft glaub ich auf 133MHz, der PR166 auf 116MHz und der PR133 auf 100MHz.
Die ALU vom K5 ist übrigens genauso effizient wie die der Alphas zu dieser Zeit ;D
4 Integeroperationen auf einmal passen da durch.

Bob Rooney
08.01.2004, 18:33
@Fruchtnektar
Also die Prozzis mit der fehlerhaften Gleitkommaarithmetik war der Sockel 4 Pentium, sprich 60/66 Mhz.
Mein getauschter P60 (ist eigentlich ein P66) hat ein Keramikgehäuse, kein Gold Cap.

Der Sockel 5 reichte nach meiner Erinnerung bis zum normalen P200 (ohne MMX), danach kam Sockel 7 (die MMX Pentiums). Sockel 6 war ja der Megaflop Pentium Pro.

Gruß Bob Rooney

i_hasser
08.01.2004, 18:54
??????


Der PPro war doch kein Megaflop, wer hat dir denn das eingeflößt?

Natürlich war die CPU nicht für den Heimanwender gedacht, und desswegen dürfte der sich da auch nicht sonderlich durchgesetzt haben. Aber es gibt noch genug Quadserver mit PPro, bei Ebay kosten die Dinger heute noch 700€ (ja, ein Quad-PPro mit je 200MHz).

In Firmen lief dann natürlich auch ordentliche Software, so dass die 16bit Schwäche vom PPro da nicht zum Tragen kam - den Heimanwender hat das sicherlich deutlich mehr gestört. Rückblickend war der PPro sogar ein verdammt gutes Design - selber der heutige P4 basiert noch wesentlich auf dem PPro. Der P2 war dem PPro sogar zu 100% identisch, abgesehen von einer verbesserten 16bit Fähigkeit und nun externem Cache (dadurch billiger).

Bob Rooney
08.01.2004, 19:15
Der Pentium-Pro war ein Flop, weil die Ausbeute sehr gering war (damals hatte Intel Probleme wegen dem integrierten L2-Cache. Da dieser oft fehlerhaft war, gabs auch ne Menge Ausschuß, damit verbunden sehr niedrige Stückzahlen und dadurch extrem hohe Verkaufspreise. Heutzutage würde man wohl wahrscheinlich den halben L2-Cache deaktivieren ;-)

Deshalb sind die Teile bei Ebay noch so viel Wert, nicht (unbedingt) wegen der Leistung, da ist jede heute verkaufte CPU samt Umfeld besser

i_hasser
08.01.2004, 19:19
Den PPro gabs mit 256kb, 512kb und 1mb L2 Cache - da wurde anscheinend schon deaktiviert ;)

Die 1mb Modelle sind auch einzeln Gold Wert. Die 256kb/512kb CPUs sieht man recht häufig. Der Quad-Server hatte übrigens 1mb CPUs ;)

Ein Flop waren die Dinger trotzdem net - oder eben nur Verkaufsmäßig. Aber dann war der Cyrix M1 und M2 nach deiner definition kein Flop, die Dinger wurden nur zu oft verkauft.

Fruchtnektar
08.01.2004, 19:19
Eine Korrektur: Der Sockel vom PPro war der Sockel 8 nicht 6.

Intel hat im Grunde schon eine Selektion betrieben. Es gibt folgende PPros:

Pentium Pro 133 Mhz 8 Kb Data/8 Kb Code 256Kb on Die
Pentium Pro 150 Mhz 8 Kb Data/8 Kb Code 256Kb on Die
Pentium Pro 166 Mhz 8 Kb Data/8 Kb Code 256Kb on Die
Pentium Pro 166 Mhz 8 Kb Data/8 Kb Code 512 Kb on Die
Pentium Pro 180 Mhz 8 Kb Data/8 Kb Code 256Kb on Die
Pentium Pro 200 Mhz 8 Kb Data/8 Kb Code 256Kb on Die
Pentium Pro 200 Mhz 8 Kb Data/8 Kb Code 512 Kb on Die
Pentium Pro 200 Mhz 8 Kb Data/8 Kb Code 1024 Kb on Die

Daran sieht man das Intel wahrscheinlcih doch eine Aussonderung veranlasst hat. 512 die Kaputt waren als 256 verkauft.

Nur die 1MB Teile wurde auch als 1MB verkauft und nicht drunter. Das spricht auch für das spezielle Package, das nur beim PPro 200/1MB zum tragen kann.

Fruchtnektar
08.01.2004, 19:23
@Bob

Was du zum P-Bug sagst stimmt nicht. Es waren nicht nur P60/66 im Sockel 4 betroffen sondern auch Prozzis mit Sockel 5 in diesem Fall ab P75-100MHz.
Ich meine deshalb sind das auch nur Sockel 5 Prozzis..... ich schau noch mal bei Intel jetzt mal vorbei.

150MHz hatte einen neuen Chipsatz nötig, den TX und vorher war der FX. Der HX hatte nur Multi bis 2 vorgesehen. Also 2*66,6MHz=133,3MHz.

Kann auch falsch sein, zumindest meine ich das in den Whitepapers von Intel gelesen zu haben.

586IFM
08.01.2004, 19:25
Also laut diversen damals aktuellen Benchmark konnten damals die AMD K5 PR100 und AMD K5 PR133 den iP100 bzw. iP133 nicht das Wasser reichen. Insbesondere im FPU-Bereich waren die Dinger eine Katastrophe.

Ich habe übrigens privat mit dem AMD 5K86-100 am 30.08.1996 begonnen. Der hat am 28.08.1996 bei MintDATA satte 171 DM gekostet. Und lief natürlich zuerst auf einem Chaintech (aufgepast) 586IFM ! ;-). Das Board hat damals 281 DM gekostet. Ein Am 5x86 PR75 (mit 133 MHz) hat übrigens zum gleichen Zeitpunkt 70 DM gekostet. Und ein AMD K5-PR133 hat am 28.02.1997 bei HWE 175 DM gekostet.

Bitterarme Leute heben halt alle Rechnungen gut auf ;-). Aber auch alle Benchmarks ! Also nicht streiten. Ich habe hier mehrere MByte Text-Dateien mit Benchmurksergebnissen ab Ende 1995.

i_hasser
08.01.2004, 19:31
Tja, schon süß die PPros. Die wohl einzige Intel CPU die mir wirklich gut gefällt ;)

Ein PPro mit 200MHz macht auch einen P2 mit 200MHz platt. Der Socket6 sollte ein aufgebohrter 486er Socket (glaub sogar mit 64bit Datenbus) werden, daraus ist aber nix geworden und der Socket wurde die öffentlich vorgestellt. Dann kam der Socket7 und da waren 486er längst (Leistungsmäßig) Geschichte. Selbst mein guter X5 müsste wohl so um die 400MHz haben, um mit einem K5-PR200 mitzuhalten (der gerade mal auf 166MHz lief).

Ein großes Manko der 486er war eben auch der 32bit Datenbus - bei gleichem FSB kann ein 586er doppelt so viele Daten durch die Leitung schaufeln. Und mit EDO Ram dazu macht das eben schonmal 160mb/s, wohingegen mein X5 für einen 486er hervorragende 45mb/s schafft :P (auch EDO Ram auf schärfsten Timings)
Ok, der FSB war nur auf 40MHz - aber 66/40*45mb/s macht eben trotzdem nur 74.25mb/s.

Am schönsten sind da die Socket5 Dualboards - da hat jede CPU ihren eigenen Speicher. Und so schaffen die beiden P90 auf meinem Dualo zusammen knappe 320mb/s, da kommt manches alte SDRam Board nicht hinterher ;D (und das war nur 60ns PS/2 Ram)

i_hasser
08.01.2004, 19:33
@586

Der 5k86 besaß einen etwas anderen Kern als der K5, auch den K5 gabs mit verschiedenen Kernen.

Und du kannst mir glauben - bei der Integer Leistung zersägt der K5 (letzes Design) einen gleichgetakteten P1 locker ;)

586IFM
08.01.2004, 19:34
Original geschrieben von Fruchtnektar
@Bob
Was du zum P-Bug sagst stimmt nicht. Es waren nicht nur P60/66 im Sockel 4 betroffen sondern auch Prozzis mit Sockel 5 in diesem Fall ab P75-133MHz.
Ich meine deshalb sind das auch nur Sockel 5 Prozzis..... ich schau noch mal bei Intel jetzt mal vorbei.
150MHz hatte einen neuen Chipsatz nötig, den TX und vorher war der FX. Der HX hatte nur Multi bis 2 vorgesehen. Also 2*66,6MHz=133,3MHz.
Kann auch falsch sein, zumindest meine ich das in den Whitepapers von Intel gelesen zu haben.

1. Von dem Bug waren iP60/66/75 und 90 betroffen.
2. Der FX-Chipsatz unterstützte iCPU bis zum iP120.
3. Der HX-Chipsatz unterstützte iCPU bis zum iP233 MMX, genauso der VX-Chipsatz.
4. Der TX-Chipsatz unterstützte iCPU bis zum iP266 MMX, mehr gab es ja auch nicht, wobei es den iP266 MMX ja bloß in der Notebookversion gab.

Vielleicht sollte man doch mal einen Blick ins ct-Magazin werfen oder die brandaktuelle heise-ct-Archiv-DVD kaufen ?

Fruchtnektar
08.01.2004, 19:40
Hast deinen armen Rechner wieder mit der DVD gequält ;)

i_hasser
08.01.2004, 19:40
http://home.arcor.de/intelhasser2/486bench/tab1.html

Hier ist mal der Link auf die Ergebnissliste von meinem Benchmark (an dem ich auch fleißig weiterprogge).


Die Ergebnisse sind nicht so ganz repräsentativ, weil die CPUs alle mit SDRam befeuert wurden und auf dem Board 512kb L2 Cache gesessen haben. Aber ich denke das benachteiligt eher den K5 als den P1, der K5 hat nämlich effektiv 34kb (!) L1 Cache, der P1 hat magere 16kb.
Da hilft der zusätzliche L2 (bei Socket5 waren es meißt nur 256kb und net 512) und die zusätzliche Speicherbandbreite (die Latzenzzeitunterschiede sind ja bei Edo/SdRam gigantisch) eher dem P1 als dem K5.

So, hier mal die Integer-Ergebnisse:


K5 116MHz (PR166) 19.65
K5 133MHz (PR200*) 22.12
P1 133MHz 17.53
P1 MMX 166MHz 20.33

* - wurde vom Bios so erkannt, lief aber auf 133MHz


Wie du siehst wird selbst der P1-MMX mit 166MHz vom 133MHz K5 verdroschen ;D
Die Randbedingungen waren immer gleich, selbes Board etc.


Die aktuelle Beta vom Bench spuckt viel detailliertere Ergebnisse aus, aber ist eben noch Beta (steht zum Download, aber da wird sich noch was ändern).

586IFM
08.01.2004, 19:45
Original geschrieben von intel_hasser
@586
Der 5k86 besaß einen etwas anderen Kern als der K5, auch den K5 gabs mit verschiedenen Kernen. Und du kannst mir glauben - bei der Integer Leistung zersägt der K5 (letzes Design) einen gleichgetakteten P1 locker ;)

Wie anhand meiner Ausführungen ersichtlich, besaß ich sowohl den 5k86, wie auch den K5.
Und war heilfroh, als ich die lahmen Scheißdinger endlich los war. Als Ersatz rückten übrigens ein iP200 (läuft heute noch auf dem 586IFM) und ein AMD K6-233 an. Mein erster
AMD 5k86-100 war übrigens per Fertigung defekt und wurde anstandlos umgetauscht.

Die Bechmurks liefen übrigens bei mir daheim auf Chaintech 586IFM, ASUS XP55T2P4 Rev 3.x und ASUS P55T2P4 Rev 3.1 - alles auch noch heute bei mir in Betrieb. Zum Vergleich habe ich u.a. auch HP VL133 und Scenic Pro D5 166 MMX herangezogen.

Und Benchmarkzweiflern empfehle ich mal einen Blick in die Benchvgl.dat vom 22.05.1997 der DHRARD-Version D3.70. Und wer dann noch immer zweifelt und alles besser weiß, der sollte mal einen Blick in die Datei CONFIG.VGL vom 05.08.1997 des Programms PC-CONFIG Version 8.45 werfen. U.a. auch von diesen Progrämmchen besitze ich lizensierte Versionen.

i_hasser
08.01.2004, 19:50
Tja, die FPU vom K5 war wirklich nicht die Beste, aber mal von Spielen und wissenschaftlichem Klimbims abgesehen wird die auch so gut wie garnet gebraucht.

Den K5 gabs wie schon gesagt auch mit verschiedenen Kernen. Vom 5k86 mal ganz abgesehen.

Die CPU war ein sehr gute Design, nur leider viel zu komplex. Und so kam das Ding einfach net auf hohe Taktraten. Bei der FPU werd ich mal noch nachschauen obs da vielleicht Probleme mit dem Compiler gibt - die erscheint mir doch etwas arg langsam. Aber Integermäßig macht dem K5 keiner was vor. Bei langsamem Ram dürfte der K5 auch nochmal deutlich zulegen, da der eben effektiv 34kb L1 Cache hat - mehr als 2mal so viel wie der P1/MMX.

Das Speicherrating von dem Bench ist etwas schwammig, das hab ich in der aktuellen Beta verbessert, aber da sind die Werte völlig anders und da mach ich erst eine Tabelle wenn das Release draußen ist.

i_hasser
08.01.2004, 20:06
Ach ja, ist dir eigentlich aufgefallen, dass ich die CPUs mit gleicher Taktrate verglichen hab? Dass das PR Rating übertrieben war dürfte jeder einsehen, der PR133 hat keinen P1-133 geschafft.

Aber ein K5 133MHz hat einen P1-133 im Bereich Integer schon zersägt.

586IFM
08.01.2004, 20:06
Original geschrieben von intel_hasser
Tja, die FPU vom K5 war wirklich nicht die Beste, aber mal von Spielen ... abgesehen wird die auch so gut wie garnet gebraucht.

:-). Was glaubst Du wohl, wo das 586IFM nach wenigen NT-Testwochen stand und mit Dualboot unter MSDOS und W95 lief ? Bei meiner Tochter als Spiele-Möhre ! Während sich der Vater an zwei PC mit 5x86 ergötzen durfte :-(. Und als mein PT2066.7 dann mit 4x40 MHz lief, bekamen wir einen richtigen Schreck: der lieferte mehr Power als der 5k86-100 !!! Ich schob die Schuld auf das Chaintech 586IFM und holte mir das ASUS XP55T2P4. Aber auch das kam mit dem 5K86-100 nicht aus der Hüfte. Also kaufte ich einen AMD K5-PR133 wegen diversen Lobeshymnen schon damals. Und mein Gesicht wurde noch länger :-(((. Mein Tochter knurrte nur noch. So holte ich mir dann am 15.05.1997 den iP200 bei BUG für satte 560 DM und verkaufte den 5k86-100. Alles war erst zufrieden, als dann auch der sehr gute K6-233 bei uns lief.

Fruchtnektar
08.01.2004, 20:06
Hier ist ne schöne Liste mit verschieden Sockeln.

Demnach ist Sockel 5 nur bis P133MHz geeignet. Alles andere danach hat auch gepasst, nur halt Sockel 7:

http://www.elektronik-kompendium.de/sites/com/0403301.htm

586IFM
08.01.2004, 20:12
Original geschrieben von intel_hasser
Ach ja, ist dir eigentlich aufgefallen, dass ich die CPUs mit gleicher Taktrate verglichen hab? Dass das PR Rating übertrieben war dürfte jeder einsehen, der PR133 hat keinen P1-133 geschafft. Aber ein K5 133MHz hat einen P1-133 im Bereich Integer schon zersägt.

Mein K5-PR133 lief mit 116 MHz. Der K5-PR166 lief wohl mit 128 MHz oder ähnlich. Der 5K86-100 lief wiederum mit echten 100 MHz. Die absolute AMD-Katastrophe war aber der AMD 5K86-75. Wenn der in einem Billig-Board mit Trident-Grafikkarte war, dann bin ich gleich wieder abgehauen - ohne die Möhre nochmals anzufassen. Der konnte unter solchen Bedingungen dem 5x86-PR75 in einem guten 486er Board nicht mal die Klobürste reichen :-(.

586IFM
08.01.2004, 20:15
Original geschrieben von Fruchtnektar
Hier ist ne schöne Liste mit verschieden Sockeln.
Demnach ist Sockel 5 nur bis P133MHz geeignet. Alles andere danach hat auch gepasst, nur halt Sockel 7:
http://www.elektronik-kompendium.de/sites/com/0403301.htm

Höflich formuliert " eine stark vereinfachte Darstellung" ;-).

i_hasser
08.01.2004, 20:20
Der PR133 lief mit glatten 100MHz, der PR166 lief mit einem internen Multi von 1.75 und hatte daher 116.6MHz ;)

Wie gesagt, da hat sich vieles am Kern getan - und der K5 mit 100MHz ist eben auch deutlich schneller als der 5k86 mit 100MHz.
Abgesehen davon ist der K5 Architekturmäßig trotzdem der modernste 586er den es gibt. Und die IPC ist auch verdammt gut.


Am Sonntag gibts vielleicht das Release von meinem Bench, der bietet so viele Detailwerte, dass man problemlos genau rausbekommt wo der Schuh drückt. Die Ergebnisse der alten Version belegen aber schon zweifelsohne, dass der K5 bei der reinen Integer Leistung jedem gleichgetakteten P1/MMX überlegen ist. Das die FPU langsam ist bestreite ich doch garnet, und das spiegeln die Benchergebnisse in der Benchliste auch nur zu deutlich wieder. Daher ist der K5 als Spiele-CPU untauglich (verglichen mit dem P1/MMX). Aber für zb. Texte schreiben um so geeigneter.

Ich glaub ich werf gleich den K5 an (und auch die P1/MMX) und schreibe hier mal alle Ergebnisse der Beta Version vom Bench hin, damit auch du mir glaubst ;)
Da interessieren mich selbst auch die Ergebnisse.

i_hasser
08.01.2004, 20:23
Die Liste ist etwas geschlampt.

Der K5 war ein reinrassiger Socket5 Prozz, genauso der IDT Winchip und der Cyrix M1.

Einen 586er für den Socket7 gabs von AMD nie.

Fruchtnektar
08.01.2004, 20:30
Original geschrieben von 586IFM
Höflich formuliert " eine stark vereinfachte Darstellung" ;-).

Hast ja recht aber sowas wie hier ist nciht für die Allgemeinheit vertretber:
http://www.hardware-bastelkiste.de/cpu_586.html

Fruchtnektar
08.01.2004, 20:39
Das habe ich gar nicht gelesen ;) :o (gemein da löscht er es einfach ;))

Habe mir nur die technischen Unterschiede in der Pinbelegung reingezogen..... Jaja ich muss besser lesen... Aber guck du mal Resident Evil und suche dabei nach Unterschieden zwischen Sockel 5 und 7.... naja ich werde in Zukunft besser lesen 8) *buck*

586IFM
08.01.2004, 20:47
Original geschrieben von Fruchtnektar
Das habe ich gar nicht gelesen ;) :o

Die meinten das anders, ist mir gerade aufgefallen:-( Ist aber auch falsch. Der Am5x86 kam erst mehrere Jahre nach den P60/66 auf den Markt. Gegner der iP60/66 waren die 486DX4-100 und da war AMD rechtzeitig da, zuerst mit dem Am4DX2-80. Und der echte iP66-Totengräber kam dann mit dem Am486DX120 ! Dazu kam das Chipsatzdilemma beim iP60/66.
Wer noch alte Ausgaben der PC Direkt hat, kann das wunderschon bei den Gerätevorstellungen nachlesen und nachvollziehen.

Die Diskussionen S5/S7 entstehen bei vielen Leuten wegen der BFO, BF1 und BF2-Jumper. Erst HX und VX brachten nämlich den BF2 mit. Boards mit FX-Chipsatz und Co hatten keinen BF2-Jumper.

586IFM
08.01.2004, 21:14
Original geschrieben von intel_hasser
Der PR133 lief mit glatten 100MHz, der PR166 lief mit einem internen Multi von 1.75 und hatte daher 116.6MHz ;)
Wie gesagt, da hat sich vieles am Kern getan - und der K5 mit 100MHz ist eben auch deutlich schneller als der 5k86 mit 100MHz.
Abgesehen davon ist der K5 Architekturmäßig trotzdem der modernste 586er den es gibt. Und die IPC ist auch verdammt gut. Da interessieren mich selbst auch die Ergebnisse.

Wie wäre es damit:

PC-Beschreibung RAM-DTR(MB/s) Hard- Soft- VidRam(MB/s) HD (KB/s)
max. min. stones stones TXT/Grfk. Zugriff DTR
==============================================================================
Dieser PC ³ 195.5 54.3 75794 24512 29.5/45.9 17.5 3606.7
Pentium Pro-200, SCSI ³ 325.8 184.4 107877 44388 19.0/84.5 16.2 3143.5
Pentium Pro-180, EIDE ³ 287.5 160.2 92893 40280 34.3/55.5 21.8 4455.3
AMD-K6-200, SCSI ³ 977.4 407.2 240491 63335 19.2/53.6 15.4 4133.9
Pentium MMX-225, SCSI ³1221.7 186.2 233025 89040 19.6/86.0 14.9 4133.9
Pentium MMX-200, SCSI ³ 977.4 160.2 195280 64528 59.7/87.6 16.2 3787.0
Pentium MMX-166, SCSI ³ 698.1 136.7 160585 53928 39.1/86.8 16.7 3787.0
Pentium-200 ³ 977.4 58.5 152928 62938 23.5/43.6 17.0 3155.8
Pentium-166 ³ 698.1 53.3 126052 50482 23.5/43.6 17.1 3155.8
Pentium-133,PBurst,SCSI³ 543.0 53.3 104384 42400 30.0/20.8 14.5 7360.4
Pentium-120,PBurst ³ 488.7 50.5 92321 38955 11.1/20.1 18.4 3254.5
Pentium-100,PBurst,EIDE³ 375.9 51.2 73634 32198 34.1/55.5 22.3 1942.1
Pentium-90, PCI ³ 287.5 27.6 66258 27428 8.5/ 8.6 17.3 2164.0
Pentium-75, PCI, EIDE ³ 244.3 28.5 57937 22525 30.6/46.1 18.0 1165.2
Pentium-60, PCI,SCSI ³ 212.5 22.6 46284 18020 12.0/11.9 22.9 2930.4
Pentium-60, PCI,o.Cache³ 203.6 17.9 43321 17490 11.9/11.9 23.4 2930.4
IBM 6x86-133 (P-166+) ³ 543.0 191.6 176752 37232 27.6/84.5 17.5 3442.7
CX6x86-133 (P-166) ³ 543.0 232.7 176771 41472 23.5/43.6 17.0 3155.8
CX6x86-120 (P-150) ³ 488.7 183.0 159056 33390 27.3/41.1 20.6 2705.0
AMD K5-100, SCSI,PBurst³ 195.5 34.5 88506 27428 35.4/44.0 22.7 3787.0
AMD K5-75, EIDE, SCSI ³ 135.7 21.0 57390 17225 26.2/32.6 21.0 2805.2
CX5x86-100, PCI, EIDE ³ 99.7 58.4 47808 24248 11.6/42.0 25.3 946.7
AM5x86-160, PCI ³ 212.5 83.2 80629 28222 30.2/38.6 14.9 2805.2
AM5x86-133, VLB ³ 168.5 62.7 62642 22922 10.7/11.0 22.7 2184.8
DX4-120 ³ 53.1 23.5 44617 21068 29.3/35.5 22.1 1456.5
DX4-100 ³ 44.0 27.9 39349 19080 13.6/25.0 18.4 4686.4
DX4-75, EIDE, o.Cache ³ 46.1 27.2 34374 15370 9.3/12.9 23.6 1183.4
DX4-75 Overdrive o.Cche³ 46.1 25.1 30721 13118 64./ 6.3 19.3 1352.5
486dx2-80, IDE ³ 52.0 23.0 33385 14045 8.6/13.1 14.9 1402.6
486dx2-66, IDE ³ 61.9 24.3 29614 11395 3.6/ 3.6 17.3 1721.4
486dx2-50, IDE ³ 42.5 19.1 21731 8348 2.5/ 2.5 21.6 537.9
486dx-50 ³ 46.1 20.6 22879 8612 2.2/ 2.0 26.8 961.5
486dx-40 ³ 45.2 17.4 19384 7420 12.2 12.2 32.7 934.3
486dx-33, IDE, VLB-Grfk³ 29.3 14.0 15289 5830 27.3/29.1 29.4 887.6
CX486dx-100,PCI,256,IDE³ 65.2 12.0 33685 14840 14.2/14.0 19.9 1305.9
CX486dx/2-66 ³ 61.1 23.4 25746 11792 12.2/13.3 25.3 1147.6
CX486dx-50,IDE CacheCtl³ 46.5 21.9 19933 8612 3.1/ 3.1 18.4 2254.4
CX486dx-40,VLB,IDE ³ 37.3 20.7 16685 6890 32.9/38.2 23.8 1972.4
IBM486slc2-50,IDE,XGA ³ 11.7 6.4 13795 238 3.5/ 3.4 29.9 961.5
386dx-40,IDE,128K Cache³ 29.6 15.5 11508 286 6.7/ 6.9 32.9 986.2
386dx-33,IDE,NPU,64K C ³ 28.6 11.7 9403 2385 5.3/ 5.4 24.4 845.3
386dx-25, ESDI 1 GB,HGC³ 5.4 5.6 3074 57 0.8/ 0.0 24.4 996.6
386dx-16, PS/2 70 ³ 6.3 4.7 3186 88 0.7/ 0.6 37.0 467.5
386sx-25, IDE ³ 6.9 6.8 4327 72 4.4/ 4.8 29.2 901.7
386sx-20, IDE, VGA ³ 4.4 4.9 3058 54 3.0/ 3.6 61.2 498.3
286-12, ESDI 1 GB,HGC ³ 3.2 2.4 1836 58 0.8/ 0.0 24.0 1147.6
286XT-6, SCSI, Copro ³ 1.9 2.5 1281 164 0.7/ 0.0 44.9 552.8
8088-9.6,XT-Bus HD, HGC³ 0.5 0.5 544 17 0.5/ 0.0 43.6 147.0
8088-4.77,XT-Bus HD,HGC³ 0.2 0.2 276 8 0.5/ 0.0 43.6 147.0

Q.E.D. ;-).

Hier läuft soetwas :-) :

Leistung des Systems
====================
ÚÄ Eigenschaften ÄÄÄÄÄÄÄÄÄÄÄÂÄ Durchsatz(MB/s)ÄÂÄ Bench-Faktor (vs.8086) ÄÄÄ¿
³CPU : AMD K5 ³RAM max.: 195.48 ³Integerrechnung : 300.6 ³
³Takt : 99.9 MHZ ³RAM min.: 54.30 ³Zeigerverarbeitung : 286.5 ³
³Cache: 256 KB ³RAM Std.: 80.11 ³Feldzugriffe : 98.2 ³
³Div. : V86-Mode,32-Bit-Zgr ³Bus : 28.92 ³Speicherperformance : 226.2 ³
ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÁÄÄÄÄÄÄÄÄÄÄÄÄÄ ÄÄÄÄÁÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ

Und hier noch etwas zum knabbern vom 06.04.1997 17:48 Uhr ;-).
+-- Processor ---------------------------------------------------------+
¦ CPU : PENTIUM-60/66 ¦
¦ CPU Clock : 128.8 MHZ ¦
¦ Internal ID : Model:1, Step:4h (c) AuthenticAMD ¦
¦ Status L1 Cache: yes, active ¦
¦ Operating Mode : V86 Mode ¦
+-- Other -------------------------------------------------------------¦
¦ Coprocessor : internal ¦
¦ Chipset (-ID) : Intel 82430HX ¦
¦ PC Model/Board : ASUSTek P/I-P55T2P4, Pentium-166/200 
 External Cache : 256KB Pipeline Burst 
 Bus System : PCI V 2.10 

Na, was für eine CPU ist das in Wirklichkeit ?
Hinweis: falsche Initialisierung durch das BIOS. Der CPU-Fehlkauf war ziemlich neu:-(.

i_hasser
08.01.2004, 21:22
Das ist ein Bench der wirklich nur die Ram-Geschwindigkeit erfasst - was willst du mir damit sagen???

Das Stones könnte auf Whetstone und Dhrystone hinauslaufen, aber die Benchmarks sind allerhöchstens zur groben Orientierung gut, weil die sogar in den Cache meines 486SX passen :P


Also wenn man schon viel misst, sollte man wenigstens darauf achten WAS man misst. Sonst kommt unter Umständen Müll raus ;)

Die Benches laufen gerade durch - den K5 hab ich gleich fertig. Der kommt mit 386er Code übrigens deutlich besser zurrecht als mit 486er Code, wenn ich gcc auf den Pentium1 optimieren lasse kommt der selbe Code wie für'n 486er raus.

586IFM
08.01.2004, 21:31
Original geschrieben von intel_hasser
Das ist ein Bench der wirklich nur die Ram-Geschwindigkeit erfasst - was willst du mir damit sagen??? Das Stones könnte auf Whetstone und Dhrystone hinauslaufen, aber die Benchmarks sind allerhöchstens zur groben Orientierung gut, weil die sogar in den Cache meines 486SX passen :P
Also wenn man schon viel misst, sollte man wenigstens darauf achten WAS man misst. Sonst kommt unter Umständen Müll raus ;)

Wernn Du DRHARDWARE als Müll bezeichnest, ist jede weitere Diskussion leider überflüssig -meine zumindest ich. Denn nicht nur die Leute vom ct-Mag halten DRHARDWARE für weit realitatsnäher als Dutzende andere fragwürdige Programme.

-Schade-

i_hasser
08.01.2004, 21:55
So, die Benches sind fertig ;D

Folgende Einstellungen hab ich gebencht:

P1 nonMMX mit 133MHz
P1 MMX mit 166MHz (der ließ sich komischerweise net auf 133 takten, laut DRHardware und Bios waren es 166)
K5 mit 116MHz (1.75*66MHz)
K5 mit 130MHz (1.75*75MHz) - ist etwas unfair, aber anders bekomm ich den net auf ~133MHz.

Speicher (64mb SDRam) auf langsamste Einstellung (damit ähnlicher wie EDO Ram)

Jetzt gibts erstmal haufenweise Ergebnisse, die Auswertung mach ich mit dem nächsten Beitrag.



P1 nonMMX:


dhrystone 2 benchmark:

VAX rating: 117.5774 VAX MIPS

dhrystone rating: 206.5835 kilo dhrystone/s



integer mandelbrot benchmark:

calculated area (-0.300,0.450)-(0.300,1.050) every 0.015 with maxdepth of 255

result: 11.7894 it/s



integer result: 80.2173 MOPS (million operations per second)

data throughput: 291.4426 MB/s (register/cache/ram - only data)



whetstone benchmark:

result: 72.2761 MWIPS



floatpoint mandelbrot benchmark:

calculated area (-0.300,0.450)-(0.300,1.050) every 0.015 with maxdepth of 255

result: 17.7937 it/s



float result: 34.2154 MOPS (million operations per second)

data throughput: 357.9869 MB/s (register/cache/ram - only data)



memory bandwith benchmark:



measurement 1

blksize int32 read int32 write int64 read int64 write float64 read float64 write

1 kB 794.2 MB/s 445.5 MB/s 484.9 MB/s 332.8 MB/s 645.6 MB/s 318.5 MB/s

4 kB 825.3 MB/s 564.1 MB/s 497.3 MB/s 403.4 MB/s 745.2 MB/s 382.0 MB/s

8 kB 718.5 MB/s 284.2 MB/s 458.9 MB/s 238.6 MB/s 637.3 MB/s 236.2 MB/s

16 kB 200.3 MB/s 130.1 MB/s 169.0 MB/s 125.3 MB/s 196.9 MB/s 123.7 MB/s

24 kB 200.5 MB/s 110.6 MB/s 169.2 MB/s 108.4 MB/s 197.4 MB/s 107.5 MB/s

32 kB 200.5 MB/s 103.2 MB/s 169.2 MB/s 101.4 MB/s 197.6 MB/s 100.7 MB/s

48 kB 200.8 MB/s 96.1 MB/s 169.5 MB/s 95.3 MB/s 198.1 MB/s 95.1 MB/s

64 kB 200.7 MB/s 93.0 MB/s 169.4 MB/s 92.2 MB/s 198.0 MB/s 92.2 MB/s

96 kB 200.9 MB/s 90.2 MB/s 169.6 MB/s 89.7 MB/s 198.3 MB/s 89.6 MB/s

128 kB 200.7 MB/s 88.7 MB/s 169.4 MB/s 88.3 MB/s 198.2 MB/s 88.2 MB/s

192 kB 201.4 MB/s 87.7 MB/s 170.1 MB/s 87.4 MB/s 199.0 MB/s 87.4 MB/s

256 kB 200.0 MB/s 86.6 MB/s 169.0 MB/s 86.4 MB/s 197.7 MB/s 86.4 MB/s

384 kB 199.1 MB/s 86.0 MB/s 168.5 MB/s 85.9 MB/s 197.0 MB/s 85.9 MB/s

512 kB 198.0 MB/s 85.4 MB/s 167.7 MB/s 85.2 MB/s 196.0 MB/s 85.3 MB/s

768 kB 157.4 MB/s 86.4 MB/s 137.9 MB/s 86.3 MB/s 156.0 MB/s 86.3 MB/s

1024 kB 140.0 MB/s 84.9 MB/s 124.0 MB/s 84.8 MB/s 138.6 MB/s 84.8 MB/s

1536 kB 141.9 MB/s 86.1 MB/s 125.9 MB/s 86.0 MB/s 140.8 MB/s 86.0 MB/s

2048 kB 139.7 MB/s 84.7 MB/s 123.9 MB/s 84.6 MB/s 138.6 MB/s 84.6 MB/s

3072 kB 149.0 MB/s 90.2 MB/s 132.2 MB/s 90.1 MB/s 147.9 MB/s 90.2 MB/s

4096 kB 136.5 MB/s 84.5 MB/s 124.0 MB/s 84.5 MB/s 138.6 MB/s 84.5 MB/s



measurement 2

datasize COPY ADD SCALE TRIAD

float64 106.3 MB/s 92.8 MB/s 155.6 MB/s 107.2 MB/s

int32 110.3 MB/s 85.0 MB/s 114.1 MB/s 98.7 MB/s

int64 108.2 MB/s 83.3 MB/s 94.5 MB/s 84.6 MB/s



average speed

memory read: 242.3 MB/s

memory write: 131.7 MB/s

memory operation: 103.4 MB/s



average memory speed: 159.1 MB/s





bubble sort memory benchmark:

sorting random list with 655360 32bit entries

result: 29.6744



integer matrix benchmark:

using 14x14 32bit integer matrices

rating: 14.5659 it/s



prime filtering benchmark (M3):

searching all primes up to 20000000

primes found: 1270608

result: 0.1880 it/s



integer result: 58.2716 MOPS (million operations per second)

data throughput: 356.3879 MB/s (register/cache/ram - only data)



prime filtering benchmark (M4):

searching all primes up to 20000000

primes found: 1270606

result: 0.0630 it/s



integer result: 14.7592 MOPS (million operations per second)

data throughput: 92.8429 MB/s (register/cache/ram - only data)



prime filtering benchmark (M6):

searching all primes up to 20000000

primes found: 1270605

result: 0.1413 it/s



integer result: 59.5853 MOPS (million operations per second)

data throughput: 296.3354 MB/s (register/cache/ram - only data)



floatpoint matrix benchmark:

using 14x14 32bit integer matrices

rating: 15.2270 it/s



image operation benchmark:

image size of 1024x1024

rating: 2.8992



integer result: 15.2060 MOPS (million operations per second)

float result: 30.4001 MOPS (million operations per second)

data throughput: 243.5877 MB/s (register/cache/ram - only data)



P1 MMX 166MHz:


dhrystone 2 benchmark:

VAX rating: 157.4517 VAX MIPS

dhrystone rating: 276.6426 kilo dhrystone/s



integer mandelbrot benchmark:

calculated area (-0.300,0.450)-(0.300,1.050) every 0.015 with maxdepth of 255

result: 15.2176 it/s



integer result: 103.5433 MOPS (million operations per second)

data throughput: 376.1900 MB/s (register/cache/ram - only data)



whetstone benchmark:

result: 90.8264 MWIPS



floatpoint mandelbrot benchmark:

calculated area (-0.300,0.450)-(0.300,1.050) every 0.015 with maxdepth of 255

result: 22.2729 it/s



float result: 42.8284 MOPS (million operations per second)

data throughput: 448.1033 MB/s (register/cache/ram - only data)



memory bandwith benchmark:



measurement 1

blksize int32 read int32 write int64 read int64 write float64 read float64 write

1 kB 1094.0 MB/s 1065.6 MB/s 615.2 MB/s 608.3 MB/s 886.1 MB/s 554.5 MB/s

4 kB 1112.7 MB/s 1105.3 MB/s 621.1 MB/s 612.4 MB/s 1001.6 MB/s 594.5 MB/s

8 kB 1122.2 MB/s 1084.5 MB/s 624.0 MB/s 603.2 MB/s 1029.2 MB/s 591.7 MB/s

16 kB 996.3 MB/s 488.1 MB/s 587.1 MB/s 372.2 MB/s 893.8 MB/s 360.7 MB/s

24 kB 225.5 MB/s 190.8 MB/s 203.0 MB/s 176.4 MB/s 223.7 MB/s 171.3 MB/s

32 kB 225.5 MB/s 143.5 MB/s 203.1 MB/s 137.2 MB/s 223.8 MB/s 136.7 MB/s

48 kB 225.8 MB/s 116.8 MB/s 203.4 MB/s 114.0 MB/s 224.2 MB/s 113.8 MB/s

64 kB 225.7 MB/s 106.6 MB/s 203.2 MB/s 104.8 MB/s 224.0 MB/s 104.6 MB/s

96 kB 225.9 MB/s 98.3 MB/s 203.4 MB/s 97.1 MB/s 224.4 MB/s 97.0 MB/s

128 kB 225.7 MB/s 94.5 MB/s 203.3 MB/s 93.6 MB/s 224.2 MB/s 93.6 MB/s

192 kB 226.4 MB/s 91.4 MB/s 204.1 MB/s 90.7 MB/s 225.1 MB/s 90.7 MB/s

256 kB 223.4 MB/s 89.1 MB/s 201.6 MB/s 88.5 MB/s 222.1 MB/s 88.6 MB/s

384 kB 223.5 MB/s 87.8 MB/s 202.0 MB/s 87.4 MB/s 222.5 MB/s 87.5 MB/s

512 kB 222.3 MB/s 86.7 MB/s 201.0 MB/s 86.3 MB/s 221.2 MB/s 86.4 MB/s

768 kB 171.8 MB/s 87.3 MB/s 159.1 MB/s 87.0 MB/s 171.5 MB/s 87.1 MB/s

1024 kB 151.6 MB/s 85.5 MB/s 141.0 MB/s 85.3 MB/s 150.9 MB/s 85.4 MB/s

1536 kB 153.8 MB/s 86.5 MB/s 143.2 MB/s 86.3 MB/s 153.3 MB/s 86.4 MB/s

2048 kB 151.4 MB/s 85.0 MB/s 141.0 MB/s 84.7 MB/s 150.9 MB/s 84.9 MB/s

3072 kB 161.5 MB/s 90.4 MB/s 150.4 MB/s 90.2 MB/s 160.9 MB/s 90.3 MB/s

4096 kB 148.3 MB/s 84.7 MB/s 141.0 MB/s 84.5 MB/s 150.9 MB/s 84.6 MB/s



measurement 2

datasize COPY ADD SCALE TRIAD

float64 115.7 MB/s 107.1 MB/s 162.6 MB/s 122.0 MB/s

int32 117.6 MB/s 100.7 MB/s 117.7 MB/s 104.6 MB/s

int64 117.6 MB/s 98.8 MB/s 107.8 MB/s 102.7 MB/s



average speed

memory read: 330.8 MB/s

memory write: 214.1 MB/s

memory operation: 114.6 MB/s



average memory speed: 219.8 MB/s





bubble sort memory benchmark:

sorting random list with 655360 32bit entries

result: 36.4413



integer matrix benchmark:

using 14x14 32bit integer matrices

rating: 18.0618 it/s



prime filtering benchmark (M3):

searching all primes up to 20000000

primes found: 1270608

result: 0.2500 it/s



integer result: 77.5151 MOPS (million operations per second)

data throughput: 474.0810 MB/s (register/cache/ram - only data)



prime filtering benchmark (M4):

searching all primes up to 20000000

primes found: 1270606

result: 0.0793 it/s



integer result: 18.5813 MOPS (million operations per second)

data throughput: 116.8863 MB/s (register/cache/ram - only data)



prime filtering benchmark (M6):

searching all primes up to 20000000

primes found: 1270605

result: 0.1715 it/s



integer result: 72.3321 MOPS (million operations per second)

data throughput: 359.7290 MB/s (register/cache/ram - only data)



floatpoint matrix benchmark:

using 14x14 32bit integer matrices

rating: 18.9029 it/s



image operation benchmark:

image size of 1024x1024

rating: 3.6242



integer result: 19.0087 MOPS (million operations per second)

float result: 38.0025 MOPS (million operations per second)

data throughput: 304.5037 MB/s (register/cache/ram - only data)




K5 116MHz:


dhrystone 2 benchmark:

VAX rating: 132.1380 VAX MIPS

dhrystone rating: 232.1664 kilo dhrystone/s



integer mandelbrot benchmark:

calculated area (-0.300,0.450)-(0.300,1.050) every 0.015 with maxdepth of 255

result: 33.3630 it/s



integer result: 227.0079 MOPS (million operations per second)

data throughput: 824.7575 MB/s (register/cache/ram - only data)



whetstone benchmark:

result: 34.9937 MWIPS



floatpoint mandelbrot benchmark:

calculated area (-0.300,0.450)-(0.300,1.050) every 0.015 with maxdepth of 255

result: 12.1982 it/s



float result: 23.4558 MOPS (million operations per second)

data throughput: 245.4126 MB/s (register/cache/ram - only data)



memory bandwith benchmark:



measurement 1

blksize int32 read int32 write int64 read int64 write float64 read float64 write

1 kB 792.3 MB/s 218.2 MB/s 781.6 MB/s 220.3 MB/s 655.7 MB/s 212.5 MB/s

4 kB 817.7 MB/s 221.7 MB/s 806.3 MB/s 220.8 MB/s 738.5 MB/s 219.5 MB/s

8 kB 763.3 MB/s 216.0 MB/s 763.0 MB/s 216.3 MB/s 686.1 MB/s 211.7 MB/s

16 kB 243.1 MB/s 116.4 MB/s 247.9 MB/s 117.7 MB/s 210.1 MB/s 117.3 MB/s

24 kB 214.6 MB/s 106.5 MB/s 213.9 MB/s 107.9 MB/s 194.4 MB/s 105.6 MB/s

32 kB 201.0 MB/s 102.4 MB/s 206.6 MB/s 103.2 MB/s 188.3 MB/s 103.3 MB/s

48 kB 191.7 MB/s 98.9 MB/s 195.7 MB/s 99.6 MB/s 182.4 MB/s 99.1 MB/s

64 kB 185.4 MB/s 97.0 MB/s 187.1 MB/s 97.6 MB/s 179.1 MB/s 97.5 MB/s

96 kB 180.3 MB/s 95.5 MB/s 185.6 MB/s 95.9 MB/s 176.4 MB/s 95.8 MB/s

128 kB 178.9 MB/s 94.6 MB/s 182.1 MB/s 94.9 MB/s 175.2 MB/s 94.8 MB/s

192 kB 177.6 MB/s 94.2 MB/s 181.4 MB/s 94.4 MB/s 174.2 MB/s 94.3 MB/s

256 kB 176.0 MB/s 93.3 MB/s 179.6 MB/s 93.6 MB/s 172.7 MB/s 93.5 MB/s

384 kB 177.2 MB/s 94.5 MB/s 181.5 MB/s 94.6 MB/s 174.7 MB/s 94.6 MB/s

512 kB 173.2 MB/s 92.7 MB/s 177.7 MB/s 92.7 MB/s 171.3 MB/s 92.7 MB/s

768 kB 139.6 MB/s 63.6 MB/s 141.4 MB/s 63.6 MB/s 137.2 MB/s 63.6 MB/s

1024 kB 123.0 MB/s 53.7 MB/s 124.3 MB/s 53.7 MB/s 121.1 MB/s 53.7 MB/s

1536 kB 129.8 MB/s 57.2 MB/s 131.9 MB/s 57.2 MB/s 128.6 MB/s 57.2 MB/s

2048 kB 122.0 MB/s 53.5 MB/s 123.8 MB/s 53.5 MB/s 120.7 MB/s 53.5 MB/s

3072 kB 129.8 MB/s 57.1 MB/s 131.7 MB/s 57.1 MB/s 128.5 MB/s 57.1 MB/s

4096 kB 116.1 MB/s 53.5 MB/s 123.7 MB/s 53.5 MB/s 120.6 MB/s 53.5 MB/s



measurement 2

datasize COPY ADD SCALE TRIAD

float64 67.3 MB/s 67.6 MB/s 58.8 MB/s 52.7 MB/s

int32 77.6 MB/s 85.9 MB/s 72.8 MB/s 76.3 MB/s

int64 71.4 MB/s 77.6 MB/s 61.0 MB/s 62.4 MB/s



average speed

memory read: 255.6 MB/s

memory write: 104.0 MB/s

memory operation: 69.3 MB/s



average memory speed: 143.0 MB/s





bubble sort memory benchmark:

sorting random list with 655360 32bit entries

result: 29.3685



integer matrix benchmark:

using 14x14 32bit integer matrices

rating: 21.1616 it/s



prime filtering benchmark (M3):

searching all primes up to 20000000

primes found: 1270608

result: 0.1787 it/s



integer result: 55.4070 MOPS (million operations per second)

data throughput: 338.8680 MB/s (register/cache/ram - only data)



prime filtering benchmark (M4):

searching all primes up to 20000000

primes found: 1270606

result: 0.0656 it/s



integer result: 15.3868 MOPS (million operations per second)

data throughput: 96.7909 MB/s (register/cache/ram - only data)



prime filtering benchmark (M6):

searching all primes up to 20000000

primes found: 1270605

result: 0.2059 it/s



integer result: 86.8088 MOPS (million operations per second)

data throughput: 431.7259 MB/s (register/cache/ram - only data)



floatpoint matrix benchmark:

using 14x14 32bit integer matrices

rating: 13.5221 it/s



image operation benchmark:

image size of 1024x1024

rating: 2.2154



integer result: 11.6194 MOPS (million operations per second)

float result: 23.2298 MOPS (million operations per second)

data throughput: 186.1340 MB/s (register/cache/ram - only data)



Das ist die 486 Version - hatte vorhin falsch geguckt, der K5 mag 486er Code auch lieber als 386er Code.


K5 - 75Mhz*1.75:

dhrystone 2 benchmark:

VAX rating: 147.9534 VAX MIPS

dhrystone rating: 259.9541 kilo dhrystone/s



integer mandelbrot benchmark:

calculated area (-0.300,0.450)-(0.300,1.050) every 0.015 with maxdepth of 255

result: 37.4641 it/s



integer result: 254.9128 MOPS (million operations per second)

data throughput: 926.1405 MB/s (register/cache/ram - only data)



whetstone benchmark:

result: 39.2952 MWIPS



floatpoint mandelbrot benchmark:

calculated area (-0.300,0.450)-(0.300,1.050) every 0.015 with maxdepth of 255

result: 13.6975 it/s



float result: 26.3389 MOPS (million operations per second)

data throughput: 275.5771 MB/s (register/cache/ram - only data)



memory bandwith benchmark:



measurement 1

blksize int32 read int32 write int64 read int64 write float64 read float64 write

1 kB 889.6 MB/s 245.0 MB/s 877.5 MB/s 247.4 MB/s 736.2 MB/s 238.6 MB/s

4 kB 887.2 MB/s 248.9 MB/s 905.4 MB/s 248.0 MB/s 829.3 MB/s 246.5 MB/s

8 kB 853.6 MB/s 242.0 MB/s 849.2 MB/s 242.5 MB/s 768.9 MB/s 239.0 MB/s

16 kB 272.0 MB/s 130.5 MB/s 279.1 MB/s 131.9 MB/s 237.2 MB/s 131.7 MB/s

24 kB 241.2 MB/s 119.7 MB/s 245.7 MB/s 121.3 MB/s 219.1 MB/s 120.2 MB/s

32 kB 225.3 MB/s 115.1 MB/s 232.2 MB/s 116.3 MB/s 210.9 MB/s 116.0 MB/s

48 kB 214.1 MB/s 111.1 MB/s 219.9 MB/s 111.9 MB/s 204.7 MB/s 111.7 MB/s

64 kB 209.3 MB/s 109.0 MB/s 211.9 MB/s 109.7 MB/s 199.4 MB/s 109.2 MB/s

96 kB 203.3 MB/s 107.1 MB/s 208.0 MB/s 107.7 MB/s 198.1 MB/s 107.6 MB/s

128 kB 201.4 MB/s 106.3 MB/s 205.9 MB/s 106.6 MB/s 196.4 MB/s 106.5 MB/s

192 kB 199.6 MB/s 105.8 MB/s 204.0 MB/s 106.0 MB/s 195.6 MB/s 105.9 MB/s

256 kB 197.6 MB/s 105.0 MB/s 202.0 MB/s 105.1 MB/s 194.0 MB/s 105.1 MB/s

384 kB 197.0 MB/s 104.9 MB/s 201.6 MB/s 105.0 MB/s 194.0 MB/s 105.0 MB/s

512 kB 195.3 MB/s 104.1 MB/s 199.8 MB/s 104.2 MB/s 192.5 MB/s 104.2 MB/s

768 kB 157.8 MB/s 71.1 MB/s 160.4 MB/s 71.2 MB/s 155.7 MB/s 71.2 MB/s

1024 kB 140.2 MB/s 60.1 MB/s 142.1 MB/s 60.1 MB/s 138.5 MB/s 60.1 MB/s

1536 kB 141.6 MB/s 60.8 MB/s 143.9 MB/s 60.8 MB/s 140.3 MB/s 60.9 MB/s

2048 kB 139.3 MB/s 59.8 MB/s 141.5 MB/s 59.8 MB/s 138.0 MB/s 59.8 MB/s

3072 kB 148.4 MB/s 63.8 MB/s 150.6 MB/s 63.8 MB/s 146.9 MB/s 63.8 MB/s

4096 kB 135.8 MB/s 59.8 MB/s 141.4 MB/s 59.8 MB/s 137.9 MB/s 59.8 MB/s

measurement 2

datasize COPY ADD SCALE TRIAD

float64 77.3 MB/s 76.5 MB/s 65.6 MB/s 59.1 MB/s

int32 86.9 MB/s 96.9 MB/s 81.8 MB/s 85.6 MB/s

int64 77.0 MB/s 87.9 MB/s 68.2 MB/s 69.5 MB/s



average speed

memory read: 286.8 MB/s

memory write: 116.5 MB/s

memory operation: 77.7 MB/s



average memory speed: 160.3 MB/s





bubble sort memory benchmark:

sorting random list with 655360 32bit entries

result: 32.3523



integer matrix benchmark:

using 14x14 32bit integer matrices

rating: 23.7633 it/s



prime filtering benchmark (M3):

searching all primes up to 20000000

primes found: 1270608

result: 0.2007 it/s



integer result: 62.2207 MOPS (million operations per second)

data throughput: 380.5403 MB/s (register/cache/ram - only data)



prime filtering benchmark (M4):

searching all primes up to 20000000

primes found: 1270606

result: 0.0737 it/s



integer result: 17.2779 MOPS (million operations per second)

data throughput: 108.6869 MB/s (register/cache/ram - only data)



prime filtering benchmark (M6):

searching all primes up to 20000000

primes found: 1270605

result: 0.2312 it/s



integer result: 97.4821 MOPS (million operations per second)

data throughput: 484.8075 MB/s (register/cache/ram - only data)



floatpoint matrix benchmark:

using 14x14 32bit integer matrices

rating: 15.1845 it/s



image operation benchmark:

image size of 1024x1024

rating: 2.4877



integer result: 13.0477 MOPS (million operations per second)

float result: 26.0851 MOPS (million operations per second)

data throughput: 209.0129 MB/s (register/cache/ram - only data)




So, wie gesagt - Auswertung kommt gleich

i_hasser
08.01.2004, 22:57
Sorry, aber ich weis net was das für Ergebnisse sein sollen - was soll ich also damit anfangen???


Dann sind das wahrscheinlich nicht Dhrystone und Whetstone - was dann? Was wurde da überhaupt gebencht???
Wenn das nicht ersichtlich wird ist der Bench gleich für die Tonne.


Aber nun zur Auswertung:

Fangen wir mit Dhrystone an, erstmal die Ergebnisse:

P1 : 117.5774 VAX MIPS
P1MMX : 157.4517 VAX MIPS
K5 116: 132.1380 VAX MIPS
K5 130: 147.9534 VAX MIPS


Hier schlägt sich der K5 gegen den P1 sehr gut, aber gegen den P1MMX hat er wenig Chancen. Dhrystone ist vorwiegend ein Integer Benchmark, aber es werden auch zb. Funktionsaufrufe, Parameterauswertung etc. gebencht. Desswegen ist beim Kompilieren sehr auf die Optimierung zu achten - lässt man den Dhrystone Bench zu stark optimieren werden zb. Funktionen aufgelöst, und die Ergebnisse sind nicht mehr vergleichbar.

Dhrystone ist schon recht alt (197x) und braucht praktisch keinen Ram. Daher eignet er sich nur zur Ermittlung der Integer Leistung, weil der Alg komplett im Cache verschwindet.

Die Einheit (VAX MIPS) orientiert sich am Ergebniss das eine bestimmte VAX damals erzielt hat. Das ist eine konstante Umrechnung von dem dhrystone/s Ergebniss.


Weiter gehts mit dem Integer Mandelbrot Benchmark:

P1 : 11.7894 it/s
P1MMX : 15.2176 it/s
K5 116: 33.3630 it/s
K5 130: 37.4641 it/s


Hier wird das Mandelbrot Fraktal berechnet (bzw. ein Ausschnitt). Zum Einsatz kommen lange Integer-Werte. Speicherzugriffe finden praktisch nicht statt, ist also ein reiner Integer Benchmark.

Wie man sieht werden beide Pentium1 hier auf übelste Weise zerlegt ;)
It/s steht für Wiederholungen pro Sekunde, also wie oft in der Sekunde der Ausschnitt komplett berechnet wurde.


So - Whetstone:
Whetstone wurde später als Dhrystone entwickelt und stellt den Gegensatz dar, hier wird die Fließkomma Leistung ermittelt. Nicht mehr und nicht weniger und so spielt auch hier der Speicher keine Rolle.


P1 : 72.2761 MWIPS
P1MMX : 90.8264 MWIPS
K5 116: 34.9937 MWIPS
K5 130: 39.2952 MWIPS


Hier muss der K5 Federn lassen, die FPU liefert hier wirklich miserable Ergebnisse. Mehr ist dazu auch nicht zu sagen - außer, dass mein X5 mit 160MHz irgendwas um die 29 MWIPS abliefert.

MWIPS steht für Millionen WIPS, und WIPS steht für Whetstone Instructions per Second.



Nun gehts zum Fließkomma-Mandelbrot. Hier wird auch wieder das Mandelbrot berechnet, nur diesmal nehmen wir Fließkomma Zahlen und keine Festkomma Zahlen.


P1 : 17.7937 it/s
P1MMX : 22.2729 it/s
K5 116: 12.1982 it/s
K5 130: 13.6975 it/s


Hier schneidet der K5 nicht ganz so schlecht ab wie bei Whetstone, aber die Fließkommaleistung ist trotzdem nicht zu gebrauchen.

Die anderen beiden Ergebnisse bei den Details ergeben sich aus den It/s mal eine für den Bench konstante Zahl, ist also egal welche Werte wir hier miteinander vergleichen.


So - das waren die Integer und Float Benchmarks, die das Speicherinterface komplett außer Acht lassen. Nun kommt der Speicherbench und später gehts auch zu praktischen Werten.

Speicherbench:


P1 : 159.1 MB/s
P1MMX : 219.8 MB/s
K5 116: 143.0 MB/s
K5 130: 160.3 MB/s


Die Unterschiede zwischen P1 und P1MMX sind schnell erklärt. Der Speicherbench misst alles - Cache (L1 und L2) und Speicher.
Der P1MMX hat wie die Detail-Ergebnisse zeigen einen deutlich schnelleren L1 Cache (das liegt teilweise auch an der höheren Taktrate, aber nicht ausschließlich) und daher sind die Werte höher. Dazu kommt er mit 64bit Zugriffen etwas besser zurrecht.
Der K5 hat 8kb Datencache wie der P1 und 16kb Codecache, die letzten 10kb Stecken ganz woanders und daher sind die Werte nicht verschieden vom P1. Der L1 Cache scheint sogar genau die selbe Geschwindigkeit zu haben. Mit Schreibzugriffen kommt der K5 anscheinend etwas besser zurrecht, dafür siehts beim Streaming (die werte bei measurement 2) schlechter aus.

Hier nehmen sich die CPUs nicht viel. Nur der PMMX kann sich absetzen.



Nun kommt der Bubble Sort Benchmark - hauptsächlich Speicherbandbreite, aber hier ist auch Integer-Leistung gefordert. Ziel ist es einfach eine Liste von Zahlen per Bubblesort Algorithmus zu sortieren.


P1 : 29.6744 it/s (hab bei den Details die Einheiten vergessen, muss ich noch in den Bench proggen)
P1MMX : 36.4413 it/s
K5 116: 29.3685 it/s
K5 130: 32.3523 it/s


Hier kann der K5 auch punkten. Bei 16MHz weniger Takt als der P1 und ansonsten identischen Bedingungen liegt er mit dem P1 gleichauf. Vermutlich spielt hier der 34kb L1 Cache eine Rolle, die Integer-Leistung wird sich auch positiv auswirken.
Der P1MMX ist dank schnellem Cache schneller als der P1 - das liegt am Cache und an der höheren Taktrate, die Liste ist 2.56mb groß und passt nicht komplett in den Cache (und desswegen ist die Steigerung trotz selben Ram-durchsatz beachtlich).


Nun gehts zum Integer-Matrizenbench. Es werden einfach ein paar Matrizen mit Integerwerten erzeugt und addiert und auch mal multipliziert.
Also Speicher und Integer - SIMD dürfte hier wirklich extrem Speed bringen - aber das kann nur der PMMX und das wäre doch etwas unfähr, weil MMX so selten genutzt wird.


P1 : 14.5659 it/s
P1MMX : 18.0618 it/s
K5 116: 21.1616 it/s
K5 130: 23.7633 it/s


Tja, viel gibts hier nicht zu sagen - der K5 räumt das Feld dank der guten Integerleistung ab. Der Cache wird sein übriges tun. Eine Paradedisziplin für den K5, so wie Fließkommaberechnungen hier eine Paradedisziplin für den P1/MMX sind.



So - jetzt kommen meine Lieblingsbenchmarks, die Primzahlalgorithmen.
Derer gibts gleich dreierlei - die Ergebnisse sind aber auch zwischen den Algorithmen vergleichbar (den M4 etwas ausgeklammert), die einzelnen Benchmarks legen jeweils Wert auf andere Dinge.

M3 will viel Speicherbandbreite, M4 will etwas mehr Cache, eine große ALU und M6 will weniger Speicherbandbreite aber einen sehr guten Cache.
Allgemein beanspruchen alle 3 Benchmarks aber hauptsächlich Integer und Speicherinterface.



(Ergebnisse in It/s)
M3 M4 M6
P1 : 0.1880/0.0630/0.1413
P1MMX : 0.2500/0.0793/0.1715
K5 116: 0.1787/0.0656/0.2059
K5 130: 0.2007/0.0737/0.2312


So, hier kann man wirklich sehr schön auswerten. An M3 sieht man schön, wie gut sich der schnellere FSB beim K5 auswirkt (75 statt 66MHs FSB). Der erste Alg ist eben sehr Speicherlastig.
Beim M4 kann der K5 begrenzt seine bessere ALU Leistung ausspielen - hier gehts nur um eine Division und eine Modulo-Operation, und hier scheint der K5 nicht so viel schneller zu sein wie zb. bei einer Addition oder Schiebeoperation.
Trotzdem reicht es - der 116MHz K5 ist hier schneller als der 133MHz P1. M6 ist aber das Interessanteste - hier kann der K5 seinen größeren Cache ausspielen. Mit 116MHz ist er 48% schneller als der um 16 MHz höher getaktete P1 - das muss man sich mal auf der Zunge zergehen lassen! Der 130er baut seinen Vorsprung noch weiter aus, aber wegen dem schnelleren Speicher fällt er hier etwas heraus.

Nun zu den Vergleichen der Algs (M4 wegen einige Compilerproblemen ausgenommen): Der K5 hat etwas schlechtere Karten beim M3, weil er Streaming net so gut kann (hier räumt der P1MMX ab). Dafür hat er besseren Cache und ist beim M6 um Längen schneller.


Die Speicherzugriffe finden bei dem Bench übrigens sehr verteilt statt, M4 und M6 nutzen aber auch ca. 4kb an Tabellen sie sich gut im Cache machen. Der Code von dem Alg ist etwas umfangreicher und hier kann der K5 mit dem Codecache punkten. Die weiteren 10kb Cache wirken sich auch gut auf die Leistung aus (glaub die nehmen auch Daten auf).



So, nun kommt der Fließkomma-Matrixbench. Der ist identisch zum Integerbenchmark, nur dass jetzt Fließkommawerte benutzt werden.


P1 : 15.2270 it/s
P1MMX : 18.9029 it/s
K5 116: 13.5221 it/s
K5 130: 15.1845 it/s


Tja, hier gehts dem K5 erwartungsgemäß an den Kragen - aber dank des größen Caches kann er hier viel rausreißen. So schafft der 130er fast den P1-133 aber fairerweise muss man sagen, dass der 130er etwas schnelleren Speicher zur Verfügung hat.

Der P1MMX kommt hier mit seinem schnelleren Cache gut zurrecht, die FPU scheint auch nicht die langsamste zu sein ;)


Und nun kommt der letzte Benchmark - Bildberechnung. Fürchterlich unoptimiert, aber trotzdem gut zu gebrauchen. Durchgeführt wird eine Rotation und gleich danach eine Transparenzberechnung.
Viele Daten, viele Floatberechnungen eben ;)
Integer ist auch was dabei. Die 3 Teilergebnisse (das Rating hat keine Bedeutung) errechnen sich durch Benchwiederholungen/s*KonstanterWert, daher ist es egal ob ich hier die Integerleistung oder die Floatleistung vergleiche. Die Teilergebnisse gibts, um Rückschlüsse auf den Limmitierenden Faktor ziehen zu können - wenn eine CPU hier genauso viele Integer operationen /s schafft wie zb. beim Integer-Mandelbrot dürfte das der Limitierende Faktor sein usw.

MOPS - Millionen Operationen pro Sekunde. Ich hab die Fließkommaergebnisse genommen.


P1 : 30.4001 MOPS
P1MMX : 38.0025 MOPS
K5 116: 23.2298 MOPS
K5 130: 26.0851 MOPS


Hier schlägt wieder die schwache FPU zu und der K5 fällt zurück. Da nutzt auch der etwas schnellere Speicher vom 130er net, und der 133er P1 zieht vorbei.
Aber die Unterschiede halten sich in Grenzen - es ist nicht so wie zb. beim Whetstone.
(der 130er K5 ist ja trotzdem noch minnimal langsamer getaktet als der P1-133 - und wenn die FPU limitiert kommts praktisch nur auf den Takt an)



Fazit: Der K5 hat wirklich eine brachiale Integer-Leistung! Dafür ist die FPU Leistung so armseelig wie die Integer Leistung brachial ist.
Der K5 schwächelt ein bisschen bei Streaming Zugriffen auf den Ram, dafür ist der Cache etwas schneller und eben größer - das reißt das Ruder rum und bei Speichersachen ist der K5 in der Praxis doch etwas schneller (Streaming kommt eben eher seltener zum Einsatz als verteilte Zugriffe).

Für den Officebetrieb ist der K5 eine sehr gute CPU, ist er bei Integer-Sachen doch teilweise 2mal so schnell wie ein gleichgetakteter P1. Dafür ist er für Graphisch aufwendige Spiele sehr schlecht geeignet, weil die FPU wirklich schnarchlangsam ist. Bei Graphisch wenig anspruchsvollen Spielen (zb. Civ1) dürfte sich der K5 aber trotzdem auch sehr gut schlagen - das müssen dann Spielebenchmarks zeigen.


Nochwas in eigener Sache: Ich hab mir die Ergebnisse vor der Auswertung nicht angesehen! Ich hab mich praktisch auch überraschen lassen - und dass die FPU so langsam ist hätte ich nicht erwartet. Dafür hätte ich auch nicht erwartet, dass die ALU so verflucht schnell ist. Beim Integer-Mandelbrotbench reißt der K5 dem P1 ja alle Beinchen einzeln raus.


Ich hoffe das Überzeugt dich, ich hab mir jetzt wirklich viel Arbeit gemacht. Ich hab auch versucht in dem Benchmark so unterschiedliche Benchmarks wie möglich zu integrieren und das ist mir denke ich auch gelungen. Trotzdem werden einige Anforderungsbereiche nur angerissen, aber aussagekräftiger als ein DRHardware sollte der Bench schon sein.

Bokill
08.01.2004, 23:44
Ist zwar schlechter, aber sooooo schlecht ist die FPU- Leistung auch wieder nicht.

Da zeigt die P4 simpel FPU im vergleich zum PIII und Athlon noch ganz andere Werte.

Wenns dann Benchmarks sind ohne ausdrückliche Intelbevorzugung.

MFG Bokill

Bokill
09.01.2004, 00:08
Wenn ich mir so flüchtig die Ergebnisse des K5 bei gleicher Taktfrequenz so betrachte

Integer-Matrizenbench


P1 : 14.5659 it/s
P1MMX : 18.0618 it/s
K5 116: 21.1616 it/s
K5 130: 23.7633 it/s


Dann dürfte sogar jetzt noch der K5 eine mächtige Engine haben, vermutlich mag die aber überhaupt keine Taktfrequenzsteigerungen.

Danke intelhasser, dass du mir die bisherigen Behauptungen im Netz so nett beweist...
Denn wenn Insider vom K5 sprechen, dann immer mit Respekt!
Sie bemängelten nur das späte Erscheinen und die vergleichsweise schwache FPU... vom damaligen Konzept waren sie aber begeistert.

Wäre mal nett zu betrachten wo die Entwickler vom K5 nun arbeiten, bzw. welche Projekte sie bis jetzt so gemacht haben...

Merkwürdig wollte ich sowieso in der letzten Zeit mal machen.

MFG Bokill

Bokill
09.01.2004, 00:29
Hi hi geil...

Während die Pentiums den K5 im FPU- Bereich lauthals singend und tanzend förmlich auf dem Bock zersägen...

kehrt sich das Spiel mit Integer komplett um!

Witzig... sehr witzig!


Sägebock Integer: Schwer arbeitender K5 mit schutziger
Klinge, aber das Imperium schlägt mit MMX Kettensäge zurück
P1 : 117.5774 VAX MIPS
P1MMX : 157.4517 VAX MIPS
K5 116: 132.1380 VAX MIPS
K5 130: 147.9534 VAX MIPS


Sägebock Integer Mandelbrot: K5 Auf der Pirsch
P1 : 11.7894 it/s
P1MMX : 15.2176 it/s
K5 116: 33.3630 it/s
K5 130: 37.4641 it/s Blattschuss 2 Pentiumhirsche
... sofort erwischt... Halali

Sägebock FP: Fröhliches Pentium Duo; Hinrichtung
P1 : 72.2761 MWIPS
P1MMX : 90.8264 MWIPS
K5 116: 34.9937 MWIPS
K5 130: 39.2952 MWIPS Chopp... Kopf ab!

Sägebock FP Mandelbrot: Pentium Duo mit rostiger Kettensäge
P1 : 17.7937 it/s
P1MMX : 22.2729 it/s
K5 116: 12.1982 it/s
K5 130: 13.6975 it/s *schmerzschrei*


Nett!
Sehr nett!

MFG Bokill

i_hasser
09.01.2004, 00:37
Spaßeshalber können wir ja mal die Leistung auf eine gleiche Taktrate aller CPUs zurückrechnen (der Speicher spielt da zwar auch etwas mit, aber das vernachlässigen wir mal ;))

wenn wir einfach mal 133MHz als Referenztakt nehmen kommt das hier raus:


P1 : 14.5659 it/s
P1MMX : 14.4712 it/s (133/166)
K5 116: 24.2629 it/s (133/116)
K5 130: 24.2844 it/s (133/130)


Der PMMX ist schneller als der P1 weil er trotz, dass nur der CPU Takt gesteigert wurde erstaunlich gut mithält (wir vernachlässigen ja den Speicher)

Aber der K5 zerlegt eben alles ;D

Der K5 hat eine 6 Stufige Pipeline (eben extrem kurz) und durch die ALU passen 4 Integer-Operationen gleichzeitig. Ich glaub da hält nichtmal der aktuelle Athlon mit.
Das große Problem war die Taktrate. Meinen K5 hier hab ich ja auf 130MHz übertaktet, 145MHz hat er schon nicht mehr mitgemacht. Den Pentium1 gabs bis 200MHz. Der PR200 wurde ja auch nie offiziell vorgestellt, weil die Ausbeute wohl einfach viel zu niedrig war.
Der L1 Cache war zu der Zeit ja auch der Hammer, 34kb hatte nichtmal der PPro! Mich würde nur mal interessieren, wie es ausgesehen hätte wenns 16kb Daten und 8kb Code wären. Aber sicherlich hat AMD da auch getestet und schon das optimalere gewählt. Für Multitasking ist der große Code-Cache sicherlich gut.

Dafür, dass das das erste Design komplett von AMD ist, ist die CPU wirklich verdammt gut! Aber auch so muss man vor dem K5 wirklich Respekt haben, der zieht wie gesagt bei gleicher Taktrate mit den sauteuren RISC-Alphas gleich (selbe Integerleistung). Schade, dass man den K5 damals verworfen hat und nochmal neu angefangen hat (K6).

Ich werd glaub ich meine PMMX morgen etwas dreschen und mal sehen, bei welcher Taktrate die auf die selbe Integerleistung kommen ;D

Dürfte irgendwo bei 360MHz liegen... ok, das werd ich wohl nicht schaffen ;)
Da werd ich meinen P2 morgen mal satteln und damit benchen. Der PPro ist aber auch ein völliges Redesign und kein aufgebohrter PMMX. Da freu ich mich schon drauf *ggg*

i_hasser
09.01.2004, 00:49
@Bokill
MMX und dergleichen wird hier nicht genutzt, und im Primzahlalg kann man das sowieso nicht anwenden ;)

Der PMMX ist hier einfach schneller, weil er mit 166MHz getaktet ist. Der P1 krepelt dagegen mit 133MHz durch die Gegend.

Ich weis auch net warum der PMMX so schnell läuft, ich hab den P1 aus dem Sockel genommen und den PMMX reingepackt (ach da fällt mir ein, dass ich den mit 3.5V befeuert hab... naja, anscheinend hat er es überlebt *buck* - vielleicht schaff ich die 360MHz ja doch? *chatt*) und er kam mir mit 166MHz an. Der P1 lief davor bei genau den Einstellungen mit 133MHz, der Multi war 2.0 (tiefer kann das Board leider net - da werd ich mir mal noch irgendwann ein nicht-super-socket-7 Board an Land ziehen).


Den PMMX hab ich nur reingenommen um zu demonstrieren, dass da ein völlig anderer Kern drunter steckt (auch ein RISC, nur hatte eben schon der 5k86 einen RISC Kern und intel hat damit erst viel später nachgezogen).

Ich könnte höchstens mal den K5-PR133 aus meinem Router nehmen und den auf 133MHz prügeln - aber sicherlich wird der den Multi 2.0 auch als 1.75 interpretieren und damit gehts net.

Und weniger als 60MHz FSB macht das Board leider net - und 2.5*60 ist für den K5 einfach zu schnell (hat ja schon keine 145MHz geschafft).



Da muss ich wohl wirklich meinen Router auseinandernehmen. Naja... morgen ;)
Dann gibts auch gleich die Benches mit EDO Ram, ist dann viel realistischer.

Dj_Ninja
12.01.2004, 23:00
@intel-hasser

hast du noch ppro's rumzuliegen ? ich suche noch 2x die 1mb-variante, um 'nen siemens primergy 561 server (raid5, 2 redundante netzteile, dual ppro) an seine grenze zu treiben, im moment sind 2x 256kb drin.

übrigens trifft die sache "cache on die" meines wissens nach nicht das genaue - ich glaub da sind zwei ic's in einem gehäuse verbaut, die cpu und der cache. fast wie beim slot-p2, wo die cache-bausteine ja auch separat auf der platine sitzen.

Fruchtnektar
12.01.2004, 23:02
Du hast recht. es sind 3 Dies. Diese sind aber miteinander Verbunden (Der Name dieser Verbindung ist mir leider entfallen) aber es läuft mit vollen Die Takt.

i_hasser
12.01.2004, 23:03
Es sind sogar 3 separate Kerne ;)

PPros hab ich leider nicht rumliegen :(
Hab schon öfters überlegt mir mal einen herzuschaffen, aber irgendwie ist er dann doch nicht so das richtige - für 16bit überhauptreingarnicht geeignet, produziert sehr viel Wärme und wird von vielen P2 überholt, und ist von Kern her praktisch mit dem P2 identisch.

Da kauf ich mir lieber einen Cyrix, davon hab ich bis jetzt nämlich nur einen 486er ;)


@586IFM
no comment?


EDIT:

Mist, doch nur wieder 2. :P

Fruchtnektar
12.01.2004, 23:05
Haha... ich sitze auch abends vor dem Rechner und hab nichts zu tun ;)

Dj_Ninja
12.01.2004, 23:45
kannst ja einen von mir haben wenn ich "neue" gefunden habe und du dann noch möchtest... mußt nur schauen, wie du den kühler und den wärmeleitkleber abbekommst (aceton ?)

Fruchtnektar
13.01.2004, 00:05
Wenn es "normaler" Wärme-Leit-Kleber ist mit erhitzen bzw. abkühlen des Kükos. Aber ich habe hier 2 Prozzies mit Küko die wurden scheinbar geschweißt und betoniert gleichzeitig. Selbst das von intel_hasser geratene Hämmerchen bringt nichts....

Aceton muss ich noch mal ausprobieren... da ist Gott sei dank nichts Organisches dran bis auf (hoffentlich) der Kleber

Dj_Ninja
13.01.2004, 00:20
wie das aceton an den kleber kriegen wenn der kühler noch drauf is ? geht nich. also muß der erst runter. ich dachte das nur, um den kleber-rückstand von der cpu zu kriegen.
ich hab mal einen werks-geklebten kühler von einem 486er (so'n overdrive-teil) runtergedreht. ging aber nur, nachdem ich den prozi in einen schraubstock eingespannt und den kühler mit einer zange gefasst hatte. allerdings war's egal ob die cpu das überlebt oder nicht (wollte nur den kühler haben). der war mit stinknormalem klebstoff festgemacht - kühler und cpu waren rau, deswegen hielt der wohl so gut.

Fruchtnektar
13.01.2004, 00:22
Meine beiden müsste ich wohl in Aceton einweichen ;)

Dj_Ninja
13.01.2004, 00:25
hehe... kann dir 'nen abgebrannten xp zum testen geben. einfach mal über nacht reinschmeißen und wenn er am nächsten tag noch da is, kannst's mit den intels auch so machen. :D

Fruchtnektar
13.01.2004, 00:28
*g* zum Glück sind es zwei Pendulums im CPGA. Also da passiert nicht so viel dran.... Ob sie Danach noch gehen.....
Das gilt es zu klären 8)

i_hasser
13.01.2004, 10:15
Original geschrieben von Dj_Ninja
kannst ja einen von mir haben wenn ich "neue" gefunden habe und du dann noch möchtest... mußt nur schauen, wie du den kühler und den wärmeleitkleber abbekommst (aceton ?)

Danke für das Angebot - da würd ich direkt zugreifen! :D *buck* ;)

larsbo
13.01.2004, 11:24
Original geschrieben von Fruchtnektar
Eine Korrektur: Der Sockel vom PPro war der Sockel 8 nicht 6.

Intel hat im Grunde schon eine Selektion betrieben. Es gibt folgende PPros:

Pentium Pro 133 Mhz 8 Kb Data/8 Kb Code 256Kb on Die
Pentium Pro 150 Mhz 8 Kb Data/8 Kb Code 256Kb on Die
Pentium Pro 166 Mhz 8 Kb Data/8 Kb Code 256Kb on Die
Pentium Pro 166 Mhz 8 Kb Data/8 Kb Code 512 Kb on Die
Pentium Pro 180 Mhz 8 Kb Data/8 Kb Code 256Kb on Die
Pentium Pro 200 Mhz 8 Kb Data/8 Kb Code 256Kb on Die
Pentium Pro 200 Mhz 8 Kb Data/8 Kb Code 512 Kb on Die
Pentium Pro 200 Mhz 8 Kb Data/8 Kb Code 1024 Kb on Die

Daran sieht man das Intel wahrscheinlcih doch eine Aussonderung veranlasst hat. 512 die Kaputt waren als 256 verkauft.

Nur die 1MB Teile wurde auch als 1MB verkauft und nicht drunter. Das spricht auch für das spezielle Package, das nur beim PPro 200/1MB zum tragen kann.

Noch eine kleine Korrektur: Der L2 war beim PPro nich on Die, sondern separat, aber im Gehäuse mit dem Die gebonded. KA ob man da so einfach einen Teil des L2 deaktivieren konnte, wenn etwas nicht ging. Auf jeden Fall war der Packaging-Aufwand recht groß.

gruß
larsbo

edit: oops, hätte doch erst den ganzen thread lesen sollen. Dann hätte ich auch gesehen, das das anderen hier auch schon aufgefallen ist :]
Lustig, was aus nem thread werden kann, in dem einer nur wissen wollte, wie er seine Kühlkörper abkriegt....



Copyright © 1999 - 2011 Planet 3DNow!
Rechtliche Hinweise