App installieren
How to install the app on iOS
Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: This feature may not be available in some browsers.
Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
K9 - erste Fakten?
- Ersteller mtb][sledgehammer
- Erstellt am
mtb][sledgehammer
Grand Admiral Special
- Mitglied seit
- 11.11.2001
- Beiträge
- 4.375
- Renomée
- 30
- Mein Laptop
- HP Compaq nx6125
- Prozessor
- Athlon XP 2500+
- Mainboard
- Asrock K7S8XE
- Kühlung
- AC / selfmade Wakü
- Speicher
- 1 GB PC3200 Team Memory
- Grafikprozessor
- ATI Radeon 9500
- Display
- 20,1'' Samsung SyncMaster 205BW 1680x1050
- HDD
- Samsung SV0802N
- Optisches Laufwerk
- Toshiba DVD-ROM SD-M1612
- Soundkarte
- Creative SB Live! Player 1024
- Gehäuse
- Chenbro Net Server Tower
- Netzteil
- Coba 400 Watt (silent)
- Betriebssystem
- Windows XP, Ubuntu Linux
- Webbrowser
- Mozilla Firefox
- Verschiedenes
- knc TV Station , Terratec Cinergy 1200 DVB-C
Kaum ist ein Prozessor erhältlich, so tauchen meist schon die ersten Gerüchte über dessen Nachfolger auf. Erste offizielle Fakten zum K8 gab es beispielsweise schon im Sommer 2000, nachdem der Athlon (K7) im Sommer 1999 in den Markt drängte. Den K8 gibt es mittlerweile seit April 2003 als Opteron und seit September 2003 als Athlon 64 zu kaufen, aber zu deren lanfristigen Nachfolgern der K9 Generation gab es bislang allenfalls Gerüchte, über die in unserem Forum auch ausführlichst <a href="http://www.planet3dnow.de/vbulletin/showthread.php3?s=&threadid=109777">diskutiert</a> wird.
Im <a href="http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/25112.PDF" target="b">Software Optimization Guide</a> für die AMD Athlon 64 und AMD Opteron Prozessoren findet man jedoch eine konkrete Andeutung auf eine mögliche Verbesserung im K9: <ul><i>Future processors with more or wider multipliers and adders will achieve better throughput using SSE and SSE2 instructions. (Today's processors implement a 128-bit-wide SSE or SSE2 operation as two 64-bit operations that are internally pipelined.)</i></ul>Der K8 Nachfolger soll also eine bessere 128 Bit SIMD (SSE/SSE2) Leistung bieten, eine Verbesserung, die auf alle Fälle Sinn machen würde. Denn heute verarbeiten die Hammer/K8 Prozessoren 128 Bit SIMD Operationen in je 2 Häppchen a 64 Bit, was natürlich den Durchsatz der CPU stark behindert. Damit erklärt sich im Übrigen auch, warum Opteron und Athlon 64 nicht - wie eigentlich erwartet - durch SSE2 einen enormen Geschwindigkeitsschub erhalten.
Eine weitere Andeutung machte Symon Chang, Geschäftsführer bei Tyan, in einem kürzlichen Interview: <ul><i>Around 2006, when the market moves to AMD's next generation of chips, you will be able to go over 8-way. What I mean is that with eight sockets, and dual cores, you then have sixteen processors, but with K9, you'll see it go over that. I think we'll see a significant increase in the amount of crossbar switches in the CPU. I'm not up on all the minute details, but you'll be able to go over 60 processors without adding any external crossbar chips.</i></ul>Während der Opteron duch seine integrierte Crossbar und die drei Hyper Transport Links heute fähig ist ohne zusätzliche Kommunikationschips bis zu sieben weitere Prozessoren anzusprechen (mit den kommenden <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1087248616">Dual Core Prozessoren</a> können sogar bis zu 16 Prozessoren direkt miteinander kommunizieren), soll es bei dessen Nachfolger demnach also möglich sein, über 60 Prozessoren direkt miteinander zu verbinden. Das komplette Interview mit Symon Chang findet ihr <a href="http://www.digitimes.com/news/a20040726PR202.html" target="b">hier</a>.
Thx Dresdenboy für den Hinweis
Im <a href="http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/25112.PDF" target="b">Software Optimization Guide</a> für die AMD Athlon 64 und AMD Opteron Prozessoren findet man jedoch eine konkrete Andeutung auf eine mögliche Verbesserung im K9: <ul><i>Future processors with more or wider multipliers and adders will achieve better throughput using SSE and SSE2 instructions. (Today's processors implement a 128-bit-wide SSE or SSE2 operation as two 64-bit operations that are internally pipelined.)</i></ul>Der K8 Nachfolger soll also eine bessere 128 Bit SIMD (SSE/SSE2) Leistung bieten, eine Verbesserung, die auf alle Fälle Sinn machen würde. Denn heute verarbeiten die Hammer/K8 Prozessoren 128 Bit SIMD Operationen in je 2 Häppchen a 64 Bit, was natürlich den Durchsatz der CPU stark behindert. Damit erklärt sich im Übrigen auch, warum Opteron und Athlon 64 nicht - wie eigentlich erwartet - durch SSE2 einen enormen Geschwindigkeitsschub erhalten.
Eine weitere Andeutung machte Symon Chang, Geschäftsführer bei Tyan, in einem kürzlichen Interview: <ul><i>Around 2006, when the market moves to AMD's next generation of chips, you will be able to go over 8-way. What I mean is that with eight sockets, and dual cores, you then have sixteen processors, but with K9, you'll see it go over that. I think we'll see a significant increase in the amount of crossbar switches in the CPU. I'm not up on all the minute details, but you'll be able to go over 60 processors without adding any external crossbar chips.</i></ul>Während der Opteron duch seine integrierte Crossbar und die drei Hyper Transport Links heute fähig ist ohne zusätzliche Kommunikationschips bis zu sieben weitere Prozessoren anzusprechen (mit den kommenden <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1087248616">Dual Core Prozessoren</a> können sogar bis zu 16 Prozessoren direkt miteinander kommunizieren), soll es bei dessen Nachfolger demnach also möglich sein, über 60 Prozessoren direkt miteinander zu verbinden. Das komplette Interview mit Symon Chang findet ihr <a href="http://www.digitimes.com/news/a20040726PR202.html" target="b">hier</a>.
Thx Dresdenboy für den Hinweis
xxmartin
Admiral Special
- Mitglied seit
- 15.08.2003
- Beiträge
- 1.979
- Renomée
- 490
- Prozessor
- AMD Opteron 170 (CCB1E 0550 VPMW) @ 3200 MHz @ 1.50V
- Mainboard
- DFI LANparty nF4 SLI-DR Expert
- Kühlung
- Alphacool NexXxoS XP powered by TITAN 1500
- Speicher
- 2 GB Original Infineon DDR400 CE-5 @ 266 MHz @ 3.0-3-2-8 1T
- Grafikprozessor
- 2x Pine XFX GeForce 7900 GTX Extreme Edition 1750 @ SLI
- Display
- Samsung SyncMaster 959NF
- HDD
- 4x Samsung SP1213C @ RAID-0
- Soundkarte
- Creative Sound Blaster X-Fi Fatal1ty FPS
- Gehäuse
- Chieftec Mesh BigTower (CA-01SL-SL-B)
- Netzteil
- Enermax Liberty 620W ATX 2.2 (ELT620AWT)
- Betriebssystem
- Windows XP SP2, Windows XP x64, SuSE 10.0 x86_64, LFS Linux 64-bit
Zukunftsmusik ... klingt aber trotzdem fein.
Wo soll ich unterschreiben!? 8)
Wo soll ich unterschreiben!? 8)
PuckPoltergeist
Grand Admiral Special
Original geschrieben von mtb][sledgehammer
(mit den kommenden <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1087248616">Dual Core Prozessoren</a> können sogar bis zu 16 Prozessoren direkt miteinander kommunizieren)
Sicher? Die Logik ist ja die gleiche, welche den Datenaustausch mit den CPUs koordiniert. Gibt es dafür irgendwo was Schriftliches?
BLJ
Admiral Special
heut hab ich n shice Tag, sorry:
wie wärs mit:
1. ists im Original falsch negiert.(Original = kein Geschwindigkeitsschub wurde erwartet)
2. gefällt mir die Satzstellung mit dem keinen gleich nach dem Gedankenstrich besser, da es ja 'logisch' mit dem Zwischensatz verbunden ist...
so jetzt dürft ihr mich wegen meiner Pingeligkeit steinigen... ^^ (wär wohl ne gute Tat ^^)
cya
warum Opteron und Athlon 64 nicht - wie eigentlich erwartet - durch SSE2 einen enormen Geschwindigkeitsschub erhalten
wie wärs mit:
warum Opteron und Athlon 64 - nicht wie eigentlich erwartet - keinen enormen Geschwindigkeitsschub durch SSE2 erhalten.
1. ists im Original falsch negiert.(Original = kein Geschwindigkeitsschub wurde erwartet)
2. gefällt mir die Satzstellung mit dem keinen gleich nach dem Gedankenstrich besser, da es ja 'logisch' mit dem Zwischensatz verbunden ist...
so jetzt dürft ihr mich wegen meiner Pingeligkeit steinigen... ^^ (wär wohl ne gute Tat ^^)
cya
das mit dem direkten kommunizieren ist falsch. das sockeldesign lässt nur 3 hts nach außen zu. Somit ist keine "über-Kreuz" kommunikation mit zwei cores mehr möglich, was nur den schluß zulasst, daß ein datenstrom der path-through über core0 oder core1 den jeweils anderen erreicht.
die SSE2 leistung des athlon 64 ist komischerweise in geringen frequenzen (z.B. 800 MHz) sehr hoch...
die SSE2 leistung des athlon 64 ist komischerweise in geringen frequenzen (z.B. 800 MHz) sehr hoch...
mtb][sledgehammer
Grand Admiral Special
- Mitglied seit
- 11.11.2001
- Beiträge
- 4.375
- Renomée
- 30
- Mein Laptop
- HP Compaq nx6125
- Prozessor
- Athlon XP 2500+
- Mainboard
- Asrock K7S8XE
- Kühlung
- AC / selfmade Wakü
- Speicher
- 1 GB PC3200 Team Memory
- Grafikprozessor
- ATI Radeon 9500
- Display
- 20,1'' Samsung SyncMaster 205BW 1680x1050
- HDD
- Samsung SV0802N
- Optisches Laufwerk
- Toshiba DVD-ROM SD-M1612
- Soundkarte
- Creative SB Live! Player 1024
- Gehäuse
- Chenbro Net Server Tower
- Netzteil
- Coba 400 Watt (silent)
- Betriebssystem
- Windows XP, Ubuntu Linux
- Webbrowser
- Mozilla Firefox
- Verschiedenes
- knc TV Station , Terratec Cinergy 1200 DVB-C
@Puck
Ich denke schon. Schließlich bleibt die Anzahl der Knoten (und damit die Anzahl der Spiechercontroller) identisch. Wieviele Kollegen drumherum sind, dürfte den Prozessor nicht interessieren.
Außerdem sagte Fred Webber in seinem ersten Interview, in dem er die Dual Cores ankündigte, dass man problemlos bestehende Plattformen aufrüsten könnte. OK das gibt jetzt natürlich weniger her.
3. Argument: AMD will leistungsfähigere Systeme anbieten
4. Argument: Symon Chang sagt das selbe
@BLJ
Ich gebe zu an diesem Satz habe ich auch nachgedacht, wie er am besten ist. Mir gefällts so besser
@not@AMD
Mit direkt meine ich, dass kein zusätzlicher Kommunikationschip nötig ist. Ansonsten hast du natürlich recht
Ich denke schon. Schließlich bleibt die Anzahl der Knoten (und damit die Anzahl der Spiechercontroller) identisch. Wieviele Kollegen drumherum sind, dürfte den Prozessor nicht interessieren.
Außerdem sagte Fred Webber in seinem ersten Interview, in dem er die Dual Cores ankündigte, dass man problemlos bestehende Plattformen aufrüsten könnte. OK das gibt jetzt natürlich weniger her.
3. Argument: AMD will leistungsfähigere Systeme anbieten
4. Argument: Symon Chang sagt das selbe
@BLJ
Ich gebe zu an diesem Satz habe ich auch nachgedacht, wie er am besten ist. Mir gefällts so besser
@not@AMD
Mit direkt meine ich, dass kein zusätzlicher Kommunikationschip nötig ist. Ansonsten hast du natürlich recht
PuckPoltergeist
Grand Admiral Special
Original geschrieben von not@AMD
das mit dem direkten kommunizieren ist falsch. das sockeldesign lässt nur 3 hts nach außen zu. Somit ist keine "über-Kreuz" kommunikation mit zwei cores mehr möglich, was nur den schluß zulasst, daß ein datenstrom der path-through über core0 oder core1 den jeweils anderen erreicht.
Nein, die Cores werden noch vor der X-BAR gekoppelt, die müssen nicht übereinander kommunizieren.
edit: Die Verbindung wird über die SRQ (System Request Queue) hergestellt.
PuckPoltergeist
Grand Admiral Special
Original geschrieben von mtb][sledgehammer
Ich denke schon. Schließlich bleibt die Anzahl der Knoten (und damit die Anzahl der Spiechercontroller) identisch. Wieviele Kollegen drumherum sind, dürfte den Prozessor nicht interessieren.
Das reicht ja noch nicht, die CPUs müssen alle "voneinander wissen", um die Cache-Kohärenz sicher zu stellen.
Außerdem sagte Fred Webber in seinem ersten Interview, in dem er die Dual Cores ankündigte, dass man problemlos bestehende Plattformen aufrüsten könnte. OK das gibt jetzt natürlich weniger her.
3. Argument: AMD will leistungsfähigere Systeme anbieten
4. Argument: Symon Chang sagt das selbe
Man kann ja 8-fach Systeme mit DualCore-CPUs aufrüsten, muss dann nur vier Sockel unbstückt lassen.
Nein, es macht andersherum schon Sinn, also dass sich die Anzahl der CPUs dadurch verdoppelt. Nun ja, bin ja mal gespannt.
Trodat
Grand Admiral Special
Original geschrieben von BLJ
1. ists im Original falsch negiert.(Original = kein Geschwindigkeitsschub wurde erwartet)
2. gefällt mir die Satzstellung mit dem keinen gleich nach dem Gedankenstrich besser, da es ja 'logisch' mit dem Zwischensatz verbunden ist...
so jetzt dürft ihr mich wegen meiner Pingeligkeit steinigen... ^^ (wär wohl ne gute Tat ^^)
cya
Dann steinige ich dich jetzt mal virtuell
Meiner Meinung nach ist der Satzbau in der News nicht nur schöner, sondern dein Vorschlag ist durch die doppelte Verneinung sogar kaum noch lesbar.
also ich muß BLJ Recht geben. Der Satzbau in den News ist Sinngemäß falsch, da keine Negierung im "wie erwartet" Teil drin ist, bedeutet dadß das alles so ist wie erwartet.Original geschrieben von Trodat
Dann steinige ich dich jetzt mal virtuell
Meiner Meinung nach ist der Satzbau in der News nicht nur schöner, sondern dein Vorschlag ist durch die doppelte Verneinung sogar kaum noch lesbar.
Sehr leserlich find ich BLJ´s Vorschlag zwar auch nicht, aber er ist zumindest richtig und was besseres ist mir auch nicht eingefallen.
Allerdings ists mir beim durchlesen auch nicht aufgefallen dass das eigentlich falsch ist
*SchutzschildvorBLJaufbaugegenSteinigung*
Trodat
Grand Admiral Special
Original geschrieben von skfink
also ich muß BLJ Recht geben. Der Satzbau in den News ist Sinngemäß falsch, da keine Negierung im "wie erwartet" Teil drin ist, bedeutet dadß das alles so ist wie erwartet.
Sehr leserlich find ich BLJ´s Vorschlag zwar auch nicht, aber er ist zumindest richtig und was besseres ist mir auch nicht eingefallen.
Allerdings ists mir beim durchlesen auch nicht aufgefallen dass das eigentlich falsch ist
*SchutzschildvorBLJaufbaugegenSteinigung*
Ich bin immer noch der Meinung, dass da keine Negierung in den "wie erwartet" Einschub gehört. Das "nicht" im Hauptsatz steht ja vor dem Einschub, und dieser bezieht sich meinem Verständnis nach auf den Teil danach. Damit wäre es ja logisch dann korrekt, d.h. ursprünglich wurde ein enormer Geschwindigkeitsschub erwartet der dann aber nicht aufgetreten ist.
Aber egal was jetzt korrekt ist, ich denke so wie es in der News ist, weiß auf jeden Fall jeder was gemeint ist
Kamui
Grand Admiral Special
- Mitglied seit
- 14.09.2003
- Beiträge
- 3.991
- Renomée
- 16
- Standort
- Hessen
- Mein Laptop
- Apple MacBook ... Pro!
- Prozessor
- Intel Core2Duo P8400 (2x2,26 GHz)
- Mainboard
- kA
- Kühlung
- Was leises
- Speicher
- 1 x 1024 MB, 1 x 2048 MB DDR-3 Standard-RAM
- Grafikprozessor
- NVIDIA 9400M
- Display
- Intern 13,3"-LED-1280x800, extern 1680x1050- 20" Viewsonic VX2025WM (P-MVA)
- HDD
- Samsung M7, 500 GB, 5400rpm, extern 1 TB Trekstor maxi g.u
- Optisches Laufwerk
- Superdrive
- Soundkarte
- Apple-Standard / Teufel Concept C
- Gehäuse
- Apple Aluminium-Unibody
- Netzteil
- Apple 65 W
- Betriebssystem
- Mac OS X 10.6, in VM Windows 7 Professional
- Webbrowser
- Chrome. (Safari mit Glims)
- Verschiedenes
- Eine hervorragende Ergänzung zu meinem Palm Pre.
Während der Opteron duch seine integrierte Crossbar und die drei Hyper Transport Links heute fähig ist ohne zusätzliche Kommunikationschips bis zu sieben weitere Prozessoren anzusprechen (mit den kommenden <a href="http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1087248616">Dual Core Prozessoren</a> können sogar bis zu 16 Prozessoren direkt miteinander kommunizieren), soll es bei dessen Nachfolger demnach also möglich sein, über 60 Prozessoren direkt miteinander zu verbinden.
60 Prozessoren
Denke, das is für Server gedacht, weil ich brauch hoffentlich nich mehr als eine... im "Notfall" () auch zwei, aber mehr nich...
Aber ne interessante News...
Ach ja, zu dem Satzbau: is doch wurscht, er wurde halt nich schneller
Zuletzt bearbeitet:
mtb][sledgehammer
Grand Admiral Special
- Mitglied seit
- 11.11.2001
- Beiträge
- 4.375
- Renomée
- 30
- Mein Laptop
- HP Compaq nx6125
- Prozessor
- Athlon XP 2500+
- Mainboard
- Asrock K7S8XE
- Kühlung
- AC / selfmade Wakü
- Speicher
- 1 GB PC3200 Team Memory
- Grafikprozessor
- ATI Radeon 9500
- Display
- 20,1'' Samsung SyncMaster 205BW 1680x1050
- HDD
- Samsung SV0802N
- Optisches Laufwerk
- Toshiba DVD-ROM SD-M1612
- Soundkarte
- Creative SB Live! Player 1024
- Gehäuse
- Chenbro Net Server Tower
- Netzteil
- Coba 400 Watt (silent)
- Betriebssystem
- Windows XP, Ubuntu Linux
- Webbrowser
- Mozilla Firefox
- Verschiedenes
- knc TV Station , Terratec Cinergy 1200 DVB-C
So war auch mein Sprachgefühl: der Einschub bezieht sich auf das, was dahinter kommt. Das nicht auf alles was hinter nicht kommt. Falsch wäre is IMO folgendermaßen: <ul>warum Opteron und Athlon 64 - wie eigentlich erwartet - nicht durch SSE2 einen enormen Geschwindigkeitsschub erhalten</ul>Original geschrieben von Trodat
Ich bin immer noch der Meinung, dass da keine Negierung in den "wie erwartet" Einschub gehört. Das "nicht" im Hauptsatz steht ja vor dem Einschub, und dieser bezieht sich meinem Verständnis nach auf den Teil danach. Damit wäre es ja logisch dann korrekt, d.h. ursprünglich wurde ein enormer Geschwindigkeitsschub erwartet der dann aber nicht aufgetreten ist.
Mist, genau das wollte ich ursprünglich auch noch irgendwo hinpacken.Denke, das is für Server gedacht
Da hast du recht, habe ich nicht bedacht.Das reicht ja noch nicht, die CPUs müssen alle "voneinander wissen", um die Cache-Kohärenz sicher zu stellen.
OBrian
Moderation MBDB, ,
- Mitglied seit
- 16.10.2000
- Beiträge
- 17.032
- Renomée
- 267
- Standort
- NRW
- Prozessor
- Phenom II X4 940 BE, C2-Stepping (undervolted)
- Mainboard
- Gigabyte GA-MA69G-S3H (BIOS F7)
- Kühlung
- Noctua NH-U12F
- Speicher
- 4 GB DDR2-800 ADATA/OCZ
- Grafikprozessor
- Radeon HD 5850
- Display
- NEC MultiSync 24WMGX³
- SSD
- Samsung 840 Evo 256 GB
- HDD
- WD Caviar Green 2 TB (WD20EARX)
- Optisches Laufwerk
- Samsung SH-S183L
- Soundkarte
- Creative X-Fi EM mit YouP-PAX-Treibern, Headset: Sennheiser PC350
- Gehäuse
- Coolermaster Stacker, 120mm-Lüfter ersetzt durch Scythe S-Flex, zusätzliche Staubfilter
- Netzteil
- BeQuiet 500W PCGH-Edition
- Betriebssystem
- Windows 7 x64
- Webbrowser
- Firefox
- Verschiedenes
- Tastatur: Zowie Celeritas Caseking-Mod (weiße Tasten)
Wie wär´s mit
"Damit erklärt sich im Übrigen auch, warum Opteron und Athlon 64 durch SSE2 keinen enormen Geschwindigkeitsschub erhalten, wie eigentlich erwartet."
Liest sich weniger holprig und ist genauso richtig wie die ursprüngliche Fassung. Die Ellipse am Ende bezieht sich ja auf den Sachverhalt des "Geschwindigkeitsschuberhaltens"; damit es deutlicher wird, würde ich sie aber evtl. ausschreiben ("wie dies eigentlich erwartet worden war").
"Damit erklärt sich im Übrigen auch, warum Opteron und Athlon 64 durch SSE2 keinen enormen Geschwindigkeitsschub erhalten, wie eigentlich erwartet."
Liest sich weniger holprig und ist genauso richtig wie die ursprüngliche Fassung. Die Ellipse am Ende bezieht sich ja auf den Sachverhalt des "Geschwindigkeitsschuberhaltens"; damit es deutlicher wird, würde ich sie aber evtl. ausschreiben ("wie dies eigentlich erwartet worden war").
SGI
Commander
- Mitglied seit
- 24.11.2002
- Beiträge
- 166
- Renomée
- 1
- Prozessor
- Intel Core 2 Duo E6600 @ 3,2 GHz (8 x 400 Mhz FSB)
- Mainboard
- Gigabyte GA-P35-DS3R
- Kühlung
- Zalman CNPS 9700 LED
- Speicher
- 4x 1024 MB Corsair CM2X DDR2-800 4-4-4-12
- Grafikprozessor
- Gainward Bliss 8800 GTS (640 MB)
- Display
- 19" TFT, Philips 190B4, 1280x1024x32@60Hz
- HDD
- Samsung HD501LJ (500 GB, SATA2)
- Optisches Laufwerk
- LG GSA-H62N (DVD-Recorder, SATA)
- Soundkarte
- Realtek Azalia (onboard)
- Gehäuse
- Casetek 1018 BM (Schallgedämmt)
- Netzteil
- SilverStone ST50EF-Plus (500 W)
- Betriebssystem
- Windows Vista Ultimate 64
- Webbrowser
- Firefox 2.0
Wie macht denn das der P4? Bearbeitet der eine 128 bit Operation im ganzen oder auch wie der Athlon 64 in zwei 64 bit Teilen?
Original geschrieben von OBrian
Wie wär´s mit
"Damit erklärt sich im Übrigen auch, warum Opteron und Athlon 64 durch SSE2 keinen enormen Geschwindigkeitsschub erhalten, wie eigentlich erwartet."
Liest sich weniger holprig und ist genauso richtig wie die ursprüngliche Fassung.
du meinst wohl genauso falsch
wenn du deinen Satz anderst betonst merkst dus. Einfach mal eine Pause vor dem letzten Satzteil machen. Das "wie eigentlich erwartet" sagt aus dass das vorangegangene so war wie es zu erwarten war.
den letzten Teil konjugiert klingt das zwar schon besser, aber wohl immer noch um die die Richtigkeit betrogen:
"Damit erklärt sich im Übrigen auch, warum Opteron und Athlon 64 durch SSE2 keinen enormen Geschwindigkeitsschub erhielten, wie es eigentlich zu erwartet gewesen wäre."
mtb][sledgehammer
Grand Admiral Special
- Mitglied seit
- 11.11.2001
- Beiträge
- 4.375
- Renomée
- 30
- Mein Laptop
- HP Compaq nx6125
- Prozessor
- Athlon XP 2500+
- Mainboard
- Asrock K7S8XE
- Kühlung
- AC / selfmade Wakü
- Speicher
- 1 GB PC3200 Team Memory
- Grafikprozessor
- ATI Radeon 9500
- Display
- 20,1'' Samsung SyncMaster 205BW 1680x1050
- HDD
- Samsung SV0802N
- Optisches Laufwerk
- Toshiba DVD-ROM SD-M1612
- Soundkarte
- Creative SB Live! Player 1024
- Gehäuse
- Chenbro Net Server Tower
- Netzteil
- Coba 400 Watt (silent)
- Betriebssystem
- Windows XP, Ubuntu Linux
- Webbrowser
- Mozilla Firefox
- Verschiedenes
- knc TV Station , Terratec Cinergy 1200 DVB-C
geht man von folgendem ausOriginal geschrieben von SGI
Wie macht denn das der P4? Bearbeitet der eine 128 bit Operation im ganzen oder auch wie der Athlon 64 in zwei 64 bit Teilen?
http://www.chip-architect.com/news/2003_09_21_Detailed_Architecture_of_AMDs_64bit_Core.html#1.5
Dann bearbeitet der Pentium 4 ebenfalls zweimal 64 Bit. Bei ihm brachte SSE2 jedoch einen enormen Schub, da der Pentium 4 mit normalen FP Operationen nicht mehr Befehle pro Takt bearbeiten konnte (hängt mit dessen internen µOp ports zusammen.) Der Opteron erreicht jedoch mit normalem FP den doppelten Durchsatz, was der selben Datenmenge wie mit SSE2 entspricht. Daher ist SSE2 nur unwesentlich schneller. Da ich das Gefühl habe, dass das sehr missverständlich ausgedrückt ist, fasse ich es in einer Tabelle zusammen: <table border="1"><tr><th>Prozessor</th><th>x87 FP</th><th>SSE2 SIMD</th></tr><tr><td>Athlon 64/Opteron</td><td>2 Ops/Takt</td><td>2 Ops/2 Takte</td></tr><tr><td>Pentium 4</td><td>1 Op/Takt</td><td>1 Op/Takt</td></tr></table>In the Pentium 4 an SSE2 instruction is split in a later stage in the Floating Point unit itself. The Floating Point units accept 128 bit source data at it's first stage. It then splits the operation in two and combines the two results at the end into one single 128 bit result. This effectively adds one extra cycle to the total latency. For instance: The x87 FADD and FMUL take 5 and 7 cycles while the 128 bit (2x64) SSE2 equivalents need 6 and 8 cycles.
Wobei ein SSE2 Op soviel leistet wie 2 x87 fp Ops
PuckPoltergeist
Grand Admiral Special
Original geschrieben von mtb][sledgehammer
geht man von folgendem aus
http://www.chip-architect.com/news/2003_09_21_Detailed_Architecture_of_AMDs_64bit_Core.html#1.5 Dann bearbeitet der Pentium 4 ebenfalls zweimal 64 Bit. Bei ihm brachte SSE2 jedoch einen enormen Schub, da der Pentium 4 mit normalen FP Operationen nicht mehr Befehle pro Takt bearbeiten konnte (hängt mit dessen internen µOp ports zusammen.) Der Opteron erreicht jedoch mit normalem FP den doppelten Durchsatz, was der selben Datenmenge wie mit SSE2 entspricht. Daher ist SSE2 nur unwesentlich schneller.
Das erklärt aber IMO nicht das extrem schlechte Abschneiden der P4s bei skalaren SSE-Operationen.
mtb][sledgehammer
Grand Admiral Special
- Mitglied seit
- 11.11.2001
- Beiträge
- 4.375
- Renomée
- 30
- Mein Laptop
- HP Compaq nx6125
- Prozessor
- Athlon XP 2500+
- Mainboard
- Asrock K7S8XE
- Kühlung
- AC / selfmade Wakü
- Speicher
- 1 GB PC3200 Team Memory
- Grafikprozessor
- ATI Radeon 9500
- Display
- 20,1'' Samsung SyncMaster 205BW 1680x1050
- HDD
- Samsung SV0802N
- Optisches Laufwerk
- Toshiba DVD-ROM SD-M1612
- Soundkarte
- Creative SB Live! Player 1024
- Gehäuse
- Chenbro Net Server Tower
- Netzteil
- Coba 400 Watt (silent)
- Betriebssystem
- Windows XP, Ubuntu Linux
- Webbrowser
- Mozilla Firefox
- Verschiedenes
- knc TV Station , Terratec Cinergy 1200 DVB-C
Da hast du recht. Im Prinzip sollte diese in der selben Region liegen wie die x87 FP Perfomance. Eventuell findet sich das Problem im Decoder? Edit: Nein am Decoder liegt es wohl eher nicht (Das sollte der Trace Cache kompensieren)
Zur Tabelle muss ich noh ergänzen, dass diese nur auf FP Operationen zutrifft.
Zur Tabelle muss ich noh ergänzen, dass diese nur auf FP Operationen zutrifft.
Zuletzt bearbeitet:
PuckPoltergeist
Grand Admiral Special
Dresdenboy
Redaktion
☆☆☆☆☆☆
Vielleicht hilft auch das, was ich in einem anderen Thread schon schrieb, weiter (nachgemessen habe ich es allerdings nicht):
Andere Erklärungsidee:
Bis SSE2 werden die 2 oder 4 FP-Operanden bei Rechenoperationen unabhängig voneinander bearbeitet. Dadurch entfallen schon ein paar Schedulingprobleme, da sich die Latenzen nur um 1 Takt erhöhen, der Durchsatz aber verdoppelt. Bei Skalaroperationen wird nicht nur halb soviel pro Befehl erledigt, sondern können im folgenden Code schon nach weniger Takten Befehle auftreten, die vom vorherigen Ergebnis abhängig sind.
Anders dargestellt: Nehmen wir einmal 2 aufeinanderfolgende SSE2-Befehle (ADDPD, 4 Takte Latenz) an, wo der zweite vom ersten abhängt. Arbeite ich gerade nur mit SSE2, müsste ich 4 Takte mit anderen SSE2-Operationen überbrücken. Bei skalaren Operationen bräuchte ich 4 Befehle, bei Vektor-Operationen nur 2, da diese selbst einen Durchsatz von 1 Befehl aller 2 Takte aufweisen. Somit ergeben sich bei Vektorcode weniger Verzögerungen durch Operandenabhängigkeiten, da es bei den 8 Registern einfacher ist, die Lücke mit nur 2 anstatt 4 Befehlen füllen zu müssen.
Man könnte es auch damit vergleichen, daß die Vektorbefehle statt mit 2 Takten Durchsatz nur mit 1 Takt Durchsatz, aber bei halber Taktfrequenz und halben Latenzzeiten ausgeführt werden.
Nachtrag: Die Latenzangaben für SSE2 von George Woltman (meine Quelle) und Hans de Vries (www.chip-architect.com) differieren, aber ich schaue jetzt nicht extra im Manual nach, da das Prinzip gleich bleibt.
Andere Erklärungsidee:
Bis SSE2 werden die 2 oder 4 FP-Operanden bei Rechenoperationen unabhängig voneinander bearbeitet. Dadurch entfallen schon ein paar Schedulingprobleme, da sich die Latenzen nur um 1 Takt erhöhen, der Durchsatz aber verdoppelt. Bei Skalaroperationen wird nicht nur halb soviel pro Befehl erledigt, sondern können im folgenden Code schon nach weniger Takten Befehle auftreten, die vom vorherigen Ergebnis abhängig sind.
Anders dargestellt: Nehmen wir einmal 2 aufeinanderfolgende SSE2-Befehle (ADDPD, 4 Takte Latenz) an, wo der zweite vom ersten abhängt. Arbeite ich gerade nur mit SSE2, müsste ich 4 Takte mit anderen SSE2-Operationen überbrücken. Bei skalaren Operationen bräuchte ich 4 Befehle, bei Vektor-Operationen nur 2, da diese selbst einen Durchsatz von 1 Befehl aller 2 Takte aufweisen. Somit ergeben sich bei Vektorcode weniger Verzögerungen durch Operandenabhängigkeiten, da es bei den 8 Registern einfacher ist, die Lücke mit nur 2 anstatt 4 Befehlen füllen zu müssen.
Man könnte es auch damit vergleichen, daß die Vektorbefehle statt mit 2 Takten Durchsatz nur mit 1 Takt Durchsatz, aber bei halber Taktfrequenz und halben Latenzzeiten ausgeführt werden.
Nachtrag: Die Latenzangaben für SSE2 von George Woltman (meine Quelle) und Hans de Vries (www.chip-architect.com) differieren, aber ich schaue jetzt nicht extra im Manual nach, da das Prinzip gleich bleibt.
Ähnliche Themen
- Antworten
- 0
- Aufrufe
- 482
- Antworten
- 1
- Aufrufe
- 443
- Antworten
- 0
- Aufrufe
- 437
- Antworten
- 0
- Aufrufe
- 374