App installieren
How to install the app on iOS
Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: This feature may not be available in some browsers.
Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Phenom-Optimierung der SiSoft Sandra Speicherbandbreite
- Ersteller MusicIsMyLife
- Erstellt am
MusicIsMyLife
Redaktion
☆☆☆☆☆☆
- Mitglied seit
- 22.02.2002
- Beiträge
- 15.580
- Renomée
- 2.569
- Standort
- in der Nähe von Cottbus
- Lieblingsprojekt
- Asteroids@Home
- Meine Systeme
- Alltags-PC, Test-PC (wechselnde Hardware)
- BOINC-Statistiken
- Folding@Home-Statistiken
- Mein Desktopsystem
- Alltags-PC
- Mein Laptop
- HP DV7-2225sg
- Prozessor
- AMD Ryzen 9 7950X
- Mainboard
- ASRock B650M PG Riptide
- Kühlung
- Watercool Heatkiller IV Pro Copper
- Speicher
- 2x 32 GB G.Skill TridentZ 5 TGB (F5-6000J3040G32X2-TZ5RS)
- Grafikprozessor
- AMD Radeon RX 6900XT
- Display
- ASUS ROG PG42UQ (3840x2160), Philips BDM4065UC (3840x2160), Samsung C27HG70 (2560x1440)
- SSD
- Micron 9300 Pro 7,68 TB (U.2), Samsung 850 Evo 4 TB (SATA)
- HDD
- keine, SSD only...
- Optisches Laufwerk
- LG CH08LS10 Blu-ray Disc-Player
- Soundkarte
- Creative SoundBlasterX AE-5 Plus
- Gehäuse
- Dimastech BenchTable EasyXL (vorübergehend)
- Netzteil
- Corsair RM850i
- Tastatur
- ASUS ROG Strix Flare
- Maus
- Steelseries Sensei 310
- Betriebssystem
- Windows 10 Professional
- Webbrowser
- Firefox
- Schau Dir das System auf sysprofile.de an
- Internetanbindung
- ▼250 MBit ▲45 MBit
In unserem <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=325750">AMD Phenom-Review</a> sowie im nachfolgenden <a href="http://www.planet3dnow.de/vbulletin/showthread.php?t=326608">Update</a> haben wir gezeigt, dass die Speicherbandbreite im SiSoft Sandra Bandbreitentest sehr bescheiden aussah, während der gleiche Test mit dem Sciencemark genau das Gegenteil zeigte.
Wie wir jedoch ebenfalls erwähnt haben, liegt das schlechte Ergebnis in diesem Test an der genutzen Sandra-Version und der Programmierung des Benchmarks:<ul><i>Der Phenom 9500 schneidet augenscheinlich sehr schlecht ab. Hier muss aber beachtet werden, dass die Entwicklung von SiSoft Sandra noch nicht beim Phenom angekommen ist. Berichte anderer User zeigen ebenfalls eine sehr niedrige Bandbreite. Grund hierfür ist die Programmierung des Tests, welcher erst noch auf die Architektur angepasst werden muss.</i></ul>Bis zur Version, die wir für unsere Reviews genutzt haben (welche die zu diesem Zeitpunkt aktuellste war), wurde während des Bandbreitentests ein Benchmark-Thread pro physischer CPU ausgeführt.
Die Kollegen von Legitreviews.com haben nun einen Vergleich der SiSoft Sandra-Versionen XII sowie XII SP1 vorgenommen. Während die Version XII auf die besagte Abarbeitung eines Berechnungsthreads pro physischer CPU setzt, wird bei der zwischenzeitlich erschienenen Version XII SP1 auf die Abarbeitung eines Threads pro CPU-Kern gesetzt. Als Ergebnis zeigt sich eine Verdoppelung der Speicherbandbreite.
Obwohl dies natürlich gute Nachrichten für den Phenom sind, zeigt sich einmal mehr, wie abhängig das Benchmarkergebnis einer Architektur von der Art der Benchmarkprogrammierung ist. Denn an der Bandbreite selbst hat sich nichts gändert, lediglich die Messung selbiger wurde optimiert.
<b>Links zum Thema:</b> <a href="http://www.legitreviews.com/article/617/1/" target="_blank">AMD Phenom Processors Don't Have Crappy Memory Bandwidth Afterall</a>
Wie wir jedoch ebenfalls erwähnt haben, liegt das schlechte Ergebnis in diesem Test an der genutzen Sandra-Version und der Programmierung des Benchmarks:<ul><i>Der Phenom 9500 schneidet augenscheinlich sehr schlecht ab. Hier muss aber beachtet werden, dass die Entwicklung von SiSoft Sandra noch nicht beim Phenom angekommen ist. Berichte anderer User zeigen ebenfalls eine sehr niedrige Bandbreite. Grund hierfür ist die Programmierung des Tests, welcher erst noch auf die Architektur angepasst werden muss.</i></ul>Bis zur Version, die wir für unsere Reviews genutzt haben (welche die zu diesem Zeitpunkt aktuellste war), wurde während des Bandbreitentests ein Benchmark-Thread pro physischer CPU ausgeführt.
Die Kollegen von Legitreviews.com haben nun einen Vergleich der SiSoft Sandra-Versionen XII sowie XII SP1 vorgenommen. Während die Version XII auf die besagte Abarbeitung eines Berechnungsthreads pro physischer CPU setzt, wird bei der zwischenzeitlich erschienenen Version XII SP1 auf die Abarbeitung eines Threads pro CPU-Kern gesetzt. Als Ergebnis zeigt sich eine Verdoppelung der Speicherbandbreite.
Obwohl dies natürlich gute Nachrichten für den Phenom sind, zeigt sich einmal mehr, wie abhängig das Benchmarkergebnis einer Architektur von der Art der Benchmarkprogrammierung ist. Denn an der Bandbreite selbst hat sich nichts gändert, lediglich die Messung selbiger wurde optimiert.
<b>Links zum Thema:</b> <a href="http://www.legitreviews.com/article/617/1/" target="_blank">AMD Phenom Processors Don't Have Crappy Memory Bandwidth Afterall</a>
wobei die Messung der Speicherbandbreite dort mit aktiviertem TLB-Patch erfolgte.
Dh. ohne geht die Post erst richtig ab.
Aber überhaupt ist die Speicherbandbreite eher uniteressant, siehe C2D, C2Q, die dank grossem und schnellen Cache auch mit weniger Bandbreite noch ganz gut auskommen, dh. bessere Benchmarkresultate liefern.
Die sollten lieber die einzelnen Anwendungen AUCH für den K9/K10 neu optimal compilieren, dann hat der Anwender auch etwas davon. Kommt sicher oft vor, dass da Ressourcen in der CPU brach liegen, weil das Programm bzw. der Compiler diese nicht vorhatte zu nutzen.
Dh. ohne geht die Post erst richtig ab.
Aber überhaupt ist die Speicherbandbreite eher uniteressant, siehe C2D, C2Q, die dank grossem und schnellen Cache auch mit weniger Bandbreite noch ganz gut auskommen, dh. bessere Benchmarkresultate liefern.
Die sollten lieber die einzelnen Anwendungen AUCH für den K9/K10 neu optimal compilieren, dann hat der Anwender auch etwas davon. Kommt sicher oft vor, dass da Ressourcen in der CPU brach liegen, weil das Programm bzw. der Compiler diese nicht vorhatte zu nutzen.
mmoses
Admiral Special
- Mitglied seit
- 20.10.2006
- Beiträge
- 1.899
- Renomée
- 43
- Standort
- Bembeltown
- Mein Laptop
- Lenovo Thinkpad Edge T450
- Prozessor
- AMD Ryzen5 - 1600
- Mainboard
- MSI B350 PC MATE
- Kühlung
- Original Bex Kühler
- Speicher
- 2 x ADATA DIMM 8 GB DDR4-2400
- Grafikprozessor
- Asus Radeon R7 250X
- Display
- 27" iiyama ProLite B2783QSU
- SSD
- Samsung SSD 840PRO 256GB
- HDD
- WD WD20EZRZ 2 TB
- Optisches Laufwerk
- BluRayBrenner PIONEER BDR-209DBK SATA
- Soundkarte
- onboard
- Gehäuse
- Enermax Chakra BS 25cm Fan ATX
- Netzteil
- Enermax EPR385AWT Pro82+ 385W ATX23
- Betriebssystem
- 64-Bit Linux Mint 19.2
- Webbrowser
- Frickelfuchs/opera
Obwohl dies natürlich gute Nachrichten für den Phenom sind, zeigt sich einmal mehr, wie abhängig das Benchmarkergebnis einer Architektur von der Art der Benchmarkprogrammierung ist. Denn an der Bandbreite selbst hat sich nichts gändert, lediglich die Messung selbiger wurde optimiert.
<b>Links zum Thema:</b> <a href="http://www.legitreviews.com/article/617/1/" target="_blank">AMD Phenom Processors Don't Have Crappy Memory Bandwidth Afterall</a>
Genau ..... und wenn wir noch ein halbes Jahr bis zu C2 oder C3 Stepping gehts richtig rund, glaube ich .... weil erstens ham die Sunnyvaler (bzw Dresdner) dann die Kanten glattgefeilt und zweitens die Parzen ihre Benches wenigstens halbwegs angepasst.....
Ich glaub immer noch dass im K10 noch Musigg steckt....
Mmoe
Das ist mir schon öfter aufgefallen, daß die Benchmarks sich mit den aktuellen Intels besser auskennen als mit gleichalten AMDs und angesichts der Tatsache, daß doch viele ihre Kaufentscheidungen von solchen Ergebnissen abhängig machen, finde ich es bedenklich, wenn Benchmarks da nicht unparteiisch sind.
Ole
Grand Admiral Special
Ich frag mich gerade wie sinnlos so ein Bench eigentlich ist, der auf die Hardware angepasst wird.
Vollkommen sinnlos um genau zu sein. Wenn ein Programm so geschrieben wird, das maximale rauszuholen, kann man gleich theoretische Bandbreite minus ein paar Prozent Overhead nehmen, dazu brauche ich keinen Benchmark.
Theoretische Ergebnisse schön und gut aber das ist ja nun vollkommen bekloppt.
Vollkommen sinnlos um genau zu sein. Wenn ein Programm so geschrieben wird, das maximale rauszuholen, kann man gleich theoretische Bandbreite minus ein paar Prozent Overhead nehmen, dazu brauche ich keinen Benchmark.
Theoretische Ergebnisse schön und gut aber das ist ja nun vollkommen bekloppt.
niethi
Vice Admiral Special
- Mitglied seit
- 25.02.2006
- Beiträge
- 888
- Renomée
- 151
- Aktuelle Projekte
- SIMAP, Docking@home
- Lieblingsprojekt
- SIMAP, QMC, F@H
- Meine Systeme
- AMD Athlon X2 6000+ EE
- BOINC-Statistiken
- Folding@Home-Statistiken
- Prozessor
- Core i7-3770
- Betriebssystem
- Gentoo Linux (linux 3.2.12-gentoo)
- Webbrowser
- Chromium
Wenn der Benchmark sich an realen Anwendungen orientiert sicher schon...Ich frag mich gerade wie sinnlos so ein Bench eigentlich ist, der auf die Hardware angepasst wird.
Vollkommen sinnlos um genau zu sein. Wenn ein Programm so geschrieben wird, das maximale rauszuholen, kann man gleich theoretische Bandbreite minus ein paar Prozent Overhead nehmen, dazu brauche ich keinen Benchmark.
Theoretische Ergebnisse schön und gut aber das ist ja nun vollkommen bekloppt.
Als Refernzergebnis für die Softwareentwickler - wieviel sie denn aus ihrem Code herausholen könnten - finde ich sie jedenfalls sehr sinnvoll.
Wenn die Programme am Ende nicht so optimiert werden, wie sie könnten, ist das IMHO nicht der Fehler des Benchmarks.
Wer also nicht eine doppelt so schnelle CPU will, weil seine Software nur 50% herausholt, sollte einmal über ein selbskompilliertes OS nachdenken - oder die teure optimierte Software anschaffen
MusicIsMyLife
Redaktion
☆☆☆☆☆☆
- Mitglied seit
- 22.02.2002
- Beiträge
- 15.580
- Renomée
- 2.569
- Standort
- in der Nähe von Cottbus
- Lieblingsprojekt
- Asteroids@Home
- Meine Systeme
- Alltags-PC, Test-PC (wechselnde Hardware)
- BOINC-Statistiken
- Folding@Home-Statistiken
- Mein Desktopsystem
- Alltags-PC
- Mein Laptop
- HP DV7-2225sg
- Prozessor
- AMD Ryzen 9 7950X
- Mainboard
- ASRock B650M PG Riptide
- Kühlung
- Watercool Heatkiller IV Pro Copper
- Speicher
- 2x 32 GB G.Skill TridentZ 5 TGB (F5-6000J3040G32X2-TZ5RS)
- Grafikprozessor
- AMD Radeon RX 6900XT
- Display
- ASUS ROG PG42UQ (3840x2160), Philips BDM4065UC (3840x2160), Samsung C27HG70 (2560x1440)
- SSD
- Micron 9300 Pro 7,68 TB (U.2), Samsung 850 Evo 4 TB (SATA)
- HDD
- keine, SSD only...
- Optisches Laufwerk
- LG CH08LS10 Blu-ray Disc-Player
- Soundkarte
- Creative SoundBlasterX AE-5 Plus
- Gehäuse
- Dimastech BenchTable EasyXL (vorübergehend)
- Netzteil
- Corsair RM850i
- Tastatur
- ASUS ROG Strix Flare
- Maus
- Steelseries Sensei 310
- Betriebssystem
- Windows 10 Professional
- Webbrowser
- Firefox
- Schau Dir das System auf sysprofile.de an
- Internetanbindung
- ▼250 MBit ▲45 MBit
Ich frag mich gerade wie sinnlos so ein Bench eigentlich ist, der auf die Hardware angepasst wird.
Du sprichst mir gerade aus der Seele.
Wenn es nur nach mir ginge, wäre SiSoft Sandra bereits völlig aus meinen Benchmark-Durchläufen gestrichen. Aber immer wieder wird der Test zugrunde gelegt und da ihn fast jeder nutzt, gehört er auch zu unserem Parcours dazu.
Privat nutze ich seit dem nForce 2 kein Sandra mehr, da ich damals mitbekommen habe, wie merkwürdig der Bandbreitentest programmiert sein muss. Damals habe ich für mich einige Tests gemacht, in denen unter anderem die asymmetrische Bestückung der Speicherkanäle vorkam. Obwohl DualChannel, fiel dort die Bandbreite um ein gutes Stück ab. Im Gegensatz dazu zeigten andere Anwendungen praktisch kaum einen Unterschied zwischen symmetrischer und asymmetrischer Speicherkanal-Bestückung.
Ähnliches ist bei Einführung des AM2 vorgekommen. Während bei der damalig aktuellsten Version der DualCore schlechter abgeschnitten hatte, ist das Bild heute um 180 Grad gedreht.
Die eigentliche Frage, die sich mir stellt, ist die:
Legitreviews.com schreibt ja sinngemäß, dass alle von einer schlechten Bandbreite ausgegangen sind.
legitreviews schrieb:It seems SiSoftware Sandra XII was not correctly optimized for the Phenom processors! We contacted SiSoftware after we were informed by AMD that nearly every memory bandwidth score on the internet was incorrect. Why AMD waited weeks to let us know this is beyond me, but nothing is shocking in this industry.
Wissen nur wir, was für eine zweifelhafte Aussagekraft der Bandbreitentest in Sandra hat? Ist das niemand anderem aufgefallen?
larsbo
Grand Admiral Special
- Mitglied seit
- 20.06.2003
- Beiträge
- 5.864
- Renomée
- 62
- Prozessor
- Ryzen 5 3400G
- Mainboard
- Gigabyte B450I Aorus pro Wifi
- Kühlung
- Noctua NH-L9a
- Speicher
- 32 GB, 2x ADATA 16GB single rank PC4-3200 1,2V (Samsung 16Gbit 2666-Chips)
- Grafikprozessor
- APU
- SSD
- Samsung 970Pro 1TB NVMe PCIe3
- Optisches Laufwerk
- Pioneer BD-RE slim-line
- Soundkarte
- on-board
- Gehäuse
- SilverStone ML08-H
- Netzteil
- Corsair SF450 (80PlusGold)
- Betriebssystem
- Win10pro 64
Ich frag mich gerade wie sinnlos so ein Bench eigentlich ist, der auf die Hardware angepasst wird.
Vollkommen sinnlos um genau zu sein. Wenn ein Programm so geschrieben wird, das maximale rauszuholen, kann man gleich theoretische Bandbreite minus ein paar Prozent Overhead nehmen, dazu brauche ich keinen Benchmark.
Theoretische Ergebnisse schön und gut aber das ist ja nun vollkommen bekloppt.
Absolut. Wenn das von mir benutzte Programm nun Speicherzugriffe so organisiert, wie der "alte" Sandra-Speicherbench, dann hab ich nämlich auch nichts davon, dass der neue Bench nun irgendwelche tollen Werte zeigt......
Diese theoretischen Benches waren schon immer und sind immer noch Käse. Egal ob nun Intel oder AMD. Entscheidend ist, dass die Aufgaben, die man macht, schneller oder langsamer abgearbeitet werden.
U
User002
Guest
Wissen nur wir, was für eine zweifelhafte Aussagekraft der Bandbreitentest in Sandra hat? Ist das niemand anderem aufgefallen?
Zumal du ja von Anfang gesagt hast, dass der Benchmark sozusagen "entsorgt" gehört...
Aber schau dir doch mal die Qualität der durschnittlichen Reviews im Netz so an....
Ohne dir jetzt Honig um den Bart schmieren zu wollen, hat man bei dir doch das Gefühl, dass du einfach bisschen mehr Ahnung von der Materie hast, was sich auch in deinen Reviews wiederspiegelt.....
Diese theoretischen Benches waren schon immer und sind immer noch Käse. Egal ob nun Intel oder AMD. Entscheidend ist, dass die Aufgaben, die man macht, schneller oder langsamer abgearbeitet werden.
Aber auch nur weil die meisten Benchmarks viel zu überbewertet werden, meiner Meinung nach...Es wird objektivität suggeriert....
Benchmarks sind insofern hilfreich um die Grund - Funktion der Hardware zu testen, Fehler aufzuspüren. zu optimieren... Dafür nutze ich sie persönlich... Für Vergleiche zwischen Produkten ist das immer so eine Sache, grade bei ganz neuen Produkten, wie der Speichertest hier zeigt....Vor allem auch, weil die Produkte auch "streuen", man also für 100% objektivität einen Mittelwert mehrerer Setups bräuchte. Insofern immer nur ein Anhaltspunkt...
Grüße!
BLJ
Admiral Special
Tjoa...
zum Thema Durchsatz, nicht zum Thema Bench ( ):
Was es zeigt ist, dass man beim Phenom für einen einzelnen Thread nur noch eine relativ schwache Bandbreite hat.
So wie ich es sehe, wurde die Architektur optimiert für den Fall, dass zwei Threads parallel laufen, die viel Speicherbandbreite benötigen ( so viel sie kriegen können). Ein einzelner Thread der viel Bandbreite braucht (der weitaus häufigere Fall?), dem gehts jetzt aber schlechter... so gesehen nicht grad ne Optimierung?
Bzw., ggf. kriegt man ne bessere Bandbreite hin wenn man einen bandbreiten-hungrigen Thread auf mehrere Bandbreiten-hungrige Threads verteilt; was dann aber wieder mehr overhead und (sonst unnötiger) Synchronisationaufwand bedeutet - unter'm strich wirds langsamer sein als vorher?!
Na gut, vielleicht gibt's dadurch noch andere (Latenz- ?) Optimierungen, wenn nun die Hälfte der Threads beim Memorycontroller in der Queue stehen?
Die Latenz könnte ja durchaus auch von starker Bedeutung sein...
zum Thema Durchsatz, nicht zum Thema Bench ( ):
Was es zeigt ist, dass man beim Phenom für einen einzelnen Thread nur noch eine relativ schwache Bandbreite hat.
So wie ich es sehe, wurde die Architektur optimiert für den Fall, dass zwei Threads parallel laufen, die viel Speicherbandbreite benötigen ( so viel sie kriegen können). Ein einzelner Thread der viel Bandbreite braucht (der weitaus häufigere Fall?), dem gehts jetzt aber schlechter... so gesehen nicht grad ne Optimierung?
Bzw., ggf. kriegt man ne bessere Bandbreite hin wenn man einen bandbreiten-hungrigen Thread auf mehrere Bandbreiten-hungrige Threads verteilt; was dann aber wieder mehr overhead und (sonst unnötiger) Synchronisationaufwand bedeutet - unter'm strich wirds langsamer sein als vorher?!
Na gut, vielleicht gibt's dadurch noch andere (Latenz- ?) Optimierungen, wenn nun die Hälfte der Threads beim Memorycontroller in der Queue stehen?
Die Latenz könnte ja durchaus auch von starker Bedeutung sein...
.. wer misst, misst Mist.
Hm, so weit würd ich mich nicht aus dem Fenster lehnen. Ich könnte mir vorstellen das bei Sandra an noch mehr Stellen gedreht wurde, als die reine Umstellung auf einzelne Threads. Wir wissen nicht was für Compiler Einstellungen usw. noch geändert wurden. Ich halte von synthetischen Benchmarks nicht viel, bei denen man die Sourcen nicht sehen kann. Ich kann mich nicht darauf verlassen, das was ich messen will auch wirklich gemessen wird und annähernd der Realität entspricht.
Benchmarks mit sog. "Realworld" Anwendungen sind relevanter, weil ich als Benutzer sehen kann was mir neue Technologien bringen.
Grüße
kirsche
Was es zeigt ist, dass man beim Phenom für einen einzelnen Thread nur noch eine relativ schwache Bandbreite hat.
Hm, so weit würd ich mich nicht aus dem Fenster lehnen. Ich könnte mir vorstellen das bei Sandra an noch mehr Stellen gedreht wurde, als die reine Umstellung auf einzelne Threads. Wir wissen nicht was für Compiler Einstellungen usw. noch geändert wurden. Ich halte von synthetischen Benchmarks nicht viel, bei denen man die Sourcen nicht sehen kann. Ich kann mich nicht darauf verlassen, das was ich messen will auch wirklich gemessen wird und annähernd der Realität entspricht.
Benchmarks mit sog. "Realworld" Anwendungen sind relevanter, weil ich als Benutzer sehen kann was mir neue Technologien bringen.
Grüße
kirsche
Scour
Grand Admiral Special
- Mitglied seit
- 17.03.2002
- Beiträge
- 4.825
- Renomée
- 66
- Standort
- Unterfranken
- Mein Laptop
- Fujitsu A3510
- Prozessor
- Intel i5-6600K
- Mainboard
- Asrock Z270 Pro4
- Kühlung
- be quiet! Pure Rock Slim
- Speicher
- 2x4GB G.Skill Aegis DDR4-2400 DIMM CL15
- Grafikprozessor
- Asus GTX 460 OC
- Display
- Acer LED S1 S221HQLbid
- SSD
- Teamgroup L3 Evo 960GB,Kingston HyperX Savage 480GB, Mushkin Reactor 1TB, Plextor M5S, Crucial M4
- HDD
- WD20PURZ, Toshiba V300, Hitachi 7K2000 usw.
- Optisches Laufwerk
- LG GH24NSD6, Pioneer BDR-209EBK
- Soundkarte
- Onboard
- Gehäuse
- Zalmann MS800
- Netzteil
- Seasonic G450
- Betriebssystem
- WinXP Pro, W7 HP 64 Bit, W8.1 64 Bit, W10-64Bit
- Webbrowser
- Firefox
- Verschiedenes
- So, sollte für eine Weile reichen :)
Was interessiert mich eine Bnadbreite, die im normalen Betrieb nie zum Tragen kommt
Drohne
Vice Admiral Special
- Mitglied seit
- 27.09.2007
- Beiträge
- 863
- Renomée
- 20
Das ist mir schon öfter aufgefallen, daß die Benchmarks sich mit den aktuellen Intels besser auskennen als mit gleichalten AMDs und angesichts der Tatsache, daß doch viele ihre Kaufentscheidungen von solchen Ergebnissen abhängig machen, finde ich es bedenklich, wenn Benchmarks da nicht unparteiisch sind.
Das liegt eigentlich in der Natur der Sache - denn Intel liefert den Referenz-C Compiler, auf den der weitläufig benutzte Compiler von MS aufbaut! Kaum jemand setzt eine Compiler-Suite von Pathscale, NAG oder PGI ein, geschweige denn der wesentlich 'vergleichbarere' GNU gcc. Letzterer ist angeblich zu langsam - wohl aber auf allen Architekturen eben gleich lahm!
Insofern sind mir unter Windoof getätigte Benchmarks eh suspekt! Interessanter sind die Meßwerte der SPEC Suite. Sie sagen wirklich etwas über die Leistungsfähigkeit einer CPU aus, wenn man sie zu lesen versteht. Wer aber auf bunte Bilder und schicke bunte Balken in sog. Diagrammnen steht ...
Berniyh
Grand Admiral Special
- Mitglied seit
- 29.11.2005
- Beiträge
- 5.206
- Renomée
- 219
Als es darum ging den Phenom zu bashen hat es erstaunlich viele interessiert.Was interessiert mich eine Bnadbreite, die im normalen Betrieb nie zum Tragen kommt
Scour
Grand Admiral Special
- Mitglied seit
- 17.03.2002
- Beiträge
- 4.825
- Renomée
- 66
- Standort
- Unterfranken
- Mein Laptop
- Fujitsu A3510
- Prozessor
- Intel i5-6600K
- Mainboard
- Asrock Z270 Pro4
- Kühlung
- be quiet! Pure Rock Slim
- Speicher
- 2x4GB G.Skill Aegis DDR4-2400 DIMM CL15
- Grafikprozessor
- Asus GTX 460 OC
- Display
- Acer LED S1 S221HQLbid
- SSD
- Teamgroup L3 Evo 960GB,Kingston HyperX Savage 480GB, Mushkin Reactor 1TB, Plextor M5S, Crucial M4
- HDD
- WD20PURZ, Toshiba V300, Hitachi 7K2000 usw.
- Optisches Laufwerk
- LG GH24NSD6, Pioneer BDR-209EBK
- Soundkarte
- Onboard
- Gehäuse
- Zalmann MS800
- Netzteil
- Seasonic G450
- Betriebssystem
- WinXP Pro, W7 HP 64 Bit, W8.1 64 Bit, W10-64Bit
- Webbrowser
- Firefox
- Verschiedenes
- So, sollte für eine Weile reichen :)
Als es darum ging den Phenom zu bashen hat es erstaunlich viele interessiert.
Ich hab Sandra nie ernstgenommen, egal was ich gerade hatte, ob Intel oder AMD da führte war mir immer egal
Saulus
Grand Admiral Special
- Mitglied seit
- 11.07.2005
- Beiträge
- 8.747
- Renomée
- 95
- Mein Laptop
- ACER 5930G
- Prozessor
- ii7-4790K
- Mainboard
- GIGABYTE GA-Z97P-D3
- Kühlung
- HR-02 Macho Rev. B
- Speicher
- 16 GB DDR3-1600
- Grafikprozessor
- GTX 980ti
- Display
- 27" iiyama B2776HDS
- SSD
- 2x SSD 256GB
- HDD
- 1x HDD 750GB
- Optisches Laufwerk
- keins mehr
- Soundkarte
- nur noch Onboard
- Gehäuse
- ANTEC Sonata III
- Netzteil
- Enermax Liberty ECO II 720W
- Betriebssystem
- W7
- Webbrowser
- FireFox
Benchmarks die immer erst Updates benötigen um neue Hartware richtig zu testen sind gelinde gesagt suspekt. Es geht da nicht um irgendwelche Besonderheiten die noch nie da waren die getestet werden müssen, sondern nur um die Speicherbandbreite. Die gibt es schon seit was weis ich...
Ich glaube das solche Benchmarks dann auch nur so gut testen wie die Optimierung für das neue System ausgefallen ist. Aber nicht die tatsächliche Leistung.
Ich glaube das solche Benchmarks dann auch nur so gut testen wie die Optimierung für das neue System ausgefallen ist. Aber nicht die tatsächliche Leistung.
G
Gast29012019_2
Guest
Ist das den nicht normal, Nvidia macht es auch nicht anders. Da wird mal eben der neuste Treiber optimiert, damit sie im Benchmark noch besser darstehen.
Von daher sollte man sich nicht wundern, wenn das jetzt überall dort gemacht wird, wovon man sich was versprechen kann. Man wäre ja ein Looser wenn man es nicht tut.
Wobei ich mich trotzdem Frage das man keine anderen Programme dafür nutzen kann, mit Everrrest z.b in der Ultimate Edition läßt sich ja auch ziemlich viel dahingehend messen. Oder wird SIS benutzt, weil jeder es mittlerweile nutzt, oder weil sonst kein vgl. mit älteren Benchmarks möglich ist. Irgendwo muß man ja ein Schnitt machen.
Von daher sollte man sich nicht wundern, wenn das jetzt überall dort gemacht wird, wovon man sich was versprechen kann. Man wäre ja ein Looser wenn man es nicht tut.
Wobei ich mich trotzdem Frage das man keine anderen Programme dafür nutzen kann, mit Everrrest z.b in der Ultimate Edition läßt sich ja auch ziemlich viel dahingehend messen. Oder wird SIS benutzt, weil jeder es mittlerweile nutzt, oder weil sonst kein vgl. mit älteren Benchmarks möglich ist. Irgendwo muß man ja ein Schnitt machen.
larsbo
Grand Admiral Special
- Mitglied seit
- 20.06.2003
- Beiträge
- 5.864
- Renomée
- 62
- Prozessor
- Ryzen 5 3400G
- Mainboard
- Gigabyte B450I Aorus pro Wifi
- Kühlung
- Noctua NH-L9a
- Speicher
- 32 GB, 2x ADATA 16GB single rank PC4-3200 1,2V (Samsung 16Gbit 2666-Chips)
- Grafikprozessor
- APU
- SSD
- Samsung 970Pro 1TB NVMe PCIe3
- Optisches Laufwerk
- Pioneer BD-RE slim-line
- Soundkarte
- on-board
- Gehäuse
- SilverStone ML08-H
- Netzteil
- Corsair SF450 (80PlusGold)
- Betriebssystem
- Win10pro 64
Das liegt eigentlich in der Natur der Sache - denn Intel liefert den Referenz-C Compiler, auf den der weitläufig benutzte Compiler von MS aufbaut! Kaum jemand setzt eine Compiler-Suite von Pathscale, NAG oder PGI ein, geschweige denn der wesentlich 'vergleichbarere' GNU gcc. Letzterer ist angeblich zu langsam - wohl aber auf allen Architekturen eben gleich lahm!
Insofern sind mir unter Windoof getätigte Benchmarks eh suspekt! Interessanter sind die Meßwerte der SPEC Suite. Sie sagen wirklich etwas über die Leistungsfähigkeit einer CPU aus, wenn man sie zu lesen versteht. Wer aber auf bunte Bilder und schicke bunte Balken in sog. Diagrammnen steht ...
Ooch, die c´t macht aus Spec-Werten auch bunte Balken, warum auch nicht?
Man sollte für real-life Anwendungen die Bedeutung der compiler aber auch nicht überbewerten. Die AMD-Architektur ist IMHO so ausgelegt, dass sie mit relativ unterschiedlichem code jeweils gut zurecht kommt. Wer einen leistungsfähigen Prozessor als kleinerer Mitbewerber basteln will, ist auch immer gut beraten, das so zu machen. Und grundsätzliche Schwächen, wie die SSE2/3-Schwäche des K8 (im K10 ja nun behoben) lassen sich auch mit dem tollsten Compiler nicht umgehen. Solange ein Intel-Compilat nicht grundsätzliche code-Funktionen auf einem AMD verweigert (gabs ja durchaus auch) ist der Code vom Intel-Compiler sogar oft immer noch schneller auf AMD-Systemen als Code von sog. AMD-optimierten Compilern.......
PrakashP
Captain Special
- Mitglied seit
- 18.02.2005
- Beiträge
- 207
- Renomée
- 1
So wie ich es sehe, wurde die Architektur optimiert für den Fall, dass zwei Threads parallel laufen, die viel Speicherbandbreite benötigen ( so viel sie kriegen können). Ein einzelner Thread der viel Bandbreite braucht (der weitaus häufigere Fall?), dem gehts jetzt aber schlechter... so gesehen nicht grad ne Optimierung?
Der Phenom hat eine NUMA Architektur, da er zwei unabhängige Speichercontroller hat, verhält sich also eher wie ein SMP System als Multicore.
Es ist keine Benchmark Optimierung, wenn man mehrere Threads startet um die aggregierte Speicherbandbreite zu messen, sondern das ist der normale use case, daß man mehrere Threads auf einer Multicore CPU laufen läßt... Wen interessieren noch single threaded benchmarks?
BLJ
Admiral Special
Der Phenom hat eine NUMA Architektur, da er zwei unabhängige Speichercontroller hat, verhält sich also eher wie ein SMP System als Multicore.
Es ist keine Benchmark Optimierung, wenn man mehrere Threads startet um die aggregierte Speicherbandbreite zu messen, sondern das ist der normale use case, daß man mehrere Threads auf einer Multicore CPU laufen läßt... Wen interessieren noch single threaded benchmarks?
Was nützen einem mehrere concurrent Threads wenn die keine solchen Bandbreiten benötigen?
Mit Optimierung habe ich nicht Optimierung auf Benchmarks gemeint sondern auf Bandbreiten-hungrige Anwendungen die produktiv eingesetzt werden sollen.
Aber die Anmerkungen oben sind vermutlich korrekt und es ist das bessere Design...
PrakashP
Captain Special
- Mitglied seit
- 18.02.2005
- Beiträge
- 207
- Renomée
- 1
Was nützen einem mehrere concurrent Threads wenn die keine solchen Bandbreiten benötigen?
Interessanter ist die Latenz, welche sich meines Wissens auch mit NUMA reduziert (sofern man nicht auf den an den anderen controller angekoppelten Speicher zugreift). Denn Zugriffe auf Hauptspeicher verlangsamen eine CPU ungemein und es wird sehr viel Aufwand betrieben um solche Zugriffe um Fraktionen von Prozenten zu reduzieren.
Der Phenom führt als erster x86 Prozessor auch out-of-order Loads durch, bin mal gespannt, ob damit das bekannte x86 memory model aufgeweicht wird und es Richtung Itanium geht.
Drohne
Vice Admiral Special
- Mitglied seit
- 27.09.2007
- Beiträge
- 863
- Renomée
- 20
Phenom-CPUs auf Basis der Barcelona Architektur haben KEINE zwei unabhängige Speichercontroller! Das Attribut 'unabhängig' ist hier falsch! Der Speichercontroller des Phenom ist in der Lage zwei 64 Bit Worte unabhängig zu lesen oder schreiben, vorausgesetzt sie befinden sich in zwei unterschiedlichen Bänken.
Eine NUMA haben alle Zwei- bis n-Sockel Opteron/Barcelona.
Eine NUMA haben alle Zwei- bis n-Sockel Opteron/Barcelona.
Opteron
Redaktion
☆☆☆☆☆☆
Jo, im rauhen Internet treiben sich viele zweifelhaften Gestalten mit erstaunlich großem Halbwissen rum ...Wissen nur wir, was für eine zweifelhafte Aussagekraft der Bandbreitentest in Sandra hat? Ist das niemand anderem aufgefallen?
Das 1 thread benches nicht die volle RAM Bandbreite von Multicore CPUs mit integriertem Speicherkontroller nützen, vermute ich schon seit über nem Jahr .. aber auch wenn ich in allen möglichen Foren schreib ... bis sich sowas rumspricht .. dauert es
ciao
Alex
wadenbeisser
Vice Admiral Special
- Mitglied seit
- 03.12.2007
- Beiträge
- 825
- Renomée
- 2
Ich halte den bench allgemein für recht zweifelhaft. Ich habe den kram zwar schon ne weile nicht mehr genutzt aber ich erinnere mich noch an Zeiten wo bei den Prozessortests die SSE Einheit bei intel CPUs genutzt wurde und bei den AMD Prozessoren lediglich die FPU zum Einsatz kam.....obwohl diese ebenfalls SSE unterstützte.Wissen nur wir, was für eine zweifelhafte Aussagekraft der Bandbreitentest in Sandra hat? Ist das niemand anderem aufgefallen?
Somit wird mit zweierlei Maß gemessen, die Vergleichbarkeit ist dahin und das Programm war somit für mich gestorben.
PrakashP
Captain Special
- Mitglied seit
- 18.02.2005
- Beiträge
- 207
- Renomée
- 1
Phenom-CPUs auf Basis der Barcelona Architektur haben KEINE zwei unabhängige Speichercontroller! Das Attribut 'unabhängig' ist hier falsch! Der Speichercontroller des Phenom ist in der Lage zwei 64 Bit Worte unabhängig zu lesen oder schreiben, vorausgesetzt sie befinden sich in zwei unterschiedlichen Bänken.
Nun ja, ich kann nur das wiedergeben, was Mike Wall von AMD auf der TechEd Developers in Barcelona über den Barcelona zum besten gegeben hatte.
Ferner scheint http://www.channelinsider.com/print_article/AMD+Unveils+Barcelona+QuadCore+Details/191008.aspx oder auch http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2939&p=7 das zu bestätigen, daß es sich um unabhängige controller handelt (wie auch immer man nun "unabhängig" definieren mag). Man müßte mal in AMD's whitepapers nachlesen, um das endgültig zu verifizieren, was ich aber auch nicht getan habe.
Ok, hier scheint was beschrieben zu sein: http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/31116.pdf den Punkt 2.8. Das TEil hat zwei DRAM Controller DCT0 und DCT1, die im "ganged" oder "unganged" mode betrieben werden können. Letzteres wird unter 2.8.4 empfohlen und entspricht meinem Verständnis einer NUMA Architektur, [EDIT] wobei es wohl auch ankommt, wie die cores dran geknüpft sind. Hmm. Wenn ich den L3 cache auch noch bedenke, denn sich ja alle cores teilen, und der ja vor den memory controllern liegen sollte, macht es in der Tat nicht viel Sinn von NUMA zu reden. Also nehme ich das zurück. Der Effekt der höheren Bandbreite ist aber ähnlich.
Zuletzt bearbeitet:
Ähnliche Themen
- Antworten
- 9
- Aufrufe
- 4K
- Antworten
- 14
- Aufrufe
- 4K
- Antworten
- 0
- Aufrufe
- 33K