App installieren
How to install the app on iOS
Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: This feature may not be available in some browsers.
Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
SuperPi goes AVX -> y-cruncher
- Ersteller WindHund
- Erstellt am
WindHund
Grand Admiral Special
- Mitglied seit
- 30.01.2008
- Beiträge
- 12.225
- Renomée
- 536
- Standort
- Im wilden Süden (0711)
- Mitglied der Planet 3DNow! Kavallerie!
- Aktuelle Projekte
- NumberFields@home
- Lieblingsprojekt
- none, try all
- Meine Systeme
- RYZEN R9 3900XT @ ASRock Taichi X570 & ASUS RX Vega64
- BOINC-Statistiken
- Prozessor
- AMD Ryzen 9 5950X
- Mainboard
- ASRock 570X Taichi P5.05 Certified
- Kühlung
- AlphaCool Eisblock XPX, 366x40mm Radiator 6l Brutto m³
- Speicher
- 2x 16 GiB DDR4-3600 CL26 Kingston (Dual Rank, unbuffered ECC)
- Grafikprozessor
- 1x ASRock Radeon RX 6950XT Formula OC 16GByte GDDR6 VRAM
- Display
- SAMSUNG Neo QLED QN92BA 43" up to 4K@144Hz FreeSync PP HDR10+
- SSD
- WD_Black SN850 PCI-Express 4.0 NVME
- HDD
- 3 Stück
- Optisches Laufwerk
- 1x HL-DT-ST BD-RE BH10LS30 SATA2
- Soundkarte
- HD Audio (onboard)
- Gehäuse
- SF-2000 Big Tower
- Netzteil
- Corsair RM1000X (80+ Gold)
- Tastatur
- Habe ich
- Maus
- Han I
- Betriebssystem
- Windows 10 x64 Professional (up to date!)
- Webbrowser
- @Chrome.Google & Edge Chrome
Das bekannte Benchmark Programm SuperPi wird nicht weiter entwickelt, ein Grund mehr neue Ansätze zu wagen.
Der y-cruncher wurde von "Alexander J. Yee" Entwickelt und ist schneller als alle bisher entwickelten Pi Programme.
Es werden Multicore CPU´s unterstüzt und neue Befehlssätze wie z.B. AVX.
Das Programm eignet sich sowohl als Benchmark, als auch als Stabilitätstest.
Download: http://www.numberworld.org/y-cruncher/
Hier ein Ergebnis von meinem Scorpius System mit dem FX-8150 @ standard Takt mit DDR3-1866 CL9:
(Es wurden 1 Milliarde Stellen mit AVX* berechnet, was etwa 4.75GB RAM Auslastung entspricht)
*Der Befehlssatz variiert je nach dem was die CPU unterstüzt, bei mir wurde AVX genutzt.
FYI: Windows 8 unterstüzt in der Consumer Preview Version bisher kein AVX, dort wird SSE4.1 genutzt.
MfG
Der y-cruncher wurde von "Alexander J. Yee" Entwickelt und ist schneller als alle bisher entwickelten Pi Programme.
Es werden Multicore CPU´s unterstüzt und neue Befehlssätze wie z.B. AVX.
Das Programm eignet sich sowohl als Benchmark, als auch als Stabilitätstest.
Download: http://www.numberworld.org/y-cruncher/
Hier ein Ergebnis von meinem Scorpius System mit dem FX-8150 @ standard Takt mit DDR3-1866 CL9:
(Es wurden 1 Milliarde Stellen mit AVX* berechnet, was etwa 4.75GB RAM Auslastung entspricht)
*Der Befehlssatz variiert je nach dem was die CPU unterstüzt, bei mir wurde AVX genutzt.
FYI: Windows 8 unterstüzt in der Consumer Preview Version bisher kein AVX, dort wird SSE4.1 genutzt.
MfG
Sabroe SMC
Grand Admiral Special
- Mitglied seit
- 14.05.2008
- Beiträge
- 4.526
- Renomée
- 387
- Standort
- Castrop-Rauxel
- Mein Laptop
- Gigabyte P37, i7 4720HQ, 16 Gb, 128 Gb SSD, 1Tb HD, 17" FHD
- Prozessor
- AMD Ryzen 9 7950X3D
- Mainboard
- Asus TUF Gaming X670E Plus
- Kühlung
- Noctua NH-D15 chromax.black
- Speicher
- G.Skill Trident Z5 RGB silber DIMM Kit 64GB DDR5-6400 CL32-39-39-102 on-die ECC
- Grafikprozessor
- Palit GeForce RTX 4090 GameRock
- Display
- Samsung U32H850, 31.5" (3840x2160)
- SSD
- Kingston KC3000 PCIe 4.0 NVMe SSD 2TB
- Optisches Laufwerk
- irgendeins
- Soundkarte
- Onboard
- Gehäuse
- SilverStone Seta D1, schwarz
- Netzteil
- ASUS ROG Strix, ROG-STRIX-850G Gold Aura Edition, 850W ATX 3.0
- Tastatur
- Razer BlackWidow Ultimate
- Maus
- Zowie Gaming Mouse FK1
- Betriebssystem
- Windows 11 Pro
- Webbrowser
- Firefox in aktuellster Version
- Internetanbindung
-
▼500 Mbit/s
▲25 Mbit/s
Hab's mal auf i7 2600K @ 4500 MHz | 16 Gb DDR-3 1600 | Win 7 64 laufen lassen.
Anhang anzeigen 25848
Anhang anzeigen 25848
Zuletzt bearbeitet:
G
Gast27042015
Guest
OBrian
Moderation MBDB, ,
- Mitglied seit
- 16.10.2000
- Beiträge
- 17.032
- Renomée
- 267
- Standort
- NRW
- Prozessor
- Phenom II X4 940 BE, C2-Stepping (undervolted)
- Mainboard
- Gigabyte GA-MA69G-S3H (BIOS F7)
- Kühlung
- Noctua NH-U12F
- Speicher
- 4 GB DDR2-800 ADATA/OCZ
- Grafikprozessor
- Radeon HD 5850
- Display
- NEC MultiSync 24WMGX³
- SSD
- Samsung 840 Evo 256 GB
- HDD
- WD Caviar Green 2 TB (WD20EARX)
- Optisches Laufwerk
- Samsung SH-S183L
- Soundkarte
- Creative X-Fi EM mit YouP-PAX-Treibern, Headset: Sennheiser PC350
- Gehäuse
- Coolermaster Stacker, 120mm-Lüfter ersetzt durch Scythe S-Flex, zusätzliche Staubfilter
- Netzteil
- BeQuiet 500W PCGH-Edition
- Betriebssystem
- Windows 7 x64
- Webbrowser
- Firefox
- Verschiedenes
- Tastatur: Zowie Celeritas Caseking-Mod (weiße Tasten)
Wenn man einstellen könnte, ob AVX genutzt wird oder nicht, wäre ein direkter Vergleich auf demselben System mit und ohne interessant, um zu sehen, wieviel AVX bringt.
ONH
Grand Admiral Special
Wenn man einstellen könnte, ob AVX genutzt wird oder nicht, wäre ein direkter Vergleich auf demselben System mit und ohne interessant, um zu sehen, wieviel AVX bringt.
Eigentlich das einzige Feature das dem Programm fehlt, zumal es praktisch unbekannt ist, warte immer noch auf die neue Version 0.6.x welche auch XOP nutzt und wie sich die schlägt, das Programm ist meiner meinung nach viel Sinnvoller als die meissten programme welche Getestet werden und wenn es dann noch alle nützlichen Funktionen unterstützt lässt sich auch zeigen was für ein Potential die einzelnen Prozessoren haben.
Im Unterverzeichnis "Binaries" sind alle Varianten einzeln startbar.
.
EDIT :
.
Hier die 64-Bit-Werte für i7-3770K @4.1GHz, 8GB DDR3/1333, Win7/64 (Pi; total; total mit output und verify):
AVX ~Hina: 292,711s; 334,856s; 347,753s
SSE4.1 ~Nagisa: 325,941s; 372,278s; 386,110s
SSE4.1 ~Ushio: 324,270s; 370,477s; 384,117s
SSE3 ~Kasumi: 324,731s; 371,886s; 385,923s
SSE3: 325,094s; 371,995s; 386,108s
.
EDIT :
.
Werte für 1.000.000.000 decimal digits!
.
EDIT :
.
Hier die 64-Bit-Werte für i7-3770K @4.1GHz, 8GB DDR3/1333, Win7/64 (Pi; total; total mit output und verify):
AVX ~Hina: 292,711s; 334,856s; 347,753s
SSE4.1 ~Nagisa: 325,941s; 372,278s; 386,110s
SSE4.1 ~Ushio: 324,270s; 370,477s; 384,117s
SSE3 ~Kasumi: 324,731s; 371,886s; 385,923s
SSE3: 325,094s; 371,995s; 386,108s
.
EDIT :
.
Werte für 1.000.000.000 decimal digits!
Und Bully macht trotz AVX wieder eine schlechte Figur?
Total Computation Time:
494 Sekunden bei 3.9Ghz (FX8150) zu 324 Sekunden bei 4.5Ghz (I7 2600K)
Taktbereinigt ist Bully um 32% langsamer, obwohl 8 Threads genutzt wurden
Total Computation Time:
494 Sekunden bei 3.9Ghz (FX8150) zu 324 Sekunden bei 4.5Ghz (I7 2600K)
Taktbereinigt ist Bully um 32% langsamer, obwohl 8 Threads genutzt wurden
WindHund
Grand Admiral Special
- Mitglied seit
- 30.01.2008
- Beiträge
- 12.225
- Renomée
- 536
- Standort
- Im wilden Süden (0711)
- Mitglied der Planet 3DNow! Kavallerie!
- Aktuelle Projekte
- NumberFields@home
- Lieblingsprojekt
- none, try all
- Meine Systeme
- RYZEN R9 3900XT @ ASRock Taichi X570 & ASUS RX Vega64
- BOINC-Statistiken
- Prozessor
- AMD Ryzen 9 5950X
- Mainboard
- ASRock 570X Taichi P5.05 Certified
- Kühlung
- AlphaCool Eisblock XPX, 366x40mm Radiator 6l Brutto m³
- Speicher
- 2x 16 GiB DDR4-3600 CL26 Kingston (Dual Rank, unbuffered ECC)
- Grafikprozessor
- 1x ASRock Radeon RX 6950XT Formula OC 16GByte GDDR6 VRAM
- Display
- SAMSUNG Neo QLED QN92BA 43" up to 4K@144Hz FreeSync PP HDR10+
- SSD
- WD_Black SN850 PCI-Express 4.0 NVME
- HDD
- 3 Stück
- Optisches Laufwerk
- 1x HL-DT-ST BD-RE BH10LS30 SATA2
- Soundkarte
- HD Audio (onboard)
- Gehäuse
- SF-2000 Big Tower
- Netzteil
- Corsair RM1000X (80+ Gold)
- Tastatur
- Habe ich
- Maus
- Han I
- Betriebssystem
- Windows 10 x64 Professional (up to date!)
- Webbrowser
- @Chrome.Google & Edge Chrome
Danke an alle für die Ergebnisse!
Danke für den Hinweiß, hab gleich mal alle getestet:
Instructionset|PI Time|Computation Time|Total Time|Multi-core Efficiency
x64 AVX ~ Hina|427.825|492.040|514.399|96.48%
x64 SSE4.1 ~ Nagisa|387.308|443.548|466.159|96.51%
x64 SSE4.1 ~ Ushio|389.699|446.999|468.892|96.23%
x64 SSE3 ~ Kasumi| 391.616|448.489|471.191|95.73%
x64 SSE3|387.690|444.692|466.881|96.41%
Taktbereinigt ist nicht so einfach, da bei mir alle EE (APS, C1E, C´n´Q, EuP2013, CC6 sowie das Coreparking in Windows) aktiv sind.
Ich werde es mal noch mit fixem Takt testen.
@Helle53Im Unterverzeichnis "Binaries" sind alle Varianten einzeln startbar.
Danke für den Hinweiß, hab gleich mal alle getestet:
x64 AVX ~ Hina|427.825|492.040|514.399|96.48%
x64 SSE4.1 ~ Nagisa|387.308|443.548|466.159|96.51%
x64 SSE4.1 ~ Ushio|389.699|446.999|468.892|96.23%
x64 SSE3 ~ Kasumi| 391.616|448.489|471.191|95.73%
x64 SSE3|387.690|444.692|466.881|96.41%
Das der Bulldozer kein Rennwagen ist, sollte inzwischen bekannt sein.Und Bully macht trotz AVX wieder eine schlechte Figur?
Total Computation Time:
494 Sekunden bei 3.9Ghz (FX8150) zu 324 Sekunden bei 4.5Ghz (I7 2600K)
Taktbereinigt ist Bully um 32% langsamer, obwohl 8 Threads genutzt wurden
Taktbereinigt ist nicht so einfach, da bei mir alle EE (APS, C1E, C´n´Q, EuP2013, CC6 sowie das Coreparking in Windows) aktiv sind.
Ich werde es mal noch mit fixem Takt testen.
@Windhund
Deswegen hab ich ja auch mit 3.9Ghz gerechnet, obwohl 1-2 Cores wohl auch mit 4.2Ghz laufen könnten.
Das BD kein Rennwagen ist, ist mir klar, aber wo ist nun dein vielmals raufbeschwörter Vorteil von AVX@Bully ? Wenn nicht hier, wo dann?
(PS.: Die EE-Features sowie Coreparking spielen bei MT-Tests [100% CPU-Auslastung] keine Rolle, wohl eher bei Teillast. Aber du könntest ja mit 4.5GHz ohne allem testen, dann muss man nicht "schätzen" wo er wirklich liegt )
Deswegen hab ich ja auch mit 3.9Ghz gerechnet, obwohl 1-2 Cores wohl auch mit 4.2Ghz laufen könnten.
Das BD kein Rennwagen ist, ist mir klar, aber wo ist nun dein vielmals raufbeschwörter Vorteil von AVX@Bully ? Wenn nicht hier, wo dann?
(PS.: Die EE-Features sowie Coreparking spielen bei MT-Tests [100% CPU-Auslastung] keine Rolle, wohl eher bei Teillast. Aber du könntest ja mit 4.5GHz ohne allem testen, dann muss man nicht "schätzen" wo er wirklich liegt )
WindHund
Grand Admiral Special
- Mitglied seit
- 30.01.2008
- Beiträge
- 12.225
- Renomée
- 536
- Standort
- Im wilden Süden (0711)
- Mitglied der Planet 3DNow! Kavallerie!
- Aktuelle Projekte
- NumberFields@home
- Lieblingsprojekt
- none, try all
- Meine Systeme
- RYZEN R9 3900XT @ ASRock Taichi X570 & ASUS RX Vega64
- BOINC-Statistiken
- Prozessor
- AMD Ryzen 9 5950X
- Mainboard
- ASRock 570X Taichi P5.05 Certified
- Kühlung
- AlphaCool Eisblock XPX, 366x40mm Radiator 6l Brutto m³
- Speicher
- 2x 16 GiB DDR4-3600 CL26 Kingston (Dual Rank, unbuffered ECC)
- Grafikprozessor
- 1x ASRock Radeon RX 6950XT Formula OC 16GByte GDDR6 VRAM
- Display
- SAMSUNG Neo QLED QN92BA 43" up to 4K@144Hz FreeSync PP HDR10+
- SSD
- WD_Black SN850 PCI-Express 4.0 NVME
- HDD
- 3 Stück
- Optisches Laufwerk
- 1x HL-DT-ST BD-RE BH10LS30 SATA2
- Soundkarte
- HD Audio (onboard)
- Gehäuse
- SF-2000 Big Tower
- Netzteil
- Corsair RM1000X (80+ Gold)
- Tastatur
- Habe ich
- Maus
- Han I
- Betriebssystem
- Windows 10 x64 Professional (up to date!)
- Webbrowser
- @Chrome.Google & Edge Chrome
AVX bringt hier wohl nicht viel, zugegeben die AVX Version wurde auf einem I7-2600K optimiert.
Die Last geht ab und zu auf 75% runter bei meinem FX, laut Windows Taskmanager.
Takt|Instructionset|PI Time|Computation Time|Total Time|Multi-core Efficiency
PowerNow!|x64 AVX ~ Hina|427.825|492.040|514.399|96.48%
3.9GHz fix|x64 AVX ~ Hina|428.820|492.988|516.003|96.09%
Mal sehen was XOP später bringt und ob Intel es auch nutzen wird.
Die Last geht ab und zu auf 75% runter bei meinem FX, laut Windows Taskmanager.
PowerNow!|x64 AVX ~ Hina|427.825|492.040|514.399|96.48%
3.9GHz fix|x64 AVX ~ Hina|428.820|492.988|516.003|96.09%
Mal sehen was XOP später bringt und ob Intel es auch nutzen wird.
Zuletzt bearbeitet:
Opteron
Redaktion
☆☆☆☆☆☆
Wer hat gesagt AVX wäre super auf dem BD??Das BD kein Rennwagen ist, ist mir klar, aber wo ist nun dein vielmals raufbeschwörter Vorteil von AVX@Bully ? Wenn nicht hier, wo dann?
Das bringt so gut wie gar nichts. Die Vorteile von AVX sind:
a) 3 Operanden
b) 256bit.
a) bringt nicht immer was, da BD ne look-ahead Funktion hat, die einen benötigten 3.Operanden vorher laden kann und dann genauso schnell ist. Aber kommt auf den Code an.
b) Bringt wirklich nichts auf BD, da es ja nur 2x128bit Pipes gibt. Im Gegenteil, das Teil bremst noch, da die OoO-Flexibilität anscheinend deutlich schlechter ist und/oder das Front-End mit den doubles extra beschäftigt ist, sieht man ja bei den yCrunsher-Ergebnissen.
Wobei: Das ist eher ein grober Eckpunkt, der AVX-Code ist mit VStudio übersetzt, die SSE-Sachen mit ICC. Allerdings war ICC-AVX auf den Intels *langsamer* (kein Scherz). Eventuell sind die Optimierungen bei AVX-Code noch nicht so stark wie bei SSE.
Wie dem auch sei, AMD selbst empfiehlt ja AVX-128 zu nutzen. Eben weil AVX256 nichts bringt, bzw. sogar bremst.
Um nen BD voll auslasten zu können braucht man FMA-Code, dann bringts was. Ansonsten sieht er kein Land gegen Intel. Sieht man auch schon an den theor. FLOP-Zahlen, die betragen bei purem AVX nur die Hälfte. Man kanns sichs auch dadurch klar machen, dass Intel je eine 256bit Add+Mul Pipe hat pro Kern, während BD eben nur eine 256bit Add oder Mul Pipe hat - für 2 Kerne. Kurz: Nur die Hälfte.
Der Autor hat nen Thread bei AMDzone:
http://www.amdzone.com/phpbb3/viewtopic.php?f=532&t=138791
sompe
Grand Admiral Special
- Mitglied seit
- 09.02.2009
- Beiträge
- 14.370
- Renomée
- 1.978
- Mein Laptop
- Dell G5 15 SE 5505 Eclipse Black
- Prozessor
- AMD Ryzen 9 3950X
- Mainboard
- MSI MPG X570 GAMING PRO CARBON WIFI
- Kühlung
- Wasserkühlung
- Speicher
- 4x 16 GB G.Skill Trident Z RGB, DDR4-3200, CL14
- Grafikprozessor
- AMD Radeon RX 6900 XT
- Display
- 1x 32" LG 32UD89-W + 1x 24" Dell Ultrasharp 2405FPW
- SSD
- Samsung SSD 980 PRO 1TB, Crucial MX500 500GB, Intel 600p 512GB, Intel 600p 1TB
- HDD
- Western Digital WD Red 2 & 3TB
- Optisches Laufwerk
- LG GGC-H20L
- Soundkarte
- onboard
- Gehäuse
- Thermaltake Armor
- Netzteil
- be quiet! Dark Power Pro 11 1000W
- Betriebssystem
- Windows 10 Professional, Windows 7 Professional 64 Bit, Ubuntu 20.04 LTS
- Webbrowser
- Firefox
@Twodee
Du beschwerst dich jetzt nicht allen ernstes das der Bulli @ all Core Turbo deutlich langsamer ist als ein zu 36% übertakteter i7 ist und machst dich jetzt nicht allen ernstes darüber lustig das der i7 mit 6 Kernen und 6 FPUs bei einem multicore tauglichen Programm doch tatsächlich deutlich schneller wird und für die gleiche Leistung weniger Taktfrequenz benötigt? Die Ergebnisse decken sich eher halbwegs mit bisherigen FX-8150 vs. i7 2600 Multicore Ergebnissen.
Beim ht4u Test konnte man bereits sehen das der Bulli nicht allso sehr von AVX profitiert und der Hund bei FMA begraben ist. http://ht4u.net/reviews/2011/amd_bulldozer_fx_prozessoren/index17.php
Interessant ist allerdings zu sehen das der Bulli hier mit AVX ca. 10% Leistung verliert wärend der i7 ca. 10% gewinnt. Das dürfte wohl der Pferdefuss am FPU Design sein.
Komm also mal wieder runter und geile dich nicht an absehbaren Ergebnissen auf.
Du beschwerst dich jetzt nicht allen ernstes das der Bulli @ all Core Turbo deutlich langsamer ist als ein zu 36% übertakteter i7 ist und machst dich jetzt nicht allen ernstes darüber lustig das der i7 mit 6 Kernen und 6 FPUs bei einem multicore tauglichen Programm doch tatsächlich deutlich schneller wird und für die gleiche Leistung weniger Taktfrequenz benötigt? Die Ergebnisse decken sich eher halbwegs mit bisherigen FX-8150 vs. i7 2600 Multicore Ergebnissen.
Beim ht4u Test konnte man bereits sehen das der Bulli nicht allso sehr von AVX profitiert und der Hund bei FMA begraben ist. http://ht4u.net/reviews/2011/amd_bulldozer_fx_prozessoren/index17.php
Interessant ist allerdings zu sehen das der Bulli hier mit AVX ca. 10% Leistung verliert wärend der i7 ca. 10% gewinnt. Das dürfte wohl der Pferdefuss am FPU Design sein.
Komm also mal wieder runter und geile dich nicht an absehbaren Ergebnissen auf.
@Opteron: Ok alles. Allerdings hab ich noch im kopf das einige behauptet haben, das AVX auf BD besser umgesetzt worden sei als auf Sandy. Was ist da nun dran?
@Sompe: Schade du hast keinen einzigen Post bzw. dessen Ergebnisse verstanden. Das einzige was annähernd direkt vergleichbar ist, ist Sabroe SMC I7 und Windhunds BD. Da yC sehr gut mit dem Takt skaliert (siehe meine beiden Benches) kann man den Taktunterschied von 600MHz rel. genau rausrechnen. Daher der Unterschied von 32%.
@Sompe: Schade du hast keinen einzigen Post bzw. dessen Ergebnisse verstanden. Das einzige was annähernd direkt vergleichbar ist, ist Sabroe SMC I7 und Windhunds BD. Da yC sehr gut mit dem Takt skaliert (siehe meine beiden Benches) kann man den Taktunterschied von 600MHz rel. genau rausrechnen. Daher der Unterschied von 32%.
sompe
Grand Admiral Special
- Mitglied seit
- 09.02.2009
- Beiträge
- 14.370
- Renomée
- 1.978
- Mein Laptop
- Dell G5 15 SE 5505 Eclipse Black
- Prozessor
- AMD Ryzen 9 3950X
- Mainboard
- MSI MPG X570 GAMING PRO CARBON WIFI
- Kühlung
- Wasserkühlung
- Speicher
- 4x 16 GB G.Skill Trident Z RGB, DDR4-3200, CL14
- Grafikprozessor
- AMD Radeon RX 6900 XT
- Display
- 1x 32" LG 32UD89-W + 1x 24" Dell Ultrasharp 2405FPW
- SSD
- Samsung SSD 980 PRO 1TB, Crucial MX500 500GB, Intel 600p 512GB, Intel 600p 1TB
- HDD
- Western Digital WD Red 2 & 3TB
- Optisches Laufwerk
- LG GGC-H20L
- Soundkarte
- onboard
- Gehäuse
- Thermaltake Armor
- Netzteil
- be quiet! Dark Power Pro 11 1000W
- Betriebssystem
- Windows 10 Professional, Windows 7 Professional 64 Bit, Ubuntu 20.04 LTS
- Webbrowser
- Firefox
So wie ich das sehe vergleichst du einen übertakteten i7 mit nem Bulli @ standard.
Wo ist das Problem beide @ Standard zu testen?
Im Zweifelsfall darfst du dann die zusätzlichen 15% Takt vom i7 wieder abziehen.
Ich für meinen Teil bin dann noch gespannt was bei raus kommt wenn man das beste Ergebnis unabhängig vom Befehlsatz nimmt.
Rein rechnerisch dürfte dann der Vorsprung von 32% auf ca. 6% zusammenschnurren, es sei denn das der Turbo des i7 noch dazwischen funkt.
Wo ist das Problem beide @ Standard zu testen?
Im Zweifelsfall darfst du dann die zusätzlichen 15% Takt vom i7 wieder abziehen.
Ich für meinen Teil bin dann noch gespannt was bei raus kommt wenn man das beste Ergebnis unabhängig vom Befehlsatz nimmt.
Rein rechnerisch dürfte dann der Vorsprung von 32% auf ca. 6% zusammenschnurren, es sei denn das der Turbo des i7 noch dazwischen funkt.
Opteron
Redaktion
☆☆☆☆☆☆
Kann ich mich nicht dran erinnern. Ich denke das war nur im Zusammenhang mit FMA, im Spezialfall von AVX128, oder nur auf die momentan günstigere FPU-Organisation von 2x128 statt 1x256. Aktuell gibts ja nur wenig AVX-Code, da liegen die 256bit brach und die Flops brechen auf die Hälfte = AMD-Niveau ein.@Opteron: Ok alles. Allerdings hab ich noch im kopf das einige behauptet haben, das AVX auf BD besser umgesetzt worden sei als auf Sandy. Was ist da nun dran?
Aber ohne FMA und mit den vollen 256b gibts eigentlich keine Diskussion.
Wie kommst du auf 6%?So wie ich das sehe vergleichst du einen übertakteten i7 mit nem Bulli @ standard.
Wo ist das Problem beide @ Standard zu testen?
Im Zweifelsfall darfst du dann die zusätzlichen 15% Takt vom i7 wieder abziehen.
Ich für meinen Teil bin dann noch gespannt was bei raus kommt wenn man das beste Ergebnis unabhängig vom Befehlsatz nimmt.
Rein rechnerisch dürfte dann der Vorsprung von 32% auf ca. 6% zusammenschnurren, es sei denn das der Turbo des i7 noch dazwischen funkt.
BD@3.9 wäre um 19% langsamer als ein i7@3,5 Ghz (beide mit AllCoreTurbo)
(rechne Sabroe 4.5Ghz i7 auf 3.5Ghz runter)
Zuletzt bearbeitet:
sompe
Grand Admiral Special
- Mitglied seit
- 09.02.2009
- Beiträge
- 14.370
- Renomée
- 1.978
- Mein Laptop
- Dell G5 15 SE 5505 Eclipse Black
- Prozessor
- AMD Ryzen 9 3950X
- Mainboard
- MSI MPG X570 GAMING PRO CARBON WIFI
- Kühlung
- Wasserkühlung
- Speicher
- 4x 16 GB G.Skill Trident Z RGB, DDR4-3200, CL14
- Grafikprozessor
- AMD Radeon RX 6900 XT
- Display
- 1x 32" LG 32UD89-W + 1x 24" Dell Ultrasharp 2405FPW
- SSD
- Samsung SSD 980 PRO 1TB, Crucial MX500 500GB, Intel 600p 512GB, Intel 600p 1TB
- HDD
- Western Digital WD Red 2 & 3TB
- Optisches Laufwerk
- LG GGC-H20L
- Soundkarte
- onboard
- Gehäuse
- Thermaltake Armor
- Netzteil
- be quiet! Dark Power Pro 11 1000W
- Betriebssystem
- Windows 10 Professional, Windows 7 Professional 64 Bit, Ubuntu 20.04 LTS
- Webbrowser
- Firefox
Ich glaube die bessere Unterstützung bezog sich lediglich auf den Befehlssatz und nicht auf die Leistung.
Bevor er raus kam hieß es doch immer das er durch die SSE5 Vorarbeit den einen oder anderen Befehl mehr kann.
Gehe ich dann noch anch den SSE5 Wiki Eintrag, dann war FMA 4 sogar mal ein Bestandteil von AVX, wodurch wir heute bei Intel nur die Sparversion haben.
http://de.wikipedia.org/wiki/Streaming_SIMD_Extensions_5
.
EDIT :
.
Da unbekannt (da nicht getestet) ist mit welcher Taktfrequenz der i7 @ Standard läuft bin ich von den 3,4GHz Standardtakt ausgegangen und das sind ausgehend von den 3,9GHz ca. 15% weniger. Was der Turbo daraus macht...keine Ahnung aber das schrieb ich bereits in dem Posting.
Bei WindHund lief der FX-8150 mit "x64 SSE4.1 ~ Nagisa" ca. 10% schneller als mit "x64 AVX ~ Hina". Grob überschlagen wäre das also eine Angleichung von ca. 25%. OK...wenn man es ganz genau nehmen will wären wir dann bei grob überschlagenen 7% @ i7 2600 Grundtakt.
Edit:
Habe ich deine taktbereinigte Prozentangabe falsch verstanden? Ich hatte es so verstanden das du die 32% auf jeweils 3,9GHz bezogen hattest.
Rechne ich aber mit den 4,5 GHz komme ich auf ca. 52% Mehrleistung bei einer Übertaktung um ca. 28% (mit allcore turbo) bzw. 32% (Grundtakt). Das runter gerechnet und nochmal die 10% für SSE4.1 beim Bulli rauf und ich bin grob geschätzten 10-14% Mehrleistung für den i7.
Bevor er raus kam hieß es doch immer das er durch die SSE5 Vorarbeit den einen oder anderen Befehl mehr kann.
Gehe ich dann noch anch den SSE5 Wiki Eintrag, dann war FMA 4 sogar mal ein Bestandteil von AVX, wodurch wir heute bei Intel nur die Sparversion haben.
http://de.wikipedia.org/wiki/Streaming_SIMD_Extensions_5
.
EDIT :
.
Wie kommst du auf 6%?
BD@3.9 wäre um 19% langsamer als ein i7@3,5 Ghz (beide mit AllCoreTurbo)
(rechne Sabroe 4.5Ghz i7 auf 3.5Ghz runter)
Da unbekannt (da nicht getestet) ist mit welcher Taktfrequenz der i7 @ Standard läuft bin ich von den 3,4GHz Standardtakt ausgegangen und das sind ausgehend von den 3,9GHz ca. 15% weniger. Was der Turbo daraus macht...keine Ahnung aber das schrieb ich bereits in dem Posting.
Bei WindHund lief der FX-8150 mit "x64 SSE4.1 ~ Nagisa" ca. 10% schneller als mit "x64 AVX ~ Hina". Grob überschlagen wäre das also eine Angleichung von ca. 25%. OK...wenn man es ganz genau nehmen will wären wir dann bei grob überschlagenen 7% @ i7 2600 Grundtakt.
Edit:
Habe ich deine taktbereinigte Prozentangabe falsch verstanden? Ich hatte es so verstanden das du die 32% auf jeweils 3,9GHz bezogen hattest.
Rechne ich aber mit den 4,5 GHz komme ich auf ca. 52% Mehrleistung bei einer Übertaktung um ca. 28% (mit allcore turbo) bzw. 32% (Grundtakt). Das runter gerechnet und nochmal die 10% für SSE4.1 beim Bulli rauf und ich bin grob geschätzten 10-14% Mehrleistung für den i7.
Zuletzt bearbeitet:
Das BD unter SSE4.1 10% schneller ist, hab ich übersehen. So gesehen hast du natürlich recht
.
EDIT :
.
.
EDIT :
.
Und ich dachte es ging ums verrechnen, weil beim Sandy da mehrere Einheiten zusammengeschaltet werden müßten... naja wie auch immer.Ich glaube die bessere Unterstützung bezog sich lediglich auf den Befehlssatz und nicht auf die Leistung.
Bevor er raus kam hieß es doch immer das er durch die SSE5 Vorarbeit den einen oder anderen Befehl mehr kann.
Gehe ich dann noch anch den SSE5 Wiki Eintrag, dann war FMA 4 sogar mal ein Bestandteil von AVX, wodurch wir heute bei Intel nur die Sparversion haben.
Opteron
Redaktion
☆☆☆☆☆☆
Lol, man beachte Quelle No. 6Gehe ich dann noch anch den SSE5 Wiki Eintrag, dann war FMA 4 sogar mal ein Bestandteil von AVX, wodurch wir heute bei Intel nur die Sparversion haben.
http://de.wikipedia.org/wiki/Streaming_SIMD_Extensions_5
Crashtest
Redaktion
☆☆☆☆☆☆
- Mitglied seit
- 11.11.2008
- Beiträge
- 9.275
- Renomée
- 1.413
- Standort
- Leipzig
- Mitglied der Planet 3DNow! Kavallerie!
- Aktuelle Projekte
- Collatz, yoyo, radac
- Lieblingsprojekt
- yoyo
- Meine Systeme
- Ryzen: 2x1600, 5x1700, 1x2700,1x3600, 1x5600X; EPYC 7V12 und Kleinzeuch
- BOINC-Statistiken
- Folding@Home-Statistiken
- Mein Laptop
- Lenovo IdeaPad 5 14ALC05
- Prozessor
- Ryzen 7950X / Ryzen 4750G
- Mainboard
- ASRock B650M PGRT / X570D4U
- Kühlung
- be quiet! Dark Rock Pro4 / Pure Rock Slim 2
- Speicher
- 64GB DDR5-5600 G Skill F5-5600J3036D16G / 32 GB DDR4-3200 ECC
- Grafikprozessor
- Raphael IGP / ASpeed AST-2500
- Display
- 27" Samsung LF27T450F
- SSD
- KINGSTON SNVS2000G
- HDD
- - / 8x Seagate IronWolf Pro 20TB
- Optisches Laufwerk
- 1x B.Ray - LG BD-RE BH16NS55
- Soundkarte
- onboard HD?
- Gehäuse
- zu kleines für die GPU
- Netzteil
- be quiet! Pure Power 11 400W / dito
- Tastatur
- CHERRY SECURE BOARD 1.0
- Maus
- Logitech RX250
- Betriebssystem
- Windows 10 19045.4355 / Server 20348.2227
- Webbrowser
- Edge 124.0.2478.51
- Verschiedenes
- U320 SCSI-Controller !!!!
- Internetanbindung
- ▼1000 MBit ▲82 MBit
Der grüne Planet war und ist ne gute zitierbare Quellen oder - selbst heise zitiert uns
Ge0rgy
Grand Admiral Special
- Mitglied seit
- 14.07.2006
- Beiträge
- 4.322
- Renomée
- 82
- Mein Laptop
- Lenovo Thinkpad X60s
- Prozessor
- Phenom II 955 BE
- Mainboard
- DFI LanParty DK 790FXB-M3H5
- Kühlung
- Noctua NH-U12P
- Speicher
- 4GB OCZ Platinum DDR1600 7-7-7 @ 1333 6-6-6
- Grafikprozessor
- Radeon 4850 1GB
- HDD
- Western Digital Caviar Black 1TB
- Netzteil
- Enermax Modu 525W
- Betriebssystem
- Linux, Vista x64
- Webbrowser
- Firefox 3.5
Also bei den SSE-Zahlen schlägt sich Bully garnicht so übel.
AVX in voller Lebensgröße schmeckt der FPU in der Konfiguration noch nicht. Ohne FMA ist da auch nichts zu holen. Wenn man aber betrachtet dass BD bei AVX256 nur grob die Hälfte der Rohleistung gegenüber Sandy aufbieten kann, sind die Werte wiederum recht ordentlich - denn Sandy ist nicht doppelt so schnell.
In der Hinsicht bin ich gespannt was Steamroller uns zeigen wird, ob die FPU da nochmal deutlich getunt wird, oder ob man sich darauf verlässt dass das Fliesskomma-lastige Zeugs mittelfristig von der GPU übernommen wird.
Trotzdem ist die skalierung interessant zu sehen, Helles ivy wird bei AVX nochmal schneller gegenüber den SSEs und BD verliert an Leistung. - Inwieweit die Compiler dabei reinspielen, kann ich aber auch nicht abschätzen. Interessant allemal, dass der ICC überhaupt SSE > 2 auf AMD-CPUs benutzt.
AVX in voller Lebensgröße schmeckt der FPU in der Konfiguration noch nicht. Ohne FMA ist da auch nichts zu holen. Wenn man aber betrachtet dass BD bei AVX256 nur grob die Hälfte der Rohleistung gegenüber Sandy aufbieten kann, sind die Werte wiederum recht ordentlich - denn Sandy ist nicht doppelt so schnell.
In der Hinsicht bin ich gespannt was Steamroller uns zeigen wird, ob die FPU da nochmal deutlich getunt wird, oder ob man sich darauf verlässt dass das Fliesskomma-lastige Zeugs mittelfristig von der GPU übernommen wird.
Trotzdem ist die skalierung interessant zu sehen, Helles ivy wird bei AVX nochmal schneller gegenüber den SSEs und BD verliert an Leistung. - Inwieweit die Compiler dabei reinspielen, kann ich aber auch nicht abschätzen. Interessant allemal, dass der ICC überhaupt SSE > 2 auf AMD-CPUs benutzt.
gurkenstix
Grand Admiral Special
- Mitglied seit
- 18.05.2007
- Beiträge
- 2.794
- Renomée
- 98
Ähnliche Themen
- Antworten
- 0
- Aufrufe
- 30K