BOINC Performance auf AMD Ryzen

Wegen der SMT-Problematik und wegen der trotz Corsair H100 Wakü und EPU-Einsatzes (Vcore 1,35 V lt. Ryzen Master, 1,84 V lt. CPU-Z) hohen Temps (ca. 87°) habe ich nur 50% der Kerne für Boinc aktiv. Damit ist die CPU-Temp. bei 72° :]
Mir scheint, das die Zeit so besser ist, als mit 16 Threads ... (kann die WUs leider nicht ganz genau von denen aus dem Versuch mit mit 8 Cores und 3,7 GHz unterscheiden)

Der GSkill-2666-Speicher aus der QVL will auch nur mit 2133 laufen ... es gibt da noch einiges zu tun für Asus....

EDIT: Jetzt geht der Speicher mit 2666, sogar abweichend von der QVL mit allen 4 8MB-Modulen!
Man muss D.C.O.P. im Bios aktivieren ...
 
Zuletzt bearbeitet:
Nee bringt nix, die WUs brechen nach ~10 Sekunden ab, hab ich schon im Asteroids Forum gemeldet...

Achso jetzt, das Projekt läuft nicht, lol, falsch verstanden. Ok, blöd dann ..

"Illegal instruction" hmm, was kann das denn nun sein. Kannst Du mal unter Linux eine Übersicht der unterstützten Befehle abfragen und hier posten? Vielleicht fehlt irgendwas.

Gibts über cpuid, dmidecode oder /proc/cpuinfo

Poste dann hier mal alles, am besten in nem Spoiler, ansonsten wird es zu lang.

Danke

Alex
 
processor : 15
vendor_id : AuthenticAMD
cpu family : 23
model : 1
model name : AMD Ryzen 7 1700 Eight-Core Processor
stepping : 1
microcode : 0x8001105
cpu MHz : 3600.000
cache size : 512 KB
physical id : 0
siblings : 16
core id : 7
cpu cores : 8
apicid : 15
initial apicid : 15
fpu : yes
fpu_exception : yes
cpuid level : 13
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm constant_tsc rep_good nopl nonstop_tsc extd_apicid aperfmperf pni pclmulqdq monitor ssse3 fma cx16 sse4_1 sse4_2 movbe popcnt aes xsave avx f16c rdrand lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw skinit wdt tce topoext perfctr_core perfctr_nb bpext perfctr_l2 mwaitx hw_pstate vmmcall fsgsbase bmi1 avx2 smep bmi2 rdseed adx smap clflushopt sha_ni xsaveopt xsavec xgetbv1 xsaves clzero irperf arat npt lbrv svm_lock nrip_save tsc_scale vmcb_clean flushbyasid decodeassists pausefilter pfthreshold avic overflow_recov succor smca
bugs : fxsave_leak sysret_ss_attrs null_seg
bogomips : 7163.90
TLB size : 2560 4K pages
clflush size : 64
cache_alignment : 64
address sizes : 48 bits physical, 48 bits virtual
power management: ts ttp tm hwpstate eff_freq_ro [13] [14]

x 16 ;-)
 
Mein 1700er mit Boxed kommt unter wuprop, 15x wcg scc und 1x Collatz (auf der RX460) auf 61°C
 
@koschi: Danke, das ging ja fix.

Da sind aber wieder alle Befehle drin, die ich im Asteroid-Forum gepostet hatte. An denen kann es also nicht liegen.
Merkwürdig, möglicherweise bedingt irgendein Flag noch anderer Befehle, die Zen dann doch nicht kann.
 
Mit dem 1700X@3,8 GHz komme ich mit SSE3 auf Laufzeiten zwischen 5.600 und 6.200 Sekunden CPU-Zeit. AVX benutzt er scheinbar nicht. *noahnung*

Heftig: http://asteroidsathome.net/boinc/workunit.php?wuid=62473513
Cuda unter Linux benötigt eine Laufzeit von 1,881.11 Sekunden vs. 5,598.78 Sekunden auf meinem 1700X

Nunja aber 5600 sec durch 8 gleich 700 sec . also alle 700 sec 1 WU fertig oder durch 16 wäre alle 350 sec eine Wu oder bin ich gerade durch den wind ?

Und Graka verbrauch (vermutlich )auch mehr Saft .

gruß Manni
 
Zuletzt bearbeitet:
Nunja aber 5600 sec durch 8 gleich 700 sec . also alle 700 sec 1 WU fertig oder durch 16 wäre alle 350 sec eine Wu oder bin ich gerade durch den wind ?

Und Graka verbrauch (vermutlich )auch mehr Saft .

gruß Manni

Vorletzteres ;)
Das war eine WU welche (normalerweise) auf einem Kern gerechnet wurde
 
Einstein@home hat die O1MD1CV WUs jetzt auch für AMD (Ryzen) freigeschaltet, vorher gab es die nur für Intel hosts.
Da hatte ich bisher nur Haswell E3 und E5 XEON als Gegenspieler, bei ersterem eine non-SMT CPU, bei letzterem SMT abgeschaltet oder BOINC per ncpus auf 6 begrenzt.
Mit 45-49k Sekunden pro WU ist der R7 3-4h langsamer als die Intel, angesichts der SMT/non-SMT Geschichte denke ich die Laufzeiten sind aber sehr ordentlich.

https://einsteinathome.org/content/introducing-new-amd-ryzen
 
Zuletzt bearbeitet:
Oh, das ist bemerkenswert.
 
ATLAS AEI Hannover hat auch zahlreiche Xeon E3-1231 v3 (Haswell, 4c/8t, 3.4-3.8GHz) im Repertoire. Diese zeigen ziemlich identische Laufzeiten wie der R7, haben aber natürlich nur die Hälfte der Threads. Denke der R7 taugt auch bei Einstein *great*
 
Mein R7 @ 3.6GHz mit Linux bei TN-Grid:
http://gene.disi.unitn.it/test/results.php?hostid=2506


Zu den Tests mit Einstein Gravitational Wave Search zitiere ich mich selbst:
Results for the standalone 8 vs. 16 thread comparison on a random WU are in. Running 8 threads they finished in 31933 seconds (average), running 16 threads completion times went up to 60740 seconds.

A small 10% throughput gain, less than anything I have seen on other projects to date.

Most of my WUs complete in shorter time though (<50k seconds). Comparing their times against the wing mates (most are ATLAS Haswell Xeon), they are of course usually 25-40% slower than the non-SMT Intels, but run 16 and not 4-6 jobs at once. Without SMT the R7 should outperform these Xeon and still run more WUs in parallel.
 
Asteroids@Home mit 1700X

a) unter Linux mit AVX deutlich langsamer bei gleicher Frequenz (3,5 GHz) als unter Win10 mit SSE3
b) benötigt auch noch 1,35 Standardspannung, sonst bleibt er hängen, Win10 mit 1,2 Volt Stromspar

Linux (Ubuntu 17.04) AVX: im Durchschnitt hohe 7900-8300 Sekunden
http://asteroidsathome.net/boinc/workunit.php?wuid=62784077
http://asteroidsathome.net/boinc/workunit.php?wuid=62784139
Win10 SSE3: im Durchschnitt 7200-7500 Sekunden
http://asteroidsathome.net/boinc/workunit.php?wuid=62706780

@Einstein
mit AVX unter Linux nur Hänger, trotz erhöhter Spannung :]
 
Zuletzt bearbeitet:
Danke euch!

Das der Ryzen bei TN-Grid unter Linux nicht auch schneller ist finde ich seltsam.
 
ist alles im Bios default also 16 T quer Beet.
Overclocking und Optimierungen mache ich erst unter Wasser.

Linux wird der R7 erst einmal dann nur in einer VM schmecken sollte dies reibungslos funktionieren.

Edit:

Ich hatte im BM nur 50% CPU eingestellt ich denke daher stammen die guten Zeiten, jetzt auf 100% ziehen die Zeiten auch nach oben.
unter Wasser habe ich @default 40-46°C je nach Sensor bei 1,1Vcore laut CPUz und 130-140W Verbrauch vom Gesamtsystem laut Schätzeisen.

Tests mit Linux VM mache ich morgen

Edit No²:

VM Ware Player installiert und mit Linux Mint Mate sind die Laufzeiten bei TN ca 200-300 Sec. schneller
http://gene.disi.unitn.it/test/results.php?hostid=5770&offset=0&show_names=0&state=2&appid=
 
Zuletzt bearbeitet:
Asteroids@Home mit 1700X

a) unter Linux mit AVX deutlich langsamer bei gleicher Frequenz (3,5 GHz) als unter Win10 mit SSE3
b) benötigt auch noch 1,35 Standardspannung, sonst bleibt er hängen, Win10 mit 1,2 Volt Stromspar

Linux (Ubuntu 17.04) AVX: im Durchschnitt hohe 7900-8300 Sekunden
http://asteroidsathome.net/boinc/workunit.php?wuid=62784077
http://asteroidsathome.net/boinc/workunit.php?wuid=62784139
Win10 SSE3: im Durchschnitt 7200-7500 Sekunden
http://asteroidsathome.net/boinc/workunit.php?wuid=62706780

@Einstein
mit AVX unter Linux nur Hänger, trotz erhöhter Spannung :]

Mein 1700X @Std liegt unter Win 10 mit SSE3 eher so bei ca. 8000s Laufzeit, allerdings mit 16 Threads.
Hast du bei dir nur 8 Threads laufen? Deine Laufzeiten sind ja schon einiges besser und mit Taktunterschied ist das eher nicht zu erklären. ???

http://asteroidsathome.net/boinc/hosts_user.php?userid=326154

Sollte man bei Asteroids die Prozesse auch mit ProcessLasso einfangen oder ist das wurscht?
Im Taskmanager ist die Auslastung aller logischen Kerne konstant bei 100%.
 
Mein 1700X @Std liegt unter Win 10 mit SSE3 eher so bei ca. 8000s Laufzeit, allerdings mit 16 Threads.
Hast du bei dir nur 8 Threads laufen? Deine Laufzeiten sind ja schon einiges besser und mit Taktunterschied ist das eher nicht zu erklären. ???

http://asteroidsathome.net/boinc/hosts_user.php?userid=326154

Im beschriebenen Szenario nutze ich 12 Threads (entspricht 76% Prozessorzeit in BOINC) für den Alltagsbetrieb, da ich hierbei bei unter 95W rauskomme. VCore ist hier ca. 1,2 V mit EPU und D.C.O.P. (XMP-Profil vom RAM 1,2 V 2666 und 15er Latenzen, CR 1T) On und energiesparenden Profil. Da geht er automatisch auf die 3.5 GHz auf allen Kernen.
Ich denke, das liegt an der Taktrate vom Speicher. Der ist ja atm gleich mit dem Takt Fabric.

Ich habe da keinen Unterschied in der Laufzeit bei 8, 10, 12 oder 16 Threads festgestellt.
 
Zuletzt bearbeitet:
Zurück
Oben Unten