10. Pentathlon 2019 - Einstein@home (Querfeldein)

Irgendwie rechnet meine RX480 total lahm, 22+min bei 2WUs gleichzeitig....

Takt ist stabil, Auslasung ist gut... was übersehe ich?

Ist das nicht normal? Meine RX 560 – ja quasi eine halbierte RX 480/580 – braucht 20 Minuten für 1 WU. Wenn Deine in derselben Zeitspanne 2 WUs schafft, sollte das doch passen, oder? :)
 
Also meine 280X (normalerweise langsamer als eine 480) ist rund 2 min schneller, das ist ungewöhnlich.
Oder sind die WUs auch ein wenig unterschiedlich?
Habe die zu unterschiedlichen Zeiten betankt.
 
Ja, lass dich nicht von den VII-Zeiten irritieren, die ist AUSSERORDENTLICH schnell

Hm, dann muss ich wohl nochmal schauen ob ich an WUs komme, die 283 sind schon lange durch und wäre ja VII-Verschwendung sonst
 
Unbedingt. Dann noch eine Instanz aufmachen.
 
Oh, hatte wohl mal wieder zu früh Panik, hatte noch ein YT-Video am laufen.
Kaum war das aus, sind die Zeiten auf unter 20Min runter.
 
Meine [AMD/ATI] Cape Verde PRO [Radeon HD 7750/8740 / R7 250E] braucht ca. 53:30 min
meine [AMD/ATI] Baffin [Radeon RX 460/560D / Pro 450/455/460/555/555X/560/560X] braucht ca. 32:30 min
 
Hmpf, das ist ärgerlich. Der Unterschied ist mit über 50% (32:30 min vs. 20:30 min) :o aber deutlich größer, als die Eckdaten (2,1 TFLOPS statt 2,4 TFLOPS, 96 GB/s statt 112 GB/s) es erwarten lassen *kopfkratz Kriegt sie genügend CPU-Zeit ab?
 
Oh, hatte wohl mal wieder zu früh Panik, hatte noch ein YT-Video am laufen.
Kaum war das aus, sind die Zeiten auf unter 20Min runter.

17-18 minuten pro wu ab 1300MHz gehts unter die 18 minuten ^^ meine rennt mit 1288MHz
 
Hmpf, das ist ärgerlich. Der Unterschied ist mit über 50% (32:30 min vs. 20:30 min) :o aber deutlich größer, als die Eckdaten (2,1 TFLOPS statt 2,4 TFLOPS, 96 GB/s statt 112 GB/s) es erwarten lassen *kopfkratz Kriegt sie genügend CPU-Zeit ab?

Keine Ahnung ist ja Linux-opencl. Da sind die Laufzeiten vielleicht anders, weil es der opensource opencl stack von mesa ist.
 
Da der Mehrwert von zwei gleichzeitigen WUs überschaubar ist, lasse ich hier jeweils nur eine WU pro Karte laufen. Bei zweien verdoppelt sich die Laufzeit fast, bringt also nur ein paar Sekunden Zeitgewinn. Mit GPU-Z wird bei der 580 meistens eine Last von 80-90% auf dem Memory Controller angezeigt und die GPU ist hauptsächlich bei 98-100%. Beides mit Ausreißern nach unten. Zur 7970 wird mir nur GPU Last von recht konstanten 88-90% angezeigt. Der Speicher wird nicht gemeldet. Theoretisch dürfte die noch etwas mehr Luft haben.

Wie auch immer, hier werden pro Stunde gut 11 Wuzen fertig ;D
 
Ja die Last auf den Grafikspeicher ist bei Einstein schon extrem, die GDDR5 Variante meiner beiden GT1030 ist fast 3x schneller als die DDR4 Variante. :o
 
Also ohne 2 WUs kommt meine 480 grade mal so auf 50-60 Auslastung im Schnitt.
 
Also ohne 2 WUs kommt meine 480 grade mal so auf 50-60 Auslastung im Schnitt.

Bekommt die Graka dann vielleicht nicht genug CPU Power ab?
Die WUs erzeugen auch relativ viel CPU Last, wodurch man bei den schnelleren Karten ruhig einen Bulli Kern pro WU rechnen kann.
 
Hab ich gar nicht mitbekommen, dass die neuen Stacks überhaupt so weit sind.
 
Gibt es:

https://www.planet3dnow.de/vbulleti...me-Stadtlauf?p=5237456&viewfull=1#post5237456

BM beenden und in der client_state.xml den <duration_correction_factor> senken. Bei mir entsprach "1.000000" 250 Min. Habe es auf "0.100000" geändert und es wurden 25 Minuten draus. Habe es zur Sicherheit auch in der client_state_prev.xml geändert.
Hat wunderbar geklappt. :)

Ich hab's gefürchtet: in ca. 4 Stunden ist mein Bunker leergeknuspert und das dreieinhalb Tage vor Projektstart. :( Da es ein GPU-Projekt ist, ist nix mit einfach eine neue VM machen. Soll ich versuchen, ein neues BOINC-Profil anzulegen? Ich hadere noch. Der kleinste Fehler und die vorgecrunchten WUs sind alle im Eimer :-/
Ich hab zwar noch Windows7 und 10 parallel, aber das mit der 2. Instanz klingt viel interessanter, weil ich dann die CPU-WUs weiter auf der ersten Instanz laufen lassen kann.

Klappt das auch mit Ubuntu?
 
Ja, man muss es dann halt anpassen. Ich mir das auf einige großen Maschinen komfortabel als Services (wie den Hauptclienten) angelegt und bis zu 400 pro Rechner für Goofyxgrid per Skript starten lassen.
 
Ich meine in meinen Tests war Einstein mit Mesa/Clover nur halb so schnell wie amdgpu-pro openCL. ROCm hingegen kam dem letzteren recht Nahe.

Hm, hab kein Ubuntu mit Graka, sondern Arch.
Trotzdem gibt das ne gute Aussicht. Danke.
 
Mir ging es primär um die Geschwindigkeitsunterschiede zwischen den verschiedenen Implementierungen, das wird ja unter Arch ähnlich sein.
 
Bekommt die Graka dann vielleicht nicht genug CPU Power ab?
Die WUs erzeugen auch relativ viel CPU Last, wodurch man bei den schnelleren Karten ruhig einen Bulli Kern pro WU rechnen kann.

Nene die bekommen nen ganzen Kern Pro WU und verdrängen sogar CPU-WUs.
 
Zurück
Oben Unten