Collatz - Generalmobilmachung gegen Sicituradastra !!!

verbose=1, threads=8, items_per_kernel=20, kernels_per_reduction=8, sleep=1

Das sollte quasi auf so ziemlich jeder Karte laufen und schon einen Grossteil des Performance-Gewinns einfahren.

items_per_kernel=20 laeuft selbst auf sehr kleinen GPUs ueberraschend gut, gut moeglich dass die 5770/6770 sogar mit items_per_kernel=21 arbeiten kann.
Um ein gewisses Experimentieren kommt man jedoch nicht herum, das dauert halt seine Zeit. Aber mit den Parametern oben sollte IMHO schon eine ziemlich gute Grundoptimierung drin sein.

Zu testen bliebe nur items_per_kernel=21 und kernels_per_reduction=9, sowie z.B. threads=10...

Selbst auf meiner relativ winzigen R7 240 hat sich die Performance von den Standardwerten aus verglichen mehr als verdoppelt. Es lohnt sich wirklich auf jeder GPU.

PS.
Habe jetzt alles an GPUs laufen, was bei mir machbar ist und bis zum Erbrechen optimiert.

-- edit --
Da ich mit den Optimierungs-Tests fertig bin, hier die Liste der besten Tuning-Parameter, die ich herausgefunden habe (1 Task/GPU) :

Code:
R9 290 | verbose=1, threads=10, items_per_kernel=22, kernels_per_reduction=9, sleep=1 | Solo :    14m / Large : 3h47m
HD7970 | verbose=1, threads=10, items_per_kernel=22, kernels_per_reduction=9, sleep=1 | Solo :    24m / Large : 6h19m
R9 270 | verbose=1, threads=10, items_per_kernel=22, kernels_per_reduction=9, sleep=1 | Solo :    36m
HD7850 | verbose=1, threads=10, items_per_kernel=22, kernels_per_reduction=9, sleep=1 | Solo :    48m
HD7790 | verbose=1, threads=10, items_per_kernel=21, kernels_per_reduction=9, sleep=1 | Solo :    52m
HD7750 | verbose=1, threads=10, items_per_kernel=21, kernels_per_reduction=9, sleep=1 | Solo :  1h45m
R7 240 | verbose=1, threads=10, items_per_kernel=20, kernels_per_reduction=9, sleep=1 | Solo :  3h03m
GT720M | verbose=1, threads= 8, items_per_kernel=21, kernels_per_reduction=9, sleep=1 | Solo :  4h03m
HD4000 | verbose=1, threads= 8, items_per_kernel=17, kernels_per_reduction=8, sleep=1 | Solo : 11h15m

Einen CPU-Kern braucht man scheinbar mit den harten Optimierungen nicht reservieren - der wird ggf. zwar voll ausgelastet aber es tut sich letztendlich nix an den Berechnungszeiten (?)

-- edit 2 wegen intel HD4000 --

Ausnahme : intel OpenCL (HD4000) goennt sich eine ganze Ecke (fast 100% eines CPU-Kerns) und braucht diesen auch - aber auch hier ist die explizite Reservierung nicht zwingend notwendig, optimiertes intel OpenCL Collatz nimmt sich automatisch, was es brauch.
 
Zuletzt bearbeitet:
@FalconFly
Sauber, die Werte werde ich die Tage mal testen. *great*
10 Minuten schneller als eine HD 7970 (solo)? :o
Nun ja, wenn man es in Punkte sieht, sind es bei mir alle 12 Minuten eine WU. Aber dafür mit SIMAP 700W Insgesamt. ;D
 
Jo, flotter kriege ich die GPUs nicht, hab mit Parameter-Tuning so ziemlich alles rausgeholt, was drin war.

Alles was ggf. noch gehen koennte, waere mehrere Tasks/GPU laufen lassen. Da sind je nach GPU sicher noch einige Prozentpunkte drin - allerdings weiss ich nicht, ob man dann noch so harte Parameter fahren kann...

Der Stromkasten ist im Moment sowieso Sperrzone *g*
Das will ich gar nicht wissen was bei mir im Moment so durchgeht ;)
(schaetze so ganz grob 3.5kW Dauerleistung)

Naja, denke bis Dezember lass' ich die Anlage so laufen - aber im naechsten Jahr werd' ich definitiv zum Stromsparer.
 
Zuletzt bearbeitet:
Warum werden die Configs nicht in unserem Wiki gesammelt? :)
 
So, habe auch mal eine HD7750 und eine HD6870 mit ins Rennen geschmissen.

Sollte alles noch optimiert laufen vom letzten Mal, aber die Werte im BM sind befremdlich:
Ph2 X4 945: 0,877 CPU + 1ATI GPU (das ist die HD7750, Last bei konst.98%)
FX-6300: 0,01 CPU + 1 ATI GPU (HD6870, Last bei konst. 96%)

Wie kommt der Unfug mit den CPU Reservirungen? Die App_config steht bei beiden auf 1.0 *noahnung*

--- Update ---

Nachtrag:

Der FX rechnet Mini Collatz Conjecture v6.04 (ati14)
Der Ph rechnet Mini Collatz Conjecture v6.04 (opencl_amd_gpu)

Kann ich das beienflussen, dass der Ph2 auch die andern kriegt?
Die Laufzeiten sind sich sehr ähnlich, aber der FX macht 6 Simapsen und die Collatz nebenbei!
Der fehlende Ph2-Kern ist ärgerlich bei Simap :D
 
Die 6870 läuft mit CAL, weil die OpenCL-Version erst ab der GCN-Architektur läuft. Die 0,877 Kerne braucht die OpenCL aber auch nicht dauerhaft. In der zwischenzeit rechnet der Kern schon die anderen Projektaufgaben weiter ;)
 
Hm, also nichts reservieren, sondern Simap einfach weiter laufen lassen? Im Moment habe ich Simap auf 3 WUs runter geschraubt.

O.K., erledigt, Mal sehen, wer wen zu behindern versucht :D
 
CC nimmt sich bei mir immer alles was es an CPU braucht, da brauch ich nichts reservieren.
Lass es erstmal alles freigegeben, denke damit lässt sich das beste Ergebnis erziehelen.
 
So, die HD7790 geht auch noch rein. Aber jetzt wirds warm werden in der Ecke ;D - im selben PC ist auch die GTX560Ti am Werkeln und hat gerade eine PrimeGrid Genefer(WR) am Schlafittchen - eine hat die GPU gerade abgeliefert ... 610k hat sie gebracht.

Ich sehe gerade, dass mit noch fast 80 Mille fehlen bis zum "Ruby badge". Ohgott. Na denn mal los.
 
Zuletzt bearbeitet:
Kann ich das beienflussen, dass der Ph2 auch die andern kriegt?
Die Laufzeiten sind sich sehr ähnlich, aber der FX macht 6 Simapsen und die Collatz nebenbei!
Der fehlende Ph2-Kern ist ärgerlich bei Simap :D

Einfach bei Einstellungen abwählen.

Run only the selected plan classes
Brook+/CAL for AMD GPUs (ati14)
OpenCL for AMD GPUs (opencl_amd_gpu)
CUDA GPUs (cuda40/cuda55)
OpenCL for nVidia GPUs (opencl_nvidia_gpu)
OpenCL for Intel GPUs (opencl_intel_gpu)
OpenCL for Intel CPUs (opencl_intel_cpu)
OpenCL for AMD/Intel CPUs (opencl_amd_cpu)




Cuda und Ati14 raus . Dann gehen auch die opti.


grüße
joe
 
:D Ja, die ati14 wollte ich doch gar nicht raus haben. Die sind es doch, die so schön wenig CPU-Last machen.
 
Also ich habe ausschliesslich opencl_amd_gpu auf den AMD-Karten laufen und keine macht >8% CPU-Last (?)

AFAIK ist Brook/CAL nur fuer sehr alte ATI-Karten ohne OpenCL-Unterstuetzung gedacht.
 
Zuletzt bearbeitet:
Also ich habe ausschliesslich opencl_amd_cpu auf den AMD-Karten laufen und keine macht >8% CPU-Last (?)

AFAIK ist Brook/CAL nur fuer sehr alte ATI-Karten ohne OpenCL-Unterstuetzung gedacht.

Also die 4xxx oder kleiner, ab HD 5xxx können die das .


Meine kleinen HD 5770 , HD 6310 (E350), HD 6950 nehmen sich schon fast einen Kern , laut Taskmanager.
 
Zuletzt bearbeitet:
Jippie!
Im Debian Repo ist der neue AMD Treiber eingetrudelt und parallel hat AMD ein neues APP SDK veröffentlicht.
Mit diesem (v2.9.1) scheint der CPU Bug(?) auf meinen Rechnern behoben zu sein.
Durch dieses neue SDK funktioniert auch Collatz wieder (mit dem 2.9 ebenfalls, jedoch mit unsinniger CPU-Last).
 
Die beiden ersten in der Bucht ersteigerten HD7870 sind angekommen und schon eingebaut.
Mal sehen, ob man das am output erkennen kann.
 
Hm Deine Pitcairns sind genau so, teils etwas schneller als meine Tahiti. Nur weil die vergessen haben müssen, die optimierungs config in den Linux Apps zu parsen. :(
 
(?)
Linux erkennt diese Configs auch...

Sie sollten unter /var/lib/boinc-client/projects/boinc.thesonntags.com_collatz/ stehen bzw. dort erstellt werden.

Das Hauptproblem sind (wie immer) die BOINC-Benutzerrechte under Linux; die Config-Dateien koennen nicht einfach z.B. von aussen hereinkopiert oder heruntergeladen werden.
Wenn man sie auf diese Weise dort einstellt, muss mit chown oder chmod nachgeholfen werden - sonst erkennt BOINC sie als "Fremdkoerper" und loescht sie.
 
Zuletzt bearbeitet:
Die sind auch schon vorhanden, nur werden sie komplett ignoriert.

--- Update ---

Ach hätte ich die GPU Power nur schon zum letzten Pentadings gehabt.
P3D geht richtig ab.
 
Fast 40 Mio./Tag, doppelt so viel wie der Nächste.
 
Hmm...

Das Czech National Team sieht nun erstmal nur noch unsere Ruecklichter im Fernglas *g*
Nach vorn ist allerdings ein recht grosser "leerer Raum", den es zu durchfliegen gilt. Aber dahinter lockt sUSi...
evil.gif
 
Die nicht funktionierenden Configs umgehe ich nun mit parallel laufenden WUs, das bringt 100% Auslastung. Somit bin ich gleich hinter FalconFly (RAC) 8)
 
Aber wenn wir einmal dran sind an SUSA dann könnten wir gleisch alle 4 zusammen abräumen ;)
 
Gleich baue ich in einen Rechner ein anderes Netzteil ein. Der war seit Wochen abgeschaltet, weil das alte Netzteil nicht mehr startete. Dann geht eine HD7850 mehr an den Start. Danach baue ich in einen anderen Rechner noch eine HD 7870 ein, die gestern angekommen ist.
 
Zurück
Oben Unten