Optimierung der Collatz-WUs -die - Datenbank

verbose=1
threads=8
kernels_per_reduction=64
sieve_size=30
lut_size=16
reduce_cpu=0
sleep=1

Vielleicht gibt es noch eine bessere Einstellung. Weiß da jemand wie man das auf die Vega um- und ausrechnet?
 
verbose=1
threads=8
kernels_per_reduction=64
sieve_size=30
lut_size=16
reduce_cpu=0
sleep=1

Vielleicht gibt es noch eine bessere Einstellung. Weiß da jemand wie man das auf die Vega um- und ausrechnet?

MOIN MOIN
https://www.planet3dnow.de/vbulletin/threads/416499-Optimierung-der-Collatz-WUs
IM spoiler stehen die infos wozu was zum einstellen ist , dann ausprobieren und zeiten messen .

Es gibt noch eine englische umfangreichere Anleitung , die suche ich mal , ich habe sie aber auch schon irgendwo mal verlinkt

Beitrag 5 sind daten und zeiten für ne 480 meine ich, damit willich sagen deine zeiten sollten ja noch viel schneller werden 99% auslastung ?

gruß Manni
 
Zuletzt bearbeitet:
Hab auch ein bisschen gespielt und für folgende GPU Monster leichte Verbesserungen rausgeholt:

i7 3632qm - Ivy Bridge, Intel HD 4000

verbose=1
threads=9
items_per_kernel=16
kernels_per_reduction=28
lut_size=16
sleep=1
reduce_cpu=0
sieve_size=24

Geforce 635M

verbose=1
items_per_kernel=12
kernels_per_reduction=24
threads=6
lut_size=17
sleep=1
reduce_cpu=0
sieve_size=24

Die zu schwach ausgelegte Kühlung im Laptop ist aber ein großes Problem, sodass die GF gerne deutlich runtertaktet :(
 
Zuletzt bearbeitet:
Ich habe mal meine Vega11( Ryzen 5 2400G) Optimiert, leider hatte ich nur 2666 MHz RAM gehabt:(, Win 10

verbose=1
kernels_per_reduction=64
sleep=1
threads=8
lut_size=17
reduce_cpu=0
sieve_size=30
cache_sieve=1
 
Zuletzt bearbeitet:
Ich habe mal meine Vega11( Ryzen 5 2400G) Optimiert, leider hatte ich nur 2666 MHz RAM gehabt:(, Win 10

verbose=1
kernels_per_reduction=64
sleep=1
threads=8
lut_size=17
reduce_cpu=0
sieve_size=30
cache_sieve=1

Hast du laufzeiten vor / nachherr?



gruß Manni
 
Ich habe mal meine Vega11( Ryzen 5 2400G) Optimiert, leider hatte ich nur 2666 MHz RAM gehabt:(, Win 10

verbose=1
kernels_per_reduction=64
sleep=1
threads=8
lut_size=17
reduce_cpu=0
sieve_size=30
cache_sieve=1

Du könntest deinen RAM ja mal testweise mit 2133 fahren und 4-5 WUs durchknuspern.
Ich könnte mir nämlich gut vorstellen, dass der RAM fast keinen Einfluss hat.
 
Ohne Optimierung lag die Laufzeit bei ca. 50 Min, Samstag Abend habe ich den Speichertakt auf 3000 erhöht, danach wurden die Zeiten besser
bis Gestern Abend hatte ich nur wenige Fertige und Bestätigte Wus mit mehr als 40 Min die meisten bleiben knapp unter 40 Min,
seit Sontag 22 Uhr sind die Zeiten wieder länger geworden. Asus B350M-A 2 X 8GB 7 Treads

Ursache gefunden, seit Sontag Abend hatte ich nebenbei OpenZika gerechnet vorher und seit Heute Morgen wieder GoofyXgrid@Home CPU
und schon gingen die Zeiten für Collatz wieder runter von Ca. 45Min auf ca. 40 Min.
 
Zuletzt bearbeitet:
verbose=1
threads=8
kernels_per_reduction=64
sieve_size=30
lut_size=16
reduce_cpu=0
sleep=1

mit diesen Einstellungen macht meine RX Vega 56 eine WU in ca. 395s platt und erhält ca. 28k Punkte. Macht am Tag ca. 6Mio.

Grüße
 
Zuletzt bearbeitet:
Ich weiss leider nicht mehr wem ich für die Daten danken muss (ich find den Thread nicht mehr)

meine 1060 er mögen auf jeden fall:

verbose=1
kernels_per_reduction=48
threads=8
lut_size=17
sleep=1
reduce_cpu=0
sieve_size=30

Änderung: von 23-24,5 Min auf 12-13,5 Min

(vergleich gegen die hier stehenden Werte kommt hoffentlich noch.
 
Zuletzt bearbeitet:
Ich weiss leider nicht mehr wem ich für die Daten danken muss (ich find den Thread nicht mehr)

meine 1060 er mögen auf jeden fall:

verbose=1
kernels_per_reduction=48
threads=8
lut_size=17
sleep=1
reduce_cpu=0
sieve_size=30

Änderung: von 23-24,5 Min auf 12-13,5 Min

(vergleich gegen die hier stehenden Werte kommt hoffentlich noch.

moin moin
Ich habe auf seite 1 in der Datenbank folgende werte.
GTX 1060
verbose 1 (yes)
kernels/reduction 48
threads 8
lut_size 17
sieve_size 28
sleep 1
cache_sieve 1

Nur das Rot makierte ist anders wie groß da die veränderung ist kann ich leider nicht sagen
von Sabroe SMC:
sleep= [ 1 .. 1000]
Dies steuert die Anzahl der Millisekunden, die die Anwendung in einen Schlafzustand während der Wartezeit für die asynchrone Kernel verbringt um abzuschließen. Der Standardwert ist 1 . Das Setzen dieser höheren (z. B. 2-5) wird zu einer besseren Video-Antwort führen, sondern wird die Anwendung erheblich verlangsamen.

gruß Manni
 
moin moin
Ich habe auf seite 1 in der Datenbank folgende werte.
GTX 1060
verbose 1 (yes)
kernels/reduction 48
threads 8
lut_size 17
sieve_size 28
sleep 1
cache_sieve 1

Hi Manni,

jetzt sehe ich auch, warum der Eintrag, den ich hier raus kopiert hab, bei mir nicht funktioniert hat.

"kernels/reduction 48" muss eigentlich "kernels_per_reduction=48" heißen.

kannst Du das bitte copy past freundlich umschreiben? (sonst wundere ich mich beim nächsten kopieren wieder, warum bei mir alle abbrechen... ;-)

Danke
 
Habe mal eine RX Vega 64 Liquid Edition auf Collatz losgelassen.

Mit den Einstellungen die ich auch schon letztens bei der normalen Vega64 hatte.
verbose=1
threads=8
kernels_per_reduction=64
sieve_size=30
lut_size=16
reduce_cpu=0
sleep=1

Die Karte erreicht damit ca. 7,2 Mio Punkte.

Die Karte ist bei 100% Auslastung. Und ist dabei nahezu Lautlos.
 
Zuletzt bearbeitet:
HD7950

collatz_sieve_1.30_windows_x86_64__opencl_ati_gpu.config

<configuration>
verbose=1
threads=8
kernels_per_reduction=64
sieve_size=30
lut_size=16
reduce_cpu=0
sleep=1
</configuration>

~2,1MCr/d, nahezu 99% Auslastung, scheint eine gute Config zu sein...
 
Zuletzt bearbeitet:
Habe mal eine RX Vega 64 Liquid Edition auf Collatz losgelassen.

Mit den Einstellungen die ich auch schon letztens bei der normalen Vega64 hatte.
verbose=1
threads=8
kernels_per_reduction=64
sieve_size=30
lut_size=16
reduce_cpu=0
sleep=1

Die Karte erreicht damit ca. 7,2 Mio Punkte.

Die Karte ist bei 100% Auslastung. Und ist dabei nahezu Lautlos.

Mit denselben Werten läuft meine Vega 56 auf die 100% 391 Sekunden (Takt 1530 MHz, 1V, VRAM 950 MHz, 174 W bei 50° und 1900 RPM lt. HWMonitor)
 
Zuletzt bearbeitet:
Ich habe mal meine Vega11( Ryzen 5 2400G) Optimiert, leider hatte ich nur 2666 MHz RAM gehabt:(, Win 10

verbose=1
kernels_per_reduction=64
sleep=1
threads=8
lut_size=17
reduce_cpu=0
sieve_size=30
cache_sieve=1

Ich werde mal deine angaben für meinen Ryzen3 2200G nehmen. Die Einstellungen muss ich in die .conifg rein kopieren oder?
 
Genau da.
Läuft mmn sogar ohne Neustart ab der nächsten WU mit der Config.
 
Also mit den Einstellungen für die Vega11 habe ich mit meiner Vega8 eine Laufzeit von 58min pro WU.
 
Endlich läuft meine RTX 2060 bei Collatz.
Mit den Einstellungen der 1080 benötigt sie bei 1920 MHz zwischen 263 und 273 sec pro Wu und ist schneller als meine 1080 bei 1974 MHz mit 325 bis 335 sec pro WU. Die RX 570 benötigt bei 1340 MHz um die 800 sec pro WU mit den Einstellungen der 470. Alles unter WIN 10 Pro 64
 
Zuletzt bearbeitet:
Ich habe mal auf einer GTX 1650 gerechnet, 849s - 881s. unter Linux mit den Einstellungen der GTX1050Ti(1397s - 1428s Linux),.
 
Zuletzt bearbeitet:
Moin moin
...
GTX 1060
verbose=1
kernels_per_reduction=48
threads=8
lut_size=17
sieve_size=28
sleep=1
cache_sieve=1

1050 Ti = 1397 - 1428 S. mit Linux

verbose=1
kernels_per_reduction=64
sleep=1
threads=8
lut_size=18
reduce_cpu=0
sieve_size=30
cache_sieve=1

...
Ich habe heute diese beiden Settings auf meiner 1050ti getestet mit Ubuntu 18
die unteren Werte, die eigentlich für die 1050 stehen, haben sogar eine Verschlechterung gebracht (von 2350s auf 2000s, aber auch nur noch 28k statt 36k cr).
Mit den oberen Settings, die für die 1060 genannt werden, schafft die 1050ti hingegen 1300s bei 29k cr.
 
Falls es jemanden interessiert:
ATI 5700:
<configuration>
verbose=1
items_per_kernel=20
kernels_per_reduction=64
threads=7
sleep=1
lut_size=17
reduce_cpu=0
sieve_size=30
</configuration>

von 14:30 runter auf 7:11 (ca Werte)
 
Ich war mal so frei, und habe Deine Einstellung für meine RX 6900XT übernommen.
Da ich nur alle Jubeljahre Collatz rechne, muß ich erstmal wieder nachlesen, wofür welcher Wert steht.
Bisher sind die Laufzeiten von 5 Minuten auf 3 Minuten runter gegangen.
Ich bin ja überhaupt erstmal Froh, dass Collatz überhaupt auf der Karte läuft.
Beim ersten Versuch im Dezember wurden nur Rechenfehler erzeugt.
 
Hat jemand gescheite Werte und Zeiten für die RX6900XT ?

Derzeit lass ich 4 Wuzen auf der GPU mit 0,5 CPU rechnen -> knapp 16 Min Laufzeit bei 4 Wuzen *kopfkratz *noahnung*
 
Zurück
Oben Unten