TN-Grid

Wer noch Lust auf Gefrickel hat, just kamen noch 3 Anwendungen hinzu bzw. wurden aktualisiert:
TN-Grid.linux-x86-64-avx2-v1.1.tgz
TN-Grid.windows-x86-64-avx2-v1.1.zip
TN-Grid.windows-x86-64-fma-v1.1.zip

https://bitbucket.org/sirzooro/pc-boinc/downloads

Die Windows FMA app war wohl Anfangs mit Haswell als Target kompoliert worden, lief daher auf AMD nicht. Bitte nochmal probieren. Wer CPUs mit AVX2 hat, kann auch die mal testen...
 
Zuletzt bearbeitet:
SSE2 hat im zweiten Anlauf funktioniert, die neue FMA App läuft auch! *greater*
 
Neue ARMv7a-vfp4 Anwendung jetzt auch verfügbar:
root@odroidc2-1:~/pc-boinc# ./test_run.sh
Running bin/pc_armv7a-vfpv4-v1.1 -
Loading: 0.556
computeStandardDeviations: 0.002
computeCorrelations: 1.374
pcAlgorithm, l 0: 0.030
pcAlgorithm, l 1: 2.428
pcAlgorithm, l 2: 0.896
pcAlgorithm, l 3: 0.096
pcAlgorithm, l 4: 0.041
pcAlgorithm, l 5: 0.013
pcAlgorithm, l 6: 0.003
pcAlgorithm, l 7: 0.000
pcAlgorithm, l 8: 0.000

real 0m7.459s
user 0m5.370s
sys 0m0.100s


Running bin/pc_armv8-v0.9 -

real 0m10.512s
user 0m8.470s
sys 0m0.050s


Das sind nur Testdaten, mal schauen wie das bei richtigen WUs ausschaut.

--- Update ---

ARMv8 v1.1

Running bin/pc_armv8-a -
Loading: 0.376
computeStandardDeviations: 0.003
computeCorrelations: 1.442
pcAlgorithm, l 0: 0.023
pcAlgorithm, l 1: 1.815
pcAlgorithm, l 2: 0.856
pcAlgorithm, l 3: 0.084
pcAlgorithm, l 4: 0.030
pcAlgorithm, l 5: 0.010
pcAlgorithm, l 6: 0.002
pcAlgorithm, l 7: 0.000
pcAlgorithm, l 8: 0.000

real 0m6.667s
user 0m4.600s
sys 0m0.070s

Hossa die Waldfee!
 
Hat jemand nen Einladungs Code für mich? *party2*
 
Einladungscode: science@tn

Jetzt mit richtigen Daten, das nutzt dann auch die NEON SIMD des C2, damit ist der Gewinn dramatisch!
root@odroidc2-1:~/BOINC_dev/boinc/samples/pc-boinc# ./test_run2.sh
bin/pc_armv7a-vfpv4-v1.1 input/tile2.txt output/output2.txt 0.05 1 2470
Loading: 0.831
computeStandardDeviations: 0.003
computeCorrelations: 0.369
pcAlgorithm, l 0: 0.001
pcAlgorithm, l 1: 0.064
pcAlgorithm, l 2: 0.893
pcAlgorithm, l 3: 4.866
pcAlgorithm, l 4: 16.922
pcAlgorithm, l 5: 23.217
pcAlgorithm, l 6: 22.773
pcAlgorithm, l 7: 17.738
pcAlgorithm, l 8: 16.013
pcAlgorithm, l 9: 10.758
pcAlgorithm, l 10: 6.917
pcAlgorithm, l 11: 3.896
pcAlgorithm, l 12: 2.017
pcAlgorithm, l 13: 0.736
pcAlgorithm, l 14: 0.205
pcAlgorithm, l 15: 0.041
pcAlgorithm, l 16: 0.005
pcAlgorithm, l 17: 0.000
pcAlgorithm, l 18: 0.000

real 2m10.423s
user 2m8.150s
sys 0m0.120s
diff: output/output2.txt: No such file or directory
#######################################################################

bin/pc_armv8-v0.9 input/tile2.txt output/output2.txt 0.05 1 2470

real 3m48.623s
user 3m46.260s
sys 0m0.110s
diff: output/output2.txt: No such file or directory
#######################################################################

bin/pc_armv8-v1.1 input/tile2.txt output/output2.txt 0.05 1 2470
Loading: 0.466
computeStandardDeviations: 0.003
computeCorrelations: 0.384
pcAlgorithm, l 0: 0.001
pcAlgorithm, l 1: 0.047
pcAlgorithm, l 2: 1.054
pcAlgorithm, l 3: 4.910
pcAlgorithm, l 4: 12.164
pcAlgorithm, l 5: 18.240
pcAlgorithm, l 6: 17.246
pcAlgorithm, l 7: 13.092
pcAlgorithm, l 8: 11.164
pcAlgorithm, l 9: 7.474
pcAlgorithm, l 10: 4.813
pcAlgorithm, l 11: 2.743
pcAlgorithm, l 12: 1.423
pcAlgorithm, l 13: 0.520
pcAlgorithm, l 14: 0.146
pcAlgorithm, l 15: 0.030
pcAlgorithm, l 16: 0.004
pcAlgorithm, l 17: 0.000
pcAlgorithm, l 18: 0.000

real 1m37.931s
user 1m35.870s
sys 0m0.060s
diff: output/output2.txt: No such file or directory

57% gewonnen, bzw. 2.33x so schnell wie die alte ARMv8-v0.9. Damit sollte eine Einheit ca. 3.5h dauern auf einem übertakteten C2...
 
Zuletzt bearbeitet:
Zuletzt bearbeitet:
Ha, dann kann mein J1900 ja doch noch mithalten: 11.700 .... 12.100 s = 3:15 ... 3:22 h.

Nicht ganz so effizient wie ein C2, aber er macht ja auch noch andere Sachen nebenbei. *noahnung*

--- Update ---

Oh, das reimt sich sogar, ich sehe da durchaus eine Karriere als Poet ;D

--- Update ---

Wie ich sehe, habe ich meine PG-Ziele auch fürs Erste erreicht, alle CPU-Subprojekte mindestens Gold, die GPU-Subprojekte auf Jade.
(Naja, vielleicht doch noch ein wenig AP27 machen?) Aber erstmal ist da dann Ruhe.
 
Oh, dann sollte ich das mal als "Olsens gesammelte Werke" herausgeben ;D
(Hoffentlich finde ich noch alles.)
 
Auf meinem FX (@3,5 GHz, RAM 1.333 MHz) läuft die neue SSE2-App am schnellsten:
AVX = 58 Minuten
FMA = 55 Minuten
SSE2 = 52 Minuten
 
OcUK - Overclockers UK hatten wir gerade überholt, nun ziehen die aber an. Womöglich die neuen optimierten apps schneller ausgerollt :-D
Also gebt mal Gas, es lohnt sich, den 7. Platz wollen wir uns doch nicht wieder abnehmen lassen ;-)
 
Nun, an mir solls nicht liegen, nach den neuen optimierten Apps hat sich mein Output schon ordentlich erhöht. :-)
 
Ich komme rüber wenn ich die 5,5Mios bei POGSe voll hab.
 
also wurden die optimierten apps wieder optimiert?
 
Also optimierungen hin oder her. Ich rechne nun seit Tagen TN und irgendwie wurde es seitdem immer langsamer. Vor 2 Tagen gingen SSE2 unter einer Stunde fertig weg, nun liegen alle bei mindestens bei einer Stunde, AVX sogar bei 1:27 etwa, laut der Schäätzung von Boinc. Also ich selber merke nix von optimierungen bei mir.

Ganz genau sehe ich das natürlich nur an fertigen und validierten WUs, aber ich sehe bisher für mich keine Optimierungen.

Habe nun fürs Race mal den I5 2400 hochgefahren und der liegt bei fertigen WUs mit AVX bei 1:30 etwa. Klar der ist relativ schwach, aber tut auch nichts anderes, als Boinc. Während mein anderer I5 4590 noch anderes nebenher zu tun hat. Bei diesem liegen FMA bei 1:01 und AVX bei 1:03 etwa. Im Moment habe ich auch keine SSE2 mehr da, aber ich denke oben die Werte von @Krümel sind recht ähnlich. Das dort SSE2 am schnellsten läuft.Wobei dessen Bulli natürlich schneller unterwegs ist, trotz "nur" 3,5 ghz.
 
Zuletzt bearbeitet:
Die optimierten Apps musst Du händisch installieren, die werden noch nicht automatisch verteilt (das kommt aber noch).
Den Link findest Du in einem Beitag von koschi. Nimm für Deinen i5 2400 die SSE2 App, dass sollte ihm Beine machen. ;)
 
OcUK - Overclockers UK hatten wir gerade überholt, nun ziehen die aber an. Womöglich die neuen optimierten apps schneller ausgerollt :-D
Also gebt mal Gas, es lohnt sich, den 7. Platz wollen wir uns doch nicht wieder abnehmen lassen ;-)
Ay, 2 Stunden vor dem "flat rate" Strom.
Ich kenne welche aus UK, einer davon "Buzzl" schwört auf Apple im mobilen Bereich.
Die spinnen die Engländer! ;D
 
Lese gerade die älteren Thread durch und sehe, das gestern @Landjunge gefragt hat, ob jemand so einen Invite Code für ihn hat.

Kann sich da mal jemand drum kümmern oder hat schon? Nicht das noch was oder jemand verloren geht :)
 
Lese gerade die älteren Thread durch und sehe, das gestern @Landjunge gefragt hat, ob jemand so einen Invite Code für ihn hat.

Kann sich da mal jemand drum kümmern oder hat schon? Nicht das noch was oder jemand verloren geht :)
Wurde schon gepostet: science@tn
 
Ja danke, hab ich auch nochmal im Startpost hinterlegt.

Die neuen optimierten (v1.1) von https://bitbucket.org/sirzooro/pc-boinc/downloads und https://github.com/sorcrosc/rpi-boinc-ap/tree/master/TN-Grid/bin sind händisch zu installieren. Bereits geladene WUs gehen idR verloren...
:) Nice!

Erste Eigenart der Engländer:
Zwischen 17:45 und 18:45 wird der Strom importiert, weil da "Tee time" ist und jeder sein Wasserkocher anwirft in UK...
Eine Insel die sich selbst mit Essen versorgen kann aber den Strom importieren muss, ist dann doch nicht unabhängig. *suspect*
 
Alter, jetzt geht aber der Bestand beim Lagerverwalter in die Höhe.

Aktuell 243 - rasch steigend... :o
 
Alter, jetzt geht aber der Bestand beim Lagerverwalter in die Höhe.

Aktuell 243 - rasch steigend... :o
Akku leer, ein nachteil bei mobil server...
Eine 48V LKW Batterie, kann auch ein 20 Gabelschlüssel zum glühen bringen!

Soll ich mal 8 Threads los lassen? *party2*
 
Also optimierungen hin oder her. Ich rechne nun seit Tagen TN und irgendwie wurde es seitdem immer langsamer. Vor 2 Tagen gingen SSE2 unter einer Stunde fertig weg, nun liegen alle bei mindestens bei einer Stunde, AVX sogar bei 1:27 etwa, laut der Schäätzung von Boinc. Also ich selber merke nix von optimierungen bei mir.
Das kann eigentlich nicht sein, weil bei nahezu allen sich die Laufzeiten deutlich verkürzt haben.
Auf der Projektseite stand ja auch, dass die Laufzeiten und Credits erweitert wurden.

War bei Asteroids damals auch so. Als die Optimierten Apps dann vielfasch schneller waren, wurde die WU Größte und Credits vervierfacht (einst 120Cr/Wu).
 
Ich habe mal 48 Threads losgelassen. Kann ich die Heizung heute Nacht runter drehen. :)
etwa 4000 s pro WU. SSE2 ist am schnellsten, wohl auch durch den Taktvorteil bei nicht-AVX-Workload.
 
Zurück
Oben Unten