TN-Grid

Also bei meinem FX sind die SSE2 einen kleinen ticken schneller wie die AVX, die FMA sind aber noch einmal 4 Minuten schneller als die SSE2.
Also FMA laufen auf meinem FX am besten.

@WindHund: Bin trotz FMA auf allen 8 Cores jetzt bei 1,14 Volt. :P

Anhang anzeigen 35128
Naja, so schlimm kann es nicht sein.
Sind ja auch die GPU´s die FMA hervor gebracht haben.

Sieht gut aus bei dir würde ich interpretieren, so schaut es im Moment aus:
 

Anhänge

  • Boinc@Einstein2&6Gene_stock_sensoring.jpg
    Boinc@Einstein2&6Gene_stock_sensoring.jpg
    368,2 KB · Aufrufe: 36
Uih, mit mehr als 4 GHz darf meiner nur beim daddeln laufen, für BOINC wird er auf 3,5 GHz kastriert.
Ich bin einfach noch vom niedrigen Energieverbrauch seines Vorgängers (Haswell Xeon) verwöhnt und warte sehnsüchtig auf Zen. ;)
 
Der Intel läuft in der Regel keine 24/7 und eigentlich nur dann wenn ich am PC bin, dann zocke ich aber halt auch die meiste Zeit wodurch die unterschiede zwischen Laufzeit und CPU Zeit ergeben.
Laut Taskmanager hab ich in 95% der Zeit 100% last auf der CPU beim Intel, beim 9600P sieht das anders aus, je nach dem was läuft sind es nur 80-90% und nie der Standarttakt :D so hoch kommt er garnicht, meistens liegen zwischen 1,99-2,17GHz an 15W TDP halt ne :D
 
Heute Nacht haben wir BOINC@Poland überholt, morgen Nacht ist OcUK - Overclockers UK dran, Platz 7 :-D

Auch gibt es die nächsten Tage dann gleich 2 Challenges, einmal von Gridcoin, einmal von SETI.USA ausgerufen:
- 2017-01-25 02:30 bis 2017-01-28 02:30
- 2017-01-30 00:00 bis 2017-02-04 00:00
 
Argh, diese challenges werfen mich dann wieder in meinem Bestreben zurück, die 1 Mio. bei WCG voll zu machen, weil ich garantiert dazu verlockt werde meinen i7 rüber zu schwenken...*noahnung*
 
Argh, diese challenges werfen mich dann wieder in meinem Bestreben zurück, die 1 Mio. bei WCG voll zu machen, weil ich garantiert dazu verlockt werde meinen i7 rüber zu schwenken...*noahnung*

Ruf doch eine bei WCG aus. ;)
 
Auch eine Idee, aber dazu bin ich zu schüchtern. *nosorry*
 
Benenne dich um, du bist kein Krümel, sondern ein großer Kuchen !!! (Aber nicht leckere Torte... ;D)
 
Ah, der Herr Oldenburg, der mich auch noch bei TN-Grid überholen möchte.
Drehst Du heimlich wieder auf, oder hast Du das OK Deiner besseren Hälfte? ????
Und nein, ich bleibe der kleine Hamster Krümel, weder Kuchen noch Sahnetorte. ????

--- Update ---

Hmm, irgendwie kommen die Emojies nicht richtig rüber...
 
Nö, kein Ok, das ist auch nicht dauerhaft, ich wollte nur bei PG / GFN die 10 Millionen schaffen und das ist nunmal GPU.
Und PG habe ich morgen oder übermorgen fertig.

Da hatten die Kerne also nix zu tun und ich dachte, für die paar Tage kriegt der i7-4790T dann irgendwas anderes zu tun.
Mein Lappy läuft nur stundenweise und der Firmenrechner macht auch ein wenig.

Aufdrehen hieße sonst 20 Kerne / 40 Threads und dann würden sicher mehr als 30k /d fallen :D
 
Ich wollte gerade mal testen, ob die 0.10 App immer noch deutlich schneller läuft auf Linux, aber leider bekomme ich da keine WUs!
Fehlermeldung: "Sa 21 Jan 2017 16:51:04 CET | TN-Grid Platform | Tasks are committed to other platforms"
Kann da jemand was mit anfangen?

Edit: OK, BOINC-Manager einmal komplett beendet und neu gestartet und händisch TN-Grid aktualisiert hat geklappt. 80 WU bekommen.

--- Update ---

Ergebnis: War bei App 0.09 Linux noch deutlich schneller (bei mir bis zu mehr als einer halben Stunde), so hat mit 0.10 Windows die Nase vorn, wenn auch nur knapp (so ca. 4 bis 6 Minuten).
 
Zuletzt bearbeitet:
Es gibt nochmals neue optimierte Apps!

http://gene.disi.unitn.it/test/forum_thread.php?id=135&postid=780#780

Surprise! I have just released new optimized app version (Opti v1.1), 2 times faster than previous optimized one (now the official one) :). It can be downloaded from the same place as previous ones: https://bitbucket.org/sirzooro/pc-boinc/downloads. At this moment there are only 64-bit versions for Windows and Linux available. I will add 32-bit Windows version later.

app_info.xml file provided together with app does not specify plan class, so make sure you finish or abort your tasks. Otherwise you will loose them when you will install my app! This file also specifies new app version (10), so make sure you have no tasks if you are still running previous app installed manually, you will also lose your tasks if you replace that file.

Here are results for test data from previous and new SSE Linux version:

Code:
real    0m54.472s
user    0m52.358s
sys     0m0.045s

real    0m26.208s
user    0m24.142s
sys     0m0.033s

I also was able to add code which uses NEON instructions on ARM 64bit (AARCH64). Here are results of running non-NEON and NEON apps on test data my Odroid C2:

Code:
real    2m18.336s
user    2m18.180s
sys     0m0.080s

real    1m48.669s
user    1m48.600s
sys     0m0.060s


At this moment I do not have BOINC libraries ready for ARM64, so there is no app for it yet. I am going to add it later too. If you have them you can compile it too, source code is in BitBucket repo on "additional_optimizations" branch.

If you are curious how I managed to make it even faster, here is answer. I did following changes:
- changed way how data was stored, what allowed me to replace unaligned load/store instructions with aligned ones;
- removed unnecessary memory writes;
- changed calculations a bit - replaced square root of product with product of square roots, so I was able to calculate these square roots first and then use result multiple times;
- removed some unnecessary code and provided templated versions of most performance-critical function, so compiler could optimize it further.

Wenn das so weitergeht wird TN-Grid noch zur Creditschleuder *lol*
 
Man ist das krass!
Ich sollte auch mal paar WUs antesten.
 
Unter Win (FMA) brechen mir alle WU mit Berechnungsfehler ab, mit der neuen App. :(
SSE 2 auch...
AVX scheint zu laufen!
 
Zuletzt bearbeitet:
Linux SSE2, von ca. 93 auf 53 Minuten runter...

Deine Abbrüche sind ja sonderbar, "Reason: Illegal Instruction (0xc000001d) at address 0x000000000040682a", ob da mehr als nur SSE2/AVX aktiviert wurde, irgendwas was deine CPU nicht kann?
 
der C2 zeigt eine Forcast von ca. 1h per WU bei der ARM App., ich teste das mal...
 
...
Deine Abbrüche sind ja sonderbar, "Reason: Illegal Instruction (0xc000001d) at address 0x000000000040682a", ob da mehr als nur SSE2/AVX aktiviert wurde, irgendwas was deine CPU nicht kann?

Keine Ahnung, ist ein FX 8320. Der ist zwar nicht mehr der jüngste, SSE2 und FMA sollte er aber beherrschen. :)

Edit: Win 10 64, AVX, FX 8320 @ 3,5 GHz runter von ca. 1:57h auf 1:05 h. *great*
 
Zuletzt bearbeitet:
Hm ??? was nehme ich denn nu für i7-2600?

SSE2 vermutlich, AVX kann der zwar auch, aber kein AVX2 und bei den bisherigen AVX habe ich keinen Vorteil feststellen können.

--- Update ---

BTW: Was passiert überhaupt, wenn ich SSE2, AVX und FMA alle in denselben Ordner entpacke? Sieht doch so aus, als ob das klappen sollte?

--- Update ---

Nä, klappt eben nicht, in allen Zip sind je zwei Dateien, die immer gleich benannt sind. Es werden also die alten überschrieben und das gerechnet, was zuletzt entpackt wurde.
Da sollte man schon wissen, was am besten geeignet ist.

--- Update ---

Gibt es von euch Tipps, was am besten geeignet wäre für:

-Sandy bridge (i7-2600 / rechnet derzeit SSE2, AVX)
-Ivy bridge (i7-3630QM / derzeit leider aus)
-Haswell (i7-4790T, rechnet derzeit SSE2, AVX, FMA)
 
der C2 zeigt eine Forcast von ca. 1h per WU bei der ARM App., ich teste das mal...

TN-Grid.linux-armv7a-vfpv4-v1.0.tgz

Das ist noch die Version vom 2016-12-26, wenn du da bislang die default v0.10 verwendest gibt das keinen Unterschied, sollten effektiv die gleichen Anwendungen sein. Ein ARM Kompilat mit den Änderungen der v1.1 fehlt aktuell noch.

Mit Version 0.10 (auf i7 3770) hatte sich bei mir die Laufzeit der SSE2 WUs 10 Minuten vor den AVX WUs eingependelt. Ich nehme mal an das bleibt so, bin zu faul zum testen ;-)
 
Zuletzt bearbeitet:
na ich habe TN zum ersten Mal auf dem C2 am Start.
die Laufzeiten sind jetzt hoch auf 8h, das wäre zu schön.
Im Moment läuft nur ein C2 zu Probe.

SSE oder AVX @X86 würde ich SSE den Vorang geben und bei Intel erst ab Haswell AVX laufen lassen.

EDIT:
Laufzeiten unter Win10 auf einem Xeon E5 v3 Haswell mit AVX haben sich halbiert
 
Zuletzt bearbeitet:
7.5-8h sind auf einem übertakteten C2 drin...
 
O.K., probieren geht über studieren. *noahnung*

Wow, 12% nach 7,5 min. Das könnte unter 1h liegen... (SSE2)

Dann folgt der 4790T auch gleich.

--- Update ---

Oh, ich hatte ganz vergessen, dass da noch ein einsamer J1900 gegen die TN-Grid-WUs kämpft. Jetzt ebenfalls mir der neuen SSE2-App.
Schaun wir mal, ob da was zu sehen ist. Bisher lagen die Laufzeiten bei 25.000-26.000 s

Der 4790T hat mit AVX die ersten WUs jetzt nach 18min bei 33%

--- Update ---

Der J1900 geht auch jetzt in Richtung <4h Laufzeit. Nicht zu fassen!

--- Update ---

Der i7-2600 (mitt SSE2) hat den ersten Satz durch:

Vorher: 8.600 ... 9.300 s
Nachher: 3.580 ... 3.700 s

--- Update ---

i7-4790T (mit AVX):

Vorher: 7.200 ... 8.300 s
Nachher: 3.200 ... 3.300 s

--- Update ---

Der J1900 liegt nach ca. 1h bei 30% . Die App gefällt mir. :D
 
Zuletzt bearbeitet:
Ich bekomme auf dem fx8350 mit FMA nur Berechnungsfehler.

Edit

Lag wahrscheinlich daran das ich im TN-grid ordner alles rausgelöscht habe und er dann die "ec_v3f_mgn.csv" Datei nicht finden konnte.

Failed to open "ec_v3f_mgn.csv" file

Jetzt wo alles wieder da ist, rechnet er fleißig. Mal sehen was am Ende rauskommt.
 
Zuletzt bearbeitet:
Bei mir läuft weiterhin nur die AVX-App. An der CSV-Datei liegt es bei mir nicht, die ist da...
 
Hm, mit der FMA habe ich auch keinen Erfolg gehabt, jedenfalls nicht auf dem Ivy bridge.

Ich habe aber gesehen, dass der Haswell schon FMA gerechnet hat (mit Erfolg) - also werde ich das dort nochmal probieren.
Die SSE2 und AVX laufen gut.

Und SSE2 auf dem J1900 geht auch richtig gut, vorher 25.000 ...26.000s - jetzt so um die 12.000 s. Was will man mehr.
 
Zurück
Oben Unten