11. Pentathlon 2020 - Rosetta (Marathon)

Also entweder hat mein 1090T (Ubuntu 20.04) ein richtiges Problem oder es gibt eine Serie defekter WU´s:
Junior_HalfRoid_design6_cart_COVID-19_SAVE_ALL_OUT_IGNORE_THE_REST...
Werden alle kurz angerechnet und dann mit Rechenfehler abgebrochen. Die Dinger werden gerade in Masse verteilt.
Allerdings hat er andere WUs aktuell in Arbeit ohne Berechnungsfehler...???
Das exakte Problem habe ich auch mit allen K10 CPUs. 1090T, X4 810 und ein 12 Kern Opti. Betrifft die SAVE_ALL_OUT_IGNORE_THE_REST.
Keine Ahnung warum. Vielleicht brauchen die AVX (und keiner weiß das, weil es heute jeder hat)...
 
Kann nicht sein - hab' einige von den "SAVE_ALL_OUT_IGNORE_THE_REST" WUs auf meinen Celerons gesehen - die haben auch kein AVX...
 
Dann liegt es nicht an AVX und ist noch mysteriöser. Naja, dann bleiben halt nur die A_fold_SAVE_ALL_OUT am laufen.
 
Das exakte Problem habe ich auch mit allen K10 CPUs. 1090T, X4 810 und ein 12 Kern Opti. Betrifft die SAVE_ALL_OUT_IGNORE_THE_REST.
Keine Ahnung warum. Vielleicht brauchen die AVX (und keiner weiß das, weil es heute jeder hat)...

SSE4.1?

--- Update ---

Wir haben übrigens wohl Mitglied Nr. 1000 in unserem Team bekommen!
 
Das Rosetta jetzt die Datenbank nur noch einmal auspackt und nicht mehr jeden Slot damit zuballert ist sicher eine der sinnigsten Verbesserungen der letzten Zeit gewesen.
Stelle gerade um von N2 + NFS storage auf N2 lokal. Es laufen 6 Rosetta WUs, noch 50 auf Halde und trotzdem sind inkl. OS nur 4.4 von 7.0 GB der eMMC belegt. Hurra!
 
Über Nacht hat der 1090T jetzt 17 Wuzen ohne weiter Fehler fertig gebracht. Immerhin 1.100 Credits *buck*

Da sind einige SAVE_ALL_OUTxxx und xxxIGNORE_THE_REST dabei. Allerdings nicht SAVE_ALL_OUT_IGNORE_THE_REST

Die Juniors habe ich konsequent abgebrochen.
 
Wir brauchen hier mehr Power!
Nur noch 450k Vorsprung auf LTT.
Hab außer dem R9 alles auf Rosetta, aber da kommt nicht viel bei rum :]
 
Ist bei mir auch so - der R9 ist leider noch gut mit ibercivis beschäftigt - aber sobald er da durch ist (werde defintiv nicht mehr nachfassen), wird er auch noch ein paar Rosen pflücken..
 
Ich habe nun auch noch mal 16 Kerne auf Rosetta angesetzt. Leider haben die Kisten alle nur 8GB Ram, so das wirklich nur 4 Kerne pro System arbeiten können.
 
Ich schwenke auch noch mal 16 Threads von den lieblichen Nummern zum Marathon.
 
Es scheint sich ganz langsam auszuwirken - zumindest konnten wir die letzten 2-3h unseren hauchdünnen Vorsprung zu LLT wieder minimalst vergrößern.

Weiter so Jungs! *great*

Mein C2 kriegt leider keine Rosen mehr - jetzt heißt es wieder zuwenig Speicher :(
(Macht er derweil halt Openpandemics)
 
Ich schwenke von Amicable auch mal zu den Rosen. 16 Zen2 Threads mehr...
Amicable sehe ich nicht mehr dass wir die 10 Mio noch aufholen - auch wenn uns die 3 Punkte am Ende schmerzlich fehlen könnten...
 
Na super. 38 Gute vs. >116 Schrott. Und das in 10 Tagen mit einem Ryzen 9 3900X. Ich bin so stolz auf mich. Der macht jetzt ein anderes Projekt.
Heißt aber auch, dass ich bei den Rosetten ganz raus bin.

Mann, mann. Hätte ich das nur eher kontrolliert. *elch* *elch* Doppel-*elch*
 
Das muss ich alles erst mal gegenschecken. Ich habe doch die Tage immer was bei durchschnittlich 20-25k/d gesehen.
Das da sind <10k. wann werden die denn gelöscht, jeden Tag?

--- Update ---

Egal. hatte ja schon mal festgestellt, dass es am Besten läuft, wenn man nicht reinschaut. und 10k könnte ja sein, weil ich für NF rosetta pausiert hatte.
 
Das sind doch keine Fehler, sondern das Ergebnis wurde knapp doch noch gemeldet und du hast mit der WU noch nicht begonnen.


kann ich mir nicht vorstellen:
Erstellt 15 May 2020, 4:47:47 UTC
Gesendet 15 May 2020, 4:49:30 UTC
Ablaufdatum 18 May 2020, 4:49:30 UTC
Empfangen 15 May 2020, 9:12:40 UTC
Serverstatus Abgeschlossen
Resultat Berechnungsfehler
Clientstatus Abgebrochen durch Server
 
Über Nacht hat der 1090T jetzt 17 Wuzen ohne weiter Fehler fertig gebracht. Immerhin 1.100 Credits *buck*

Da sind einige SAVE_ALL_OUTxxx und xxxIGNORE_THE_REST dabei. Allerdings nicht SAVE_ALL_OUT_IGNORE_THE_REST

Die Juniors habe ich konsequent abgebrochen.



Auf dem 3900X produzieren die split_bas_agba Berechnungsfehler so bei 3:50h - also kurz vor Ende .

So langsam wird die Selektion stressig...
 
Hmm, ich habe auf dem 3800X grad zwei "split_pass_bp_agba" in der Mangel - werde das beobachten und sehen, ob die bei mir auch spirenzien machen.

--- Update ---

Mist, eine ist durch gegangen und immerhin 180 Punkte gebracht, die zweite ist nach knapp 4h abgebrochen -> Berechnungsfehler. Grml!

--- Update ---

Code:
<core_client_version>7.16.5</core_client_version>
<![CDATA[
<stderr_txt>
command: projects/boinc.bakerlab.org_rosetta/rosetta_4.20_windows_x86_64.exe -abinitio::fastrelax 1 -ex2aro 1 -frag3 00001.200.3mers.index -in:file:native 00001.pdb -silent_gz 1 -frag9 00001.200.9mers.index -out:file:silent default.out -ex1 1 -abinitio::rsd_wt_loop 0.5 -relax::default_repeats 5 -abinitio::use_filters false -abinitio::increase_cycles 10 -abinitio::rsd_wt_helix 0.5 -beta 1 -abinitio::rg_reweight 0.5 -in:file:boinc_wu_zip split_pass_bp_agba--rlx_aln_c1_aln_pass_build.bp_20200508201700.pdb-edge1-4-6_renumbered_obj01_polA-3-5.pdb.blue.bp_20200510073414_0001_0001_fragments_data.zip -out:file:silent default.out -silent_gz -mute all -nstruct 10000 -cpu_run_time 28800 -boinc:max_nstruct 20000 -checkpoint_interval 120 -database minirosetta_database -in::file::zip minirosetta_database.zip -boinc::watchdog -boinc::cpu_run_timeout 36000 -run::rng mt19937 -constant_seed -jran 1651978
Using database: database_357d5d93529_n_methyl\minirosetta_database
WARNING! [COLOR="#FF0000"][B]attempt to create gzipped file ../../projects/boinc.bakerlab.org_rosetta/split_pass_bp_agba--rlx_aln_c1_aln_pass_build.bp_20200508201700.pdb-edge1-4-6_renumbered_obj01_polA-3-5.pdb.blue.bp_20200510073414_0001_0001_fragments_fold_SAVE_ALL_OUT_929561_745_0_r1027261576_0 failed.[/B][/COLOR]
======================================================
DONE ::     1 starting structures  14020.7 cpu seconds
This process generated     19 decoys from      19 attempts
======================================================
BOINC :: WS_max 4.67538e+08
20:02:33 (13916): called boinc_finish(0)

</stderr_txt>
<message>
upload failure: <file_xfer_error>
  <file_name>split_pass_bp_agba--rlx_aln_c1_aln_pass_build.bp_20200508201700.pdb-edge1-4-6_renumbered_obj01_polA-3-5.pdb.blue.bp_20200510073414_0001_0001_fragments_fold_SAVE_ALL_OUT_929561_745_0_r1027261576_0</file_name>
  <error_code>-240 (stat() failed)</error_code>
</file_xfer_error>
</message>
]]>

Schaut so aus, als wäre einfach der filename zu lang?
 
Ja ja. Wie hatte ich schonmal vermutet? Am Besten läufts, wenn man nicht hinschaut. *buck*
 
Darum läufts also bei mir so gut dieses Jahr.
Aber nee, der kleine Athlon 5350 war irgendwann leer gelaufen. Den konnte ich nicht anschauen, weil der mit meinem KVM-Switch nicht klarkommt.
 
So, folgendes rechnet nun noch ein wenig hier mit.
i7-8650U(8T), i3-9100T(4T), i3-9100(4T), i3-8100(4T), R5 3400G(4T), R3 3200G(4T)

Wahnsinn, wenn man Bedenkt, das ein 3950X alles zusammen in die Tasche steckt...

Auf die Intel Kisten habe ich auch Zugriff, die könnten auch bei Bedarf etwas anderes berechnen.
 
Hmm, ich habe auf dem 3800X grad zwei "split_pass_bp_agba" in der Mangel - werde das beobachten und sehen, ob die bei mir auch spirenzien machen.

--- Update ---

Mist, eine ist durch gegangen und immerhin 180 Punkte gebracht, die zweite ist nach knapp 4h abgebrochen -> Berechnungsfehler. Grml!
(...)
Schaut so aus, als wäre einfach der filename zu lang?

Auch ich hatte Pech mit diesen, nach 7:45h von 8h Abbruch, gänzlich ohne Punkte :-(
https://boinc.bakerlab.org/rosetta/result.php?resultid=1180884077
Der Fehler ist auch bei mir derselbe, der Name ist schon arg lang:
Code:
split_pass_bp_agba--rlx_aln_c1_aln_pass_build.bp_20200508201700.pdb-edge1-4-6_renumbered_obj01_polA-3-5.pdb.blue.bp_20200510105447_0001_0001_fragments_fold_SAVE_ALL_OUT_929569_568_0
 
Zurück
Oben Unten