Linux SMP Client: Was tun bei Shutdown nach 100% - qfix

mibo

Grand Admiral Special
Mitglied seit
05.01.2003
Beiträge
2.297
Renomée
65
Standort
Hannover
Hi Linux-64Bit-Beta-SMP Falter :-)

Heute morgen habe ich mal wieder einen Abbruch eines Clienten nach 100% bemerkt und nochmal die "qfix" Methode ausprobiert. Was soll ich sagen - es hat geklappt :-) und mir die Punkte einer 2605 WU gerettet.
Deshalb gibts hier die Schritt-für-Schritt Anleitung.

Das Problem:
Der Client macht nach Ende einer WU einfach nicht weiter. Meldung: "...
[19:41:36] - Shutting down core
[19:41:36]
[19:41:36] Folding@home Core Shutdown: FINISHED_UNIT"

Die Lösung:
Strg+C
# drücken zum Abbrechen des hängenden Clienten

wget http://linuxminded.nl/software/qd-tools/binaries/linux/x86/qfix
# download von qfix

chmod +x ./qfix
# ausführbar-machen von qfix

./qfix
# qfix starten, Meldung:
"entry 4, status 0, address 171.64.65.56:8080
entry 5, status 0, address 171.64.65.56:8080
entry 6, status 0, address 171.64.65.56:8080
entry 7, status 0, address 171.64.65.56:8080
entry 8, status 0, address 171.64.65.56:8080
entry 9, status 0, address 171.64.65.56:8080
entry 0, status 0, address 171.64.65.56:8080
entry 1, status 0, address 171.64.65.56:8080
entry 2, status 0, address 171.64.65.56:8080
entry 3, status 1, address 171.64.65.56:8080
Found results <work/wuresults_03.dat>: proj 2604, run 0, clone 222, gen 2
-- queue entry: proj 2604, run 0, clone 222, gen 2
-- queue entry isn't empty
File is OK
"
# Nummer des Eintrags merken, dessen Status nicht "0" ist (hier 3)

./fah6 -smp -delete 3
# dauert ca.4 Minuten
# Meldung:
"[07:11:51] Loaded queue successfully.
[07:11:51] Deleting work unit #3 from work queue...
[0]0:Return code = 18
[0]1:Return code = 18
[0]2:Return code = 0, signaled with Quit
[0]3:Return code = 0, signaled with Quit
[07:15:55] - Failed to delete the requested work unit

Folding@Home Client Shutdown."
# meldet zwar nen Fehler, das ist aber ok

./qfix
# nochmal qfix starten
# Meldung:
"File needed repair. Errors fixed: 1."

./fah6 -smp
# FAH Client wieder starten und hoffen, dass folgende Meldung kommt :-)
"...[07:19:33] + Attempting to send results
[07:19:34] - Successful: assigned to (171.64.65.56).
[07:19:34] + News From Folding@Home: Welcome to Folding@Home
[07:19:35] Loaded queue successfully.
[07:19:42] + Results successfully sent
[07:19:42] Thank you for your contribution to Folding@Home."


Die Methode funktioniert leider nicht immer. Man muß das Problem auch schnell bemerken und drauf reagieren, da die Deadlines bei den SMP-Beta-WUs ziemlich kurz sind.

Frohes Falten
mibo

Edit: nach dem zweiten ./qfix kann man auch erstmal ein
./fah6 -smp -send all
ausführen, damit die WU schnell zurückgeschickt wird.

Edit2: Adresse von qfix aktualisiert und auf den aktuellen Syntax von fah6 umgestellt - die Methode funktionierte gerade bei mir mit der neuen fah6 Version. "qfix" in den Threadtitel eingefügt, damit man es mit der "Suche"-Funktion finden kann.
 
Zuletzt bearbeitet:
Hi,

danke für deinen Tipp!


Leider hatte ich am letzten Sonntag auch dieses Problem! WU war fertig und "Zapp" futsch waren die Punkte... 8-( Hab keine Ahnung warum das so war.. :-[

Vielleicht kann ich ja beim nächsten mal was retten...


MfG
macom
 
Vielen Dank. Die Beschreibung hat mir gerade mal wieder 1760 Punkte gerettet.

Gruß
thorsam
 
schön, wenns geholfen hat :-)

Alles für den Output

*attacke* *attacke* *attacke*
 
*push*

Da es mir heute mal wieder eine WU gerettet hat, gibts ein kleines Update von der Anleitung in Post #1.

happy crunching
mibo
 
Zurück
Oben Unten