Gromacs cannot continue further.

Steelmaster

Admiral Special
Mitglied seit
02.07.2006
Beiträge
1.177
Renomée
3
  • SIMAP Race
  • QMC Race
Hi Leute,

jetzt hatte ich schon 30% von einer 622 Credit WU fertig, und jetzt isses leider abgebrochen.

Gestern lief mein PC (Win XP) schon etliche Stunden und ich hatte 100er Fensterchen/Anwendungen offen. Jedenfalls hat er sich dann irgendwie "verschluckt". Der Rechner ist nicht abgestürzt, aber das Icon von Folding@Home wurde nicht mehr in der Taskleiste angezeigt und auch das vom Taskmanager nicht. Ansonsten lief alles normal weiter. Der Folding Core lief aber noch laut Prozessauflistung im Taskmanager, also hab ich mir nichts weiter bei gedacht.

Heute seh ich aber, dass die WU nicht fortgesetzt werden konnte - siehe auch Logfile Ausschnitt.

Woran kann das denn liegen und wie kann man das verhindern. Ich habe die maximale CPU Auslastung auf ca. 60% eingestellt - kann das damit zu tun haben?

# Windows Graphical Edition ###################################################
###############################################################################

Folding@Home Client Version 5.03

http://folding.stanford.edu

###############################################################################
###############################################################################

Launch directory: C:\Programme\tools\Sonstiges\Folding@Home


[07:32:00] - Ask before connecting: No
[07:32:00] - User name: Steelmaster (Team 34361)
[07:32:00] - User ID: 7C6309D80B6FF1F9
[07:32:00] - Machine ID: 1
[07:32:00]
[07:32:00] Loaded queue successfully.
[07:32:00] Initialization complete
[07:32:00] + Benchmarking ...
[07:32:02]
[07:32:02] + Processing work unit
[07:32:02] Core required: FahCore_78.exe
[07:32:02] Core found.
[07:32:02] Working on Unit 03 [July 9 07:32:02]
[07:32:02] + Working ...
[07:32:03]
[07:32:03] *------------------------------*
[07:32:03] Folding@Home Gromacs Core
[07:32:03] Version 1.90 (March 8, 2006)
[07:32:03]
[07:32:03] Preparing to commence simulation
[07:32:03] - Looking at optimizations...
[07:32:03] - Files status OK
[07:32:08] - Expanded 3173644 -> 17202261 (decompressed 542.0 percent)
[07:32:10]
[07:32:10] Project: 1165 (Run 6, Clone 9, Gen 3)
[07:32:10]
[07:32:10] Assembly optimizations on if available.
[07:32:10] Entering M.D.
[07:32:34] (Starting from checkpoint)
[07:32:34] Protein: p1165_RIBO_H2O_flex
[07:32:34]
[07:32:34] Writing local files
[07:32:34] Completed 80000 out of 250000 steps (32)
[07:32:40] Extra SSE boost OK.
[08:24:01] Writing local files
[08:24:01] Completed 82500 out of 250000 steps (33)
[09:08:47] Gromacs cannot continue further.
[09:08:47] Going to send back what have done.
[09:08:47] logfile size: 82754
[09:08:48] - Writing 83290 bytes of core data to disk...
[09:08:48] ... Done.
[09:08:48]
[09:08:48] Folding@home Core Shutdown: EARLY_UNIT_END
[09:08:51] CoreStatus = 72 (114)
[09:08:51] Sending work to server


[09:08:51] + Attempting to send results
[09:08:56] + Results successfully sent
[09:08:56] Thank you for your contribution to Folding@Home.
[09:09:00] - Preparing to get new work unit...
[09:09:00] + Attempting to get work packet
[09:09:00] - Connecting to assignment server
[09:09:01] - Successful: assigned to (171.65.103.156).
[09:09:01] + News From Folding@Home: Welcome to Folding@Home
[09:09:01] Loaded queue successfully.
[09:09:18] + Closed connections
[09:09:23]
[09:09:23] + Processing work unit
[09:09:23] Core required: FahCore_78.exe
[09:09:23] Core found.
[09:09:23] Working on Unit 04 [July 9 09:09:23]
[09:09:23] + Working ...
[09:09:23]
[09:09:23] *------------------------------*
[09:09:23] Folding@Home Gromacs Core
[09:09:23] Version 1.90 (March 8, 2006)
[09:09:23]
[09:09:23] Preparing to commence simulation
[09:09:23] - Looking at optimizations...
[09:09:23] - Created dyn
[09:09:23] - Files status OK
[09:09:28] - Expanded 3017907 -> 17202261 (decompressed 570.0 percent)
[09:09:28] - Starting from initial work packet
[09:09:28]
[09:09:28] Project: 1164 (Run 5, Clone 47, Gen 2)
[09:09:28]
[09:09:29] Assembly optimizations on if available.
[09:09:29] Entering M.D.
[09:09:39] Protein: p1164_RIBO_H2O_froz
[09:09:39]
[09:09:39] Writing local files
[09:09:44] Extra SSE boost OK.
[09:09:45] Writing local files
[09:09:45] Completed 0 out of 250000 steps (0)
[09:15:54] Opening C:\Programme\tools\Sonstiges\Folding@Home\MyFolding.html...

edit:

die abgebrochene WU war: p1165_RIBO_H2O_flex und die neue ist nun p1164_RIBO_H2O_flex

Ist das jetzt der "Rest"?

nochmal edit:

Wurde mir trotzdem als abgelieferte WU angerechnet und hat immerhin noch 310 Punkte gebracht :) Trotzdem merkwürdig
 
Zuletzt bearbeitet:
Hi,

das kann prinzipiell an zwei Dingen liegen.

1. Das System ist aus irgendwelchen Gründen instabil. (Übertaktung etc.)
2. Die WU ist fehlerhaft. (das kommt ebenso vor)

Mit der Prozessorauslastung hat das gar nichts zu tun, da sich FAH sofort zurück nimmt (vorausgesetzt es läuft mit niedrigster Priorität), wenn andere Prozesse Rechenleistung erfordern.

Was die Systeminstablilitäten angeht, ist FAH extrem empfindlich, meiner Erfahrung nach noch empfindlicher als Prime !!!

Nicht vollständig berechnete WU´s geben anteilige Punkte. Mit den 310 hattest Du mächtig Glück. Manchmal gibt es kaum etwas für fast zuende gerechnete WU´s.
Manche starten dann auch selbstätig von neuem und die bereits berechneten Ergebnisse werden gelöscht. Verdammt ärgelich, wenn das passiert. Aber auch so etwas kommt vor.

So, ich hoffe damit sind Deine Fragen beantwortet.

Gruss

Tirpiz


P.S. die abgebrochene WU war: p1165_RIBO_H2O_flex und die neue ist nun p1164_RIBO_H2O_flex


Nein, das kann man so nicht sagen. Von der Bezeichnung her scheint es sich um eine sehr ähnliches Projekt zu handeln.
Ausserdem besteht ein Projekt aus tausenden von WU. Eine WU ist wirklich nur ein klitzekleiner Teil in einem Projekt.
Am ehesten kann man das wohl vergleichen mit einem Einzelbild in einer stundenlangen Videosequenz. Erst wenn am Ende alle
Bilder in der richtigen Reihenfolge aneinander gereiht werden, entsteht daraus ein Film.
 
Zuletzt bearbeitet:
Danke für die Antwort

Mein System ist generell eigentlich nicht instabil und läuft zumindest bis diese Hitze mal nachlässt auch auf Standardtakt.

Naja, muss halt irgendwie an diesem Mini-Absturz gelegen haben. Der Folding Algorithmus scheint tatsächlich extrem empfindlich zu sein. So hat man halt wenigstens einen ständigen Test, ob das System noch 100% funktioniert. Eigentlich auch nicht schlecht.

Vielleicht sollte man in OC Kreisen von "Primestable" auf "Foldingstable" wechseln ;)
 
Zurück
Oben Unten