Monitoring für SMP@Win und GPU-Client - Problem

Eckat

Lt. Commander
Mitglied seit
11.04.2007
Beiträge
139
Renomée
3
Hallo!

Ich habe mich heute mal etwas schlau gelesen und mich für den Win-SMP- und GPU-Client entschieden. Nach anfänglichen Schwierigkeiten scheinen beide auch zu laufen.

Leider funktioniert FAHmon nicht wirklich bei mir, er erkennt zwar beide Projekte, aber der Status bleibt bei beiden immer N/A. Nur der Nick wird erkannt. Für den SMP-Client habe ich den Workaround mit der html Datei gemacht, was keine Veränderung brachte.

Hier mal zwei Bilder von FAHmon bei mir (Zeit seit Beginn ca. 4h):
fahmon_eckat_1.png

fahmon_eckat_2.png


Liegt das an FAHmon oder mach ich grundsätzlich irgendwas falsch?

CU Eckat
 
FahMon erkennt nicht alle Projekte. Aber zumindest die Fortschrittsanzeige sollte funktionieren. Allerdings tut sie das glaube ich erst nach 2-3 %, mglw. musst Du also einfach noch etwas warten.
Du kannst auch die Fehleranzeige von FahMon aktivieren (weiß jetzt nur nicht wie das geht, habs nämlich grad nicht hier). Vll. steht da etwas brauchbares drin.
 
In den logs für die Clients steht folgendes drin.
Für den SMP:
Code:
--- Opening Log file [May 8 10:05:02] 


# SMP Client ##################################################################
###############################################################################

                       Folding@Home Client Version 5.91beta

                          http://folding.stanford.edu

###############################################################################
###############################################################################

Launch directory: D:\Programme\Folding@Home Windows SMP Client V1.01
Service: D:\Programme\Folding@Home Windows SMP Client V1.01\fah.exe
Arguments: -svcstart 

Launched as a service.
Entered D:\Programme\Folding@Home Windows SMP Client V1.01 to do work.

[10:05:02] - Ask before connecting: No
[10:05:02] - User name: Eckat (Team 34361)
[10:05:02] - User ID: 4E72FA540B5D527E
[10:05:02] - Machine ID: 1
[10:05:02] 
[10:05:02] Loaded queue successfully.
[10:05:02] 
[10:05:02] + Processing work unit
[10:05:02] Core required: FahCore_a1.exe
[10:05:02] Core found.
[10:05:02] Working on Unit 01 [May 8 10:05:02]
[10:05:02] + Working ...

Für den GPU-Client (die letzten beiden Blöcke):
Code:
[12:25:21] + Attempting to send results
[12:25:22] + Results successfully sent
[12:25:22] Thank you for your contribution to Folding@Home.
[12:25:26] - Preparing to get new work unit...
[12:25:26] + Attempting to get work packet
[12:25:26] - Connecting to assignment server
[12:25:27] - Successful: assigned to (171.64.65.20).
[12:25:27] + News From Folding@Home: GPU folding beta
[12:25:27] Loaded queue successfully.
[12:25:29] + Closed connections
[12:25:34] 
[12:25:34] + Processing work unit
[12:25:34] Core required: FahCore_10.exe
[12:25:34] Core found.
[12:25:34] Working on Unit 09 [May 8 12:25:34]
[12:25:34] + Working ...
[12:25:34] 
[12:25:34] *------------------------------*
[12:25:34] Folding@Home GPU Core - Beta
[12:25:34] Version 0.10 (Mon Oct 30 12:32:17 PST 2006)
[12:25:34] 
[12:25:34] Compiler  : Microsoft (R) 32-bit C/C++ Optimizing Compiler Version 13.10.3077 for 80x86
[12:25:34] Build host: CYGWIN_NT-5.1 vishal-gpu 1.5.19(0.150/4/2) 2006-01-20 13:28 i686 Cygwin
[12:25:34] Preparing to commence simulation
[12:25:34] - Looking at optimizations...
[12:25:34] - Created dyn
[12:25:34] - Files status OK
[12:25:34] - Expanded 86866 -> 443713 (decompressed 510.8 percent)
[12:25:34] 
[12:25:34] Project: 2737 (Run 4, Clone 254, Gen 7)
[12:25:34] 
[12:25:34] Assembly optimizations on if available.
[12:25:34] Entering M.D.
[12:25:41] Working on 1258 p2737_GPUlambda
[12:25:41] Starting GUI Server
[12:25:48] mdrun_gpu returned 114
[12:25:48] Going to send back what have done.
[12:25:48] logfile size: 7155
[12:25:48] - Writing 7693 bytes of core data to disk...
[12:25:48] Done: 7181 -> 2720 (compressed to 37.8 percent)
[12:25:48]   ... Done.
[12:25:48] 
[12:25:48] Folding@home Core Shutdown: EARLY_UNIT_END
[12:25:52] CoreStatus = 72 (114)
[12:25:52] Sending work to server


[12:25:52] + Attempting to send results
[12:25:53] + Results successfully sent
[12:25:53] Thank you for your contribution to Folding@Home.
[12:25:57] - Preparing to get new work unit...
[12:25:57] + Attempting to get work packet
[12:25:57] - Connecting to assignment server
[12:25:58] - Successful: assigned to (171.64.65.20).
[12:25:58] + News From Folding@Home: GPU folding beta
[12:25:58] Loaded queue successfully.
[12:26:00] + Closed connections

Wie lange dauert es denn ungefähr, bis man 2 bis 3 % fertig hat?

System:
MSI K9A Platinum
Athlon64 X2 4800+
2x 512 MB RAM
ATI Radeon X1950Pro 256 MB PCIe

CU Eckat
.
EDIT :
.

Achja, der log von FAHmon selber:
Code:
[08/05/07 - 14:24:49]   Reloading Eckat
[08/05/07 - 14:24:49]   Reloading Eckat_GPU
[08/05/07 - 14:24:49] X Error while reading D:/Programme/Folding@Home Windows SMP Client V1.01/unitinfo.txt!
[08/05/07 - 14:24:49] ! Unable to save D:/Programme/Folding@Home Windows SMP Client V1.01/work/current.xyz because it does not exist
[08/05/07 - 14:24:49]   Eckat has an unknown state (Unable to find a complete frame)
[08/05/07 - 14:24:49] X Error while reading D:/burn2/Programme/FAH5.91beta4-GPU/unitinfo.txt!
[08/05/07 - 14:24:49] ! Unable to save D:/burn2/Programme/FAH5.91beta4-GPU/work/current.xyz because it does not exist
[08/05/07 - 14:24:49]   Eckat_GPU has an unknown state (Unable to find a complete frame)
[08/05/07 - 14:24:50]   Reloading Eckat_GPU
[08/05/07 - 14:24:50]   Reloading Eckat
[08/05/07 - 14:24:50] X Error while reading D:/Programme/Folding@Home Windows SMP Client V1.01/unitinfo.txt!
[08/05/07 - 14:24:50] ! Unable to save D:/Programme/Folding@Home Windows SMP Client V1.01/work/current.xyz because it does not exist
[08/05/07 - 14:24:50]   Eckat has an unknown state (Unable to find a complete frame)
[08/05/07 - 14:24:50] X Error while reading D:/burn2/Programme/FAH5.91beta4-GPU/unitinfo.txt!
[08/05/07 - 14:24:50] ! Unable to save D:/burn2/Programme/FAH5.91beta4-GPU/work/current.xyz because it does not exist
[08/05/07 - 14:24:50]   Eckat_GPU has an unknown state (Unable to find a complete frame)
[08/05/07 - 14:26:04]   Reloading Eckat
[08/05/07 - 14:26:04]   Reloading Eckat_GPU
[08/05/07 - 14:26:04] X Error while reading D:/Programme/Folding@Home Windows SMP Client V1.01/unitinfo.txt!
[08/05/07 - 14:26:04] ! Unable to save D:/Programme/Folding@Home Windows SMP Client V1.01/work/current.xyz because it does not exist
[08/05/07 - 14:26:04]   Eckat has an unknown state (Unable to find a complete frame)
[08/05/07 - 14:26:04] X Error while reading D:/burn2/Programme/FAH5.91beta4-GPU/unitinfo.txt!
[08/05/07 - 14:26:04] ! Unable to save D:/burn2/Programme/FAH5.91beta4-GPU/work/current.xyz because it does not exist
[08/05/07 - 14:26:04]   Eckat_GPU has an unknown state (Unable to find a complete frame)
[08/05/07 - 14:28:04]   Reloading Eckat
[08/05/07 - 14:28:04]   Reloading Eckat_GPU
[08/05/07 - 14:28:04] X Error while reading D:/Programme/Folding@Home Windows SMP Client V1.01/unitinfo.txt!
[08/05/07 - 14:28:04] ! Unable to save D:/Programme/Folding@Home Windows SMP Client V1.01/work/current.xyz because it does not exist
[08/05/07 - 14:28:04]   Eckat has an unknown state (Unable to find a complete frame)
[08/05/07 - 14:28:04] X Error while reading D:/burn2/Programme/FAH5.91beta4-GPU/unitinfo.txt!
[08/05/07 - 14:28:04] ! Unable to save D:/burn2/Programme/FAH5.91beta4-GPU/work/current.xyz because it does not exist
[08/05/07 - 14:28:04]   Eckat_GPU has an unknown state (Unable to find a complete frame)

Sorry, hab erst dann wieder heute Abend Zeit :(

CU Eckat
 
Zum FahMon Problem fällt mir gerade nichts ein, aber vielleicht löst sich das von selbst, wenn deine ganzen anderen Probleme beseitigt sind:

1. Dein GPU Client produziert nur EUEs (Early Unit Ends), sprich er produziert Müll. Momentan hast du 135 WUs abgeliefert, aber keinen einzigen Punkt dafür gekriegt. Du solltest deine Treiber, DirectX Version, und evtl. Übertaktung überprüfen.

2. Du benutzt das Flag -svstart beim SMP Client. Der SMP Client kann (afaik) noch nicht als Service gestartet werden.

3. Es macht keinen Sinn SMP und GPU auf einem X2 4800+ laufen zu lassen, da der GPU Client einen kompletten CPU Core für sich beansprucht. Wahrscheinlich schaffst du so nichtmal die SMP Deadlines. Also entweder GPU + 1x normaler CLI Client oder nur SMP.


FahMon erkennt nicht alle Projekte.
FahMon erkennt alle Projekte, die auf http://fah-web.stanford.edu/psummary.html gelistet sind.
 
OK, also das mit den Treibern etc. muß ich auf später verschieben. Ich weiß nur, dass ich den aktuellen Catalyst (7.4), DX9c installiert habe und nichts übertaktet ist.
Wenn der GPZ-Client laut GUI arbeitet ist die Prozess-Last laut Taskmanager zwischen 0 und 2 %.

Das Flag hab ich nicht gesetzt, das hat der bei der Installation gemacht. Mit den Flags hab ich mich noch nicht auseinander gesetzt, aber der Dienst läuft und braucht auch einiges an CPU-Last. Daraus würde ich schließen, er läuft ;)

Grundsätzliche Frage: Wenn nur einer von beiden Sinn macht, welcher ist dann, im Sinn von mehr WUs, sinnvoller?

CU Eckat
 
Wenn der GPZ-Client laut GUI arbeitet ist die Prozess-Last laut Taskmanager zwischen 0 und 2 %.
Das liegt daran, dass der Client nicht wirklich was berechnet. Schau mal ins Log, der wird immer sofort mit "Folding@home Core Shutdown: EARLY_UNIT_END" abbrechen.
Das Flag hab ich nicht gesetzt, das hat der bei der Installation gemacht. Mit den Flags hab ich mich noch nicht auseinander gesetzt, aber der Dienst läuft und braucht auch einiges an CPU-Last. Daraus würde ich schließen, er läuft ;)
Dann hast du beim ersten Config-Durchlauf wahrscheinlich angegeben, dass er als Service starten soll? Wie bereits gesagt, wird das afaik vom SMP Client noch nicht (offiziell) unterstützt.

Grundsätzliche Frage: Wenn nur einer von beiden Sinn macht, welcher ist dann, im Sinn von mehr WUs, sinnvoller?
PPD (Points Per Day) wird wahrscheinlich der SMP knapp mehr machen. Allerdings muss dein PC dann auch wirklich oft laufen, sonst schaffst du die Deadlines nicht (grob geschätzt knapp 12h/Tag).
Mehr "wissenschaftliche Arbeit" verrichtet allerdings der GPU Client, leider schlägt sich das momentan nicht in den Punkten nieder.
 
Dann werde ich nachher mal schauen, woran es beim GPU-Client liegen könnte.

CU Eckat
 
So... Der GPU-Client macht wohl gerne Zicken bei Karten mit nur 256 MB RAM. Natürlich habe ich mir so eine ausgesucht, da sie für meine sonstigen Bedürfnisse vollkommen reicht.
Fazit: Ich werde keinen GPU-Client nutzen.

Den SMP habe ich deinstalliert und neu installiert, da trotz vieler Bemühungen keine Besserung in Sicht war. Trotz "guter" CPU-Last konnte ich auch nach einem 1/2 Tag keinen Fortschritt finden.
Jetzt habe ich ihn, obwohl es beim Installieren angeboten wird, NICHT als Service eintragen lassen. Siehe da, er rechnet mit 100% Last auf beiden Cores. :) Und FAHmon kann es auch auf Anhieb auslesen.

Meine Verwunderung gilt aber der Berechnungsdauer. Ich hatte wohl gehört, dass die Deadlines sehr knapp gesetzt sind, das macht ja auch durchaus Sinn, aber soooo knapp....
Mein PC rechnet jetzt seit 11h an einer WU und hat 13% geschafft. Laut FAHmon ergibt sich eine Restzeit von 2d06h. Das Ende wäre also Übermorgen (11.5.) gegen 15:00 Uhr. Die Deadline ist mit 12.05.2007 23:51 Uhr angegeben.

Grundsätzlich wollte ich den Client immer laufen lassen, wenn der PC läuft. Das sind so 16h am Tag. Aber bei einer Berechnungsdauer von gut 87h und einer maximalen Zeit bis zur Deadline seit Start von 96h würde das nicht reichen. 16 von 24h sind 67%, aber 87 von 96h entsprechen 91%.
Dabei sind noch keine Ausnahmen etc. berücksichtigt, wo der PC evtl. mal doch nicht 16h läuft oder er nicht 100% CPU für F@H zur Verfügung hat.

Meine Frage: Ist das so normal oder ist mein (neuer) PC zu langsam? :] *noahnung*

CU Eckat
 
1. Der SMP-Client kann derzeit wirklich nicht als Dienst gestartet werden.
2. FahMon erkennt vll. alle Projekte, die aus der Betaphase raus sind, aber es gibt ja auch noch die Betaprojekte. Jedenfalls habe ich das des öfteren, dass er eine WU nicht erkennt.
3. Eine Deadline von 4 Tagen bei den SMP-WUs und eine Berechnungsdauer von 2-3 Tagen auf einem 4800+ kommt ungefähr hin.
 
3. Eine Deadline von 4 Tagen bei den SMP-WUs und eine Berechnungsdauer von 2-3 Tagen auf einem 4800+ kommt ungefähr hin.
Schade, dann ist das erstmal ein kurzes Gastspiel von mir bei F@H :(
Aber nur dafür den PC auch über Nacht eingeschaltet zu lassen finde ich nicht sinnvoll.

Mal abwarten wie das mit den Quad-Cores von AMD aussieht.

CU Eckat
 
Nimm doch den normalen Client. Da schaffst Du die Deadlines locker. Er wirft zwar weit weniger Punkte ab, aber Kleinvieh macht auch Mist. Und er läuft auch als Dienst.
 
Schade, dann ist das erstmal ein kurzes Gastspiel von mir bei F@H :(
Aber nur dafür den PC auch über Nacht eingeschaltet zu lassen finde ich nicht sinnvoll.

Mal abwarten wie das mit den Quad-Cores von AMD aussieht.

CU Eckat

Problem ist das der SMP-Client zwar auch auf den Dual-Cores läuft aber eigentlich für die Maschinen mit 4 und mehr Prozessoren gedacht ist.

Wenn du die Deadlines auf einem Dual-Core schaffen willst, muss er durchlaufen.

Installiere dir doch, so wie Tiku sagt, zweimal den Standard-Client. Da sind die Deadlines viel länger und dein Rechner wird da auch gut Punkte bringen.
Nicht soviel wie mit dem SMP-Client aber "Kleinvieh" macht auch Mist ;)
 
Wenn die WU durch ist mit dem SMP werde ich auf 2x Standard-Console-Client umsteigen.

Leider habe ich über die Suche nichts gefunden. Gibt es einen Thread, der sich mit den Catalyst-Treiber-Versionen und der Kompatibilität zu dem GPU-Client befasst?

Zusätzlich habe ich auf meinem kleinen Linux-home-Server (eigentlich für einen Entwicklungs-Apache-Server und kleinere Dienste zuständig) auch mal den Client installiert. Wie zu erwarten ist die Geschwindigkeit äußerst mies, aber das liebe Kleinvieh ... :D
Der P3 800 läuft auf einem recht sparsamen aber langsamen Motherboard und wird laut FAHmon ca. 16 Tage für eine WU brauchen *lol* -> ca. 12 ppd
 
Zurück
Oben Unten