Text Client mit P4 HT System

Takato

Commander
Mitglied seit
08.07.2005
Beiträge
191
Renomée
0
  • Docking@Home
Moin Crunchgemeinde!

Ich habe mir eine neue Rechenmaschine zusammengeschraubt einen P4 2,4Ghz @ 3,06Ghz mit HT und habe natürlich 1GB RAM.
Das Betriebssystem ist WinXP Pro und ich verwende den Textclient da ich aber nun in den FAQ´s gelesen habe das 4 Textclients am Ende schneller sind als immer einen laufen zulassen habe ich es auch so gemacht. Also jeweils die Ordner FAH 1 - 4 erstellt und bei jedem ein Textclient rein kopiert sowie konfiguriert und eine Verknüpfung mit den Erweiterungen -local -advmethods -forceasm -verbosity 9 gemacht und starte die auch jeweils nur rechnen die nicht so richtig manchmal nur 2 oder 3 Clients und die rechnen aber nicht die WU komplett sondern brechen oft ab und holen sich eine neue WU.
Die core priority hab ich auf low priority bei allen Clients gestellt.
Und jeder Client hat seine eigene ID also 1 - 4.

Also was hab ich falsch gemacht das der ordentlich durch cruncht und das mit allen 4 Clients?


Gruß Takato
 
Hallo Takato und herzlich willkommen bei den P3D-Faltern! :)

Zwei Dinge, die ich erst einmal zurückschrauben würde:

1. Benutze nur 2 Clients (evtl. sogar nur einen).
2. Lass "-advmethods" weg. Gerade durch diesen Parameter kannst du WUs bekommen, die von Haus aus nicht richtig laufen (Stichwort Beta).

Hast du evtl. auch jeweils die Option für große WUs aktiviert? Dann kann es (gerade bei vier gleichzeitig laufenden Clients) zu Resourcenproblemen kommen (selbst mit 1 GB RAM).

Wie gesagt, versuch's erst einmal auf kleinerer Flamme. Und wenn's dann nicht klappt, gib mal ein paar LOG-Daten preis, in denen die WU-Abbrüche dokumentiert sind.

Grüße, Gerby
 
ok ich werd es mal so probieren! Ich geb hier bescheid wenn es was neues gibt!
 
Also irgendwie will das noch nicht so richtig hab jetzt 2 Clients laufen und davon hat ein Client schon wieder ne WU abgebrochen. Hab alle Ratschläge befolgt aber will nicht so wirklich. Und zu warm wird der CPU auch nicht daran kann es nicht wirklich liegen hier mal das Log bzw. der Aussschnitt wo der abgebrochen hat.

[14:28:56] Project: 888 (Run 3, Clone 333, Gen 13)
[14:28:56]
[14:28:56] Assembly optimizations on if available.
[14:28:56] Entering M.D.
[14:29:16] (Starting from checkpoint)
[14:29:16] Protein: p888_p53peptide888
[14:29:16]
[14:29:16] Writing local files
[14:29:16] Completed 1473028 out of 5000000 steps (29)
[14:29:16] Extra SSE boost OK.
[14:44:16] Timered checkpoint triggered.
[14:45:56] Writing local files
[14:45:56] Completed 1500000 out of 5000000 steps (30)
[15:00:56] Timered checkpoint triggered.
[15:15:56] Timered checkpoint triggered.
[15:16:34] Writing local files
[15:16:34] Completed 1550000 out of 5000000 steps (31)
[15:20:15] Gromacs cannot continue further.
[15:20:15] Going to send back what have done.
[15:20:15] logfile size: 86102
[15:20:15] - Writing 86638 bytes of core data to disk...
[15:20:15] ... Done.
[15:20:15]
[15:20:15] Folding@home Core Shutdown: EARLY_UNIT_END
[15:20:18] CoreStatus = 72 (114)
[15:20:18] Sending work to server


[15:20:18] + Attempting to send results
[15:20:18] - Reading file work/wuresults_03.dat from core
[15:20:18] (Read 86638 bytes from disk)
[15:20:18] Connecting to
[15:21:12] Posted data.
[15:21:14] Initial: 0000; - Uploaded at ~1 kB/s
[15:21:14] - Averaged speed for that direction ~4 kB/s
[15:21:14] + Results successfully sent
[15:21:14] Thank you for your contribution to Folding@Home.
[15:21:18] Trying to send all finished work units
[15:21:18] + No unsent completed units remaining.
[15:21:18] - Preparing to get new work unit...
[15:21:18] + Attempting to get work packet
[15:21:18] - Will indicate memory of 1023 MB.
[15:21:18] - Connecting to assignment server
[15:21:18] Connecting to
[15:21:26] Posted data.
[15:21:26] Initial: 40AB; - Successful: assigned to (171.64.122.133).
[15:21:26] + News From Folding@Home: Welcome to Folding@Home
[15:21:26] Loaded queue successfully.
[15:21:26] Connecting to
[15:21:32] Posted data.
[15:21:32] Initial: 0000; - Receiving payload (expected size: 23455)
[15:21:39] - Downloaded at ~3 kB/s
[15:21:39] - Averaged speed for that direction ~77 kB/s
[15:21:39] + Received work.
[15:21:39] Trying to send all finished work units
[15:21:39] + No unsent completed units remaining.
[15:21:39] + Closed connections
[15:21:44]
[15:21:44] + Processing work unit
[15:21:44] Core required: FahCore_65.exe
[15:21:44] Core not found.
[15:21:44] - Core is not present or corrupted.
[15:21:44] - Attempting to download new core...
[15:21:44] + Downloading new core: FahCore_65.exe


Und dann würd ich ja eh gleich 4 Clients laufen lassen ich will ja effektiv für unser Team arbeiten. Also was kann ich ändern damit das richtig super läuft, weil irgendwie fühl ich mich nen wenig hilfos, weil der noch nicht rund läuft.


Gruß Takato
 
Also irgendwie will das noch nicht so richtig hab jetzt 2 Clients laufen und davon hat ein Client schon wieder ne WU abgebrochen. Hab alle Ratschläge befolgt aber will nicht so wirklich. Und zu warm wird der CPU auch nicht daran kann es nicht wirklich liegen hier mal das Log bzw. der Aussschnitt wo der abgebrochen hat.
Das könnte an den Speichertimings liegen. Stell die mal etwas konservativer ein.
Und dann würd ich ja eh gleich 4 Clients laufen lassen ich will ja effektiv für unser Team arbeiten.
Schön und gut, aber wenn Du nur 2 logische CPUs hast (Du hast doch sicher keinen DualCore mit HT, oder?), bringt das nichts.
Ein Client kann genau eine logische CPU nutzen. Deshalb lässt man pro logischer CPU einen Client laufen. Wenn Du bei 2 logischen CPUs 4 Clients laufen lässt, hat jede logische CPU 2 Clients zu bedienen. Ob nun 1 Client 100% Leistung bekommt oder 2 Clients 50%, kommt aber aufs selbe raus. Du gewinnst also nichts wenn Du 2 Clients auf 1 logische CPU loslässt. Im Gegenteil, durch den höheren Verwaltungsaufwand ist das sogar langsamer.
Und Hyperthreading ist ohnehin ein Spezialfall: HT suggeriert dem Betriebssystem 2 logische CPUs, kann aber leistungsmäßig grob geschätzt vielleicht "1,5 CPUs" liefern. Deshalb ist bei HT gar nicht mal gesagt, dass es sinnvoll ist pro logischer CPU 1 Client einzusetzen. Aber eines ist sicher: 2 Clients pro logischer CPU bremst nur.
 
Gut dann werd ich mal die Timings mal entschärfen obowhl der momentan nur auf Cas 2.5 Ras to Cas 3 Ras 3 TRas 7 und das bei 200Mhz und die Speichermodule sind Twinmos PC3200.

Und bei euch in den FAQ´s steht
" Update: (Thx @Rapier)
- Mit einem Client wird ca. 80% der Rechenleistung beansprucht, obwohl im Taskmanager nur 50% angezeigt wird.
- Den grössten Output auf einem HT-System lässt sich mit je 2 Clients für jeden (virtuellen) Prozessor erreichen, d.h. 4 Clients sollten gleichzeitig arbeiten um 100% CPU-Auslastung zu erreichen.
- Der Output mit 4 Clients liegt ca. 20-30% höher als mit nur einem Client. Eine WU dauert dann zwar ca. 3x länger als normal, aber dafür werden 4 gleichzeitig fertig. Somit erhält man besagte ca. 20-30% mehr Output."

Da les ich raus das 4 Clients für meinen Fall den besten Output geben und ich hab nen P4 ohne Dual Core aber mit HT.
 
Zuletzt bearbeitet:
Verdammt, daran, dass in den FAQ sowas steht, habe ich jetzt gar nicht mehr gedacht. Sorry. Ja, Rapier hatte das vor einiger Zeit mal ausgetestet. Ich kann es mangels entsprechender CPU nicht prüfen, bin aber (wie damals schon) eher skeptisch. Ich kann mir einfach nicht vorstellen, dass das schneller sein soll als 2 Clients.
Ich würde sagen, versuch erstmal 2 Clients stabil ans Laufen zu bekommen. Ob das mit den 4 Clients noch gilt, kann man dann ja mal austesten. Als der FAQ-Eintrag geschrieben wurde, gab es bspw. noch keine QMD-WUs. Da eine QMD ziemlich viel RAM benötigt, wird die Empfehlung, 4 Clients zu nutzen, wohl nicht mehr uneingeschränkt gelten.
 
Ja da kannste mal sehen ich hab die FAQ gelesen wie es sich gehört. Nun mal sehen ob der Rechner stabil mit 2 Clients läuft hab die Timings jetzt vom SPD des Speichers genommen also bis auf TRas von 7 auf 8 nix verändert aber so steht es im SPD. Und nun bin ich gespannt ob das was wird. Ich kann es nur hoffen.
Ja QMD benötigen extrem viel da sind 1 GB bei 4 Clients dann schnell weg. Aber erstmal teste ich 2 Clients und wenn die stabil laufen dann seh ich weiter.

Gruß Takato
 
Ja das mit den QMDs stimmt. Die brauchen Speicher satt, 1QMD benötig ca. 350MB an Speicher. Aber auch die Speicherbandbreite ist bei den QMDs nicht zu vernachlässigen. Auf meinen Dual-Xeons rechnen 2 QMDs lamgsamer als eine QMD und eine Gromec.
Denn besten Output erreichts du mit einer QMD und einer 600er GROM.

cad_fob
 
So trotzdem das zwei Clients laufen hat einer der beiden Clients schon wieder ne WU abgebrochen. CPU: 45°C Sys: 34°C PWM: 55°C Also alles im Rahmen des normalen auch das Timing des RAMs ist auf 2,5 ; 3 ; 3 ; 8
Hier das Log:

[16:16:26] Writing local files
[16:16:27] Completed 4150000 out of 5000000 steps (83)
[16:24:38] Quit 101 - Fatal error:
[16:24:38] Step 4165214, time 8330.43 (ps) LINCS WARNING
[16:24:38] relative constraint deviation after LINCS:
[16:24:38] max 0.000000 (between atoms 1 and 2) rms 1.#QNAN0
[16:24:38]
[16:24:38] Simulation instability has been encountered. The run has entered a
[16:24:38] state from which no further progress can be made.
[16:24:38] This may be the correct result of the simulation, however if you
[16:24:38] often see other project units terminating early like this
[16:24:38] too, you may wish to check the stability of your computer (issues
[16:24:38] such as high temperature, overclocking, etc.).
[16:24:38] Going to send back what have done.
[16:24:38] logfile size: 180260
[16:24:38] - Writing 180939 bytes of core data to disk...
[16:24:38] ... Done.
[16:24:38]
[16:24:38] Folding@home Core Shutdown: EARLY_UNIT_END
[16:24:43] CoreStatus = 72 (114)
[16:24:43] Sending work to server


[16:24:43] + Attempting to send results
[16:24:43] - Reading file work/wuresults_09.dat from core
[16:24:43] (Read 180939 bytes from disk)
[16:24:43] Connecting to
[16:24:59] Posted data.
[16:25:00] Initial: 0000; - Uploaded at ~10 kB/s
[16:25:00] - Averaged speed for that direction ~4 kB/s
[16:25:00] + Results successfully sent
[16:25:00] Thank you for your contribution to Folding@Home.
[16:25:04] Trying to send all finished work units
[16:25:04] + No unsent completed units remaining.
[16:25:04] - Preparing to get new work unit...
[16:25:04] + Attempting to get work packet
[16:25:04] - Will indicate memory of 1023 MB.
[16:25:04] - Connecting to assignment server
 
Hallo,

so wie es aussieht läuft deine Kiste nicht stabil, Du hast einfach ein bisschen zu viel Overclockt. Lass mal deinen P4 nur mit 2,8Ghz laufen und du wirst sehen das dann alles läuft.

cad_fob
 
So trotzdem das zwei Clients laufen hat einer der beiden Clients schon wieder ne WU abgebrochen.
Welchen Core verwendete die WU? Hast du meine obigen Tipps befolgt (kein "-advmethods" und auch keine großen WUs)? Lass evtl. mal die "üblichen" Speicher-Tests (Memtest86+ und Prime95) laufen (am besten jeweils über Nacht). F@H ist halt einer der härtesten OC-Tests (da können mitunter noch so viele andere Programme "stabil" laufen).

Grüße, Gerby
 
Jep hab alles befolgt und Prime lief einen Tag lang stabil aber ich glaub ich weis warum mein Rechner abstürzt da ich in den Systemereignissen geguckt hab und folgendes gefunden habe.
Bei DCOM ist der Fehler "Der angegebene Dienst kann nicht gestartet werden. Er ist deaktiviert oder nicht mit aktivierten Geräten verbunden. " aufgetreten, als der Dienst "StiSvc" mit den Argumenten "" gestartet wurde, um den folgenden Server zu verwenden:
{A1F4E726-8CF1-11D1-BF92-0060081ED811}
 
Zurück
Oben Unten