Absturz, sobald F@H das Rechnen anfängt

Peter1984

Grand Admiral Special
Mitglied seit
17.06.2002
Beiträge
4.904
Renomée
17
Standort
Mainfranken
Hi!

Also, hier der extra Thread... ;)

Habe mir F@H 5.03 runtergeladen, installiert, mit den Standardeinstellungen begonnen zu rechnen und was macht meine Kiste? Abstürzen... bzw. Einfrieren...

Konfig siehe Sig.
 
Inzwischen habe ich festgestellt, dass immer die FahCore_65.exe abstürzt, im abgesicherten Modus spuckt Windows die Fehlermeldung aus, dass die Anwendung abgestürzt sei. Bei meinem MItbewohner gehts einwandfrei... :(
 
FahCore_65.exe ist einer von *grübel* 3 Kernen des Projekts. Die Kerne erledigen die eigentliche Rechenarbeit während alles andere nur zur Nutzerinteraktion nötig ist.

Dein Rechner ist übertaktet. Hast Du ihn mal testweise mit Normaltakt laufen lassen? Wenn Du den Grafikclient nutzt, könnte es auch mit OpenGL zusammenhängen. Versuche ggf. mal die "No-nonsense" text-only console.

Und poste bitte auch mal folgende Abschnitte der client.cfg (zu finden im Installationsordner von F@H): [settings], [core] und [graphics]
Enthält die FAHlog.txt (oder die FAHlog-Prev.txt) irgendwelche auffälligen Einträge (bspw. Fehlermeldungen)?
 
Ich habe mal Trillian aus dem Autostart genommen, damit gehts. Mit dem Takt hatte es aber nichts zu tun. Was mich jedoch noch wundert ist, dass jedes Mal wenn das Molekül gedreht wird ein piep aus dem Buzzer im Rechner kommt...
 
Hast du deinen Recher schon mal mit Prime auf Stabilität getestet ?

Wenn das abstürzt stürzt bei mir auch FAH ab und umgekehrt und das passiert eigentlich nur, wenn ich meine CPU übertakte - sprich sie wird zu "heiss" oder ich gebe zu wenig Spannung.


Tirpiz, der wo lieber etwas undervoltet


Barton @ 2300MHz@1,575V für 2500MHz brauch ich schon 1,7 bis 1,725 und das ist mir eindeutig zuviel !
 
Wie gesagt, ohne Trillian gehts... CPU ist absolut Prime-stable, nicht um sonst passierts bei Standardtakt auch.
 
Ok, nachdem ich meiner Unwissenheit etwas auf die Sprünge geholfen habe (Trillian ist also ein Messenger *oink*), kann ich in dem Zusammenhang auch nicht viel sagen. Ich gehe mal nicht davon aus, dass das Proggi eine große CPU-Belastung hervorruft.

Der Core 65 (="Tinker") ist normalerweise etwas weniger empfindlich was OC angeht. In der Regel treten bei allen Cores aber eher Rechenfehler als Totalabstürze des Rechners auf. Da scheint eher ein Treiber-Problem zu bestehen.

Wie TiKu bereits schrieb: Probier einfach mal den Text-Client aus. Einfach die EXE-Datei vom Download in das Folding@Home-Verzeichnis kopieren und ausführen. ACHTUNG: Nicht gleichzeitig mit dem Grafik-Client laufen lassen! Manuell beenden kannst Du die Berechnung im Text-Client mit Strg-C.

Ansonsten: Der letzte Teil der Datei FAHlog.txt (vor einem Absturz) könnte hier auch etwas weiterhelfen.
 
Ich hab genau daselbe Problem.

Programm startet, und schmiert dann ab.
Ich wollte das Programm starten -> schmiert ab. Der Textclient hat sich seit einer Woche an Frame 177 festgebissen, hab ihn dann heute abgeschossen.
W2k SP4, Tuleron 1 GHz @ 1.4 (läuft aber stabil, ist noch nie einfach so abgeschmiert, auch unter tagelanger Vollast, es liegt also nicht an der Übertaktung!).



Eigentlich wollte ich es ja nur antesten, da ich bald was für die Schulrechner zum Rechnen brauch, das vollkommen selbstständig arbeitet. Daher würde mich interessieren, ob F@H folgende Punkte erfüllt:


+ zufriedenstellende Effizienz sowohl auf Tuleron 1.2 (P3-Kern) sowie A64 CPUs.

+ muss als Dienst auf jedem Rechner laufen, im Hinergrund, unter jedem Username, muss auch laufen, wenn keiner angemeldet ist. Darf nicht von einem Nicht-Admin abschaltbar sein (Normalsterbliche haben auch keinen Zugriff auf die Festplatte).

+ muss einmal auf ein Image installiert werden, und dann auf jedem damit geimageten PC laufen, von selbst! Es kann nicht sein, dass man dann bei jedem Clienten noch den Username eingeben muss.

+ es sollte nicht zuviel RAM verbrauchen, sagen wir max. 100 MB, notfalls bis 150, aber 200 ist schon deutlich zuviel (Für den Infounterricht muss man knapp 400 MB einkalkulieren).

+ Das Programm muss ausgereift sein, und möglichst 2 Jahre ohne oder mit vollautomatischen Updates laufen (die Updates müssen auch selbstständig durchgeführt werden, wenn kein Admin angemeldet sind. Am besten sind sie aber nicht nötig).

+ muss mindestens alle 35 Minuten auf einem 1200er Tuleron ein abgespeichertes Ergebniss liefern, sonst ists ja sinnlos (wegen Pausenwechsel, mit evtl. PC-herrunterfahren). (Kann man glaube ich bei F@H einstellen, daher no Problem, I think).

+ wenn ein Fehler auftritt, muss das Programm ihn selbstständig beheben, das heißt notfalls neue WU runterladen, weiterrechnen. Auf keinen Fall Logfile aktualisieren und dann auf Userbefehle warten.

cu Foveon
 
Original geschrieben von Foveon
Ich hab genau daselbe Problem.

Programm startet, und schmiert dann ab.
Ich wollte das Programm starten -> schmiert ab. Der Textclient hat sich seit einer Woche an Frame 177 festgebissen, hab ihn dann heute abgeschossen.
W2k SP4, Tuleron 1 GHz @ 1.4 (läuft aber stabil, ist noch nie einfach so abgeschmiert, auch unter tagelanger Vollast, es liegt also nicht an der Übertaktung!).
Ich würde trotzdem mal versuchsweise auf Normaltakt zurückstellen. F@H ist _SEHR_ empfindlich was Overclocking angeht.

Hab die Diskussion um die 40 Celerons mal ausgelagert.;)
-> http://www.planet3dnow.de/vbulletin/showthread.php3?s=&threadid=212724
 
Also ich hab seit ca. 10 Tagen auch laufend probleme mit den Tinker-Wu´s - meist sind es die 241er.

Die laufen ganz normal. Fahre ich aber meinen Rechner herunter und starte ihn neu, "stürzen" mir die Teile relgelmässig ab.

Entweder mit der Fehlermeldung Bad work unit oder mit der Meldung, dass er mit der Einheit von vorne beginnt.

Normal ist das jedenfalls nicht, da ich werder am Takt noch an den sonstigen Einstellungen etwas verändert habe. Lasse ich den Rechner durchlaufen gibt es keinerlei Probleme.

Hat jemand schon ähnliches beobachtet ?
 
hi rudi,

ich benutze ebenfalls antivir und als firewall zonealarm. Daran liegt es sicher nicht !

wie gesagt, es sind nur die Tinkers - vielleicht liegt es einfach nur an meiner persönlichen abneigung gegen dieses "drecksteile" *gggg* *noahnung*


Hier mal Ausschnitte aus so einer typischen Log-Datei:
.
.
.
Finished a frame (147)
Finished a frame (148}
Finished a frame (149)

Folding@Home Client Shutdown.
.
.
.

Hashes matched on file work/wudata_00.dyn
ARC file integrity verified
Restarting from checkpointed files.
Protein: p1131_L939_K12M_355K
Run: 391 (Clone 96, Gen 0)
Frames Completed: 149, Remaining: 251
Dynamic steps required: 3137500
Writing local files:
parameters work/wudata_00.prm
Writing "work/wudata_00.key": (overwrite) successful.
Writing "work/wudata_00.xyz": (overwrite) successful.
Writing "work/wudata_00.prm": (overwrite) successful.
Writing "work/wudata_00.key": (append) successful.
PROJECT="work/wudata_00", NSTEPS=3137500, DT=2.0000, DTDUMP=25.000000, TEMP=355.00
TINKER: Software Tools for Molecular Design
Version 3.8 October 2000
Copyright (c) Jay William Ponder 1990-2000
portions Copyright (c) Michael Shirts 2001
portions Copyright (c) Vijay S Pande 2001
Received faulty work unit.
logfile size: 274432
Writing 274944 bytes of core data to disk.
end (WriteWorkResults)
Folding@home Core Shutdown: BAD_WORK_UNIT
CoreStatus = 72 (114)
Sending work to server
.
.
.
 
versuch mal mit dem takt ein bißchen runter zu gehen (es wird ja wärmer)
wens nicht hilft las ma scandisk laufen und/oder prüf ma den speicher mit memtest(oder so).
könntest auch nur zum testen mal den work ordner und FahCore_65.exe löschen der core wird automatisch nachgeladen.
wen nichtsvon dem hilft *kopfkratz oder nicht mehr runterfahren *buck*
quellen:
löschen von core und work ordner
scandisk und memtest
 
Mir ist mein Rechner jetzt auch schon ein paar mal abgeschmiert, d.h. Bildschirm hat sich ausgeschaltet und das einzige was geholfen hat war ein Reset.
Wäre ja an sich nicht so schlimm, nur leider ist dabei schon mehrmals die log-Datei beschädigt worden und die Berechnung hat wieder von vorne angefangen. Am Übertakten der CPU kannst nicht liegen, das passiert auch mit Standardtakt. Oder kanns an zu scharfen Timings für den RAM liegen?
Hab ein paarmal gesehen, dass VPU-Recover meine übertaktete Radeon 9600Pro zurückgesetzt hat, nach ich den Grafikclient gestartet habe (und mein PC sich nicht aufgehängt hat). Ich werde mal auf die Console umsteigen und hoffen, dass es nur n Problem in Zusammenhang mit der Graka ist.
 
Ok, der Textclient läuft ganz gut, dachte ich zumindest, aber mein PC startet alle paar Stunden neu. Ich hab aber ka woran das liegt. CPU (XP-M 2600+) läuft auf 12 x 166Mhz mit 1,6V und mein RAM (Infineon PC2700) mit 333Mhz bei 6-3-3-2,5 und das sogar mit 2,8V. Jemand ne Idee was da los ist?
 
Weech schrieb:
Ok, der Textclient läuft ganz gut, dachte ich zumindest, aber mein PC startet alle paar Stunden neu. Ich hab aber ka woran das liegt. CPU (XP-M 2600+) läuft auf 12 x 166Mhz mit 1,6V und mein RAM (Infineon PC2700) mit 333Mhz bei 6-3-3-2,5 und das sogar mit 2,8V. Jemand ne Idee was da los ist?
Hi Weech!

Welches MB benutzt du? Von meinem Asus A7V880 weiß ich z.B., dass Infineon-Speicher nicht gut läuft (aus eigener Erfahrung und auch der von anderen). Hast du den (impliziten) Rat von Tiku bzgl. des Timings befolgt? Wie sieht's mit den obligatorischen Speichertests (Memtest86, Prime95) aus?

Es bietet sich an, dass du ein wenig in einem oder mehreren der P3D-Hardware-Foren stöberst bzw. in der MB-Datenbank nachsiehst. Da gibt's zu Hardware-Problemen einige Tipps! 8)

Gruß, Gerby19
 
Gerby19 schrieb:
Welches MB benutzt du? Von meinem Asus A7V880 weiß ich z.B., dass Infineon-Speicher nicht gut läuft (aus eigener Erfahrung und auch der von anderen).

Habe ein NF7 Rev 2.0. Habe und hatte damit bzgl. des Speichers noch keine nennenswerten Probleme.


Gerby19 schrieb:
Hast du den (impliziten) Rat von Tiku bzgl. des Timings befolgt?

Ja, habe ich. Als ich wegen zu schnellen Timings gefragt habe, lief mein RAM noch mit 11-2-2-2. Wie gesagt, jetzt hab ich die Timings auf 6-3-3-2,5 gestellt...


Gerby19 schrieb:
Wie sieht's mit den obligatorischen Speichertests (Memtest86, Prime95) aus?

Noch nicht ausprobiert, aber ich hab meinen Speicher auch schon mit 200Mhz und schärferen Timings betrieben, ohne das sich mein Computer ständig neugestartet hat. Aber das mal laufen zu lassen, kann ja nicht schaden....

Gerby19 schrieb:
Es bietet sich an, dass du ein wenig in einem oder mehreren der P3D-Hardware-Foren stöberst bzw. in der MB-Datenbank nachsiehst. Da gibt's zu Hardware-Problemen einige Tipps! 8)

Bevor ich mit dem Falten angefangen habe, hatte ich kein Hardware-Problem. ;)
 
Weech schrieb:
Bevor ich mit dem Falten angefangen habe, hatte ich kein Hardware-Problem. ;)
Tja, das hatten viele von uns nicht und haben einen entsprechenden Leidensweg hinter sich. *buck*
Es ist tatsächlich so, dass F@H die Hardware noch mehr herausfordert als so manch andere Alltagssoftware oder Games. Da sieht man wirklich, ob alles stabil läuft (und nicht nur "rock stable" oder "100%ig" *lol*).

Memtest86+ (läuft von Bootdiskette) findest du übrigens hier, Prime95 (Win-Software) dort, wobei ich dir die neuere Version empfehle (nicht leicht zu finden, deswegen dieser Direktlink).

Viel Erfolg weiterhin bei der Fehlersuche!
 
Wie sieht es eigentlich mit den temps aus?
Mein rechner startet zwar nicht neu sondern hängt sich einfach nur auf aber das könnte doch eventuel sein. *noahnung*
Achja bei nem epoxboad hatte ich sowas auch mal das lag an den elkos aufm mobo, abewr ich denke mal sowas kann man bei dir ausschließen.
 
Danke Gerby19 für die Links. Es lag wohl tatsächlich nur an den RAM-Timings. Bin nämlich inzwischen wieder hoch mit dem FSB und F@H läuft einwandfrei. Wie lange bzw. wie viele WUs muss ich denn crunchen, dass ich sagen kann mein System sei "F@H-stable"? ;)
 
Die Gromacs-WUs "quälen" die CPU am ehesten, da diese die SSE-Einheit verwenden und dadurch die CPU noch etwas mehr aufheizen (bei mir ca. 2 °C mehr als bei Tinker-WUs). Wenn du auch noch die 5-MB-WU-Option aktiviert hast, wird auch noch 'ne Menge Arbeitsspeicher gebraucht.

Aber Achtung: Eine abgebrochene WU muss nicht gleich einen Fehler in der Hardware bedeuten. Für manche WUs gibt es halt rein rechnerisch eine Sackgasse. Leider lässt sich das nicht ohne weiteres unterscheiden. Bei mehreren abgebrochenen WUs in kurzen Abständen (also alle paar WUs) ist es dann schon eher die Hardware.
 
Das war ne Gromacs-WU, an der ich mein übertaktetes System getestet hab. Wie gesagt keine Probleme und hab auch jetzt schon wieder Gromacs-WU zu 40% berechnet, ohne Fehler etc.

Was ist die "5-MB-WU-Option"? Kenn mich noch nicht so wirklich aus mit F@H. Bin erst seit ein paar Tagen dabei, vorher hatte ich BOINC bei mir laufen. :)
 
Damit hast du die Chance auch die "Dicken Dinger", die 600 Punkte abwerfen zu bekommen.

Allerdings ist die nur empfehlenswert ab 512 MB Ram.

Alle Klarheiten beseitigt ? ;D


Greets

Tirpiz
 
Zurück
Oben Unten