PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : WU-Abbrüche



TAL9000
06.05.2008, 19:07
Habe Probleme mit System 18 (http://www.planet3dnow.de/vbulletin/showpost.php?p=3192266&postcount=19) des Clusters

WU Abbrüche bei Einstein (3 von 5 WUs):
http://einstein.phys.uwm.edu/result.php?resultid=96755170
http://einstein.phys.uwm.edu/result.php?resultid=96714987
http://einstein.phys.uwm.edu/result.php?resultid=96667600

2 WUs sauber durchgerechnet, System QMC relativ stabil im ganzen letzten Monat (6 Abbrüche von über 60 WUs)*kopfkratz

*noahnung*

Irgendwelche Ideen

TAL9000

erde-m
06.05.2008, 20:04
Habe Probleme mit System 18 (http://www.planet3dnow.de/vbulletin/showpost.php?p=3192266&postcount=19) des Clusters

WU Abbrüche bei Einstein (3 von 5 WUs):
http://einstein.phys.uwm.edu/result.php?resultid=96755170
http://einstein.phys.uwm.edu/result.php?resultid=96714987
http://einstein.phys.uwm.edu/result.php?resultid=96667600

2 WUs sauber durchgerechnet, System QMC relativ stabil im ganzen letzten Monat (6 Abbrüche von über 60 WUs)*kopfkratz

*noahnung*

Irgendwelche Ideen

TAL9000
Bei meinen stockstabilen Homeserver hat es auch 2 WU´s zerrissen. Die letzte ist aber auch schon auf einem anderen Rechner mit Fehler abgebrochen worden.

http://einstein.phys.uwm.edu/workunit.php?wuid=38034376
http://einstein.phys.uwm.edu/workunit.php?wuid=38854232

Ev. defekte WU´s ???

Bikeman
06.05.2008, 20:29
Bei meinen stockstabilen Homeserver hat es auch 2 WU´s zerrissen. Die letzte ist aber auch schon auf einem anderen Rechner mit Fehler abgebrochen worden.

http://einstein.phys.uwm.edu/workunit.php?wuid=38034376
http://einstein.phys.uwm.edu/workunit.php?wuid=38854232

Ev. defekte WU´s ???

Hmmm. eher nicht, das andere war ein Download Fehler. Übertaktet?

CU
Bikeman
.
EDIT :
.

System QMC relativ stabil im ganzen letzten Monat (6 Abbrüche von über 60 WUs)*kopfkratz

*noahnung*

Irgendwelche Ideen

TAL9000

6 Abbrüche von 60 = 10% Abbruchrate...das nenne ich aber relativ instabil. Die E@H App ist schon sehr anspruchsvoll für die Hardware (Speicher und Fließkommaeinheit).

CU
Bikeman

erde-m
06.05.2008, 20:31
Ja schon, aber sind nur 2 WU´s vom 3. Mai ca. 18:30 Uhr sent - sonst war bisher nichts - vorher nicht und seit dem auch nichts. Eventuell fehlerhafte Übermittlung - oder werden die WU´s noch mal vom Boinc über Quersumme gecheckt?

Primestable über zig Stunden und bei den anderen Projekten auch keine Errors.

Steht unter Beobachtung - wird ja wieder wärmer, eventuell doch zu nahe an der Grenze*noahnung*

Bikeman
06.05.2008, 20:51
Ja schon, aber sind nur 2 WU´s vom 3. Mai ca. 18:30 Uhr sent - sonst war bisher nichts - vorher nicht und seit dem auch nichts. Eventuell fehlerhafte Übermittlung - oder werden die WU´s noch mal vom Boinc über Quersumme gecheckt?

Primestable über zig Stunden und bei den anderen Projekten auch keine Errors.

Steht unter Beobachtung - wird ja wieder wärmer, eventuell doch zu nahe an der Grenze*noahnung*

Ja, neuere BOINC Versionen erlauben die Überprüfung der Dateien mittels Checksumme, und E@H nutzt dieses feature.

CU
Bikeman

TAL9000
06.05.2008, 21:04
6 Abbrüche von 60 = 10% Abbruchrate...das nenne ich aber relativ instabil. Die E@H App ist schon sehr anspruchsvoll für die Hardware (Speicher und Fließkommaeinheit).

CU
Bikeman

Das System wollte ich als nächstes Ersetzen. Es lief mal mit 2150MHZ QMC Stabil und jetzt bin ich bei 2050MHz, scheinbar stirbt es langsam...
Naja gehe ich halt wieder 50Mhz runter.
Die von den defekten 6 WUs wurden nur 2 bisher fehlerfrei von anderen Hosts gerechnet. 3 WUs hatten auch bei andren Probleme, deswegen habe ich sie als Ausreißer gesehen und nicht weiter beachtet.
Bisher war Einstein nicht so "anspruchsvoll" bei OC oder liegt das an der 4.36 App?

TAL9000

erde-m
06.05.2008, 21:08
Ja, neuere BOINC Versionen erlauben die Überprüfung der Dateien mittels Checksumme, und E@H nutzt dieses feature.

CU
Bikeman
Wenn jetzt das Rce nicht vor der Tür stände, würde ich mal paar QMC-WU´s drauf los lassen. Na ja - werde es beobachten und mal sehen, ob es eine Eintagsfliege war.

Bikeman
06.05.2008, 21:22
Bisher war Einstein nicht so "anspruchsvoll" bei OC oder liegt das an der 4.36 App?

TAL9000

Ja, die 4.36 dürfte die CPU und das Speicherinterface stärker "stressen" als die Vorgängerversionen, da einige Teile des C-Codes durch handoptimierten Assembler-Code ersetzt wurden. Im direkten Vergleich sollte man das sogar anhand der CPU temp. sehen können (bei ungeregelten Lüftern, versteht sich).

CU
Bikeman

jcworks
07.05.2008, 21:47
Leider hab auch ich mit meinem (natürlich schnellsten) Rechner so Probleme..

Irgendwie bleibt die Berechnung auf einmal wie eingefroren.. Hab mir schon einige WUs damit versaut.. *noahnung* Mein kleiner Turion dagegen arbeitet mit der 4.36 ohne Probleme..

Pipo
09.05.2008, 01:37
Bei 3,2 GHz steigt der Brisbanekern bei mir auch aus. Kann man wohl nichts machen. *noahnung* Dann sind es eben ein paar hundert MHz weniger.

Fränki´s Welle
10.05.2008, 09:34
Habe meinen guten alten XP 2800+ auch noch mal runtertackten müssen. Die Abbrüche liegen dann doch wahrscheinlich am Übertackten des PC.