Milkyway@Home Server down ?!?

Crashtest

Redaktion
☆☆☆☆☆☆
Mitglied seit
11.11.2008
Beiträge
9.274
Renomée
1.406
Standort
Leipzig
  • Docking@Home
  • BOINC Pentathlon 2011
  • BOINC Pentathlon 2012
  • BOINC Pentathlon 2013
  • BOINC Pentathlon 2014
  • BOINC Pentathlon 2015
  • BOINC Pentathlon 2016
  • BOINC Pentathlon 2017
  • BOINC Pentathlon 2018
  • BOINC Pentathlon 2019
  • BOINC Pentathlon 2020
  • THOR Challenge 2020
  • BOINC Pentathlon 2021
  • BOINC Pentathlon 2022
  • BOINC Pentathlon 2023
es scheint als sei der Milkyway@Home Server down:
- Scheduler schlägt fehl
- Upload schlägt fehl
- Webseite nicht aufrufbar

seit 13:35



13:58 - geht wieder
 
Zuletzt bearbeitet:
Seit Do-Nachmittach (05.02.2009) down !

diesmal richtig böse; server nicht erreichbar weder über boinc noch http oder ping
 
Seit Do-Nachmittach (05.02.2009) down !

diesmal richtig böse; server nicht erreichbar weder über boinc noch http oder ping
Eigentlich sind nur der Web- und BOINC-Server down. Anpingen geht .
ping milkyway.cs.rpi.edu

Ping milkyway.cs.rpi.edu [128.213.28.20] mit 32 Bytes Daten:

Antwort von 128.213.28.20: Bytes=32 Zeit=117ms TTL=50
Antwort von 128.213.28.20: Bytes=32 Zeit=117ms TTL=50
Antwort von 128.213.28.20: Bytes=32 Zeit=117ms TTL=50
Antwort von 128.213.28.20: Bytes=32 Zeit=117ms TTL=50

Ping-Statistik für 128.213.28.20:
Pakete: Gesendet = 4, Empfangen = 4, Verloren = 0 (0% Verlust),
Ca. Zeitangaben in Millisek.:
Minimum = 117ms, Maximum = 117ms, Mittelwert = 117ms
 
ich hatt heute früh :

C:\Dokumente und Einstellungen\KressR\Desktop>ping 128.213.28.20

Ping wird ausgeführt für 128.213.28.20 mit 32 Bytes Daten:

Zeitüberschreitung der Anforderung.
Zeitüberschreitung der Anforderung.
Zeitüberschreitung der Anforderung.
Zeitüberschreitung der Anforderung.

Ping-Statistik für 128.213.28.20:
Pakete: Gesendet = 4, Empfangen = 0, Verloren = 4 (100% Verlust),

C:\Dokumente und Einstellungen\KressR\Desktop>
 
ich hatt heute früh :
[..]
Ping wird ausgeführt für 128.213.28.20 mit 32 Bytes Daten:

Zeitüberschreitung der Anforderung.
Zeitüberschreitung der Anforderung.
Zeitüberschreitung der Anforderung.
Zeitüberschreitung der Anforderung.

Ping-Statistik für 128.213.28.20:
Pakete: Gesendet = 4, Empfangen = 0, Verloren = 4 (100% Verlust)
Na dann ist ja schon mal ein Fortschritt erkennbar *suspect* *lol*
 
der Milkyway Server ist momentan:

- mal wieder ein wenig lauffähig
- langsamer als vor dem Crash
- durchgeknallt bei Credit-Vergabe zB
http://milkyway.cs.rpi.edu/milkyway/result.php?resultid=40431 - 724s = 3,47 Credits
http://milkyway.cs.rpi.edu/milkyway/result.php?resultid=22392 - 724s = 21,7 Credits
muss ich sowas verstehen ?
- ellen-langes Pending; hatte vor dem Crash mal eine Unit im Pending - nu fast alle
......

Ergo : die Projektbetreiber müssen da noch einiges verbessern

ps :
Message from server: Server error: can't attach shared memory
und ich kann momentan kein neuen Computer dem Projekt hinzufügen weil : "Cant access database"
 
- durchgeknallt bei Credit-Vergabe zB
http://milkyway.cs.rpi.edu/milkyway/result.php?resultid=40431 - 724s = 3,47 Credits
http://milkyway.cs.rpi.edu/milkyway/result.php?resultid=22392 - 724s = 21,7 Credits
muss ich sowas verstehen ?
Ja, da geht gerade einiges durcheinander.
Der erste Creditwert entspricht übrigens genau dem Wert, den man erhält wenn die Anzahl der Flops zur Berechnung der single stream WUs mit dem Creditmultiplier von SETI multipliziert wird (~1,25 TFlop * 2,77 credits/TFlop). Allerdings sind das ja bei SETI single precision Berechnungen, sollte bei MW also vielleicht schon etwas höher sein.

Aber das zeigt zumindest, daß Travis wirklich ernsthaft über sowas nachdenkt. Wäre auf jeden Fall besser, als die momentane Situation mit dem Creditlimit. Die GPU-App würde auch mit nur 3,5 credits/WU schon ordentlich was abwerfen. Für CPUs wäre das allerdings fast schon etwas mager. Außerdem setzt das voraus, daß auch die Stock-App ein wenig schneller wird. Eigentlich wollte Travis an den Credits erst was machen, wenn das geschehen ist. Aber momentan geht wohl alles drunter und drüber *noahnung*
 
und Teile des Projekts sind mal wieder down...

seit 4 Tagen geht MW nicht mehr richtig .... schon tech. schlecht für ein Projekt

Credits : da es DB is wäre evtl. 2x Credit (~1,25 TFlop * 5,54 credits/TFlop) ok oder ?
und rd 5-7 Cr/Wu auch bei Grakas wäre doch echt ein "Hammer" (sofern's Projekt mal wieder läuft und auch ausreichend Wu's produziert)

Server: eine physikalische Trennung der einzelnen Teile (data-driven web pages, upload/download server, scheduler, feeder, transitioner, db_purge und milkyway_av) auf 2 Server ist immernoch zu empfehlen
 
Credits : da es DB is wäre evtl. 2x Credit (~1,25 TFlop * 5,54 credits/TFlop) ok oder ?
und rd 5-7 Cr/Wu auch bei Grakas wäre doch echt ein "Hammer" (sofern's Projekt mal wieder läuft und auch ausreichend Wu's produziert)
Das habe ich Travis auch so gesagt ;)
Würde mit den optimierten Apps auf CPUs immer noch sehr gute Credits geben und auf den 4800ern von ATIs richtig viel :D
 
ich erhalte momentan mal wieder etwas mehr Credits ... ;

aber wenns so weiter geht ist der Server in 20min wieder leer ....

Graka: ich hoffe mal, dass ATI bald ne neue CAL-Version mit DB für die 46xxer freigibt

Gipsel : kurze Frage auch wenn du wie auch ich unter 0-Zeit leidest: Schon mal ein Blick auf OpenCL 1.0 (http://www.khronos.org/registry/cl/) geworfen ?
 
MW ist mal wieder down ....


feeder milkyway Not Running
db_purge milkyway Not Running
milkyway_av milkyway Not Running

Nachtrag 21:50
feeder milkyway Not Running
transitioner milkyway Not Running
db_purge milkyway Not Running
milkyway_av milkyway Not Running

es wird immer schlimmer, aber es gibt neue WUs ?!?

Nachtrag 22:10
es geht mal wieder ... (vorerst ?)
 
Zuletzt bearbeitet:
seit einigen Tag "spinnt" der MW-Server - er geht öfters mal einige Zeit (zw. 10min und 4h) down - aber es gibt keine Info von Travis ....

pingen der IP (128.213.28.20) geht auch nich ...
 
Vielleicht versucht Travis ein paar Änderungen vorzunehmen. Die Serverprobleme traten erst nach der letzten Meldung von Travis auf, also seit 2-3 Tagen. Davor lief der Server eigentlich problemlos.
 
"Gute Projekte" informieren die Nutzer wenn ne Downtime geplant ist;

aber MW hatte in den letzten Tagen (nicht erst seit 2-3) öfters mal downtimes
 
MW seit 16h down - aber keine Info von T.
 
So, MW is wieder down :-(

seit 11:42 gibts Fehlermeldungen wegen "peer"

nach 3,5h gehts nu wieder
 
Zuletzt bearbeitet:
Zurück
Oben Unten