PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : [Docking] defekte WUs


Kater Sylvester
30.01.2011, 22:57
Zur Zeit sind wieder defekte WUs bei Docking im Umlauf.
Die Fortschrittsanzeige bleibt bei 0 % stehen und die WUs werden "endlos" berechnet.
Bei mir waren es inzwischen ca 40 WUs die Spitzenreiter liefen seit über 12 Stunden.

Die WUs von Hand abbrechen.

ICEMAN
31.01.2011, 07:03
Kann einer sagen welche WU Serie das ist?
Bei mir sind das die hier: 1hvi1hbv_mod0014crossdockinghiv1_11026_75861_0 using charmm34 version 623

Kater Sylvester
31.01.2011, 10:40
Es scheint tatsächlich eine Serie zu sein. Hier ein paar Beispiele:
1hvk1hbv_mod0014crossdockinghiv1_20587_408149_0
1hvk1hbv_mod0014crossdockinghiv1_20572_314483
1hvk1hbv_mod0014crossdockinghiv1_20571_354654
1hvk1hbv_mod0014crossdockinghiv1_20456_316907
1hvk1hbv_mod0014crossdockinghiv1_20455_84806
1hvk1hbv_mod0014crossdockinghiv1_20454_1968
1hvk1hbv_mod0014crossdockinghiv1_20453_469280
1hvk1hbv_mod0014crossdockinghiv1_20381_365342

Alle mit Applikation Charmm 34a2 berechnet.

[MTB]JackTheRipper
31.01.2011, 12:16
Hmm, vll sind die garnicht defekt?

Hab hier eine mit 1% nach 67h! Werd sie aber jetzt abbrechen.

jcworks
31.01.2011, 14:08
Die maximale Zeit einer großen WU sollte bei ca. 3 GHz die 3h-Marke nicht wesentlich übersteigen!

Alles, das nach einer Minute noch immer bei 0% liegt, ist defekt!

Kater Sylvester
31.01.2011, 17:58
Ich hatte inzwischen auch WUs, die bei 1 % hängenblieben.
Bei gößeren WUs kann es schon mal 2 Min. dauern, bis der Fortschritt (%) angezeigt wird.
Da ich für 3 Tage in die Niederlande muss, habe ich die meisten Rechner abgeschaltet.
Ich habe keine Lust "Nullnummern" zu rechnen.
Donnerstag abend geht es aber weiter.

skneo
01.02.2011, 02:08
Sauber nach WE auf stats Page geschaut last hm 24h Output 400 Credits WTF, auf die Rechner geschaut jeder aber jeder hatte WUs zwischen 65h und 120h NARV

ICEMAN
01.02.2011, 13:36
Willkommen im Club!
.
EDIT :
.
Wenn ich net alle Stunde den Boinc Manager anschauen würde dann.... Ich bekomme immer noch Defekt WUs.

ICEMAN
02.02.2011, 11:53
Inzwischen ist es jede 2te WU bei mir. Super Ingo!

skneo
03.02.2011, 12:38
bei mir auch kompl dock auf no work gesetzt

heavy-Ions@boinc
03.02.2011, 12:52
Die betreiber sollten langsam mal ihren arsch hochkriegen. diese WUs legen alles lahm
http://boincstats.com/charts/chart_uk_docking_project_new_credits.gif

ICEMAN
03.02.2011, 12:55
Die wissen schon Bescheid und sind auf der Suche nach dem Grund.
http://docking.cis.udel.edu/community/forum/thread.php?id=460

heavy-Ions@boinc
03.02.2011, 12:59
Scheinbar ja noch nicht, die wurden zwar PMed aber bisher hat sich noch keiner der projektverantwortlichen gemeldet.

ICEMAN
03.02.2011, 13:02
Dieser Trilce Estrada ist doch von denen einer oder nicht?

heavy-Ions@boinc
03.02.2011, 13:05
Ja, die haben sie angemailt, hat sich aber noch nicht gemeldet

No response yet from the PM sent to Trilce Estrada

Kater Sylvester
03.02.2011, 20:02
Das nerved.

Nun war ich 3 Tage nicht zu Hause. Die 5 Rechner, die noch durchliefen hatten alle 1...3 WUs, die nun schon 62 Stunden auf dem Buckel hatten.
Ich kann nicht jede Stunde nach den WUs schauen...

ICEMAN
03.02.2011, 20:06
Mir geht es ähnlich. Mein 2ter Rechner ist nicht gerade bei mir um die Ecke. Und der Rechnet wahrscheinlich wieder an einer WU bei der nichts passiert.

[MTB]JackTheRipper
03.02.2011, 20:08
Muss halt Docking mal pausiert werden... Hatte auch keine Lust die WUs zu sortieren, und das bei läppischen drei Systemen *g*

Kater Sylvester
03.02.2011, 20:23
Ich hatte angenommen, das es an einer defekten WU Serie liegt. Wenn es aber wie heavy-Ions@boinc schreibt, ein Server Problem sein sollte, das noch nicht abgestellt ist, kann es ja noch etwas dauern.
Na gut, dan halt mal wieder SIMAP.

ICEMAN
03.02.2011, 20:25
Ich versteh nur nicht, das Docking das nicht in den Griff bekommt und einfach mal die Server abschaltet, solange bis die Fehler behoben wurden.

heavy-Ions@boinc
04.02.2011, 10:01
Eigentlich ist docking (für mich zumindest) ein sehr interessantes projekt und "förderungswürdig". nur leider sind die betreiber etwas faul. das betrifft die allgemeine kommunikation mit den usern als auch die realtionsgeschwindigkeit wenns mal klempt.

ICEMAN
04.02.2011, 11:58
So seh ich das auch.

Kater Sylvester
04.02.2011, 12:47
Ja, da könnten die sich mal ein Beispiel an Michael Weber von RNA nehmen.
Aber bitte nur die positiven ;D (Kommunikation) nicht die negativen :( (Checkpoints fehlen).

jcworks
04.02.2011, 13:43
Ja, da könnten die sich mal ein Beispiel an Michael Weber von RNA nehmen.
Aber bitte nur die positiven ;D (Kommunikation) nicht die negativen :( (Checkpoints fehlen).

weiteres Beispiel für hervorragende Reaktion: Simap

bisher wurde meist innerhalb von 1 Stunde reagiert.. (außer es war mal mitten in der Nacht ;) )

Ärgerlich ist halt, daß man bei Docking - im Falle von Problemen - nicht mal anhand von Statusmeldungen eine Reaktion erkennen kann oder nicht.. so nach dem Motto: ich steck erstmal den Kopf in den Sand und hoffe, daß sich alles irgendwie auflöst..

*noahnung*

erde-m
04.02.2011, 14:42
Ist das Problem nun schon behoben *noahnung*.

Unser Output steigt ja wieder, können aber auch nur gerade wieder mal ein paar funktionierende WUs sein. Ich habe aber keine Lust die Rechner ständig zu überwachen - dafür bleibt mir atm keine Zeit.

ICEMAN
04.02.2011, 15:34
Bis jetzt habe ich keine Defekten WUs mehr gehabt.

Mr. Ice
04.02.2011, 22:27
Toll, und dass im Urlaub...
Hab erstmal alles auf SIMAP geswitched da ich nur kurz zu Hause bin und dann noch mal eine Woche weg...

Gruß,
Mr. Ice

erde-m
05.02.2011, 08:20
Bis jetzt habe ich keine Defekten WUs mehr gehabt.
Stimmt! Jetzt gibt es gar keine mehr - Server-Error *buck*

ICEMAN
05.02.2011, 08:25
Ich bekomme die Meldung: Server error: can't attach shared memory

heavy-Ions@boinc
05.02.2011, 11:21
zumindest leben die Projektbetreiber noch
Hi All,
we have a disk issue. We stopped the generation of new jobs and are looking at the issue.
Sorry for the problem and thank you for the notes!
Michela

ICEMAN
05.02.2011, 23:31
Es geht aufwärts. Es gibt wieder WUs, ob die aber i.O. sind, kann ich noch nicht sagen.

Kater Sylvester
06.02.2011, 01:20
Na dann hoffen wir doch mal, dass es wieder läuft.
Merkwürdig finde ich, dass sich der Fehler genauso äußert, wie das Docking Problem mit einigen Intel Prozessoren und Win 7.

MLMapster
11.02.2011, 13:24
Hallo zusammen,

ich habe derzeit eine Charmm 34a2 6.23 - 1hvl1hbv_mod0014crossdockinghiv1_75723_56247
und die ist nach ca 48min bei 13,375%.

Mal sehen, ob die nicht doch noch Probleme macht, sonst könnte man vll meinen, dass es wieder läuft.
Woanders habe ich aber noch nciht geschaut, ob es allgemein eine Entwarnung gibt.

ICEMAN
11.02.2011, 13:27
Also ich rechne die Woche über schon wieder fleißig und es gab keine Probleme!

erde-m
17.02.2011, 17:04
Ich hatte heute schon wieder einen ganzen Sack voll WUs mit Berechnungsfehler. Wie sieht es bei Euch aus?

ICEMAN
17.02.2011, 17:10
2 Stück heute.

heavy-Ions@boinc
17.02.2011, 19:28
Muss nachschauen wenn ich wieder am richtigen PC sitze
.
EDIT :
.
noch hab ich keine faulen WUs. das problem ist seitens der betreiber diesmal schnell angegangen worden

One of the ligands, ligand 1hih, really did not want to dock into the other protein conformations than the one in which it was observed experimentally. So in the cross-docking simulation, no matter what protein conformation we were using, the simulation was very short and inconclusive, besides crating D@H problems. We removed the whole batch of simulations with this ligand and will work with our scientists to understand the scientific reason for this problem. We are distributing a new batch of jobs with another ligand and this time it seem to work OK.

Protein-ligand docking is definitely not a deterministic thing!

Thanks for the alert!

Mr. Ice
18.02.2011, 07:41
Ich hab auch grad gesehen das ich 2 WUs mit Berechnungsfehler erwischt hab...
Dafür, dass das Projekt bisher eigentlich sehr pflegeleicht war macht es momentan ganz schön viele Probleme... deshalb werde ich vorerst hauptsächlich bei SIMAP bleiben

Gruß,
Mr. Ice

Kater Sylvester
18.02.2011, 19:59
Sodele. Ich bin wieder zu Hause. Ein Rechner hat sich 51 Stunden mit einer defekten Docking WU vergnügt. :(
Auf den zwei durchlaufenden Rechner waren 5 defekte WUs.

ICEMAN
19.02.2011, 08:21
Super Ingo. Inzwischen habe ich 23 Defekte WU abgegeben, an einem PC an dem ich am Wochenende nicht ran komme.

Mr. Ice
19.02.2011, 12:32
und zu allem kommt nun auch wieder das "Low Credit Problem" (http://docking.cis.udel.edu/community/results.php?hostid=78746) dazu... 34 Credits für ca. 4 Stunden Rechenzeit, normalerweise sind es 140 Credits...

ICEMAN
19.02.2011, 13:38
Jup geht mir leider auch so! Ich will da die Million voll machen und dann mir ein neues Lieblingsprojekt aussuchen.

Mr. Ice
07.03.2011, 12:49
Wie ist der Stand? Läuft das Projekt wieder stabil?

ICEMAN
07.03.2011, 14:30
Ja keine Probleme mehr und das schon mehrere Wochen.

Mr. Ice
08.03.2011, 11:21
Danke für deine Antwort... werde demnächst auch mal wieder ein System auf Docking switchen

Mr. Ice
18.03.2011, 20:03
Das "Low-Credit" Problem besteht weiterhin... :( aber solange es nicht überhand nimmt störts mich nicht...

Kater Sylvester
09.04.2011, 16:10
Ich habe z.Z. wieder auf vielen Rechnern Abbrüche bei Docking wegen Rechenfehlern.
ich glaube aber ehrlich gesagt nicht, dass es an den Rechnern liegt. Die laufen schon seit Tagen ohne Probleme.
.
EDIT :
.
Innerhalb einer halben Stunde schon wieder 3 Abbrüche auf unterschiedlichen Rechnern.

MrBad
09.04.2011, 20:42
Bei mir laufen bisher alle sauber durch. *noahnung*

Mr. Ice
10.04.2011, 11:23
Ich hab in den letzten beiden Tagen 4 Abbrüche auf einem Rechner, glücklicherweise bereits nach weniger als 10min so dass nicht wieder jede Menge Rechenzeit verloren ging.

Kater Sylvester
10.04.2011, 17:05
Bei mir läuft es jetzt wieder rund.

Kater Sylvester
12.04.2011, 22:00
Jetzt gehts schon wieder los.
Aktuell 9 wegen Berechnungsfehler abgebrochene WUs auf 7 verschiedenen Rechnern.
Und zu warm war es bei uns heute bestimmt nicht.

MrBad
12.04.2011, 22:36
Argh!! Ich hab eben nachgesehen und auch ein paar defekte dabei...hoffentlich nur ein paar Einzelfälle.... )((

Mr. Ice
13.04.2011, 11:06
Ich hab allein auf einem System 12 Fehler ... und die Summe der verschwendeten Zeit ist dabei auch schon wieder beachtlich

Kater Sylvester
13.04.2011, 11:37
Danke für die Infos. Ich dachte schon, nur ich hätte dieses Problem.
Ich habe heute Morgen auch wieder 12 abgebrochene WUs entsorgt. Rechenzeit unterschiedlich von 8 Min...45 Min.

Mr. Ice
13.04.2011, 11:42
Habs auch mal im Docking Forum (http://docking.cis.udel.edu/community/forum/thread.php?id=579) erwähnt.



Copyright © 1999 - 2011 Planet 3DNow!
Rechtliche Hinweise