Endmonster erlegt...

Alles zum Projekt RNA World
Nachricht
Autor
Die AliBaBa's
Taschenrechner
Taschenrechner
Beiträge: 9
Registriert: 18.03.2011 16:35

Re: Endmonster erlegt...

#73 Ungelesener Beitrag von Die AliBaBa's » 08.04.2011 21:09

Michael H.W. Weber hat geschrieben:
yoyo hat geschrieben:Dann solltest Du mal ein Projekt aktualisieren machen, dann werden sie abgebrochen.
Auch bei mir auf Rechner ID 169 ist das leider nicht der Fall. Zwei der dort laufenden drei Introns wurden in der Tat abgebrochen (Credits wurden anscheinend keine dafür vergeben, zumindest sehe ich keinen rapide ansteigenden Creditsbalken im lokalen Client, wie bei über 800 Std. Laufzeit pro WU erwartet) und eine läuft unbeirrt weiter. Auch nach mehrfachem Projektaktualisieren. Was ist zu tun, was funktioniert da nicht? Worüber ich mir insbesondere Gedanken mache ist: Wieso bekommt der Server nicht mit, dass da noch etwas läuft? Ist das ein generelleres Problem?

Michael.
Tja stimmt, das mit den Credits ...

da scheint wohl noch ein Bug versteckt zu sein, was aber dem Chef des Projektes nix ausmacht :wink:
wenn man deine WUs mal genauer betrachtet:
http://www.rnaworld.de/rnaworld/workuni ... id=4496257 geht in Ordnung da nur kurze Zeit gecruncht ...
http://www.rnaworld.de/rnaworld/workuni ... id=4496682 würde ich jetzt bemängeln, da ja doch etwas länger gecruncht wurde:
Task ID 11292934
Run time 2,477,202.97
CPU time 282,132.44
Granted credit: 3,616.00
das war doch auch schon mal anderherum seltsam ... Run Time = 0 ???

Die netten AliBaBa's :wave:
PS: hoffentlich geht es auch anderen Crunchern nicht so ...

Benutzeravatar
Norman
Vereinsmitglied
Vereinsmitglied
Beiträge: 2188
Registriert: 20.03.2003 14:34
Wohnort: Saarland
Kontaktdaten:

Re: Endmonster erlegt...

#74 Ungelesener Beitrag von Norman » 08.04.2011 21:15

es geht ja nicht nach der run time sondern nach der cpu time ;)

Die AliBaBa's
Taschenrechner
Taschenrechner
Beiträge: 9
Registriert: 18.03.2011 16:35

Re: Endmonster erlegt...

#75 Ungelesener Beitrag von Die AliBaBa's » 08.04.2011 21:21

Norman hat geschrieben:es geht ja nicht nach der run time sondern nach der cpu time ;)
Gut zu wissen,
Danke für die Information.
Bin mal Neugierig: warum ist denn da so ein exorbitanter Unterschied in diesem Fall?

Die netten AliBaBa's :wave:

Benutzeravatar
Norman
Vereinsmitglied
Vereinsmitglied
Beiträge: 2188
Registriert: 20.03.2003 14:34
Wohnort: Saarland
Kontaktdaten:

Re: Endmonster erlegt...

#76 Ungelesener Beitrag von Norman » 08.04.2011 22:07

naja, nehmen wir mal an dieser rechner ist oft beschäftigt mit irgendwelchen anderen sachen die ziemlich cpu-lastig sind.
boincanwendungen laufen i.d.r. mit niedrigster priorität und bekommen den rest der frei/übrig ist an cpu.
jetzt zählt der kamerad boinc aber fleissig die laufzeit nach oben (run time) ohne das in der zeit mit 100% gerechnet wird.
die anwendung bekommt wenig cpu-kapazität ab ( sagen wir mal 10% im schnitt ) und hat ja somit viel weniger gerechnet als die laufzeitanzeige vorweist.

grob kann man sagen die run time gibt nur die laufzeit an die die app im boinc aktiv ist und die cpu time die zeit in der tatsächlich daran geknuspert wurde und dafür gibts dann die credits.

Benutzeravatar
yoyo
Vereinsvorstand
Vereinsvorstand
Beiträge: 7800
Registriert: 17.12.2002 14:09
Wohnort: Berlin
Kontaktdaten:

Re: Endmonster erlegt...

#77 Ungelesener Beitrag von yoyo » 09.04.2011 09:39

Warum einige Boincclients die results nicht abbrechen ist mir ein Rätsel. Das sollte eigentlich gehen. Alle Results, die vom Projekt abgebrochen wurden (und nicht vom user) haben auch gredits bekommen. Falls dem nicht so sein sollte, dann bitte Roß und Reiter, sprich ResultID nennen.
yoyo
HILF mit im Rechenkraft-WiKi, dies gibts zu tun.
Wiki - FAQ - Verein - Chat

Bild Bild

Die AliBaBa's
Taschenrechner
Taschenrechner
Beiträge: 9
Registriert: 18.03.2011 16:35

Re: Endmonster erlegt...

#78 Ungelesener Beitrag von Die AliBaBa's » 09.04.2011 12:24

Gut,

dann fang ich mal an mit:
Computer: 10184 Task-ID: 11099050
Computer: 10184 Task-ID: 10863587


Die netten AliBaBas :wave:

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 20412
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Endmonster erlegt...

#79 Ungelesener Beitrag von Michael H.W. Weber » 09.04.2011 15:49

yoyo hat geschrieben:Warum einige Boincclients die results nicht abbrechen ist mir ein Rätsel. Das sollte eigentlich gehen.
Geht aber leider nicht und kostet mich bzw. viel mehr unser Team jetzt weitere 900 Stunden Laufzeit (zusätzlich zu den bislang von mir auch nicht verursachten anderen Verlusten in der Größenordnung von ca. 3000 Stunden, die ich in den exzessiv langen Listen von Tasks aus Zeitgründen in diesem Leben leider nicht mehr identifizieren kann). Werde das Ding jetzt abbrechen (erledigt, aber diese WU taucht leider auch nirgends in den Listen auf, jedenfalls finde ich sie weder ganz oben in der "error" noch in der "invalid" Liste - wir sollten vielleicht einfach für alle Introns die Credits gutschreiben, dann hat die Seele Ruh'). 8)
Könntest Du da bitte mal bei David Anderson nachhaken, wie es sein kann, dass die Client-Server-Kommunikation nicht funktioniert? Mir scheint da ein bislang unentdeckter "bug" vorzuliegen.

Auch wüßte ich ganz gerne, wieso hier die Lauf- und Rechenzeit so eklatant auseinanderliegen. Der Rechner rechnet NUR an RNA World und macht sonst nchts anderes.

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Benutzeravatar
yoyo
Vereinsvorstand
Vereinsvorstand
Beiträge: 7800
Registriert: 17.12.2002 14:09
Wohnort: Berlin
Kontaktdaten:

Re: Endmonster erlegt...

#80 Ungelesener Beitrag von yoyo » 09.04.2011 18:04

Michael H.W. Weber hat geschrieben: Auch wüßte ich ganz gerne, wieso hier die Lauf- und Rechenzeit so eklatant auseinanderliegen. Der Rechner rechnet NUR an RNA World und macht sonst nchts anderes.

Michael.
Das siehst Du im error log. Die wu wurde 2 mal wegen no heartbeat abgebrochen und begann von neuem..
yoyo
HILF mit im Rechenkraft-WiKi, dies gibts zu tun.
Wiki - FAQ - Verein - Chat

Bild Bild

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 20412
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Endmonster erlegt...

#81 Ungelesener Beitrag von Michael H.W. Weber » 09.04.2011 18:59

Oh, Danke. David sollte dieses seit Jahren bekannte Problem vielleicht endlich mal lösen.

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Die AliBaBa's
Taschenrechner
Taschenrechner
Beiträge: 9
Registriert: 18.03.2011 16:35

Re: Endmonster erlegt...

#82 Ungelesener Beitrag von Die AliBaBa's » 09.04.2011 19:48

Danke,

jetzt sind beide WUs abgebrochen durch das Projekt.
Mir schwant aber Übles wenn ich mir den Unterschied zwischen Run-Time und CPU-Time ansehe.

Die netten AliBaBas :wave:

Ananas
WU-Schieber
WU-Schieber
Beiträge: 1184
Registriert: 27.04.2008 18:37
Wohnort: Nordlichter Köln

Re: Endmonster erlegt...

#83 Ungelesener Beitrag von Ananas » 15.02.2012 00:26

Schnabeltierzilla hat zwar Heartbeat-Aerger gemacht, konnte aber nicht auf Dauer standhalten.

Keine Intron, trotzdem ein Monster
vi BOINC/checkin_notes
:1,$s/bug/feature/g
:wq!

Erzaehlen sich Biologen eigentlich Klein-RNA-Witze?

Ananas
WU-Schieber
WU-Schieber
Beiträge: 1184
Registriert: 27.04.2008 18:37
Wohnort: Nordlichter Köln

Re: Endmonster erlegt...

#84 Ungelesener Beitrag von Ananas » 15.02.2012 00:44

Vielleicht sollten wir mal versuchen, die Ursachen zu sammeln.

An die Leute mit Heartbeatproblemen : Achtet doch mal darauf, ob in unmittelbarer Naehe (zeitlich +/- 1 Min.) zum Crash auf einem anderen Kern eine andere WU ganz frisch gestartet wurde oder mehrere Malaria-WUs synchron checkpointen.

Das muss nicht unbedingt eine andere RNA-WU sein (die tun's aber ebenfalls), auch andere Projekte (heftigst CPDN) blockieren beim Auspacken und/oder beim ersten Start (bei mir entweder EDGeS oder SNinCA, weiss nicht mehr ganz genau) den Coreclient laenger als der Heartbeat-Zyklus es erlaubt. Rechner mit schnellen Kernen und HDDs sind davon natuerlich weniger betroffen.

Auch Projektserver oder Nameserver, die extrem verzoegert reagieren, sind potentiell gefaehrlich. Das betrifft ausdruecklich nicht welche, die gar nicht erreichbar sind sondern nur welche mit grottenlahmer Reaktion.

p.s.: Bei meinem Schnabeltier war es uebrigens zweifelsfrei der grottenlahme Webzugriff, da lag es aber am defekten Router, der 2 von 3 Paketen kaputtgemacht und streckenweise die Verbindung stundenlang komplett gekippt hat (grusel, kein Internet geht nur im Urlaub, zu Hause ist es Folter).
vi BOINC/checkin_notes
:1,$s/bug/feature/g
:wq!

Erzaehlen sich Biologen eigentlich Klein-RNA-Witze?

Antworten

Zurück zu „RNA World Diskussionen (deutsch)“