Zu viele Fehler bei Monster WU

Alles zum Projekt RNA World
Nachricht
Autor
nebu

Zu viele Fehler bei Monster WU

#1 Ungelesener Beitrag von nebu » 17.10.2013 11:36

Bei WU 6329166 sind "nur" maximal 14 Fehler vorgesehen, die sind jetzt erreicht:
1x not started by deadline / canceled
2x Fehler beim Download
4x Fehler beim Berechnen
5x Zeitüberschreitung - keine Antwort
2x Abbruch durch Benutzer

und der 15te Versuch
1x Fertig, warte auf Bestätigung.

Wie komme ich an die Credits für die 641 Stunden, die ich im August/September daran rechnen ließ ?

ChristianB
Admin
Admin
Beiträge: 1920
Registriert: 23.02.2010 22:12

Re: Zu viele Fehler bei Monster WU

#2 Ungelesener Beitrag von ChristianB » 17.10.2013 12:03

Diese Workunit wurde nicht wegen zu vielen Fehlern angehalten sondern war für eine konvertierung in die VM vorgesehen. In der Zwischenzeit ist aber ein erfolgreiches Result abgeliefert wurden (nämlich deins) weil ich aber die Generierung von neuen Aufgaben für diese WU deaktiviert habe wurde keine neue erzeugt um dein Ergebnis zu überprüfen also konnten auch keine Credits gutgeschrieben werden.

Es ist noch nicht entschieden was mit diesen "angehaltenen" Workunits passiert. Die Credits sind aber nicht verloren sondern werden nur etwas später gutgeschrieben.

nebu

Re: Zu viele Fehler bei Monster WU

#3 Ungelesener Beitrag von nebu » 17.10.2013 12:07

Danke für die Info
Ich fühle die Arbeit meiner CPU nicht nutzlos vertan.

Benutzeravatar
ClaudiusD
Block-Bunkerer
Block-Bunkerer
Beiträge: 1301
Registriert: 29.01.2013 16:52
Wohnort: Wien

Re: Zu viele Fehler bei Monster WU

#4 Ungelesener Beitrag von ClaudiusD » 17.10.2013 12:44

Zählt zu den WUs auch diese hier: 6330417?

Lief aber auch nur 25 Tage oder sowas...
Bild

ChristianB
Admin
Admin
Beiträge: 1920
Registriert: 23.02.2010 22:12

Re: Zu viele Fehler bei Monster WU

#5 Ungelesener Beitrag von ChristianB » 17.10.2013 14:31

Ja, die ist auch angehalten. Man erkennt es daran das "Anfängliche Kopien" auf 0 gesetzt ist. Das verhindert das neue Aufgaben erzeugt werden.

NovaTec

Re: Zu viele Fehler bei Monster WU

#6 Ungelesener Beitrag von NovaTec » 15.11.2013 23:23

Da eine meiner Fragen zum Topic passt, schließe ich mich hier einfach mal an ;-)


Ich weiß nicht genau was alles als "Fehler" gezählt wird aber eine meiner WUs (6045661) wurde schon von vielen abgebrochen oder hatte "Fehler beim Berechnen".
Könnte man für diese WU die Anzahl maximaler Fehler anheben? Hat jetzt schon 3414 Stunden auf dem Buckel.
Wäre sehr schade um die Rechenzeit.
Da sie bei mir alle auf einer VM laufen, sollte ich die eigentlich auch "sicher" fertig bekommen.
Dann brauch ich nur noch einen ausdauernden XXL-Jäger :D

Eine Frage noch zum umwandeln von XXL's in VM's:
was passiert wenn schon einer die WU als XXL abgeliefert hat?
Wird diese dann trotzdem in eine VM umgewandelt, weil es z.B. zu lange dauern würde einen "geduldigen" Wingman zu erwischen?
Wenn ja, kann ein XXL-Result mit einem VM-Result validiert werden?
Eine meiner kleineren steht z.B. auf pending und wird nicht mehr versendet (6330250).

Mir geht es eigentlich weniger um die Credits, wichtig sind mir die Ergebnisse.
Bei ein paar Stunden Rechenzeit ist das ja ok aber bei über 17000 Stunden (6 WUs) möchte ich was sinnvolles abliefern... was einen Nutzen hat.


Grüße,
NovaTec

Benutzeravatar
Dunuin
Vereinsmitglied
Vereinsmitglied
Beiträge: 1743
Registriert: 23.03.2011 12:59
Wohnort: Hamburg

Re: Zu viele Fehler bei Monster WU

#7 Ungelesener Beitrag von Dunuin » 16.11.2013 00:51

Das Problem ist wohl die Validierung. Jedes Betriebsystem rundet z.B. die Zahlen anders, weshalb eine Linux WU (in den VMs läuft Linux) nicht mit einer Windows-WU oder gar iOS-WU validiert werden kann. Dann können zwar beide Ergebnisse vollkommen richtig sein, es kommt aber eben bei beiden etwas anderes heraus. Daher lassen sich wohl XXL WUs vom Win Rechner nicht mit einer VM-Linux-WU validieren.
Bild

ChristianB
Admin
Admin
Beiträge: 1920
Registriert: 23.02.2010 22:12

Re: Zu viele Fehler bei Monster WU

#8 Ungelesener Beitrag von ChristianB » 16.11.2013 08:58

NovaTec hat geschrieben:Ich weiß nicht genau was alles als "Fehler" gezählt wird aber eine meiner WUs (6045661) wurde schon von vielen abgebrochen oder hatte "Fehler beim Berechnen".
Könnte man für diese WU die Anzahl maximaler Fehler anheben? Hat jetzt schon 3414 Stunden auf dem Buckel.
Für diesen Job sieht es gut aus, das Fehlerlimit liegt bei 52 und selbst wenn die 3 laufenden auch noch abbrechen dann sind es nur 33 Aufgaben welche einen Berechnungsfehler aufweisen. Durch den Benutzer abgebrochenen Aufgaben zählen in diese Berechnung nicht mit rein.
NovaTec hat geschrieben:Eine Frage noch zum umwandeln von XXL's in VM's:
was passiert wenn schon einer die WU als XXL abgeliefert hat?
Wird diese dann trotzdem in eine VM umgewandelt, weil es z.B. zu lange dauern würde einen "geduldigen" Wingman zu erwischen?
Wenn ja, kann ein XXL-Result mit einem VM-Result validiert werden?
Was mit den SingleResult XXL Jobs passiert ist noch nicht ganz klar. Vorerst werden die angehalten bleiben. Leider gibt es keinen ordentlichen und einfachen Weg diese Jobs zu VM Jobs zu konvertieren, so dass die auch sicher Validieren. Da macht uns das BOINC Konzept einen Strich durch die Rechnung.

Grundsätzlich gibt es drei Möglichkeiten:
  1. Den Job einfach konvertieren, dabei dem XXL User Credits gutschreiben und nochmal zwei valide Ergebnisse per VM berechnen
  2. Den Job konvertieren aber nur einmal Berechnen lassen und anschießend per Hand die beiden Ergebnisse validieren und Credit verteilen
  3. Neue Aufgaben für den XXL Job erzeugen und hoffen das sich ein stabiler Wingman findet (das kann durch den Server etwas beeinflusst werden)
Es gibt zur Zeit 65 solcher angehaltenen Jobs (und 100 für die noch neue XXL Aufgaben erzeugt werden) wobei einige auch leere Ergebnisse enthalten. Ich habe mir vorgenommen diese in den nächsten Tagen herauszufiltern (geht nur per händischer Überprüfung) so dass ein besserer Überblick besteht. Bisher hatte ich Option 3 favorisiert, mittlerweile finde ich Option 2 aber auch nicht so verkehrt nur etwas arbeitsintensiver.

Roland Schneider
Vereinsvorstand
Vereinsvorstand
Beiträge: 919
Registriert: 12.11.2003 20:41
Wohnort: Stavenhagen

Re: Zu viele Fehler bei Monster WU

#9 Ungelesener Beitrag von Roland Schneider » 17.11.2013 12:51

ChristianB hat geschrieben:Grundsätzlich gibt es drei Möglichkeiten:
  1. Den Job einfach konvertieren, dabei dem XXL User Credits gutschreiben und nochmal zwei valide Ergebnisse per VM berechnen
  2. Den Job konvertieren aber nur einmal Berechnen lassen und anschießend per Hand die beiden Ergebnisse validieren und Credit verteilen
  3. Neue Aufgaben für den XXL Job erzeugen und hoffen das sich ein stabiler Wingman findet (das kann durch den Server etwas beeinflusst werden)
Es gibt zur Zeit 65 solcher angehaltenen Jobs (und 100 für die noch neue XXL Aufgaben erzeugt werden) wobei einige auch leere Ergebnisse enthalten. Ich habe mir vorgenommen diese in den nächsten Tagen herauszufiltern (geht nur per händischer Überprüfung) so dass ein besserer Überblick besteht. Bisher hatte ich Option 3 favorisiert, mittlerweile finde ich Option 2 aber auch nicht so verkehrt nur etwas arbeitsintensiver.
Wenn's hilft, würde ich für Linux-Tasks nochmal meine VM's anwerfen (wenn Du mir welche zuteilen kannst, die ich noch nicht hatte).

NovaTec

Re: Zu viele Fehler bei Monster WU

#10 Ungelesener Beitrag von NovaTec » 17.11.2013 14:15

Dunuin hat geschrieben:Das Problem ist wohl die Validierung. Jedes Betriebsystem rundet z.B. die Zahlen anders, weshalb eine Linux WU (in den VMs läuft Linux) nicht mit einer Windows-WU oder gar iOS-WU validiert werden kann. Dann können zwar beide Ergebnisse vollkommen richtig sein, es kommt aber eben bei beiden etwas anderes heraus. Daher lassen sich wohl XXL WUs vom Win Rechner nicht mit einer VM-Linux-WU validieren.
Auf meiner VM läuft Debian. Das sollte eigentlich nicht das Problem sein.


@Christian:
Danke für die ausfühliche, beruhigende Antwort!
Wenn man das serverseitig ein wenig beeinflussen kann wer die WUs bekommt (stabiler Wingman), finde ich die Option 3 eigentlich am besten.
Gerade wegen dem geringeren Aufwand. Ihr habt ja so schon genug zu tun ;-)
Jetzt muss ich die Dinger nur noch zu Ende bekommen, wollen einfach nicht fertig werden...

Grüße,
NovaTec

Ananas
WU-Schieber
WU-Schieber
Beiträge: 1184
Registriert: 27.04.2008 18:37
Wohnort: Nordlichter Köln

Re: Zu viele Fehler bei Monster WU

#11 Ungelesener Beitrag von Ananas » 23.11.2013 20:56

Leucht-Dingens :-)

Meine Vibrio harveyi steht kurz vor dem Abschluss (da fehlt nur noch die 100%-Phase), bitte nicht serverseitig abbrechen, was zu meinem Entsetzen bei einem bereits gestarteten Result wohl passiert ist.
vi BOINC/checkin_notes
:1,$s/bug/feature/g
:wq!

Erzaehlen sich Biologen eigentlich Klein-RNA-Witze?

ChristianB
Admin
Admin
Beiträge: 1920
Registriert: 23.02.2010 22:12

Re: Zu viele Fehler bei Monster WU

#12 Ungelesener Beitrag von ChristianB » 23.11.2013 21:52

Da sollte eigentlich nichts passieren, du bist ja der letzte der da noch rechnet. Die anderen Abbrüche sind schon älter und könnten von einer Zeit stammen bevor ich den Job wieder aktiviert hatte.

Zurück zu „RNA World Diskussionen (deutsch)“