completed, marked as invalid

Alles zum Projekt RNA World
Nachricht
Autor
Benutzeravatar
TotoHH
Vereinsmitglied
Vereinsmitglied
Beiträge: 139
Registriert: 27.11.2002 08:15
Wohnort: Hamburg
Kontaktdaten:

completed, marked as invalid

#1 Ungelesener Beitrag von TotoHH » 12.08.2010 14:27

Moin,

ich habe mal eine Frage zu den reporteten Ergebnissen.
Wenn ich mir meine abgeschlossenen Tasks anschaue, dann gibt es da "Unmengen" mit dem Status "Completed, marked as invalid".
Ein Beispiel dafür ist diese WU.

Das Ergebnis der HostID 4125 wurde angenommen aber wohl abgelehnt, da scheinbar immer nur das erste und letzte gemeldete Ergebnis von Belang zu sein scheinen. Woran liegt das und was ist der Sinn dahinter?


Generell würde es vielleicht Sinn machen, die verwendeten Status in einer Legende mit kurzer Erklärung zusammenzufassen.
Bild

Benutzeravatar
mxplm
Partikel-Strecker
Partikel-Strecker
Beiträge: 966
Registriert: 14.09.2009 13:56
Wohnort: Bielefeld

Re: completed, marked as invalid

#2 Ungelesener Beitrag von mxplm » 12.08.2010 14:54

Marked as invalid heißt, dass das Result danach aussah, dass Fehler bei der Berechnung gemacht wurde.

Dass immer das erste und das letzte Result valid sind kann ich teilweise auch erklären. Falls die ersten Results nich erfolgreich validiert werden können (Deadline überschritten, Berechnungsfehler, Abbruch durch User), dann werden solange weitere Results erzeugt und verschickt, bis mal eins erfolgreich validiert werden kann. Daher ist oft das letze Result "Completed and validated".

Warum oft das erste dazu validiert werden konnte, kann ich nicht sagen, das ist wohl eher Zufall.

Wenn du viele WUs hast, die nicht validiert werden, solltest du mal nachgucken, ob das vllt nur einen bestimmten Host betrifft. Fehler können eine Unmenge von Quellen haben, spontan fällt mir ein, dass z.B. bei übertakteten CPUs manchmal das eine oder andere Bit verloren geht, falls die Spannung nicht reicht. Du kannst dir die WUs ansehen, dort steht z.B. die Ausgabe des Programmes, in deinem Fall:

Code: Alles auswählen

...
wrapper: starting ./freeze chkpoint 16241
     Ignoring map - in kernel space.
     Error parsing map: 08048000-081d5000 r-xp 00000000 fd:01 9765062                            /named/BOINC/slots/1/cmsearch

     Ignoring map - in kernel space.
     Error parsing map: 081d5000-081d8000 rwxp 0018c000 fd:01 9765062                            /named/BOINC/slots/1/cmsearch

     Ignoring map - in kernel space.
     Error parsing map: 081d8000-08206000 rwxp 081d8000 00:00 0 

     Ignoring map - in kernel space.
     Error parsing map: 09ea7000-0a1d5000 rwxp 09ea7000 00:00 0                                  [heap]

     Ignoring map - in kernel space.
     Error parsing map: f4c52000-f7921000 rwxp f4c52000 00:00 0 

     Ignoring map - in kernel space.
     Error parsing map: f7921000-f7bc4000 rwxp f7c8c000 00:00 0 

     Ignoring map - in kernel space.
     Error parsing map: f7d08000-f7f3c000 rwxp f7d08000 00:00 0 

     Ignoring map - in kernel space.
     Error parsing map: ff933000-ff948000 rw-p 7ffffffea000 00:00 0                              [stack]

     Ignoring map - in kernel space.
     Error parsing map: ffffe000-fffff000 r-xp ffffe000 00:00 0 

[-] No suitable scribble zone could be found. Aborting.
wrapper: writing checkpoint image
...
Könnte sein, dass man damit schon auf Fehlersuche gehen kann.
:Wiki-Benutzerseite: (Über mich)
:fold.it: (Helfen durch Zocken)

Benutzeravatar
TotoHH
Vereinsmitglied
Vereinsmitglied
Beiträge: 139
Registriert: 27.11.2002 08:15
Wohnort: Hamburg
Kontaktdaten:

Re: completed, marked as invalid

#3 Ungelesener Beitrag von TotoHH » 12.08.2010 15:18

Hmm.... die Kiste ist sowas von Standard (HP DL360G5, Intel Quad Xeon X5365 bei 3GHz Standardtakt, 2x HP 8Gb PC3-8500 Registered CAS7 Low Power DRAM, RHEL 5.5 64bit Kernel 2.6.18).

Wenn das wenigstens eine der Debian Kisten wäre... aber das hier ist ein Rechner, wie er tausendfach von HP vertrieben wird.
Naja, schlimmstenfalls muss ich alle HP Server auf yoyo schwenken.
Bild

Benutzeravatar
mxplm
Partikel-Strecker
Partikel-Strecker
Beiträge: 966
Registriert: 14.09.2009 13:56
Wohnort: Bielefeld

Re: completed, marked as invalid

#4 Ungelesener Beitrag von mxplm » 12.08.2010 17:06

Eventuell kann yoyo dazu noch mehr sagen, der kann vielleicht nachgucken, was bei deinen invalids gemeldet wurde. Da es ja einige WUs auch schaffen, kann es eigentlich nicht an fehlenden libs oder so liegen.
:Wiki-Benutzerseite: (Über mich)
:fold.it: (Helfen durch Zocken)

Benutzeravatar
yoyo
Vereinsvorstand
Vereinsvorstand
Beiträge: 8045
Registriert: 17.12.2002 14:09
Wohnort: Berlin
Kontaktdaten:

Re: completed, marked as invalid

#5 Ungelesener Beitrag von yoyo » 12.08.2010 21:07

Die WU ist vor 5 Tagen valid gewesen. Da sind jetzt die invalid results weg. Das kann ich mir jetzt nicht mehr ansehen.
Wenn was invalid ist, dann schnell melden, 24h nachdem die WU komplett ist werden die Results gelöscht und lediglich das valide Result wird archiviert.
yoyo
HILF mit im Rechenkraft-WiKi, dies gibts zu tun.
Wiki - FAQ - Verein - Chat

Bild Bild

Benutzeravatar
TotoHH
Vereinsmitglied
Vereinsmitglied
Beiträge: 139
Registriert: 27.11.2002 08:15
Wohnort: Hamburg
Kontaktdaten:

Re: completed, marked as invalid

#6 Ungelesener Beitrag von TotoHH » 13.08.2010 07:41

Hier die aktuellsten Fälle:

HostID 4125
http://www.rnaworld.de/rnaworld/workuni ... id=2126221
http://www.rnaworld.de/rnaworld/workuni ... id=2125563

HostID 4134
http://www.rnaworld.de/rnaworld/workuni ... id=2129190
http://www.rnaworld.de/rnaworld/workuni ... id=2102011

HostID 4135
http://www.rnaworld.de/rnaworld/workuni ... id=2128685


Edit:

Komischerweise hat die HostID 3846 (AMD Athlon(tm) 64 X2 Dual Core Processor 5200+ [Family 15 Model 107 Stepping 2], 2MB RAM, Fedora 12, 64bit Kernel 2.6.32) bisher nicht eine einzige invalide WU berechnet.



Edit2:

Und noch eine ganz frisch.
HostID 4135
http://www.rnaworld.de/rnaworld/workuni ... id=2093237
Bild

Benutzeravatar
yoyo
Vereinsvorstand
Vereinsvorstand
Beiträge: 8045
Registriert: 17.12.2002 14:09
Wohnort: Berlin
Kontaktdaten:

Re: completed, marked as invalid

#7 Ungelesener Beitrag von yoyo » 13.08.2010 19:40

TotoHH hat geschrieben: Und noch eine ganz frisch.
HostID 4135
http://www.rnaworld.de/rnaworld/workuni ... id=2093237
Hier mal alle results zu dieser WU http://www.rnaworld.de/rnaworld/downloa ... 093237.zip .
Die *_0 Dateien sind die Results, die validiert werden.
Die *_1 Dateien sind Logfiles.

Von dir ist die *_2_0, die validen sind *_1_0 und *_3_0.

Die WU hat nichts gefunden, daher steht im Ergebnis nur der Name der CM. Bei dir und dem anderen invalid Result allerdings mehrfach. Unklar ist mir warum, da es nicht so aussieht als ob die WU bei Euch mehrfach gestartet bzw. restartet wurde. Außerdem schreibt cmsearch das Ergebnis erst am Ende.

yoyo
HILF mit im Rechenkraft-WiKi, dies gibts zu tun.
Wiki - FAQ - Verein - Chat

Bild Bild

Benutzeravatar
TotoHH
Vereinsmitglied
Vereinsmitglied
Beiträge: 139
Registriert: 27.11.2002 08:15
Wohnort: Hamburg
Kontaktdaten:

Re: completed, marked as invalid

#8 Ungelesener Beitrag von TotoHH » 13.08.2010 21:45

Komisch..... umsomehr, da ich für die drei Hosts auf knapp 300 solcher Ergebnisse komme.
Könnte man den ganzen Vorgang irgendwie nach solch einem Auftreten nochmal manuell mit ein paar mehr Debug Informationen starten?
Da scheint mir doch irgendwo ein Wurm drin zu stecken.


Hmm... hier ist noch eine http://www.rnaworld.de/rnaworld/workuni ... id=2128754
Interessanterweise wurde hier freeze offensichtlich zweimal hintereinander aufgerufen. Könnte das die Ursache für die mehrfache Ausgabe im Ergebnisfile sein?

<core_client_version>6.6.41</core_client_version>
<![CDATA[
<stderr_txt>
RNA World wrapper v0.04
wrapper: no checkpoint file found
wrapper: running unzip (-o graphics.zip)
wrapper: no checkpoint file found
wrapper: running unzip (-o in.zip)
wrapper: no checkpoint file found
wrapper: running unzip_cpufeat (cmsearch.zip)
wrapper: no checkpoint file found
wrapper: running cmsearch (--forecast 1 cmfile in)
forecast.txt found.
wrapper: no checkpoint file found
wrapper: running cmsearch (-o out cmfile in)
forecast.txt found.
wrapper: writing checkpoint image
wrapper: starting ./freeze chkpoint 30742
Ignoring map - in kernel space.
Error parsing map: 08048000-081d5000 r-xp 00000000 fd:01 9830463 /named/BOINC/slots/2/cmsearch

Ignoring map - in kernel space.
Error parsing map: 081d5000-081d8000 rwxp 0018c000 fd:01 9830463 /named/BOINC/slots/2/cmsearch

Ignoring map - in kernel space.
Error parsing map: 081d8000-08206000 rwxp 081d8000 00:00 0

Ignoring map - in kernel space.
Error parsing map: 08cdb000-08ded000 rwxp 08cdb000 00:00 0 [heap]

Ignoring map - in kernel space.
Error parsing map: f4f52000-f7a78000 rwxp f4f52000 00:00 0

Ignoring map - in kernel space.
Error parsing map: f7a78000-f7d02000 rwxp f7eb5000 00:00 0

Ignoring map - in kernel space.
Error parsing map: f7ed7000-f7f4d000 rwxp f7ed7000 00:00 0

Ignoring map - in kernel space.
Error parsing map: ffe3e000-ffe53000 rw-p 7ffffffea000 00:00 0 [stack]

Ignoring map - in kernel space.
Error parsing map: ffffe000-fffff000 r-xp ffffe000 00:00 0

[-] No suitable scribble zone could be found. Aborting.
wrapper: writing checkpoint image
wrapper: starting ./freeze chkpoint 30742
Ignoring map - in kernel space.
Error parsing map: 08048000-081d5000 r-xp 00000000 fd:01 9830463 /named/BOINC/slots/2/cmsearch

Ignoring map - in kernel space.
Error parsing map: 081d5000-081d8000 rwxp 0018c000 fd:01 9830463 /named/BOINC/slots/2/cmsearch

Ignoring map - in kernel space.
Error parsing map: 081d8000-08206000 rwxp 081d8000 00:00 0

Ignoring map - in kernel space.
Error parsing map: 08cdb000-08dfb000 rwxp 08cdb000 00:00 0 [heap]

Ignoring map - in kernel space.
Error parsing map: f4f52000-f7a78000 rwxp f4f52000 00:00 0

Ignoring map - in kernel space.
Error parsing map: f7a78000-f7d02000 rwxp f7eb5000 00:00 0

Ignoring map - in kernel space.
Error parsing map: f7ed7000-f7f4d000 rwxp f7ed7000 00:00 0

Ignoring map - in kernel space.
Error parsing map: ffe3e000-ffe53000 rw-p 7ffffffea000 00:00 0 [stack]

Ignoring map - in kernel space.
Error parsing map: ffffe000-fffff000 r-xp ffffe000 00:00 0

[-] No suitable scribble zone could be found. Aborting.
13:46:24 (30626): called boinc_finish

</stderr_txt>
]]>
Bild

Benutzeravatar
yoyo
Vereinsvorstand
Vereinsvorstand
Beiträge: 8045
Registriert: 17.12.2002 14:09
Wohnort: Berlin
Kontaktdaten:

Re: completed, marked as invalid

#9 Ungelesener Beitrag von yoyo » 16.08.2010 16:56

Ich vermute, dass es an irgend einer lib bei dir liegt, die auf anderen Linux'en eine andere Version hat. In Deinen results gibt es leichte Unterschiede zu den validen Results:

WUid: 2180367

Code: Alles auswählen

> diff *0_0 *2_0
1452c1452
<  Score = 20.33, E = 0.2679, P = 1.552e-07, GC =  58
---
>  Score = 20.33, E = 0.2679, P = 1.552e-07, GC =  57
WUid: 2185247

Code: Alles auswählen

> diff *0
1977c1977
<  Score = 22.91, E = 0.03844, P = 2.257e-08, GC =  58
---
>  Score = 22.91, E = 0.03844, P = 2.257e-08, GC =  57
Kannst Du mal versuchen auf einem der anfälligsten Rechnern die neuste Boincversion zu nehmen?

Welches Linux läuft bei Dir und wann hast Du das das letzte Mal aktualisiert?
yoyo
HILF mit im Rechenkraft-WiKi, dies gibts zu tun.
Wiki - FAQ - Verein - Chat

Bild Bild

Benutzeravatar
TotoHH
Vereinsmitglied
Vereinsmitglied
Beiträge: 139
Registriert: 27.11.2002 08:15
Wohnort: Hamburg
Kontaktdaten:

Re: completed, marked as invalid

#10 Ungelesener Beitrag von TotoHH » 16.08.2010 21:15

Der Host mit den meisten Fehlern ist der 4125. Das ist ein Xeon Quad mit einem aktuellen RedHat Enterprise 5.5 mit einem 2.6.18 64bit Kernel.
Bisher lief darauf ein Boinc 6.6.41, was mit anderen Projekten keinerlei Probleme hat. Ich habe die ältere Version, da die neuere mit den Debian Servern (einige der anderen Hosts) nicht läuft.
Diesen Host habe ich nun mit der aktuellen Version (6.10.56) versehen und werde beobachten, ob die Fehler trotzdem noch auftreten.
Bild

Benutzeravatar
TotoHH
Vereinsmitglied
Vereinsmitglied
Beiträge: 139
Registriert: 27.11.2002 08:15
Wohnort: Hamburg
Kontaktdaten:

Re: completed, marked as invalid

#11 Ungelesener Beitrag von TotoHH » 18.08.2010 18:28

Bis jetzt ist es nach dem Update zu keinen invaliden WUs mehr gekommen.
Ich fürchte, das schreit nach einem weiteren Hinweis, welche Voraussetzungen für dieses Projekt zu beachten sind.
Bild

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22419
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: completed, marked as invalid

#12 Ungelesener Beitrag von Michael H.W. Weber » 19.08.2010 01:49

Gerne. Und was soll da nun konkret hingeschrieben werden?

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Antworten

Zurück zu „RNA World Diskussionen (deutsch)“