completed, marked as invalid
completed, marked as invalid
Moin,
ich habe mal eine Frage zu den reporteten Ergebnissen.
Wenn ich mir meine abgeschlossenen Tasks anschaue, dann gibt es da "Unmengen" mit dem Status "Completed, marked as invalid".
Ein Beispiel dafür ist diese WU.
Das Ergebnis der HostID 4125 wurde angenommen aber wohl abgelehnt, da scheinbar immer nur das erste und letzte gemeldete Ergebnis von Belang zu sein scheinen. Woran liegt das und was ist der Sinn dahinter?
Generell würde es vielleicht Sinn machen, die verwendeten Status in einer Legende mit kurzer Erklärung zusammenzufassen.
ich habe mal eine Frage zu den reporteten Ergebnissen.
Wenn ich mir meine abgeschlossenen Tasks anschaue, dann gibt es da "Unmengen" mit dem Status "Completed, marked as invalid".
Ein Beispiel dafür ist diese WU.
Das Ergebnis der HostID 4125 wurde angenommen aber wohl abgelehnt, da scheinbar immer nur das erste und letzte gemeldete Ergebnis von Belang zu sein scheinen. Woran liegt das und was ist der Sinn dahinter?
Generell würde es vielleicht Sinn machen, die verwendeten Status in einer Legende mit kurzer Erklärung zusammenzufassen.
Re: completed, marked as invalid
Marked as invalid heißt, dass das Result danach aussah, dass Fehler bei der Berechnung gemacht wurde.
Dass immer das erste und das letzte Result valid sind kann ich teilweise auch erklären. Falls die ersten Results nich erfolgreich validiert werden können (Deadline überschritten, Berechnungsfehler, Abbruch durch User), dann werden solange weitere Results erzeugt und verschickt, bis mal eins erfolgreich validiert werden kann. Daher ist oft das letze Result "Completed and validated".
Warum oft das erste dazu validiert werden konnte, kann ich nicht sagen, das ist wohl eher Zufall.
Wenn du viele WUs hast, die nicht validiert werden, solltest du mal nachgucken, ob das vllt nur einen bestimmten Host betrifft. Fehler können eine Unmenge von Quellen haben, spontan fällt mir ein, dass z.B. bei übertakteten CPUs manchmal das eine oder andere Bit verloren geht, falls die Spannung nicht reicht. Du kannst dir die WUs ansehen, dort steht z.B. die Ausgabe des Programmes, in deinem Fall:
Könnte sein, dass man damit schon auf Fehlersuche gehen kann.
Dass immer das erste und das letzte Result valid sind kann ich teilweise auch erklären. Falls die ersten Results nich erfolgreich validiert werden können (Deadline überschritten, Berechnungsfehler, Abbruch durch User), dann werden solange weitere Results erzeugt und verschickt, bis mal eins erfolgreich validiert werden kann. Daher ist oft das letze Result "Completed and validated".
Warum oft das erste dazu validiert werden konnte, kann ich nicht sagen, das ist wohl eher Zufall.
Wenn du viele WUs hast, die nicht validiert werden, solltest du mal nachgucken, ob das vllt nur einen bestimmten Host betrifft. Fehler können eine Unmenge von Quellen haben, spontan fällt mir ein, dass z.B. bei übertakteten CPUs manchmal das eine oder andere Bit verloren geht, falls die Spannung nicht reicht. Du kannst dir die WUs ansehen, dort steht z.B. die Ausgabe des Programmes, in deinem Fall:
Code: Alles auswählen
...
wrapper: starting ./freeze chkpoint 16241
Ignoring map - in kernel space.
Error parsing map: 08048000-081d5000 r-xp 00000000 fd:01 9765062 /named/BOINC/slots/1/cmsearch
Ignoring map - in kernel space.
Error parsing map: 081d5000-081d8000 rwxp 0018c000 fd:01 9765062 /named/BOINC/slots/1/cmsearch
Ignoring map - in kernel space.
Error parsing map: 081d8000-08206000 rwxp 081d8000 00:00 0
Ignoring map - in kernel space.
Error parsing map: 09ea7000-0a1d5000 rwxp 09ea7000 00:00 0 [heap]
Ignoring map - in kernel space.
Error parsing map: f4c52000-f7921000 rwxp f4c52000 00:00 0
Ignoring map - in kernel space.
Error parsing map: f7921000-f7bc4000 rwxp f7c8c000 00:00 0
Ignoring map - in kernel space.
Error parsing map: f7d08000-f7f3c000 rwxp f7d08000 00:00 0
Ignoring map - in kernel space.
Error parsing map: ff933000-ff948000 rw-p 7ffffffea000 00:00 0 [stack]
Ignoring map - in kernel space.
Error parsing map: ffffe000-fffff000 r-xp ffffe000 00:00 0
[-] No suitable scribble zone could be found. Aborting.
wrapper: writing checkpoint image
...
Re: completed, marked as invalid
Hmm.... die Kiste ist sowas von Standard (HP DL360G5, Intel Quad Xeon X5365 bei 3GHz Standardtakt, 2x HP 8Gb PC3-8500 Registered CAS7 Low Power DRAM, RHEL 5.5 64bit Kernel 2.6.18).
Wenn das wenigstens eine der Debian Kisten wäre... aber das hier ist ein Rechner, wie er tausendfach von HP vertrieben wird.
Naja, schlimmstenfalls muss ich alle HP Server auf yoyo schwenken.
Wenn das wenigstens eine der Debian Kisten wäre... aber das hier ist ein Rechner, wie er tausendfach von HP vertrieben wird.
Naja, schlimmstenfalls muss ich alle HP Server auf yoyo schwenken.
Re: completed, marked as invalid
Eventuell kann yoyo dazu noch mehr sagen, der kann vielleicht nachgucken, was bei deinen invalids gemeldet wurde. Da es ja einige WUs auch schaffen, kann es eigentlich nicht an fehlenden libs oder so liegen.
Re: completed, marked as invalid
Die WU ist vor 5 Tagen valid gewesen. Da sind jetzt die invalid results weg. Das kann ich mir jetzt nicht mehr ansehen.
Wenn was invalid ist, dann schnell melden, 24h nachdem die WU komplett ist werden die Results gelöscht und lediglich das valide Result wird archiviert.
yoyo
Wenn was invalid ist, dann schnell melden, 24h nachdem die WU komplett ist werden die Results gelöscht und lediglich das valide Result wird archiviert.
yoyo
Re: completed, marked as invalid
Hier die aktuellsten Fälle:
HostID 4125
http://www.rnaworld.de/rnaworld/workuni ... id=2126221
http://www.rnaworld.de/rnaworld/workuni ... id=2125563
HostID 4134
http://www.rnaworld.de/rnaworld/workuni ... id=2129190
http://www.rnaworld.de/rnaworld/workuni ... id=2102011
HostID 4135
http://www.rnaworld.de/rnaworld/workuni ... id=2128685
Edit:
Komischerweise hat die HostID 3846 (AMD Athlon(tm) 64 X2 Dual Core Processor 5200+ [Family 15 Model 107 Stepping 2], 2MB RAM, Fedora 12, 64bit Kernel 2.6.32) bisher nicht eine einzige invalide WU berechnet.
Edit2:
Und noch eine ganz frisch.
HostID 4135
http://www.rnaworld.de/rnaworld/workuni ... id=2093237
HostID 4125
http://www.rnaworld.de/rnaworld/workuni ... id=2126221
http://www.rnaworld.de/rnaworld/workuni ... id=2125563
HostID 4134
http://www.rnaworld.de/rnaworld/workuni ... id=2129190
http://www.rnaworld.de/rnaworld/workuni ... id=2102011
HostID 4135
http://www.rnaworld.de/rnaworld/workuni ... id=2128685
Edit:
Komischerweise hat die HostID 3846 (AMD Athlon(tm) 64 X2 Dual Core Processor 5200+ [Family 15 Model 107 Stepping 2], 2MB RAM, Fedora 12, 64bit Kernel 2.6.32) bisher nicht eine einzige invalide WU berechnet.
Edit2:
Und noch eine ganz frisch.
HostID 4135
http://www.rnaworld.de/rnaworld/workuni ... id=2093237
Re: completed, marked as invalid
Hier mal alle results zu dieser WU http://www.rnaworld.de/rnaworld/downloa ... 093237.zip .TotoHH hat geschrieben: Und noch eine ganz frisch.
HostID 4135
http://www.rnaworld.de/rnaworld/workuni ... id=2093237
Die *_0 Dateien sind die Results, die validiert werden.
Die *_1 Dateien sind Logfiles.
Von dir ist die *_2_0, die validen sind *_1_0 und *_3_0.
Die WU hat nichts gefunden, daher steht im Ergebnis nur der Name der CM. Bei dir und dem anderen invalid Result allerdings mehrfach. Unklar ist mir warum, da es nicht so aussieht als ob die WU bei Euch mehrfach gestartet bzw. restartet wurde. Außerdem schreibt cmsearch das Ergebnis erst am Ende.
yoyo
Re: completed, marked as invalid
Komisch..... umsomehr, da ich für die drei Hosts auf knapp 300 solcher Ergebnisse komme.
Könnte man den ganzen Vorgang irgendwie nach solch einem Auftreten nochmal manuell mit ein paar mehr Debug Informationen starten?
Da scheint mir doch irgendwo ein Wurm drin zu stecken.
Hmm... hier ist noch eine http://www.rnaworld.de/rnaworld/workuni ... id=2128754
Interessanterweise wurde hier freeze offensichtlich zweimal hintereinander aufgerufen. Könnte das die Ursache für die mehrfache Ausgabe im Ergebnisfile sein?
<core_client_version>6.6.41</core_client_version>
<![CDATA[
<stderr_txt>
RNA World wrapper v0.04
wrapper: no checkpoint file found
wrapper: running unzip (-o graphics.zip)
wrapper: no checkpoint file found
wrapper: running unzip (-o in.zip)
wrapper: no checkpoint file found
wrapper: running unzip_cpufeat (cmsearch.zip)
wrapper: no checkpoint file found
wrapper: running cmsearch (--forecast 1 cmfile in)
forecast.txt found.
wrapper: no checkpoint file found
wrapper: running cmsearch (-o out cmfile in)
forecast.txt found.
wrapper: writing checkpoint image
wrapper: starting ./freeze chkpoint 30742
Ignoring map - in kernel space.
Error parsing map: 08048000-081d5000 r-xp 00000000 fd:01 9830463 /named/BOINC/slots/2/cmsearch
Ignoring map - in kernel space.
Error parsing map: 081d5000-081d8000 rwxp 0018c000 fd:01 9830463 /named/BOINC/slots/2/cmsearch
Ignoring map - in kernel space.
Error parsing map: 081d8000-08206000 rwxp 081d8000 00:00 0
Ignoring map - in kernel space.
Error parsing map: 08cdb000-08ded000 rwxp 08cdb000 00:00 0 [heap]
Ignoring map - in kernel space.
Error parsing map: f4f52000-f7a78000 rwxp f4f52000 00:00 0
Ignoring map - in kernel space.
Error parsing map: f7a78000-f7d02000 rwxp f7eb5000 00:00 0
Ignoring map - in kernel space.
Error parsing map: f7ed7000-f7f4d000 rwxp f7ed7000 00:00 0
Ignoring map - in kernel space.
Error parsing map: ffe3e000-ffe53000 rw-p 7ffffffea000 00:00 0 [stack]
Ignoring map - in kernel space.
Error parsing map: ffffe000-fffff000 r-xp ffffe000 00:00 0
[-] No suitable scribble zone could be found. Aborting.
wrapper: writing checkpoint image
wrapper: starting ./freeze chkpoint 30742
Ignoring map - in kernel space.
Error parsing map: 08048000-081d5000 r-xp 00000000 fd:01 9830463 /named/BOINC/slots/2/cmsearch
Ignoring map - in kernel space.
Error parsing map: 081d5000-081d8000 rwxp 0018c000 fd:01 9830463 /named/BOINC/slots/2/cmsearch
Ignoring map - in kernel space.
Error parsing map: 081d8000-08206000 rwxp 081d8000 00:00 0
Ignoring map - in kernel space.
Error parsing map: 08cdb000-08dfb000 rwxp 08cdb000 00:00 0 [heap]
Ignoring map - in kernel space.
Error parsing map: f4f52000-f7a78000 rwxp f4f52000 00:00 0
Ignoring map - in kernel space.
Error parsing map: f7a78000-f7d02000 rwxp f7eb5000 00:00 0
Ignoring map - in kernel space.
Error parsing map: f7ed7000-f7f4d000 rwxp f7ed7000 00:00 0
Ignoring map - in kernel space.
Error parsing map: ffe3e000-ffe53000 rw-p 7ffffffea000 00:00 0 [stack]
Ignoring map - in kernel space.
Error parsing map: ffffe000-fffff000 r-xp ffffe000 00:00 0
[-] No suitable scribble zone could be found. Aborting.
13:46:24 (30626): called boinc_finish
</stderr_txt>
]]>
Könnte man den ganzen Vorgang irgendwie nach solch einem Auftreten nochmal manuell mit ein paar mehr Debug Informationen starten?
Da scheint mir doch irgendwo ein Wurm drin zu stecken.
Hmm... hier ist noch eine http://www.rnaworld.de/rnaworld/workuni ... id=2128754
Interessanterweise wurde hier freeze offensichtlich zweimal hintereinander aufgerufen. Könnte das die Ursache für die mehrfache Ausgabe im Ergebnisfile sein?
<core_client_version>6.6.41</core_client_version>
<![CDATA[
<stderr_txt>
RNA World wrapper v0.04
wrapper: no checkpoint file found
wrapper: running unzip (-o graphics.zip)
wrapper: no checkpoint file found
wrapper: running unzip (-o in.zip)
wrapper: no checkpoint file found
wrapper: running unzip_cpufeat (cmsearch.zip)
wrapper: no checkpoint file found
wrapper: running cmsearch (--forecast 1 cmfile in)
forecast.txt found.
wrapper: no checkpoint file found
wrapper: running cmsearch (-o out cmfile in)
forecast.txt found.
wrapper: writing checkpoint image
wrapper: starting ./freeze chkpoint 30742
Ignoring map - in kernel space.
Error parsing map: 08048000-081d5000 r-xp 00000000 fd:01 9830463 /named/BOINC/slots/2/cmsearch
Ignoring map - in kernel space.
Error parsing map: 081d5000-081d8000 rwxp 0018c000 fd:01 9830463 /named/BOINC/slots/2/cmsearch
Ignoring map - in kernel space.
Error parsing map: 081d8000-08206000 rwxp 081d8000 00:00 0
Ignoring map - in kernel space.
Error parsing map: 08cdb000-08ded000 rwxp 08cdb000 00:00 0 [heap]
Ignoring map - in kernel space.
Error parsing map: f4f52000-f7a78000 rwxp f4f52000 00:00 0
Ignoring map - in kernel space.
Error parsing map: f7a78000-f7d02000 rwxp f7eb5000 00:00 0
Ignoring map - in kernel space.
Error parsing map: f7ed7000-f7f4d000 rwxp f7ed7000 00:00 0
Ignoring map - in kernel space.
Error parsing map: ffe3e000-ffe53000 rw-p 7ffffffea000 00:00 0 [stack]
Ignoring map - in kernel space.
Error parsing map: ffffe000-fffff000 r-xp ffffe000 00:00 0
[-] No suitable scribble zone could be found. Aborting.
wrapper: writing checkpoint image
wrapper: starting ./freeze chkpoint 30742
Ignoring map - in kernel space.
Error parsing map: 08048000-081d5000 r-xp 00000000 fd:01 9830463 /named/BOINC/slots/2/cmsearch
Ignoring map - in kernel space.
Error parsing map: 081d5000-081d8000 rwxp 0018c000 fd:01 9830463 /named/BOINC/slots/2/cmsearch
Ignoring map - in kernel space.
Error parsing map: 081d8000-08206000 rwxp 081d8000 00:00 0
Ignoring map - in kernel space.
Error parsing map: 08cdb000-08dfb000 rwxp 08cdb000 00:00 0 [heap]
Ignoring map - in kernel space.
Error parsing map: f4f52000-f7a78000 rwxp f4f52000 00:00 0
Ignoring map - in kernel space.
Error parsing map: f7a78000-f7d02000 rwxp f7eb5000 00:00 0
Ignoring map - in kernel space.
Error parsing map: f7ed7000-f7f4d000 rwxp f7ed7000 00:00 0
Ignoring map - in kernel space.
Error parsing map: ffe3e000-ffe53000 rw-p 7ffffffea000 00:00 0 [stack]
Ignoring map - in kernel space.
Error parsing map: ffffe000-fffff000 r-xp ffffe000 00:00 0
[-] No suitable scribble zone could be found. Aborting.
13:46:24 (30626): called boinc_finish
</stderr_txt>
]]>
Re: completed, marked as invalid
Ich vermute, dass es an irgend einer lib bei dir liegt, die auf anderen Linux'en eine andere Version hat. In Deinen results gibt es leichte Unterschiede zu den validen Results:
WUid: 2180367
WUid: 2185247
Kannst Du mal versuchen auf einem der anfälligsten Rechnern die neuste Boincversion zu nehmen?
Welches Linux läuft bei Dir und wann hast Du das das letzte Mal aktualisiert?
yoyo
WUid: 2180367
Code: Alles auswählen
> diff *0_0 *2_0
1452c1452
< Score = 20.33, E = 0.2679, P = 1.552e-07, GC = 58
---
> Score = 20.33, E = 0.2679, P = 1.552e-07, GC = 57
Code: Alles auswählen
> diff *0
1977c1977
< Score = 22.91, E = 0.03844, P = 2.257e-08, GC = 58
---
> Score = 22.91, E = 0.03844, P = 2.257e-08, GC = 57
Welches Linux läuft bei Dir und wann hast Du das das letzte Mal aktualisiert?
yoyo
Re: completed, marked as invalid
Der Host mit den meisten Fehlern ist der 4125. Das ist ein Xeon Quad mit einem aktuellen RedHat Enterprise 5.5 mit einem 2.6.18 64bit Kernel.
Bisher lief darauf ein Boinc 6.6.41, was mit anderen Projekten keinerlei Probleme hat. Ich habe die ältere Version, da die neuere mit den Debian Servern (einige der anderen Hosts) nicht läuft.
Diesen Host habe ich nun mit der aktuellen Version (6.10.56) versehen und werde beobachten, ob die Fehler trotzdem noch auftreten.
Bisher lief darauf ein Boinc 6.6.41, was mit anderen Projekten keinerlei Probleme hat. Ich habe die ältere Version, da die neuere mit den Debian Servern (einige der anderen Hosts) nicht läuft.
Diesen Host habe ich nun mit der aktuellen Version (6.10.56) versehen und werde beobachten, ob die Fehler trotzdem noch auftreten.
Re: completed, marked as invalid
Bis jetzt ist es nach dem Update zu keinen invaliden WUs mehr gekommen.
Ich fürchte, das schreit nach einem weiteren Hinweis, welche Voraussetzungen für dieses Projekt zu beachten sind.
Ich fürchte, das schreit nach einem weiteren Hinweis, welche Voraussetzungen für dieses Projekt zu beachten sind.
- Michael H.W. Weber
- Vereinsvorstand
- Beiträge: 22435
- Registriert: 07.01.2002 01:00
- Wohnort: Marpurk
- Kontaktdaten:
Re: completed, marked as invalid
Gerne. Und was soll da nun konkret hingeschrieben werden?
Michael.
Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.
http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B
http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B