Redundante Ergebnisse

Alles zum Projekt RNA World
Nachricht
Autor
Sabroe@P3D
PDA-Benutzer
PDA-Benutzer
Beiträge: 32
Registriert: 13.09.2010 21:37
Wohnort: Castrop-Rauxel

Redundante Ergebnisse

#1 Ungelesener Beitrag von Sabroe@P3D » 13.09.2010 21:42

Moin zusammen
http://www.rnaworld.de/rnaworld/workuni ... id=2790138

>15 Stunden dran gerechnet. Innerhalb der Deadline hochgeladen. Als fünftes Ergebnis dieser WU abgegeben - und doch als redundantes Ergebnis gewertet??? :crying:
die "max# of sucess liegt bei 6.

Ich hätte diesen Vorgang bitte mal erklärt bekommen.
Gruß Michael

Benutzeravatar
yoyo
Vereinsvorstand
Vereinsvorstand
Beiträge: 8134
Registriert: 17.12.2002 14:09
Wohnort: Berlin

Re: Redundante Ergebnisse

#2 Ungelesener Beitrag von yoyo » 13.09.2010 21:50

Laut stderr Deines results wurde dieses mehrfach Restartet. Beim letzten Restart merkte Boinc, dass das Projekt dieses Result eigentlich nicht mehr braucht und begann nicht von vorne, sondern brach die WU ab.

yoyo
HILF mit im Rechenkraft-WiKi, dies gibts zu tun.
Wiki - FAQ - Verein - Chat

Bild Bild

Sabroe@P3D
PDA-Benutzer
PDA-Benutzer
Beiträge: 32
Registriert: 13.09.2010 21:37
Wohnort: Castrop-Rauxel

Re: Redundante Ergebnisse

#3 Ungelesener Beitrag von Sabroe@P3D » 13.09.2010 22:10

<core_client_version>6.10.58</core_client_version>
<![CDATA[
<message>
aborted by project - no longer usable
</message>
<stderr_txt>
RNA World wrapper v0.04
wrapper: no checkpoint file found
wrapper: running unzip (-o graphics.zip)
wrapper: no checkpoint file found
wrapper: running unzip (-o in.zip)
wrapper: no checkpoint file found
wrapper: running unzip_cpufeat (cmsearch.zip)
wrapper: no checkpoint file found
wrapper: running cmsearch (--forecast 1 -T 0.0 --fil-T-hmm 0.0 --fil-T-qdb 0.0
cmfile in)
forecast.txt found.
wrapper: no checkpoint file found
wrapper: running cmsearch (-o out -T 0.0 --fil-T-hmm 0.0 --fil-T-qdb 0.0
cmfile in)
forecast.txt found.
wrapper: windows. no checkpoint image
...
wrapper: windows. no checkpoint image
app exit status: 0xc000013a
03:26:56 (380): called boinc_finish
RNA World wrapper v0.04
wrapper: no checkpoint file found
wrapper: running cmsearch (-o out -T 0.0 --fil-T-hmm 0.0 --fil-T-qdb 0.0
cmfile in)
forecast.txt found.
wrapper: windows. no checkpoint image
.....
.....
wrapper: windows. no checkpoint image

</stderr_txt>
]]>

Wenn ich das richtig sehe ist die WU einmal nach ~3,5 Stunden unterbrochen worden (vermutlich wegen Speichermangel, sind nur 3 Gb drin) und dann 12 Stunden weitergelaufen. Passt das?

Benutzeravatar
mxplm
Partikel-Strecker
Partikel-Strecker
Beiträge: 966
Registriert: 14.09.2009 13:56
Wohnort: Bielefeld

Re: Redundante Ergebnisse

#4 Ungelesener Beitrag von mxplm » 14.09.2010 00:08

Sabroe@P3D hat geschrieben:Wenn ich das richtig sehe ist die WU einmal nach ~3,5 Stunden unterbrochen worden (vermutlich wegen Speichermangel, sind nur 3 Gb drin) und dann 12 Stunden weitergelaufen. Passt das?
Wenn eine WU wegen zu wenig Speicher abgebrochen wird, ist das normalerweise ein Berechnungsfehler. Die WU wird also abgebrochen.

Der entscheidende Punkt bei dir ist: Die WU wurde irgendwann angehalten (weil der PC heruntergefahren wurde, BOINC aus war oder weil ein anderee Task dran kam und die Einstellung "Leave in Memory" nicht aktiviert war). Da RNA World keine Checkpoints unterstützt (bzw. nur unter Linux 32 Bit), wird die WU beim nächsten Start komplett von vorne angefangen. Und da kam eben der Server und hat Bescheid gesagt, dass dein Client damit jetzt gar nicht anzufangen braucht, denn das Result hat er ja schon validiert. Siehe RNA World FAQ: Checkpointing
:Wiki-Benutzerseite: (Über mich)
:fold.it: (Helfen durch Zocken)

Sabroe@P3D
PDA-Benutzer
PDA-Benutzer
Beiträge: 32
Registriert: 13.09.2010 21:37
Wohnort: Castrop-Rauxel

Re: Redundante Ergebnisse

#5 Ungelesener Beitrag von Sabroe@P3D » 14.09.2010 15:48

mxplm hat geschrieben:
Sabroe@P3D hat geschrieben:Wenn ich das richtig sehe ist die WU einmal nach ~3,5 Stunden unterbrochen worden (vermutlich wegen Speichermangel, sind nur 3 Gb drin) und dann 12 Stunden weitergelaufen. Passt das?
Wenn eine WU wegen zu wenig Speicher abgebrochen wird, ist das normalerweise ein Berechnungsfehler. Die WU wird also abgebrochen.

Der entscheidende Punkt bei dir ist: Die WU wurde irgendwann angehalten (weil der PC heruntergefahren wurde, BOINC aus war oder weil ein anderee Task dran kam und die Einstellung "Leave in Memory" nicht aktiviert war). Da RNA World keine Checkpoints unterstützt (bzw. nur unter Linux 32 Bit), wird die WU beim nächsten Start komplett von vorne angefangen. Und da kam eben der Server und hat Bescheid gesagt, dass dein Client damit jetzt gar nicht anzufangen braucht, denn das Result hat er ja schon validiert. Siehe RNA World FAQ: Checkpointing
Ich möchte Dir an dieser Stelle wiedersprechen: 1) "Leave App.. in memory" ist bei mir immer eingeschaltet 2) Die WU war im BM als"hoch geladen und meldebereit" angezeigt worden mit Berechnungszeit >15h 3) Die Unterbrechung war nach (lt. sterr.out) 3,5 Stunden, danach lief die WU nochmals 11,5 h bis zur erfolgreichen Beendigung.
Es geht mir hier nicht darum ~500 Cr nachgereicht zu bekommen sondern um die Sache. Es ist nicht so das dieses Problem einmalig ist: http://www.rnaworld.de/rnaworld/results ... =0&state=5. Dort sind 8 WUs durch den Server als redundant gemarkt worden obwohl Rechenzeit angelaufen war. Ob diese Ergebnisse korrekt waren kann ich von hier aus nicht nachvollziehen.
Das Problem scheint bei mir nur 2 Rechner zu betreffen, i7 920@stock HT on mit 3 Gb Ram. Diese werde ich nun die restlichen Aufgaben fertig rechnen lassen und dann von RNA schweren Herzens abziehen. Hat kein Zweck.
Gruß Sabroe

Benutzeravatar
magihatfertig
Vereinsmitglied
Vereinsmitglied
Beiträge: 240
Registriert: 29.04.2006 13:41
Wohnort: Der Blaue Planet

Re: Redundante Ergebnisse

#6 Ungelesener Beitrag von magihatfertig » 14.09.2010 16:05

Die Flinte ins Korn werfen bevor sich ein Projektleiter ausführlich zu deinen Angaben geäußert hat :roll:
Ich bin sicher auch für dieses Problem wird uns Michael schon bald in gewohnt ausführlicher Art und Weise eine Lösung präsentieren :attention: :wave:

Benutzeravatar
Norman
Klimawolke
Klimawolke
Beiträge: 2188
Registriert: 20.03.2003 14:34
Wohnort: Saarland

Re: Redundante Ergebnisse

#7 Ungelesener Beitrag von Norman » 14.09.2010 16:20

na wenn ich mir mal so das sendedatum/-zeit anschaue:

Code: Alles auswählen

13 Sep 2010 17:15:00 UTC      13 Sep 2010 17:20:37 UTC
dann ist bei allen WU auffällig, dass sie in 5 minuten gemeldet wurden.
da einige aber korrekt begonnen wurden, mal verdrängt, mal begonnen, mal verdrängt ..... hätte der server sie dürfen nicht als redundant result markieren dürfen.
das stimmt.
da müsste Uwe mal drüber schauen.

Sabroe@P3D
PDA-Benutzer
PDA-Benutzer
Beiträge: 32
Registriert: 13.09.2010 21:37
Wohnort: Castrop-Rauxel

Re: Redundante Ergebnisse

#8 Ungelesener Beitrag von Sabroe@P3D » 14.09.2010 16:37

Ich hoffe sehr das da noch mal einer drüberschaut. Aber im P3D Forum hat Michael schon auf diesen Fred verwiesen. Scheint so als ob für ihn der Fall erledigt wäre.
Gruß Sabroe

Benutzeravatar
Norman
Klimawolke
Klimawolke
Beiträge: 2188
Registriert: 20.03.2003 14:34
Wohnort: Saarland

Re: Redundante Ergebnisse

#9 Ungelesener Beitrag von Norman » 14.09.2010 16:44

Michael ist ja auch wissenschaftler und kein serverguru ;)
yoyo wird sich das problem später bestimmt genauer ansehen.

ChristianB
Admin
Admin
Beiträge: 1920
Registriert: 23.02.2010 22:12

Re: Redundante Ergebnisse

#10 Ungelesener Beitrag von ChristianB » 14.09.2010 17:25

Was hier ganz klar aus dem stderr Protokoll hervorgeht ist das die WU in deinem speziellen Fall nach 3,5 h mit einem Fehler abgebrochen wurde (app exit status: 0xc000013a) Das wurde dem Client auch per boinc_finish mitgeteilt. Dieser hat aber gedacht die Anwendung ist erfolgreich beendet worden (weil wahrscheinlich boinc_finish(0) aufgerufen wurde) und hat die WU neu gestartet (Fehlermeldung ist normalerweise: Output file Dateiname for task WU-Name absent). Beim nächsten Kontakt des Clients mit dem rna-Server hat der Client die Info bekommen das bereits mind. 2 erfolgreiche Results eingegangen sind und die aktuelle Berechnung nicht mehr benötigt wird (Outcome: Redundant result, Client state: Cancelled by server). Daraufhin hat dein Client diese WU abgebrochen und die WU als hochgeladen und meldebereit markiert (obwohl in dem Moment nichts hochzuladen war).

Weitere Hinweise sind im entsprechenden Client-Log (stdoutdae) zu finden.

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22954
Registriert: 07.01.2002 01:00
Wohnort: Marpurk

Re: Redundante Ergebnisse

#11 Ungelesener Beitrag von Michael H.W. Weber » 14.09.2010 17:55

Sabroe@P3D hat geschrieben:Ich hoffe sehr das da noch mal einer drüberschaut. Aber im P3D Forum hat Michael schon auf diesen Fred verwiesen. Scheint so als ob für ihn der Fall erledigt wäre.
Keine Sorge, ich kriege die Dinge durchaus mit und kümmere mich auch drum, dass Lösungen herbei kommen, soweit ich das veranlassen kann. Yoyo ist informiert. Er hat aber bis einschließlich Sonntag Urlaub. Übrigens schon seit gestern Früh und dennoch hat er sich hier eingebracht. Also das nenne ich durchaus Support. :D

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

Bild Bild

Benutzeravatar
yoyo
Vereinsvorstand
Vereinsvorstand
Beiträge: 8134
Registriert: 17.12.2002 14:09
Wohnort: Berlin

Re: Redundante Ergebnisse

#12 Ungelesener Beitrag von yoyo » 14.09.2010 20:12

ChristianB hat geschrieben:Was hier ganz klar aus dem stderr Protokoll hervorgeht ist das die WU in deinem speziellen Fall nach 3,5 h mit einem Fehler abgebrochen wurde (app exit status: 0xc000013a) Das wurde dem Client auch per boinc_finish mitgeteilt. Dieser hat aber gedacht die Anwendung ist erfolgreich beendet worden (weil wahrscheinlich boinc_finish(0) aufgerufen wurde) und hat die WU neu gestartet (Fehlermeldung ist normalerweise: Output file Dateiname for task WU-Name absent). Beim nächsten Kontakt des Clients mit dem rna-Server hat der Client die Info bekommen das bereits mind. 2 erfolgreiche Results eingegangen sind und die aktuelle Berechnung nicht mehr benötigt wird (Outcome: Redundant result, Client state: Cancelled by server). Daraufhin hat dein Client diese WU abgebrochen und die WU als hochgeladen und meldebereit markiert (obwohl in dem Moment nichts hochzuladen war).

Weitere Hinweise sind im entsprechenden Client-Log (stdoutdae) zu finden.
So sehe ich das auch, was ich versuchte oben auch zu schreiben.
yoyo
HILF mit im Rechenkraft-WiKi, dies gibts zu tun.
Wiki - FAQ - Verein - Chat

Bild Bild

Zurück zu „RNA World Diskussionen (deutsch)“