Deadline

Alles zum Projekt RNA World
Nachricht
Autor
Benutzeravatar
Yeti
Oberprojektler
Oberprojektler
Beiträge: 1917
Registriert: 01.04.2008 21:15
Kontaktdaten:

Deadline

#1 Ungelesener Beitrag von Yeti » 01.03.2016 19:14

Hallo zusammen,

nach langer Abstinenz wollte ich mal testen, ob Ihr inzwischen Checkpointing oder etwas ähnliches in Eure Anwendungen integrieren konntet.

Nu hab ich direkt ein Monster erwischt, daß nach 4 Tagen Laufzeit noch 104 Resttage meldet, die Deadline aber ist bereits am 16.03 erreicht.

Wie gehen wir damit um ? Abbrechen oder nicht ?

Uups, hat sich schon erledigt: Postponed: VM Hypervisor falied to enter an online state in a timely Fashion

Auf der Maschine laufen 6 Atlas parallel plus RNA-World; von 32 GB ist ca 50% frei, so, wo ist das Problem ?

Äähh, gegen VirtualBox 5.0.14 habt ihr hoffentlich nix einzuwenden ?
Bild

Supporting BOINC, a great concept !

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22419
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Deadline

#2 Ungelesener Beitrag von Michael H.W. Weber » 02.03.2016 13:23

Yeti hat geschrieben:nach langer Abstinenz wollte ich mal testen, ob Ihr inzwischen Checkpointing oder etwas ähnliches in Eure Anwendungen integrieren konntet.
Ja, haben wir seit einigen Jahren drin und zwar universell für alle existierenden und zukünftigen Apps auf Basis von Virtualbox.
Yeti hat geschrieben:Nu hab ich direkt ein Monster erwischt, daß nach 4 Tagen Laufzeit noch 104 Resttage meldet, die Deadline aber ist bereits am 16.03 erreicht.
Da die Laufzeitvorhersage aufgrund der integrierten wissenschaftlichen Applikation nicht zuverlässig sein kann, haben wir eine "auto extension" integriert, d.h. eine automatische Abgabefristverlängerung. Will heissen: Wird die angegebene "deadline" erreicht, meldet der Client dem Server, dass er noch an der Aufgabe zu tun hat und dann verlängert der Server die "deadline" automatisch. Leider kannn der Server die neu angesetzte Deadline nicht an den Client zurückmelden. Dies alles funktioniert so lange, wie die betreffende Maschine nach Ablauf der initialen Abgabefrist (im Client angezeigt) wenigstens alle 2 Wochen einmal Online ist (sonst können keine "trickle up messages" gesandt werden).
Yeti hat geschrieben:Uups, hat sich schon erledigt: Postponed: VM Hypervisor falied to enter an online state in a timely Fashion

Auf der Maschine laufen 6 Atlas parallel plus RNA-World; von 32 GB ist ca 50% frei, so, wo ist das Problem ?
Hmm, das weiss ich ehrlich gesagt auch nicht.
Wie hast Du das Schreibintervall auf die HD gesetzt? Da rödeln jetzt 7 heftigste Tasks I/O auf die Platte - im schlimmsten Fall alle 10 Minuten und das bedeutet je nach Startzeit der WUs auch überlappend...
Yeti hat geschrieben:Äähh, gegen VirtualBox 5.0.14 habt ihr hoffentlich nix einzuwenden ?
Nein, wir haben als Einstand für 2016 den Wrapper auf die neuste Virtualbox-Version aktualisiert. Es gab danach noch ein paar von uns zunächt unentdeckte Probleme, die aber nach meinem Kenntnisstand inzwischen alle ausgeräumt sind. Ansonsten wird Christian sich hierzu sicher nochmal zu Wort melden...

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Benutzeravatar
Yeti
Oberprojektler
Oberprojektler
Beiträge: 1917
Registriert: 01.04.2008 21:15
Kontaktdaten:

Re: Deadline

#3 Ungelesener Beitrag von Yeti » 02.03.2016 15:00

Michael H.W. Weber hat geschrieben: Dies alles funktioniert so lange, wie die betreffende Maschine nach Ablauf der initialen Abgabefrist (im Client angezeigt) wenigstens alle 2 Wochen einmal Online ist (sonst können keine "trickle up messages" gesandt werden).
Das sollte bei mir kein Problem sein, meine Clients gehen permanent online
Michael H.W. Weber hat geschrieben:
Yeti hat geschrieben:Uups, hat sich schon erledigt: Postponed: VM Hypervisor falied to enter an online state in a timely Fashion

Auf der Maschine laufen 6 Atlas parallel plus RNA-World; von 32 GB ist ca 50% frei, so, wo ist das Problem ?
Hmm, das weiss ich ehrlich gesagt auch nicht.
Wie hast Du das Schreibintervall auf die HD gesetzt? Da rödeln jetzt 7 heftigste Tasks I/O auf die Platte - im schlimmsten Fall alle 10 Minuten und das bedeutet je nach Startzeit der WUs auch überlappend...
HM, hab BOINC eine eigene, exklusive SSD spendiert, die sollte damit keine Probleme haben, so hoffe ich zumindest. Das Intervall zum Checkpointen steht auf 1039 Sekunden.

Ach ja, ich hab sonst einen CMS-Task (oder einen vLHC-CMS-Task) zusätzlich laufen, eigentlich funktioniert das so gut, daß ich die Maschine noch normal zum Arbeiten benutzen kann

Gruss Yeti
Bild

Supporting BOINC, a great concept !

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22419
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Deadline

#4 Ungelesener Beitrag von Michael H.W. Weber » 02.03.2016 15:05

Meine Herren! Wenn ich mir Deine Signatur ansehe, kommen Fragen auf, wie Du diesen enormen Beitrag für ATLAS (und vLHC) hinbekommen hast. Der helle Wahnsinn! Hast Du da ein ganzes Rechenzentrum an der Hand? Dich würde ich gerne für unser Team abwerben... :lol:

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Benutzeravatar
Yeti
Oberprojektler
Oberprojektler
Beiträge: 1917
Registriert: 01.04.2008 21:15
Kontaktdaten:

Re: Deadline

#5 Ungelesener Beitrag von Yeti » 02.03.2016 15:16

Michael H.W. Weber hat geschrieben:Meine Herren! Wenn ich mir Deine Signatur ansehe, kommen Fragen auf, wie Du diesen enormen Beitrag für ATLAS und vLHC hinbekommen hast. Der helle Wahnsinn! Hast Du da ein ganzes Rechenzentrum an der Hand? :lol:

Michael.
HM, das kommt auf den Blickwinkel an. Aus der Sicht eines "normalen" Crunchers sieht das tatsächlich so aus, Fakt ist einfach, daß ich meine gesamte Firma mit BOINC durchsetzt habe (ist leider nur eine kleine Firma).

Der LHC ist mein absolutes Lieblings-Projekt, bei allen LHC-Projekten war ich früh dabei (ausser B-LHC).

Ja, und Atlas ist so eine eigene Geschichte: Mit dem Resourcenhunger war es endlich ein Projekt, was aus meinen Maschinen endlich mal gescheit was rausholte, nicht immer nur so ein bißchen Hauptspeicher. Und seit mich das Atlas-Fieber gepackt hat, wird halt hier die Priorität auf Atlas gesetzt. Mehr Hauptspeicher wurde angeschafft, Windows als 64Bit-Version installiert usw.

Phasenweise durfte ich bei Atlas das Feld im RAC anführen, inzwischen wurde ich wieder auf Platz 3 im RAC und Platz 2 im GesamtCredit verwiesen. Und gegen die Resourcen der vor mir liegenden Power-Cruncher komme selbst ich nicht an

Gruss Yeti
Bild

Supporting BOINC, a great concept !

Antworten

Zurück zu „RNA World Diskussionen (deutsch)“