Hallo zusammen,
nach langer Abstinenz wollte ich mal testen, ob Ihr inzwischen Checkpointing oder etwas ähnliches in Eure Anwendungen integrieren konntet.
Nu hab ich direkt ein Monster erwischt, daß nach 4 Tagen Laufzeit noch 104 Resttage meldet, die Deadline aber ist bereits am 16.03 erreicht.
Wie gehen wir damit um ? Abbrechen oder nicht ?
Uups, hat sich schon erledigt: Postponed: VM Hypervisor falied to enter an online state in a timely Fashion
Auf der Maschine laufen 6 Atlas parallel plus RNA-World; von 32 GB ist ca 50% frei, so, wo ist das Problem ?
Äähh, gegen VirtualBox 5.0.14 habt ihr hoffentlich nix einzuwenden ?
Deadline
Deadline
Supporting BOINC, a great concept !
- Michael H.W. Weber
- Vereinsvorstand
- Beiträge: 22435
- Registriert: 07.01.2002 01:00
- Wohnort: Marpurk
- Kontaktdaten:
Re: Deadline
Ja, haben wir seit einigen Jahren drin und zwar universell für alle existierenden und zukünftigen Apps auf Basis von Virtualbox.Yeti hat geschrieben:nach langer Abstinenz wollte ich mal testen, ob Ihr inzwischen Checkpointing oder etwas ähnliches in Eure Anwendungen integrieren konntet.
Da die Laufzeitvorhersage aufgrund der integrierten wissenschaftlichen Applikation nicht zuverlässig sein kann, haben wir eine "auto extension" integriert, d.h. eine automatische Abgabefristverlängerung. Will heissen: Wird die angegebene "deadline" erreicht, meldet der Client dem Server, dass er noch an der Aufgabe zu tun hat und dann verlängert der Server die "deadline" automatisch. Leider kannn der Server die neu angesetzte Deadline nicht an den Client zurückmelden. Dies alles funktioniert so lange, wie die betreffende Maschine nach Ablauf der initialen Abgabefrist (im Client angezeigt) wenigstens alle 2 Wochen einmal Online ist (sonst können keine "trickle up messages" gesandt werden).Yeti hat geschrieben:Nu hab ich direkt ein Monster erwischt, daß nach 4 Tagen Laufzeit noch 104 Resttage meldet, die Deadline aber ist bereits am 16.03 erreicht.
Hmm, das weiss ich ehrlich gesagt auch nicht.Yeti hat geschrieben:Uups, hat sich schon erledigt: Postponed: VM Hypervisor falied to enter an online state in a timely Fashion
Auf der Maschine laufen 6 Atlas parallel plus RNA-World; von 32 GB ist ca 50% frei, so, wo ist das Problem ?
Wie hast Du das Schreibintervall auf die HD gesetzt? Da rödeln jetzt 7 heftigste Tasks I/O auf die Platte - im schlimmsten Fall alle 10 Minuten und das bedeutet je nach Startzeit der WUs auch überlappend...
Nein, wir haben als Einstand für 2016 den Wrapper auf die neuste Virtualbox-Version aktualisiert. Es gab danach noch ein paar von uns zunächt unentdeckte Probleme, die aber nach meinem Kenntnisstand inzwischen alle ausgeräumt sind. Ansonsten wird Christian sich hierzu sicher nochmal zu Wort melden...Yeti hat geschrieben:Äähh, gegen VirtualBox 5.0.14 habt ihr hoffentlich nix einzuwenden ?
Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.
http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B
http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B
Re: Deadline
Das sollte bei mir kein Problem sein, meine Clients gehen permanent onlineMichael H.W. Weber hat geschrieben: Dies alles funktioniert so lange, wie die betreffende Maschine nach Ablauf der initialen Abgabefrist (im Client angezeigt) wenigstens alle 2 Wochen einmal Online ist (sonst können keine "trickle up messages" gesandt werden).
HM, hab BOINC eine eigene, exklusive SSD spendiert, die sollte damit keine Probleme haben, so hoffe ich zumindest. Das Intervall zum Checkpointen steht auf 1039 Sekunden.Michael H.W. Weber hat geschrieben:Hmm, das weiss ich ehrlich gesagt auch nicht.Yeti hat geschrieben:Uups, hat sich schon erledigt: Postponed: VM Hypervisor falied to enter an online state in a timely Fashion
Auf der Maschine laufen 6 Atlas parallel plus RNA-World; von 32 GB ist ca 50% frei, so, wo ist das Problem ?
Wie hast Du das Schreibintervall auf die HD gesetzt? Da rödeln jetzt 7 heftigste Tasks I/O auf die Platte - im schlimmsten Fall alle 10 Minuten und das bedeutet je nach Startzeit der WUs auch überlappend...
Ach ja, ich hab sonst einen CMS-Task (oder einen vLHC-CMS-Task) zusätzlich laufen, eigentlich funktioniert das so gut, daß ich die Maschine noch normal zum Arbeiten benutzen kann
Gruss Yeti
Supporting BOINC, a great concept !
- Michael H.W. Weber
- Vereinsvorstand
- Beiträge: 22435
- Registriert: 07.01.2002 01:00
- Wohnort: Marpurk
- Kontaktdaten:
Re: Deadline
Meine Herren! Wenn ich mir Deine Signatur ansehe, kommen Fragen auf, wie Du diesen enormen Beitrag für ATLAS (und vLHC) hinbekommen hast. Der helle Wahnsinn! Hast Du da ein ganzes Rechenzentrum an der Hand? Dich würde ich gerne für unser Team abwerben...
Michael.
Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.
http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B
http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B
Re: Deadline
HM, das kommt auf den Blickwinkel an. Aus der Sicht eines "normalen" Crunchers sieht das tatsächlich so aus, Fakt ist einfach, daß ich meine gesamte Firma mit BOINC durchsetzt habe (ist leider nur eine kleine Firma).Michael H.W. Weber hat geschrieben:Meine Herren! Wenn ich mir Deine Signatur ansehe, kommen Fragen auf, wie Du diesen enormen Beitrag für ATLAS und vLHC hinbekommen hast. Der helle Wahnsinn! Hast Du da ein ganzes Rechenzentrum an der Hand?
Michael.
Der LHC ist mein absolutes Lieblings-Projekt, bei allen LHC-Projekten war ich früh dabei (ausser B-LHC).
Ja, und Atlas ist so eine eigene Geschichte: Mit dem Resourcenhunger war es endlich ein Projekt, was aus meinen Maschinen endlich mal gescheit was rausholte, nicht immer nur so ein bißchen Hauptspeicher. Und seit mich das Atlas-Fieber gepackt hat, wird halt hier die Priorität auf Atlas gesetzt. Mehr Hauptspeicher wurde angeschafft, Windows als 64Bit-Version installiert usw.
Phasenweise durfte ich bei Atlas das Feld im RAC anführen, inzwischen wurde ich wieder auf Platz 3 im RAC und Platz 2 im GesamtCredit verwiesen. Und gegen die Resourcen der vor mir liegenden Power-Cruncher komme selbst ich nicht an
Gruss Yeti
Supporting BOINC, a great concept !