Ständig Probleme mit Atlas- und Lattice-WUs

Probleme mit einem Clientprogramm? Oder einen Tipp dazu? Dann hier posten...
Nachricht
Autor
Benutzeravatar
Stimpy
Team-Joker
Team-Joker
Beiträge: 342
Registriert: 12.03.2011 11:00
Wohnort: Bochum

Ständig Probleme mit Atlas- und Lattice-WUs

#1 Ungelesener Beitrag von Stimpy » 13.01.2016 12:56

Beide Projekte verursachen ähnliche Probleme, die sich ständig wiederholen:

Atlas beißt sich gerne mal an einen ganzen Schwung WU´s fest (aktuell über 15 Stunden). Die Fortschritt-Anzeige steigt immer langsamer in 0,001 Prozent-Schritten, obwohl 99,8% schon erreicht sind. Als zweites Phänomen kommt hinzu: wenn 6 oder mehr WU´s gleichzeitig bearbeitet werden pausiert ein Teil der Anwendungen und meldet "warten auf Speicher". Die Auslastung des Ram steigt aber nicht über 3,8Gb, obwohl 16Gb vorhanden sind. Ram-Tests habe ich durchgeführt, alles io. Starte ich andere Programme, wie Spiele, steigt die Ram-Ausnutzung normal.

Lattice hängt ebenfalls öfters. Alle WU´s auf 3 Rechnern stehen aktuell bei 11,75%. Bis auf eine habe ich alle angehalten, diese läuft seit mitlerweile 75 Stunden.

Was kann man tun, sind alle WU´s fehlerhaft? Abbrechen?
Ich bekomme ständig solche WU´s, ist das nur bei mir so?
Muss man damit leben, dass so viele WU´s Schrott sind? Andere Projekte funzen doch auch?
Was könnte das mit dem Ram zu tun haben? (habe Win7 64bit, frisch aufgesetzt mit neuen Treibern und Updates[nicht die optionalen :wink: ])

Grüße
Michael
Bild

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22434
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#2 Ungelesener Beitrag von Michael H.W. Weber » 14.01.2016 08:58

Moin Stimpy, wenn Du mal im ATLAS@home Forum gezielt nach meinen Beiträgen schauen magst, wirst Du feststellen, dass die von Dir beschriebenen Probleme nicht neu sind. Dort findest Du auch allerlei Antworten.

Hier deshalb nur ganz kurz:
Pro WU musst Du 4 GB RAM freihalten, d.h. bei 16 GB kannst Du maxinal (!) 4 WUs parallel rechnen, ohne Ausfälle zu verzeichnen (eigentlich nur 3, da das OS ja auch noch was an Speicher braucht).
WUs, die die normale Laufzeit merklich überschreiten, schaust Du mit dem VirtualBox Toolkit an, ob sie nicht einen "kernel panic" im Screensht melden. Ist das der Fall, kannst Du die WU sofort killen. Sieht sie normal aus und läuft trotzdem quasi 3 Std. mehr als normal, kannst Du sie ebenfalls löschen. Diese sich langsam an 100% anschleichenden WUs werden niemals fertig. Die Ursache des Problems konnte im letzten Jahr trotz systematischer Fehlerursachenkategorisierung nicht identifiziert werden. Aber man ist dran. Den "kernel panic" konnte man schon mal ganz gut in den Griff bekommen.

Wenn Du ein LHC-Projekt laufen lassen möchest, dass absolut "rock stable" läuft, empfehle ich Dir vLHC@home (Test for Theory). Allerdings lässt dies nur zwei WUs parallel zu und benötigt ein permanentes Internet. Dafür hast Du keine Ausfälle und es braucht auch wenig Speicher.
Bei ATLAS@home ist noch diverses im Argen. Ich rechne dort dennoch kontinuierlich mit und probiere, die Fehler zu sammeln und in deren Forum etwas systematischer aufzubereiten, damit es irgendwann so stabil läuft, wie vLHC@home. Ich habe letztes Jahr das gesamte Jahr beide Projekte auf maximaler Priorität durchlaufen lassen - trotz der vielen Ärgernisse. Wichtig ist, die Fehler immer zu melden, sonst wird sich nichts tun. Ich kenne den Programmierer von ATLAS@home und der ist an sich ziemlich fit.

Vieleiecht magst Du ja auch das ATLAS@home Spiel spielen oder zum LHC einen Roman lesen (Klaus Seibel)... :wink:

Michael.

P.S.: Ich habe während meines Urlaubs in Indien ATLAS@home von den Rechnern verbannt - eben wegen der noch bestehenden Unzuverlässigkeiten. Sobald ich zurück bin, geht's weiter...
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Benutzeravatar
Stimpy
Team-Joker
Team-Joker
Beiträge: 342
Registriert: 12.03.2011 11:00
Wohnort: Bochum

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#3 Ungelesener Beitrag von Stimpy » 15.01.2016 18:56

Danke für die Antwort! Auch bei neuen WU´s keine Besserung, nicht eine einzige WU wird fertig. Ich rechne erstmal ein anderes Projekt und versuche es später noch einmal. Ich habe leider nicht die Zeit mich intensiv mit der Materie zu befassen, auch wegen meiner Selbstständigkeit. Ich schaue nur ab und zu, ob der PC noch läuft und nehme ein paar Änderungen vor. Den Rest soll der PC erledigen :wink:

Schön wäre es, wenn man jedem Projekt einzeln eine maximale Anzahl an Kernen zuweisen kann, am besten über den Boinc-Manager. :roll:
Bild

JagDoc
Vereinsmitglied
Vereinsmitglied
Beiträge: 292
Registriert: 03.12.2011 12:05

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#4 Ungelesener Beitrag von JagDoc » 16.01.2016 08:45

Stimpy hat geschrieben: Schön wäre es, wenn man jedem Projekt einzeln eine maximale Anzahl an Kernen zuweisen kann, am besten über den Boinc-Manager. :roll:
Das geht relativ einfach mit einer app_config.xml im Projektordner.

Z.B. für Atlas 3 WUs:

Code: Alles auswählen

<app_config>

<app>
<name>ATLAS</name>
<max_concurrent>3</max_concurrent>
</app>

</app_config>
Danach im Boinc Manager Extras - Konfigurationsdateien neu einlesen. Oder Boinc neu starten.

Wenn der app Name nicht bekannt ist einfach eine app_config.xml ohne Namen erstellen.
Nach dem neu einlesen unter Meldungen nachschauen.
Da ist dann eine Fehlermeldung mit den richtigen App-Namen. Die dann noch einfügen und nochmal einlesen.
Bild

respawner
Vereinsmitglied
Vereinsmitglied
Beiträge: 554
Registriert: 10.12.2007 19:42

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#5 Ungelesener Beitrag von respawner » 16.01.2016 09:45

was blöd ist, und mir schon mehrmals passiert ist, dass der Manager gerne trotzdem viele ATLAS zieht und keine anderen WUs mehr und dann einige Kerne nicht mehr benutzt werden, da der Buffer voll ist mit ATLAS.
Ich habe zwar 32 GB RAM aber mehr als 4 oder 5 VMs (lasse 2 Virtual LHC und 2-3 ATLAS) kann ich nicht laufen lassen, ohne dass der Rechner extrem träge wird. Bei 8 VMs kann ich den PC kaum benutzen obwohl gut 12 GB RAM frei ist/war.

Eine Frage, wollte gerade Lattice-WUs ziehen, aber ich bekomme keine WUs, obwohl 174000 WUs bereit zum versenden sind, aber die Meldung sagt keine WUs für GARLI. Leider steht im Serverstatus nicht welche Plattformen bedient werden könnten, aber bei den Applications steht schon, dass Windows unterstützt wird und dort auch recht viel gerechnet worden ist. Ist das ein Windows 10 Problem. Bzw. bekommt Ihr mit Windows momentan Lattice-WUs?
BildBild

Benutzeravatar
Stimpy
Team-Joker
Team-Joker
Beiträge: 342
Registriert: 12.03.2011 11:00
Wohnort: Bochum

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#6 Ungelesener Beitrag von Stimpy » 16.01.2016 10:36

seitdem die letzten Lattice-WUs Schrott waren bekomm ich auch keine neuen.

@JagDoc: werd ich mal ausprobieren und berichte dann. thx!
Bild

Benutzeravatar
Stimpy
Team-Joker
Team-Joker
Beiträge: 342
Registriert: 12.03.2011 11:00
Wohnort: Bochum

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#7 Ungelesener Beitrag von Stimpy » 17.02.2016 20:34

mit der app_config.xml hat es auf Anhieb geklappt, nach der Rosetta-Challenge werde ich 2 Kerne dauerhaft für Atlas rechnen lassen.
Von Lattice kommen wieder vereinzelt neue WU´s, der Bug ist nicht wieder aufgetreten
Bild

Benutzeravatar
helcoin
PDA-Benutzer
PDA-Benutzer
Beiträge: 46
Registriert: 10.01.2016 22:46
Wohnort: Stuttgart

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#8 Ungelesener Beitrag von helcoin » 24.02.2016 12:34

Meine Erfahrungen mit Atlas und VM sind diese:
1. Auf meinem WIN8 PC laufen die WUs fehlerfrei, ca. 130 bisher erledigt.
2. Auf meinem WIN10 PC laufen sie zu oft ins leere/unendlich, 15 von 25 fehlerhaft. Dort habe ich Atlas verbannt. VirtualLHC läuft problemlos.
Atlas lief früher nur mit einer älteren VM-Version. Jetzt wenigsten auf einem PC mit der aktuellen. Vielleicht hilft - als Test - ein Rückschritt auf diese "unsichere" alte VM.

Der Rechner wird deshalb träge, weil die VM mit Priorität "normal" läuft und nicht auf "niedrig". Ein große Speicher hilft da nicht. Auf die Task-Pri von der VM hat man keinen Einfluss, sie kann leider nicht geändert werden, sonst hätte das BOINC-Team es gemacht.

Lattice habe ich auch wegen zu vieler Probleme wieder entfernt.
Bild
Bild

Benutzeravatar
Stimpy
Team-Joker
Team-Joker
Beiträge: 342
Registriert: 12.03.2011 11:00
Wohnort: Bochum

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#9 Ungelesener Beitrag von Stimpy » 07.03.2016 19:31

Keine Ahnung was da los ist, jede Atlas-WU läuft unendlich, keine einzige wird fertig!
Win7/64, Boinc 7.6.22(64), VBox 5.0.16, Atlas Simulation 1.46
Bild

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22434
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#10 Ungelesener Beitrag von Michael H.W. Weber » 07.03.2016 21:23

Installiere mal die Virtualbox Tools und berichte uns, was die Konsole anzeigt.

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Benutzeravatar
Stimpy
Team-Joker
Team-Joker
Beiträge: 342
Registriert: 12.03.2011 11:00
Wohnort: Bochum

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#11 Ungelesener Beitrag von Stimpy » 07.03.2016 23:38

Michael H.W. Weber hat geschrieben:Installiere mal die Virtualbox Tools und berichte uns, was die Konsole anzeigt.

Michael.
Sorry, verstehe kein Wort. Hab leider null Ahnung von VirtualBox. Ich kann den Manager öffnen und sehe die Sitzungen. 2 werden ausgeführt (vLHC). Viele inaktive/defekte, die ich aber schon manuell entfernt habe.
Bild

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22434
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#12 Ungelesener Beitrag von Michael H.W. Weber » 08.03.2016 11:44

ATLAS-WU anwählen, liinks "zeige VM Konsole" klicken und schauen, ob dort "kernel panic steht". Falls ja, WU abbrechen und Task in deren Forum im zugehörigen Thema berichten.
Die andere Möglichkeit einer ewig laufenden WU ist noch ungeklärt - die Konsole meldet hier Normalität (Login-Screen). Du wirst aber nach einiger Zeit wissen, wie lange die ATLAS WUs normalerweise bei Dir laufen. Wenn die Dauer einer WU sagen wir 2 Std. drüber liegt, abbrechen und WU im Forum bei denen berichten (auch dazu ist von mir ein Themenbereich dort angelegt worden).
Die drei typischen Fehler (zwei davon oben beschrieben) werden nur behoben werden können, wenn man sie umfassend in deren Forum beschreibt und dort "nervt".

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Antworten

Zurück zu „Hilfe und Support“