Ständig Probleme mit Atlas- und Lattice-WUs

Probleme mit einem Clientprogramm? Oder einen Tipp dazu? Dann hier posten...
Nachricht
Autor
Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22435
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#37 Ungelesener Beitrag von Michael H.W. Weber » 17.04.2016 09:05

Michael H.W. Weber hat geschrieben:Könnt ihr das bei euch bestätigen?
Offenbar ein generelles Problem.
Meine Maschinen langweilen sich nun auf einigen Kernen, da aufgrund des "job cache full"-Problems nichts an WUs der anderen Projekte mehr geladen wird.

Was machen die bloß immer wieder mal für eine Scheisse bei ATLAS... :evil:

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Eric
Powerknopf-Verweigerer
Powerknopf-Verweigerer
Beiträge: 1411
Registriert: 07.05.2013 09:24

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#38 Ungelesener Beitrag von Eric » 17.04.2016 10:03

Ich habe ATLAS vor ein einigen Tagen erst einmal auf Eis gelegt. Es vertrug sich nicht mit den anderen Projekten. ATLAS geht, nach meiner momentanigen Erfahrung, eigentlich nur exklusiv auf einem Rechner, dann scheiden die Linux-Büchsen aber aus, weil die trotz 24 GB RAM keine 12 Tasks Atlas abkönnen.
Tja, Zwickmühle.
Bild

respawner
Vereinsmitglied
Vereinsmitglied
Beiträge: 554
Registriert: 10.12.2007 19:42

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#39 Ungelesener Beitrag von respawner » 17.04.2016 10:53

ich habe jetzt auch welche bekommen dort steht zwar was von 3,5 Tagen, aber die ersten waren nach knapp 2 Stunden fertig und bestätigt. Die laufen aber teilweise nur bis 1 oder 1,5%. Keine Ahnung was da wieder nicht stimmt.
BildBild

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22435
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#40 Ungelesener Beitrag von Michael H.W. Weber » 17.04.2016 12:46

Kann ich bestätigen: fertig sind sie nach wenigen Stunden, wie zuvor. Bloss der BOINC-Manager lässt sich mal wieder veräppeln.

@Erich: Bei 24 GB RAM bei 12 Kernen kannst Du 8x ATLAS, 2x vLHC, und 2x was mit wenig RAM-Bedarf laufen lassen (ich habe Rosetta, Universe, LHC@home (WU-Puffer des Servers derzeit wieder leer) laufen).

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Eric
Powerknopf-Verweigerer
Powerknopf-Verweigerer
Beiträge: 1411
Registriert: 07.05.2013 09:24

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#41 Ungelesener Beitrag von Eric » 17.04.2016 15:46

Theoretisch wäre das möglich. Praktisch gibt der Parallelbetrieb mit Atlas nur Probleme. Entweder meint Atlas, dass genügend Arbeit vorhanden wäre und läuft trocken oder die anderen Projekte. Da man mit app_config arbeiten muss, ist das alles doof.
Ich werde meinen Windows Rechner noch mal exklusiv auf Atlas ansetzen, sofern es Arbeit gibt.
Ansonsten will ich eigentlich kein Babysitter spielen.
Bild

Benutzeravatar
maxamd400
Vereinsmitglied
Vereinsmitglied
Beiträge: 407
Registriert: 07.05.2003 21:48
Wohnort: Magdeburg

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#42 Ungelesener Beitrag von maxamd400 » 17.04.2016 16:14

Ja Michael,

habe auch 2 WUs abgebrochen, nach über einer Stunde in den RAM laden, wurden diese nicht berechnet, CPU Last bei 0,9%

http://atlasathome.cern.ch/results.php? ... e=6&appid=

ich weiss jetzt nicht, ob der Link geht. Geht je nur bei regestrierten Usern
Hab erstmal alles abgebrochen zu Atlas und rechne jetzt vLHC nur muss da auch was nicht stimmen,
den für die Theory Simulations v261.78 WUs mit einer Laufzeit von 86.401.47 = 24h 1sek bekomm ich margere 189,14 Punkte ?
2 andere WUs brachten 906,43 Punkte.
Rechne ich das ins Verhältnis zu den CMS Simulation WUs müsste ich 159.316,60 Punkte bekommen.

Grüße
Thorsten


Tante Edit meint...
also nun reichts mir,

jetzt bekommt man auch bei Atlas nur noch so wenig Punkte
für gleichen Aufwand wie zuvor.

WU vom 18 Apr 2016, 4:12:21 UTC
Laufzeit(sek) 6,491.98
CPU Zeit(sek) 6,053.49
Punkte 13.81

zuvor
WU vom 15 Apr 2016, 13:14:51 UTC
Laufzeit(sek) 6,408.90
CPU Zeit(sek) 6,000.39
Punkte 80.55

Ich weiss, es geht nicht nur um die Punkte, aber wenn ich
jetzt jemanden einholen will, muss ich fast das 6 fache berechnen
und das ist mir zu blöde.

Sagt doch mal den Projektleitern, Sie sollen keine Punkte mehr vergeben,
mal sehen wer dann noch da rechnet.
WUs bei LHC, vLHC sieht es auch nicht rosig aus, ich frag mich da wirklich,
wieviele User da am Tag leer ausgehen, den diese Meldung
"No tasks are available for CMS Simulation"
geht mir auf den Keks.

Oder ist das mit Absicht, den so läuft Ihr Subventioniertes Projekt bis
ins Jahr 2.185, Arbeitsplätze sind sicher.
Bild

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22435
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Ständig Probleme mit Atlas- und Lattice-WUs

#43 Ungelesener Beitrag von Michael H.W. Weber » 18.04.2016 10:54

Eric hat geschrieben:Theoretisch wäre das möglich. Praktisch gibt der Parallelbetrieb mit Atlas nur Probleme. Entweder meint Atlas, dass genügend Arbeit vorhanden wäre und läuft trocken oder die anderen Projekte. Da man mit app_config arbeiten muss, ist das alles doof.
Ich habe vLHC und ATLAS sowohl auf 4- als auch 8-Kernmaschinen laufen:

vLHC@home lädt IMMER nur 2 WUs.
Je nach RAM-Austattung stelle ich über die app_config.xml (die nur für ATLAS benötigt wird) die Zahl der maximal parallel laufenden WUs ein: (RAM in GB (-4 (falls RNA World läuft)))/4=Zahl der parallel laufenden ATLAS-Aufgaben in der Konfigurationsdatei. Also wenn RNA World nicht läuft, dann 2 ATLAS WUs pro 8 GB RAM (nur auf Maschinen, an denen ich nicht arbeite; arbeite ich dran, dann kriegen 8 GB nur 1 ATLAS-WU, sonst kann es beim Multitabbrowsing schon mal ruckeln).
Der "project share" ist bei ATLAS auf 5.000, bei vLHC auf 6.000 eingestellt. Alle anderen Projekte bekommen nur 100 mit Ausnahme von RNA World, was bei mir auf 10.000 eingestellt wird.
Wenn auf der Masschine eine GPU oder IGP arbeitet, ist 1 Kern zur GPU-Steuerung reserviert, indem im BOINC-Manager die CPU-Nutzung auf 90% runtergesetzt wird (macht automatisch einen Kern frei).
Das Wechseln zwischen den Anwendungen habe ich praktisch verboten, indem man das Wechselintervall im BOINC-Manager von 60 Min auf 9999999 hochsetzt.
Dann wird der WU-Puffer so eingestellt, dass bei beiden Einstellung im BOINC-Manager 0,5 steht (oder 1,5/0,5 - geht auch, dann saugt sich das Maschinchen etwas voller) - die Maschinen müssen IMMER am Netz sein.
Und schließlich lade ich ein Projekt dazu, das wenig RAM frisst, also Universe@home oder LHC@home oder auch Rosetta@home (nimmt etwas mehr, läuft aber absturzfrei in obiger Kombination).

Bei diesen Einstellungen sind die Maschinen immer mit maximaler Effizienz für vLHC und ATLAS am Rechnen und füllen den Rest der Kapazitäten mit anderen Projekten.
Im Fall eines WU-Mangels füllt das Hintergrundprojekt die Lücken aus.

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Antworten

Zurück zu „Hilfe und Support“