offener Betatest für neue cmsearch VM Anwendung

Alles zum Projekt RNA World
Nachricht
Autor
Matthias Lehmkuhl
Prozessor-Polier
Prozessor-Polier
Beiträge: 125
Registriert: 12.03.2008 20:42

Re: offener Betatest für neue cmsearch VM Anwendung

#241 Ungelesener Beitrag von Matthias Lehmkuhl » 26.10.2013 20:36

Hallo,
ich hatte auch wieder eine WU, die den Reboot nicht überlebt hat.
http://www.rnaworld.de/rnaworld/result. ... d=14920569
Endstatus -2135228409 (0xffffffff80bb0007) Unknown error number

Auszug aus der stderr.txt
2013-10-26 12:38:49 (4840): vboxwrapper: starting
2013-10-26 12:38:49 (4840): Feature: Enabling trickle-ups (Interval: 1209600.000000)
2013-10-26 12:38:50 (4840): Detected: VirtualBox 4.2.16r86992
2013-10-26 12:38:51 (4840): Restore from previously saved snapshot.
2013-10-26 12:38:53 (4840): Restore completed.
2013-10-26 12:38:53 (4840): Starting VM.
2013-10-26 12:40:39 (4840): Error in start VM for VM: -2135228409
Arguments:
startvm "boinc_a9c05cdc80ee0afc" --type headless
Output:
VBoxManage.exe: error: The machine 'boinc_a9c05cdc80ee0afc' is already locked by a session (or being locked or unlocked)
VBoxManage.exe: error: Details: code VBOX_E_INVALID_OBJECT_STATE (0x80bb0007), component Machine, interface IMachine, callee IUnknown
VBoxManage.exe: error: Context: "LaunchVMProcess(a->session, sessionType.raw(), env.raw(), progress.asOutParam())" at line 580 of file VBoxManageMisc.cpp

Notes:

Another VirtualBox management application has locked the session for
this VM. BOINC cannot properly monitor this VM
and so this job will be aborted.

Könnte es sein, das der Wrapper nicht lange genug wartet, bis die VM beim Herunterfahren beendet wurde?
Ich habe im Process Explorer schon gesehen, das die VBoxHeadless noch aktiv war, obwohl der Wrapper schon beendet war.
Das Problem tritt erst auf, seit diese umfangreicheren WUs in Arbeit sind.

Edit:
habe gerade gesehen, das der Prozess VBoxHeadless für RNA doch noch aktiv ist.
Also wieder ein falscher Abbruch. Somit vergeblich 9:30 Stunden CPU Zeit gerechnet. :(

Edit2:
wie sieht das eigentlich mit der "boinc_lockfile" Datei im Slot-Verzeichnis aus?
Wird diese Datei beim beenden von Boinc gelöscht?
Habe diese Datei gerade in den Slot-Verzeichnissen gelöscht, bei nicht aktiven Boinc Client.
Auf einem anderen Rechner ist diese Datei im aktiven Slot-Verzeichnis vorhanden, aber nicht in dem Slot-Verzeichnis das seit dem letzten Start noch nicht wieder gestartet wurde.
Matthias

Bild - Bild

Beorn

Re: offener Betatest für neue cmsearch VM Anwendung

#242 Ungelesener Beitrag von Beorn » 27.10.2013 00:50

ChristianB hat geschrieben:Ich werde wohl erstmal das erzeugen von neuen Aufgaben anhalten.
Ich sehe dass die ungesendeten Aufgaben heute auf Null gegangen sind. Bedeutet dies, dass ihr auch keine Aufgaben mehr erzeugt zu Arbeitspaketen die bereits in Bearbeitung sind - also kein Ersatz für fehlerhafte Ergebnisse? :o Falls ja, dürfte es die Chancen auch Credits für ein gültiges Ergebnis zu bekommen deutlich verringern, oder?

EDIT: Damit's nicht so theoretisch ist: Paket 6330768, hier habe ich noch eine Kopie in Berechnung. Bei meinem Wingman (Gruß an Rolf! :wave: ) hat's die Wutze gestern abend zersägt. Wenn es nun keinen Wingman mehr gibt, kann ich das Ding doch eigentlich auch abbrechen, oder?

ChristianB
Admin
Admin
Beiträge: 1920
Registriert: 23.02.2010 22:12

Re: offener Betatest für neue cmsearch VM Anwendung

#243 Ungelesener Beitrag von ChristianB » 27.10.2013 10:06

Nein, denn wenn wir eine neue App Version veröffentlichen die ordentlich läuft (hoffentlich) dann werden wieder Aufgaben erzeugt und können validiert werden. Die Pakete sind nicht abgebrochen sondern nur angehalten.

Matthias Lehmkuhl
Prozessor-Polier
Prozessor-Polier
Beiträge: 125
Registriert: 12.03.2008 20:42

Re: offener Betatest für neue cmsearch VM Anwendung

#244 Ungelesener Beitrag von Matthias Lehmkuhl » 27.10.2013 21:53

Habe gerade ein oder zwei Results mit Error beendet, weil ich neben Boinc mit VirtualBox auch noch gleichzeitig
Windows Virtual PC genutzt habe.
Sicher:
http://www.rnaworld.de/rnaworld/result. ... d=14920668

eventuell auch
http://www.rnaworld.de/rnaworld/result. ... d=14920820
Matthias

Bild - Bild

Beorn

Re: offener Betatest für neue cmsearch VM Anwendung

#245 Ungelesener Beitrag von Beorn » 28.10.2013 13:08

ChristianB hat geschrieben:Nein, denn wenn wir eine neue App Version veröffentlichen die ordentlich läuft (hoffentlich) dann werden wieder Aufgaben erzeugt und können validiert werden.
Na, dann sind wir mal guten Mutes. Heute hat ein zweiter Flügelmann den Schleudersitz ausgelöst. Ich warte jetzt mit Spannung auf die erste fertige Wutze. :morning:

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22431
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: offener Betatest für neue cmsearch VM Anwendung

#246 Ungelesener Beitrag von Michael H.W. Weber » 28.10.2013 14:39

So, ich habe auf meinem Phenom II 955BE unter WinXP Pro x64 (Maschinen-ID 169) noch mal ein paar Tests durchgeführt. Ergebnis:
Das VM-Checkpinting funktioniert leider nicht mal ansatzweise.
Folgendes Szenario:

Die Maschine hatte drei VM WUs zu bearbeiten, die ca. 145 Std. liefen und Einstein lief parallel mit einer WU. Ich halte Einstein an und pausiere erst einen Task. Kein Problem. Dann alle drei. Ebenfalls kein Problem. Ergo: Pausieren scheint grundsätzlich fehlerfrei zu laufen.

Die Task-IDs waren:
14920822 (Paket 6330751)
14921086 (Paket 6330711)
14920694 (Paket 6330687)

Ich teste das Schließen des BOINC-Managers: Die Maschine rödelt wie doof auf der HD herum, ich warte etliche Minuten, bis sich Ruhe einstellt. Dann starte ich den BOINC-Manager erneut - mit geöffnetem Taskmanager. Es werden drei VMHeadless-Prozesse gestartet und drei VMManage-Prozesse, sowie einmal VMSCR.exe oder so ähnlich. Es wird wie doof auf der HD gerödelt - Einstein ist nach wie vor angehalten, um Zusatzstress zu vermeiden. Dann scheinen alle drei Tasks wieder zu laufen. Plötzlich: Die beiden VMManage-Prozesse verabschieden sich, die SCR immer noch "im Rennen". Zwei WUs werden mit Berechnungsfehler ins ewige Daten-Nirvana geblasen. Die zugehörigen VMHeadless-Prozesse aber laufen unverändert weiter. Es wird kein Speicher frei gegeben. Zwei Zombies also. Ich aktualisiere den Manager, die beiden WUs werden als fehlerhaft an den Server gemeldet. Die am längsten gelaufene WU bleibt funktionstüchtig erhalten.
Ich wiederhole mit dieser WU den BOINC-Manager-Beendigungstest. Ergebnis: Auch diese Task wird fehlerhaft und damit gekillt. Hier das Log:

Code: Alles auswählen

27.10.2013 17:04:44 | RNA World | URL http://www.rnaworld.de/rnaworld/; Computer ID 169; resource share 100
27.10.2013 17:04:44 | RNA World | General prefs: from RNA World (last modified 21-Oct-2013 16:13:27)
27.10.2013 17:04:44 | RNA World | Computer location: home
27.10.2013 17:04:44 | RNA World | General prefs: no separate prefs for home; using your defaults
27.10.2013 17:04:44 |  | Reading preferences override file
27.10.2013 17:04:44 |  | Preferences:
27.10.2013 17:04:44 |  | max memory usage when active: 7141.36MB
27.10.2013 17:04:44 |  | max memory usage when idle: 7538.11MB
27.10.2013 17:04:44 |  | max disk usage: 57.62GB
27.10.2013 17:04:44 |  | don't use GPU while active
27.10.2013 17:04:44 |  | (to change preferences, visit a project web site or select Preferences in the Manager)
27.10.2013 17:04:44 |  | Not using a proxy
27.10.2013 17:04:45 | RNA World | Restarting task cmsvm_GA-p[b-Lin64f-2]_1_Dyadobacter-fermentans-DSM-18053_CP001619.cir.EMBL_RF00028_Intron_gpI_1358679723_773_0 using cmsearch3 version 103 (vbox64) in slot 5
27.10.2013 17:04:45 | RNA World | Sending scheduler request: To fetch work.
27.10.2013 17:04:45 | RNA World | Requesting new tasks for CPU
27.10.2013 17:05:06 | Quake-Catcher Network | Restarting task qcnq_034832_0 using qcnsensor version 733 (nci) in slot 2
27.10.2013 17:05:06 | WUProp@Home | Restarting task wu_v4_1381488756_675629_0 using data_collect_v4 version 408 (nci) in slot 1
27.10.2013 17:05:07 | RNA World | Scheduler request completed: got 0 new tasks
27.10.2013 17:05:07 | RNA World | No tasks sent
27.10.2013 17:05:07 | RNA World | No tasks are available for cmsearch VM (VirtualBox) 1.0.2
27.10.2013 17:05:07 | RNA World | Für die gewählten Anwendungen ist keine Arbeit verfügbar.
27.10.2013 17:05:12 | Quake-Catcher Network | Sending scheduler request: To send trickle-up message.
27.10.2013 17:05:12 | Quake-Catcher Network | Not requesting tasks: non CPU intensive
27.10.2013 17:05:14 | Quake-Catcher Network | Scheduler request completed
27.10.2013 17:05:14 | Quake-Catcher Network | Project has no tasks available
27.10.2013 17:08:00 | RNA World | Computation for task cmsvm_GA-p[b-Lin64f-2]_1_Dyadobacter-fermentans-DSM-18053_CP001619.cir.EMBL_RF00028_Intron_gpI_1358679723_773_0 finished
27.10.2013 17:08:00 | RNA World | Output file cmsvm_GA-p[b-Lin64f-2]_1_Dyadobacter-fermentans-DSM-18053_CP001619.cir.EMBL_RF00028_Intron_gpI_1358679723_773_0_0 for task cmsvm_GA-p[b-Lin64f-2]_1_Dyadobacter-fermentans-DSM-18053_CP001619.cir.EMBL_RF00028_Intron_gpI_1358679723_773_0 absent
27.10.2013 17:08:00 | RNA World | Output file cmsvm_GA-p[b-Lin64f-2]_1_Dyadobacter-fermentans-DSM-18053_CP001619.cir.EMBL_RF00028_Intron_gpI_1358679723_773_0_1 for task cmsvm_GA-p[b-Lin64f-2]_1_Dyadobacter-fermentans-DSM-18053_CP001619.cir.EMBL_RF00028_Intron_gpI_1358679723_773_0 absent
27.10.2013 17:08:49 | RNA World | update requested by user
27.10.2013 17:08:53 | RNA World | Sending scheduler request: Requested by user.
27.10.2013 17:08:53 | RNA World | Reporting 1 completed tasks
27.10.2013 17:08:53 | RNA World | Requesting new tasks for CPU
27.10.2013 17:08:55 | RNA World | Scheduler request completed: got 0 new tasks
27.10.2013 17:08:55 | RNA World | No tasks sent
27.10.2013 17:08:55 | RNA World | No tasks are available for cmsearch VM (VirtualBox) 1.0.2
27.10.2013 17:08:55 | RNA World | Für die gewählten Anwendungen ist keine Arbeit verfügbar.
Es scheint also eine Problematik mit dem Schreiben der Ergebnisse/Checkpoints zu geben und es werden gewisse Prozesse nicht sauber terminiert.

Ich heute ab ins Labor, den i7 (Windows 7 Pro x64) testen, um zu schauen, ob das Problem architekturabhängig ist. Dort laufen ebenfalls drei Prozesse (ca. 185 Std. jeweils):

14920970 (Paket 6330692)
14920895 (Paket 6330722)
14920709 (Paket 6330694)

Pausieren Null Problem. BOINC-Manager-Beendigungstest: Null Problem (!) - also Unterschied zur AMD-Architektur.
Ich starte die Maschine neu: Alle drei Tasks krepieren (Berechnungsfehler). Log:

Code: Alles auswählen

28.10.2013 10:47:15 |  | No config file found - using defaults
28.10.2013 10:47:15 |  | Starting BOINC client version 7.0.64 for windows_x86_64
28.10.2013 10:47:15 |  | log flags: file_xfer, sched_ops, task
28.10.2013 10:47:15 |  | Libraries: libcurl/7.25.0 OpenSSL/1.0.1 zlib/1.2.6
28.10.2013 10:47:15 |  | Data directory: C:\ProgramData\BOINC
28.10.2013 10:47:15 |  | Running under account Intas2013
28.10.2013 10:47:15 |  | Processor: 8 GenuineIntel         Intel(R) Core(TM) i7-3770 CPU @ 3.40GHz [Family 6 Model 58 Stepping 9]
28.10.2013 10:47:15 |  | Processor features: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss htt tm pni ssse3 cx16 sse4_1 sse4_2 popcnt aes syscall nx lm vmx smx tm2 pbe
28.10.2013 10:47:15 |  | OS: Microsoft Windows 7: Professional x64 Edition, Service Pack 1, (06.01.7601.00)
28.10.2013 10:47:15 |  | Memory: 7.89 GB physical, 15.78 GB virtual
28.10.2013 10:47:15 |  | Disk: 232.11 GB total, 174.99 GB free
28.10.2013 10:47:15 |  | Local time is UTC +1 hours
28.10.2013 10:47:15 |  | VirtualBox version: 4.2.16
28.10.2013 10:47:15 |  | OpenCL: Intel GPU 0: Intel(R) HD Graphics 4000 (driver version 8.15.10.2639, device version OpenCL 1.1, 1624MB, 1624MB available, 45 GFLOPS peak)
28.10.2013 10:47:15 | Einstein@Home | URL http://einstein.phys.uwm.edu/; Computer ID 8991340; resource share 100
28.10.2013 10:47:15 | pogs | URL http://pogs.theskynet.org/pogs/; Computer ID 7897; resource share 100
28.10.2013 10:47:15 | Quake-Catcher Network | URL http://qcn.stanford.edu/sensor/; Computer ID 28119; resource share 100
28.10.2013 10:47:15 | WUProp@Home | URL http://wuprop.boinc-af.org/; Computer ID 54138; resource share 100
28.10.2013 10:47:15 | RNA World | URL http://www.rnaworld.de/rnaworld/; Computer ID 26070; resource share 100
28.10.2013 10:47:15 | RNA World | General prefs: from RNA World (last modified 21-Oct-2013 16:13:27)
28.10.2013 10:47:15 | RNA World | Host location: none
28.10.2013 10:47:15 | RNA World | General prefs: using your defaults
28.10.2013 10:47:15 |  | Reading preferences override file
28.10.2013 10:47:15 |  | Preferences:
28.10.2013 10:47:15 |  | max memory usage when active: 6462.83MB
28.10.2013 10:47:15 |  | max memory usage when idle: 7270.69MB
28.10.2013 10:47:15 |  | max disk usage: 10.00GB
28.10.2013 10:47:15 |  | don't use GPU while active
28.10.2013 10:47:15 |  | (to change preferences, visit a project web site or select Preferences in the Manager)
28.10.2013 10:47:15 |  | Not using a proxy
28.10.2013 10:47:18 |  | Suspending GPU computation - computer is in use
28.10.2013 10:47:18 | RNA World | Restarting task cmsvm_GA-p[e20-30MB_Lin64f]_1_Caenorhabditis-briggsae_CU538969.lin.EMBL_RF00028_Intron_gpI_1349111823_4144_1 using cmsearch3 version 103 (vbox64) in slot 10
28.10.2013 10:47:18 | RNA World | Restarting task cmsvm_GA-p[e20-30MB_Lin64f]_1_Oryza-sativa-Japonica-Group_AP008215.lin.EMBL_RF00028_Intron_gpI_1349111823_53536_2 using cmsearch3 version 103 (vbox64) in slot 9
28.10.2013 10:47:18 | RNA World | Sending scheduler request: To fetch work.
28.10.2013 10:47:18 | RNA World | Requesting new tasks for CPU
28.10.2013 10:47:31 | RNA World | Restarting task cmsvm_GA-p[e20-30MB_Lin64f]_1_Arabidopsis-thaliana-(thale-cress)_BA000014.lin.EMBL_RF00028_Intron_gpI_1349111823_1400_2 using cmsearch3 version 103 (vbox64) in slot 7
28.10.2013 10:47:31 | Quake-Catcher Network | Restarting task qcnq_035413_0 using qcnsensor version 733 (nci) in slot 1
28.10.2013 10:47:31 | WUProp@Home | Restarting task wu_v4_1381488756_706540_0 using data_collect_v4 version 409 (nci) in slot 0
28.10.2013 10:47:35 | RNA World | Scheduler request completed: got 0 new tasks
28.10.2013 10:47:35 | RNA World | Project has no tasks available
28.10.2013 10:47:41 | Quake-Catcher Network | Sending scheduler request: To send trickle-up message.
28.10.2013 10:47:41 | Quake-Catcher Network | Not requesting tasks: non CPU intensive
28.10.2013 10:47:43 | Quake-Catcher Network | Scheduler request completed
28.10.2013 10:47:43 | Quake-Catcher Network | Project has no tasks available
28.10.2013 10:49:24 | RNA World | Computation for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Caenorhabditis-briggsae_CU538969.lin.EMBL_RF00028_Intron_gpI_1349111823_4144_1 finished
28.10.2013 10:49:24 | RNA World | Output file cmsvm_GA-p[e20-30MB_Lin64f]_1_Caenorhabditis-briggsae_CU538969.lin.EMBL_RF00028_Intron_gpI_1349111823_4144_1_0 for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Caenorhabditis-briggsae_CU538969.lin.EMBL_RF00028_Intron_gpI_1349111823_4144_1 absent
28.10.2013 10:49:24 | RNA World | Output file cmsvm_GA-p[e20-30MB_Lin64f]_1_Caenorhabditis-briggsae_CU538969.lin.EMBL_RF00028_Intron_gpI_1349111823_4144_1_1 for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Caenorhabditis-briggsae_CU538969.lin.EMBL_RF00028_Intron_gpI_1349111823_4144_1 absent
28.10.2013 10:49:24 | RNA World | Computation for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Oryza-sativa-Japonica-Group_AP008215.lin.EMBL_RF00028_Intron_gpI_1349111823_53536_2 finished
28.10.2013 10:49:24 | RNA World | Output file cmsvm_GA-p[e20-30MB_Lin64f]_1_Oryza-sativa-Japonica-Group_AP008215.lin.EMBL_RF00028_Intron_gpI_1349111823_53536_2_0 for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Oryza-sativa-Japonica-Group_AP008215.lin.EMBL_RF00028_Intron_gpI_1349111823_53536_2 absent
28.10.2013 10:49:24 | RNA World | Output file cmsvm_GA-p[e20-30MB_Lin64f]_1_Oryza-sativa-Japonica-Group_AP008215.lin.EMBL_RF00028_Intron_gpI_1349111823_53536_2_1 for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Oryza-sativa-Japonica-Group_AP008215.lin.EMBL_RF00028_Intron_gpI_1349111823_53536_2 absent
28.10.2013 10:49:24 | RNA World | Computation for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Arabidopsis-thaliana-(thale-cress)_BA000014.lin.EMBL_RF00028_Intron_gpI_1349111823_1400_2 finished
28.10.2013 10:49:24 | RNA World | Output file cmsvm_GA-p[e20-30MB_Lin64f]_1_Arabidopsis-thaliana-(thale-cress)_BA000014.lin.EMBL_RF00028_Intron_gpI_1349111823_1400_2_0 for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Arabidopsis-thaliana-(thale-cress)_BA000014.lin.EMBL_RF00028_Intron_gpI_1349111823_1400_2 absent
28.10.2013 10:49:24 | RNA World | Output file cmsvm_GA-p[e20-30MB_Lin64f]_1_Arabidopsis-thaliana-(thale-cress)_BA000014.lin.EMBL_RF00028_Intron_gpI_1349111823_1400_2_1 for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Arabidopsis-thaliana-(thale-cress)_BA000014.lin.EMBL_RF00028_Intron_gpI_1349111823_1400_2 absent
28.10.2013 10:50:25 | RNA World | update requested by user
28.10.2013 10:50:27 | RNA World | Sending scheduler request: Requested by user.
28.10.2013 10:50:27 | RNA World | Reporting 3 completed tasks
28.10.2013 10:50:27 | RNA World | Requesting new tasks for CPU
28.10.2013 10:50:29 | RNA World | Scheduler request completed: got 0 new tasks
28.10.2013 10:50:29 | RNA World | Project has no tasks available
Erneut Fehler beim Schreiben von Dateien?

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Beorn

Re: offener Betatest für neue cmsearch VM Anwendung

#247 Ungelesener Beitrag von Beorn » 28.10.2013 15:02

Michael H.W. Weber hat geschrieben:Pausieren Null Problem. BOINC-Manager-Beendigungstest: Null Problem (!) - also Unterschied zur AMD-Architektur.
Offensichtlich. Wobei mein AMD FX bisher keine Probleme macht. Ein schwaches Indiz dass es wirklich an der K10 CPU (Virtualisierung / Speichermanagement) liegen könnte und nicht z.B. am Chipsatz.
Michael H.W. Weber hat geschrieben:Ich heute ab ins Labor, den i7 (Windows 7 Pro x64) testen, um zu schauen, ob das Problem architekturabhängig ist. (...) Ich starte die Maschine neu: Alle drei Tasks krepieren (Berechnungsfehler).
Was mich interessieren würde: Hattest Du BOINC im Autostart oder nach Abschluss des Bootens manuell gestartet?

Anderes Thema: Hat schon jemand außer Jacob Klein das neue BOINC v7.2.24+ getestet, welches den tatsächlichen RAM-Bedarf der VMs besser berücksichtigen soll?

http://boinc.berkeley.edu/dl/
http://www.rnaworld.de/rnaworld/forum_t ... postid=338

Gruss

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22431
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: offener Betatest für neue cmsearch VM Anwendung

#248 Ungelesener Beitrag von Michael H.W. Weber » 28.10.2013 15:48

Beorn hat geschrieben:Was mich interessieren würde: Hattest Du BOINC im Autostart oder nach Abschluss des Bootens manuell gestartet?
Wir bei mir stets basierend auf den Standardinstallationsbedingungen per Autostart gestartet.

Übrigens noch eine Info: Ich habe mir anlässlich der diversen Berichte hier auf dem AMD auch in den drei Slots die stderr-Dateien angesehen. Keine hatte eine auffällige Größe, will heißen, sie lagen so bei um die 30 MB maximal.

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Crystal Pellet

Re: offener Betatest für neue cmsearch VM Anwendung

#249 Ungelesener Beitrag von Crystal Pellet » 28.10.2013 18:36

Meiner ungefragte Meinung nach liegt es nicht am Architektur aber am wrapper und Speicherbedarf.
Michael hat maximal 6-7 GB verfügbar und hat drei Aufgaben. Jede VM möchte 4GB reservieren.
Ich habe mit meiner einstige Aufgabe Null Probleme, obwohl ich die Aufgabe mindestens einmal am Tag anhalte und nicht im Speicher verwahre.
Manchmal BOINC abschliese oder sogar den PC neustarte AMD Phenom 9350e Quad mit 8GB memory.
Darauf laufen auch noch BOINC VM's für T4T und climateathome.

Wenn ich die Tasks Ergebnisse / Diskussion so anschaue, ist die Hauptursache des Problems, dass BOINC bei vboxwrapper-26028 beim anhalten einer Aufgabe nicht immer erfolgreich ist beim beenden von VBoxHeadless.exe.
Wenn dann die Aufgabe weiter machen möchte, ist die vom noch laufende VBoxHeadless.exe besetzt und BOINC endet mit einem Fehler.

Soweit ich die neueste vboxwrapper-26029 mit T4T getestet habe, wird VBoxHeadless.exe jetzt von BOINC nach ungefähr 15 Sekunden gekilled nach einem suspend.
Beim VM restart, hat BOINC wieder die einstige Kontrolle und kann vom Checkpoint weiter machen.
Ein anderer Unterschied, ist das VBoxHeadless.exe auf den niedrigsten Priorität läuft und nicht mehr eine Prio höher als den wrapper selbst.

Ich habe v26029 mit/für RNA noch nicht testen können, weil ich erst die seit 18 Sept. laufende Aufgabe valid abliefern möchte.

Beorn

Re: offener Betatest für neue cmsearch VM Anwendung

#250 Ungelesener Beitrag von Beorn » 28.10.2013 18:51

Es wird einsam hier oben. Den hier hat die Flak zerrissen. :bang: Und das ausgerechnet beim Schnabeltier, dem dicksten ... ähm ... 'Fisch' in meinem Köcher.
Crystal Pellet hat geschrieben:Soweit ich die neueste vboxwrapper-26029 mit T4T getestet habe, wird VBoxHeadless.exe jetzt von BOINC nach ungefähr 15 Sekunden gekilled nach einem suspend.
Beim VM restart, hat BOINC wieder die einstige Kontrolle und kann vom Checkpoint weiter machen.
Ein anderer Unterschied, ist das VBoxHeadless.exe auf den niedrigsten Priorität läuft und nicht mehr eine Prio höher als den wrapper selbst.
Spricht das nicht dafür, den neuen Wrapper auch hier serverseitig einzusetzen? Und vielleicht gleichzeitig auch die Verwendung von BOINC v7.2.24+ zu empfehlen? Ich hab's mal auf einem der Rechner installiert, kann aber noch nichts zum veränderten Scheduling sagen, da ABC@home dort noch ein paar Tage im Panikmodus ist... :wink:

ChristianB
Admin
Admin
Beiträge: 1920
Registriert: 23.02.2010 22:12

Re: offener Betatest für neue cmsearch VM Anwendung

#251 Ungelesener Beitrag von ChristianB » 28.10.2013 21:12

Vorerst wird es erstmal so bleiben. Ich habe im November etwas mehr Zeit und werde mich dann darum kümmern das der neue vboxwrapper_26029 kommt. Ich überlege außerdem Serverseitig die Anzahl der gleichzeitigen VM's auf 1 zu limitieren. Wenn das erfolgreich ist dann können wir ja überlegen die Mindestversion für BOINC (nur für cmsearch VM) anzuheben. Ich würde das aber ungern von Anfang an machen weil die 7.2.24 noch in der Entwicklung ist. Sollte mittlerweile ein Release erfolgen sieht es natürlich anders aus.

Beorn

Re: offener Betatest für neue cmsearch VM Anwendung

#252 Ungelesener Beitrag von Beorn » 29.10.2013 05:30

Was BOINC 7.2.24 angeht: Jetzt geht die RNA Wutze vom 10.10. auch in 'Hohe Priorität' weil mein BOINC natürlich nicht weiß, dass serverseitig die Deadline bereits auf den 29. November verlängert wurde - ursprünglich war's morgen 16:04 Uhr. :suspect: Auch seltsam: Der BM startet zwar nur eine RNA VM (wie nach Speicherbedarf zu erwarten), aber er stoppt bis auf eine alle ABC@home Wutzen, so dass nur noch zwei von acht CPU-Threads ausgelastet werden. So wird das nix. :shake:
Dateianhänge
BM 7.2.24.PNG
BM 7.2.24.PNG (44.99 KiB) 1920 mal betrachtet

Antworten

Zurück zu „RNA World Diskussionen (deutsch)“