offener Betatest für neue cmsearch VM Anwendung
-
- Prozessor-Polier
- Beiträge: 125
- Registriert: 12.03.2008 20:42
Re: offener Betatest für neue cmsearch VM Anwendung
Hallo,
ich hatte auch wieder eine WU, die den Reboot nicht überlebt hat.
http://www.rnaworld.de/rnaworld/result. ... d=14920569
Endstatus -2135228409 (0xffffffff80bb0007) Unknown error number
Auszug aus der stderr.txt
2013-10-26 12:38:49 (4840): vboxwrapper: starting
2013-10-26 12:38:49 (4840): Feature: Enabling trickle-ups (Interval: 1209600.000000)
2013-10-26 12:38:50 (4840): Detected: VirtualBox 4.2.16r86992
2013-10-26 12:38:51 (4840): Restore from previously saved snapshot.
2013-10-26 12:38:53 (4840): Restore completed.
2013-10-26 12:38:53 (4840): Starting VM.
2013-10-26 12:40:39 (4840): Error in start VM for VM: -2135228409
Arguments:
startvm "boinc_a9c05cdc80ee0afc" --type headless
Output:
VBoxManage.exe: error: The machine 'boinc_a9c05cdc80ee0afc' is already locked by a session (or being locked or unlocked)
VBoxManage.exe: error: Details: code VBOX_E_INVALID_OBJECT_STATE (0x80bb0007), component Machine, interface IMachine, callee IUnknown
VBoxManage.exe: error: Context: "LaunchVMProcess(a->session, sessionType.raw(), env.raw(), progress.asOutParam())" at line 580 of file VBoxManageMisc.cpp
Notes:
Another VirtualBox management application has locked the session for
this VM. BOINC cannot properly monitor this VM
and so this job will be aborted.
Könnte es sein, das der Wrapper nicht lange genug wartet, bis die VM beim Herunterfahren beendet wurde?
Ich habe im Process Explorer schon gesehen, das die VBoxHeadless noch aktiv war, obwohl der Wrapper schon beendet war.
Das Problem tritt erst auf, seit diese umfangreicheren WUs in Arbeit sind.
Edit:
habe gerade gesehen, das der Prozess VBoxHeadless für RNA doch noch aktiv ist.
Also wieder ein falscher Abbruch. Somit vergeblich 9:30 Stunden CPU Zeit gerechnet.
Edit2:
wie sieht das eigentlich mit der "boinc_lockfile" Datei im Slot-Verzeichnis aus?
Wird diese Datei beim beenden von Boinc gelöscht?
Habe diese Datei gerade in den Slot-Verzeichnissen gelöscht, bei nicht aktiven Boinc Client.
Auf einem anderen Rechner ist diese Datei im aktiven Slot-Verzeichnis vorhanden, aber nicht in dem Slot-Verzeichnis das seit dem letzten Start noch nicht wieder gestartet wurde.
ich hatte auch wieder eine WU, die den Reboot nicht überlebt hat.
http://www.rnaworld.de/rnaworld/result. ... d=14920569
Endstatus -2135228409 (0xffffffff80bb0007) Unknown error number
Auszug aus der stderr.txt
2013-10-26 12:38:49 (4840): vboxwrapper: starting
2013-10-26 12:38:49 (4840): Feature: Enabling trickle-ups (Interval: 1209600.000000)
2013-10-26 12:38:50 (4840): Detected: VirtualBox 4.2.16r86992
2013-10-26 12:38:51 (4840): Restore from previously saved snapshot.
2013-10-26 12:38:53 (4840): Restore completed.
2013-10-26 12:38:53 (4840): Starting VM.
2013-10-26 12:40:39 (4840): Error in start VM for VM: -2135228409
Arguments:
startvm "boinc_a9c05cdc80ee0afc" --type headless
Output:
VBoxManage.exe: error: The machine 'boinc_a9c05cdc80ee0afc' is already locked by a session (or being locked or unlocked)
VBoxManage.exe: error: Details: code VBOX_E_INVALID_OBJECT_STATE (0x80bb0007), component Machine, interface IMachine, callee IUnknown
VBoxManage.exe: error: Context: "LaunchVMProcess(a->session, sessionType.raw(), env.raw(), progress.asOutParam())" at line 580 of file VBoxManageMisc.cpp
Notes:
Another VirtualBox management application has locked the session for
this VM. BOINC cannot properly monitor this VM
and so this job will be aborted.
Könnte es sein, das der Wrapper nicht lange genug wartet, bis die VM beim Herunterfahren beendet wurde?
Ich habe im Process Explorer schon gesehen, das die VBoxHeadless noch aktiv war, obwohl der Wrapper schon beendet war.
Das Problem tritt erst auf, seit diese umfangreicheren WUs in Arbeit sind.
Edit:
habe gerade gesehen, das der Prozess VBoxHeadless für RNA doch noch aktiv ist.
Also wieder ein falscher Abbruch. Somit vergeblich 9:30 Stunden CPU Zeit gerechnet.
Edit2:
wie sieht das eigentlich mit der "boinc_lockfile" Datei im Slot-Verzeichnis aus?
Wird diese Datei beim beenden von Boinc gelöscht?
Habe diese Datei gerade in den Slot-Verzeichnissen gelöscht, bei nicht aktiven Boinc Client.
Auf einem anderen Rechner ist diese Datei im aktiven Slot-Verzeichnis vorhanden, aber nicht in dem Slot-Verzeichnis das seit dem letzten Start noch nicht wieder gestartet wurde.
Matthias
-
-
Re: offener Betatest für neue cmsearch VM Anwendung
Ich sehe dass die ungesendeten Aufgaben heute auf Null gegangen sind. Bedeutet dies, dass ihr auch keine Aufgaben mehr erzeugt zu Arbeitspaketen die bereits in Bearbeitung sind - also kein Ersatz für fehlerhafte Ergebnisse? Falls ja, dürfte es die Chancen auch Credits für ein gültiges Ergebnis zu bekommen deutlich verringern, oder?ChristianB hat geschrieben:Ich werde wohl erstmal das erzeugen von neuen Aufgaben anhalten.
EDIT: Damit's nicht so theoretisch ist: Paket 6330768, hier habe ich noch eine Kopie in Berechnung. Bei meinem Wingman (Gruß an Rolf! ) hat's die Wutze gestern abend zersägt. Wenn es nun keinen Wingman mehr gibt, kann ich das Ding doch eigentlich auch abbrechen, oder?
-
- Admin
- Beiträge: 1920
- Registriert: 23.02.2010 22:12
Re: offener Betatest für neue cmsearch VM Anwendung
Nein, denn wenn wir eine neue App Version veröffentlichen die ordentlich läuft (hoffentlich) dann werden wieder Aufgaben erzeugt und können validiert werden. Die Pakete sind nicht abgebrochen sondern nur angehalten.
-
- Prozessor-Polier
- Beiträge: 125
- Registriert: 12.03.2008 20:42
Re: offener Betatest für neue cmsearch VM Anwendung
Habe gerade ein oder zwei Results mit Error beendet, weil ich neben Boinc mit VirtualBox auch noch gleichzeitig
Windows Virtual PC genutzt habe.
Sicher:
http://www.rnaworld.de/rnaworld/result. ... d=14920668
eventuell auch
http://www.rnaworld.de/rnaworld/result. ... d=14920820
Windows Virtual PC genutzt habe.
Sicher:
http://www.rnaworld.de/rnaworld/result. ... d=14920668
eventuell auch
http://www.rnaworld.de/rnaworld/result. ... d=14920820
Matthias
-
-
Re: offener Betatest für neue cmsearch VM Anwendung
Na, dann sind wir mal guten Mutes. Heute hat ein zweiter Flügelmann den Schleudersitz ausgelöst. Ich warte jetzt mit Spannung auf die erste fertige Wutze.ChristianB hat geschrieben:Nein, denn wenn wir eine neue App Version veröffentlichen die ordentlich läuft (hoffentlich) dann werden wieder Aufgaben erzeugt und können validiert werden.
- Michael H.W. Weber
- Vereinsvorstand
- Beiträge: 22431
- Registriert: 07.01.2002 01:00
- Wohnort: Marpurk
- Kontaktdaten:
Re: offener Betatest für neue cmsearch VM Anwendung
So, ich habe auf meinem Phenom II 955BE unter WinXP Pro x64 (Maschinen-ID 169) noch mal ein paar Tests durchgeführt. Ergebnis:
Das VM-Checkpinting funktioniert leider nicht mal ansatzweise.
Folgendes Szenario:
Die Maschine hatte drei VM WUs zu bearbeiten, die ca. 145 Std. liefen und Einstein lief parallel mit einer WU. Ich halte Einstein an und pausiere erst einen Task. Kein Problem. Dann alle drei. Ebenfalls kein Problem. Ergo: Pausieren scheint grundsätzlich fehlerfrei zu laufen.
Die Task-IDs waren:
14920822 (Paket 6330751)
14921086 (Paket 6330711)
14920694 (Paket 6330687)
Ich teste das Schließen des BOINC-Managers: Die Maschine rödelt wie doof auf der HD herum, ich warte etliche Minuten, bis sich Ruhe einstellt. Dann starte ich den BOINC-Manager erneut - mit geöffnetem Taskmanager. Es werden drei VMHeadless-Prozesse gestartet und drei VMManage-Prozesse, sowie einmal VMSCR.exe oder so ähnlich. Es wird wie doof auf der HD gerödelt - Einstein ist nach wie vor angehalten, um Zusatzstress zu vermeiden. Dann scheinen alle drei Tasks wieder zu laufen. Plötzlich: Die beiden VMManage-Prozesse verabschieden sich, die SCR immer noch "im Rennen". Zwei WUs werden mit Berechnungsfehler ins ewige Daten-Nirvana geblasen. Die zugehörigen VMHeadless-Prozesse aber laufen unverändert weiter. Es wird kein Speicher frei gegeben. Zwei Zombies also. Ich aktualisiere den Manager, die beiden WUs werden als fehlerhaft an den Server gemeldet. Die am längsten gelaufene WU bleibt funktionstüchtig erhalten.
Ich wiederhole mit dieser WU den BOINC-Manager-Beendigungstest. Ergebnis: Auch diese Task wird fehlerhaft und damit gekillt. Hier das Log:
Es scheint also eine Problematik mit dem Schreiben der Ergebnisse/Checkpoints zu geben und es werden gewisse Prozesse nicht sauber terminiert.
Ich heute ab ins Labor, den i7 (Windows 7 Pro x64) testen, um zu schauen, ob das Problem architekturabhängig ist. Dort laufen ebenfalls drei Prozesse (ca. 185 Std. jeweils):
14920970 (Paket 6330692)
14920895 (Paket 6330722)
14920709 (Paket 6330694)
Pausieren Null Problem. BOINC-Manager-Beendigungstest: Null Problem (!) - also Unterschied zur AMD-Architektur.
Ich starte die Maschine neu: Alle drei Tasks krepieren (Berechnungsfehler). Log:
Erneut Fehler beim Schreiben von Dateien?
Michael.
Das VM-Checkpinting funktioniert leider nicht mal ansatzweise.
Folgendes Szenario:
Die Maschine hatte drei VM WUs zu bearbeiten, die ca. 145 Std. liefen und Einstein lief parallel mit einer WU. Ich halte Einstein an und pausiere erst einen Task. Kein Problem. Dann alle drei. Ebenfalls kein Problem. Ergo: Pausieren scheint grundsätzlich fehlerfrei zu laufen.
Die Task-IDs waren:
14920822 (Paket 6330751)
14921086 (Paket 6330711)
14920694 (Paket 6330687)
Ich teste das Schließen des BOINC-Managers: Die Maschine rödelt wie doof auf der HD herum, ich warte etliche Minuten, bis sich Ruhe einstellt. Dann starte ich den BOINC-Manager erneut - mit geöffnetem Taskmanager. Es werden drei VMHeadless-Prozesse gestartet und drei VMManage-Prozesse, sowie einmal VMSCR.exe oder so ähnlich. Es wird wie doof auf der HD gerödelt - Einstein ist nach wie vor angehalten, um Zusatzstress zu vermeiden. Dann scheinen alle drei Tasks wieder zu laufen. Plötzlich: Die beiden VMManage-Prozesse verabschieden sich, die SCR immer noch "im Rennen". Zwei WUs werden mit Berechnungsfehler ins ewige Daten-Nirvana geblasen. Die zugehörigen VMHeadless-Prozesse aber laufen unverändert weiter. Es wird kein Speicher frei gegeben. Zwei Zombies also. Ich aktualisiere den Manager, die beiden WUs werden als fehlerhaft an den Server gemeldet. Die am längsten gelaufene WU bleibt funktionstüchtig erhalten.
Ich wiederhole mit dieser WU den BOINC-Manager-Beendigungstest. Ergebnis: Auch diese Task wird fehlerhaft und damit gekillt. Hier das Log:
Code: Alles auswählen
27.10.2013 17:04:44 | RNA World | URL http://www.rnaworld.de/rnaworld/; Computer ID 169; resource share 100
27.10.2013 17:04:44 | RNA World | General prefs: from RNA World (last modified 21-Oct-2013 16:13:27)
27.10.2013 17:04:44 | RNA World | Computer location: home
27.10.2013 17:04:44 | RNA World | General prefs: no separate prefs for home; using your defaults
27.10.2013 17:04:44 | | Reading preferences override file
27.10.2013 17:04:44 | | Preferences:
27.10.2013 17:04:44 | | max memory usage when active: 7141.36MB
27.10.2013 17:04:44 | | max memory usage when idle: 7538.11MB
27.10.2013 17:04:44 | | max disk usage: 57.62GB
27.10.2013 17:04:44 | | don't use GPU while active
27.10.2013 17:04:44 | | (to change preferences, visit a project web site or select Preferences in the Manager)
27.10.2013 17:04:44 | | Not using a proxy
27.10.2013 17:04:45 | RNA World | Restarting task cmsvm_GA-p[b-Lin64f-2]_1_Dyadobacter-fermentans-DSM-18053_CP001619.cir.EMBL_RF00028_Intron_gpI_1358679723_773_0 using cmsearch3 version 103 (vbox64) in slot 5
27.10.2013 17:04:45 | RNA World | Sending scheduler request: To fetch work.
27.10.2013 17:04:45 | RNA World | Requesting new tasks for CPU
27.10.2013 17:05:06 | Quake-Catcher Network | Restarting task qcnq_034832_0 using qcnsensor version 733 (nci) in slot 2
27.10.2013 17:05:06 | WUProp@Home | Restarting task wu_v4_1381488756_675629_0 using data_collect_v4 version 408 (nci) in slot 1
27.10.2013 17:05:07 | RNA World | Scheduler request completed: got 0 new tasks
27.10.2013 17:05:07 | RNA World | No tasks sent
27.10.2013 17:05:07 | RNA World | No tasks are available for cmsearch VM (VirtualBox) 1.0.2
27.10.2013 17:05:07 | RNA World | Für die gewählten Anwendungen ist keine Arbeit verfügbar.
27.10.2013 17:05:12 | Quake-Catcher Network | Sending scheduler request: To send trickle-up message.
27.10.2013 17:05:12 | Quake-Catcher Network | Not requesting tasks: non CPU intensive
27.10.2013 17:05:14 | Quake-Catcher Network | Scheduler request completed
27.10.2013 17:05:14 | Quake-Catcher Network | Project has no tasks available
27.10.2013 17:08:00 | RNA World | Computation for task cmsvm_GA-p[b-Lin64f-2]_1_Dyadobacter-fermentans-DSM-18053_CP001619.cir.EMBL_RF00028_Intron_gpI_1358679723_773_0 finished
27.10.2013 17:08:00 | RNA World | Output file cmsvm_GA-p[b-Lin64f-2]_1_Dyadobacter-fermentans-DSM-18053_CP001619.cir.EMBL_RF00028_Intron_gpI_1358679723_773_0_0 for task cmsvm_GA-p[b-Lin64f-2]_1_Dyadobacter-fermentans-DSM-18053_CP001619.cir.EMBL_RF00028_Intron_gpI_1358679723_773_0 absent
27.10.2013 17:08:00 | RNA World | Output file cmsvm_GA-p[b-Lin64f-2]_1_Dyadobacter-fermentans-DSM-18053_CP001619.cir.EMBL_RF00028_Intron_gpI_1358679723_773_0_1 for task cmsvm_GA-p[b-Lin64f-2]_1_Dyadobacter-fermentans-DSM-18053_CP001619.cir.EMBL_RF00028_Intron_gpI_1358679723_773_0 absent
27.10.2013 17:08:49 | RNA World | update requested by user
27.10.2013 17:08:53 | RNA World | Sending scheduler request: Requested by user.
27.10.2013 17:08:53 | RNA World | Reporting 1 completed tasks
27.10.2013 17:08:53 | RNA World | Requesting new tasks for CPU
27.10.2013 17:08:55 | RNA World | Scheduler request completed: got 0 new tasks
27.10.2013 17:08:55 | RNA World | No tasks sent
27.10.2013 17:08:55 | RNA World | No tasks are available for cmsearch VM (VirtualBox) 1.0.2
27.10.2013 17:08:55 | RNA World | Für die gewählten Anwendungen ist keine Arbeit verfügbar.
Ich heute ab ins Labor, den i7 (Windows 7 Pro x64) testen, um zu schauen, ob das Problem architekturabhängig ist. Dort laufen ebenfalls drei Prozesse (ca. 185 Std. jeweils):
14920970 (Paket 6330692)
14920895 (Paket 6330722)
14920709 (Paket 6330694)
Pausieren Null Problem. BOINC-Manager-Beendigungstest: Null Problem (!) - also Unterschied zur AMD-Architektur.
Ich starte die Maschine neu: Alle drei Tasks krepieren (Berechnungsfehler). Log:
Code: Alles auswählen
28.10.2013 10:47:15 | | No config file found - using defaults
28.10.2013 10:47:15 | | Starting BOINC client version 7.0.64 for windows_x86_64
28.10.2013 10:47:15 | | log flags: file_xfer, sched_ops, task
28.10.2013 10:47:15 | | Libraries: libcurl/7.25.0 OpenSSL/1.0.1 zlib/1.2.6
28.10.2013 10:47:15 | | Data directory: C:\ProgramData\BOINC
28.10.2013 10:47:15 | | Running under account Intas2013
28.10.2013 10:47:15 | | Processor: 8 GenuineIntel Intel(R) Core(TM) i7-3770 CPU @ 3.40GHz [Family 6 Model 58 Stepping 9]
28.10.2013 10:47:15 | | Processor features: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss htt tm pni ssse3 cx16 sse4_1 sse4_2 popcnt aes syscall nx lm vmx smx tm2 pbe
28.10.2013 10:47:15 | | OS: Microsoft Windows 7: Professional x64 Edition, Service Pack 1, (06.01.7601.00)
28.10.2013 10:47:15 | | Memory: 7.89 GB physical, 15.78 GB virtual
28.10.2013 10:47:15 | | Disk: 232.11 GB total, 174.99 GB free
28.10.2013 10:47:15 | | Local time is UTC +1 hours
28.10.2013 10:47:15 | | VirtualBox version: 4.2.16
28.10.2013 10:47:15 | | OpenCL: Intel GPU 0: Intel(R) HD Graphics 4000 (driver version 8.15.10.2639, device version OpenCL 1.1, 1624MB, 1624MB available, 45 GFLOPS peak)
28.10.2013 10:47:15 | Einstein@Home | URL http://einstein.phys.uwm.edu/; Computer ID 8991340; resource share 100
28.10.2013 10:47:15 | pogs | URL http://pogs.theskynet.org/pogs/; Computer ID 7897; resource share 100
28.10.2013 10:47:15 | Quake-Catcher Network | URL http://qcn.stanford.edu/sensor/; Computer ID 28119; resource share 100
28.10.2013 10:47:15 | WUProp@Home | URL http://wuprop.boinc-af.org/; Computer ID 54138; resource share 100
28.10.2013 10:47:15 | RNA World | URL http://www.rnaworld.de/rnaworld/; Computer ID 26070; resource share 100
28.10.2013 10:47:15 | RNA World | General prefs: from RNA World (last modified 21-Oct-2013 16:13:27)
28.10.2013 10:47:15 | RNA World | Host location: none
28.10.2013 10:47:15 | RNA World | General prefs: using your defaults
28.10.2013 10:47:15 | | Reading preferences override file
28.10.2013 10:47:15 | | Preferences:
28.10.2013 10:47:15 | | max memory usage when active: 6462.83MB
28.10.2013 10:47:15 | | max memory usage when idle: 7270.69MB
28.10.2013 10:47:15 | | max disk usage: 10.00GB
28.10.2013 10:47:15 | | don't use GPU while active
28.10.2013 10:47:15 | | (to change preferences, visit a project web site or select Preferences in the Manager)
28.10.2013 10:47:15 | | Not using a proxy
28.10.2013 10:47:18 | | Suspending GPU computation - computer is in use
28.10.2013 10:47:18 | RNA World | Restarting task cmsvm_GA-p[e20-30MB_Lin64f]_1_Caenorhabditis-briggsae_CU538969.lin.EMBL_RF00028_Intron_gpI_1349111823_4144_1 using cmsearch3 version 103 (vbox64) in slot 10
28.10.2013 10:47:18 | RNA World | Restarting task cmsvm_GA-p[e20-30MB_Lin64f]_1_Oryza-sativa-Japonica-Group_AP008215.lin.EMBL_RF00028_Intron_gpI_1349111823_53536_2 using cmsearch3 version 103 (vbox64) in slot 9
28.10.2013 10:47:18 | RNA World | Sending scheduler request: To fetch work.
28.10.2013 10:47:18 | RNA World | Requesting new tasks for CPU
28.10.2013 10:47:31 | RNA World | Restarting task cmsvm_GA-p[e20-30MB_Lin64f]_1_Arabidopsis-thaliana-(thale-cress)_BA000014.lin.EMBL_RF00028_Intron_gpI_1349111823_1400_2 using cmsearch3 version 103 (vbox64) in slot 7
28.10.2013 10:47:31 | Quake-Catcher Network | Restarting task qcnq_035413_0 using qcnsensor version 733 (nci) in slot 1
28.10.2013 10:47:31 | WUProp@Home | Restarting task wu_v4_1381488756_706540_0 using data_collect_v4 version 409 (nci) in slot 0
28.10.2013 10:47:35 | RNA World | Scheduler request completed: got 0 new tasks
28.10.2013 10:47:35 | RNA World | Project has no tasks available
28.10.2013 10:47:41 | Quake-Catcher Network | Sending scheduler request: To send trickle-up message.
28.10.2013 10:47:41 | Quake-Catcher Network | Not requesting tasks: non CPU intensive
28.10.2013 10:47:43 | Quake-Catcher Network | Scheduler request completed
28.10.2013 10:47:43 | Quake-Catcher Network | Project has no tasks available
28.10.2013 10:49:24 | RNA World | Computation for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Caenorhabditis-briggsae_CU538969.lin.EMBL_RF00028_Intron_gpI_1349111823_4144_1 finished
28.10.2013 10:49:24 | RNA World | Output file cmsvm_GA-p[e20-30MB_Lin64f]_1_Caenorhabditis-briggsae_CU538969.lin.EMBL_RF00028_Intron_gpI_1349111823_4144_1_0 for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Caenorhabditis-briggsae_CU538969.lin.EMBL_RF00028_Intron_gpI_1349111823_4144_1 absent
28.10.2013 10:49:24 | RNA World | Output file cmsvm_GA-p[e20-30MB_Lin64f]_1_Caenorhabditis-briggsae_CU538969.lin.EMBL_RF00028_Intron_gpI_1349111823_4144_1_1 for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Caenorhabditis-briggsae_CU538969.lin.EMBL_RF00028_Intron_gpI_1349111823_4144_1 absent
28.10.2013 10:49:24 | RNA World | Computation for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Oryza-sativa-Japonica-Group_AP008215.lin.EMBL_RF00028_Intron_gpI_1349111823_53536_2 finished
28.10.2013 10:49:24 | RNA World | Output file cmsvm_GA-p[e20-30MB_Lin64f]_1_Oryza-sativa-Japonica-Group_AP008215.lin.EMBL_RF00028_Intron_gpI_1349111823_53536_2_0 for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Oryza-sativa-Japonica-Group_AP008215.lin.EMBL_RF00028_Intron_gpI_1349111823_53536_2 absent
28.10.2013 10:49:24 | RNA World | Output file cmsvm_GA-p[e20-30MB_Lin64f]_1_Oryza-sativa-Japonica-Group_AP008215.lin.EMBL_RF00028_Intron_gpI_1349111823_53536_2_1 for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Oryza-sativa-Japonica-Group_AP008215.lin.EMBL_RF00028_Intron_gpI_1349111823_53536_2 absent
28.10.2013 10:49:24 | RNA World | Computation for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Arabidopsis-thaliana-(thale-cress)_BA000014.lin.EMBL_RF00028_Intron_gpI_1349111823_1400_2 finished
28.10.2013 10:49:24 | RNA World | Output file cmsvm_GA-p[e20-30MB_Lin64f]_1_Arabidopsis-thaliana-(thale-cress)_BA000014.lin.EMBL_RF00028_Intron_gpI_1349111823_1400_2_0 for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Arabidopsis-thaliana-(thale-cress)_BA000014.lin.EMBL_RF00028_Intron_gpI_1349111823_1400_2 absent
28.10.2013 10:49:24 | RNA World | Output file cmsvm_GA-p[e20-30MB_Lin64f]_1_Arabidopsis-thaliana-(thale-cress)_BA000014.lin.EMBL_RF00028_Intron_gpI_1349111823_1400_2_1 for task cmsvm_GA-p[e20-30MB_Lin64f]_1_Arabidopsis-thaliana-(thale-cress)_BA000014.lin.EMBL_RF00028_Intron_gpI_1349111823_1400_2 absent
28.10.2013 10:50:25 | RNA World | update requested by user
28.10.2013 10:50:27 | RNA World | Sending scheduler request: Requested by user.
28.10.2013 10:50:27 | RNA World | Reporting 3 completed tasks
28.10.2013 10:50:27 | RNA World | Requesting new tasks for CPU
28.10.2013 10:50:29 | RNA World | Scheduler request completed: got 0 new tasks
28.10.2013 10:50:29 | RNA World | Project has no tasks available
Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.
http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B
http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B
Re: offener Betatest für neue cmsearch VM Anwendung
Offensichtlich. Wobei mein AMD FX bisher keine Probleme macht. Ein schwaches Indiz dass es wirklich an der K10 CPU (Virtualisierung / Speichermanagement) liegen könnte und nicht z.B. am Chipsatz.Michael H.W. Weber hat geschrieben:Pausieren Null Problem. BOINC-Manager-Beendigungstest: Null Problem (!) - also Unterschied zur AMD-Architektur.
Was mich interessieren würde: Hattest Du BOINC im Autostart oder nach Abschluss des Bootens manuell gestartet?Michael H.W. Weber hat geschrieben:Ich heute ab ins Labor, den i7 (Windows 7 Pro x64) testen, um zu schauen, ob das Problem architekturabhängig ist. (...) Ich starte die Maschine neu: Alle drei Tasks krepieren (Berechnungsfehler).
Anderes Thema: Hat schon jemand außer Jacob Klein das neue BOINC v7.2.24+ getestet, welches den tatsächlichen RAM-Bedarf der VMs besser berücksichtigen soll?
http://boinc.berkeley.edu/dl/
http://www.rnaworld.de/rnaworld/forum_t ... postid=338
Gruss
- Michael H.W. Weber
- Vereinsvorstand
- Beiträge: 22431
- Registriert: 07.01.2002 01:00
- Wohnort: Marpurk
- Kontaktdaten:
Re: offener Betatest für neue cmsearch VM Anwendung
Wir bei mir stets basierend auf den Standardinstallationsbedingungen per Autostart gestartet.Beorn hat geschrieben:Was mich interessieren würde: Hattest Du BOINC im Autostart oder nach Abschluss des Bootens manuell gestartet?
Übrigens noch eine Info: Ich habe mir anlässlich der diversen Berichte hier auf dem AMD auch in den drei Slots die stderr-Dateien angesehen. Keine hatte eine auffällige Größe, will heißen, sie lagen so bei um die 30 MB maximal.
Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.
http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B
http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B
Re: offener Betatest für neue cmsearch VM Anwendung
Meiner ungefragte Meinung nach liegt es nicht am Architektur aber am wrapper und Speicherbedarf.
Michael hat maximal 6-7 GB verfügbar und hat drei Aufgaben. Jede VM möchte 4GB reservieren.
Ich habe mit meiner einstige Aufgabe Null Probleme, obwohl ich die Aufgabe mindestens einmal am Tag anhalte und nicht im Speicher verwahre.
Manchmal BOINC abschliese oder sogar den PC neustarte AMD Phenom 9350e Quad mit 8GB memory.
Darauf laufen auch noch BOINC VM's für T4T und climateathome.
Wenn ich die Tasks Ergebnisse / Diskussion so anschaue, ist die Hauptursache des Problems, dass BOINC bei vboxwrapper-26028 beim anhalten einer Aufgabe nicht immer erfolgreich ist beim beenden von VBoxHeadless.exe.
Wenn dann die Aufgabe weiter machen möchte, ist die vom noch laufende VBoxHeadless.exe besetzt und BOINC endet mit einem Fehler.
Soweit ich die neueste vboxwrapper-26029 mit T4T getestet habe, wird VBoxHeadless.exe jetzt von BOINC nach ungefähr 15 Sekunden gekilled nach einem suspend.
Beim VM restart, hat BOINC wieder die einstige Kontrolle und kann vom Checkpoint weiter machen.
Ein anderer Unterschied, ist das VBoxHeadless.exe auf den niedrigsten Priorität läuft und nicht mehr eine Prio höher als den wrapper selbst.
Ich habe v26029 mit/für RNA noch nicht testen können, weil ich erst die seit 18 Sept. laufende Aufgabe valid abliefern möchte.
Michael hat maximal 6-7 GB verfügbar und hat drei Aufgaben. Jede VM möchte 4GB reservieren.
Ich habe mit meiner einstige Aufgabe Null Probleme, obwohl ich die Aufgabe mindestens einmal am Tag anhalte und nicht im Speicher verwahre.
Manchmal BOINC abschliese oder sogar den PC neustarte AMD Phenom 9350e Quad mit 8GB memory.
Darauf laufen auch noch BOINC VM's für T4T und climateathome.
Wenn ich die Tasks Ergebnisse / Diskussion so anschaue, ist die Hauptursache des Problems, dass BOINC bei vboxwrapper-26028 beim anhalten einer Aufgabe nicht immer erfolgreich ist beim beenden von VBoxHeadless.exe.
Wenn dann die Aufgabe weiter machen möchte, ist die vom noch laufende VBoxHeadless.exe besetzt und BOINC endet mit einem Fehler.
Soweit ich die neueste vboxwrapper-26029 mit T4T getestet habe, wird VBoxHeadless.exe jetzt von BOINC nach ungefähr 15 Sekunden gekilled nach einem suspend.
Beim VM restart, hat BOINC wieder die einstige Kontrolle und kann vom Checkpoint weiter machen.
Ein anderer Unterschied, ist das VBoxHeadless.exe auf den niedrigsten Priorität läuft und nicht mehr eine Prio höher als den wrapper selbst.
Ich habe v26029 mit/für RNA noch nicht testen können, weil ich erst die seit 18 Sept. laufende Aufgabe valid abliefern möchte.
Re: offener Betatest für neue cmsearch VM Anwendung
Es wird einsam hier oben. Den hier hat die Flak zerrissen. Und das ausgerechnet beim Schnabeltier, dem dicksten ... ähm ... 'Fisch' in meinem Köcher.Beorn hat geschrieben:Heute hat ein zweiter Flügelmann den Schleudersitz ausgelöst.
Spricht das nicht dafür, den neuen Wrapper auch hier serverseitig einzusetzen? Und vielleicht gleichzeitig auch die Verwendung von BOINC v7.2.24+ zu empfehlen? Ich hab's mal auf einem der Rechner installiert, kann aber noch nichts zum veränderten Scheduling sagen, da ABC@home dort noch ein paar Tage im Panikmodus ist...Crystal Pellet hat geschrieben:Soweit ich die neueste vboxwrapper-26029 mit T4T getestet habe, wird VBoxHeadless.exe jetzt von BOINC nach ungefähr 15 Sekunden gekilled nach einem suspend.
Beim VM restart, hat BOINC wieder die einstige Kontrolle und kann vom Checkpoint weiter machen.
Ein anderer Unterschied, ist das VBoxHeadless.exe auf den niedrigsten Priorität läuft und nicht mehr eine Prio höher als den wrapper selbst.
-
- Admin
- Beiträge: 1920
- Registriert: 23.02.2010 22:12
Re: offener Betatest für neue cmsearch VM Anwendung
Vorerst wird es erstmal so bleiben. Ich habe im November etwas mehr Zeit und werde mich dann darum kümmern das der neue vboxwrapper_26029 kommt. Ich überlege außerdem Serverseitig die Anzahl der gleichzeitigen VM's auf 1 zu limitieren. Wenn das erfolgreich ist dann können wir ja überlegen die Mindestversion für BOINC (nur für cmsearch VM) anzuheben. Ich würde das aber ungern von Anfang an machen weil die 7.2.24 noch in der Entwicklung ist. Sollte mittlerweile ein Release erfolgen sieht es natürlich anders aus.
Re: offener Betatest für neue cmsearch VM Anwendung
Was BOINC 7.2.24 angeht: Jetzt geht die RNA Wutze vom 10.10. auch in 'Hohe Priorität' weil mein BOINC natürlich nicht weiß, dass serverseitig die Deadline bereits auf den 29. November verlängert wurde - ursprünglich war's morgen 16:04 Uhr. Auch seltsam: Der BM startet zwar nur eine RNA VM (wie nach Speicherbedarf zu erwarten), aber er stoppt bis auf eine alle ABC@home Wutzen, so dass nur noch zwei von acht CPU-Threads ausgelastet werden. So wird das nix.
- Dateianhänge
-
- BM 7.2.24.PNG (44.99 KiB) 1920 mal betrachtet