Nach falscher Treiberinstallation keine GUI mehr

Probleme mit einem Clientprogramm? Oder einen Tipp dazu? Dann hier posten...
Nachricht
Autor
vdvogt
FAQ-Leser
FAQ-Leser
Beiträge: 164
Registriert: 25.01.2015 15:21

Re: Nach falscher Treiberinstallation keine GUI mehr

#37 Ungelesener Beitrag von vdvogt » 28.04.2016 19:29

Hallo Christian,
heute habe ich Stretch installiert und anschiessend auch die nvidia-Treiber aus den Debian-Quellen.
lspci -nn | grep VGA hat meine Titan Z angezeigt.

Soweit ist alles gut gelaufen.

Anschliessend habe ich Boinc-Manager und Boinc-Client installiert (jeweils Version 7.6.31), auch da keine Probleme.
Aber als ich dann Projekte hinzufuegen wollte, hat der Boic-Manager angezeigt, dass er wieder keine nutzbare GPU gefunden hat!

Leider habe ich erst danach in den Nvidia X-Server Settings im PowerMixer das DP bei beiden GPUs ausgeschaltet.
Dann habe ich die lokalen Settings im BM nochmal einlesen lassen, aber es wurde keine nutzbare GPU gefunden.

Wie kann ich jetzt dem BM beibringen, dass ich eine Titan Z habe?

Hoffentlich sagst jetzt nicht, dass ich Boinc loeschen und neu installieren muss.

Viele Gruesse
Veit

vdvogt
FAQ-Leser
FAQ-Leser
Beiträge: 164
Registriert: 25.01.2015 15:21

Re: Nach falscher Treiberinstallation keine GUI mehr

#38 Ungelesener Beitrag von vdvogt » 29.04.2016 09:39

Hallo,
ich habe mal das "allwissende" Internet angezapft und folgendes bei den ubuntuusern gefunden:

[Zitatanfang]
Für Nvidia Grafikkarten das Archiv hier herunterlanden https://developer.nvidia.com/cuda-downloads Die Datei zum ausführen markieren und mit

sudo cuda_5.0.35*.run

die Software installieren.

Nach einem Neustart des Boinc-Clienten wird die Grafikkarte dann in den Meldungen angezeigt.

| CAL: ATI GPU 0: AMD Radeon HD 7700 series (Cape Verde) (CAL version 1.4.1741, 1024MB, 864MB available, 3520 GFLOPS peak)
| OpenCL: AMD/ATI GPU 0: AMD Radeon HD 7700 series (Cape Verde) (driver version 1124.2 (VM), device version OpenCL 1.2 AMD-APP (1124.2), 1024MB, 864MB available, 3520 GFLOPS peak)

Und kann dann von einem entsprechendem Projekt genutzt werden.

Ubuntu 14.04 - nVidia Grafikkarte wird in Boinc nicht erkannt
(Dieser Eintrag muss noch getestet werden - bei mir hat es funktioniert, bitte ggf. korrigieren)

Um die Grafikkartentreiber korrekt zu installieren sind neben dem nvidia-3xx Paket auch noch folgende zusätzliche Pakete erforderlich:
nvidia-3xx-uvm, nvdia-opencl-icd-3xx, nvidia-modprobe

Nach der Installation dieser Pakete ist noch die Ausführung von nvidia-modprobe mit sudo nötig:

sudo nvidia-modprobe

Nach einem Neustarten des Boinc-Daemons sollte die GPU erkannt werden:

sudo service boinc-client restart
[Zitatende]

Der Beitrag ist zwar schon etwas aelter, aber trotzdem die Frage:
Welche der o.a. Pakete (cuda_5.0.35*.run, nvidia-3xx-uvm, nvdia-opencl-icd-3xx, nvidia-modprobe) werden immer noch benoetigt?

Viele Gruesse
Veit

ChristianB
Admin
Admin
Beiträge: 1920
Registriert: 23.02.2010 22:12

Re: Nach falscher Treiberinstallation keine GUI mehr

#39 Ungelesener Beitrag von ChristianB » 29.04.2016 10:03

vdvogt hat geschrieben:Der Beitrag ist zwar schon etwas aelter, aber trotzdem die Frage:
Welche der o.a. Pakete (cuda_5.0.35*.run, nvidia-3xx-uvm, nvdia-opencl-icd-3xx, nvidia-modprobe) werden immer noch benoetigt?
Wenn du den nvidia trieber aus den Debianquellen isntalliert hast dann bitte unter keinen Umständen irgendwas direkt von nvidia nachinstallieren. Das kann nur in die Hose gehen.

Ich bräuchte mal eine Übersicht was du aktuell an nvidia und cuda Paketen überhaupt installiert hast. Also die Ausgabe von:

Code: Alles auswählen

dpkg -l | egrep "nvidia|cuda|opencl|boinc"
Dann kann ich dir sagen welche Paketenoch fehlen. Ausgehend von dem was ich bei mir auf den beiden Rechnern installiert habe. Der BOINC Client sucht immer beim start nach GPUs. Du musst also nur den Client neu starten auf Stretch mittels

Code: Alles auswählen

sudo systemctl restart boinc-client.service
Dann kannst du im Log nachschauen was er erkannt hat. Du hast schon den richtigen Client installiert welcher meinen fix zur Nvidia Erkennung beinhaltet.

@Michael: Eine goldene Lösung gibt es immer nur für eine bestimmte Kombination von GPU und Debian. Je neuer die GPU desto schwieriger eine goldene Lösung zu finden.

vdvogt
FAQ-Leser
FAQ-Leser
Beiträge: 164
Registriert: 25.01.2015 15:21

Re: Nach falscher Treiberinstallation keine GUI mehr

#40 Ungelesener Beitrag von vdvogt » 29.04.2016 11:18

Hallo Christian,
anbei die Ausgabeinformationen:

dpkg -l | egrep "nvidia|cuda|opencl|boinc"
ii boinc-client 7.6.31+dfsg-6 amd64 core client for the BOINC distributed computing infrastructure
ii boinc-manager 7.6.31+dfsg-6 amd64 GUI to control and monitor the BOINC core client
ii glx-alternative-nvidia 0.7.2 amd64 allows the selection of NVIDIA as GLX provider
ii libboinc7:amd64 7.6.31+dfsg-6 amd64 libraries of BOINC the client depends on
ii libegl1-nvidia:amd64 352.79-7 amd64 NVIDIA binary EGL libraries
ii libgl1-nvidia-glx:amd64 352.79-7 amd64 NVIDIA binary OpenGL libraries
ii libgles1-nvidia:amd64 352.79-7 amd64 NVIDIA binary OpenGL|ES 1.x libraries
ii libgles2-nvidia:amd64 352.79-7 amd64 NVIDIA binary OpenGL|ES 2.x libraries
ii libnvidia-eglcore:amd64 352.79-7 amd64 NVIDIA binary EGL core libraries
ii libnvidia-ml1:amd64 352.79-7 amd64 NVIDIA Management Library (NVML) runtime library
ii nvidia-alternative 352.79-7 amd64 allows the selection of NVIDIA as GLX provider
ii nvidia-driver 352.79-7 amd64 NVIDIA metapackage
ii nvidia-driver-bin 352.79-7 amd64 NVIDIA driver support binaries
ii nvidia-installer-cleanup 20151021+4 amd64 cleanup after driver installation with the nvidia-installer
ii nvidia-kernel-common 20151021+4 amd64 NVIDIA binary kernel module support files
ii nvidia-kernel-dkms 352.79-7 amd64 NVIDIA binary kernel module DKMS source
ii nvidia-kernel-support 352.79-7 amd64 NVIDIA binary kernel module support files
ii nvidia-legacy-check 352.79-7 amd64 check for NVIDIA GPUs requiring a legacy driver
ii nvidia-modprobe 361.28-1 amd64 utility to load NVIDIA kernel modules and create device nodes
ii nvidia-persistenced 364.15-2 amd64 daemon to maintain persistent software state in the NVIDIA driver
ii nvidia-settings 340.93-1 amd64 tool for configuring the NVIDIA graphics driver
ii nvidia-support 20151021+4 amd64 NVIDIA binary graphics driver support files
ii nvidia-vdpau-driver:amd64 352.79-7 amd64 Video Decode and Presentation API for Unix - NVIDIA driver
ii xserver-xorg-video-nvidia 352.79-7 amd64 NVIDIA binary Xorg driver

Das resetten hat leider keinen Erfolg gehabt: Immer noch keine GPU.

Viele Gruesse
Veit

ChristianB
Admin
Admin
Beiträge: 1920
Registriert: 23.02.2010 22:12

Re: Nach falscher Treiberinstallation keine GUI mehr

#41 Ungelesener Beitrag von ChristianB » 29.04.2016 14:11

Das die GPU nicht erkannt wird liegt daran das dir noch Bibliotheken fehlen. Ich habe mal einen Vergleich mit meiner Liste gemacht und folgende Pakete habe ich zusätzlich installiert:

Code: Alles auswählen

libcuda1
libcudart6.0
libcudart6.5
libcudart7.0
nvidia-opencl-common     
nvidia-opencl-icd
nvidia-smi               
ocl-icd-libopencl1
Bitte erstmal nur diese installieren, falls noch zusätzliche Pakete automatisch installiert werden sollen (oder nicht installiert werden können weil Konflikte bestehen) dann frag bitte vorher nach wenn du dir nicht sicher bist was diese Pakete bewirken.

Für Einstein@home habe ich noch zusätzlich installiert:

Code: Alles auswählen

libgl1-nvidia-glx:i386
Aber ich bin mir jetzt auch nicht mehr sicher ob das noch benötigt wird und wenn ja für welche Suche. Um das i386 Paket zu installieren muss erst noch die Platform eingerichtet werden. Das sollten wir aber erst machen wenn deine Karte von BOINC richtig erkannt wird.

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22431
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Nach falscher Treiberinstallation keine GUI mehr

#42 Ungelesener Beitrag von Michael H.W. Weber » 29.04.2016 14:18

Für Ubuntu mit NVIDIA-GPUs:

viewtopic.php?p=158760#p158760

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

vdvogt
FAQ-Leser
FAQ-Leser
Beiträge: 164
Registriert: 25.01.2015 15:21

Re: Nach falscher Treiberinstallation keine GUI mehr

#43 Ungelesener Beitrag von vdvogt » 29.04.2016 14:24

Hallo Christian,
danke!
Bin gerade dabei das zu installieren, allerdings konnte apt-get libcudart6.0 und 6.5 nicht finden, die habe ich einfach mal weggelassen, es wird ja das neuere 7.0 installiert.
Ausserdem hat apt noch das Paket
nvidia-cuda-mps
vorgeschlagen.
Habe ich aber vorerst mal nicht installiert.

Nach der Installation muss ich ja den boinc-client neu starten mit
/etc/init.d/boinc-client restart

Soweit ich weiss, gibt es fuer systemd aber einen anderen Befehl?

Aussderdem habe ich noch eine Frage zu meinem Arbeitsrechner, dort verbindet sich seit der Neuinstallation der BM nicht mehr mit den BCs auf den anderen Rechnern.
Woran kann das liegen?

Viele Gruesse
Veit

ChristianB
Admin
Admin
Beiträge: 1920
Registriert: 23.02.2010 22:12

Re: Nach falscher Treiberinstallation keine GUI mehr

#44 Ungelesener Beitrag von ChristianB » 29.04.2016 14:30

Das init skript wird auch noch unterstützt aber du kannst auch gleich

Code: Alles auswählen

systemctl restart boinc-client.service
nehmen, das ist der systemd Befehl. Das Verbinden hängt an zwei Sachen. Das eine ist das Passwort in gui_rpc_auth.cfg und das andere ist die Liste der zugelassenen Rechner in remote_hosts.cfg. Dein Arbeitsrechner muss bei allen BCs in der zweiten Datei drinn stehen (als name oder IP) und du musst das Passwort was in der ersten Datei steht im BM auf dem Arbeitsrechner eingeben wenn du dich verbindest.

vdvogt
FAQ-Leser
FAQ-Leser
Beiträge: 164
Registriert: 25.01.2015 15:21

Re: Nach falscher Treiberinstallation keine GUI mehr

#45 Ungelesener Beitrag von vdvogt » 29.04.2016 14:43

Hallo Christian,
vielen, vielen Dank!!!

Jetzt ist meine Titan Z wieder am Werk!

Aber das Problem mit dem Arbeitsrechner habe ich noch nicht geloest.
Woran koennte das liegen?
In der remote.conf der anderen Rechner steht ueberall die IP des Rechners drin.

Gruesse
Veit

vdvogt
FAQ-Leser
FAQ-Leser
Beiträge: 164
Registriert: 25.01.2015 15:21

Re: Nach falscher Treiberinstallation keine GUI mehr

#46 Ungelesener Beitrag von vdvogt » 29.04.2016 14:59

Hallo nochmal,
ich habe gerade mal beobachtet wie schnell denn meine Titan Z ist.
Arbeitspakete von Collatz, die mit 30:06 angegeben sind, werden inerhalb von 6:36 abgearbeitet!
Das ist ein Faktor 4,56!

Das ist flott!

Gruesse
Veit

vdvogt
FAQ-Leser
FAQ-Leser
Beiträge: 164
Registriert: 25.01.2015 15:21

Re: Nach falscher Treiberinstallation keine GUI mehr

#47 Ungelesener Beitrag von vdvogt » 03.05.2016 15:51

Hallo Christian,
ich habe nochmal eine Frage zu den nvidia- und boinc-Paketen:

Bei der Installation werden auch folgende Pakete vorgeschlagen:
nvidia-cuda-mps
boinc-client-opencl
boinc-client-nvidia-cuda

Werden die wirklich gebraucht?
Bisher habe ich die nicht mitinstalliert.
Wenn ja, unter welchen Umstaenden muss/sollte ich die installieren.

Desweiteren habe ich eine Frage zu meiner Titan Z:
Die hat bisher immer mit beiden GPUs gerechnet. Seit Gestern aber rechnet sie nur noch mit GPU0.
Auch ein Restart des Boinc-Clients hat an der Situation nichts geaendert.
Das ist die Ausgabe von Boinc nach dem Restart:

Di 03 Mai 2016 14:00:09 UTC | | Starting BOINC client version 7.6.31 for x86_64-pc-linux-gnu
Di 03 Mai 2016 14:00:09 UTC | | log flags: file_xfer, sched_ops, task
Di 03 Mai 2016 14:00:09 UTC | | Libraries: libcurl/7.47.0 OpenSSL/1.0.2g zlib/1.2.8 libidn/1.32 libssh2/1.5.0 nghttp2/1.9.2 librtmp/2.3
Di 03 Mai 2016 14:00:09 UTC | | Data directory: /var/lib/boinc-client
Di 03 Mai 2016 14:00:09 UTC | | CUDA: NVIDIA GPU 0: GeForce GTX TITAN Z (driver version 352.79, CUDA version 7.5, compute capability 3.5, 4096MB, 4009MB available, 5043 GFLOPS peak)
Di 03 Mai 2016 14:00:09 UTC | | CUDA: NVIDIA GPU 1: GeForce GTX TITAN Z (driver version 352.79, CUDA version 7.5, compute capability 3.5, 4096MB, 4009MB available, 5043 GFLOPS peak)
Di 03 Mai 2016 14:00:09 UTC | | OpenCL: NVIDIA GPU 0: GeForce GTX TITAN Z (driver version 352.79, device version OpenCL 1.2 CUDA, 6143MB, 4009MB available, 5043 GFLOPS peak)
Di 03 Mai 2016 14:00:09 UTC | | OpenCL: NVIDIA GPU 1: GeForce GTX TITAN Z (driver version 352.79, device version OpenCL 1.2 CUDA, 6144MB, 4009MB available, 5043 GFLOPS peak)
Di 03 Mai 2016 14:00:09 UTC | | Host name: Ci7-293
Di 03 Mai 2016 14:00:09 UTC | | Processor: 8 GenuineIntel Intel(R) Core(TM) i7 CPU 870 @ 2.93GHz [Family 6 Model 30 Stepping 5]
Di 03 Mai 2016 14:00:09 UTC | | Processor features: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc aperfmperf pni dtes64 monitor ds_cpl vmx smx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm tpr_shadow vnmi flexpriority ept vpid dtherm ida
Di 03 Mai 2016 14:00:09 UTC | | OS: Linux: 4.5.0-1-amd64

Es werden beide GPUs erkannt.
Pakete zum Rechnen sind auch genug da.
Was kann ich machen, damit wieder beide GPUs benutzt werden?

Viele Gruesse
Veit

ChristianB
Admin
Admin
Beiträge: 1920
Registriert: 23.02.2010 22:12

Re: Nach falscher Treiberinstallation keine GUI mehr

#48 Ungelesener Beitrag von ChristianB » 03.05.2016 16:54

vdvogt hat geschrieben:Bei der Installation werden auch folgende Pakete vorgeschlagen:
nvidia-cuda-mps
boinc-client-opencl
boinc-client-nvidia-cuda

Werden die wirklich gebraucht?
Bisher habe ich die nicht mitinstalliert.
Wenn ja, unter welchen Umstaenden muss/sollte ich die installieren.
Das erste Paket kannst du ruhig installieren. Deine Titan Z unterstützt das feature was damit installiert wird. Ob das auch von den Apps genutzt wird kann ich dir nicht sagen. Vom lesen der Beschreibung her würde ich sagen sollte es dir helfen wenn du mehrere Aufgaben gleichzeitig berechnen lassen willst. Das ist aber immer mit herumprobieren verbunden weil die Ergebnisse meist nicht validieren (zu Starke Abweichungen gegenüber anderen GPUs).
Die anderen beiden Pakete sind sogenannte Metapakete welche nur Abhängigkeiten enthalten und selbst keine Dateien installieren. Mit meiner Liste solltest du jetzt schon alles installiert haben was diese beiden Pakete auch installieren wollen. Du kannst diese auch installieren um bei zukünftigen Updates auf dem laufenden zu bleiben. Meine Erfahrung ist aber das man das nicht unbedingt braucht.
vdvogt hat geschrieben:Desweiteren habe ich eine Frage zu meiner Titan Z:
Die hat bisher immer mit beiden GPUs gerechnet. Seit Gestern aber rechnet sie nur noch mit GPU0.
Auch ein Restart des Boinc-Clients hat an der Situation nichts geaendert.
...
Es werden beide GPUs erkannt.
Pakete zum Rechnen sind auch genug da.
Was kann ich machen, damit wieder beide GPUs benutzt werden?
Es kann sein das du bei der vorherigen Installation schonmal eine cc_config.xml Datei angelegt hattest die jetzt natürlich weg ist. Du kannst das aber einfach nachholen. Du öffnest mit

Code: Alles auswählen

sudo nano /etc/boinc-client/cc_config.xml
die Datei und sehr weit unten findest du die Zeile:

Code: Alles auswählen

<use_all_gpus>0</use_all_gpus>
Die 0 machst du zu einer 1 und dann startest du den BOINC Client neu. Das sollte reichen. Standardmässig verwendet BOINC nur die Leistungsfähigste der GPUs wenn mehrere vom gleichen Hersteller detektiert werden.

MfG
Christian

Antworten

Zurück zu „Hilfe und Support“