Collatz nutzt ausschliesslich GPU0 auf einer Dual-GPU-GK

Probleme mit einem Clientprogramm? Oder einen Tipp dazu? Dann hier posten...
Nachricht
Autor
vdvogt
FAQ-Leser
FAQ-Leser
Beiträge: 164
Registriert: 25.01.2015 15:21

Collatz nutzt ausschliesslich GPU0 auf einer Dual-GPU-GK

#1 Ungelesener Beitrag von vdvogt » 10.05.2016 12:55

Hallo,
bei mir hat sich im Zusammenhang mit dem Kauf einer Dual-GPU Grafikkarte (ZOTAC Titan Z) folgendes Problem aufgetan:

Vormals liess ich nur GPUGRID auf der GPU rechnen, es wurden beide GPUs parallel genutzt.
Dann habe ich auch Collatz das Rechnen auf der GPU erlaubt.
Allerdings rechnete Collatz zunaechst ueberhaupt nicht auf der GPU.
Ich habe dann einige Tests gemacht:

1. GPUGPID alleine
Beide GPUs werden benutzt.

2a. GPUGRID auf GPU0, Collatz auf GPU1
NUR GPUGRID rechnet auf GPU0, Collatz nutzt GPU1 NICHT!

2b. Collatz auf GPU0, GPUGRID auf GPU1
Beide GPUs werden benutzt.

3. Collatz alleine
NUR GPU0 wird benutzt, GPU1 ist im Leerlauf!

Wer hat auch eine DUAL-GPU-Grafikkarte und kann dieses Phaenomen nachvollziehen?

Ich habe dieses Problem im Collatz-Forum beschrieben, dort schiebt man die Schuld auf BOINC, das koenne nicht an Collatz liegen.
Boinc kann aber nicht schuld daran sein, denn GPUGRID laeuft ja ordentlich auf beiden GPUs!

Wer kann zu diesem Problem was sagen?
Kann mir jemand helfen?
Vielleicht gibt es ja einen "Trick", wie ich Collatz dazu bringen kann, doch noch auf beiden GPUs zu rechnen?

Viele Gruesse
Veit

Benutzeravatar
Kolossus
TuX-omane
TuX-omane
Beiträge: 4277
Registriert: 26.10.2014 14:51

Re: Collatz nutzt ausschliesslich GPU0 auf einer Dual-GPU-GK

#2 Ungelesener Beitrag von Kolossus » 10.05.2016 18:22

Mal ins Blaue geschossen: Hast Du mal SLI ausprobiert?
Gruß Harald

Meine Kommentare sind grundsätzlich nicht Chauvinistischer, Misogynischer Xenophobischer, Homophobischer, Religionfeindlicher Natur, sondern dienen lediglich der Konversation, gelegentlichen Scherzen und repräsentieren ansonsten die schlichte, rheinische Denkungsweise.

Bilds

vdvogt
FAQ-Leser
FAQ-Leser
Beiträge: 164
Registriert: 25.01.2015 15:21

Re: Collatz nutzt ausschliesslich GPU0 auf einer Dual-GPU-GK

#3 Ungelesener Beitrag von vdvogt » 10.05.2016 19:46

Hallo Harald,
seit wann gibt es denn bei einer DUAL-GPU Grafikkarte SLI?

Die beiden GPUs sind in EINER Grafikkarte vereint und NICHT auf zwei verteilt!

Gruesse
Veit


PS: Erst richtig lesen, dann denken und danach erst schreiben;-)))

Benutzeravatar
X1900AIW
TuX-omane
TuX-omane
Beiträge: 2868
Registriert: 05.01.2008 16:34

Re: Collatz nutzt ausschliesslich GPU0 auf einer Dual-GPU-GK

#4 Ungelesener Beitrag von X1900AIW » 12.05.2016 18:25

Es gab sehr wohl SLI mit DualGPU Grafikkarten, hatte ich schon: 9800GX2 im Duett und Terzett.

Bilder im alten Computerbase Test zum Triple- und Quad SLI:
http://www.computerbase.de/2009-02/test ... sfire-x/2/

Spannend war - bezogen auf DC Applikationen - dann ob man nur per SLI Brücke deaktiviert und/oder auch in der GUI Software.

Ist doch erst 7 Jahre her, dass FAH für das Falten SLI aufdröseln konnte. :lol:
Zusammenkommen ist ein Beginn, Zusammenbleiben ist ein Fortschritt, Zusammenarbeiten ist ein Erfolg.
Henry Ford

vdvogt
FAQ-Leser
FAQ-Leser
Beiträge: 164
Registriert: 25.01.2015 15:21

Re: Collatz nutzt ausschliesslich GPU0 auf einer Dual-GPU-GK

#5 Ungelesener Beitrag von vdvogt » 12.05.2016 18:28

Hallo,
was traegt dieser Kommentar zur Loesung des Problems bei???

Gruesse
Veit

Benutzeravatar
X1900AIW
TuX-omane
TuX-omane
Beiträge: 2868
Registriert: 05.01.2008 16:34

Re: Collatz nutzt ausschliesslich GPU0 auf einer Dual-GPU-GK

#6 Ungelesener Beitrag von X1900AIW » 12.05.2016 20:13

Ich wollte lediglich hinweisen, dass verschiedene Applikationen SLI verknüpfte GPUs unterschiedlich erkennen und nutzen können. Deshalb die Verknüpfung manuell lösen, zum Testen.

Collatz rechnet OpenCL, GPUgrid rechnet CUDA. Alleine beim Start der WU könnte die jeweilige Applikationen andere Startbedingungen erwarten, freien VRAM Speicher in einem bestimmten Segment o.ä.

Ich würde folgendermaßen vorgehen: von beiden Projekten WUs herunterladen, aber nicht rechnen lassen. Ggf. anhalten und gestartete WUs löschen. Rechner runterfahren und neustarten. Gezielt die zu testenden WU Kombination sperren bzw. anhalten. Mit BOINC Parametern kann man gezielt GPU 0 oder GPU 1 als erstes die jeweilige WU (OpenCL bzw. CUDA) starten. Anhalten, BOINC Manager mit anderen Parametern neu starten. So kann man jede Kombination mit "jungfräulichen" WU austesten.

Kann mir vorstellen, es liegt an den genannten Startbedingungen. Oder der Zuteilung des VRAMs intern im GPU Gespann. Dann womöglich noch an Treiber Besonderheiten. CUDA Mehrfachberechnungen sehe ich als ausgereifter auf Nvidia GPUs. OpenCL scheint stärker abhängig von der Treibersituation zu sein, sind womöglich noch Intel OpenCL Treiber auf dem System installiert?

Hinweise genug.
Zusammenkommen ist ein Beginn, Zusammenbleiben ist ein Fortschritt, Zusammenarbeiten ist ein Erfolg.
Henry Ford

vdvogt
FAQ-Leser
FAQ-Leser
Beiträge: 164
Registriert: 25.01.2015 15:21

Re: Collatz nutzt ausschliesslich GPU0 auf einer Dual-GPU-GK

#7 Ungelesener Beitrag von vdvogt » 12.05.2016 21:36

Hallo X1900AIW,
ja, danke!

Ich hatte ja in meiner initialen Mitteilung am Beginn des Themas einige Tests aufgefuehrt.

Aus deinen Hinweisen ergibt sich fuer mich eine Frage:

Welche Boinc-Parameter muss ich wie veraendern?

Bitte um weitere Hinweise, die zur Aufklaerung des Falls dienlich sind ;-))

Viele Gruesse
Veit

Benutzeravatar
X1900AIW
TuX-omane
TuX-omane
Beiträge: 2868
Registriert: 05.01.2008 16:34

Re: Collatz nutzt ausschliesslich GPU0 auf einer Dual-GPU-GK

#8 Ungelesener Beitrag von X1900AIW » 13.05.2016 05:41

X1900AIW hat geschrieben:Deshalb die Verknüpfung manuell lösen, zum Testen.
Das würde ich zuerst klären, BOINC sehe ich nachrangig. Besitze selbst keine Titan oder neue DualGPU Generation, da müssten jene mit SLI Verbund aushelfen und ggf. mit Linux Betriebssystem und Nvidia Treiberumgebung.

[Konflikte mit den genannten Intel OpenCL Treibern sehe ich weiterhin, unter Windows hatte ich auf meinen System alle drei Treiber parallel laufen (AMD, Intel, Nvidia), das wurde im BOINC Manager auch so gemeldet. Zum Beispiel war es möglich, mit dem Tool Luxmark getrennt diese OpenCL Instanzen auszuwählen und rechnen zu lassen. Da wurden bereits Mängel und Performance Probleme offenbar. Lieber mit einem Tool abklären als gleich in die Echtberechnung von BOINC gehen, ist nur meine Meinung.]
Zusammenkommen ist ein Beginn, Zusammenbleiben ist ein Fortschritt, Zusammenarbeiten ist ein Erfolg.
Henry Ford

vdvogt
FAQ-Leser
FAQ-Leser
Beiträge: 164
Registriert: 25.01.2015 15:21

Re: Collatz nutzt ausschliesslich GPU0 auf einer Dual-GPU-GK

#9 Ungelesener Beitrag von vdvogt » 13.05.2016 09:18

Hallo X1900AIW,
es gibt bei der Titan Z keine SLI-Verknuepfung, da kann ich nichts verstellen, oder loesen.

Was koennte ich also noch machen, um Collatz dazu zu bewegen doch auf beiden GPUs zu rechnen?

Gruesse
Veit

Benutzeravatar
ClaudiusD
Vereinsmitglied
Vereinsmitglied
Beiträge: 1301
Registriert: 29.01.2013 16:52
Wohnort: Wien

Re: Collatz nutzt ausschliesslich GPU0 auf einer Dual-GPU-GK

#10 Ungelesener Beitrag von ClaudiusD » 13.05.2016 14:30

Hab noch keine Dual-GPU Karte gehabt, aber kann man das vielleicht bei der nVidia-Systemsteuerung deaktivieren?
Bild

vdvogt
FAQ-Leser
FAQ-Leser
Beiträge: 164
Registriert: 25.01.2015 15:21

Re: Collatz nutzt ausschliesslich GPU0 auf einer Dual-GPU-GK

#11 Ungelesener Beitrag von vdvogt » 21.06.2016 12:58

Hallo,
ich habe in den letzten tagen ein paar Tests gemacht:

1. Computer herunter gefahren und vollkommen auskuehlen lassen (vor allem die Grafikkarte)
Nach dem Hochfahren rechnen beide GPUs, alleerdings GPU1 nur ein paar Tasks, dann nur noch GPU0.

2. Computer nur wenige Minuten ausgeschaltet.
Nach dem Hochfahren rechnen manchmal beide, manchmal nur eine GPU.
Auch hier wie unter 1, wenn GPU1 rechnet, dann nur wenige Tasks.

Folgende Meldungen gibt mir BOinc aus:

Di 21 Jun 2016 11:39:49 UTC | | Starting BOINC client version 7.6.31 for x86_64-pc-linux-gnu
Di 21 Jun 2016 11:39:49 UTC | | log flags: file_xfer, sched_ops, task, coproc_debug
Di 21 Jun 2016 11:39:49 UTC | | Libraries: libcurl/7.47.0 OpenSSL/1.0.2g zlib/1.2.8 libidn/1.32 libssh2/1.5.0 nghttp2/1.9.2 librtmp/2.3
Di 21 Jun 2016 11:39:49 UTC | | Data directory: /var/lib/boinc-client
Di 21 Jun 2016 11:39:49 UTC | | [coproc] launching child process at /usr/bin/boinc
Di 21 Jun 2016 11:39:49 UTC | | [coproc] relative to directory /
Di 21 Jun 2016 11:39:49 UTC | | [coproc] with data directory /var/lib/boinc-client
Di 21 Jun 2016 11:39:51 UTC | | CUDA: NVIDIA GPU 0: GeForce GTX TITAN Z (driver version 352.79, CUDA version 7.5, compute capability 3.5, 4096MB, 4009MB available, 5043 GFLOPS peak)
Di 21 Jun 2016 11:39:51 UTC | | CUDA: NVIDIA GPU 1: GeForce GTX TITAN Z (driver version 352.79, CUDA version 7.5, compute capability 3.5, 4096MB, 4009MB available, 5043 GFLOPS peak)
Di 21 Jun 2016 11:39:51 UTC | | OpenCL: NVIDIA GPU 0: GeForce GTX TITAN Z (driver version 352.79, device version OpenCL 1.2 CUDA, 6143MB, 4009MB available, 5043 GFLOPS peak)
Di 21 Jun 2016 11:39:51 UTC | | OpenCL: NVIDIA GPU 1: GeForce GTX TITAN Z (driver version 352.79, device version OpenCL 1.2 CUDA, 6144MB, 4009MB available, 5043 GFLOPS peak)
Di 21 Jun 2016 11:39:51 UTC | | [coproc] NVIDIA library reports 2 GPUs
Di 21 Jun 2016 11:39:51 UTC | | [coproc] ATI: libaticalrt.so: cannot open shared object file: No such file or directory
Di 21 Jun 2016 11:39:51 UTC | | Host name: Ci7-293
Di 21 Jun 2016 11:39:51 UTC | | Processor: 8 GenuineIntel Intel(R) Core(TM) i7 CPU 870 @ 2.93GHz [Family 6 Model 30 Stepping 5]
Di 21 Jun 2016 11:39:51 UTC | | Processor features: fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc aperfmperf pni dtes64 monitor ds_cpl vmx smx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm tpr_shadow vnmi flexpriority ept vpid dtherm ida
Di 21 Jun 2016 11:39:51 UTC | | OS: Linux: 4.5.0-1-amd64
Di 21 Jun 2016 11:39:51 UTC | | Memory: 3.82 GB physical, 3.75 GB virtual
Di 21 Jun 2016 11:39:51 UTC | | Disk: 70.78 GB total, 65.17 GB free
Di 21 Jun 2016 11:39:51 UTC | | Local time is UTC +0 hours
Di 21 Jun 2016 11:39:51 UTC | | Config: GUI RPCs allowed from:
Di 21 Jun 2016 11:39:51 UTC | | 192.168.2.104
Di 21 Jun 2016 11:39:51 UTC | | 192.168.2.210
Di 21 Jun 2016 11:39:51 UTC | | Config: use all coprocessors

Nachdem GPU1 keine Tasks mehr rechnet, kommt folgende Meldung:

Di 21 Jun 2016 11:51:41 UTC | Collatz Conjecture | [coproc] Assigning NVIDIA instance 1 to collatz_sieve_2727335498745661882368_6597069766656_0

Meiner Meinung nach weist Collatz der GPU1 Tasks zu, aber aus irgendeinem Grund werden die nicht gerechnet.

Wer, oder was kann das sein?

Was verhindert, dass GPU1 die tasks rechnet?

Hat jemand auch schon mal solche Erfahrungen gemacht?

Gibt es Moeglichkeiten fuer weitere Tests?

Viele Gruesse
Veit

Benutzeravatar
maxamd400
Vereinsmitglied
Vereinsmitglied
Beiträge: 407
Registriert: 07.05.2003 21:48
Wohnort: Magdeburg

Re: Collatz nutzt ausschliesslich GPU0 auf einer Dual-GPU-GK

#12 Ungelesener Beitrag von maxamd400 » 22.06.2016 19:38

Hi vdvogt,

ich habe zusammen 5 Dual Graka. 3x GTX690, HD 7990 und R9 295x2 und ich muss sagen, wenn ich Collatz rechne, spinnt immer eine rum.
Heute war es die HD 7990, genau das gleiche Problem. GPU Core0 rechnet, Core1 macht Pause.

Ich hab glaube 4 mal neu gebootet und dann die Schnautze voll gehabt und den PC einfach Notaus, Netzschalter einfach umgelegt,
geflucht wie ein Rohrspatz usw. scheiss Kiste,mist Win7,den PC angebrüllt, Du kommst auf den Schrott und doch noch nach 15min meckern wieder eingeschaltet
und siehe da, jetzt waren wieder beide GPU Core da.

Ich will damit sagen, Du bist nicht alleine.

Bei dem PC mit der R9 295x2 habe ich festgestellt, das sich die Graka verschluckt beim packen und versenden der WU und neue in den Speicher laden.
Ein Test hat ergeben, das wenn ich eine
collatz_sieve_1.21_windows_x86_64__opencl_amd_gpu.config anlege, eigentlich müsste die da sein und dort Eintrage

sleep=2

somit macht der GPU Core beim neu laden 2 Sekunden Pause.
Die Fehlerrate ist fast auf Null gegangen, zuvor war das ein Vollzeitjob in der Stunde 20 mal neustart.

Vielleicht Hilft es ja und ich werde mich wehren das Du mich vom 2 Platz verdrängst ;)

Grüße Thorsten
Bild

Antworten

Zurück zu „Hilfe und Support“