Nur noch Berechnungsfehler außer bei GPUGrid

Probleme mit einem Clientprogramm? Oder einen Tipp dazu? Dann hier posten...
Nachricht
Autor
Dwyane
Idle-Sammler
Idle-Sammler
Beiträge: 3
Registriert: 30.07.2017 19:27

Nur noch Berechnungsfehler außer bei GPUGrid

#1 Ungelesener Beitrag von Dwyane » 30.07.2017 20:03

Hallo DCler,

ich habe seit einiger Zeit ein Problem und wende mich nun mal an euch in der Hoffnung bei eurem Know-How Hilfe zu finden.

Ich habe längere Zeit nur GPUGrid auf meinen Rechnern laufen lassen was GPU-WU`s angeht. Nun wollte ich mal wieder was anderes laufen lassen, aber nichts läuft mehr.
Ich bekomme zwar von allen angefragten Projekten GPU WU`s (PrimeGrid, Collatz, Milkyway@home, Einstein@home) aber alle brechen mit Berechnungsfehler ab.
Manchmal erst nach 13 Sekunden (Einstein) oder nach nur 2 Sekunden (Collatz). Das Problem tritt auf beiden Rechnern auf.

Ich denke nicht das es an den Grafikkarten liegt, den GPUGrid läuft weiter ohne Probleme.
Auch die CPU WU`s laufen alle ganz normal und erfolgreich durch.

Meine Systeme sind folgende:

1-
CPU: Intel Core i7 5960X
RAM: 32GB DDR4
GPU1: GeForce GTX Titan X
GPU2: GeForce GTX Titan X
BS: Win10 Pro x64

2-
CPU: Intel Xeon E3 1230v2
RAM: 8GB DDR3
GPU1: GeForce GTX 970
GPU2: GeForce GTX 970
BS: Win10 Core Edition x64

Der Grafikkarten Treiber wurde schon erneurt und ist aktuell.


Vielen Dank im voraus.

MfG Dwyane

Benutzeravatar
X1900AIW
TuX-omane
TuX-omane
Beiträge: 2868
Registriert: 05.01.2008 16:34

Re: Nur noch Berechnungsfehler außer bei GPUGrid

#2 Ungelesener Beitrag von X1900AIW » 31.07.2017 07:40

Overclocking von CPU/GPU/RAM?

Passiert das - Gegentest - in einem gemäßigten Takt bzw. unter Teillast ebenfalls?

Berechnungsfehler können natürlich durch Unverträglichkeiten der BOINC Applikation mit den Treibern provoziert werden, deshalb rate ich persönlich von "neuesten" Treibern ab, deine GPU Hardware ist älter, von daher macht es höchstens Sinn für Spiele-Software neueste Treiber zu nutzen, bei CUDA wie OpenCL ist das m.M. eher selten nötig.

Mit Windows 10 erinnere ich mich gab es Probleme wegen dessen "Treiberpolitik", das bezog sich glaube ich eher auf die installierbare Version bzw. Zwangsinstallation, könnte bereits längst Geschichte sein, ich nutze selbst nur Windows 8.
Zusammenkommen ist ein Beginn, Zusammenbleiben ist ein Fortschritt, Zusammenarbeiten ist ein Erfolg.
Henry Ford

Dwyane
Idle-Sammler
Idle-Sammler
Beiträge: 3
Registriert: 30.07.2017 19:27

Re: Nur noch Berechnungsfehler außer bei GPUGrid

#3 Ungelesener Beitrag von Dwyane » 31.07.2017 11:54

Hi X1900AIW,

übertaktet ist derzeit nichts. War es auch vorher nicht. Die Auslastung ist eigentlich egal, die Fehler passieren unter Teil oder auch erhöhter Auslastung.
Den Grakatreiber hatte ich extra aktualisiert in der Hoffnung das Problem damit zu lösen, unter dem alten Vorgänger hatte ich auch schon dieses Problem und der war bestimmt schon 6 Monate alt.

Den Boinc Manager De- und Neuinstalliert habe ich auch schon. Ebenso die einzelnen Projekte.
Mich wunderts auch das auf beiden Rechnern das Problem auftritt mit unterschiedlicher Hardware und auch nicht exakt gleicher Windows Version.

MfG Dwyane

Benutzeravatar
X1900AIW
TuX-omane
TuX-omane
Beiträge: 2868
Registriert: 05.01.2008 16:34

Re: Nur noch Berechnungsfehler außer bei GPUGrid

#4 Ungelesener Beitrag von X1900AIW » 31.07.2017 12:11

Stromversorgung bzw. Netzteile geprüft?

D.h. alle stromzuführenden Kabel mal - im ausgeschalteten Zustand :wink: - ab- und wieder einstecken, minimale Schwankungen in der Versorgung können solche Effekte auslösen, müssten dann aber reproduzierbar sein mit Last- bzw. Benchmarktools.

Es kommt vor, dass sich BIOS Parameter zurücksetzen, deshalb meine Rückfrage insb. zu RAM, der ist manchmal vom Hersteller "scharf" in den Timings getaktet, benötigt dafür aber oft ordentliche Spannung. Bei mir hatte ich den Effekt beobachtet, dass unter BOINC (ohne GPU Last) die Mehrauslastung bei 4x4GB RAM ohne Mehrspannung (XMP Vorgaben bzw. Auto-Spannungswerte) funktioniert hatte, aber bei Spielen mit GPU Last nur eine RAM-Spannungserhöhung half.

Ältere Komponenten können zuweilen mehr Spannung abverlangen, ob das nun an alterungsbedingter Elektronenmigration liegt oder an Defiziten der Mainboards/Netzteile ... keine Ahnung, zumindest ist das schnell ausgetestet, im BIOS Spannung zugeben bzw. die Netzteile ggf. untereinander tauschen, womöglich liegt der relevante Last-Verbrauchswert der Netzteile auf einem anderen Niveau, bezogen auf deine beiden Computersysteme.

Falls deine Rechner schon länger durchlaufen, lohnt sich die Grundreinigung, Entstauben, Steckerverbindungen neu stecken auf jeden Fall und du kannst zumindest diese mögliche Fehlerursache ausschließen.
Zusammenkommen ist ein Beginn, Zusammenbleiben ist ein Fortschritt, Zusammenarbeiten ist ein Erfolg.
Henry Ford

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22419
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Nur noch Berechnungsfehler außer bei GPUGrid

#5 Ungelesener Beitrag von Michael H.W. Weber » 01.08.2017 10:19

Hast Du die nun Fehler produzierenden Projekte auf genau diesen Maschinen in der jetzigen Konfiguration früher schon mal fehlerfrei laufen gehabt? Wenn nicht, vermute ich ein Problem mit Deinen Dual-GPU-Konfigurationen.
GPUGRID würde meiner Einschätzung nach nicht fehlerfrei laufen, wenn es irgendein grundsäzliches Problem mit Deiner Hardware gäbe.

Du kannst ja auch nochmal andere GPU-Projekte testen, also Asteroids, SETI, XANSONS for COD, Folding@home, MooWrapper und Enigma, um eine vollständige Liste derjenigen Projekte zu bekommen, die Probleme bereiten.

Ich hatte den Fall, dass ich jahrelang Einstein & Milkyway auf zwei AMD GPUs fehlerfrei laufen hatte und dann produzierten die Karten plötzlich zu einem großen Anteil Fehler. Die Ursache ist bis heute ungeklärt, die Hardware scheint laut aller Tests OK (wobei einige Tests intrinisch falsch programmiert sind, so wie z.B. eine memtest-Version für den Standard-RAM-Test bei Ubuntu vor einigen Jahren (keine Ahnung, ob die "kids" das inzwischen mal korrigiert haben, ich hatte es denen gemeldet)), die Kühlung ebenfalls (soweit die Temperaturen sich zuverlässig auslesen lassen: Ich habe da gelegentlich Zweifel, ob die Sensoren wirklich komplette GPU-Chip-Flächenabdeckung bieten und auch RAM checken können - daher lohnt GRUNDREINIGUNG in obskuren Fällen oft) und die Karten rechnen heute ohne Fehler bei anderen GPU-Projekten.

Ich hatte auch den Fall, dass meine beiden 280X von vorn herein nicht mit Primegrid laufen wollten. Ursache ebenfalls ungeklärt.

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Dwyane
Idle-Sammler
Idle-Sammler
Beiträge: 3
Registriert: 30.07.2017 19:27

Re: Nur noch Berechnungsfehler außer bei GPUGrid

#6 Ungelesener Beitrag von Dwyane » 01.08.2017 19:47

Hi X1900 und Michael,

Staub dürfte bei mir weniger ein Problem sein. Die Rechner sind offene Aufbauten und werden von mir wöchentlich ausgesaugt und ausgewischt. Das Netzteil schließe ich auch mal aus, beim zocken treten keine Probleme auf und Belastungstests mit Furmark und Prime95
haben auch keine auftreten lassen. MemTest sagt zudem das der Arbeitsspeicher in Ordnung ist. Damit würde ich Hardware mäßig mal die Ursache ausschließen.

Ich habe mal noch zusätzlich Asteroids@Home getestet welches ohne Probleme lief, SETI könnte ich mangels WU`s nicht testen :cry2:

Die angesprochenen Projekte liefen vor etwa 4 Monaten alle noch problemlos auf denselben Systemen es wurde seitdem nichts verändert.

Mit freundlichen Grüßen
Dwyane

Benutzeravatar
X1900AIW
TuX-omane
TuX-omane
Beiträge: 2868
Registriert: 05.01.2008 16:34

Re: Nur noch Berechnungsfehler außer bei GPUGrid

#7 Ungelesener Beitrag von X1900AIW » 01.08.2017 20:09

Was mir noch einfiele...
Dwyane hat geschrieben:Ich bekomme zwar von allen angefragten Projekten GPU WU`s (PrimeGrid, Collatz, Milkyway@home, Einstein@home) aber alle brechen mit Berechnungsfehler ab.
Manchmal erst nach 13 Sekunden (Einstein) oder nach nur 2 Sekunden (Collatz). Das Problem tritt auf beiden Rechnern auf.
Haben beide Rechner etwas gemeinsam wie z.B. spezielle Software, xK Monitoransteuerung, Antivirus, Firewall, Prozesswächter ... die Hardware ist verschieden, wo also die Gemeinsamkeit - eine Hintergrund Software?

Es hätte ein Murks von GPUgrid sein können, das lief auf beiden Systemen, die Aufräumarbeit mit BOINC Manager (etwaige korrupte Applikationen) hast du gemacht, spannende Geschichte.

Für mich wäre die Frage: was passiert nach x Sekunden Rechenzeit, welche Komponenten werden belastet, RAM kannst du ausschließen, etwas Festspeicher? Doch warum auf beiden Systemen ... hängen an beiden Rechnern irgendwelche externen Geräte die Zugriffe starten?

Alte Treiber Versionen probiert?

Hätte als Testalternative ein live Linux Boot vorgeschlagen, so könntest du die ganze Windows Welt ausklammern, hm , ist schließlich so kein Zustand, ich meine das GPUgrid Projekt würde sich freuen. :wink:
Zusammenkommen ist ein Beginn, Zusammenbleiben ist ein Fortschritt, Zusammenarbeiten ist ein Erfolg.
Henry Ford

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22419
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Nur noch Berechnungsfehler außer bei GPUGrid

#8 Ungelesener Beitrag von Michael H.W. Weber » 02.08.2017 10:58

Meine Rechner laufen auch offen und Nein, einfaches Aussaugen des RECHNERS mit dem Staubsauger löst erfahrungsgemäß das Staubproblem in GPU-Kühlungen nicht zuverlässig.

Bin ansonsten aber auch ratlos und würde den Live-Linux Test mit einem Ubuntu-Stick mal probieren, wobei ich da nicht weiss, wie Du die GPU-Treiber nebst OpenCL/CUDA installiert bekommst, da anschließend ein Re-Boot fällig wird und Änderungen im Live-System nicht automatisch auf den Stick geschrieben werden. Aber das kann man sicherlich irgendwo im Netz recherchieren, wie man das macht oder hier weiss es jemand?

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Antworten

Zurück zu „Hilfe und Support“