Stress mit Einstein@home

Astronomie (Einstein, Universe@Home, Milkyway@home, ...)
Nachricht
Autor
Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22419
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Stress mit Einstein@home

#25 Ungelesener Beitrag von Michael H.W. Weber » 09.04.2017 08:59

...eine weitere WU wurde erfolgreich validiert. In "nur" ca. 24 Std. :roll:

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22419
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Stress mit Einstein@home

#26 Ungelesener Beitrag von Michael H.W. Weber » 10.04.2017 13:03

...und noch eine. :blush:

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22419
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Stress mit Einstein@home

#27 Ungelesener Beitrag von Michael H.W. Weber » 02.05.2017 22:23

Tjo, also es läuft dann wohl doch eher auf ein Hardware unabhängiges Problem hinaus:

Mir kam es etwas spanisch vor, dass die 280X bei allen Projekten fehlerfrei liefert, bloss bei Einstein@home nicht. Also habe ich eine zweite 280X genommen und damit die angeblich fehlerbehaftete ersetzt. Die zweite Karte bekommt ebenfalls keine WU fehlerfrei berechnet, während Milkyway, Collatz und Primegrid einwandfrei laufen.
Hier mal ein paar WUs:

https://einsteinathome.org/de/task/640111492
https://einsteinathome.org/de/task/640111489
https://einsteinathome.org/de/task/640111485

Es geht nur um die Gammapulsar-WUs und ich habe auch die AMD-Treiber auf die allerneuste Version aktualisiert und damit dann erneut getestet mit demselben Ergebnis.
Das Ganze läuft unter Windows 7 x64 auf einem i5-2500K und neuster BOINC-Version.
Ich bin da inzwischen leider völlg ratlos. Hatte extra wegen des Pentathlons alles nochmal auf Vordermann bringen wollen, aber ohne Erfolg...
Das System ist auch nicht überhitzt, die 280X schnurrt bei ca. 65°C unter Vollast, die im selben System laufende 290X ist ca. 5°C kühler, weil sie außen montiert ist.

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Benutzeravatar
X1900AIW
TuX-omane
TuX-omane
Beiträge: 2868
Registriert: 05.01.2008 16:34

Re: Stress mit Einstein@home

#28 Ungelesener Beitrag von X1900AIW » 03.05.2017 06:36

Hast du zur Eingrenzung versucht, den Takt nach oben zu begrenzen, d.h. z.B. 10% unter dem Maximaltakt zu bleiben auf der betroffenen GPU?

Falls die Temperaturen o.k. sind, kann ja weiterhin die volle Spannung anliegen.

(Ich persönlich würde stets den VRAM Takt absenken bzw. in Tests klären, ob dieser im Grenzbereich überhaupt performancerelevant ist.)
Zusammenkommen ist ein Beginn, Zusammenbleiben ist ein Fortschritt, Zusammenarbeiten ist ein Erfolg.
Henry Ford

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22419
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Stress mit Einstein@home

#29 Ungelesener Beitrag von Michael H.W. Weber » 03.05.2017 08:14

Nein, ich habe dies nicht getestet, denn möchte die Karte gern mit Fabrikeinstellungen betreiben können - was bei allen anderen Projekten ja auch problemlos funktioniert.

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

ChristianB
Admin
Admin
Beiträge: 1920
Registriert: 23.02.2010 22:12

Re: Stress mit Einstein@home

#30 Ungelesener Beitrag von ChristianB » 03.05.2017 17:46

Ein anderer User hat ein ähnliches Problem berichtet. Bei ihm war es das Folding@Home gleichzeitig mit BOINC auf der GPU lief und deshalb die Aufgaben nicht richtig liefen. Wird die Radeon auch als normale Grafikkarte benutzt? Eventuell verkraftet die es nicht gleichzeitig Bild darstellen und rechnen. Die FGRPB1G app versucht die Karte zu 100% auszulasten, eventuell ist das bei den anderen Projekten nicht der Fall.

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22419
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Stress mit Einstein@home

#31 Ungelesener Beitrag von Michael H.W. Weber » 03.05.2017 18:49

ChristianB hat geschrieben:Ein anderer User hat ein ähnliches Problem berichtet. Bei ihm war es das Folding@Home gleichzeitig mit BOINC auf der GPU lief und deshalb die Aufgaben nicht richtig liefen. Wird die Radeon auch als normale Grafikkarte benutzt? Eventuell verkraftet die es nicht gleichzeitig Bild darstellen und rechnen. Die FGRPB1G app versucht die Karte zu 100% auszulasten, eventuell ist das bei den anderen Projekten nicht der Fall.
Ich habe ja zwei GPUs in der Maschine und habe tatsächlich auch zu rechnen probiert, als das Videosignal von der anderen geliefert wurde. Es werden leider auch unter diesen Bedingungen nur Fehler erzeugt. Also liegt es auch nicht an einer Doppelbelastung der Karte.

Ich habe eine Sapphire R9 280X "Toxic" laufen - GPU-Clock: 1150 MHz, RAM-Clock: 1600 MHz. Will heissen, die haut ganz schön rein (andere Hersteller verticken diese Karte mit 1050/1500 MHz GPU/RAM-Takt) und es wäre sehr interessant zu wissen, ob auch andere User diese Karte mit Werkseinstellungen fehlerfrei nutzen können.
Ich hatte bei der ersten Karte ja berichtet, dass die monatelang ohne einen einzigen Fehler für Einstein lief - übrigens lieferte sie auch das Videosignal und die Kiste ist mein Arbeitsplatzrechner, also ständig allerhand anderes am Gange. Dann plötzlich, von einem Tag auf den anderen, produzierte sie eine hohe Fehlerrate.
Die zweite, gestern oben beschriebene, lieferte von vorn herein keinerlei brauchbaren Ergebnisse.
Beide rechnen absolut zuverlässig für alle anderen getesteten Projekte, die ja gerade für AMD prädestiniert sind.

Wenn die Karte jetzt merklich höhere GPU-Kerntemperaturen aufwies - nach monatelangem Gebrauch - würde ich auf staubbedingte Überhitzung im Zusammenspiel mit der hohen Takrate tippen. Das aber ist nicht der Fall - zumindest meldet der Sensor keine andere Temperatur als zu Beginn der Kartennutzung.
Jetzt kenne ich natürlich nicht die inneren Details der Sensorpositionierung aus -signalerfassung...

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

ChristianB
Admin
Admin
Beiträge: 1920
Registriert: 23.02.2010 22:12

Re: Stress mit Einstein@home

#32 Ungelesener Beitrag von ChristianB » 04.05.2017 09:25

Das Problem ist grundsätzlich das wir nichts an der App geändert haben. Es könnte sein das sich die Parameter des aktuellen Datensatzes nicht mit bestimmten Radeon Karten vertragen. Das musste sich dann aber grossflächig durchziehen und die failed tasks müssten in die Höhe schnellen. Was aber nicht der Fall ist. Die Failrate für die ATI apps ist in einem akzeptablen Bereich von 2% auf Linux und 3,2% für Windows (letzte 3 Tage).

Benutzeravatar
Michael H.W. Weber
Vereinsvorstand
Vereinsvorstand
Beiträge: 22419
Registriert: 07.01.2002 01:00
Wohnort: Marpurk
Kontaktdaten:

Re: Stress mit Einstein@home

#33 Ungelesener Beitrag von Michael H.W. Weber » 04.05.2017 11:34

Ich habe jetzt die 280X "Toxic" von Sapphire von Einstein ferngehalten (cc_config.xml im BOINC-Datenverzeichnis):

Code: Alles auswählen

        <use_all_gpus>1</use_all_gpus>

         <exclude_gpu>
            <url>http://einstein.phys.uwm.edu/</url>
            <device_num>0</device_num>
            <type>ATI</type>
            <app>einsteinbinary_BRP4G</app>
         </exclude_gpu>
         <exclude_gpu>
            <url>http://einstein.phys.uwm.edu/</url>
            <device_num>0</device_num>
            <type>ATI</type>
            <app>hsgamma_FGRPB1G</app>
         </exclude_gpu>
In der 1. Zeile werden alle GPUs an Bord für Rechnungen aktiviert (ich habe 1x 280X Sapphire "Toxic" und 1x 290X MSI "Lightning"). Der Doppelblock darunter schaltet dann für Device 0 (das ist bei mir im Haupt-PCIe-Slot die 280X "Toxic") alle ATI-Apps ab. Bedeutet, dass die 290X alles rechnen darf, die 280X alles außer Einstein@home. Die 280X kann so mit Werkseinstellungen von 1150/1600 MHz (GPU/RAM-Clock) mit voller Leistung zu werke gehen.

Ich habe eben noch etwas mit den Clocks unter MSI Afterburner gespielt (1050/1500 MHz GPU/RAM eingestellt, was den Standards bei anderen Herstellern entspricht) und es scheint so zu sein, dass die Karte dennoch nur Fehler abliefert. Irgendwie ist der Afterburner für mich aber noch ungewohnt (hatte die Clock-Änderungen in einem Profil gespeichert, lade ich dieses, stehen dort aber wieder die Werkseinstellungen - hallo? Was ist da los?) und ich war leider dämlich genug zu vergessen, die unter Afterburner eingestellten Clocks mit einem externen Tool (GPUz) zu überprüfen...

Michael.
Fördern, kooperieren und konstruieren statt fordern, konkurrieren und konsumieren.

http://signature.statseb.fr I: Kaputte Seite A
http://signature.statseb.fr II: Kaputte Seite B

Bild Bild Bild

Antworten

Zurück zu „Astronomie“