Generation X3D
-
Kolossus
- TuX-omane

- Beiträge: 4717
- Registriert: 26.10.2014 14:51
Generation X3D
Hallo zusammen,
seit Zen 4 gibt es von AMD Prozessoren mit sogenanntem X3D-Cache.
Spannend aus meiner Sicht ist Folgendes:
Zum Ersten bezieht sich der Cache „nur“ auf die echten Kerne, nicht für die zusätzlichen Threads. Heißt im Falle des 7950 X3D 16 = 2×8+2×32+64 MB Cache. Das die Dinger in Spielen abgehen wie ein Zäpfchen steht außer Frage.
Aber wie sieht das Ganze unter Boinc aus? Muss man jetzt hingehen und nur die „richtigen“ Kerne nutzen, oder kann man, ohne einander ins Gehege zu kommen, beide Typen der Kerne benutzen? Der verbesserte Cache kommt ja den PrimGrid-rechnern sehr entgegen, aber funktioniert dies auch so? Und inwieweit hudelt Windows wiedermal dazwischen?
Ist unter Linux ebenfalls ein Unterschied spürbar/messbar?
seit Zen 4 gibt es von AMD Prozessoren mit sogenanntem X3D-Cache.
Spannend aus meiner Sicht ist Folgendes:
Zum Ersten bezieht sich der Cache „nur“ auf die echten Kerne, nicht für die zusätzlichen Threads. Heißt im Falle des 7950 X3D 16 = 2×8+2×32+64 MB Cache. Das die Dinger in Spielen abgehen wie ein Zäpfchen steht außer Frage.
Aber wie sieht das Ganze unter Boinc aus? Muss man jetzt hingehen und nur die „richtigen“ Kerne nutzen, oder kann man, ohne einander ins Gehege zu kommen, beide Typen der Kerne benutzen? Der verbesserte Cache kommt ja den PrimGrid-rechnern sehr entgegen, aber funktioniert dies auch so? Und inwieweit hudelt Windows wiedermal dazwischen?
Ist unter Linux ebenfalls ein Unterschied spürbar/messbar?
Gruß Harald
Selbst wenn es die Sonne ist, die auf ihn scheint, ein Misthaufen antwortet immer nur mit Gestank...

Selbst wenn es die Sonne ist, die auf ihn scheint, ein Misthaufen antwortet immer nur mit Gestank...

-
Stiwi
- Mod-Caser

- Beiträge: 1529
- Registriert: 20.05.2012 21:11
Re: Generation X3D
Also alles was ich schreibe ist gefährliches Halbwissen also korrigiert mich gerne.
Der Cache bezieht sich auf die CCDs weshalb prozessoren mit 2 CCDs (X900 bzw X950) bei der hälfte der Kernen/Threads diesen Cache überhaupt nutzen können. Daher kommt es sehr darauf an welcher Thread welchem Kern zugeordnet wird.
Bei Boinc ist mir persönlich nur das Projekt ARP von WCG bekannt welches Massiv den L3Cache benötigt und daher deutlich profitieren könnte.
Der Cache bezieht sich auf die CCDs weshalb prozessoren mit 2 CCDs (X900 bzw X950) bei der hälfte der Kernen/Threads diesen Cache überhaupt nutzen können. Daher kommt es sehr darauf an welcher Thread welchem Kern zugeordnet wird.
Bei Boinc ist mir persönlich nur das Projekt ARP von WCG bekannt welches Massiv den L3Cache benötigt und daher deutlich profitieren könnte.
-
gemini8
- Vereinsvorstand

- Beiträge: 6649
- Registriert: 31.05.2011 10:30
- Wohnort: Hannover
Re: Generation X3D
Bei ARP hieß es früher mal, vier MB pro Aufgabe seien günstig.
Ich habe keine Ahnung, wie viel es jetzt ist.
Bei PrimeGrid brauchen die größten Projekte derzeit bis zu vierzig MB, Tendenz steigend.
SRBase freut sich ebenfalls über L3 Cache. Da die relevanten Zahlen hier kleiner sind, kann es bedeuten, dass man Tasks nicht multi-threaden muss, wenn genug Cache vorhanden ist.
Eine Überbelegung mit mehreren Aufgaben führt zu deutlichen Leistungsverlusten; bei einer Aufgabe ist es (auf dieselbe Maschine bezogen) weniger auffällig.
Da es bei einem Cache, der kleiner als der Bedarf ist, ratsam ist, die Aufgaben multi-threaded zu rechnen, hat man Verluste durch die beim Multi-Threading auftretende Verwaltung mehrerer Threads.
Die X3D Caches helfen also damit, Aufgaben mit großem Bedarf komplett im Cache zu halten und Aufgaben mit kleinerem Bedarf mit weniger Threads (idealerweise einem) rechnen zu können.
X3D Cache kam mit ZEN3. Bei N0vas läuft z.B. ein 5800X3D.
Die Technik wurde seitdem verbessert, sodass die Teile nicht mehr dauernd überhitzen und dadurch kaputtgeben wollen.
Da die Ryzen 9 Prozessoren nur einen X3D Cache bei zwei CCDs haben, sind sie vom Verwaltungsaufwand her ungünstiger für unsere Zwecke als die Ryzen 7 Prozessoren mit X3D Cache. Wenn man ohnehin virtualisiert, kann man die Teilbereiche der Ryzen 9 entsprechend pinnen und unterschiedliche Einstellungen verwenden; ansonsten vergibt man sich den Mehrwert und landet ggfs. trotz AVX-512 bei ZEN3 non-X3D Laufzeiten.
Zur Zeit liegt das beste Thread und L3 Cache Angebot bei den Ryzen 7: Acht Kerne, sechzehn Threads, 96MB L3 Cache. Dazu ein höherer Takt als beim Ryzen 9. Wenn man sich mehrere Kisten hinstellen mag, dann dürfte man hier richtig sein.
Ansonsten gibt es natürlich auch EPYCs mit noch mehr Kernen und X3D Cache, als ein Ryzen mitbringt. Da man die Dinger ohnehin irgendwie virtualisieren sollte (Proxmox, Docker, ggfs. Unraid, ggfs. VirtualBox, falls man sich solch ein Teil als 'Desktop' mit Monitor ins Haus stellt), ist die Sache mit dem Pinnen der Prozesse hier quasi Standard.
Oder die kurze Variante:
Windows kommt dazwischen, Linux nicht. Und man sollte die Prozesse entsprechend verteilen, damit man überhaupt einen Nutzen davon hat, der über den Bereich der Zufälligkeit hinausgeht.
Ich habe keine Ahnung, wie viel es jetzt ist.
Bei PrimeGrid brauchen die größten Projekte derzeit bis zu vierzig MB, Tendenz steigend.
SRBase freut sich ebenfalls über L3 Cache. Da die relevanten Zahlen hier kleiner sind, kann es bedeuten, dass man Tasks nicht multi-threaden muss, wenn genug Cache vorhanden ist.
Eine Überbelegung mit mehreren Aufgaben führt zu deutlichen Leistungsverlusten; bei einer Aufgabe ist es (auf dieselbe Maschine bezogen) weniger auffällig.
Da es bei einem Cache, der kleiner als der Bedarf ist, ratsam ist, die Aufgaben multi-threaded zu rechnen, hat man Verluste durch die beim Multi-Threading auftretende Verwaltung mehrerer Threads.
Die X3D Caches helfen also damit, Aufgaben mit großem Bedarf komplett im Cache zu halten und Aufgaben mit kleinerem Bedarf mit weniger Threads (idealerweise einem) rechnen zu können.
X3D Cache kam mit ZEN3. Bei N0vas läuft z.B. ein 5800X3D.
Die Technik wurde seitdem verbessert, sodass die Teile nicht mehr dauernd überhitzen und dadurch kaputtgeben wollen.
Da die Ryzen 9 Prozessoren nur einen X3D Cache bei zwei CCDs haben, sind sie vom Verwaltungsaufwand her ungünstiger für unsere Zwecke als die Ryzen 7 Prozessoren mit X3D Cache. Wenn man ohnehin virtualisiert, kann man die Teilbereiche der Ryzen 9 entsprechend pinnen und unterschiedliche Einstellungen verwenden; ansonsten vergibt man sich den Mehrwert und landet ggfs. trotz AVX-512 bei ZEN3 non-X3D Laufzeiten.
Zur Zeit liegt das beste Thread und L3 Cache Angebot bei den Ryzen 7: Acht Kerne, sechzehn Threads, 96MB L3 Cache. Dazu ein höherer Takt als beim Ryzen 9. Wenn man sich mehrere Kisten hinstellen mag, dann dürfte man hier richtig sein.
Ansonsten gibt es natürlich auch EPYCs mit noch mehr Kernen und X3D Cache, als ein Ryzen mitbringt. Da man die Dinger ohnehin irgendwie virtualisieren sollte (Proxmox, Docker, ggfs. Unraid, ggfs. VirtualBox, falls man sich solch ein Teil als 'Desktop' mit Monitor ins Haus stellt), ist die Sache mit dem Pinnen der Prozesse hier quasi Standard.
Oder die kurze Variante:
Windows kommt dazwischen, Linux nicht. Und man sollte die Prozesse entsprechend verteilen, damit man überhaupt einen Nutzen davon hat, der über den Bereich der Zufälligkeit hinausgeht.
-
Kolossus
- TuX-omane

- Beiträge: 4717
- Registriert: 26.10.2014 14:51
Re: Generation X3D
Soweit ich mich erinnere, war dies schon immer das Grundproblem bei PrimeGrid.gemini8 hat geschrieben: ↑08.04.2025 05:58Eine Überbelegung mit mehreren Aufgaben führt zu deutlichen Leistungsverlusten; bei einer Aufgabe ist es (auf dieselbe Maschine bezogen) weniger auffällig.
Da es bei einem Cache, der kleiner als der Bedarf ist, ratsam ist, die Aufgaben multi-threaded zu rechnen, hat man Verluste durch die beim Multi-Threading auftretende Verwaltung mehrerer Threads.
Unser Forum ist voll mit endlosen Diskussionen über die richtigen Einstellungen, seit es mehrkernige Prozessoren gab.
Ups, mein Fehler. Schlecht recherchiert.
Warum habe ich das erwartet? Das musste ja kommen....gemini8 hat geschrieben: ↑08.04.2025 05:58Da die Ryzen 9 Prozessoren nur einen X3D Cache bei zwei CCDs haben, sind sie vom Verwaltungsaufwand her ungünstiger für unsere Zwecke als die Ryzen 7 Prozessoren mit X3D Cache. Wenn man ohnehin virtualisiert, kann man die Teilbereiche der Ryzen 9 entsprechend pinnen und unterschiedliche Einstellungen verwenden; ansonsten vergibt man sich den Mehrwert und landet ggfs. trotz AVX-512 bei ZEN3 non-X3D Laufzeiten.
Ja Ne is klargemini8 hat geschrieben: ↑08.04.2025 05:58Zur Zeit liegt das beste Thread und L3 Cache Angebot bei den Ryzen 7: Acht Kerne, sechzehn Threads, 96MB L3 Cache. Dazu ein höherer Takt als beim Ryzen 9. Wenn man sich mehrere Kisten hinstellen mag, dann dürfte man hier richtig sein.
Ansonsten gibt es natürlich auch EPYCs mit noch mehr Kernen und X3D Cache, als ein Ryzen mitbringt. Da man die Dinger ohnehin irgendwie virtualisieren sollte (Proxmox, Docker, ggfs. Unraid, ggfs. VirtualBox, falls man sich solch ein Teil als 'Desktop' mit Monitor ins Haus stellt), ist die Sache mit dem Pinnen der Prozesse hier quasi Standard.
Das gilt aber nur für die Leute, die das Geld schubkarrenweise auf der Straße finden.
Ich brauche gewiss niemandem vorrechnen, was ein 7950x inklusive entsprechend hochwertiger Hardware plus GraKa kostet. Glücklich derjenige, der in der Lage ist, sich seinen Rechner selbst zusammenzubauen. Von der Stange gibt es solche Rechner ohnehin nicht und ein Zusammenbau im Laden frisst noch einiges mehr an Geld
Abgesehen davon dürfte der von Dir gestellte Anspruch an Fachwissen bezüglich Virtualisierung und Programmen à la Prozesslasso oder AffinityWatcher das Knoffhoff jedes Normalusers bei weitem überschreiten.
Wenn ich Deinen Post lese, werde ich doch schon recht nachdenklich:
Wo bleibt da der ursprüngliche Gedanke von Boinc, einfach nur Rechenzeit zu spenden?
Klar habe auch ich zwei völlig überdimensionierte Rechner hier stehen und spende damit viel Rechenzeit und unterstütze gerne unser Team in Rennen.
Doch Dich sehe ich eher in einer Art Formel 1 Box, wo hinter verschlossenen Türen am neuen Boliden hantiert wird, der mit einem Fahrzeug mit Straßenzulassung nichts mehr gemein hat...
Irgendwie finde ich es schön, mit meinen Rechnern ohne Technikzauberei mit 5,1 GHz Allcore bei 120 Watt über die Datenautobahn zu fegen, jeden hinter mir zu lassen und in aller Ruhe die Aussicht zu genießen. (DENIS@home)
Gruß Harald
Selbst wenn es die Sonne ist, die auf ihn scheint, ein Misthaufen antwortet immer nur mit Gestank...

Selbst wenn es die Sonne ist, die auf ihn scheint, ein Misthaufen antwortet immer nur mit Gestank...

-
JagDoc
- Vereinsmitglied

- Beiträge: 312
- Registriert: 03.12.2011 12:05
Re: Generation X3D
Leider sind deine beiden Monster bei Denis@home dank Windows nur im 1.Gang auf der Standspur unterwegs.Kolossus hat geschrieben: ↑08.04.2025 14:28Doch Dich sehe ich eher in einer Art Formel 1 Box, wo hinter verschlossenen Türen am neuen Boliden hantiert wird, der mit einem Fahrzeug mit Straßenzulassung nichts mehr gemein hat...
Irgendwie finde ich es schön, mit meinen Rechnern ohne Technikzauberei mit 5,1 GHz Allcore bei 120 Watt über die Datenautobahn zu fegen, jeden hinter mir zu lassen und in aller Ruhe die Aussicht zu genießen. (DENIS@home)
Mit Linux wärst du im 5.Gang auf der Überholspur.
Mein 7945HX@45W (2,5GHz) mit Linux schafft pro Tag fast doppelt so viel wie deine beiden 7950 zusammen.
Dein 7950:
Code: Alles auswählen
CPU: AMD Ryzen 9 7950X 16-Core Processor
OS: Microsoft Windows 10 Professional x64 Edition, (10.00.19045.00)
Results fetched: 100
Average duration (s): 5883.2
Average credit: 48.45
Number of reported cores: 32
Per core per day: 707
Per system per day: 22624Code: Alles auswählen
CPU: AMD Ryzen 9 7945HX with Radeon Graphics
OS: Linux Ubuntu Ubuntu 24.10
Results fetched: 100
Average duration (s): 1545.8
Average credit: 49.33
Number of reported cores: 32
Per core per day: 2752
Per system per day: 88064Code: Alles auswählen
CPU:
OS: Linux Ubuntu Ubuntu 24.10
Results fetched: 100
Average duration (s): 2596.5
Average credit: 53.80
Number of reported cores: 4
Per core per day: 1786
Per system per day: 7144
-
gemini8
- Vereinsvorstand

- Beiträge: 6649
- Registriert: 31.05.2011 10:30
- Wohnort: Hannover
Re: Generation X3D
Das liegt aber doch sicher auch an fehlender Optimierung seitens des Projekts, oder sehe ich das falsch?
Ich sitze übrigens nicht in einer Formel 1 Box, denn ich habe gar nicht die Rechner, mit denen ich entsprechend hantieren müsste oder könnte, wenn man davon absieht, dass auf meinem 5950X zwei VirtualBox Instanzen laufen, um einerseits GPU und CPU trennen zu können, wenn es von Vorteil ist, und andererseits die beiden CCDs auseinanderzuhalten.
Ich sitze übrigens nicht in einer Formel 1 Box, denn ich habe gar nicht die Rechner, mit denen ich entsprechend hantieren müsste oder könnte, wenn man davon absieht, dass auf meinem 5950X zwei VirtualBox Instanzen laufen, um einerseits GPU und CPU trennen zu können, wenn es von Vorteil ist, und andererseits die beiden CCDs auseinanderzuhalten.
-
JagDoc
- Vereinsmitglied

- Beiträge: 312
- Registriert: 03.12.2011 12:05
-
Kolossus
- TuX-omane

- Beiträge: 4717
- Registriert: 26.10.2014 14:51
Re: Generation X3D
Das war aber jetzt nicht nett.....
Ich habe schon gehört, dass Denis seit der Wiederkehr unter Linux richtig abgehen muss und du bestätigst mir das jetzt.
Vielleicht sollte ich doch den Zweitrechner mal auf Linux umstellen, um das herauszufinden. Wenn ich mir genügend Zeit lasse und es nicht übers Knie breche, bekomme ich es möglicherweise hin. Das Linux eine Klasse für sich ist, habe ich ja schon feststellen können.
Gruß Harald
Selbst wenn es die Sonne ist, die auf ihn scheint, ein Misthaufen antwortet immer nur mit Gestank...

Selbst wenn es die Sonne ist, die auf ihn scheint, ein Misthaufen antwortet immer nur mit Gestank...

-
Kolossus
- TuX-omane

- Beiträge: 4717
- Registriert: 26.10.2014 14:51
Re: Generation X3D
Du solltest dir bei Gelegenheit unbedingt mal den Film „Gokarts“ ansehen, dann weißt du, was ich meine.gemini8 hat geschrieben: ↑09.04.2025 07:37Ich sitze übrigens nicht in einer Formel 1 Box, denn ich habe gar nicht die Rechner, mit denen ich entsprechend hantieren müsste oder könnte, wenn man davon absieht, dass auf meinem 5950X zwei VirtualBox Instanzen laufen, um einerseits GPU und CPU trennen zu können, wenn es von Vorteil ist, und andererseits die beiden CCDs auseinanderzuhalten.
Klar, ist nur ein Film, in dem es darum geht, aus zusammengeklaubten Teilen etwas Besonderes zu machen.
Gruß Harald
Selbst wenn es die Sonne ist, die auf ihn scheint, ein Misthaufen antwortet immer nur mit Gestank...

Selbst wenn es die Sonne ist, die auf ihn scheint, ein Misthaufen antwortet immer nur mit Gestank...

-
JagDoc
- Vereinsmitglied

- Beiträge: 312
- Registriert: 03.12.2011 12:05
Re: Generation X3D
Ich hab auf einem 7945HX Win10 und Linux auf 2 verschiedenen m2-SSDs drauf.Kolossus hat geschrieben: ↑09.04.2025 08:03Das war aber jetzt nicht nett.....![]()
![]()
![]()
Ich habe schon gehört, dass Denis seit der Wiederkehr unter Linux richtig abgehen muss und du bestätigst mir das jetzt.
Vielleicht sollte ich doch den Zweitrechner mal auf Linux umstellen, um das herauszufinden. Wenn ich mir genügend Zeit lasse und es nicht übers Knie breche, bekomme ich es möglicherweise hin. Das Linux eine Klasse für sich ist, habe ich ja schon feststellen können.
Bei der Installation der beiden OS war immer nur 1 Laufwerk im System, da kann nichts schiefgehen.
Normal startet er bei mir mit Linux, will ich Win wähle ich nur Bios-bootmenü Win aus.

-
gemini8
- Vereinsvorstand

- Beiträge: 6649
- Registriert: 31.05.2011 10:30
- Wohnort: Hannover
Re: Generation X3D
Zusammengeklaut ist technisch nicht korrekt, aber zusammengesucht würde ich gelten lassen. 
Ich bekomme bei Denis übrigens keine Aufgaben, weil die Anfragen meiner Rechner gar nicht beim Server ankommen.
Es gibt wohl Probleme mit Cloudflare, das zu viel filtert, und ich bin nicht dazu bereit, all meine Kisten entsprechend zu bearbeiten.
Windows scheint hier von Vorteil zu sein, weil es seltener hängenbleibt.
Ich bekomme bei Denis übrigens keine Aufgaben, weil die Anfragen meiner Rechner gar nicht beim Server ankommen.
Es gibt wohl Probleme mit Cloudflare, das zu viel filtert, und ich bin nicht dazu bereit, all meine Kisten entsprechend zu bearbeiten.
Windows scheint hier von Vorteil zu sein, weil es seltener hängenbleibt.
-
gemini8
- Vereinsvorstand

- Beiträge: 6649
- Registriert: 31.05.2011 10:30
- Wohnort: Hannover
Re: Generation X3D
Ich würde Win installieren, danach Linux, während die Win-SSD im System hängt.
Dadurch hätte ich Grub als Bootloader, aus dem heraus ich dann das zu startende System auswählen kann; Standard ist bei Grub natürlich Linux.
Für Win-Updates würde ich dann immer das Linux abklemmen.





