Download GPU-Z: http://www.techpowerup.com/downloads/SysInfo/GPU-Z/ (Anzeige der Zahl Shader Prozessoren)
Download GPU Caps Viewer: http://www.geeks3d.com/category/geeks3d ... r-geeks3d/
Interessant dürfte neben der "Compute Capability" die "GPU Core Performance" sein, darunter die Unterstützung von "double precison". Die MW-GPU-Applikation für ATI-Grafikkarten nutzt dieses Verfahren bereits, ob die CUDA-Applikation von MW ebenfalls ? Wir dürfen gespannt sein, anmelden kann man sich bereits.
Edit 2: Wegen der Unübersichtlichkeit der langen Textausgabe sammle ich hier zentrale Ergebnisse, bitte ggf. mit der Schätzung des BOINC-Managers posten. Abweichende Werte identischer Karten (etwa durch unterschiedliche Taktraten) nehme ich einzeln auf, damit man sich ein Bild über den Einfluß machen kann. So viele Postings erwarte ich nicht, daß der Platz wieder knapp wird.
Edit 3: GFLOPS-Angaben waren um eine Kommastelle falsch umgerechnet. Werte korrigiert.
Edit 4: Kommastellen bei DoublePrecision korrigiert, danke respawner. Exemplarisch eine zweite GTX 285 aufgenommen.
Edit 5: GPU Caps Viewer als weiteres Analyse-Tool ergänzt (CUDA, OpenGL, OpenCL, Demos).
Edit 6: Die ersten Daten einer Fermi und eines Ion-IGP.
Edit 7: GTX 285M ergänzt sowie IGP-Chips farblich hervorgehoben.
- Modell / Compute Capability / SP / Takt / GFLOP SP > DP / Miop/s 32 > 24-bit (DualGPU, IGP) || BOINC: estimated**
_________________________________ - GTX 480 / 2.0 / 480 / 1401 / 1.263 > 168 / 671.597 > 670.813 || BOINC: est. 1345 GFLOPS***
- GTX 470 /
- GTX 465 /
- GTX 460 /
- GTS 450M /
- GTX 295 / 1.3 / 240 / 1512 / 722 > 89 / 144.984 > 721.980 || BOINC: est. 726 GFLOPS*** [OC]
- GTX 295 / 1.3 / 240 / 1242 / 593 > 73 / 119.054 > 592.719 || BOINC: est. 596 GFLOPS***
- GTX 285 / 1.3 / 240 / 1512 / 723 > 88 / 145.034 > 722.941 || BOINC: est. 726 GFLOPS*** [AMP-Edition, OC]
- GTX 285 / 1.3 / 240 / 1512 / 719 > 88 / 142.471 > 716.810 || - [OC]
- GTX 275 / 1.3 / 240 /
- GTX 260 / 1.3 / 216 / 1512 / 649 > 80 / 114.848 > 649.810 || BOINC: est. 583 GFLOPS*** [OC]
- GTX 260 / 1.3 / 192 / 1512 / 575 > 72 / 103.170 > 575.465 || BOINC: est. 104 GFLOPS [OC]
- GTS 350M /
- GTX 285M (G92b)/ 1.1 / 128 / 1500 / 381 > (-) / 76.519 > 380.996 || -
- GT 330 (G92b)/
- 9800GX2 / 1.1 / 128 / 1512 / 385 > (-) / 77.326 > 385.118 || BOINC: est. 69 GFLOPS
- 8800 GTX / 1.0 / 128 / 1350 / 343 > (-) / 45.461 > 226.549 || BOINC: est. 41 GFLOPS
- 8800 GT / 1.1 / 128 / 1512 / 323 > (-) / 68.898 > 311.457 || -
- 8800 GTS / 1.0 / 96 / 1188 / 226 > (-) / 45.461 > 343.475 || BOINC: est. 62 GFLOPS
- 8600
- 8400 GS / 1.1 / 16 / 918 / 29 > (-) / 5.868 > 29.244 || -
- 8400
- 9800*
- 9800 GT/ 1.1 / 112 / 1500 / 337 > (-) / 67.670 > 336.887 || BOINC: est. 60 GFLOPS
- 9600 GT/ 1.1 / 64 / 1500 / 189 > (-) / 37.930 > 188.710 || -
- 9600
- 9500 GT / 1.1 / 32 / 1710 / 108 > (-) / 21.714 > 108.137 || BOINC: est. 19 GFLOPS [OC]
- 9500 GT / 1.1 / 32 / 1400 / 89 > (-) / 17.892 > 89.258 || BOINC: est. 16 GFLOPS
- 9400M (Ion) IGP / 1.1 / 16 / 1100 / 34 > (-) / 5.770 > 5770 || BOINC: est. 35 GFLOPS
- 9400
- 9300 IGP / 1.1 / 16 / 1200 / 38 > (-) / 7.471 > 37.685 || -
- 9200M
- 8300 IGP / 1.1 / 8 / 1200 / 19 > (-) / 3.789 > 18.973 || BOINC: est. 3 GFLOPS
- 8200 IGP
- etc.
** wird vom Manager nach Initierung ausgegeben, vermutlich unabhängig vom Betriebssystem, Treiber etc.
*** "Peak"-Wert (neuere BOINC-Version ?)
[OC] = Overclocking, Übertaktung
Edit: drei nVidia-Karten zum Vergleich (die zwei GTX 260er laufen auf identischem Takt, Unterschied nur in der Zahl SP und dem Betriebssystem):
- 9800GX2 mit 2x 128 SP (Standardtakt)
Code: Alles auswählen
CUDA-Z Report ============= Version: 0.5.95 http://cuda-z.sourceforge.net/ OS Version: Windows x86 5.1.2600 Service Pack 3 Core Information ---------------- Name: GeForce 9800 GX2 Compute Capability: 1.1 Clock Rate: 1512 MHz Multiprocessors: 16 Warp Size: 32 Regs Per Block: 8192 Threads Per Block: 512 Watchdog Enabled: Yes Threads Dimentions: 512 x 512 x 64 Grid Dimentions: 65535 x 65535 x 1 Memory Information ------------------ Total Global: 511.75 MB Shared Per Block: 16 KB Pitch: 256 KB Total Constant: 64 KB Texture Alignment: 256 GPU Overlap: Yes Performance Information ----------------------- Memory Copy Host Pinned to Device: 2601.84 MB/s Host Pageable to Device: 2328.42 MB/s Device to Host Pinned: 2601.37 MB/s Device to Host Pageable: 2336.93 MB/s Device to Device: 26326.5 MB/s GPU Core Performance Single-precision Float: 384907 Mflop/s Double-precision Float: Not Supported 32-bit Integer: 77326.2 Miop/s 24-bit Integer: 385118 Miop/s Generated: Fri Apr 17 21:37:21 2009
- GTX 260 mit 192 SP (übertaktet 666/1512/1150 Core/shader/memory - wie GT200 oben)
Code: Alles auswählen
CUDA-Z Report ============= Version: 0.5.95 http://cuda-z.sourceforge.net/ OS Version: Windows AMD64 6.1.7000 Core Information ---------------- Name: GeForce GTX 260 Compute Capability: 1.3 Clock Rate: 1512 MHz Multiprocessors: 24 Warp Size: 32 Regs Per Block: 16384 Threads Per Block: 512 Watchdog Enabled: No Threads Dimentions: 512 x 512 x 64 Grid Dimentions: 65535 x 65535 x 1 Memory Information ------------------ Total Global: 896 MB Shared Per Block: 16 KB Pitch: 256 KB Total Constant: 64 KB Texture Alignment: 256 GPU Overlap: No Performance Information ----------------------- Memory Copy Host Pinned to Device: 1838.25 MB/s Host Pageable to Device: 1446.47 MB/s Device to Host Pinned: 1874.57 MB/s Device to Host Pageable: 1451.82 MB/s Device to Device: 50302.4 MB/s GPU Core Performance Single-precision Float: 575468 Mflop/s Double-precision Float: 71788.9 Mflop/s 32-bit Integer: 103170 Miop/s 24-bit Integer: 575465 Miop/s
- GTX 260 mit 216 SP (übertaktet 666/1512/1150 Core/shader/memory - wie GT200 oben)
Code: Alles auswählen
CUDA-Z Report ============= Version: 0.5.95 http://cuda-z.sourceforge.net/ OS Version: Windows x86 5.1.2600 Service Pack 3 Core Information ---------------- Name: GeForce GTX 260 Compute Capability: 1.3 Clock Rate: 1512 MHz Multiprocessors: 27 Warp Size: 32 Regs Per Block: 16384 Threads Per Block: 512 Watchdog Enabled: Yes Threads Dimentions: 512 x 512 x 64 Grid Dimentions: 65535 x 65535 x 1 Memory Information ------------------ Total Global: 895.688 MB Shared Per Block: 16 KB Pitch: 256 KB Total Constant: 64 KB Texture Alignment: 256 GPU Overlap: Yes Performance Information ----------------------- Memory Copy Host Pinned to Device: 2543.01 MB/s Host Pageable to Device: 2117.36 MB/s Device to Host Pinned: 2543.26 MB/s Device to Host Pageable: 2156.64 MB/s Device to Device: 52236.4 MB/s GPU Core Performance Single-precision Float: 649640 Mflop/s Double-precision Float: 80490.2 Mflop/s 32-bit Integer: 114848 Miop/s 24-bit Integer: 649810 Miop/s