PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : [OpenCL] LDSBandwidth


Spasstiger
2011-12-07, 12:05:09
Update vom 01. Februar 2015: Der Download des Benchmarks ist bei AMD nicht mehr einzeln verfügbar, sondern nur noch als Bestandteil des AMD-App-SDK. Außerdem wurden die Parameterbuchstaben geändert, so dass die alten Batch-Dateien nicht mehr funktionieren. Ich habe den LDSBandwidth-Benchmark zusammen mit aktualisierten Batch-Daten in ein ZIP-Archiv gepackt und angehängt. Die alten Links und Anhänge habe ich gelöscht.

Im AMD-APP-SDK gibts einen Benchmark, mit dem man die Bandbreite des Local Data Share messen kann.

Download Benchmark und Batch-Dateien (nur Windows x64)
http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=51082&stc=1&d=1422785496

Optional: Download SDK (für Windows x86- und Linux-User)
http://developer.amd.com/tools-and-sdks/opencl-zone/amd-accelerated-parallel-processing-app-sdk/

Hinweis zu den Batch-Dateien
Die Batchdatei Run_LDSBandwidth Default testet mit der Standard-Vektorlänge 2, die Batchdatei Run_LDSBandwidth_Extended testet alle Vektorlängen von 1 bis 4. Linux-Usern konfigurieren ihren Benchmark mit der Konsole selbst.

Radeon HD 6630M, Windows 7 x64, 64-Bit-Binary:
Default:
Platform 0 : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Turks
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 151.582 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 89.0692 GB/s
http://www.abload.de/thumb/ldsbandwidthxljce.png (http://www.abload.de/image.php?img=ldsbandwidthxljce.png)
Extended:
AccessType : single
VectorElements : 1
Bandwidth : 121.348 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 120.728 GB/s
[...]
AccessType : single
VectorElements : 2
Bandwidth : 153.406 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 89.3259 GB/s
[...]
AccessType : single
VectorElements : 3
Bandwidth : 151.913 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 45.8163 GB/s
[...]
AccessType : single
VectorElements : 4
Bandwidth : 149.541 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 45.8818 GB/s

Man From Atlantis
2011-12-07, 13:18:41
Windows 7 x64, 64-Bit-Binary:


GTX 460 1GB @675/1350/3600MHz - GF104
Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 460
Device 1 : GeForce 9800 GT
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 577.24 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 577.678 GB/s

GTX 460 1GB @975/1950/4600MHz
Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 460
Device 1 : GeForce 9800 GT
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 833.409 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 834.063 GB/s


9800GT @550/1375/1800 - G92b
Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 460
Device 1 : GeForce 9800 GT
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 566.438 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 291.522 GB/s

9800GT @650/1625/2200
Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 460
Device 1 : GeForce 9800 GT
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 680.468 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 349.798 GB/s

klutob
2011-12-07, 13:27:06
GTX 260 192SPs, Standardtakt


Platform 0 : NVIDIA Corporation

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 260
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 691.597 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 350.951 GB/s

Nighthawk13
2011-12-07, 14:13:54
GTX470@stock:

K:\LDSBandwidth\samples\opencl\bin\x86_64>LDSBandwidth.exe -v 1
Platform 0 : NVIDIA Corporation

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 470
Build Options are : -D DATATYPE=float

AccessType : single
VectorElements : 1
Bandwidth : 1053.32 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 1053.75 GB/s

K:\LDSBandwidth\samples\opencl\bin\x86_64>LDSBandwidth.exe -v 2
Platform 0 : NVIDIA Corporation

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 470
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 1069.97 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 1069.88 GB/s

K:\LDSBandwidth\samples\opencl\bin\x86_64>LDSBandwidth.exe -v 3
Platform 0 : NVIDIA Corporation

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 470
Expected Error: Device doesn't support built-in 3 component vectors!

K:\LDSBandwidth\samples\opencl\bin\x86_64>LDSBandwidth.exe -v 4
Platform 0 : NVIDIA Corporation

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 470
Build Options are : -D DATATYPE=float4

AccessType : single
VectorElements : 4
Bandwidth : 1073.29 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 540.428 GB/s

GTX480@stock
E:\LDSBandwidth\samples\opencl\bin\x86_64>LDSBandwidth.exe -v 1
Platform 0 : NVIDIA Corporation

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 480
Build Options are : -D DATATYPE=float

AccessType : single
VectorElements : 1
Bandwidth : 1299.46 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 1301.48 GB/s

E:\LDSBandwidth\samples\opencl\bin\x86_64>LDSBandwidth.exe -v 2
Platform 0 : NVIDIA Corporation

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 480
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 1322.39 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 1322.25 GB/s

E:\LDSBandwidth\samples\opencl\bin\x86_64>LDSBandwidth.exe -v 3
Platform 0 : NVIDIA Corporation

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 480
Expected Error: Device doesn't support built-in 3 component vectors!

E:\LDSBandwidth\samples\opencl\bin\x86_64>LDSBandwidth.exe -v 4
Platform 0 : NVIDIA Corporation

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 480
Build Options are : -D DATATYPE=float4

AccessType : single
VectorElements : 4
Bandwidth : 1326.57 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 668.031 GB/s

mksn7
2011-12-07, 15:01:04
Bobcat: (E-350)

single: 2,4 *10^-10 GB/s
linear: 2,36 *10^-10 GB/s

Mach ich irgendwas falsch? System ist Mint 11 64 mit SDK 2.5

Man From Atlantis
2011-12-07, 15:25:54
GTX 460 @675/1350/3600Mhz
http://www.abload.de/img/gtx460m80lx.png
Vector Elements 1
AccessType : single
VectorElements : 1
Bandwidth : 598.49 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 598.404 GB/s

Vector Elements 2
AccessType : single
VectorElements : 2
Bandwidth : 577.248 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 577.692 GB/s

Vector Elements 3
AccessType : single
VectorElements : 3
Bandwidth : 427.219 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 214.69 GB/s

Vector Elements 4
AccessType : single
VectorElements : 4
Bandwidth : 571.814 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 286.646 GB/s

Vector Elements 5
Error

9800GT @550/1350/1800Mhz
http://www.abload.de/img/9800gt18vv5.png
Vector Elements 1
AccessType : single
VectorElements : 1
Bandwidth : 553.436 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 549.524 GB/s

Vector Elements 2
AccessType : single
VectorElements : 2
Bandwidth : 566.499 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 291.511 GB/s

Vector Elements 3
Error

Vector Elements 4
AccessType : single
VectorElements : 4
Bandwidth : 514.474 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 141.145 GB/s

Vector Elements 5
Error

Spasstiger
2011-12-07, 16:08:11
Radeon HD 4850, Windows 7 x64, 64-Bit-Binary

Platform 0 : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : ATI RV770
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 92.5887 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 94.4026 GB/s

Und mit verschiedenen Vektorlängen:
AccessType : single
VectorElements : 1
Bandwidth : 78.8117 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 78.2892 GB/s

AccessType : single
VectorElements : 2
Bandwidth : 92.5887 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 94.4026 GB/s

Expected Error: Device doesn't support built-in 3 component vectors!

AccessType : single
VectorElements : 4
Bandwidth : 85.145 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 83.5902 GB/s

5 Vektorelemente werden nicht unterstützt.
Scheint den Nvidia-Karten deutlich besser zu liegen als den Radeons.

@Man From Atlantis: Danke für die ausführlichen Resultate.

Einen CPU-Fallback gibts übrigens auch:
Core i3-2310M, Intel HD 3000 + Radeon HD 6630M @ Dynamic Switching, Windows 7 x64, 64-Bit-Binary
Platform 0 : Advanced Micro Devices, Inc.
GPU not found. Falling back to CPU device

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Intel(R) Core(TM) i3-2310M CPU @ 2.10GHz
Build Options are : -D DATATYPE=float

AccessType : single
VectorElements : 1
Bandwidth : 14.3829 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 15.2305 GB/s

[...]
AccessType : single
VectorElements : 2
Bandwidth : 31.0078 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 17.1403 GB/s

[...]
AccessType : single
VectorElements : 3
Bandwidth : 41.6833 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 42.302 GB/s

[...]
AccessType : single
VectorElements : 4
Bandwidth : 62.6729 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 56.5176 GB/s

Eine Batch-Datei für Windows, mit der man die verschiedenen Vektorlängen in einem Rutsch durchtesten kann, hab ich in das Zip-Archiv im Anhang hinzugefügt (Run_LDSBandwidth Extended.bat).

Nighthawk13
2011-12-07, 16:41:03
Die Radeons der 5000/6000er Serie sollten viel besser dastehen als die 4000er(Die 90GB/s der 4850 sind der Fallback zum normalen VRAM).

Spasstiger
2011-12-07, 16:54:11
(Die 90GB/s sind der Fallback zum normalen VRAM).
Meine Radeon HD 6630M hat nur 25,6 GB/s Speicherbandbreite (DDR3 @ 128 Bit).
Hab übrigens Ergebnisse mit anderen Vektorlängen im Startposting ergänzt.

Luziver
2011-12-07, 18:19:16
GTX260² 650/1400/999 Win7 64

AccessType : single
VectorElements : 1
Bandwidth : 864.917 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 859.624 GB/s



AccessType : single
VectorElements : 2
Bandwidth : 879.759 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 446.364 GB/s



AccessType : single
VectorElements : 3
Bandwidth : 836.208 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 220.349 GB/s



AccessType : single
VectorElements : 4
Bandwidth : 848.329 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 220.771 GB/s

Nighthawk13
2011-12-07, 19:14:35
Am Rande: shared memory bandwidth bei unter DirectCompute:

GTX470: 615 GB/s read, 415GB/s write
HD5870: 1064GB/s read, 736 GB/s write
http://www.beyond3d.com/content/reviews/55/14

Die GTX470 kommt in dem OpenCL Benchmark hier im Thread deutlich besser weg. Wär mal neugierig, wie sich die 5870 im Vergleich schlägt.

HarryHirsch
2011-12-07, 20:48:13
5870 @ default

AccessType : single
VectorElements : 1
Bandwidth : 894.211 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 863.425 GB/s

AccessType : single
VectorElements : 2
Bandwidth : 1059.97 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 929.042 GB/s


AccessType : single
VectorElements : 3
Bandwidth : 1069.32 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 528.349 GB/s


AccessType : single
VectorElements : 4
Bandwidth : 1132.68 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 530.578 GB/s

Saugbär
2011-12-08, 03:17:58
GeForce GTX 470 @800-1600-1800

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 470
Build Options are : -D DATATYPE=float
AccessType : single
VectorElements : 1
Bandwidth : 1381.12 GB/s
AccessType : linear
VectorElements : 1
Bandwidth : 1380.63 GB/s

Build Options are : -D DATATYPE=float2
AccessType : single
VectorElements : 2
Bandwidth : 1400.27 GB/s
AccessType : linear
VectorElements : 2
Bandwidth : 1400.28 GB/s

Build Options are : -D DATATYPE=float3
AccessType : single
VectorElements : 3
Bandwidth : 1056.76 GB/s
AccessType : linear
VectorElements : 3
Bandwidth : 531.89 GB/s

Build Options are : -D DATATYPE=float4
AccessType : single
VectorElements : 4
Bandwidth : 1408.26 GB/s
AccessType : linear
VectorElements : 4
Bandwidth : 709.253 GB/s

Man From Atlantis
2011-12-08, 10:39:19
So more SM means more bandwith if you think it is like memory controller.. GTX 470 gets exact double bandwith of GTX 460 at same base clock(14SMs vs 7SMs).. that's why Turks BW is on the floor when Cyress XT on the roof

GTX 460@800/1600/3600MHz

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 460
Build Options are : -D DATATYPE=float

AccessType : single
VectorElements : 1
Bandwidth : 730.803 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 730.715 GB/s

AccessType : single
VectorElements : 2
Bandwidth : 705.075 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 705.619 GB/s

AccessType : single
VectorElements : 3
Bandwidth : 521.798 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 262.202 GB/s

AccessType : single
VectorElements : 4
Bandwidth : 698.393 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 350.111 GB/s

Nighthawk13
2011-12-08, 13:42:24
@Thx at HarryHirsch.

D.h. die 5870 ist unter OpenCL und DirectCompute ähnlich schnell(So sollte es sein).
Die Performance der 470 ist unter OpenCL vergleichbar der 5870, aber unter DirectCompute merklich langsamer(zumindest in dem Beyond3D review, könnte natürlich am alten Treiber liegen).

nVoodoo
2011-12-08, 19:59:07
HD6950 2GB @Stock


Build Options are : -D DATATYPE=float
AccessType : single
VectorElements : 1
Bandwidth : 865.002 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 904.292 GB/s

Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 1055.78 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 945.121 GB/s

Build Options are : -D DATATYPE=float3

AccessType : single
VectorElements : 3
Bandwidth : 1064.91 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 538.379 GB/s

Build Options are : -D DATATYPE=float4

AccessType : single
VectorElements : 4
Bandwidth : 1124.57 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 542.57 GB/s


A4-3300M 6480G@Single DDR3-1333


Platform 0 : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : BeaverCreek
Build Options are : -D DATATYPE=float

AccessType : single
VectorElements : 1
Bandwidth : 2.58263e+006 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 2.39602e+006 GB/s


Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 4.65221e+006 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 4.29987e+006 GB/s


Build Options are : -D DATATYPE=float3

AccessType : single
VectorElements : 3
Bandwidth : 6.66617e+006 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 6.85739e+006 GB/s


Build Options are : -D DATATYPE=float4

AccessType : single
VectorElements : 4
Bandwidth : 9.35947e+006 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 8.93761e+006 GB/s

samm
2011-12-09, 13:13:06
oO Llano geht hier ja ab... sieht man allerdings Brazos an, könnte man auch einfach an einen Berechnungsfehler denken... Oder hat jemand eine Erklärung?

nVoodoo
2011-12-09, 13:24:56
Naja zumindest laut GPU-Z wird OpenCL beim 6480G nicht unterstützt oder ist das nurn Anzeigefehler?

Pirx
2011-12-09, 13:46:37
Kann doch bei den APUs nur ein fehler sein, oder? LDS ist je nachdem VRAM oder RAM und bei den APUs halt RAM?

nVoodoo
2011-12-09, 15:37:18
Naja aber der VRAM meiner 6950 schafft aber normal auch keine >1000GB/s und die 6630M von Spasstiger schafft ja auch mehr als der MC hergeben kann ich denke mal es liegt an der fehlenden OCL unterstützung!?

Nighthawk13
2011-12-12, 13:36:29
Auch beim LLano kanns max. die Geschwindigkeit vom L1-Cache sein, also definitiv weit unter 1000GB/s(real wohl eher 100GB/s).

Vermutung: Der Kernel steigt sofort mit nem Fehler aus, der Timing-Code misst eine eine sehr kurze Zeitspanne und kommt so auf ne Riesengeschwindigkeit.

Spasstiger
2015-02-01, 11:17:03
Radeon HD 7750 (800 MHz), Windows 8.1 x64, Catalyst 14.12

C:\Users\Chris\Downloads\Run_LDSBandwidth>LDSBandwidth.exe -c 1
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Capeverde Device ID is 000000EF4267BD70
Build Options are : -D DATATYPE=float

AccessType : single
VectorElements : 1
Bandwidth : 350.528 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 342.834 GB/s

AccessType : linear write
VectorElements : 1
Bandwidth : 339.353 GB/s

C:\Users\Chris\Downloads\Run_LDSBandwidth>LDSBandwidth.exe -c 2
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Capeverde Device ID is 0000009F0DCA9290
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 611.332 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 543.769 GB/s

AccessType : linear write
VectorElements : 2
Bandwidth : 350.282 GB/s

C:\Users\Chris\Downloads\Run_LDSBandwidth>LDSBandwidth.exe -c 3
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Capeverde Device ID is 000000D1D4169290
Build Options are : -D DATATYPE=float3

AccessType : single
VectorElements : 3
Bandwidth : 374.717 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 281.838 GB/s

AccessType : linear write
VectorElements : 3
Bandwidth : 304.87 GB/s

C:\Users\Chris\Downloads\Run_LDSBandwidth>LDSBandwidth.exe -c 4
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Capeverde Device ID is 0000007B7C739290
Build Options are : -D DATATYPE=float4

AccessType : single
VectorElements : 4
Bandwidth : 717.883 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 403.402 GB/s

AccessType : linear write
VectorElements : 4
Bandwidth : 204.256 GB/s

C:\Users\Chris\Downloads\Run_LDSBandwidth>pause
Drücken Sie eine beliebige Taste . . .

Die GCN-Architektur hat ein großen Schritt im Bereich der Cache-Bandbreite gegenüber der VLIW5-Architektur gemacht, wenn ich mit meiner Radeon HD 6630M vergleiche. Bis zu 600 GB/s mit der Radeon HD 7750 im Vergleich zu bis zu 150 GB/s mit der HD 6630M.

@nVoodoo: Der Benchmark testet den Cache, nicht den VRAM.

Lard
2015-02-01, 13:01:58
HD 7970 1200/1700 MHz Win7 x64, Catalyst 14.12
d:\Anwender\LDSBandwidth>LDSBandwidth.exe -c 1
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Tahiti Device ID is 0000000000346E20
Build Options are : -D DATATYPE=float

AccessType : single
VectorElements : 1
Bandwidth : 3732.41 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 3231.79 GB/s

AccessType : linear write
VectorElements : 1
Bandwidth : 2394.25 GB/s

d:\Anwender\LDSBandwidth>LDSBandwidth.exe -c 2
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Tahiti Device ID is 00000000003D6E20
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 4575.65 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 4465.14 GB/s

AccessType : linear write
VectorElements : 2
Bandwidth : 2398.51 GB/s

d:\Anwender\LDSBandwidth>LDSBandwidth.exe -c 3
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Tahiti Device ID is 0000000000256E20
Build Options are : -D DATATYPE=float3

AccessType : single
VectorElements : 3
Bandwidth : 3425.61 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 1765.82 GB/s

AccessType : linear write
VectorElements : 3
Bandwidth : 1817.27 GB/s

d:\Anwender\LDSBandwidth>LDSBandwidth.exe -c 4
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Tahiti Device ID is 00000000003C6E20
Build Options are : -D DATATYPE=float4

AccessType : single
VectorElements : 4
Bandwidth : 4576.36 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 2360.14 GB/s

AccessType : linear write
VectorElements : 4
Bandwidth : 1206.1 GB/s

d:\Anwender\LDSBandwidth>pause
Drücken Sie eine beliebige Taste . . .

HarryHirsch
2015-02-01, 13:11:58
R9 290X stock


L:\LDSBandwidth>LDSBandwidth.exe
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Hawaii Device ID is 0000000002736DA0
Device 1 : Hawaii Device ID is 0000000003543540
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 5490.01 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 5493.12 GB/s

AccessType : linear write
VectorElements : 2
Bandwidth : 2753.86 GB/s

L:\LDSBandwidth>pause
Drücken Sie eine beliebige Taste . . .

L:\LDSBandwidth>LDSBandwidth.exe -c 2
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Hawaii Device ID is 0000000002142CB0
Device 1 : Hawaii Device ID is 000000000213F6B0
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 5455.41 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 5454.62 GB/s

AccessType : linear write
VectorElements : 2
Bandwidth : 2750.26 GB/s

L:\LDSBandwidth>LDSBandwidth.exe -c 3
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Hawaii Device ID is 0000000002742CB0
Device 1 : Hawaii Device ID is 000000000273F6B0
Expected Error: Device doesn't support built-in 3 component vectors!

L:\LDSBandwidth>LDSBandwidth.exe -c 4
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Hawaii Device ID is 0000000002742CB0
Device 1 : Hawaii Device ID is 000000000273F6B0
Build Options are : -D DATATYPE=float4

AccessType : single
VectorElements : 4
Bandwidth : 5383.7 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 2750.04 GB/s

AccessType : linear write
VectorElements : 4
Bandwidth : 1378.55 GB/s

L:\LDSBandwidth>pause
Drücken Sie eine beliebige Taste . . .

del_4901
2015-02-01, 15:06:21
@nVoodoo: Der Benchmark testet den Cache, nicht den VRAM.
LDS ist weder cache noch VRAM bei AMD und NV.

HarryHirsch
2015-02-01, 17:08:38
Wasn dann? Ist nen vergleich überhaupt sinnvoll?

Spasstiger
2015-02-01, 17:33:42
LDS ist weder cache noch VRAM bei AMD und NV.
Ok, dann nennen wir es SRAM. ;)
Ich wollte eigentlich darauf hinaus, dass die LDS-Bandbreite wesentlich höher sein kann als die VRAM-Bandbreite.

Wasn dann? Ist nen vergleich überhaupt sinnvoll?
Der LDS wurde afaik mit DirectX 10 spezifiziert. Im Unterschied zum Cache ist der LDS programmierbar.

del_4901
2015-02-01, 17:36:01
LDS ist einfach nur "Scratch Memory".

Spasstiger
2015-02-01, 17:56:30
Kann man denn ausgehend von den 5,5 Terabyte/s bei der R9 290X von HarryHirsch annehmen, dass die Hawaii-GPU eine LDS-Anbindung mit einer Breite von 1024 Bit/128 Byte je Compute Unit hat? Damit komme ich bei 1000 MHz Boost-Takt und 44 CUs auf theoretisch 5,632 Terabyte/s LDS-Bandbreite.

HarryHirsch
2015-02-01, 18:08:55
Also nen Teiler oder so ist da nicht zwischen. Wenn ich 20% mehr Takt gebe steigt die Bandbreite genau so.

diedl
2015-02-01, 20:05:55
Mini-ITX HTCP
i5-4570@3,1 GHz 0,85V
HD 4600 @1350 MHz
2x4 GiB DDR3 800 (1600) MHz
Win 8.1 pro 64

Spasstiger
2015-02-01, 20:29:44
Intel hat sich auch nicht lumpen lassen, wenn schon die HD 4600 auf über 300 GB/s kommt. Wie da wohl Broadwell Iris Pro abschneidet?!

Also nen Teiler oder so ist da nicht zwischen. Wenn ich 20% mehr Takt gebe steigt die Bandbreite genau so.
Mit einem Teiler bleiben die prozentualen Verhältnisse immer erhalten. ;)
Aber bei AMD müsste tatsächlich ein LDS-Zugriff pro Zyklus möglich sein, so war es zumindest bei Cayman.

Ich hab auch mal übertaktet, skaliert nahezu 1:1.
Radeon HD 7750 @ 1060/1275 MHz, Windows 8.1 x64, Catalyst 14.12
C:\Users\Chris\Downloads\Run_LDSBandwidth>LDSBandwidth.exe -c 1
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Capeverde Device ID is 000000C36DD9AEC0
Build Options are : -D DATATYPE=float

AccessType : single
VectorElements : 1
Bandwidth : 458.77 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 454.745 GB/s

AccessType : linear write
VectorElements : 1
Bandwidth : 450.427 GB/s

C:\Users\Chris\Downloads\Run_LDSBandwidth>LDSBandwidth.exe -c 2
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Capeverde Device ID is 0000007E06AECBA0
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 803.002 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 720.244 GB/s

AccessType : linear write
VectorElements : 2
Bandwidth : 464.248 GB/s

C:\Users\Chris\Downloads\Run_LDSBandwidth>LDSBandwidth.exe -c 3
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Capeverde Device ID is 00000038BBACCBA0
Build Options are : -D DATATYPE=float3

AccessType : single
VectorElements : 3
Bandwidth : 494.934 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 373.526 GB/s

AccessType : linear write
VectorElements : 3
Bandwidth : 403.879 GB/s

C:\Users\Chris\Downloads\Run_LDSBandwidth>LDSBandwidth.exe -c 4
Platform 0 : Advanced Micro Devices, Inc.
Platform found : Advanced Micro Devices, Inc.

Selected Platform Vendor : Advanced Micro Devices, Inc.
Device 0 : Capeverde Device ID is 0000007697DDCBA0
Build Options are : -D DATATYPE=float4

AccessType : single
VectorElements : 4
Bandwidth : 946.015 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 535.285 GB/s

AccessType : linear write
VectorElements : 4
Bandwidth : 270.767 GB/s

C:\Users\Chris\Downloads\Run_LDSBandwidth>pause
Drücken Sie eine beliebige Taste . . .

Bei float2 @ single access steigt der Durchsatz bei mir um 31,4% mit einer Erhöhung des GPU-Taktes um 32,5%.

atopisch
2015-02-02, 09:52:00
Core i7-3667U HD Graphics 4000@350MHz

C:\Bench\LDSBandwidth>LDSBandwidth.exe -c 1
Platform 0 : Intel(R) Corporation
Platform found : Intel(R) Corporation

Selected Platform Vendor : Intel(R) Corporation
Device 0 : Intel(R) HD Graphics 4000 Device ID is 0000000000413F90
Build Options are : -D DATATYPE=float

AccessType : single
VectorElements : 1
Bandwidth : 39.4217 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 39.4588 GB/s

AccessType : linear write
VectorElements : 1
Bandwidth : 22.2206 GB/s

C:\Bench\LDSBandwidth>LDSBandwidth.exe -c 2
Platform 0 : Intel(R) Corporation
Platform found : Intel(R) Corporation

Selected Platform Vendor : Intel(R) Corporation
Device 0 : Intel(R) HD Graphics 4000 Device ID is 0000000000351730
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 78.4769 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 39.8673 GB/s

AccessType : linear write
VectorElements : 2
Bandwidth : 29.6665 GB/s

C:\Bench\LDSBandwidth>LDSBandwidth.exe -c 3
Platform 0 : Intel(R) Corporation
Platform found : Intel(R) Corporation

Selected Platform Vendor : Intel(R) Corporation
Device 0 : Intel(R) HD Graphics 4000 Device ID is 00000000002E1730
Build Options are : -D DATATYPE=float3

AccessType : single
VectorElements : 3
Bandwidth : 59.7226 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 30.1801 GB/s

AccessType : linear write
VectorElements : 3
Bandwidth : 26.7273 GB/s

C:\Bench\LDSBandwidth>LDSBandwidth.exe -c 4
Platform 0 : Intel(R) Corporation
Platform found : Intel(R) Corporation

Selected Platform Vendor : Intel(R) Corporation
Device 0 : Intel(R) HD Graphics 4000 Device ID is 0000000000501730
Build Options are : -D DATATYPE=float4

AccessType : single
VectorElements : 4
Bandwidth : 79.5686 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 40.2316 GB/s

AccessType : linear write
VectorElements : 4
Bandwidth : 35.6364 GB/s

Core i7-3667U HD Graphics 4000@1150MHz

C:\Bench\LDSBandwidth>LDSBandwidth.exe -c 1
Platform 0 : Intel(R) Corporation
Platform found : Intel(R) Corporation

Selected Platform Vendor : Intel(R) Corporation
Device 0 : Intel(R) HD Graphics 4000 Device ID is 00000000003F3F90
Build Options are : -D DATATYPE=float

AccessType : single
VectorElements : 1
Bandwidth : 129.101 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 129.565 GB/s

AccessType : linear write
VectorElements : 1
Bandwidth : 73.0019 GB/s

C:\Bench\LDSBandwidth>LDSBandwidth.exe -c 2
Platform 0 : Intel(R) Corporation
Platform found : Intel(R) Corporation

Selected Platform Vendor : Intel(R) Corporation
Device 0 : Intel(R) HD Graphics 4000 Device ID is 00000000001E1730
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 256.472 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 130.98 GB/s

AccessType : linear write
VectorElements : 2
Bandwidth : 97.4637 GB/s

C:\Bench\LDSBandwidth>LDSBandwidth.exe -c 3
Platform 0 : Intel(R) Corporation
Platform found : Intel(R) Corporation

Selected Platform Vendor : Intel(R) Corporation
Device 0 : Intel(R) HD Graphics 4000 Device ID is 00000000003A1730
Build Options are : -D DATATYPE=float3

AccessType : single
VectorElements : 3
Bandwidth : 196.257 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 99.1167 GB/s

AccessType : linear write
VectorElements : 3
Bandwidth : 87.8156 GB/s

C:\Bench\LDSBandwidth>LDSBandwidth.exe -c 4
Platform 0 : Intel(R) Corporation
Platform found : Intel(R) Corporation

Selected Platform Vendor : Intel(R) Corporation
Device 0 : Intel(R) HD Graphics 4000 Device ID is 0000000000481730
Build Options are : -D DATATYPE=float4

AccessType : single
VectorElements : 4
Bandwidth : 261.341 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 132.17 GB/s

AccessType : linear write
VectorElements : 4
Bandwidth : 117.088 GB/s

diedl
2015-02-02, 15:04:18
Zur besseren Vergleichbarkeit die HD 4600 mit 1150 MHz.
350 MHz kann ich bei mir leider nicht einstellen.


D:\Dateien\LDSBandwidth>LDSBandwidth.exe -c 1
Platform 0 : Intel(R) Corporation
Platform found : Intel(R) Corporation

Selected Platform Vendor : Intel(R) Corporation
Device 0 : Intel(R) HD Graphics 4600 Device ID is 00000074ED440DC0
Build Options are : -D DATATYPE=float

AccessType : single
VectorElements : 1
Bandwidth : 135.977 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 145.239 GB/s

AccessType : linear write
VectorElements : 1
Bandwidth : 73.0931 GB/s

D:\Dateien\LDSBandwidth>LDSBandwidth.exe -c 2
Platform 0 : Intel(R) Corporation
Platform found : Intel(R) Corporation

Selected Platform Vendor : Intel(R) Corporation
Device 0 : Intel(R) HD Graphics 4600 Device ID is 000000DB70342610
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 289.922 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 145.942 GB/s

AccessType : linear write
VectorElements : 2
Bandwidth : 97.5097 GB/s

D:\Dateien\LDSBandwidth>LDSBandwidth.exe -c 3
Platform 0 : Intel(R) Corporation
Platform found : Intel(R) Corporation

Selected Platform Vendor : Intel(R) Corporation
Device 0 : Intel(R) HD Graphics 4600 Device ID is 0000000F628A2610
Build Options are : -D DATATYPE=float3

AccessType : single
VectorElements : 3
Bandwidth : 200.751 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 107.678 GB/s

AccessType : linear write
VectorElements : 3
Bandwidth : 87.8115 GB/s

D:\Dateien\LDSBandwidth>LDSBandwidth.exe -c 4
Platform 0 : Intel(R) Corporation
Platform found : Intel(R) Corporation

Selected Platform Vendor : Intel(R) Corporation
Device 0 : Intel(R) HD Graphics 4600 Device ID is 0000008F6CEF2610
Build Options are : -D DATATYPE=float4

AccessType : single
VectorElements : 4
Bandwidth : 268.144 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 143.57 GB/s

AccessType : linear write
VectorElements : 4
Bandwidth : 117.086 GB/s



Gruß diedl

atopisch
2015-02-02, 22:03:56
GTX980@1500MHz

D:\Benchmark\LDSBandwidth>LDSBandwidth.exe -c 1
Platform 0 : NVIDIA Corporation
Platform found : NVIDIA Corporation

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 980 Device ID is 00000000026EC270
Build Options are : -D DATATYPE=float

AccessType : single
VectorElements : 1
Bandwidth : 2171.94 GB/s

AccessType : linear
VectorElements : 1
Bandwidth : 2254.17 GB/s

AccessType : linear write
VectorElements : 1
Bandwidth : 2430.64 GB/s

D:\Benchmark\LDSBandwidth>LDSBandwidth.exe -c 2
Platform 0 : NVIDIA Corporation
Platform found : NVIDIA Corporation

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 980 Device ID is 00000000028EC240
Build Options are : -D DATATYPE=float2

AccessType : single
VectorElements : 2
Bandwidth : 4938.63 GB/s

AccessType : linear
VectorElements : 2
Bandwidth : 2883.46 GB/s

AccessType : linear write
VectorElements : 2
Bandwidth : 2974.28 GB/s

D:\Benchmark\LDSBandwidth>LDSBandwidth.exe -c 3
Platform 0 : NVIDIA Corporation
Platform found : NVIDIA Corporation

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 980 Device ID is 00000000026EC240
Build Options are : -D DATATYPE=float3

AccessType : single
VectorElements : 3
Bandwidth : 4379.39 GB/s

AccessType : linear
VectorElements : 3
Bandwidth : 1131.68 GB/s

AccessType : linear write
VectorElements : 3
Bandwidth : 1129.5 GB/s

D:\Benchmark\LDSBandwidth>LDSBandwidth.exe -c 4
Platform 0 : NVIDIA Corporation
Platform found : NVIDIA Corporation

Selected Platform Vendor : NVIDIA Corporation
Device 0 : GeForce GTX 980 Device ID is 00000000028CC240
Build Options are : -D DATATYPE=float4

AccessType : single
VectorElements : 4
Bandwidth : 5359.6 GB/s

AccessType : linear
VectorElements : 4
Bandwidth : 2997.56 GB/s

AccessType : linear write
VectorElements : 4
Bandwidth : 2995.78 GB/s

Gipsel
2015-02-03, 19:26:57
Kann man denn ausgehend von den 5,5 Terabyte/s bei der R9 290X von HarryHirsch annehmen, dass die Hawaii-GPU eine LDS-Anbindung mit einer Breite von 1024 Bit/128 Byte je Compute Unit hat?Ganz genau.
Im Detail ist es technisch wohl noch etwas anders gelöst. Es existieren zwei Datenpfade für den LDS in einer CU, die jeweils 64 Byte (512 Bit) breit sind. Einer bedient jeweils zwei der insgesamt vier SIMD-Einheiten einer CU. Eine einzelne SIMD-Einheit kann also nur maximal die Hälfte der verfügbaren Bandbreite benutzen.

http://abload.de/img/gcn_lds26z8i.png
Die Grafik enthält übrigens einen Fehler, obwohl direkt von AMD.

Auf Die-Shots erkennt man übrigens, daß sich der LDS (bei GCN) grob in der Mitte einer CU befindet und die beiden SIMD-Paare zu beiden Seiten davon. Das verkürzt die Übertragungswege und ist vermutlich mit ein Grund für die Spaltung in 2x512Bit.