PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : OpenCL MemBench


Mr. Lolman
2015-01-27, 09:12:35
Link: http://www.forum-3dcenter.org/vbulletin/showpost.php?p=10500793&postcount=1408


Postet eure Ergebnisse. Meine folgen am Abend (inkl Besonderheiten, da ich offenbar bei den letzten 2 Chunks immer nur ~1.2GB/s erreich, mit >100ms Latenz - und das bei einem eigentlich recht gutem System: Win8.1 x64, i4770k@4.3GHz, 16GB RAM @2.4GHz, 1T, Gigabyte X87 UD4H, 290X@1120/1515, Crucial M500 480GB SSD)

Air Force One
2015-01-27, 10:52:52
Liegt ja angeblich am Fenstermodus und sollte mit igpu normal sein.

290X@ 1150/1500MHZ:
http://www.imageupload.co.uk/images/2015/01/26/Air_Force_One_-_3dcenterxyZhd.png



Meine Karte kann auch 1650MHZ VRAM Takt, aber dem bench ist das realtiv egal.



Hier jetzt mit Werks OC (1060/1350)und mit iGPU und Benchmark auf der 290X:
http://www.imageupload.co.uk/images/2015/01/27/Unbenannt2.png (http://www.imageupload.co.uk/56r6)

Mr. Lolman
2015-01-27, 11:09:04
Genauso erwarte ich mir das eigentlich auch bei meinem System. Dennoch hab ich nur ~1.2GB/s und >100ms bei Chunk 31 und 32.

diedl
2015-01-27, 11:12:33
Mein Mini-ITX HTCP
i5-4570
HD 4600 @1350 MHz
2x4 GiB DDR3 800 (1600) MHz
Win 8.1 pro 64

Obwohl hier ja auf den gleichen Speicher zugegriffen
wird, sind die Werte mit der iGPU jeweils ~ um Faktor 2
besser.
Air Force One Chunk 31/32 Werte entsprechen eher meinen
CPU-Werten.

Gruß diedl

Mr. Lolman
2015-01-27, 16:36:10
@Air Force One: Wie schauen denn deine Werte ohne iGPU aus?

Air Force One
2015-01-27, 16:39:10
Erster ist ohne igpu und zweiter mit.
Daher ist der zweite ja besser, nur eben ohne OC.

Mr. Lolman
2015-01-27, 17:43:30
Oha, na gut, dann hackts bei mir wirklich irgendwo...


Init OpenCL...
Create platforms...
[1] AMD Accelerated Parallel Processing
[2] Intel(R) OpenCL
Select platform (enter number 1-2):
1
Using platform AMD Accelerated Parallel Processing
[1] Hawaii 44 compute units
[2] Intel(R) Core(TM) i7-4770K CPU @ 3.50GHz 8 compute units
Select device (enter number 1-2):
1
Using device Hawaii . Memory available 2878 MB of 4096MB
Allocating chunk 32
Chunk 1 0 MB 0.5 ms 237.6 GB/s TRUE
Chunk 2 128 MB 0.5 ms 239.2 GB/s TRUE
Chunk 3 256 MB 0.5 ms 234.8 GB/s TRUE
Chunk 4 384 MB 0.5 ms 237.9 GB/s TRUE
Chunk 5 512 MB 0.5 ms 234.8 GB/s TRUE
Chunk 6 640 MB 0.5 ms 234.3 GB/s TRUE
Chunk 7 768 MB 0.5 ms 233.9 GB/s TRUE
Chunk 8 896 MB 0.5 ms 234.5 GB/s TRUE
Chunk 9 1024 MB 0.5 ms 234.8 GB/s TRUE
Chunk 10 1152 MB 0.5 ms 234.3 GB/s TRUE
Chunk 11 1280 MB 0.5 ms 234.7 GB/s TRUE
Chunk 12 1408 MB 0.5 ms 234.6 GB/s TRUE
Chunk 13 1536 MB 0.5 ms 235.5 GB/s TRUE
Chunk 14 1664 MB 0.5 ms 234.7 GB/s TRUE
Chunk 15 1792 MB 0.5 ms 234.3 GB/s TRUE
Chunk 16 1920 MB 0.5 ms 234.6 GB/s TRUE
Chunk 17 2048 MB 0.5 ms 235.1 GB/s TRUE
Chunk 18 2176 MB 0.6 ms 232.2 GB/s TRUE
Chunk 19 2304 MB 0.5 ms 234.9 GB/s TRUE
Chunk 20 2432 MB 0.5 ms 234.8 GB/s TRUE
Chunk 21 2560 MB 0.5 ms 234.3 GB/s TRUE
Chunk 22 2688 MB 0.5 ms 234.8 GB/s TRUE
Chunk 23 2816 MB 0.5 ms 234.8 GB/s TRUE
Chunk 24 2944 MB 0.5 ms 235.5 GB/s TRUE
Chunk 25 3072 MB 0.5 ms 234.7 GB/s TRUE
Chunk 26 3200 MB 0.5 ms 234.5 GB/s TRUE
Chunk 27 3328 MB 0.6 ms 231.0 GB/s TRUE
Chunk 28 3456 MB 0.5 ms 235.2 GB/s TRUE
Chunk 29 3584 MB 0.5 ms 235.3 GB/s TRUE
Chunk 30 3712 MB 0.6 ms 229.0 GB/s TRUE
Chunk 31 3840 MB 104.4 ms 1.2 GB/s TRUE
Chunk 32 3968 MB 104.5 ms 1.2 GB/s TRUE
All done. Press ENTER...
1

Mr. Lolman
2015-01-27, 19:18:43
Lol, das Ding lief nur auf 2x PCIe. Und bei 1500MHz VRAM dürfte der Sweet Spot sein. Drüber bricht sie auf ~215GB/s ein.


Init OpenCL...
Create platforms...
[1] AMD Accelerated Parallel Processing
[2] Intel(R) OpenCL
Select platform (enter number 1-2):
1
Using platform AMD Accelerated Parallel Processing
[1] Hawaii 44 compute units
[2] Intel(R) Core(TM) i7-4770K CPU @ 3.50GHz 8 compute units
Select device (enter number 1-2):
1
Using device Hawaii . Memory available 2878 MB of 4096MB
Allocating chunk 32
Chunk 1 0 MB 0.5 ms 234.9 GB/s TRUE
Chunk 2 128 MB 0.5 ms 234.2 GB/s TRUE
Chunk 3 256 MB 0.5 ms 235.5 GB/s TRUE
Chunk 4 384 MB 0.5 ms 234.4 GB/s TRUE
Chunk 5 512 MB 0.5 ms 235.0 GB/s TRUE
Chunk 6 640 MB 0.5 ms 235.2 GB/s TRUE
Chunk 7 768 MB 0.5 ms 235.0 GB/s TRUE
Chunk 8 896 MB 0.5 ms 234.5 GB/s TRUE
Chunk 9 1024 MB 0.5 ms 234.2 GB/s TRUE
Chunk 10 1152 MB 0.5 ms 234.9 GB/s TRUE
Chunk 11 1280 MB 0.5 ms 233.6 GB/s TRUE
Chunk 12 1408 MB 0.5 ms 236.0 GB/s TRUE
Chunk 13 1536 MB 0.5 ms 236.7 GB/s TRUE
Chunk 14 1664 MB 0.5 ms 233.7 GB/s TRUE
Chunk 15 1792 MB 0.5 ms 233.7 GB/s TRUE
Chunk 16 1920 MB 0.5 ms 234.5 GB/s TRUE
Chunk 17 2048 MB 0.5 ms 234.0 GB/s TRUE
Chunk 18 2176 MB 0.5 ms 232.9 GB/s TRUE
Chunk 19 2304 MB 0.5 ms 234.1 GB/s TRUE
Chunk 20 2432 MB 0.5 ms 234.7 GB/s TRUE
Chunk 21 2560 MB 0.5 ms 234.5 GB/s TRUE
Chunk 22 2688 MB 0.5 ms 235.7 GB/s TRUE
Chunk 23 2816 MB 0.5 ms 234.7 GB/s TRUE
Chunk 24 2944 MB 0.5 ms 234.4 GB/s TRUE
Chunk 25 3072 MB 0.5 ms 234.9 GB/s TRUE
Chunk 26 3200 MB 0.5 ms 234.6 GB/s TRUE
Chunk 27 3328 MB 0.5 ms 233.7 GB/s TRUE
Chunk 28 3456 MB 0.5 ms 234.1 GB/s TRUE
Chunk 29 3584 MB 0.5 ms 234.1 GB/s TRUE
Chunk 30 3712 MB 0.6 ms 232.1 GB/s TRUE
Chunk 31 3840 MB 12.9 ms 10.0 GB/s TRUE
Chunk 32 3968 MB 12.9 ms 10.0 GB/s TRUE
All done. Press ENTER...

Lard
2015-01-27, 19:29:43
HD 7970 1200/1700 MHz
DWM deaktiviert/ohne iGPU.

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=51031&stc=1&d=1422382784

grobi
2015-01-27, 19:34:48
http://abload.de/img/screenshot2015-01-271mle9z.png (http://abload.de/image.php?img=screenshot2015-01-271mle9z.png)


Was stimmt da nicht? Ist das wegen dem Fenstermodus?
Ich habe eine PowerColor 290 PCS+

Mr. Lolman
2015-01-27, 20:25:33
http://abload.de/img/screenshot2015-01-271mle9z.png (http://abload.de/image.php?img=screenshot2015-01-271mle9z.png)


Was stimmt da nicht? Ist das wegen dem Fenstermodus?
Ich habe eine PowerColor 290 PCS+

Lad dir GPU-Z (http://www.techpowerup.com/downloads/SysInfo/GPU-Z) und überprüf mit dem Rendertest (Klick aufs ?) ob die PCIe Anbindung tatsächlich 16x ist.
http://gpuz.techpowerup.com/15/01/27/48z.png
Falls nicht schau ob die GraKa im fest genug im Slot sitzt.

misterh
2015-01-27, 20:50:13
http://abload.de/img/unbenanntzeic6.png

Tesseract
2015-01-27, 21:39:26
Lol, das Ding lief nur auf 2x PCIe. Und bei 1500MHz VRAM dürfte der Sweet Spot sein. Drüber bricht sie auf ~215GB/s ein.

der benchmark ist äußerst seltsam. wenn ich von 1500 schrittweise auf 800 runter gehe wird es mal mehr mal weniger, schwankt aber immer so um die 200-230 rum. keine ahnung was der da misst, aber sicher nicht den peak ramdurchsatz.

grobi
2015-01-28, 18:32:48
Lad dir GPU-Z (http://www.techpowerup.com/downloads/SysInfo/GPU-Z) und überprüf mit dem Rendertest (Klick aufs ?) ob die PCIe Anbindung tatsächlich 16x ist.
http://gpuz.techpowerup.com/15/01/27/48z.png
Falls nicht schau ob die GraKa im fest genug im Slot sitzt.

Das hatte ich vorher schon gemacht. Es gab keine Auffälligkeiten. Ich denke das die Software flasch ausliest. Der Speicher war auch schon randvoll und die Karte lief Problemlos.

Butterfly
2015-01-28, 20:56:07
Schaut wohl vernichtend aus im Vergleich zu Lard´s Ergebnis: http://abload.de/img/oclmem_stock61o5u.jpg
Dafür darf man meine Werte mit 2 Multiplizieren. :biggrin:

Lard
2015-01-29, 08:19:28
Lol, das Ding lief nur auf 2x PCIe. Und bei 1500MHz VRAM dürfte der Sweet Spot sein. Drüber bricht sie auf ~215GB/s ein.
der benchmark ist äußerst seltsam. wenn ich von 1500 schrittweise auf 800 runter gehe wird es mal mehr mal weniger, schwankt aber immer so um die 200-230 rum. keine ahnung was der da misst, aber sicher nicht den peak ramdurchsatz.

Das dürfte an den Memory Timings liegen.
Z.B. wechselt die 290X ab 1500MHz zu dem nächsten, langsamen Strap (1501MHz bis 1625MHz - Hynix).
Dazu habe ich hier was geschrieben, und es gibt einige Benches:
http://www.computerbase.de/forum/showthread.php?t=1370699&p=16404098

Air Force One
2015-01-29, 10:06:58
Dort geht es doch um die 7970 bzw. 280X?
Gibts den Patch auch für 290X? Link?

Lard
2015-01-29, 10:18:48
Dort geht es doch um die 7970 bzw. 280X?
Gibts den Patch auch für 290X? Link?

Leider kann man das BIOS einer 290 nicht editieren, weil der Treiber die BIOS-Signatur überprüft:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=10216563&postcount=502

Mr. Lolman
2015-01-29, 13:11:06
Das dürfte an den Memory Timings liegen.
Z.B. wechselt die 290X ab 1500MHz zu dem nächsten, langsamen Strap (1501MHz bis 1625MHz - Hynix).
Dazu habe ich hier was geschrieben, und es gibt einige Benches:
http://www.computerbase.de/forum/showthread.php?t=1370699&p=16404098

Klingt plausibel. Thx für die Info, ich lass sie demnach wohl besser auf 1500MHz.

Lard
2015-02-05, 16:30:44
HD 7970 1200/1900 MHz
DWM deaktiviert/ohne iGPU.
Es wird der 1375MHz Strap (1251-1375MHz) mit modifizierten 280X Memory Timings by The Stilt, für 1900 MHz benutzt.

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=51127&stc=1&d=1423149240

Mr. Lolman
2015-02-05, 16:34:03
HD 7970 1200/1900 MHz
DWM deaktiviert/ohne iGPU.
Es wird der 1375MHz Strap (1251-1375MHz) mit modifizierten 280X Memory Timings by The Stilt, für 1900 MHz benutzt.

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=51127&stc=1&d=1423149240


Wow. Das nenn ich mal eine ordentliche Speicherbandbreite :eek:

BTW: "Rechtsklick links oben aufs Fenster -> bearbeiten -> alles markieren -> [ENTER]" und dann aus der Zwischenablage ins Post einfügenist einfacher, als Screenshot machen ;)

misterh
2016-06-24, 23:26:09
Ich hol mal hoch

Xeon E5-2670
https://abload.de/img/e5-267097q19.png

Xeon Phi 31S1P
https://abload.de/img/xeonphipvpe5.png

Sieht nicht schnell aus.:rolleyes:

beide blieben bis zum ende unverändert.

-=Popeye=-
2016-06-25, 20:08:34
Init OpenCL...
Create platforms...
[1] NVIDIA CUDA
Using platform NVIDIA CUDA
[1] GeForce GTX TITAN X 24 compute units
Using device GeForce GTX TITAN X . Memory available 3072 MB of 12288MB
Allocating chunk 96
Chunk 1 0 MB 0.5 ms 276.2 GB/s TRUE
Chunk 2 128 MB 0.5 ms 278.9 GB/s TRUE
Chunk 3 256 MB 0.5 ms 276.1 GB/s TRUE
Chunk 4 384 MB 0.5 ms 278.8 GB/s TRUE
Chunk 5 512 MB 0.5 ms 276.7 GB/s TRUE
Chunk 6 640 MB 0.5 ms 277.0 GB/s TRUE
Chunk 7 768 MB 0.5 ms 278.2 GB/s TRUE
Chunk 8 896 MB 0.5 ms 275.4 GB/s TRUE
Chunk 9 1024 MB 0.5 ms 278.5 GB/s TRUE
Chunk 10 1152 MB 0.5 ms 276.1 GB/s TRUE
Chunk 11 1280 MB 0.5 ms 278.3 GB/s TRUE
Chunk 12 1408 MB 0.4 ms 312.5 GB/s TRUE
Chunk 13 1536 MB 0.4 ms 312.1 GB/s TRUE
Chunk 14 1664 MB 0.4 ms 310.6 GB/s TRUE
Chunk 15 1792 MB 0.4 ms 313.1 GB/s TRUE
Chunk 16 1920 MB 0.4 ms 313.2 GB/s TRUE
Chunk 17 2048 MB 0.4 ms 310.9 GB/s TRUE
Chunk 18 2176 MB 0.4 ms 312.8 GB/s TRUE
Chunk 19 2304 MB 0.4 ms 313.2 GB/s TRUE
Chunk 20 2432 MB 0.4 ms 311.2 GB/s TRUE
Chunk 21 2560 MB 0.4 ms 313.2 GB/s TRUE
Chunk 22 2688 MB 0.4 ms 306.4 GB/s TRUE
Chunk 23 2816 MB 0.4 ms 317.6 GB/s TRUE
Chunk 24 2944 MB 0.4 ms 320.5 GB/s TRUE
Chunk 25 3072 MB 0.4 ms 319.0 GB/s TRUE
Chunk 26 3200 MB 0.4 ms 316.7 GB/s TRUE
Chunk 27 3328 MB 0.4 ms 319.1 GB/s TRUE
Chunk 28 3456 MB 0.4 ms 319.0 GB/s TRUE
Chunk 29 3584 MB 0.4 ms 317.1 GB/s TRUE
Chunk 30 3712 MB 0.4 ms 316.1 GB/s TRUE
Chunk 31 3840 MB 0.4 ms 320.5 GB/s TRUE
Chunk 32 3968 MB 0.4 ms 320.6 GB/s TRUE
Chunk 33 4096 MB 0.4 ms 317.2 GB/s TRUE
Chunk 34 4224 MB 0.4 ms 317.2 GB/s TRUE
Chunk 35 4352 MB 0.4 ms 319.5 GB/s TRUE
Chunk 36 4480 MB 0.4 ms 318.6 GB/s TRUE
Chunk 37 4608 MB 0.4 ms 320.5 GB/s TRUE
Chunk 38 4736 MB 0.4 ms 317.7 GB/s TRUE
Chunk 39 4864 MB 0.4 ms 317.4 GB/s TRUE
Chunk 40 4992 MB 0.4 ms 318.7 GB/s TRUE
Chunk 41 5120 MB 0.4 ms 319.9 GB/s TRUE
Chunk 42 5248 MB 0.4 ms 319.2 GB/s TRUE
Chunk 43 5376 MB 0.4 ms 319.2 GB/s TRUE
Chunk 44 5504 MB 0.4 ms 319.4 GB/s TRUE
Chunk 45 5632 MB 0.4 ms 319.0 GB/s TRUE
Chunk 46 5760 MB 0.4 ms 320.2 GB/s TRUE
Chunk 47 5888 MB 0.4 ms 318.9 GB/s TRUE
Chunk 48 6016 MB 0.4 ms 320.4 GB/s TRUE
Chunk 49 6144 MB 0.4 ms 319.6 GB/s TRUE
Chunk 50 6272 MB 0.4 ms 317.0 GB/s TRUE
Chunk 51 6400 MB 0.4 ms 316.0 GB/s TRUE
Chunk 52 6528 MB 0.4 ms 319.3 GB/s TRUE
Chunk 53 6656 MB 0.4 ms 320.2 GB/s TRUE
Chunk 54 6784 MB 0.4 ms 318.6 GB/s TRUE
Chunk 55 6912 MB 0.4 ms 317.3 GB/s TRUE
Chunk 56 7040 MB 0.4 ms 318.0 GB/s TRUE
Chunk 57 7168 MB 0.4 ms 318.8 GB/s TRUE
Chunk 58 7296 MB 0.4 ms 320.2 GB/s TRUE
Chunk 59 7424 MB 0.4 ms 320.1 GB/s TRUE
Chunk 60 7552 MB 0.4 ms 319.6 GB/s TRUE
Chunk 61 7680 MB 0.4 ms 318.1 GB/s TRUE
Chunk 62 7808 MB 0.4 ms 317.3 GB/s TRUE
Chunk 63 7936 MB 0.4 ms 316.2 GB/s TRUE
Chunk 64 8064 MB 0.4 ms 319.3 GB/s TRUE
Chunk 65 8192 MB 0.4 ms 320.5 GB/s TRUE
Chunk 66 8320 MB 0.4 ms 320.8 GB/s TRUE
Chunk 67 8448 MB 0.4 ms 320.7 GB/s TRUE
Chunk 68 8576 MB 0.4 ms 318.5 GB/s TRUE
Chunk 69 8704 MB 0.4 ms 318.8 GB/s TRUE
Chunk 70 8832 MB 0.4 ms 316.8 GB/s TRUE
Chunk 71 8960 MB 0.4 ms 320.0 GB/s TRUE
Chunk 72 9088 MB 0.4 ms 320.8 GB/s TRUE
Chunk 73 9216 MB 0.4 ms 320.0 GB/s TRUE
Chunk 74 9344 MB 0.4 ms 319.2 GB/s TRUE
Chunk 75 9472 MB 0.4 ms 317.4 GB/s TRUE
Chunk 76 9600 MB 0.4 ms 316.6 GB/s TRUE
Chunk 77 9728 MB 0.4 ms 318.9 GB/s TRUE
Chunk 78 9856 MB 0.4 ms 319.5 GB/s TRUE
Chunk 79 9984 MB 0.4 ms 319.5 GB/s TRUE
Chunk 80 10112 MB 0.4 ms 317.9 GB/s TRUE
Chunk 81 10240 MB 0.4 ms 316.6 GB/s TRUE
Chunk 82 10368 MB 0.4 ms 319.0 GB/s TRUE
Chunk 83 10496 MB 0.4 ms 320.8 GB/s TRUE
Chunk 84 10624 MB 0.4 ms 319.4 GB/s TRUE
Chunk 85 10752 MB 0.4 ms 320.2 GB/s TRUE
Chunk 86 10880 MB 0.4 ms 317.0 GB/s TRUE
Chunk 87 11008 MB 0.4 ms 318.3 GB/s TRUE
Chunk 88 11136 MB 0.4 ms 320.2 GB/s TRUE
Chunk 89 11264 MB 0.4 ms 318.7 GB/s TRUE
Chunk 90 11392 MB 0.4 ms 316.0 GB/s TRUE
Chunk 91 11520 MB 0.4 ms 316.2 GB/s TRUE
Chunk 92 11648 MB 0.4 ms 319.0 GB/s TRUE
Chunk 93 11776 MB 0.4 ms 319.3 GB/s TRUE
Chunk 94 11904 MB 6.4 ms 20.1 GB/s TRUE
Chunk 95 12032 MB1466866466816.0 ms 0.0 GB/s TRUE
Chunk 96 12160 MB1466866466816.0 ms 0.0 GB/s TRUE
All done. Press ENTER...