PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : ArchMark!? *hrhr* *pimp*


Seiten : 1 [2] 3

Thowe
2003-03-18, 19:53:22
Hehe, wusste ja schon immer das Gloomy nicht mehr alle Pötte im Schrank hat. :D

Meine 4MX440 mal wieder ...

ArchMark 0.09.06alpha
Driver GeForce4 MX 440/AGP/SSE2 v1.4.0
Resolution 1024x768 @ 60.26Hz
Method Swap
Timer 1.800 GHz

Memory
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 4.215 GB/s
Color 4.322 GB/s
ZAndStencil 3.989 GB/s
Z 19.927 GB/s
Stencil 1.453 MB/s

Draw 4.771 GB/s
BurnedByRAMDAC 190.236 MB/s
Physical 4.961 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 4
Height 16

----in depth buffer-----------------------------
Width 32
Height 4

----in stencil buffer---------------------------
Width 4
Height 8



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 516.303 MPix/s
Z 991.334 MPix/s
ColorAndZ 516.994 MPix/s
ZTest 468.390 MPix/s
ZCullLEqual 994.174 MPix/s
ZCullGEqual 991.390 MPix/s
ZCullEqual 3.210 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 153.645 MPix/s
Z 468.532 MPix/s
ColorAndZ 522.329 MPix/s
ZTest 381.735 MPix/s
ZCullLEqual 609.573 MPix/s
ZCullGEqual 607.805 MPix/s
ZCullEqual 892.141 MPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 511.724 MPix/s
2 522.473 MPix/s

----Unfiltered----------------------------------
1 516.781 MPix/s
2 519.462 MPix/s

----Bilinear filter-----------------------------
1 522.957 MPix/s
2 516.868 MPix/s

----Trilinear filter----------------------------
1 520.897 MPix/s
2 238.225 MPix/s

----Max anisotropy (2)--------------------------
1 261.555 MPix/s
2 133.838 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 33.626 MTris/s
List 12.483 MTris/s
Clip 12.494 MTris/s

--Vertex shading speed--------------------------
LightD1 24.974 MVerts/s
LightP1 12.252 MVerts/s
LightP8 4.029 MVerts/s





ArchMark 0.09.06alpha
Driver GeForce4 MX 440/AGP/SSE2 v1.4.0
Resolution 1024x768 @ 57.65Hz
Method Flush
Timer 1.800 GHz

Memory
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 4.332 GB/s
Color 4.518 GB/s
ZAndStencil 4.161 GB/s
Z 33.224 GB/s
Stencil 1.469 MB/s

Draw 4.952 GB/s
BurnedByRAMDAC 190.114 MB/s
Physical 5.142 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 534.297 MPix/s
Z 1.061 GPix/s
ColorAndZ 534.294 MPix/s
ZTest 504.057 MPix/s
ZCullLEqual 1.054 GPix/s
ZCullGEqual 1.053 GPix/s
ZCullEqual 3.871 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 536.377 MPix/s
Z 536.379 MPix/s
ColorAndZ 536.378 MPix/s
ZTest 536.456 MPix/s
ZCullLEqual 1.265 GPix/s
ZCullGEqual 1.264 GPix/s
ZCullEqual 3.946 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 536.358 MPix/s
2 536.468 MPix/s

----Unfiltered----------------------------------
1 536.361 MPix/s
2 536.347 MPix/s

----Bilinear filter-----------------------------
1 536.362 MPix/s
2 536.469 MPix/s

----Trilinear filter----------------------------
1 536.470 MPix/s
2 269.853 MPix/s

----Max anisotropy (2)--------------------------
1 269.469 MPix/s
2 175.474 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 33.591 MTris/s
List 12.302 MTris/s
Clip 12.570 MTris/s

--Vertex shading speed--------------------------
LightD1 24.560 MVerts/s
LightP1 12.254 MVerts/s
LightP8 4.029 MVerts/s

loewe
2003-03-18, 20:13:00
Du wirst immer besser! ;D

KYRO II SE @ 200 MHz

ArchMark 0.09.06alpha
Driver PowerVR KYRO v1.2.1
Resolution 1024x768 @ 61.97Hz
Method Flush
Timer 1.537 GHz

Memory
Mode RGBA8888 Z32 S4
--bandwidth-------------------------------------
----available to buffer clears------------------
All 2.721 GB/s
Color 1.282 GB/s
ZAndStencil 796.474 MB/s
Z 722.024 MB/s
Stencil 88.799 MB/s

Draw 2.495 GB/s
BurnedByRAMDAC 196.656 MB/s
Physical 2.692 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 32
Height 32

----in depth buffer-----------------------------
Width 32
Height 32

----in stencil buffer---------------------------
Width 32
Height 32



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z32 S4
Color 314.329 MPix/s
Z 174.941 MPix/s
ColorAndZ 311.183 MPix/s
ZTest 221.723 MPix/s
ZCullLEqual 315.243 MPix/s
ZCullGEqual 175.888 MPix/s
ZCullEqual 172.362 MPix/s

--16 bits---------------------------------------
Mode RGBA8888 Z16 S0
Color 388.329 MPix/s
Z 291.535 MPix/s
ColorAndZ 391.500 MPix/s
ZTest 328.481 MPix/s
ZCullLEqual 394.310 MPix/s
ZCullGEqual 292.968 MPix/s
ZCullEqual 283.969 MPix/s


Texturing
Mode RGBA8888 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 398.702 MPix/s
2 172.061 MPix/s
3 93.993 MPix/s
4 56.411 MPix/s

----Unfiltered----------------------------------
1 392.928 MPix/s
2 198.209 MPix/s
3 132.302 MPix/s
4 99.406 MPix/s

----Bilinear filter-----------------------------
1 392.919 MPix/s
2 197.916 MPix/s
3 132.526 MPix/s
4 99.403 MPix/s

----Trilinear filter----------------------------
1 202.256 MPix/s
2 103.810 MPix/s
3 70.844 MPix/s
4 54.023 MPix/s

----Max anisotropy (2)--------------------------
1 56.499 MPix/s
2 30.788 MPix/s
3 22.246 MPix/s
4 17.872 MPix/s



Geometry
Mode RGBA8888 Z0 S0
--Plain vertices--------------------------------
Fan 1.338 MTris/s
List 666.357 kTris/s
Clip 666.258 kTris/s

--Vertex shading speed--------------------------
LightD1 2.005 MVerts/s
LightP1 1.999 MVerts/s
LightP8 1.037 MVerts/s




Ich weiß du wolltest es nicht, aber ich musste die Besserung zeigen! :))

Hier die gnarf.txt:


-----------
32 is the most likely option
followed by: 16 8 4 2
-----------
32 is the most likely option
followed by: 16 8 4 2
-----------
32 is the most likely option
followed by: 16 8 4 2
-----------
32 is the most likely option
followed by: 16 8 4 2
-----------
32 is the most likely option
followed by: 16 8 4 2
-----------
32 is the most likely option
followed by: 16 8 4 2


Ok, bei der Höhe sollte es eigentlich 16 sein, es sind wirklich nur 16 Pixel bei KYRO, wir sind aber dicht dran.
Glückwunsch!!!

BTW, ich baue jetzt um auf Neon, mal sehen was das wird.

ow
2003-03-18, 20:38:03
Originally posted by Stefan Payne


nein hab ich nicht, ich setz gleich auch mal 'nen Athlon XP und DDR-SDRAM rein :)


Mach mal einen Test ohne Swap. Die Ergebnisse sind viel exakter. Guckst du oben meine GF4.

ow
2003-03-18, 20:43:35
Originally posted by zeckensack
Cool :D
100 MHz. Single-Pipe/zwei TMUs (Trilinear).




Imo keine trilinearen TMUs. Der Savage erzwingt immer bilinear. Tat zumindest mein/dein;) S2k unter OGL.


btw. irgendeine Ahnung, was der Kyro bei AF macht? Das Ergebnis überrascht mich nicht, lässt sich 1:1 auf den Villagemark reproduzieren (~ Viertelung der fps). Aber wieso was warum?:|

Ist das eigentlich bi- oder trilinear-AF im Test?

loewe
2003-03-18, 20:47:58
Hier nun die Neon 250!!!

Der Treiber ist ein neuerer WXP Treiber von Pixel Perfect, der aber wohl sowohl DX als auch OGL nicht unterstützt.
So habe ich im software Modus gemessen.

ArchMark 0.09.06alpha
Driver GDI Generic v1.1.0
Resolution 1024x768 @ 45.66Hz
Method Flush
Timer 1.537 GHz

Memory
Mode RGBA8888 Z32 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 530.177 MB/s
Color 483.955 MB/s
ZAndStencil 570.577 MB/s
Z 599.749 MB/s
Stencil 474.961 MB/s

Draw 128.738 MB/s
BurnedByRAMDAC 143.422 MB/s
Physical 272.160 MB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 32
Height 2

----in depth buffer-----------------------------
Width 16
Height 32

----in stencil buffer---------------------------
Width 16
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z32 S8
Color 14.925 MPix/s
Z 16.049 MPix/s
ColorAndZ 15.074 MPix/s
ZTest 11.073 MPix/s
ZCullLEqual 28.178 MPix/s
ZCullGEqual 25.543 MPix/s
ZCullEqual 70.606 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S8
Color 87.440 MPix/s
Z 11.268 MPix/s
ColorAndZ 91.485 MPix/s
ZTest 54.203 MPix/s
ZCullLEqual 110.305 MPix/s
ZCullGEqual 68.004 MPix/s
ZCullEqual 159.598 MPix/s


Texturing
Mode RGBA5650 Z16 S8
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 236.651 MPix/s

----Unfiltered----------------------------------
1 242.819 MPix/s

----Bilinear filter-----------------------------
1 241.527 MPix/s

----Trilinear filter----------------------------
1 242.076 MPix/s



Geometry
Mode RGBA5650 Z16 S8
--Plain vertices--------------------------------
Fan 9.615 MTris/s
List 4.020 MTris/s
Clip 1.555 MTris/s

--Vertex shading speed--------------------------
LightD1 10.346 MVerts/s
LightP1 3.438 MVerts/s
LightP8 727.535 kVerts/s

StefanV
2003-03-18, 20:48:21
Maaan, wieso funzt der 'Müll' nicht auf meiner Banshee ?? :-/

StefanV
2003-03-18, 20:59:47
DDR-SDRAM, FSB266:

ArchMark 0.09.05alpha
Driver ProSavage/Twister v1.1 2.40.96
Resolution 1024x768 @ ???Hz
Method Flush
Timer 1.666 GHz

Memory
Mode RGBA8888 Z32 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 989.819 MB/s
Color 872.125 MB/s
ZAndStencil 782.860 MB/s
Z 348.026 MB/s
Stencil 68.901 MB/s

Draw 769.089 MB/s
BurnedByRAMDAC 377.584 MB/s
Physical 1.147 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 2
Height none

----in depth buffer-----------------------------
Width none
Height none

----in stencil buffer---------------------------
Width none
Height none



Fillrate
--RGBA8888 Z32 S8-------------------------------
Color 113.178 MPix/s
Z 134.020 MPix/s
ColorAndZ 105.055 MPix/s
ZTest 62.397 MPix/s
ZCullLEqual 85.438 MPix/s
ZCullGEqual 84.572 MPix/s
ZCullEqual 108.490 MPix/s

--RGBA5650 Z16 S0-------------------------------
Color 137.760 MPix/s
Z 150.349 MPix/s
ColorAndZ 126.828 MPix/s
ZTest 90.593 MPix/s
ZCullLEqual 115.332 MPix/s
ZCullGEqual 115.790 MPix/s
ZCullEqual 145.981 MPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 170.441 MPix/s
2 172.761 MPix/s

----Unfiltered----------------------------------
1 172.408 MPix/s
2 172.733 MPix/s

----Bilinear filter-----------------------------
1 172.585 MPix/s
2 172.759 MPix/s

----Trilinear filter----------------------------
1 172.609 MPix/s
2 172.691 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 2.835 MTris/s
List 950.915 kTris/s
Clip 897.470 kTris/s

--Vertex shading speed--------------------------
LightD1 3.262 MVerts/s
LightP1 2.472 MVerts/s
LightP8 953.532 kVerts/s

loewe
2003-03-18, 21:04:38
Und hier jetzt doch wieder die KYRO II,

KYRO II @ 185 MHz

ArchMark 0.09.06alpha
Driver PowerVR KYRO v1.2.1
Resolution 1024x768 @ 61.99Hz
Method Flush
Timer 1.537 GHz

Memory
Mode RGBA8888 Z32 S4
--bandwidth-------------------------------------
----available to buffer clears------------------
All 2.468 GB/s
Color 1.169 GB/s
ZAndStencil 699.850 MB/s
Z 633.810 MB/s
Stencil 77.677 MB/s

Draw 2.243 GB/s
BurnedByRAMDAC 194.748 MB/s
Physical 2.438 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 32
Height 32

----in depth buffer-----------------------------
Width 32
Height 32

----in stencil buffer---------------------------
Width 32
Height 32



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z32 S4
Color 284.868 MPix/s
Z 154.242 MPix/s
ColorAndZ 281.677 MPix/s
ZTest 199.235 MPix/s
ZCullLEqual 285.812 MPix/s
ZCullGEqual 155.133 MPix/s
ZCullEqual 154.517 MPix/s

--16 bits---------------------------------------
Mode RGBA8888 Z16 S0
Color 357.987 MPix/s
Z 268.489 MPix/s
ColorAndZ 359.666 MPix/s
ZTest 302.453 MPix/s
ZCullLEqual 362.809 MPix/s
ZCullGEqual 269.818 MPix/s
ZCullEqual 262.006 MPix/s


Texturing
Mode RGBA8888 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 366.794 MPix/s
2 155.723 MPix/s
3 83.963 MPix/s
4 48.065 MPix/s

----Unfiltered----------------------------------
1 361.370 MPix/s
2 182.303 MPix/s
3 121.848 MPix/s
4 91.480 MPix/s

----Bilinear filter-----------------------------
1 361.391 MPix/s
2 182.039 MPix/s
3 121.649 MPix/s
4 91.492 MPix/s

----Trilinear filter----------------------------
1 186.457 MPix/s
2 95.903 MPix/s
3 65.447 MPix/s
4 50.008 MPix/s

----Max anisotropy (2)--------------------------
1 52.557 MPix/s
2 29.273 MPix/s
3 21.914 MPix/s
4 16.435 MPix/s



Geometry
Mode RGBA8888 Z0 S0
--Plain vertices--------------------------------
Fan 1.232 MTris/s
List 612.997 kTris/s
Clip 613.105 kTris/s

--Vertex shading speed--------------------------
LightD1 1.845 MVerts/s
LightP1 1.839 MVerts/s
LightP8 1.030 MVerts/s




und die gnarf.txt


-----------
32 is the most likely option
followed by: 16 8 4 2
-----------
32 is the most likely option
followed by: 16 8 4 2
-----------
32 is the most likely option
followed by: 16 8 4 2
-----------
32 is the most likely option
followed by: 16 8 4 2
-----------
32 is the most likely option
followed by: 16 8 4 2
-----------
32 is the most likely option
followed by: 16 8 4 2



@Gloomy,
könnte in der Tat sein, daß der interne Z/Stencil in diesem Benchmark bremst. So richtig durchdacht ist das nicht, aber versuch's einfach mal ohne. Wenn die Ergebnisse sich dann verdoppeln, wissen wir Bescheid


Daran glaube ich nun wieder nicht. Warum sollte so etwas bei Gloomy auftreten und sonst nicht? Da liegt irgend ein anderes Problem vor.

ow
2003-03-18, 21:04:49
Originally posted by Stefan Payne
DDR-SDRAM, FSB266:



:o aah... das sieht ja fast schon nach Leistung aus. Von 94 auf 172MPix is ja nicht schlecht.

StefanV
2003-03-18, 21:55:25
@Zecke

Kannst du auch einen Bandbreiten abhängigen Füllratentest einbauen ?? ;)

Korrom
2003-03-18, 22:48:42
Salve!

Ich bin endlich mal dazu gekommen den Archmark durch die TNT2U zu drücken. Ich habe zunächst einmal mit und dann einmal ohne Swap laufen lassen. Und das sieht dann so aus:

Mit:
ArchMark 0.09.06alpha
Driver RIVA TNT2/AGP/3DNOW! v1.3.1
Resolution 1024x768 @ 100.72Hz
Method Swap
Timer 1.533 GHz

Memory
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 974.929 MB/s
Color 642.746 MB/s
ZAndStencil 652.510 MB/s
Z 489.306 MB/s
Stencil 158.744 MB/s

Draw 1.160 GB/s
BurnedByRAMDAC 316.202 MB/s
Physical 1.476 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 16
Height 32

----in depth buffer-----------------------------
Width 8
Height 32

----in stencil buffer---------------------------
Width 8
Height 32



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 131.896 MPix/s
Z 109.882 MPix/s
ColorAndZ 131.907 MPix/s
ZTest 87.950 MPix/s
ZCullLEqual 106.224 MPix/s
ZCullGEqual 105.742 MPix/s
ZCullEqual 118.560 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 186.543 MPix/s
Z 185.348 MPix/s
ColorAndZ 186.213 MPix/s
ZTest 183.521 MPix/s
ZCullLEqual 186.395 MPix/s
ZCullGEqual 189.128 MPix/s
ZCullEqual 191.779 MPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 180.541 MPix/s
2 116.942 MPix/s

----Unfiltered----------------------------------
1 188.675 MPix/s
2 116.986 MPix/s

----Bilinear filter-----------------------------
1 191.716 MPix/s
2 116.948 MPix/s

----Trilinear filter----------------------------
1 116.581 MPix/s
2 116.098 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 22.322 MTris/s
List 5.852 MTris/s
Clip 1.899 MTris/s

--Vertex shading speed--------------------------
LightD1 9.558 MVerts/s
LightP1 9.560 MVerts/s
LightP8 9.555 MVerts/s




Und nochmal ohne:
ArchMark 0.09.06alpha
Driver RIVA TNT2/AGP/3DNOW! v1.3.1
Resolution 1024x768 @ 100.74Hz
Method Flush
Timer 1.533 GHz

Memory
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 1.972 GB/s
Color 1.929 GB/s
ZAndStencil 2.018 GB/s
Z 1.513 GB/s
Stencil 465.418 MB/s

Draw 1.659 GB/s
BurnedByRAMDAC 312.922 MB/s
Physical 1.972 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 16
Height 8

----in depth buffer-----------------------------
Width 4
Height 1

----in stencil buffer---------------------------
Width 4
Height 1



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 291.670 MPix/s
Z 201.990 MPix/s
ColorAndZ 291.667 MPix/s
ZTest 138.479 MPix/s
ZCullLEqual 189.948 MPix/s
ZCullGEqual 189.901 MPix/s
ZCullEqual 233.308 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 297.866 MPix/s
Z 297.698 MPix/s
ColorAndZ 297.866 MPix/s
ZTest 279.977 MPix/s
ZCullLEqual 291.650 MPix/s
ZCullGEqual 291.640 MPix/s
ZCullEqual 297.856 MPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 297.858 MPix/s
2 149.447 MPix/s

----Unfiltered----------------------------------
1 297.857 MPix/s
2 149.446 MPix/s

----Bilinear filter-----------------------------
1 297.857 MPix/s
2 149.446 MPix/s

----Trilinear filter----------------------------
1 149.450 MPix/s
2 149.446 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 22.183 MTris/s
List 5.880 MTris/s
Clip 1.900 MTris/s

--Vertex shading speed--------------------------
LightD1 9.646 MVerts/s
LightP1 9.658 MVerts/s
LightP8 9.657 MVerts/s




Jo. Was sagt ihr?

StefanV
2003-03-18, 23:00:19
hier das ganze nochmal mit PC100 RAM

€dit
Die Ergebnisse wären auch nicht verkehrt :|

ArchMark 0.09.05alpha
Driver ProSavage/Twister v1.1 2.40.96
Resolution 1024x768 @ 119.27Hz
Method Flush
Timer 848.352 MHz

Memory
Mode RGBA8888 Z32 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 473.839 MB/s
Color 401.485 MB/s
ZAndStencil 212.879 MB/s
Z 186.383 MB/s
Stencil 29.632 MB/s

Draw 401.833 MB/s
BurnedByRAMDAC 375.354 MB/s
Physical 777.186 MB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width none
Height 2

----in depth buffer-----------------------------
Width none
Height none

----in stencil buffer---------------------------
Width none
Height none



Fillrate
--RGBA8888 Z32 S8-------------------------------
Color 94.001 MPix/s
Z 130.228 MPix/s
ColorAndZ 87.967 MPix/s
ZTest 38.774 MPix/s
ZCullLEqual 58.234 MPix/s
ZCullGEqual 56.788 MPix/s
ZCullEqual 85.704 MPix/s

--RGBA5650 Z16 S0-------------------------------
Color 141.815 MPix/s
Z 137.209 MPix/s
ColorAndZ 119.623 MPix/s
ZTest 66.035 MPix/s
ZCullLEqual 94.206 MPix/s
ZCullGEqual 105.526 MPix/s
ZCullEqual 120.502 MPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 159.275 MPix/s
2 130.651 MPix/s

----Unfiltered----------------------------------
1 164.743 MPix/s
2 165.385 MPix/s

----Bilinear filter-----------------------------
1 165.319 MPix/s
2 165.254 MPix/s

----Trilinear filter----------------------------
1 130.687 MPix/s
2 130.519 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 2.512 MTris/s
List 843.524 kTris/s
Clip 863.312 kTris/s

--Vertex shading speed--------------------------
LightD1 1.877 MVerts/s
LightP1 1.251 MVerts/s
LightP8 482.430 kVerts/s

StefanV
2003-03-18, 23:05:08
Originally posted by ow



Imo keine trilinearen TMUs. Der Savage erzwingt immer bilinear. Tat zumindest mein/dein;) S2k unter OGL.

Gleich mal mit dem 3DMark testen...

€dit:

Shit, das Teil verlangt DX6 kompatible Videotreiber :-/

Achill
2003-03-18, 23:11:06
also ich könnte noch einen Radeon 64MB Bulk und eine Radeon9700 Pro anbieten... fals interesse besteht - denke ja wenn eher der R100 ;)

evtl. kann man ja auch so aussagen zu der weiterentwicklung von hyperZ zu hyperZ 2&3 aussagen machen...

StefanV
2003-03-18, 23:51:22
nochwas:
vergesst die Tests der G550, die sind für die Tonne...
Anscheinend läuft Zeckies Tool nicht wirklich gut auf der G550...

und *oh wunder*, auf einmal läuft auch 32bit...

ANscheinend mag der TEst 32bit Farbtiefe mit 16bit ZBuffer nicht sonderlich gerne...

hier die neuen (und RICHTIGEN) Ergebnisse:

ArchMark 0.09.05alpha
Driver Matrox G400 v1.1.3 Feb 7 2003
Resolution 1024x768 @ ???Hz
Method Flush
Timer 848.352 MHz

Memory
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 1.090 GB/s
Color 1.666 GB/s
ZAndStencil 820.681 MB/s
Z 1.152 GB/s
Stencil 380.566 MB/s

Draw 1.214 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 1.482 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 16
Height 32

----in depth buffer-----------------------------
Width 16
Height 32

----in stencil buffer---------------------------
Width 32
Height 32



Fillrate
--RGBA8888 Z24 S8-------------------------------
Color 204.363 MPix/s
Z 204.402 MPix/s
ColorAndZ 204.402 MPix/s
ZTest 130.539 MPix/s
ZCullLEqual 151.488 MPix/s
ZCullGEqual 151.142 MPix/s
ZCullEqual 164.710 MPix/s

--RGBA8880 Z15 S1-------------------------------
Color 203.481 MPix/s
Z 204.275 MPix/s
ColorAndZ 204.064 MPix/s
ZTest 176.991 MPix/s
ZCullLEqual 176.729 MPix/s
ZCullGEqual 189.358 MPix/s
ZCullEqual 193.751 MPix/s


Texturing
Mode RGBA5650 Z15 S1
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 204.637 MPix/s
2 204.749 MPix/s

----Unfiltered----------------------------------
1 204.782 MPix/s
2 204.765 MPix/s

----Bilinear filter-----------------------------
1 204.782 MPix/s
2 204.746 MPix/s

----Trilinear filter----------------------------
1 204.765 MPix/s
2 111.815 MPix/s



Geometry
Mode RGBA5650 Z15 S1
--Plain vertices--------------------------------
Fan 6.376 MTris/s
List 3.273 MTris/s
Clip 911.397 kTris/s

--Vertex shading speed--------------------------
LightD1 9.124 MVerts/s
LightP1 9.153 MVerts/s
LightP8 9.166 MVerts/s

StefanV
2003-03-19, 00:49:52
und mal eine 'echte' G400, leider nur eine G400/16SD...

Hat jemand noch 'ne G400/32SG ??
Thowe ??

ArchMark 0.09.05alpha
Driver Matrox G400 v1.1.3 Feb 7 2003
Resolution 1024x768 @ ???Hz
Method Flush
Timer 1.470 GHz

Memory
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 805.726 MB/s
Color 2.019 GB/s
ZAndStencil 530.817 MB/s
Z 765.531 MB/s
Stencil 234.182 MB/s

Draw 1.403 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 1.670 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 8
Height 32

----in depth buffer-----------------------------
Width 8
Height none

----in stencil buffer---------------------------
Width 8
Height 16



Fillrate
--RGBA8888 Z24 S8-------------------------------
Color 248.654 MPix/s
Z 228.784 MPix/s
ColorAndZ 248.672 MPix/s
ZTest 138.940 MPix/s
ZCullLEqual 182.826 MPix/s
ZCullGEqual 182.126 MPix/s
ZCullEqual 217.341 MPix/s

--RGBA8880 Z15 S1-------------------------------
Color 241.914 MPix/s
Z 241.947 MPix/s
ColorAndZ 241.956 MPix/s
ZTest 157.495 MPix/s
ZCullLEqual 206.847 MPix/s
ZCullGEqual 206.178 MPix/s
ZCullEqual 245.315 MPix/s


Texturing
Mode RGBA5650 Z15 S1
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 249.195 MPix/s
2 126.652 MPix/s

----Unfiltered----------------------------------
1 249.282 MPix/s
2 126.665 MPix/s

----Bilinear filter-----------------------------
1 251.266 MPix/s
2 126.666 MPix/s

----Trilinear filter----------------------------
1 136.180 MPix/s
2 69.665 MPix/s



Geometry
Mode RGBA5650 Z15 S1
--Plain vertices--------------------------------
Fan 11.015 MTris/s
List 5.680 MTris/s
Clip 1.541 MTris/s

--Vertex shading speed--------------------------
LightD1 15.752 MVerts/s
LightP1 15.851 MVerts/s
LightP8 15.849 MVerts/s

zeckensack
2003-03-19, 11:14:49
Ah ja, danke :)

Bei den Software-T&L-Karten scheint sich ein Trend abzuzeichnen:
Beliebig komplexe Beleuchtung ist genauso schnell wie 'rohe' Dreiecke.
Auf den ersten Blick merkwürdig, nach kurzem Nachdenken macht's aber Sinn. Soft-T&L kann Backface culling vor der Lichtberechnung durchführen, weswegen diese das Ergebnis nicht beeinflußt :|

zeckensack
2003-03-19, 11:25:09
Originally posted by Achill
also ich könnte noch einen Radeon 64MB Bulk und eine Radeon9700 Pro anbieten... fals interesse besteht - denke ja wenn eher der R100 ;)

evtl. kann man ja auch so aussagen zu der weiterentwicklung von hyperZ zu hyperZ 2&3 aussagen machen... Das machen wir :)

Ich kann dir sowieso nicht verbieten, die R9700Pro auch zu benchen. Ist andererseits auch nicht verkehrt, weil wir von den anderen R300ern schon länger keine Ergebnisse gesehen haben ;)

Hauwech
2003-03-19, 13:51:11
Ich habe noch ne Matrox G200 rumliegen, Matrox Millenium II mit 8 MB!! (die 6MB Erweiterung war arschteuer :...( ), Tseng ET4000W32P und ne normale TNT. Werde erstmal versuchen ob die ueberhaupt noch laufen, liegen schon seit Ewigkeiten rum von daher .... wenn sie laufen, melde ich mich nochmal :)

zeckensack
2003-03-19, 13:57:21
Originally posted by Stefan Payne
nochwas:
vergesst die Tests der G550, die sind für die Tonne...
Anscheinend läuft Zeckies Tool nicht wirklich gut auf der G550...

und *oh wunder*, auf einmal läuft auch 32bit...

ANscheinend mag der TEst 32bit Farbtiefe mit 16bit ZBuffer nicht sonderlich gerne...

Stefan, ich hatte da doch ein paar 'fixes' eingebaut, ohne die Versionsnummer zu ändern. Wäre sinnvoll, wenn du's mit der letzten Version nochmal versuchst, da sollten keine solchen Kuriositäten mehr auftreten (funzt jedenfalls wie erwartet bei der Kyro-Fraktion, die ja auch einige merkwürdige 'Mischformate' bevorzugt).

StefanV
2003-03-19, 14:08:31
Originally posted by zeckensack

Stefan, ich hatte da doch ein paar 'fixes' eingebaut, ohne die Versionsnummer zu ändern. Wäre sinnvoll, wenn du's mit der letzten Version nochmal versuchst, da sollten keine solchen Kuriositäten mehr auftreten (funzt jedenfalls wie erwartet bei der Kyro-Fraktion, die ja auch einige merkwürdige 'Mischformate' bevorzugt).

bringt auch nix, funzt nicht.

Das Häckchen muss im MGA Panel gesetzt werden, sonst funzt der MEM Bench nicht (bei 32bit)...

€dit

16bit funzt aber problemlos nur 32bit mit 16bit Z nicht.

StefanV
2003-03-19, 14:14:56
Originally posted by Stefan Payne
DDR-SDRAM, FSB266:

ArchMark 0.09.05alpha
Driver ProSavage/Twister v1.1 2.40.96
Resolution 1024x768 @ ???Hz
Method Flush
Timer 1.666 GHz


Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 2.835 MTris/s
List 950.915 kTris/s
Clip 897.470 kTris/s

--Vertex shading speed--------------------------
LightD1 3.262 MVerts/s
LightP1 2.472 MVerts/s
LightP8 953.532 kVerts/s




Irgendwie sind diese Werte 'eigenartig', IMHO...

Endorphine
2003-03-19, 14:36:12
Originally posted by zeckensack
Das machen wir :)

Ich kann dir sowieso nicht verbieten, die R9700Pro auch zu benchen. Ist andererseits auch nicht verkehrt, weil wir von den anderen R300ern schon länger keine Ergebnisse gesehen haben ;)Du musst uns schon sagen, was dich noch so interessieren würde, riechen können wir das nicht ;)

Ich stehe jederzeit für umfangreiches ergebnisspammen zur Verfügung, nur zum dreißigsten Mal das gleiche zu posten bringt auch nichts, wenn sich der Benchmark nicht ändert :flower:

Was könnte ich denn noch testen mit der 9700? :-)

GloomY
2003-03-19, 16:25:30
Hrhr, mit der neuen Version komm' ich auf gescheite Werte :)
Was hast du denn gefixt, Zecki?
ArchMark 0.09.06alpha
Driver PowerVR KYRO v1.2.1
Resolution 1024x768 @ 101.53Hz
Method Swap
Timer 1.929 GHz

Memory
Mode RGBA8888 Z32 S4
--bandwidth-------------------------------------
----available to buffer clears------------------
All 2.092 GB/s
Color 976.007 MB/s
ZAndStencil 557.725 MB/s
Z 502.481 MB/s
Stencil 62.165 MB/s

Draw 1.852 GB/s
BurnedByRAMDAC 318.314 MB/s
Physical 2.170 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 32
Height 32

----in depth buffer-----------------------------
Width 32
Height 32

----in stencil buffer---------------------------
Width 32
Height 32



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z32 S4
Color 240.324 MPix/s
Z 122.430 MPix/s
ColorAndZ 240.411 MPix/s
ZTest 162.026 MPix/s
ZCullLEqual 240.478 MPix/s
ZCullGEqual 121.985 MPix/s
ZCullEqual 122.048 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 355.395 MPix/s
Z 247.867 MPix/s
ColorAndZ 355.838 MPix/s
ZTest 292.375 MPix/s
ZCullLEqual 355.882 MPix/s
ZCullGEqual 247.733 MPix/s
ZCullEqual 247.828 MPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 343.577 MPix/s
2 179.890 MPix/s
3 118.874 MPix/s
4 88.194 MPix/s

----Unfiltered----------------------------------
1 357.340 MPix/s
2 182.035 MPix/s
3 122.462 MPix/s
4 92.577 MPix/s

----Bilinear filter-----------------------------
1 357.349 MPix/s
2 182.068 MPix/s
3 122.486 MPix/s
4 92.577 MPix/s

----Trilinear filter----------------------------
1 357.328 MPix/s
2 182.069 MPix/s
3 122.487 MPix/s
4 92.576 MPix/s

----Max anisotropy (2)--------------------------
1 94.484 MPix/s
2 49.356 MPix/s
3 34.035 MPix/s
4 26.621 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 1.227 MTris/s
List 610.669 kTris/s
Clip 610.456 kTris/s

--Vertex shading speed--------------------------
LightD1 1.837 MVerts/s
LightP1 1.831 MVerts/s
LightP8 1.257 MVerts/s

zeckensack
2003-03-19, 16:59:50
Originally posted by Endorphine
Du musst uns schon sagen, was dich noch so interessieren würde, riechen können wir das nicht ;)

Ich stehe jederzeit für umfangreiches ergebnisspammen zur Verfügung, nur zum dreißigsten Mal das gleiche zu posten bringt auch nichts, wenn sich der Benchmark nicht ändert :flower:

Was könnte ich denn noch testen mit der 9700? :-)
Spätestens morgen gibt's interessante neue Subtests Größe des Texturcaches
Präzision der Combiner, des Alpha-Tests, und des Farb-Interpolators
:naughty:

edit: der Tiling-Subtest hat sich seit den letzten R300-Ergebnissen auch stark geändert, das wäre einen Nachtest wert. Auch der Geometrie-Test hat ein paar neue Sachen bekommen. Also immer her damit =)

zeckensack
2003-03-19, 17:05:53
Originally posted by GloomY
Hrhr, mit der neuen Version komm' ich auf gescheite Werte :)
Was hast du denn gefixt, Zecki?

Ich habe die Wahrscheinlichkeitsschwelle abgesenkt, unter der mögliche Tilegrößen für Unsinn befunden und ignoriert werden (=> 'none'). Am Verfahren an sich ist nix neues.
Diese Änderung ist theoretisch unnötig, weil passende Tilegrößen immer eine Wahrscheinlichkeit >1.0 haben sollten.
Um eine gewisse Toleranz ggü Meßschwankungen zu haben war das Limit bisher auf 0.5. Jetzt isses auf 0.25.

Nur um das mal zu erläutern, Wahrscheinlichkeit <1.0 heißt, daß bei Kacheln dieser Größe eine geringere Füllrate erreicht wird als bei benachbarten Größen. Im Grunde können das gar keine richtigen Tiles mehr sein ... wenn sie's im Ergebnis doch werden, dann nur weil alle anderen Meßpunkte noch schlechter abschneiden.

Rein theoretisch ist das total paradox :|

ow
2003-03-19, 18:13:29
Originally posted by Stefan Payne Gleich mal mit dem 3DMark testen... €dit: Shit, das Teil verlangt DX6 kompatible Videotreiber :-/


Hö? DX6 treiber hat der Savage aber doch.

Nimm doch einfach den Villagemark und teste bi-/trilinear.

ow
2003-03-19, 18:18:46
Originally posted by GloomY
Hrhr, mit der neuen Version komm' ich auf gescheite Werte :)
Was hast du denn gefixt, Zecki?


Schalt mal Texturkompression aus. Das verfälscht den Wert bei trilinearem Filtern, weil der Kyro hier 'trickst'.

Achill
2003-03-19, 18:54:56
R300 (324/310.5), ganzes System mit Std. Takt, ansonsten siehe sig...

--- Swap: ---

ArchMark 0.09.06alpha
Driver Radeon 9700 Pro x86/SSE2 v1.3.3604 Win2000 Release
Resolution 1024x768 @ ???Hz
Method Swap
Timer 2.405 GHz

Memory
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 18.312 GB/s
Color 9.688 GB/s
ZAndStencil 80.778 GB/s
Z 60.106 GB/s
Stencil 2.134 GB/s

Draw 18.762 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 19.030 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 4
Height 4

----in depth buffer-----------------------------
Width 8
Height 4

----in stencil buffer---------------------------
Width 8
Height 4



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 2.373 GPix/s
Z 2.465 GPix/s
ColorAndZ 2.374 GPix/s
ZTest 1.759 GPix/s
ZCullLEqual 4.580 GPix/s
ZCullGEqual 4.578 GPix/s
ZCullEqual 2.465 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 2.464 GPix/s
Z 2.465 GPix/s
ColorAndZ 2.465 GPix/s
ZTest 1.908 GPix/s
ZCullLEqual 4.912 GPix/s
ZCullGEqual 4.922 GPix/s
ZCullEqual 2.465 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 2.464 GPix/s
2 1.258 GPix/s
3 844.647 MPix/s
4 642.449 MPix/s
5 514.330 MPix/s
6 429.066 MPix/s
7 368.015 MPix/s
8 322.271 MPix/s

----Unfiltered----------------------------------
1 2.466 GPix/s
2 1.258 GPix/s
3 845.031 MPix/s
4 642.717 MPix/s
5 514.625 MPix/s
6 429.240 MPix/s
7 368.245 MPix/s
8 322.491 MPix/s

----Bilinear filter-----------------------------
1 2.466 GPix/s
2 1.258 GPix/s
3 845.026 MPix/s
4 642.732 MPix/s
5 514.629 MPix/s
6 429.247 MPix/s
7 368.256 MPix/s
8 322.494 MPix/s

----Trilinear filter----------------------------
1 1.258 GPix/s
2 636.406 MPix/s
3 426.419 MPix/s
4 320.894 MPix/s
5 257.406 MPix/s
6 215.031 MPix/s
7 184.685 MPix/s
8 161.914 MPix/s

----Max anisotropy (16)-------------------------
1 630.164 MPix/s
2 319.295 MPix/s
3 213.610 MPix/s
4 160.974 MPix/s
5 129.316 MPix/s
6 108.032 MPix/s
7 93.066 MPix/s
8 81.615 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 61.156 MTris/s
List 42.497 MTris/s
Clip 2.477 MTris/s

--Vertex shading speed--------------------------
LightD1 90.562 MVerts/s
LightP1 38.941 MVerts/s
LightP8 14.664 MVerts/s

-----------
4 is the most likely option
followed by: 8 16 2 32
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
8 is the most likely option
followed by: 4 16 32 2
-----------
4 is the most likely option
followed by: 2 8 16 32
-----------
8 is the most likely option
followed by: 4 16 2 32
-----------
4 is the most likely option
followed by: 8 2 16 32





--- Flush: ---

ArchMark 0.09.06alpha
Driver Radeon 9700 Pro x86/SSE2 v1.3.3604 Win2000 Release
Resolution 1024x768 @ ???Hz
Method Flush
Timer 2.405 GHz

Memory
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 18.468 GB/s
Color 9.962 GB/s
ZAndStencil 116.480 GB/s
Z 87.174 GB/s
Stencil 2.176 GB/s

Draw 19.969 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 20.236 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 4
Height 4

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 2.440 GPix/s
Z 2.558 GPix/s
ColorAndZ 2.440 GPix/s
ZTest 1.740 GPix/s
ZCullLEqual 4.749 GPix/s
ZCullGEqual 4.744 GPix/s
ZCullEqual 2.545 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 2.533 GPix/s
Z 2.558 GPix/s
ColorAndZ 2.534 GPix/s
ZTest 1.934 GPix/s
ZCullLEqual 5.225 GPix/s
ZCullGEqual 5.220 GPix/s
ZCullEqual 2.545 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 2.508 GPix/s
2 1.277 GPix/s
3 854.984 MPix/s
4 642.009 MPix/s
5 514.368 MPix/s
6 428.785 MPix/s
7 367.761 MPix/s
8 321.915 MPix/s

----Unfiltered----------------------------------
1 2.504 GPix/s
2 1.278 GPix/s
3 854.691 MPix/s
4 642.458 MPix/s
5 514.273 MPix/s
6 429.026 MPix/s
7 367.807 MPix/s
8 322.100 MPix/s

----Bilinear filter-----------------------------
1 2.509 GPix/s
2 1.277 GPix/s
3 855.264 MPix/s
4 642.202 MPix/s
5 514.461 MPix/s
6 428.898 MPix/s
7 367.903 MPix/s
8 322.041 MPix/s

----Trilinear filter----------------------------
1 1.270 GPix/s
2 638.395 MPix/s
3 425.982 MPix/s
4 319.798 MPix/s
5 255.975 MPix/s
6 213.404 MPix/s
7 182.937 MPix/s
8 160.164 MPix/s

----Max anisotropy (16)-------------------------
1 633.528 MPix/s
2 317.512 MPix/s
3 211.939 MPix/s
4 159.018 MPix/s
5 127.254 MPix/s
6 106.064 MPix/s
7 90.928 MPix/s
8 79.571 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 61.157 MTris/s
List 42.498 MTris/s
Clip 2.477 MTris/s

--Vertex shading speed--------------------------
LightD1 90.549 MVerts/s
LightP1 38.948 MVerts/s
LightP8 14.664 MVerts/s

-----------
4 is the most likely option
followed by: 8 16 2 32
-----------
4 is the most likely option
followed by: 2 8 16 32
-----------
2 is the most likely option
followed by: 4 8 16 32
-----------
2 is the most likely option
followed by: 4 8 16 32
-----------
2 is the most likely option
followed by: 4 8 16 32
-----------
2 is the most likely option
followed by: 4 8 16 32



R100 kommt gleich, muss erst umbaun und treiber neu installieren...

Achill
2003-03-19, 19:43:12
R100 (164.25/164.25), rest wie bei R300 Test...

--- Swap ---

ArchMark 0.09.06alpha
Driver Radeon 7200 DDR x86/SSE2 v1.3.3604 Win2000 Release
Resolution 1024x768 @ ???Hz
Method Swap
Timer 2.405 GHz

Memory
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 4.941 GB/s
Color 2.544 GB/s
ZAndStencil 63.276 GB/s
Z 47.757 GB/s
Stencil 287.319 MB/s

Draw 3.786 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 4.053 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 4
Height 8

----in depth buffer-----------------------------
Width 4
Height 8

----in stencil buffer---------------------------
Width 8
Height 8



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 327.178 MPix/s
Z 327.213 MPix/s
ColorAndZ 327.213 MPix/s
ZTest 287.721 MPix/s
ZCullLEqual 309.702 MPix/s
ZCullGEqual 309.664 MPix/s
ZCullEqual 312.893 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 327.179 MPix/s
Z 327.225 MPix/s
ColorAndZ 327.225 MPix/s
ZTest 306.926 MPix/s
ZCullLEqual 312.901 MPix/s
ZCullGEqual 312.871 MPix/s
ZCullEqual 320.697 MPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 327.935 MPix/s
2 328.596 MPix/s
3 328.595 MPix/s

----Unfiltered----------------------------------
1 328.575 MPix/s
2 328.577 MPix/s
3 328.588 MPix/s

----Bilinear filter-----------------------------
1 328.578 MPix/s
2 328.584 MPix/s
3 328.581 MPix/s

----Trilinear filter----------------------------
1 328.581 MPix/s
2 166.635 MPix/s
3 166.634 MPix/s

----Max anisotropy (16)-------------------------
1 328.581 MPix/s
2 328.580 MPix/s
3 328.581 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 14.315 MTris/s
List 5.125 MTris/s
Clip 1.672 MTris/s

--Vertex shading speed--------------------------
LightD1 12.033 MVerts/s
LightP1 11.357 MVerts/s
LightP8 11.318 MVerts/s

-----------
4 is the most likely option
followed by: 8 16 2 32
-----------
8 is the most likely option
followed by: 32 16 4 2
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
8 is the most likely option
followed by: 32 16 4 2
-----------
8 is the most likely option
followed by: 4 16 2 32
-----------
8 is the most likely option
followed by: 32 16 4 2



--- Flush ---

ArchMark 0.09.06alpha
Driver Radeon 7200 DDR x86/SSE2 v1.3.3604 Win2000 Release
Resolution 1024x768 @ ???Hz
Method Flush
Timer 2.405 GHz

Memory
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 4.967 GB/s
Color 2.560 GB/s
ZAndStencil 78.591 GB/s
Z 58.592 GB/s
Stencil 286.430 MB/s

Draw 3.818 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 4.085 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 4
Height 32

----in depth buffer-----------------------------
Width 4
Height 16

----in stencil buffer---------------------------
Width 4
Height 16



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 327.451 MPix/s
Z 327.484 MPix/s
ColorAndZ 327.464 MPix/s
ZTest 287.754 MPix/s
ZCullLEqual 309.894 MPix/s
ZCullGEqual 309.753 MPix/s
ZCullEqual 312.699 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 327.451 MPix/s
Z 327.484 MPix/s
ColorAndZ 327.463 MPix/s
ZTest 307.326 MPix/s
ZCullLEqual 313.417 MPix/s
ZCullGEqual 313.378 MPix/s
ZCullEqual 320.237 MPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 326.945 MPix/s
2 327.274 MPix/s
3 327.228 MPix/s

----Unfiltered----------------------------------
1 327.308 MPix/s
2 327.259 MPix/s
3 327.215 MPix/s

----Bilinear filter-----------------------------
1 327.304 MPix/s
2 327.257 MPix/s
3 327.213 MPix/s

----Trilinear filter----------------------------
1 327.299 MPix/s
2 164.904 MPix/s
3 164.890 MPix/s

----Max anisotropy (16)-------------------------
1 327.302 MPix/s
2 327.260 MPix/s
3 327.209 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 14.316 MTris/s
List 5.124 MTris/s
Clip 1.672 MTris/s

--Vertex shading speed--------------------------
LightD1 12.033 MVerts/s
LightP1 11.357 MVerts/s
LightP8 11.318 MVerts/s

-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
32 is the most likely option
followed by: 16 8 4 2
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
16 is the most likely option
followed by: 32 8 4 2
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
16 is the most likely option
followed by: 32 8 4 2

Endorphine
2003-03-19, 20:00:01
Originally posted by zeckensack

Spätestens morgen gibt's interessante neue Subtests Größe des Texturcaches
Präzision der Combiner, des Alpha-Tests, und des Farb-Interpolators
:naughty:

edit: der Tiling-Subtest hat sich seit den letzten R300-Ergebnissen auch stark geändert, das wäre einen Nachtest wert. Auch der Geometrie-Test hat ein paar neue Sachen bekommen. Also immer her damit =)

OK =)
R300 @ 275/270
--- SWAP ---
ArchMark 0.09.06alpha
Driver Radeon 9700 x86/SSE2 v1.3.3604 WinXP Release
Resolution 1024x768 @ 86.93Hz
Method Swap
Timer 2.289 GHz

Memory
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 15.373 GB/s
Color 8.121 GB/s
ZAndStencil 71.597 GB/s
Z 53.219 GB/s
Stencil 1.829 GB/s

Draw 15.828 GB/s
BurnedByRAMDAC 271.237 MB/s
Physical 16.099 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 4
Height 4

----in depth buffer-----------------------------
Width 4
Height 4

----in stencil buffer---------------------------
Width 4
Height 4



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 2.073 GPix/s
Z 2.155 GPix/s
ColorAndZ 2.074 GPix/s
ZTest 1.515 GPix/s
ZCullLEqual 3.963 GPix/s
ZCullGEqual 3.965 GPix/s
ZCullEqual 2.114 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 2.043 GPix/s
Z 2.149 GPix/s
ColorAndZ 2.067 GPix/s
ZTest 1.639 GPix/s
ZCullLEqual 4.245 GPix/s
ZCullGEqual 4.236 GPix/s
ZCullEqual 2.113 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 2.077 GPix/s
2 978.578 MPix/s
3 720.631 MPix/s
4 547.361 MPix/s
5 437.457 MPix/s
6 366.731 MPix/s
7 314.337 MPix/s
8 276.031 MPix/s

----Unfiltered----------------------------------
1 2.066 GPix/s
2 1.058 GPix/s
3 722.131 MPix/s
4 547.618 MPix/s
5 437.652 MPix/s
6 367.031 MPix/s
7 314.559 MPix/s
8 276.293 MPix/s

----Bilinear filter-----------------------------
1 2.079 GPix/s
2 1.050 GPix/s
3 722.141 MPix/s
4 547.602 MPix/s
5 437.660 MPix/s
6 367.052 MPix/s
7 314.548 MPix/s
8 276.299 MPix/s

----Trilinear filter----------------------------
1 1.082 GPix/s
2 542.173 MPix/s
3 364.597 MPix/s
4 274.897 MPix/s
5 219.954 MPix/s
6 184.031 MPix/s
7 158.243 MPix/s
8 138.924 MPix/s

----Max anisotropy (16)-------------------------
1 539.453 MPix/s
2 272.150 MPix/s
3 182.805 MPix/s
4 137.881 MPix/s
5 110.634 MPix/s
6 92.646 MPix/s
7 79.793 MPix/s
8 70.105 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 52.236 MTris/s
List 36.280 MTris/s
Clip 2.116 MTris/s

--Vertex shading speed--------------------------
LightD1 77.567 MVerts/s
LightP1 33.401 MVerts/s
LightP8 12.516 MVerts/s

-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
4 is the most likely option
followed by: 2 32 8 16
-----------
4 is the most likely option
followed by: 2 8 16 32
-----------
4 is the most likely option
followed by: 2 8 32 16
-----------
4 is the most likely option
followed by: 2 8 16 32--- FLUSH ---
ArchMark 0.09.06alpha
Driver Radeon 9700 x86/SSE2 v1.3.3604 WinXP Release
Resolution 1024x768 @ 86.24Hz
Method Flush
Timer 2.289 GHz

Memory
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 15.974 GB/s
Color 8.383 GB/s
ZAndStencil 100.296 GB/s
Z 75.052 GB/s
Stencil 1.876 GB/s

Draw 15.631 GB/s
BurnedByRAMDAC 271.235 MB/s
Physical 15.903 GB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 4
Height 4

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 2.112 GPix/s
Z 2.185 GPix/s
ColorAndZ 2.112 GPix/s
ZTest 1.505 GPix/s
ZCullLEqual 4.102 GPix/s
ZCullGEqual 4.098 GPix/s
ZCullEqual 2.174 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 2.164 GPix/s
Z 2.185 GPix/s
ColorAndZ 2.164 GPix/s
ZTest 1.667 GPix/s
ZCullLEqual 4.497 GPix/s
ZCullGEqual 4.494 GPix/s
ZCullEqual 2.174 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 2.143 GPix/s
2 1.091 GPix/s
3 730.232 MPix/s
4 548.369 MPix/s
5 439.329 MPix/s
6 366.137 MPix/s
7 314.066 MPix/s
8 274.933 MPix/s

----Unfiltered----------------------------------
1 2.140 GPix/s
2 1.092 GPix/s
3 730.042 MPix/s
4 548.776 MPix/s
5 439.244 MPix/s
6 366.444 MPix/s
7 314.144 MPix/s
8 275.099 MPix/s

----Bilinear filter-----------------------------
1 2.144 GPix/s
2 1.091 GPix/s
3 730.491 MPix/s
4 548.508 MPix/s
5 439.430 MPix/s
6 366.330 MPix/s
7 314.244 MPix/s
8 275.060 MPix/s

----Trilinear filter----------------------------
1 1.085 GPix/s
2 545.296 MPix/s
3 363.858 MPix/s
4 273.137 MPix/s
5 218.645 MPix/s
6 182.269 MPix/s
7 156.247 MPix/s
8 136.805 MPix/s

----Max anisotropy (16)-------------------------
1 541.138 MPix/s
2 271.212 MPix/s
3 181.029 MPix/s
4 135.818 MPix/s
5 108.690 MPix/s
6 90.592 MPix/s
7 77.664 MPix/s
8 67.964 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 52.234 MTris/s
List 36.281 MTris/s
Clip 2.116 MTris/s

--Vertex shading speed--------------------------
LightD1 77.563 MVerts/s
LightP1 33.415 MVerts/s
LightP8 12.516 MVerts/s

4 is the most likely option
followed by: 8 2 16 32
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
2 is the most likely option
followed by: 4 8 16 32
-----------
2 is the most likely option
followed by: 4 8 16 32
-----------
2 is the most likely option
followed by: 4 8 16 32
-----------
2 is the most likely option
followed by: 4 8 16 32
Eine Frage zum Schluss noch: wird's eine Readme geben, die die Tests etwas erklärt? Ich verstehe z.B. gar nicht, was bei der preferred block size gemessen wird und beim Geometrietest kann ich mir auch nur zusammenreimen, was dort passiert :...(

zeckensack
2003-03-19, 20:03:21
Thx :)

@Achill,
sehr interessant finde ich den Clip-Wert von der Radeon9700Pro. Die Performance ist genauso schlecht wie auf meiner Radeon8500LE (im Rahmen des Taktunterschiedes). Auch der R100 paßt hier absolut ins Bild. ATI scheint die doch recht bescheidene Clipping-Engine bis zur aktuellen Generation eins zu eins übernommen zu haben :|

Endorphine
2003-03-19, 20:16:37
zeckensack,
gibt es nen Grund, warum sich die "preferred block size" Ergebnisse von Achill von meinen unterscheiden? Bei Swap Buffers sehe ich nen deutlichen Unterschied, der bei Flush nicht vorhanden ist ???


swap buffers mein Ergebnis:

4 is the most likely option
followed by: 8 2 16 32
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
4 is the most likely option
followed by: 2 32 8 16
-----------
4 is the most likely option
followed by: 2 8 16 32
-----------
4 is the most likely option
followed by: 2 8 32 16
-----------
4 is the most likely option
followed by: 2 8 16 32


swap buffers Achill's Ergebnis

-----------
4 is the most likely option
followed by: 8 16 2 32
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
8 is the most likely option
followed by: 4 16 32 2
-----------
4 is the most likely option
followed by: 2 8 16 32
-----------
8 is the most likely option
followed by: 4 16 2 32
-----------
4 is the most likely option
followed by: 8 2 16 32

zeckensack
2003-03-19, 20:32:27
Originally posted by Endorphine
zeckensack,
gibt es nen Grund, warum sich die "preferred block size" Ergebnisse von Achill von meinen unterscheiden? Bei Swap Buffers sehe ich nen deutlichen Unterschied, der bei Flush nicht vorhanden ist ???
Die Messung ist leider nicht so ganz zuverlässig ... ich hatte mir das auch einfacher vorgestellt :|

zeckensack
2003-03-19, 20:36:30
Originally posted by Endorphine
Eine Frage zum Schluss noch: wird's eine Readme geben, die die Tests etwas erklärt? Ich verstehe z.B. gar nicht, was bei der preferred block size gemessen wird und beim Geometrietest kann ich mir auch nur zusammenreimen, was dort passiert :...(
Japp, irgendwann gibt's ein kurzes Readme und eine detaillierte Erklärung auch noch extra :D

Wie hieß es doch erst heute im Mod-Forum:
Informatik-Menschen wie Elektrotechniker hassen es Dokumentation zu produzieren. Es gibt nichts, das sie lieber vor sich her schieben ;)

Tiling-Test:
Dort wird die erreichbare Füllrate beim Zeichnen unterschiedlich großer Rechteckiger Regionen gemessen, nach Höhe und Breite getrennt. Den Test für den Color-Buffer kannst du ja bei der Arbeit beobachten :)

Aus den Verhältnissen zwischen den erreichbaren Füllraten wird jetzt 'rausanalysiert', welche Blockgrößen dem Chip am liebsten sind.

Geo-Test:
Dort werden ganz einfach Dreiecke auf die Karte geschmissen. Die werden später durchs Backface culling eliminiert, sodaß keine Füllrate dabei draufgeht. Es wird also die reine Transformationsleistung gemessen.
'Fan' ist eben das, ein Fan, also eine geschlossene Fläche mit einem gemeinsamen Zentrum. Der Chip braucht hier pro Dreieck nur einen Eckpunkt zu transformieren, weil die beiden anderen aus dem unmittelbar vorangegangenen Dreieck übernommen werden.

'List' zeichnet unabhängige Dreiecke, also ohne gemeinsame Eckpunkte.

'Clip' funktioniert wie List, nur wird der Dreieckshaufen so weit skaliert, daß jedes Dreieck über den Bildschirmrand hinausragt. Der Chip muß nun die Eckpunkte so weit nach innen verschieben, daß sie wieder auf der Bildfläche zu liegen kommen. Das nennt man 'Clipping'.

'LightD1', 'LightP1' und 'LightP8' benutzen Lichter nach der Definition von fixed-function-T&L. Diese sollten auf moderneren Chips als Vertex Shader gelöst sein - oder auch nicht. Der Vorteil dieser Methode ist, daß jeder Grafiktreiber dieses beherrscht, und ich nicht zig verschiedene 'richtige' Vertex Shader schreiben und testen muß. Selbst T&L-lose Karten können das, der Treiber muß es dann in Software emulieren.
Ich halte insbesondere LightP8 für einen angemessenen Ersatz für komplexe Vertex Shader, weil dafür schon ganz ordentlich gerechnet werden muß.

Achill
2003-03-19, 20:37:50
evtl. liegt es an meinen OpenGL einstellungen...

versuche es mal damit:

Windows Registry Editor Version 5.00

[HKEY_LOCAL_MACHINE\SYSTEM\ControlSet001\Services\ati2mtag\Device0\OpenGL]
"OGLEnableKTXBufferRegion"=dword:00000000
"OGLForceZBufferDepth"=dword:00000000
"OGLAlphaDitherMethod"=dword:00000000
"OGLWaitVerticalSync"=dword:00000000
"OGLEnableFastFullSceneAA"=dword:00000000
"OGLFullSceneAAScale"=dword:00000000
"OGLMaxAnisotropy"=dword:00000000
"OGLLODBias"=dword:00000000
"OGLTextureOpt"=dword:00000000
"OGLConvertTextures32To16"=dword:00000000
"OGLEnableHWPageFlip"=dword:00000001
"OGLEnableTextureCompression"=dword:00000001
"OGLDisableDitherWhenAlphaBlending"=dword:00000000
"OGLSubPixelPrecision"=dword:00000004

[HKEY_LOCAL_MACHINE\SYSTEM\ControlSet001\Services\ati2mtag\Device0\OpenGL\Private]
"enableFastZMaskClear"=dword:00000001
"enableHierarchicalZ"=dword:00000001
"enableMacroTile"=dword:00000001
"enableMicroTile"=dword:00000001
"enableMultiTexture"=dword:00000001
"enableZCompression"=dword:00000001
"ZCompForAllConfigs"=dword:00000001
"enableSSE"=dword:00000001
"enableSSE2"=dword:00000001
"disableHyperZ"=dword:00000000

Achill
2003-03-19, 20:57:36
habe zum test alle opengl einträge aus der reg entfernt, bei der r100 veränderte sich darauf die tilegröße...

--preferred block size--------------------------
----in color buffer-----------------------------
Width 4
Height 8

----in depth buffer-----------------------------
Width 4
Height 8

----in stencil buffer---------------------------
Width 4
Height 8

-----------
4 is the most likely option
followed by: 8 16 2 32
-----------
8 is the most likely option
followed by: 32 16 4 2
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
8 is the most likely option
followed by: 32 16 4 2
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
8 is the most likely option
followed by: 32 16 4 2

eigendlich sollte doch ein kleiners tile besser sein oder?

[Nachtrag]
Habe noch etwas weiter mit den Treibersettings gespielt, es kam aber immer nur die letzten ergebnisse heraus, ich konnte die ersten ergebnisse nicht mehr replizieren, selbst als ich mein altes profi mit dem radeonator 2.0 geladen hatte und ein neustart durchgeführt habe. Die letzteren werte scheienen die richtigen zu sein - test ca. 15 durchgelaufen bei vielen kobinationen von hyperZ und Unterarten davon + macro_tile und micro_tile ... ergaben keine veränderungen...

zeckensack
2003-03-19, 21:31:21
So, Junx :D

Version 0.10.03 :naughty:
Noch eine letzte verzweifelte Änderung an der Tiling-Logik. Wenn jetzt immer noch Blödsinn gemessen wird, dann kommt dieser Test in die Tonne.
Neuer Subtest: Präzision
kleine Verschönerungen am Interface :flower:
kleine Umstrukturierung des Ergebnis-Exporters
sonst wirklich nix!


Also primär geht's um Tiling, das bitte nochmal testen :eyes: und die Präzision natürlich.

Ihr könnt und dürft gerne die anderen Tests überspringen. Davon würde die Lesbarkeit dieses Threads enorm profitieren ;)

Achill
2003-03-19, 21:37:20
muss mich nochmal revidieren... habe immer nur auf die erste zahl geschaut gehabt - aber es gibt ja noch weitere.

die folge dieser unterscheidet sich sehr wohl.

zum test hatte ich wieder alle setinge unter opengl gelöscht und dann 2 mal den test laufen lassen. nach einen durchlauf hab ich ihn geschlossen, werte gespeichert und dann wieder gestartet - sonst nichts.

raus kam folgendes:

1 versuch...

-----------
4 is the most likely option
followed by: 8 16 2 32
-----------
8 is the most likely option
followed by: 32 4 16 2
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
8 is the most likely option
followed by: 32 4 16 2
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
8 is the most likely option
followed by: 32 4 16 2


2 versuch...

-----------
4 is the most likely option
followed by: 8 16 2 32
-----------
8 is the most likely option
followed by: 32 16 4 2
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
8 is the most likely option
followed by: 32 16 4 2
-----------
4 is the most likely option
followed by: 8 2 16 32
-----------
8 is the most likely option
followed by: 32 16 4 2

fast alle reihen unterscheiden sichnach der ersten ziffer.

wenn die reihe also nicht stabiel ist, sollte es auch möglich sein, das ab und zu eine der ersten ziffern aus der reihe tanzt...

fehlerquellen:

Der Ati-Treiber optimiert/verändert sich intern und man kann ihn nicht von treibersettings abhänig machen.

Die der HW algorith. ist nicht eindeutig und "entscheidet" selbst.

Der Test hat einen fehler, der verschiedene Möglichkeiten produziert.


Wenn man davon ausgeht, das der ATI Treiber beim init. von OpenGL sich einmal einstellt ("optimiert"), so würde es reichen, wenn man den Test 2 mal durchlaufen läst - gäb es keine abweichungen könnte man zumindest einen defekt/ungenauigkeit in der HW ausschließen...

[nachtrag]
bezog sich noch auf die alte version... - beschreibe doch bitte nochmal die logik von dem test.

Quasar
2003-03-19, 21:44:51
@Zecki:
Besteht noch Bedarf an alternativen Grakas?
Xabre, G400MAX 32SG, R7500, Voodoo4/5...

ow
2003-03-19, 21:44:55
Originally posted by Achill
R100 (164.25/164.25), rest wie bei R300 Test...


--Vertex shading speed--------------------------
LightD1 12.033 MVerts/s
LightP1 11.357 MVerts/s
LightP8 11.318 MVerts/s




Hmm...sind das Werte einer HWT&L?:|

Achill
2003-03-19, 21:48:10
sieht viel besser aus ... einige mal nur tiling versucht, bis auf die letzen zwei werte (sehr selten) sonst alles stabil... jedodch sind die tile jetzt viel kleiner - wie das?

immernoch r100...

versuch 1...
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
1 is the most likely option
followed by: 2 4 8 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
1 is the most likely option
followed by: 2 4 8 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
1 is the most likely option
followed by: 2 4 8 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
1 is the most likely option
followed by: 2 4 8 16


versuch 2...
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
1 is the most likely option
followed by: 2 4 8 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
1 is the most likely option
followed by: 2 4 8 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
1 is the most likely option
followed by: 2 4 8 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
1 is the most likely option
followed by: 2 4 8 32


versuch 3...
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
1 is the most likely option
followed by: 2 4 8 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
1 is the most likely option
followed by: 2 4 8 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
1 is the most likely option
followed by: 2 4 8 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
1 is the most likely option
followed by: 2 4 8 32

StefanV
2003-03-19, 21:49:38
Originally posted by zeckensack
So, Junx :D

Version 0.10.03 :naughty:
Noch eine letzte verzweifelte Änderung an der Tiling-Logik. Wenn jetzt immer noch Blödsinn gemessen wird, dann kommt dieser Test in die Tonne.
Neuer Subtest: Präzision
kleine Verschönerungen am Interface :flower:
kleine Umstrukturierung des Ergebnis-Exporters
sonst wirklich nix!


Also primär geht's um Tiling, das bitte nochmal testen :eyes: und die Präzision natürlich.

Ihr könnt und dürft gerne die anderen Tests überspringen. Davon würde die Lesbarkeit dieses Threads enorm profitieren ;)

Besteht die möglichkeit die 16bít und 32bit Tests NEBENEINANDER darzustellen anstatt untereinander ??

StefanV
2003-03-19, 21:50:02
ArchMark 0.10.03alpha
Driver GeForce3/PCI/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 60.22Hz
Method Flush
Timer 1.670 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 14.541 GB/s
Color 8.339 GB/s
ZAndStencil 57.153 GB/s
Z 42.872 GB/s
Stencil 14.292 GB/s

Draw 10.194 GB/s
BurnedByRAMDAC 190.617 MB/s
Physical 10.384 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 2
Height 2

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 969.904 MPix/s
Z 970.039 MPix/s
ColorAndZ 969.905 MPix/s
ZTest 948.722 MPix/s
ZCullLEqual 1.917 GPix/s
ZCullGEqual 1.915 GPix/s
ZCullEqual 969.915 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z24 S0
Color 970.036 MPix/s
Z 969.906 MPix/s
ColorAndZ 970.039 MPix/s
ZTest 969.726 MPix/s
ZCullLEqual 1.925 GPix/s
ZCullGEqual 1.923 GPix/s
ZCullEqual 970.040 MPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 966.497 MPix/s
2 970.035 MPix/s
3 485.546 MPix/s
4 485.483 MPix/s

----Unfiltered----------------------------------
1 970.034 MPix/s
2 970.037 MPix/s
3 485.489 MPix/s
4 485.484 MPix/s

----Bilinear filter-----------------------------
1 970.037 MPix/s
2 969.847 MPix/s
3 485.488 MPix/s
4 485.546 MPix/s

----Trilinear filter----------------------------
1 969.866 MPix/s
2 485.546 MPix/s
3 323.672 MPix/s
4 242.757 MPix/s

----Max anisotropy (8)--------------------------
1 485.804 MPix/s
2 242.899 MPix/s
3 165.527 MPix/s
4 148.975 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 29.947 MTris/s
List 9.735 MTris/s
Clip 9.736 MTris/s

--Vertex shading speed--------------------------
LightD1 20.155 MVerts/s
LightP1 9.635 MVerts/s
LightP8 3.688 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
ATest 9
Combiner 15
Color 15

ow
2003-03-19, 21:50:40
GF4@250/256,5

ArchMark 0.10.03alpha
Driver GeForce4 Ti 4200/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 87.89Hz
Method Flush
Timer 1.470 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 12.057 GB/s
Color 7.650 GB/s
ZAndStencil 28.419 GB/s
Z 21.318 GB/s
Stencil 13.276 GB/s

Draw 9.094 GB/s
BurnedByRAMDAC 276.852 MB/s
Physical 9.371 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 2
Height 2

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 995.635 MPix/s
Z 995.634 MPix/s
ColorAndZ 995.634 MPix/s
ZTest 867.355 MPix/s
ZCullLEqual 1.943 GPix/s
ZCullGEqual 1.942 GPix/s
ZCullEqual 3.721 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 995.635 MPix/s
Z 995.634 MPix/s
ColorAndZ 995.634 MPix/s
ZTest 996.048 MPix/s
ZCullLEqual 1.960 GPix/s
ZCullGEqual 1.959 GPix/s
ZCullEqual 3.799 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 995.632 MPix/s
2 995.630 MPix/s
3 498.140 MPix/s
4 498.140 MPix/s

----Unfiltered----------------------------------
1 995.633 MPix/s
2 995.633 MPix/s
3 498.141 MPix/s
4 498.141 MPix/s

----Bilinear filter-----------------------------
1 995.606 MPix/s
2 995.632 MPix/s
3 498.141 MPix/s
4 498.141 MPix/s

----Trilinear filter----------------------------
1 995.633 MPix/s
2 498.137 MPix/s
3 332.092 MPix/s
4 249.069 MPix/s

----Max anisotropy (8)--------------------------
1 498.452 MPix/s
2 249.227 MPix/s
3 166.391 MPix/s
4 149.734 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 49.749 MTris/s
List 18.151 MTris/s
Clip 18.232 MTris/s

--Vertex shading speed--------------------------
LightD1 32.802 MVerts/s
LightP1 22.168 MVerts/s
LightP8 4.994 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
ATest 9
Combiner 15
Color 15




/edit: swap durch flush ersetzt.

StefanV
2003-03-19, 21:51:53
meine geliebte G550 :naughty:

ArchMark 0.10.03alpha
Driver Matrox G400 v1.1.3 Feb 7 2003
Resolution 1024x768 @ ???Hz
Method Flush
Timer 848.352 MHz

Bandwidth

Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 2
Height 1

----in color buffer-----------------------------
Width 2
Height 1

----in depth buffer-----------------------------
Width 2
Height 1

----in stencil buffer---------------------------
Width 2
Height 1



Fillrate

Texturing

Geometry

Precision
Mode RGBA8888 Z15 S1
--fraction bits---------------------------------
ATest 9
Combiner 9
Color 9

Achill
2003-03-19, 21:56:27
die r100, alles wie oben beschrieben - für heute das letzte mal, dann kommt die r300 wieder rein ;)

ArchMark 0.10.03alpha
Driver Radeon 7200 DDR x86/SSE2 v1.3.3604 Win2000 Release
Resolution 1024x768 @ ???Hz
Method Swap
Timer 2.405 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 4.941 GB/s
Color 2.544 GB/s
ZAndStencil 63.263 GB/s
Z 47.747 GB/s
Stencil 287.291 MB/s

Draw 3.816 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 4.083 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 2
Height 1

----in color buffer-----------------------------
Width 2
Height 1

----in depth buffer-----------------------------
Width 2
Height 1

----in stencil buffer---------------------------
Width 2
Height 1



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 327.176 MPix/s
Z 327.212 MPix/s
ColorAndZ 327.213 MPix/s
ZTest 287.722 MPix/s
ZCullLEqual 309.717 MPix/s
ZCullGEqual 309.604 MPix/s
ZCullEqual 312.893 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 327.176 MPix/s
Z 327.225 MPix/s
ColorAndZ 327.224 MPix/s
ZTest 306.923 MPix/s
ZCullLEqual 312.897 MPix/s
ZCullGEqual 312.870 MPix/s
ZCullEqual 320.698 MPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 327.937 MPix/s
2 328.589 MPix/s
3 328.584 MPix/s

----Unfiltered----------------------------------
1 328.577 MPix/s
2 328.584 MPix/s
3 328.586 MPix/s

----Bilinear filter-----------------------------
1 328.579 MPix/s
2 328.586 MPix/s
3 328.575 MPix/s

----Trilinear filter----------------------------
1 328.575 MPix/s
2 166.638 MPix/s
3 166.635 MPix/s

----Max anisotropy (16)-------------------------
1 328.583 MPix/s
2 328.573 MPix/s
3 328.580 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 14.315 MTris/s
List 5.125 MTris/s
Clip 1.672 MTris/s

--Vertex shading speed--------------------------
LightD1 12.033 MVerts/s
LightP1 11.357 MVerts/s
LightP8 11.318 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
ATest 9
Combiner 13
Color 12

zeckensack
2003-03-19, 22:01:20
Originally posted by ow


Hmm...sind das Werte einer HWT&L?:|
Das sind jedenfalls offenbar die Werte einer Graka, die das Culling vor der Beleuchtungsberechnung durchführt. Ist schon erstaunlich :|

Bei HW-T&L halte ich das eigentlich für kompletten Blödsinn :bäh:

ow
2003-03-19, 22:04:36
Originally posted by zeckensack

Das sind jedenfalls offenbar die Werte einer Graka, die das Culling vor der Beleuchtungsberechnung durchführt. Ist schon erstaunlich :|

Bei HW-T&L halte ich das eigentlich für kompletten Blödsinn :bäh:

Hm...wieso?
Du meinst da wird zuerst transformiert, dann gecullt und dann erst die Beleuchtung berechnet?

/edit: btw. wie sicher ist denn der Präzisionstest?
Da liegen 'momentan' die GFs weit in Front.:D


/edit: und ich sehe gearde, dass da eine Reihe Tests auf der GF mit Z0 S0 laufen.:|

Achill
2003-03-19, 22:11:53
@ow, evtl. hilft es weiter, r100@(182.25/182.25)

ArchMark 0.10.03alpha
Driver Radeon 7200 DDR x86/SSE2 v1.3.3604 Win2000 Release
Resolution 1024x768 @ ???Hz
Method Swap
Timer 2.405 GHz

Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 15.888 MTris/s
List 5.689 MTris/s
Clip 1.856 MTris/s

--Vertex shading speed--------------------------
LightD1 13.352 MVerts/s
LightP1 12.600 MVerts/s
LightP8 12.556 MVerts/s



LightD1:
(182,25/164,25)*12.033=13351,7 - kommt sehr gut hin mit den Meßwerten.

LightP1
(182,25/164,25)*11.357=12601 - kommt sehr gut hin mit den Meßwerten.

LightP8
(182,25/164,25)*11.318=12556 - kommt sehr gut hin.

Also k.a. woran es liegt, die T&L leistung skaliert linear zum Takt.
Des weiteren bezweifle ich, das mein P4 12.556 MV/s berechnen kann. Aber eine Antwort habe ich nicht recht...


(325/164,25)*11.318 = 22395 MV/s - das wäre ein r100 mit r300 taktung :) - wer weiss was ATI noch so alles einbehällt ;)

zeckensack
2003-03-19, 22:11:57
Originally posted by ow
Hm...wieso?
Du meinst da wird zuerst transformiert, dann gecullt und dann erst die Beleuchtung berechnet?Japp. Transformation und Beleuchtung sollten sinnigerweise in einer einzelnen Einheit ausgeführt werden, weil beide auf den gleichen Datensätzen arbeiten (jeweils ein einzelner Vertex). Außerdem führen beide Teile recht ähnliche Operationen aus (Skalarprodukte und Additionen von Vektoren).

Culling erwartet man eigentlich im Triangle Setup, und dafür braucht man jeweils drei transformierte Vertices. Vertex-Normalen (die in meinem Fall sowieso komplett zufällig sind, und nichts mit der Oberfläche zu tun haben) dürfen für's Culling auf gar keinen Fall verwendet werden.

Irgendwie ist das sehr merkwürdig :|
/edit: btw. wie sicher ist denn der Präzisionstest?
Da liegen 'momentan' die GFs weit in Front.:D Anscheinend nicht sicher genug ;)
Ich sehe da eine Möglichkeit, in diesem Test zu schummeln. Ich hätte eigentlich nicht erwartet daß das ein Hersteller tut, aber ich wurde eines besseren belehrt :D

zeckensack
2003-03-19, 22:14:25
Originally posted by Quasar
@Zecki:
Besteht noch Bedarf an alternativen Grakas?
Xabre, G400MAX 32SG, R7500, Voodoo4/5... Xabre wäre cool :)

Du hast PM.

StefanV
2003-03-19, 22:15:04
ArchMark 0.10.03alpha
Driver Radeon 9000 Pro DDR x86/MMX/3DNow!/SSE v1.3.3561 WinXP Release
Resolution 1024x768 @ 86.52Hz
Method Swap
Timer 1.670 GHz

Bandwidth

Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 8
Height 2

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate

Texturing

Geometry

Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
ATest 8
Combiner 11
Color 11

StefanV
2003-03-19, 22:17:16
Originally posted by zeckensack
Xabre wäre cool :)

Du hast PM.

Leider sitzt mein KT333 Brett im 'Hauptrechner', der mein Internetserver ist ;)

Und ins KT400 Brett passt die V5 schlecht, genausowenig wie ins A340 ;)

PS: werd die Savage 2000 gleich nochmal rausholen und mein KM266 Brett umbauen, in ~20min...

StefanV
2003-03-19, 22:20:23
Originally posted by ow
GF4@250/256,5

ArchMark 0.10.03alpha
Driver GeForce4 Ti 4200/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 87.89Hz
Method Flush
Timer 1.470 GHz

Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
ATest 9
Combiner 15
Color 15




/edit: swap durch flush ersetzt.

ah, interessant, anscheinend 'Cheatet' NV in diesem Test :naughty:

Bei allen anderen läuft der Prezisionstest mit Z15/24 und S1/8...

zeckensack
2003-03-19, 22:25:18
Originally posted by Achill
beschreibe doch bitte nochmal die logik von dem test. Ich beschreibe jetzt mal die aktuelle Logik, die minimal anders arbeitet.

1)Füllrate messen für Streifen von 1...64 Pixel Breite, abspeichern
2)Für jede Stufe wird eine Wahrscheinlichkeit ausgerechnet, daß diese dem Chip ganz besonders gut liegt. Rechnung für Stufe x:

2a)Aus den Füllraten von Stufe x-1 und Stufe x+1 wird ein Mittelwert gebildet. Dies ist die erwartete Füllrate für Stufe x. Die Basis-Wahrscheinlichkeit wird gebildet aus tatsächlich/erwartet.

3)Ansammeln der Wahrscheinlichkeiten von ganzzahligen Vielfachen für jede Stufe x:
3a)Die Basis-Wahrscheinlichkeit wird mit den Wahrscheinlichkeiten aller ganzzahligen Vielfachen multipliziert
(dies sorgt zB dafür, daß Stufe 4 abgewertet wird, wenn Stufen 12,20,28 etc vergleichsweise langsam waren)

4)Der beste gewinnt :)

Die alte Methode unterschied sich in Punkt 2a, und zwar wurde dort nur die Füllrate der aktuellen durch die Füllrate der nächsten Stufe geteilt. Grund: idR steigen die Füllraten von Stufe zu Stufe an, Ausreißer (höhere Füllraten bei den jeweils kleineren Blöcken) deuten auf die gesuchten Optimalfälle.

Ein Problem der aktuellen Methode könnte die Bildung des Mittelwerts sein. Dies erfolgt im Moment linear, die Füllrate/Stufe-Kurven die ich gesehen habe sind aber eher logarithmisch oder sowas ...

zeckensack
2003-03-19, 22:27:09
Originally posted by Stefan Payne


ah, interessant, anscheinend 'Cheatet' NV in diesem Test :naughty:

Bei allen anderen läuft der Prezisionstest mit Z15/24 und S1/8... Herzallerliebster Stefan, so erkläre mir doch bitte was der Z-Buffer mit der Farbpräzision zu tun hat =)

Btw, die Gf4 arbeitet korrekt, denn dieser Test fordert überhaupt keinen Z-Buffer an :naughty:

Achill
2003-03-19, 22:43:22
r300, alles wie gehabt...

ArchMark 0.10.03alpha
Driver Radeon 9700 Pro x86/SSE2 v1.3.3604 Win2000 Release
Resolution 1024x768 @ ???Hz
Method Swap
Timer 2.405 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 18.313 GB/s
Color 9.686 GB/s
ZAndStencil 80.749 GB/s
Z 60.505 GB/s
Stencil 2.134 GB/s

Draw 18.755 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 19.022 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 4
Height 2

----in color buffer-----------------------------
Width 4
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 2.373 GPix/s
Z 2.465 GPix/s
ColorAndZ 2.374 GPix/s
ZTest 1.759 GPix/s
ZCullLEqual 4.583 GPix/s
ZCullGEqual 4.582 GPix/s
ZCullEqual 2.464 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 2.465 GPix/s
Z 2.465 GPix/s
ColorAndZ 2.465 GPix/s
ZTest 1.907 GPix/s
ZCullLEqual 4.927 GPix/s
ZCullGEqual 4.918 GPix/s
ZCullEqual 2.465 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 2.463 GPix/s
2 1.258 GPix/s
3 844.687 MPix/s
4 642.490 MPix/s
5 514.200 MPix/s
6 429.069 MPix/s
7 368.090 MPix/s
8 322.258 MPix/s

----Unfiltered----------------------------------
1 2.466 GPix/s
2 1.258 GPix/s
3 845.018 MPix/s
4 642.708 MPix/s
5 514.638 MPix/s
6 429.234 MPix/s
7 368.253 MPix/s
8 322.482 MPix/s

----Bilinear filter-----------------------------
1 2.466 GPix/s
2 1.258 GPix/s
3 845.004 MPix/s
4 642.731 MPix/s
5 514.625 MPix/s
6 429.237 MPix/s
7 368.248 MPix/s
8 322.498 MPix/s

----Trilinear filter----------------------------
1 1.258 GPix/s
2 636.398 MPix/s
3 426.427 MPix/s
4 320.893 MPix/s
5 257.406 MPix/s
6 215.032 MPix/s
7 184.677 MPix/s
8 161.914 MPix/s

----Max anisotropy (16)-------------------------
1 630.187 MPix/s
2 319.290 MPix/s
3 213.609 MPix/s
4 160.965 MPix/s
5 129.311 MPix/s
6 108.030 MPix/s
7 93.068 MPix/s
8 81.615 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 61.157 MTris/s
List 42.499 MTris/s
Clip 2.477 MTris/s

--Vertex shading speed--------------------------
LightD1 90.565 MVerts/s
LightP1 38.956 MVerts/s
LightP8 14.664 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
ATest 9
Combiner 12
Color 12

Endorphine
2003-03-19, 22:55:36
Originally posted by zeckensack

Japp, irgendwann gibt's ein kurzes Readme und eine detaillierte Erklärung auch noch extra :D

Wie hieß es doch erst heute im Mod-Forum:
Informatik-Menschen wie Elektrotechniker hassen es Dokumentation zu produzieren. Es gibt nichts, das sie lieber vor sich her schieben ;)

Tiling-Test:
[...]
Geo-Test:
[...]Aaah, danke :) Das leuchtet zum Grossteil ein, ein paar Begriffe werde ich noch nachschlagen müssen :) Der Text is schon gut readme-tauglich IMO =)

Quasar
2003-03-19, 23:15:28
r300, Aber nur die Minimalausführung (i.e. 4Pipes@275MHz, 2x64Bit@270MHz DDR, 64MB)

ArchMark 0.10.03alpha
Driver Radeon 9500 x86/SSE2 v1.3.3604 WinXP Release
Resolution 1024x768 @ ???Hz
Method Flush
Timer 2.524 GHz

BandwidthMode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 8.463 GB/s 18.313 GB/s
Color 4.296 GB/s 9.686 GB/s
ZAndStencil 134.604 GB/s 80.749 GB/s
Z 97.348 GB/s 60.505 GB/s
Stencil 1.019 GB/s 2.134 GB/s
Draw 8.183 GB/s 18.755 GB/s
BurnedByRAMDAC 267.387 MB/s 267.387 MB/s
Physical 8.450 GB/s 19.022 GB/s


Tiling Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 4 4
Height 2 2
----in color buffer-----------------------------
Width 2 4
Height 2 2
----in depth buffer-----------------------------
Width 2 2
Height 2 2
----in stencil buffer---------------------------
Width 2 2
Height 2 2

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 1.077 GPix/s 2.373 GPix/s
Z 1.095 GPix/s 2.465 GPix/s
ColorAndZ 1.077 GPix/s 2.374 GPix/s
ZTest 758.880 MPix/s 1.759 GPix/s
ZCullLEqual 946.053 MPix/s 4.583 GPix/s
ZCullGEqual 945.673 MPix/s 4.582 GPix/s
ZCullEqual 1.090 GPix/s 2.464 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 1.089 GPix/s 2.465 GPix/s
Z 1.095 GPix/s 2.465 GPix/s
ColorAndZ 1.089 GPix/s 2.465 GPix/s
ZTest 845.801 MPix/s 1.907 GPix/s
ZCullLEqual 988.408 MPix/s 4.927 GPix/s
ZCullGEqual 988.060 MPix/s 4.918 GPix/s
ZCullEqual 1.091 GPix/s 2.465 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 1.087 GPix/s 2.466 GPix/s
2 548.758 MPix/s
3 366.438 MPix/s
4 275.108 MPix/s
5 220.183 MPix/s
6 183.579 MPix/s
7 157.393 MPix/s
8 137.767 MPix/s 322.498 MPix/s

----Trilinear filter----------------------------
1 544.172 MPix/s 1.258 GPix/s
2 273.120 MPix/s
3 182.331 MPix/s
4 136.806 MPix/s
5 109.497 MPix/s
6 91.261 MPix/s
7 78.233 MPix/s
8 68.468 MPix/s 161.914 MPix/s

----Max anisotropy (16)-------------------------
1 271.295 MPix/s 630.187 MPix/s
2 135.853 MPix/s
3 90.599 MPix/s
4 67.972 MPix/s
5 54.383 MPix/s
6 45.325 MPix/s
7 38.849 MPix/s
8 33.999 MPix/s 81.615 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 50.535 MTris/s 61.157 MTris/s
List 34.890 MTris/s 42.499 MTris/s
Clip 2.110 MTris/s 2.477 MTris/s

--Vertex shading speed--------------------------
LightD1 74.410 MVerts/s 90.565 MVerts/s
LightP1 32.748 MVerts/s 38.956 MVerts/s
LightP8 12.428 MVerts/s 14.664 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
ATest 9
Combiner 12
Color 12

StefanV
2003-03-19, 23:20:13
JETZT kommt was richtig geiles !! ;)

ArchMark 0.10.03alpha
Driver 3Dfx/Voodoo5 (tm) SLI/2 TMUs/32 MB SDRAM/3DNow!/ICD (Nov 2 2000) v1.1.0
Resolution 1024x768 @ ???Hz
Method Flush
Timer 848.351 MHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 10.488 GB/s
Color 10.481 GB/s
ZAndStencil 10.480 GB/s
Z 3.623 GB/s
Stencil 1.207 GB/s

Draw 11.301 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 11.568 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 4
Height 2

----in color buffer-----------------------------
Width 4
Height 2

----in depth buffer-----------------------------
Width 4
Height 2

----in stencil buffer---------------------------
Width 4
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 1.504 GPix/s
Z 1.504 GPix/s
ColorAndZ 1.504 GPix/s
ZTest 905.073 MPix/s
ZCullLEqual 905.076 MPix/s
ZCullGEqual 905.074 MPix/s
ZCullEqual 905.077 MPix/s

--16 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 1.504 GPix/s
Z 1.504 GPix/s
ColorAndZ 1.504 GPix/s
ZTest 905.079 MPix/s
ZCullLEqual 905.070 MPix/s
ZCullGEqual 905.076 MPix/s
ZCullEqual 905.084 MPix/s


Texturing
Mode RGBA8888 Z24 S8
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 1.501 GPix/s
2 1.501 GPix/s

----Unfiltered----------------------------------
1 1.501 GPix/s
2 1.501 GPix/s

----Bilinear filter-----------------------------
1 1.501 GPix/s
2 1.501 GPix/s

----Trilinear filter----------------------------
1 1.501 GPix/s
2 1.501 GPix/s



Geometry
Mode RGBA8888 Z24 S8
--Plain vertices--------------------------------
Fan 5.162 MTris/s
List 2.113 MTris/s
Clip 1.037 MTris/s

--Vertex shading speed--------------------------
LightD1 3.684 MVerts/s
LightP1 3.640 MVerts/s
LightP8 3.784 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
ATest 9
Combiner 10
Color 10

StefanV
2003-03-19, 23:21:12
@Zecke

Kannst du einen Simplen Bi/Tri 'Tester' einbauen ? ;)

also 2 Bilder, die man vergleichen kann um zu beurteilen, ob Tri funzt oder nicht ;)

loewe
2003-03-19, 23:39:37
Hier dann noch einmal die KYRO II mit der neuen Version.

Tiling ist nicht besser, ansonsten gute Werte, wie auch vorher.

KYRO II @ 185 MHz

ArchMark 0.10.03alpha
Driver PowerVR KYRO v1.2.1
Resolution 1024x768 @ 62.15Hz
Method Flush
Timer 1.537 GHz

Bandwidth
Mode RGBA8888 Z32 S4
--bandwidth-------------------------------------
----available to buffer clears------------------
All 2.445 GB/s
Color 2.126 GB/s
ZAndStencil 706.024 MB/s
Z 643.843 MB/s
Stencil 78.178 MB/s

Draw 2.242 GB/s
BurnedByRAMDAC 196.716 MB/s
Physical 2.439 GB/s


Tiling
Mode RGBA8888 Z32 S4
--preferred block size--------------------------
----updating all buffers------------------------
Width 4
Height 1

----in color buffer-----------------------------
Width 4
Height 1

----in depth buffer-----------------------------
Width 1
Height 1

----in stencil buffer---------------------------
Width 1
Height 1



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z32 S4
Color 283.114 MPix/s
Z 155.448 MPix/s
ColorAndZ 279.965 MPix/s
ZTest 199.241 MPix/s
ZCullLEqual 283.953 MPix/s
ZCullGEqual 156.239 MPix/s
ZCullEqual 155.117 MPix/s

--16 bits---------------------------------------
Mode RGBA8888 Z16 S0
Color 357.676 MPix/s
Z 268.746 MPix/s
ColorAndZ 359.682 MPix/s
ZTest 302.436 MPix/s
ZCullLEqual 362.817 MPix/s
ZCullGEqual 270.124 MPix/s
ZCullEqual 261.724 MPix/s


Texturing
Mode RGBA8888 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 367.033 MPix/s
2 155.948 MPix/s
3 83.949 MPix/s
4 48.065 MPix/s

----Unfiltered----------------------------------
1 361.315 MPix/s
2 182.017 MPix/s
3 121.666 MPix/s
4 91.486 MPix/s

----Bilinear filter-----------------------------
1 360.760 MPix/s
2 182.330 MPix/s
3 121.848 MPix/s
4 91.486 MPix/s

----Trilinear filter----------------------------
1 186.787 MPix/s
2 95.770 MPix/s
3 65.444 MPix/s
4 50.011 MPix/s

----Max anisotropy (2)--------------------------
1 52.477 MPix/s
2 29.279 MPix/s
3 21.914 MPix/s
4 16.414 MPix/s



Geometry
Mode RGBA8888 Z0 S0
--Plain vertices--------------------------------
Fan 1.232 MTris/s
List 613.189 kTris/s
Clip 612.948 kTris/s

--Vertex shading speed--------------------------
LightD1 1.846 MVerts/s
LightP1 1.839 MVerts/s
LightP8 1.023 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
ATest 8
Combiner 10
Color 10



Hier auch noch die gnarf.txt:

-----------
4 is the most likely option
followed by: 16 2 8 32
-----------
1 is the most likely option
followed by: 4 8 32 16
-----------
1 is the most likely option
followed by: 32 4 8 16
-----------
1 is the most likely option
followed by: 4 16 32 8
-----------
1 is the most likely option
followed by: 16 32 4 8
-----------
1 is the most likely option
followed by: 8 16 4 32
-----------
4 is the most likely option
followed by: 2 16 8 32
-----------
1 is the most likely option
followed by: 4 8 16 32


BTW, ging leider nicht früher. Wir waren heute noch auf der CeBIT und sind gerade zurück, war ein langer Tag von 5.00 Uhr an.

Achill
2003-03-19, 23:54:45
@Quasar, zum vergleichen sollten wir schon entweder für flush oder swap entscheiden ;)

Zum Test...

Da ich nicht genau weis wie Tile funktionieren, aber dein Algorithmus verstehe, eine frage ob man es so interpretieren kann:


Bei einer bestimmten Pixelbreite (x) eines Streifen greift das Tiling besonders gut.

Dadurch erhöht sich die Füllrate bzw. wird max. ausgeschöpft. Weicht die Streifenbreite um x+/-1 ab, so ist das Tiling nicht mehr so effektiv - geringere füllrate.

Durch diesen Effekt ermittelt man für x nach 2a) einen zu niedrigen wert.

Dies bekommt man aber sofort bei der Auswertung mit, ist es der grund x-wert für ein tile, so sind auch alle vielfachen höher als erwartet - und da alle vielfachen miteinander multipliziert werden sollte der höchste wert heraus kommen.

Untersucht man einen anderen x-Wert, der größer als der x-Grundwert ist aber einvielfaches und somit im ersten Augenblick als möglicher Tilewert in frage kommt, wird er trotzdem raus fliegen, weil seine vielfachen evtl. nicht alle vielfachen vom wirklichen x-Wert sind und es weniger vielfache gibt die multiplziert werden können.

Hier stellt sich mir jetzt eine frage aufgrund meines zu geringen Wissens über Tiles.

Nehmen wir an, x=1 und x=3 sind nicht die idealen Tilewerte, somit gibt es dort schlechte Füllwerte.
Nun ist x=2 schon etwas optimal, die relative Füllrate liegt nach 2a) über eins.
Aber durch einen internen Trick ist wieder rum x=4 besser als x=2 für den GPU, jedoch ergibt sich nicht eine proportionale Erhöhung der Füllrate (im Verhältnis wie es besser ist) sondern eine etwas geminderte Füllrate (Verlust) - so würde in dem model x=4 schlechter abschneiden als x=2, obwohl es besser ist.

Wäre so eine Technik denkbar oder geht dieser Fall nicht, weil diese Technik nicht möglich ist?

Endorphine
2003-03-19, 23:55:01
So nochmal R300 @ 275/270 mit neuester Archmark-Alpha und nachfolgender kleiner Tiling-Analyse =)

--- buffer swapping ---
ArchMark 0.10.03alpha
Driver Radeon 9700 x86/SSE2 v1.3.3604 WinXP Release
Resolution 1024x768 @ 86.24Hz
Method Swap
Timer 2.289 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 15.399 GB/s
Color 8.084 GB/s
ZAndStencil 70.966 GB/s
Z 53.486 GB/s
Stencil 1.834 GB/s

Draw 16.173 GB/s
BurnedByRAMDAC 271.240 MB/s
Physical 16.444 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 4
Height 2

----in color buffer-----------------------------
Width 4
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 2.073 GPix/s
Z 2.156 GPix/s
ColorAndZ 2.073 GPix/s
ZTest 1.513 GPix/s
ZCullLEqual 3.958 GPix/s
ZCullGEqual 3.958 GPix/s
ZCullEqual 2.114 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 2.044 GPix/s
Z 2.144 GPix/s
ColorAndZ 2.072 GPix/s
ZTest 1.638 GPix/s
ZCullLEqual 4.241 GPix/s
ZCullGEqual 4.237 GPix/s
ZCullEqual 2.114 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 2.070 GPix/s
2 1.080 GPix/s
3 721.779 MPix/s
4 547.251 MPix/s
5 437.327 MPix/s
6 366.774 MPix/s
7 314.308 MPix/s
8 276.041 MPix/s

----Unfiltered----------------------------------
1 2.079 GPix/s
2 1.079 GPix/s
3 722.166 MPix/s
4 547.617 MPix/s
5 437.657 MPix/s
6 367.043 MPix/s
7 314.561 MPix/s
8 276.297 MPix/s

----Bilinear filter-----------------------------
1 2.074 GPix/s
2 1.082 GPix/s
3 721.590 MPix/s
4 547.641 MPix/s
5 437.660 MPix/s
6 367.054 MPix/s
7 314.554 MPix/s
8 276.294 MPix/s

----Trilinear filter----------------------------
1 1.079 GPix/s
2 542.179 MPix/s
3 364.594 MPix/s
4 274.910 MPix/s
5 219.964 MPix/s
6 184.040 MPix/s
7 158.247 MPix/s
8 138.925 MPix/s

----Max anisotropy (16)-------------------------
1 539.391 MPix/s
2 272.196 MPix/s
3 182.806 MPix/s
4 137.880 MPix/s
5 110.632 MPix/s
6 92.648 MPix/s
7 79.792 MPix/s
8 70.105 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 52.237 MTris/s
List 36.282 MTris/s
Clip 2.116 MTris/s

--Vertex shading speed--------------------------
LightD1 77.557 MVerts/s
LightP1 33.406 MVerts/s
LightP8 12.516 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
ATest 9
Combiner 12
Color 12


Die Einzelwerte für das Tiling sind je nach Lauf recht inkosistent bei Buffer Swapping:

Durchlauf 1
-----------
4 is the most likely option
followed by: 2 8 1 16
-----------
2 is the most likely option
followed by: 4 8 16 1
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 8 16 1
-----------
2 is the most likely option
followed by: 4 8 1 32
-----------
2 is the most likely option
followed by: 4 8 16 1
-----------
4 is the most likely option
followed by: 8 2 16 1
-----------
2 is the most likely option
followed by: 4 8 16 1
------------

Durchlauf 2
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 8 16 32
-----------
2 is the most likely option
followed by: 4 8 1 32
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 8 1 32
-----------
2 is the most likely option
followed by: 4 8 16 1
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 8 16 32
-----------

Durchlauf 3
-----------
4 is the most likely option
followed by: 2 8 1 16
-----------
2 is the most likely option
followed by: 4 8 16 1
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 8 16 1
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 8 16 1
-----------
4 is the most likely option
followed by: 2 8 1 16
-----------
2 is the most likely option
followed by: 4 8 16 1
-----------

Durchlauf 4
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 8 16 1
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 8 16 1
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
4 is the most likely option
followed by: 2 8 1 16
-----------
4 is the most likely option
followed by: 2 8 16 1
-----------

Endorphine
2003-03-19, 23:57:17
--- flushing!!! (argh! C&P suxx)---
ArchMark 0.10.03alpha
Driver Radeon 9700 x86/SSE2 v1.3.3604 WinXP Release
Resolution 1024x768 @ 86.24Hz
Method Flush
Timer 2.289 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 15.972 GB/s
Color 8.383 GB/s
ZAndStencil 100.280 GB/s
Z 75.056 GB/s
Stencil 1.877 GB/s

Draw 15.634 GB/s
BurnedByRAMDAC 271.259 MB/s
Physical 15.905 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 4
Height 2

----in color buffer-----------------------------
Width 4
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 2.112 GPix/s
Z 2.185 GPix/s
ColorAndZ 2.112 GPix/s
ZTest 1.505 GPix/s
ZCullLEqual 4.102 GPix/s
ZCullGEqual 4.096 GPix/s
ZCullEqual 2.174 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 2.120 GPix/s
Z 2.185 GPix/s
ColorAndZ 2.164 GPix/s
ZTest 1.667 GPix/s
ZCullLEqual 4.499 GPix/s
ZCullGEqual 4.494 GPix/s
ZCullEqual 2.174 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 2.143 GPix/s
2 1.091 GPix/s
3 730.291 MPix/s
4 548.285 MPix/s
5 439.201 MPix/s
6 366.172 MPix/s
7 314.091 MPix/s
8 274.931 MPix/s

----Unfiltered----------------------------------
1 2.140 GPix/s
2 1.092 GPix/s
3 730.064 MPix/s
4 548.773 MPix/s
5 439.289 MPix/s
6 366.443 MPix/s
7 314.123 MPix/s
8 275.120 MPix/s

----Bilinear filter-----------------------------
1 2.144 GPix/s
2 1.091 GPix/s
3 730.497 MPix/s
4 548.521 MPix/s
5 439.396 MPix/s
6 366.327 MPix/s
7 314.239 MPix/s
8 275.034 MPix/s

----Trilinear filter----------------------------
1 1.085 GPix/s
2 545.300 MPix/s
3 363.856 MPix/s
4 273.159 MPix/s
5 218.642 MPix/s
6 182.280 MPix/s
7 156.256 MPix/s
8 136.797 MPix/s

----Max anisotropy (16)-------------------------
1 541.081 MPix/s
2 271.209 MPix/s
3 181.017 MPix/s
4 135.817 MPix/s
5 108.690 MPix/s
6 90.565 MPix/s
7 77.664 MPix/s
8 67.964 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 52.237 MTris/s
List 36.282 MTris/s
Clip 2.116 MTris/s

--Vertex shading speed--------------------------
LightD1 77.562 MVerts/s
LightP1 33.405 MVerts/s
LightP8 12.516 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
ATest 9
Combiner 12
Color 12

-----------
4 is the most likely option
followed by: 2 8 1 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 1 8 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 1 8 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
4 is the most likely option
followed by: 2 8 1 16
-----------
2 is the most likely option
followed by: 4 8 1 16
Die Tiling-Einzelwerte sind auch nach viermaligem Test jedesmal absolut identisch bei flushing =)

p.s. Wem die Schrift beim lesen zu klein ist - per Browser vergrössern (IE: Mausrad + STRG, Mozilla: STRG und Plus/Minus). Beim scrollen ist es so aber sicher angenehmer ;)

/edit:
Postingtitel berichtigt

Achill
2003-03-19, 23:57:42
--- r300 mit flush ---

ArchMark 0.10.03alpha
Driver Radeon 9700 Pro x86/SSE2 v1.3.3604 Win2000 Release
Resolution 1024x768 @ ???Hz
Method Flush
Timer 2.405 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 18.468 GB/s
Color 9.960 GB/s
ZAndStencil 116.480 GB/s
Z 87.228 GB/s
Stencil 2.177 GB/s

Draw 19.964 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 20.232 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 4
Height 2

----in color buffer-----------------------------
Width 4
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 2.440 GPix/s
Z 2.558 GPix/s
ColorAndZ 2.440 GPix/s
ZTest 1.740 GPix/s
ZCullLEqual 4.749 GPix/s
ZCullGEqual 4.743 GPix/s
ZCullEqual 2.545 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 2.533 GPix/s
Z 2.558 GPix/s
ColorAndZ 2.534 GPix/s
ZTest 1.935 GPix/s
ZCullLEqual 5.226 GPix/s
ZCullGEqual 5.219 GPix/s
ZCullEqual 2.545 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 2.508 GPix/s
2 1.277 GPix/s
3 854.984 MPix/s
4 642.023 MPix/s
5 514.379 MPix/s
6 428.786 MPix/s
7 367.790 MPix/s
8 321.950 MPix/s

----Unfiltered----------------------------------
1 2.504 GPix/s
2 1.278 GPix/s
3 854.721 MPix/s
4 642.493 MPix/s
5 514.306 MPix/s
6 429.029 MPix/s
7 367.805 MPix/s
8 322.104 MPix/s

----Bilinear filter-----------------------------
1 2.509 GPix/s
2 1.277 GPix/s
3 855.233 MPix/s
4 642.156 MPix/s
5 514.486 MPix/s
6 428.900 MPix/s
7 367.904 MPix/s
8 322.033 MPix/s

----Trilinear filter----------------------------
1 1.270 GPix/s
2 638.387 MPix/s
3 425.977 MPix/s
4 319.787 MPix/s
5 255.973 MPix/s
6 213.404 MPix/s
7 182.938 MPix/s
8 160.164 MPix/s

----Max anisotropy (16)-------------------------
1 633.522 MPix/s
2 317.507 MPix/s
3 211.937 MPix/s
4 159.017 MPix/s
5 127.254 MPix/s
6 106.063 MPix/s
7 90.927 MPix/s
8 79.571 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 61.158 MTris/s
List 42.497 MTris/s
Clip 2.477 MTris/s

--Vertex shading speed--------------------------
LightD1 90.567 MVerts/s
LightP1 38.948 MVerts/s
LightP8 14.664 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
ATest 9
Combiner 12
Color 12

-----------
4 is the most likely option
followed by: 2 8 1 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
2 is the most likely option
followed by: 4 1 8 16
-----------
2 is the most likely option
followed by: 4 8 1 16
-----------
4 is the most likely option
followed by: 2 8 1 16
-----------
2 is the most likely option
followed by: 4 8 1 16

Endorphine
2003-03-20, 00:05:14
Achill,
lass doch bitte mal mehrere Durchläufe nur vom Tiling durchlaufen, jeweils mit flushing und swapping und vergleiche mal die gnarf.txt-Dateien untereinander.

Bei meiner R300 sind die Werte bei buffer swapping jedesmal anders, bei flushing immer exakt gleich. Kannst du das reproduzieren?

Achill
2003-03-20, 00:07:50
Originally posted by Endorphine

Die Tiling-Einzelwerte sind auch nach viermaligem Test jedesmal absolut identisch bei flushing =)



evtl. sollte man sich gleich auf flush einigen?

warte kurz...

[nachtrag]

Ja, bei mir das selbe, aber die letzten Zahlen nur - könnten auch meßfehler sein oder evtl. tritt der von mir beschriebene effekt auf ???

Versuch1 | Versuch2 | Versuch3

-----------
4 is the most likely option
followed by: 2 8 1 16 | 2 8 16 1 | 2 8 16 1
-----------
2 is the most likely option
followed by: 4 8 16 32 | 4 8 16 32 | 4 8 16 1
-----------
2 is the most likely option
followed by: 4 8 16 1 | 4 8 16 1 | 4 8 16 1
-----------
2 is the most likely option
followed by: 4 8 16 1 | 4 8 1 16 | 4 8 1 16
-----------
2 is the most likely option
followed by: 4 8 16 1 | 4 8 16 1 | 4 8 16 1
-----------
2 is the most likely option
followed by: 4 8 16 1 | 4 8 16 1 | 4 8 16 1
-----------
4 is the most likely option
followed by: 2 8 1 16 | 2 8 16 1 | 2 8 16 1
-----------
2 is the most likely option
followed by: 4 8 16 1 | 4 8 16 32 | 4 8 16 32

[Nachtrag2]
flush sieht sauber aus...

Endorphine
2003-03-20, 00:09:41
Originally posted by Achill
evtl. sollte man sich gleich auf flush einigen? OK, dann ab jetzt nur noch flushing-Werte bei R300-Karten, es sei denn, zecki will was andres :) :bäh:

/Edit:
Solange die Tilingwerte beim 256-Bit Speicheranbindungs-R300 bei buffer swapping teilweise eine Art Roulette sind würde ich dabei bleiben, dass wir uns wirklich auf flushing einigen, es sei denn, buffer swapping ist wirklich nötig =)

zeckensack
2003-03-20, 00:22:11
Originally posted by Endorphine
OK, dann ab jetzt nur noch flushing-Werte bei R300-Karten, es sei denn, zecki will was andres :) :bäh:
Hrrrr :D

Vielleicht könnte ein mathematisch begabter jemand mir mal erzählen, mit welcher Sorte Funktion ich eine solche Meßreihe annähern kann (zwecks passender Interpolation)
Ich habe 'Funktionswerte' von nicht-Primzahlen mal weggelassen, denn das sind vermehrt die Ausreißer, die es zu finden gilt

f(1) = 5142.54
f(2) = 11979.2 <= Obacht, weicht möglicherweise von der gesuchten Kurve ab
f(3) = 17029.7
f(5) = 26151.8
f(7) = 34041.8
f(11)= 37468.3
f(13)= 43822.3
f(17)= 43293.7
f(19)= 48196.5
f(23)= 58745.9
f(29)= 58616.9
f(31)= 51981.1
f(37)= 62513
f(41)= 60063.8
f(43)= 62628
f(47)= 68898.1
f(53)= 66132.2
f(59)= 66947
f(61)= 67919.5


Das wäre im Moment das dringendste ;)

zeckensack
2003-03-20, 00:27:57
Originally posted by Endorphine
/Edit:
Solange die Tilingwerte beim 256-Bit Speicheranbindungs-R300 bei buffer swapping teilweise eine Art Roulette sind würde ich dabei bleiben, dass wir uns wirklich auf flushing einigen, es sei denn, buffer swapping ist wirklich nötig =) Flushing ist besser. Swaps braucht man nur für Geforces, sonst dauert der Tiling-Test schonmal fünf Minuten ... ich konnt's auch erst nicht glauben als ich das gesehen habe :devil:
Klarer Fall von 'rasend cleverer Treiber' *eg*

Achill
2003-03-20, 00:39:12
poste mal bitte noch f(2) ...

Endorphine
2003-03-20, 00:39:47
Originally posted by zeckensack
Flushing ist besser. Swaps braucht man nur für Geforces, sonst dauert der Tiling-Test schonmal fünf Minuten ... ich konnt's auch erst nicht glauben als ich das gesehen habe :devil:
Klarer Fall von 'rasend cleverer Treiber' *eg* Sollte es wirklich mal einen Fall geben wo ATI-Treiber denen von nVidia überlegen sind? Hier wird gerade Geschichte geschrieben :o :naughty:

StefanV
2003-03-20, 00:41:39
Originally posted by Endorphine
Sollte es wirklich mal einen Fall geben wo ATI-Treiber denen von nVidia überlegen sind? Hier wird gerade Geschichte geschrieben :o :naughty:

Starte mal MGAs Reef Demo, da läuft auch nicht viel mit G-Forces ;)

Quasar
2003-03-20, 00:44:13
Wo kann ich das herunterladen?

StefanV
2003-03-20, 00:46:48
Originally posted by Quasar
Wo kann ich das herunterladen?

Matrox? (http://developer.matrox.com/details.cfm?CFID=667528&CFTOKEN=64659423&s=tech&i=108)

zeckensack
2003-03-20, 00:47:13
Originally posted by Achill
poste mal bitte noch f(2) ... Ich hab's oben reineditiert. Die Zahl ist aber höchstwahrscheinlich nicht Teil der gesuchten Kurve.

StefanV
2003-03-20, 00:49:11
hm, bin ich der einzige, der sich 'etwas' über die Voodoo5 Werte Wundert ?? :|

Quasar
2003-03-20, 00:50:35
Originally posted by Stefan Payne


Matrox? (http://developer.matrox.com/details.cfm?CFID=667528&CFTOKEN=64659423&s=tech&i=108)

File Not Found
The requested URL /content/lev1/zip/ReefDemo.zip was not found on this server.

Diese proprietäre Techdemo war wohl eher aus Versehen öffentlich zugänglich...

Endorphine
2003-03-20, 00:52:48
Originally posted by Stefan Payne


Matrox? (http://developer.matrox.com/details.cfm?CFID=667528&CFTOKEN=64659423&s=tech&i=108)
"The requested URL /content/lev1/zip/ReefDemo.zip was not found on this server." :P ;)

Techdemos sind auch ein IMO denkbar ungeeignetes Mittel zum Vergleich der Treiberqualität. ATI-Demos laufen nur auf ATI-Karten, nV-Demos nur auf Karten mit GPU von nVidia. Einzig und allein der Fablemark ist eine Techdemo die lupenrein DX-standardkonform ( :naughty: ) zu sein scheint...

StefanV
2003-03-20, 00:53:51
Originally posted by Quasar


File Not Found
The requested URL /content/lev1/zip/ReefDemo.zip was not found on this server.

Diese proprietäre Techdemo war wohl eher aus Versehen öffentlich zugänglich...

schau mal in diesen (http://forum-3dcenter.de/vbulletin/showthread.php?s=&threadid=60680) Thread, vielleicht gibts da 'nen Link...

Oder du 'organisierst' dir eine Parhelia zum testen ^^

Frank
2003-03-20, 00:55:08
Originally posted by zeckensack

Hrrrr :D

Vielleicht könnte ein mathematisch begabter jemand mir mal erzählen, mit welcher Sorte Funktion ich eine solche Meßreihe annähern kann (zwecks passender Interpolation)
Ich habe 'Funktionswerte' von nicht-Primzahlen mal weggelassen, denn das sind vermehrt die Ausreißer, die es zu finden gilt

Meistens wohl mit einer normalen polynomfunktion. Kommt bloß drauf an welchen Grad du haben willst - wohl linear meist - und wie interpoliert werden soll. Ob du die senkrechten, waagerechten oder senkrechten Abstände zu der Kurve von den einzelnen Punkten aus minimieren willst.

Endorphine
2003-03-20, 00:56:49
Originally posted by Stefan Payne


schau mal in diesen (http://forum-3dcenter.de/vbulletin/showthread.php?s=&threadid=60680) Thread, vielleicht gibts da 'nen Link...

Oder du 'organisierst' dir eine Parhelia zum testen ^^ Auch dort nur wieder:
The requested URL /reef/ReefDemo.zip was not found on this server.

p.s. Zufälle gibt's - man könnte fast an Gedankenübertragung denken:
http://boards.turtled.com/topic.html?id=374985

zeckensack
2003-03-20, 01:15:16
Oh, sorry, das habe ich gerade erst gesehen :(
Originally posted by Achill
Zum Test...

Da ich nicht genau weis wie Tile funktionieren, aber dein Algorithmus verstehe, eine frage ob man es so interpretieren kann:

Bei einer bestimmten Pixelbreite (x) eines Streifen greift das Tiling besonders gut.

Dadurch erhöht sich die Füllrate bzw. wird max. ausgeschöpft. Weicht die Streifenbreite um x+/-1 ab, so ist das Tiling nicht mehr so effektiv - geringere füllrate.Ja. Beispiel: Ein Chip habe 8x8-Tiles. Wenn er 9x8 Pixel zeichnen soll, muß er zwei Tiles beschreiben, was zu einem Performanceeinbruch führen sollte. Bei 7x8 das gleiche, die Speicheranbindung kann nicht optimal ausgenutzt werden, weil 'Fülldaten' übertragen werden müssen. So weit die Theorie.

Durch diesen Effekt ermittelt man für x nach 2a) einen zu niedrigen wert.

Dies bekommt man aber sofort bei der Auswertung mit, ist es der grund x-wert für ein tile, so sind auch alle vielfachen höher als erwartet - und da alle vielfachen miteinander multipliziert werden sollte der höchste wert heraus kommen.

Untersucht man einen anderen x-Wert, der größer als der x-Grundwert ist aber einvielfaches und somit im ersten Augenblick als möglicher Tilewert in frage kommt, wird er trotzdem raus fliegen, weil seine vielfachen evtl. nicht alle vielfachen vom wirklichen x-Wert sind und es weniger vielfache gibt die multiplziert werden können.Quasi. Bsp, stark vereinfachte Zahlen:
1: 100
2: 200
3: 150
4: 300
5: 220
6: 250
7: 280
8: 350

2 ist gut.
Aber 4 ist besser.
6 hebt sich nicht großartig von den Nachbarn ab, was aber sollte wenn 2 die Tilegröße wäre. Das ganze wird durch Meßschwankungen und die ungewisse Kurvenform (die je nach Chip auch stark unterschiedlich ist) sehr kompliziert.


Hier stellt sich mir jetzt eine frage aufgrund meines zu geringen Wissens über Tiles.

Nehmen wir an, x=1 und x=3 sind nicht die idealen Tilewerte, somit gibt es dort schlechte Füllwerte.
Nun ist x=2 schon etwas optimal, die relative Füllrate liegt nach 2a) über eins.
Aber durch einen internen Trick ist wieder rum x=4 besser als x=2 für den GPU, jedoch ergibt sich nicht eine proportionale Erhöhung der Füllrate (im Verhältnis wie es besser ist) sondern eine etwas geminderte Füllrate (Verlust) - so würde in dem model x=4 schlechter abschneiden als x=2, obwohl es besser ist.

Wäre so eine Technik denkbar oder geht dieser Fall nicht, weil diese Technik nicht möglich ist? Die Einordnung der Füllrate in 'gut' oder 'schlecht' erfolgt immer im Verhältnis zu den direkten Nachbarn.

Die Füllrate bei Größe 16 wird mit der von Größe 17 (und neuerdings auch 15) verglichen, und zwar durch einfache Division. Ist sie höher, ergibt das >1, ist sie kleiner, dann <1.
Durch die Multiplikation bildet sich dann eine Art 'Mehrheitswillen'.

zeckensack
2003-03-20, 02:48:02
Originally posted by Frank

Meistens wohl mit einer normalen polynomfunktion. Kommt bloß drauf an welchen Grad du haben willst - wohl linear meist - und wie interpoliert werden soll. Ob du die senkrechten, waagerechten oder senkrechten Abstände zu der Kurve von den einzelnen Punkten aus minimieren willst. Nach einigem Grübeln bin ich darauf gekommen, daß das eine lineare Funktion mit einer Art Sättigung ist.

Ich hab's jetzt nochmal komplett umgeschmissen (zum vierten Mal oder so), und habe jetzt endlich etwas gefunden, das sehr angenehm zu analysieren ist:
-----------
64 - 2266.840820
32 - 2267.532227
16 - 2267.734131
8 - 2267.550537
4 - 2043.409424
2 - 2046.407715
1 - 2043.265991

-----------
64 - 2475.249023
32 - 2475.189453
16 - 2475.254883
8 - 2475.215820
4 - 2473.312988
2 - 2473.485840
1 - 2402.652100

Schick, gell? =)

Quasar
2003-03-20, 03:26:15
ArchMark 0.10.03alpha
Driver Xabre VGA / MMX/SSE2 /AGP v1.3.0
Resolution 1024x768 @ 71.75Hz
Method Flush
Timer 601.363 MHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 3.318 GB/s
Color 12.419 MB/s
ZAndStencil 1.772 GB/s
Z 17.588 GB/s
Stencil 443.074 MB/s

Draw 6.588 GB/s
BurnedByRAMDAC 240.759 MB/s
Physical 6.829 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 4
Height 2

----in color buffer-----------------------------
Width 4
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 858.043 MPix/s
Z 997.379 MPix/s
ColorAndZ 847.486 MPix/s
ZTest 446.827 MPix/s
ZCullLEqual 859.097 MPix/s
ZCullGEqual 870.512 MPix/s
ZCullEqual 889.410 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 997.306 MPix/s
Z 996.709 MPix/s
ColorAndZ 996.527 MPix/s
ZTest 851.269 MPix/s
ZCullLEqual 982.966 MPix/s
ZCullGEqual 983.016 MPix/s
ZCullEqual 984.209 MPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 981.863 MPix/s
2 1.805 GPix/s???

----Unfiltered----------------------------------
1 1.013 GPix/s
2 520.518 MPix/s

----Bilinear filter-----------------------------
1 1.014 GPix/s
2 516.783 MPix/s

----Trilinear filter----------------------------
1 691.804 MPix/s
2 297.763 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 10.465 MTris/s
List 4.297 MTris/s
Clip 4.298 MTris/s

--Vertex shading speed--------------------------
LightD1 8.759 MVerts/s
LightP1 8.751 MVerts/s
LightP8 8.549 MVerts/s


Precision
Mode RGBA8888 Z16 S0
--fraction bits---------------------------------
ATest 8
Combiner 8
Color 8

zeckensack
2003-03-20, 03:58:59
Thx, Quasar :)

Ich hab das '???' gesehen, ich schau morgen nochmal nach was das sein kann. Jetzt geh' ich erstmal penn0rn ;)

loewe
2003-03-20, 08:32:27
Hallo, noch mal mit der 0.10.03a die KYRO I

KYRO I @ 115 MHz

ArchMark 0.10.03alpha
Driver PowerVR KYRO v1.2.1
Resolution 1024x768 @ 61.90Hz
Method Flush
Timer 866.329 MHz

Bandwidth
Mode RGBA8888 Z32 S4
--bandwidth-------------------------------------
----available to buffer clears------------------
All 1.462 GB/s
Color 689.647 MB/s
ZAndStencil 413.303 MB/s
Z 378.019 MB/s
Stencil 45.880 MB/s

Draw 1.339 GB/s
BurnedByRAMDAC 192.753 MB/s
Physical 1.532 GB/s


Tiling
Mode RGBA8888 Z32 S4
--preferred block size--------------------------
----updating all buffers------------------------
Width 1
Height 1

----in color buffer-----------------------------
Width 1
Height 2

----in depth buffer-----------------------------
Width 1
Height 1

----in stencil buffer---------------------------
Width 1
Height 1



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z32 S4
Color 172.254 MPix/s
Z 90.994 MPix/s
ColorAndZ 163.241 MPix/s
ZTest 119.328 MPix/s
ZCullLEqual 167.380 MPix/s
ZCullGEqual 91.675 MPix/s
ZCullEqual 92.417 MPix/s

--16 bits---------------------------------------
Mode RGBA8888 Z16 S0
Color 224.614 MPix/s
Z 163.403 MPix/s
ColorAndZ 223.317 MPix/s
ZTest 183.916 MPix/s
ZCullLEqual 226.415 MPix/s
ZCullGEqual 164.744 MPix/s
ZCullEqual 157.373 MPix/s


Texturing
Mode RGBA8888 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 231.046 MPix/s
2 88.159 MPix/s
3 39.059 MPix/s
4 13.308 MPix/s

----Unfiltered----------------------------------
1 224.596 MPix/s
2 114.085 MPix/s
3 76.301 MPix/s
4 57.326 MPix/s

----Bilinear filter-----------------------------
1 224.966 MPix/s
2 114.274 MPix/s
3 76.331 MPix/s
4 57.339 MPix/s

----Trilinear filter----------------------------
1 118.526 MPix/s
2 61.672 MPix/s
3 42.483 MPix/s
4 32.789 MPix/s

----Max anisotropy (2)--------------------------
1 35.363 MPix/s
2 20.566 MPix/s
3 15.356 MPix/s
4 11.521 MPix/s



Geometry
Mode RGBA8888 Z0 S0
--Plain vertices--------------------------------
Fan 746.950 kTris/s
List 370.501 kTris/s
Clip 370.298 kTris/s

--Vertex shading speed--------------------------
LightD1 1.119 MVerts/s
LightP1 1.111 MVerts/s
LightP8 448.582 kVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
ATest 8
Combiner 10
Color 10



Das Tiling ist nun überhaupt nicht zu gebrauchen. 1x1 Tiles sind ja nun auch gerade die triviale Lösung, die kann man doch eigentlich weglassen.

Achill
2003-03-20, 11:11:30
Ich war gestern ca. 0.30 einfach zu müde und hab schon von guten und schlechten Werten geschrieben ... :bonk:

Noch einmal zur alten Methode, Vorschlag...

Unser vereinfachtes Bsp.:

1: 100 / 2: 200 / 3: 150 / 4: 300 / 5: 220 / 6: 250 / 7: 280 / 8: 350 ...

ich nehme an, das es sich für x>8 mit der gleichen Ordnung weiter verhält, die Werte für 5 und 7 passen eigentlich nicht so richtig. Es wäre hilfreich eine komplette Messreihe zu besitzen.

Hat man dein alten Algorithmus im Hinterkopf, so würde folgendes passieren. Es würde für jedes x (Breite des Streifen in Pixels) die Auswertung von x im Verhältnis zu ((x-1)+(x+1))/2 erfolgen.

(Zwischenfrage: Wie handhabst du x=1 und x=64?)

Wenn man jetzt das Verhältnis von einem x aus [1,64] der N nimmt und dies mit den Verhältnissen aller Vielfachen von X multipliziert, kann folgendes passieren:

Da für x=2 doppelt so viele Vielfache wie x=4 oder vierfach so viele wie x=8 hat, kann das verfahren schnell ein zu kleines x bevorzugen.

Damit im verfahren x=2 und x=4 gleich gut abschneiden, müsste folgendes gelten:

Y = Gesamtverhältnis
X1...X32 – Verhältniswerte von x=2 und aller Vielfachen.
Z1...Z16 – Verhältniswerte von x=4 und aller Vielfachen.

Y= (X1+X2+...+X31+X32) = (Z1+Z2+...+Z15+Z16)

Nimmt man jetzt wegen der Einfachheit an und damit es nicht zu kompliziert wird, dass x1=x2=...=x32 und z1=z2=...=z16 gleiche oder stark ähnliche Verhältnisse sind, so ergibt sich...

32*x1 = 16*z1 => z1 = 2*x1

Das Verhältnis für x = 4 (Pixel) und die Verhältnisse alle Vielfachen von 4, müssten doppelt so hoch sein als der Verhältniswert von x = 2 und die Werte der Vielfachen von 2.
Ich denke das ist so gut wie unmöglichen – wenn sich unser Bsp. auf die Wirklichkeit übertragen läst.

Was könnte man machen? Leider fehlt mir eine Messreihe und somit bewege ich mich jetzt auf unsicheren Grund .. ;)

Die Idee finde ich in sich sehr gut, ich würde aber auch den Durchschnitt von den addierten Relativwerten bilden und diesen vergleichen, damit würde das Verfahren von sich aus keine kleineren Tiles bevorzugen.

Der max. x-wert (breite,höhe) sollte evtl. auf 128 angehobn werden, damit bekommt man auch noch für x=32 vier Werte und alg. sollte es genauer werden.

Alles über x=32 sind eh keine sinnfollen tiles mehr, für x>32 sollten die Verhältniswerte nur noch als Rechenwerte für die Vielfachen von x <= 32 genutz werden (finde ich).

Mehr später... muss erst mal schluss machen.

zeckensack
2003-03-20, 16:45:49
Achill,
zu spät. Ich habe den Algo komplett weggeworfen ;)

Schaumer mal
0.10.04
nächster Versuch für's Tiling - komplett neu, ignoriert jetzt btw den 'swap buffers' Haken. Es wird in diesem Test immer mit Flush gearbeitet
Anti-Cheat-Maßnahmen im Präzisionstest. Wahrscheinlich immer noch buggy (jedenfalls glaube ich nicht so recht an meine Ergebnisse (http://home.t-online.de/home/zsack/archmark/results.htm))

loewe
2003-03-20, 16:54:47
;D

KYRO II @ 185 MHz

ArchMark 0.10.04alpha
Driver PowerVR KYRO v1.2.1
Resolution 1024x768 @ 62.44Hz
Method Flush
Timer 1.537 GHz

Bandwidth
Mode RGBA8888 Z32 S4
--bandwidth-------------------------------------
----available to buffer clears------------------
All 2.468 GB/s
Color 2.126 GB/s
ZAndStencil 707.652 MB/s
Z 646.715 MB/s
Stencil 78.266 MB/s

Draw 2.225 GB/s
BurnedByRAMDAC 195.461 MB/s
Physical 2.421 GB/s


Tiling
Mode RGBA8888 Z32 S4
--preferred block size--------------------------
----updating all buffers------------------------
Width 32
Height 16

----in color buffer-----------------------------
Width 32
Height 16

----in depth buffer-----------------------------
Width 64
Height 64

----in stencil buffer---------------------------
Width 64
Height 64



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z32 S4
Color 284.860 MPix/s
Z 154.234 MPix/s
ColorAndZ 281.477 MPix/s
ZTest 199.249 MPix/s
ZCullLEqual 285.982 MPix/s
ZCullGEqual 155.305 MPix/s
ZCullEqual 154.515 MPix/s

--16 bits---------------------------------------
Mode RGBA8888 Z16 S0
Color 358.588 MPix/s
Z 268.304 MPix/s
ColorAndZ 359.869 MPix/s
ZTest 302.586 MPix/s
ZCullLEqual 362.781 MPix/s
ZCullGEqual 269.663 MPix/s
ZCullEqual 261.999 MPix/s


Texturing
Mode RGBA8888 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 366.937 MPix/s
2 155.718 MPix/s
3 83.956 MPix/s
4 48.065 MPix/s

----Unfiltered----------------------------------
1 361.266 MPix/s
2 182.306 MPix/s
3 121.847 MPix/s
4 91.484 MPix/s

----Bilinear filter-----------------------------
1 361.278 MPix/s
2 182.037 MPix/s
3 121.669 MPix/s
4 91.483 MPix/s

----Trilinear filter----------------------------
1 186.458 MPix/s
2 95.896 MPix/s
3 65.449 MPix/s
4 50.004 MPix/s

----Max anisotropy (2)--------------------------
1 52.557 MPix/s
2 29.237 MPix/s
3 21.914 MPix/s
4 16.434 MPix/s



Geometry
Mode RGBA8888 Z0 S0
--Plain vertices--------------------------------
Fan 1.231 MTris/s
List 613.010 kTris/s
Clip 613.102 kTris/s

--Vertex shading speed--------------------------
LightD1 1.845 MVerts/s
LightP1 1.839 MVerts/s
LightP8 1.069 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 8
Combiner 6
Interpolator 10



Sehr schön!!!

Wie testest du jetzt das Tiling? Ich hätte gesagt das alte Verfahren kann nicht funktionieren!

Quasar
2003-03-20, 16:59:33
Die kommen mir auch komisch vor....

ArchMark 0.10.04alpha
Driver Matrox G400 v1.1.3 May 17 2002
Resolution 1024x768 @ ???Hz
Method Flush
Timer 1.340 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 1.329 GB/s
Color 2.018 GB/s
ZAndStencil 996.936 MB/s
Z 1.416 GB/s
Stencil 467.081 MB/s

Draw 1.544 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 1.812 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 2
Height 8

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 8



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 248.623 MPix/s
Z 248.648 MPix/s
ColorAndZ 247.868 MPix/s
ZTest 156.594 MPix/s
ZCullLEqual 193.732 MPix/s
ZCullGEqual 193.209 MPix/s
ZCullEqual 219.802 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z15 S1
Color 250.365 MPix/s
Z 250.291 MPix/s
ColorAndZ 250.476 MPix/s
ZTest 243.309 MPix/s
ZCullLEqual 246.284 MPix/s
ZCullGEqual 246.260 MPix/s
ZCullEqual 247.788 MPix/s


Texturing
Mode RGBA5650 Z15 S1
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 249.067 MPix/s
2 124.920 MPix/s

----Unfiltered----------------------------------
1 249.232 MPix/s
2 124.926 MPix/s

----Bilinear filter-----------------------------
1 249.232 MPix/s
2 124.925 MPix/s

----Trilinear filter----------------------------
1 136.143 MPix/s
2 68.205 MPix/s



Geometry
Mode RGBA5650 Z15 S1
--Plain vertices--------------------------------
Fan 8.866 MTris/s
List 4.773 MTris/s
Clip 972.800 kTris/s

--Vertex shading speed--------------------------
LightD1 9.861 MVerts/s
LightP1 10.102 MVerts/s
LightP8 9.819 MVerts/s


Precision
Mode RGBA8888 Z15 S1
--fraction bits---------------------------------
AlphaTest 9
Combiner 2
Interpolator 6

StefanV
2003-03-20, 17:00:25
Originally posted by zeckensack
Achill,
zu spät. Ich habe den Algo komplett weggeworfen ;)

Schaumer mal
0.10.04
nächster Versuch für's Tiling - komplett neu, ignoriert jetzt btw den 'swap buffers' Haken. Es wird in diesem Test immer mit Flush gearbeitet
Anti-Cheat-Maßnahmen im Präzisionstest. Wahrscheinlich immer noch buggy (jedenfalls glaube ich nicht so recht an meine Ergebnisse (http://home.t-online.de/home/zsack/archmark/results.htm))


Welche Karten hättest du gern von mir ? ;)

GF3, RAdeon 9000, Savage 2000, Voodoo5, Voodoo3, Savage 4, Prosavage DDR, (RAGE PRO geht irgendwie nicht) ;)

StefanV
2003-03-20, 17:04:49
G400/16SD
ArchMark 0.10.04alpha
Driver Matrox G400 v1.1.3 Feb 7 2003
Resolution 1024x768 @ ???Hz
Method Flush
Timer 1.470 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 787.591 MB/s
Color 2.018 GB/s
ZAndStencil 530.883 MB/s
Z 765.702 MB/s
Stencil 234.177 MB/s

Draw 1.396 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 1.664 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 2
Height 16

----in color buffer-----------------------------
Width 2
Height 4

----in depth buffer-----------------------------
Width 32
Height 2

----in stencil buffer---------------------------
Width 4
Height 4



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 248.422 MPix/s
Z 228.822 MPix/s
ColorAndZ 248.634 MPix/s
ZTest 138.845 MPix/s
ZCullLEqual 182.352 MPix/s
ZCullGEqual 181.914 MPix/s
ZCullEqual 216.093 MPix/s

--16 bits---------------------------------------
Mode RGBA8880 Z15 S1
Color 241.892 MPix/s
Z 241.955 MPix/s
ColorAndZ 238.988 MPix/s
ZTest 157.338 MPix/s
ZCullLEqual 206.657 MPix/s
ZCullGEqual 204.849 MPix/s
ZCullEqual 245.272 MPix/s


Texturing
Mode RGBA5650 Z15 S1
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 249.207 MPix/s
2 122.313 MPix/s

----Unfiltered----------------------------------
1 249.172 MPix/s
2 124.677 MPix/s

----Bilinear filter-----------------------------
1 249.282 MPix/s
2 124.914 MPix/s

----Trilinear filter----------------------------
1 135.055 MPix/s
2 67.151 MPix/s



Geometry
Mode RGBA5650 Z15 S1
--Plain vertices--------------------------------
Fan 9.755 MTris/s
List 5.216 MTris/s
Clip 1.390 MTris/s

--Vertex shading speed--------------------------
LightD1 14.533 MVerts/s
LightP1 14.430 MVerts/s
LightP8 14.308 MVerts/s


Precision
Error no pixel format

StefanV
2003-03-20, 17:11:58
also irgendwas stimmt da nicht :|
(G550 Dual DVI)

ArchMark 0.10.04alpha
Driver Matrox G400 v1.1.3 Feb 7 2003
Resolution 1024x768 @ ???Hz
Method Flush
Timer 848.350 MHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 1.090 GB/s
Color 1.666 GB/s
ZAndStencil 820.716 MB/s
Z 1.152 GB/s
Stencil 380.617 MB/s

Draw 1.215 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 1.482 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 2
Height none

----in color buffer-----------------------------
Width 2
Height none

----in depth buffer-----------------------------
Width 2
Height 16

----in stencil buffer---------------------------
Width 2
Height 16


Precision
Error no pixel format

zeckensack
2003-03-20, 17:27:17
Originally posted by loewe
Sehr schön!!!

Wie testest du jetzt das Tiling? Ich hätte gesagt das alte Verfahren kann nicht funktionieren! Die merkwürdig steigende, und dann in die Sättigung fahrende Füllratenkurve bei variabler Blockgröße hat mir ja ziemlich die Analyse versaut.

Ergo sind die Blöcke jetzt immer gleich groß, und es wird nur noch die Position varriiert. Dadurch ist die benötigte Füllrate auf einem ideal arbeitenden Chip immer gleich groß. Unterhalb des 'guten' Alignments fällt der Wert dann ab. ZB mal ein Ergebnis einer Radeon 8500LE ('frames per second'):
X-Richtung
64 - 2266.854004
32 - 2267.526611
16 - 2267.726563
8 - 2267.575439
4 - 2043.393799
2 - 2046.411499
1 - 2043.258423

Y-Richtung
64 - 2475.273926
32 - 2475.239502
16 - 2475.400635
8 - 2475.179688
4 - 2473.274658
2 - 2474.461182
1 - 2402.690430
Wie man sieht gibt's da jeweils eine relativ ausgeprägte Stufe, allerdings ist der absolute Effizienzverlust sehr gering. Deswegen muß die Messung sehr präzise sein (jetzt 1/4 Sekunde/Schritt statt vorher 1/16 Sekunde/Schritt; nur noch Flush). An der Analyse muß ich noch arbeiten, sie sucht im Moment buchstäblich irgendwas, woran sie sich aufhängen kann.
Bei der G400 zB ist das aber nicht sinnvoll, ich muß noch eine Schwelle einarbeiten, unterhalb derer dann gesagt wird "hier ist nichts".

Beispiel 2, Gf2MX
X-Richtung
64 - 789.528076
32 - 796.812927
16 - 796.979248
8 - 797.035278
4 - 797.159424
2 - 788.496704 ( -1.09% )
1 - 770.060303 ( -2.34% )

Y-Richtung
64 - 807.122498
32 - 807.092529
16 - 807.208130
8 - 806.688354
4 - 806.633972
2 - 806.693359
1 - 785.397888
Das ist schon schwieriger. Intuitiv würde ich sagen 4x2 ist richtig auf der MX, denn der Abfall in Y ist auf jeden Fall signifikant (eventuell Framebuffer-Swizzling). Der größte punktuelle Verlust tritt aber bei 2x2 ein, deswegen wird dieses als Ergebnis ausgeworfen.
Ich bräuchte jetzt eine verlässliche (mathematische) Methode, um diese sehr kleinen 'erwünschten' Abweichungen von den Meßschwankungen zuverlässig zu isolieren.

Auch der irgendwie geringe Wert bei 64 ist kein Meßfehler, sondern absolut reproduzierbar.

Lange Rede, kurzer Sinn, das Verfahren funzt, ist aber einerseits noch zu empfindlich, andererseits unterbewertet es signifikante, aber zu kleine Abweichungen.

zeckensack
2003-03-20, 17:31:04
Originally posted by Stefan Payne
also irgendwas stimmt da nicht :|Das sehe ich auch so. Er scheint Probleme zu haben, auf 'richtige' 16bit-Modi zu schalten. Nochmal zur Erinnerung:
Es wird immer der primäre Monitor umgeschaltet, egal welche Karte diesen antreibt. Dort wird auch das Fenster* erzeugt. Hast du an dem Rechner mehrere Montiorausgänge und Grafikkarten aktiviert und/oder belegt?

*das bzw die Fenster, die für's Rendering benutzt werden. Wo der Optionsdialog aufgeklappt wird weiß nur Windows ...

zeckensack
2003-03-20, 17:35:48
Originally posted by Stefan Payne
hm, bin ich der einzige, der sich 'etwas' über die Voodoo5 Werte Wundert ?? :| /me wundert sich fast über alle deine Werte :D

Erzähl doch mal was du da angestellt hast. Die Werte sind viel zu hoch.

zeckensack
2003-03-20, 17:37:54
Originally posted by Stefan Payne
@Zecke

Kannst du einen Simplen Bi/Tri 'Tester' einbauen ? ;)

also 2 Bilder, die man vergleichen kann um zu beurteilen, ob Tri funzt oder nicht ;) Das ist ein ganz guter Plan, ich habe aber mittlerweile einen besseren:
Ob Trilinear funktioniert, kann man auch messen :naughty:

Also nicht zwingend anhand der Performance, sondern durch Zurücklesen und Untersuchen des Framebuffer-Inhalts.

StefanV
2003-03-20, 17:39:54
Originally posted by zeckensack
Das sehe ich auch so. Er scheint Probleme zu haben, auf 'richtige' 16bit-Modi zu schalten. Nochmal zur Erinnerung:
Es wird immer der primäre Monitor umgeschaltet, egal welche Karte diesen antreibt. Dort wird auch das Fenster erzeugt. Hast du an dem Rechner mehrere Montiorausgänge und Grafikkarten aktiviert und/oder belegt?

bei der G400/16SD nein, bei der G550 hab ich einen Fernseher im DVD MAX Mode.

Bei beiden ist nur einer aktiv.

DH hab ich zwar aktiviert aber der Monitor ist ausgegraut...

Quasar
2003-03-20, 17:41:10
So, ich habe mal 20 Minuten damit verbracht, meine drei Ergebnisse etwas übersichtlich zu gestalten. Ich hoffe, das macht den Thread etwas lesbarer, auch wenn mir dadurch 2 Postings verloren gehen:

ArchMark 0.10.04alpha
Driver G400 v1.1.3 17/5/02 /R9500 v1.3.3604 /Xabre v1.3.0
Resolution 1024x768 @ ???Hz
Method Flush
Timer 1.340 GHz/2.524 GHz/601.360 MHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth----------------------------------------------
----available to buffer clears---------------------------
All 1.329 GB/s /8.469 GB/s /3.318 GB/s
Color 2.018 GB/s /4.301 GB/s /12.425 MB/s
ZAndStencil 996.936 MB/s /139.150 GB/s /1.772 GB/s
Z 1.416 GB/s /105.414 GB/s /17.588 GB/s
Stencil 467.081 MB/s /1.018 GB/s /443.072 MB/s
Draw 1.544 GB/s /8.178 GB/s /6.592 GB/s
BurnedByRAMDAC 267.387 MB/s /267.387 MB/s /237.992 MB/s
Physical 1.812 GB/s /8.445 GB/s /6.830 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size-----------------------------------
----updating all buffers---------------------------------
Width 2 /4 /64
Height 8 /4 /2

----in color buffer--------------------------------------
Width 2 /4 /4
Height 2 /4 /4

----in depth buffer--------------------------------------
Width 2 /2 /2
Height 2 /2 /2

----in stencil buffer------------------------------------
Width 2 /2 /2
Height 8 /2 /2



Fillrate
--32 bits------------------------------------------------
Mode RGBA8888 Z24 S8
Color 248.623 MPix/s /1.077 GPix/s /858.447 MPix/s
Z 248.648 MPix/s /1.095 GPix/s /997.337 MPix/s
ColorAndZ 247.868 MPix/s /1.077 GPix/s /847.734 MPix/s
ZTest 156.594 MPix/s /758.777 MPix/s /446.790 MPix/s
ZCullLEqual 193.732 MPix/s /946.093 MPix/s /859.258 MPix/s
ZCullGEqual 193.209 MPix/s /945.498 MPix/s /870.783 MPix/s
ZCullEqual 219.802 MPix/s /1.090 GPix/s /888.925 MPix/s

--16 bits------------------------------------------------
Mode RGBA5650 Z15 S1
Color 250.365 MPix/s /1.088 GPix/s /996.347 MPix/s
Z 250.291 MPix/s /1.095 GPix/s /992.691 MPix/s
ColorAndZ 250.476 MPix/s /1.089 GPix/s /997.154 MPix/s
ZTest 243.309 MPix/s /845.954 MPix/s /851.135 MPix/s
ZCullLEqual 246.284 MPix/s /988.537 MPix/s /981.135 MPix/s
ZCullGEqual 246.260 MPix/s /988.127 MPix/s /983.531 MPix/s
ZCullEqual 247.788 MPix/s /1.090 GPix/s /984.397 MPix/s


Texturing
Mode RGBA5650 Z15 S1
--Textured fillrate--------------------------------------
----Peak-------------------------------------------------
1 249.067 MPix/s 1.085 GPix/s 968.893 MPix/s
2 124.920 MPix/s 548.479 MPix/s 1.679 GPix/s
3 366.362 MPix/s
4 275.023 MPix/s
5 220.117 MPix/s
6 183.521 MPix/s
7 157.358 MPix/s
8 137.740 MPix/s

----Unfiltered-------------------------------------------
1 249.232 MPix/s 1.087 GPix/s 1.014 GPix/s
2 124.926 MPix/s 548.675 MPix/s 513.367 MPix/s
3 366.484 MPix/s
4 275.100 MPix/s
5 220.208 MPix/s
6 183.577 MPix/s
7 157.387 MPix/s
8 137.763 MPix/s

----Bilinear filter--------------------------------------
1 249.232 MPix/s 1.087 GPix/s 1.014 GPix/s
2 124.925 MPix/s 548.699 MPix/s 509.946 MPix/s
3 366.435 MPix/s
4 275.123 MPix/s
5 220.206 MPix/s
6 183.574 MPix/s
7 157.370 MPix/s
8 137.769 MPix/s

----Trilinear filter-------------------------------------
1 136.143 MPix/s 544.206 MPix/s 691.864 MPix/s
2 68.205 MPix/s 273.116 MPix/s 294.914 MPix/s
3 182.326 MPix/s
4 136.807 MPix/s
5 109.498 MPix/s
6 91.252 MPix/s
7 78.234 MPix/s
8 68.464 MPix/s

----Max anisotropy (16)----------------------------------
1 271.288 MPix/s
2 135.850 MPix/s
3 90.602 MPix/s
4 67.973 MPix/s
5 54.380 MPix/s
6 45.325 MPix/s
7 38.851 MPix/s
8 33.999 MPix/s


Geometry
Mode RGBA5650 Z15 S1 Z16 S0 Z16 S0
--Plain vertices-----------------------------------------
Fan 8.866 MTris/s 50.523 MTr/s 10.261 MTris/s
List 4.773 MTris/s 34.913 MTr/s 4.468 MTris/s
Clip 972.800 kTris/s 2.110 MTr/s 4.463 MTris/s

--Vertex shading speed-----------------------------------
LightD1 9.861 MVerts/s 74.388 MV/s 9.090 MVerts/s
LightP1 10.102 MVerts/s 32.741 MV/s 9.087 MVerts/s
LightP8 9.819 MVerts/s 12.431 MV/s 8.868 MVerts/s


Precision
Mode RGBA8888 Z15 S1 Z24 S8 Z16 S0
--fraction bits------------------------------------------
AlphaTest 9 9 8
Combiner 2 6 2
Interpolator 6 10 6

StefanV
2003-03-20, 17:41:44
Originally posted by zeckensack
/me wundert sich fast über alle deine Werte :D

Erzähl doch mal was du da angestellt hast. Die Werte sind viel zu hoch.

1. hm, wenn dem so ist...

2. Karte eingebaut, Windows Treiber installiert, Archmark gestartet.

zeckensack
2003-03-20, 17:49:54
Originally posted by Stefan Payne


1. hm, wenn dem so ist...

2. Karte eingebaut, Windows Treiber installiert, Archmark gestartet.
Du hast Bandbreitenzahlen knapp über V5-6000-Niveau gemessen. Füllrate: dito. Ich dachte das sollte eine V5-5500 sein???

StefanV
2003-03-20, 18:07:18
Originally posted by zeckensack

Du hast Bandbreitenzahlen knapp über V5-6000-Niveau gemessen. Füllrate: dito. Ich dachte das sollte eine V5-5500 sein???

1. jap, genau das wundert mich auch 'etwas'

2. nein, das IST eine V5/5500

zeckensack
2003-03-20, 18:24:05
Quasar,
der Xabre-'Ausrutscher' war dann wohl ein einmaliger Ausreißer. Danke für die beispielhafte* Aufstellung :)

*im Sinne von "nachahmenswert"

Quasar
2003-03-20, 18:28:40
Originally posted by Quasar
ArchMark 0.10.04alpha
Driver G400 v1.1.3 17/5/02 /R9500 v1.3.3604 /Xabre v1.3.0
Texturing
--Textured fillrate--------------------------------------
----Peak-------------------------------------------------
1 249.067 MPix/s 1.085 GPix/s 968.893 MPix/s
2 124.920 MPix/s 548.479 MPix/s 1.679 GPix/s

----Unfiltered-------------------------------------------
1 249.232 MPix/s 1.087 GPix/s 1.014 GPix/s
2 124.926 MPix/s 548.675 MPix/s 513.367 MPix/s


----Bilinear filter--------------------------------------
1 249.232 MPix/s 1.087 GPix/s 1.014 GPix/s
2 124.925 MPix/s 548.699 MPix/s 509.946 MPix/s

----Trilinear filter-------------------------------------
1 136.143 MPix/s 544.206 MPix/s 691.864 MPix/s
2 68.205 MPix/s 273.116 MPix/s 294.914 MPix/s


Hm, also ich meine der "Ausrutscher" ist noch da..... (bin aber jetzt erstmal 'ne Weile offline und werde deswegen wohl eine oder zwei Revisionen überspringen ;) )

Was genau wird denn bei "Peak" gemessen? Vielleicht läßt sich das dadurch erklären.

zeckensack
2003-03-20, 18:43:14
Originally posted by Quasar
Hm, also ich meine der "Ausrutscher" ist noch da..... (bin aber jetzt erstmal 'ne Weile offline und werde deswegen wohl eine oder zwei Revisionen überspringen ;) )Oh, sorry, ja, Sir! :D
*augenreib*
Was genau wird denn bei "Peak" gemessen? Vielleicht läßt sich das dadurch erklären. 'Peak' bemalt ein Bildschirmfüllendes Rechteck mit einem einzelnen Textursample.
Der Filter der dabei zur Anwendung kommt ist GL_NEAREST_MIPMAP_NEAREST, was bilinearem Filter mit Pointsampling innerhalb der Mip-Ebenen entspricht. Dieser Filter ist nach allgemeinem Konsens der 'billigste'. Normales Point sampling ohne Mipmaps ist idR leicht langsamer, weil Texturcaches damit nicht gut klar kommen.

Über die theoretische Füllrate hinaus darf der Xabre aber auf keinen Fall kommen, ganz egal wie 'optimiert' der Filter ist :|

*bugsuch*

StefanV
2003-03-20, 19:01:04
Originally posted by zeckensack

Du hast Bandbreitenzahlen knapp über V5-6000-Niveau gemessen. Füllrate: dito. Ich dachte das sollte eine V5-5500 sein???

Ich glaube, ich zerleg meinen 2. Rechner nochmal und baue ihn ins ALDI Gehäuse ein, um weitere Tests mit der V5 zu machen...

ow
2003-03-20, 19:04:43
Originally posted by Stefan Payne

(RAGE PRO geht irgendwie nicht) ;)

Probiers mal in in 16Bit Farbtiefe. Der RagePro ICD unterstützt kein 32Bit.

StefanV
2003-03-20, 19:13:36
Originally posted by ow


Probiers mal in in 16Bit Farbtiefe. Der RagePro ICD unterstützt kein 32Bit.

Geht auch nicht, der Rage PRO Treiber lässt sich unter W2k nicht installieren (war die Installation, die so merkwürdige ERgebnisse mit der GF3 und Radeon geliefert hat ;))

ow
2003-03-20, 19:23:04
Neues GF4ti4200 Ergebnis / Flush:

ArchMark 0.10.04alpha
Driver GeForce4 Ti 4200/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 88.16Hz
Method Flush
Timer 1.470 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 12.057 GB/s
Color 7.651 GB/s
ZAndStencil 28.421 GB/s
Z 21.317 GB/s
Stencil 13.275 GB/s

Draw 9.094 GB/s
BurnedByRAMDAC 277.611 MB/s
Physical 9.372 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 2
Height 2

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 995.643 MPix/s
Z 995.628 MPix/s
ColorAndZ 995.637 MPix/s
ZTest 867.407 MPix/s
ZCullLEqual 1.943 GPix/s
ZCullGEqual 1.942 GPix/s
ZCullEqual 3.721 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 995.643 MPix/s
Z 995.642 MPix/s
ColorAndZ 995.642 MPix/s
ZTest 996.049 MPix/s
ZCullLEqual 1.960 GPix/s
ZCullGEqual 1.959 GPix/s
ZCullEqual 3.799 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 995.626 MPix/s
2 995.638 MPix/s
3 498.144 MPix/s
4 498.144 MPix/s

----Unfiltered----------------------------------
1 995.640 MPix/s
2 995.639 MPix/s
3 498.144 MPix/s
4 498.144 MPix/s

----Bilinear filter-----------------------------
1 995.640 MPix/s
2 995.640 MPix/s
3 498.145 MPix/s
4 498.144 MPix/s

----Trilinear filter----------------------------
1 995.638 MPix/s
2 498.145 MPix/s
3 332.097 MPix/s
4 249.073 MPix/s

----Max anisotropy (8)--------------------------
1 498.456 MPix/s
2 249.228 MPix/s
3 166.430 MPix/s
4 149.551 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 49.691 MTris/s
List 18.007 MTris/s
Clip 18.102 MTris/s

--Vertex shading speed--------------------------
LightD1 32.645 MVerts/s
LightP1 22.087 MVerts/s
LightP8 4.994 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 9
Combiner 6
Interpolator 10



Gnarf:

-----------
64 - 2480.278809
32 - 2481.642090
16 - 2481.635742
8 - 2481.338623
4 - 2481.672119
2 - 2482.057617
1 - 2408.894043

-----------
64 - 2491.072998
32 - 2491.061768
16 - 2491.058105
8 - 2491.080811
4 - 2490.787598
2 - 2491.666504
1 - 2418.136230

-----------
64 - 2481.694336
32 - 2481.674561
16 - 2481.669678
8 - 2481.670654
4 - 2481.665771
2 - 2482.064453
1 - 2408.889404

-----------
64 - 2491.044922
32 - 2491.088623
16 - 2491.091309
8 - 2491.075684
4 - 2491.076660
2 - 2491.671387
1 - 2417.389160

-----------
64 - 2474.555420
32 - 2481.673340
16 - 2481.677979
8 - 2481.652832
4 - 2481.653320
2 - 2481.861816
1 - 2408.887939

-----------
64 - 2491.076660
32 - 2491.083008
16 - 2491.064697
8 - 2491.083984
4 - 2472.148926
2 - 2491.474121
1 - 2418.124023

-----------
64 - 2481.609863
32 - 2481.703613
16 - 2481.674561
8 - 2481.668945
4 - 2481.673584
2 - 2482.052002
1 - 2408.896484

-----------
64 - 2491.061279
32 - 2491.084473
16 - 2491.059814
8 - 2490.870361
4 - 2490.465576
2 - 2491.476807
1 - 2418.129639

peanball
2003-03-20, 19:50:47
Hiho, ich hab das Archmark jetzt mal auf meinem Schleppi laufen lassen.
Der hat noch eine ATi Rage Mobility M1 drin... 8MB Ram :)
Archmark bestätigt, dass die Karte nichts kann!

Ohne Software Fallback:

ArchMark 0.10.04alpha
Driver: RagePRO v1.1.3
Resolution: 1024x768 @ 77.29Hz
Swapping buffers
647.187 MHz timer speed (should match your CPU clock)
Bandwidth
Error: no pixel format
Tiling
Error: no pixel format
Fillrate

32 bits
Error: no pixel format
16 bits
Mode: RGBA5650 Z16 S8
40.886 MPix/s color only
50.899 MPix/s depth only
51.049 MPix/s color and depth
34.015 MPix/s color and depth with depth test
33.131 MPix/s discardable by 'LEQUAL' depth test
37.439 MPix/s discardable by 'GEQUAL' depth test
37.614 MPix/s discardable by 'EQUAL' depth test
Texturing
Mode: RGBA5650 Z16 S8

Textured fillrate
Peak
46.362 MPix/s w 1 layers
Unfiltered
50.249 MPix/s w 1 layers
Bilinear filter
51.160 MPix/s w 1 layers
Trilinear filter
50.574 MPix/s w 1 layers
Geometry
Mode: RGBA5650 Z16 S8

Plain vertices
2.743 MTris/s as triangle fan
1.246 MTris/s as triangle list
455.165 kTris/s clipped
Vertex shading speed
3.403 MVerts/s lit (one directional light)
3.329 MVerts/s lit (one point light)
3.383 MVerts/s lit (eight point lights)
Precision
Mode: RGBA8888 Z16 S8

fraction bits
8 in alpha test
0 in combiners
0 in color interpolator

Mit Software Fallback:

ArchMark 0.10.04alpha
Driver: GDI Generic v1.1.0
Resolution: 1024x768 @ 48.72Hz
Swapping buffers
647.187 MHz timer speed (should match your CPU clock)
Bandwidth
Mode: RGBA8888 Z32 S8

bandwidth
available to buffer clears
98.140 MB/s all buffers
66.286 MB/s color only
79.143 MB/s depth and stencil
70.294 MB/s depth only
26.290 MB/s stencil only
43.077 MB/s worst case draw bandwidth
267.387 MB/s burned by the RAMDAC
310.464 MB/s estimated physical bandwidth
Tiling
Mode: RGBA8888 Z32 S8

preferred block size
updating all buffers
8 pixels wide
64 pixels high
in color buffer
32 pixels wide
8 pixels high
in depth buffer
8 pixels wide
64 pixels high
in stencil buffer
2 pixels wide
16 pixels high
Fillrate

32 bits
Mode: RGBA8888 Z32 S8
4.783 MPix/s color only
4.693 MPix/s depth only
4.875 MPix/s color and depth
3.925 MPix/s color and depth with depth test
7.333 MPix/s discardable by 'LEQUAL' depth test
5.772 MPix/s discardable by 'GEQUAL' depth test
12.540 MPix/s discardable by 'EQUAL' depth test
16 bits
Mode: RGBA8880 Z16 S8
4.183 MPix/s color only
2.822 MPix/s depth only
5.091 MPix/s color and depth
4.360 MPix/s color and depth with depth test
5.557 MPix/s discardable by 'LEQUAL' depth test
5.173 MPix/s discardable by 'GEQUAL' depth test
6.729 MPix/s discardable by 'EQUAL' depth test
Texturing
Mode: RGBA8880 Z16 S8

Textured fillrate
Peak
4.927 MPix/s w 1 layers
Unfiltered
5.056 MPix/s w 1 layers
Bilinear filter
5.067 MPix/s w 1 layers
Trilinear filter
5.045 MPix/s w 1 layers
Geometry
Mode: RGBA8880 Z16 S8

Plain vertices
3.556 MTris/s as triangle fan
1.310 MTris/s as triangle list
516.978 kTris/s clipped
Vertex shading speed
2.902 MVerts/s lit (one directional light)
1.119 MVerts/s lit (one point light)
251.308 kVerts/s lit (eight point lights)
Precision
Mode: RGBA8888 Z16 S8

fraction bits
8 in alpha test
0 in combiners
0 in color interpolator

StefanV
2003-03-20, 19:59:36
@Erazor:

kannst du bitte die results.txt gegen die Results.bb.txt ersetzen ? ;)

StefanV
2003-03-20, 20:13:44
@Zecke

Kannst du bei der nächsten Version das Häkchen für 'Swap Buffer' auf off setzen ?

StefanV
2003-03-20, 20:17:17
Meine Prosavage DDR mit DDR-SDRAM.

€dit
Ohne Ergebnisse wäre dieses Posting wohl recht sinnfrei :|
ArchMark 0.10.04alpha
Driver ProSavage/Twister v1.1 2.40.96
Resolution 1024x768 @ 119.37Hz
Method Flush
Timer 848.352 MHz

Bandwidth
Mode RGBA8888 Z32 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 987.270 MB/s
Color 877.119 MB/s
ZAndStencil 764.389 MB/s
Z 332.695 MB/s
Stencil 65.272 MB/s

Draw 767.549 MB/s
BurnedByRAMDAC 377.603 MB/s
Physical 1.145 GB/s


Tiling
Mode RGBA8888 Z32 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 8
Height 16

----in color buffer-----------------------------
Width 64
Height 64

----in depth buffer-----------------------------
Width 8
Height 4

----in stencil buffer---------------------------
Width 32
Height 32



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z32 S8
Color 113.086 MPix/s
Z 133.938 MPix/s
ColorAndZ 105.106 MPix/s
ZTest 61.578 MPix/s
ZCullLEqual 84.628 MPix/s
ZCullGEqual 84.057 MPix/s
ZCullEqual 108.185 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 149.375 MPix/s
Z 137.004 MPix/s
ColorAndZ 138.420 MPix/s
ZTest 101.002 MPix/s
ZCullLEqual 126.626 MPix/s
ZCullGEqual 126.063 MPix/s
ZCullEqual 146.189 MPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 169.653 MPix/s
2 172.509 MPix/s

----Unfiltered----------------------------------
1 172.573 MPix/s
2 172.536 MPix/s

----Bilinear filter-----------------------------
1 172.547 MPix/s
2 172.572 MPix/s

----Trilinear filter----------------------------
1 172.582 MPix/s
2 172.585 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 2.668 MTris/s
List 893.839 kTris/s
Clip 922.595 kTris/s

--Vertex shading speed--------------------------
LightD1 1.909 MVerts/s
LightP1 1.255 MVerts/s
LightP8 480.283 kVerts/s


Precision
Mode RGBA8888 Z16 S0
--fraction bits---------------------------------
AlphaTest 8
Combiner 2
Interpolator 6

loewe
2003-03-20, 20:27:51
Originally posted by zeckensack
Ergo sind die Blöcke jetzt immer gleich groß, und es wird nur noch die Position varriiert. Dadurch ist die benötigte Füllrate auf einem ideal arbeitenden Chip immer gleich groß. Unterhalb des 'guten' Alignments fällt der Wert dann ab.

Ich bräuchte jetzt eine verlässliche (mathematische) Methode, um diese sehr kleinen 'erwünschten' Abweichungen von den Meßschwankungen zuverlässig zu isolieren.

Auch der irgendwie geringe Wert bei 64 ist kein Meßfehler, sondern absolut reproduzierbar.

Lange Rede, kurzer Sinn, das Verfahren funzt, ist aber einerseits noch zu empfindlich, andererseits unterbewertet es signifikante, aber zu kleine Abweichungen.

Ich habe hier mal eine gnarf.txt der KYRO II


-----------
64 - 264.990997
32 - 250.664719
16 - 224.852692
8 - 217.407684
4 - 217.919724
2 - 214.147980
1 - 213.204147

-----------
64 - 265.505920
32 - 256.337158
16 - 256.399597
8 - 245.554245
4 - 254.339066
2 - 252.623489
1 - 256.386505

-----------
64 - 201.400101
32 - 194.002777
16 - 194.010910
8 - 194.865417
4 - 194.879471
2 - 194.012405
1 - 194.473251

-----------
64 - 205.314331
32 - 196.113678
16 - 196.579590
8 - 196.113846
4 - 195.798813
2 - 196.559814
1 - 197.036667

-----------
64 - 203.231186
32 - 195.305313
16 - 195.360092
8 - 194.456253
4 - 193.577469
2 - 194.476578
1 - 194.909714

-----------
64 - 203.312134
32 - 197.495987
16 - 197.004227
8 - 196.120789
4 - 196.608917
2 - 196.580154
1 - 195.852371

-----------
64 - 264.986542
32 - 250.718704
16 - 224.809982
8 - 217.441681
4 - 217.423538
2 - 214.654144
1 - 212.718399

-----------
64 - 265.482910
32 - 257.031891
16 - 256.364563
8 - 246.099930
4 - 254.907547
2 - 252.610001
1 - 256.440063


Es sind ähnliche Verhaltensweisen zu beobachten wie bei dir, nur der prozentuale Abfall ist wesentlich stärker! Gibt es einen besonderen Grund, warum du als Breite der Balken immer 64 Pixel genommen hast? Was geschieht wenn du grundsätzlich nur 32 Pixel nimmst? Ist das hier gezeite Verhalten unabhängig von der Breite der Balken oder stehen die jeweils depth und stenile Buffer gefundenen 64x64 mit der Breite in Zusammenhang?

Ich habe die K2 noch einmal mit externen Buffern durchlaufen lassen, dort liefert das Verfahren keine brauchbaren Ergebnisse mehr:

KYRO II @ 185 MHz mit externen Buffern

ArchMark 0.10.04alpha
Driver PowerVR KYRO v1.2.1
Resolution 1024x768 @ 61.94Hz
Method Flush
Timer 1.537 GHz

Bandwidth
Mode RGBA8888 Z32 S4
--bandwidth-------------------------------------
----available to buffer clears------------------
All 1.313 GB/s
Color 422.553 MB/s
ZAndStencil 464.947 MB/s
Z 315.758 MB/s
Stencil 38.605 MB/s

Draw 1.208 GB/s
BurnedByRAMDAC 192.843 MB/s
Physical 1.401 GB/s


Tiling
Mode RGBA8888 Z32 S4
--preferred block size--------------------------
----updating all buffers------------------------
Width 64
Height 64

----in color buffer-----------------------------
Width 64
Height 64

----in depth buffer-----------------------------
Width 64
Height 64

----in stencil buffer---------------------------
Width 64
Height 64



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z32 S4
Color 105.097 MPix/s
Z 76.718 MPix/s
ColorAndZ 101.535 MPix/s
ZTest 102.634 MPix/s
ZCullLEqual 85.480 MPix/s
ZCullGEqual 85.621 MPix/s
ZCullEqual 78.917 MPix/s

--16 bits---------------------------------------
Mode RGBA8888 Z16 S0
Color 124.091 MPix/s
Z 104.333 MPix/s
ColorAndZ 123.468 MPix/s
ZTest 124.332 MPix/s
ZCullLEqual 112.212 MPix/s
ZCullGEqual 112.523 MPix/s
ZCullEqual 105.597 MPix/s


Texturing
Mode RGBA8888 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 366.874 MPix/s
2 155.748 MPix/s
3 83.978 MPix/s
4 48.057 MPix/s

----Unfiltered----------------------------------
1 361.280 MPix/s
2 182.260 MPix/s
3 121.849 MPix/s
4 91.528 MPix/s

----Bilinear filter-----------------------------
1 361.378 MPix/s
2 182.093 MPix/s
3 121.679 MPix/s
4 91.470 MPix/s

----Trilinear filter----------------------------
1 186.456 MPix/s
2 95.905 MPix/s
3 65.433 MPix/s
4 50.021 MPix/s

----Max anisotropy (2)--------------------------
1 52.544 MPix/s
2 29.229 MPix/s
3 21.914 MPix/s
4 16.431 MPix/s



Geometry
Mode RGBA8888 Z0 S0
--Plain vertices--------------------------------
Fan 1.230 MTris/s
List 613.192 kTris/s
Clip 612.936 kTris/s

--Vertex shading speed--------------------------
LightD1 1.847 MVerts/s
LightP1 1.838 MVerts/s
LightP8 1.043 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 8
Combiner 6
Interpolator 10



Der leidet teilweise doch ganz schön im Gegensatz zur Verwendung der internen Buffer.
Hier die zugehörige gnarf.txt:


-----------
64 - 123.010384
32 - 114.594070
16 - 111.588409
8 - 108.162544
4 - 109.342117
2 - 108.164795
1 - 107.986862

-----------
64 - 120.697769
32 - 112.704086
16 - 112.858315
8 - 112.651512
4 - 112.641670
2 - 112.884804
1 - 112.894333

-----------
64 - 105.281532
32 - 97.980347
16 - 97.788490
8 - 98.234268
4 - 97.786263
2 - 97.777878
1 - 98.209877

-----------
64 - 104.427887
32 - 97.629776
16 - 97.172852
8 - 96.529167
4 - 97.606895
2 - 96.940933
1 - 96.965523

-----------
64 - 104.812836
32 - 98.000031
16 - 98.209557
8 - 97.795601
4 - 97.782570
2 - 98.250008
1 - 98.009697

-----------
64 - 105.622795
32 - 96.972992
16 - 96.964935
8 - 97.602165
4 - 96.949539
2 - 97.190651
1 - 97.595985

-----------
64 - 125.303413
32 - 115.641556
16 - 112.621445
8 - 109.591209
4 - 110.554253
2 - 109.345291
1 - 108.868103

-----------
64 - 123.179749
32 - 113.979134
16 - 113.916412
8 - 113.926712
4 - 114.165527
2 - 113.653923
1 - 113.908997


Signifikant ist da wirklich außer 64x64 überhaupt nichts mehr!

zeckensack
2003-03-20, 20:44:24
Originally posted by [UPS]Erazor
Hiho, ich hab das Archmark jetzt mal auf meinem Schleppi laufen lassen.
Der hat noch eine ATi Rage Mobility M1 drin... 8MB Ram :)
Archmark bestätigt, dass die Karte nichts kann!
Thx :D

Btw, Software-Fallback ist nicht wirklich sinnvoll, weil die Werte überhaupt nicht mehr von der Graka abhängen. Wenn eine Karte den 'normalen' Test nicht schafft, sollte man zuerst auf 16 bit runtergehen (also den Haken bei 'allow 32 bit' wegmachen).

zeckensack
2003-03-20, 20:44:57
Originally posted by Stefan Payne
@Zecke

Kannst du bei der nächsten Version das Häkchen für 'Swap Buffer' auf off setzen ? Den Haken wird's sowieso nicht mehr lange geben ;)

StefanV
2003-03-20, 20:46:42
Originally posted by zeckensack
Den Haken wird's sowieso nicht mehr lange geben ;)

...oder das ;)

zeckensack
2003-03-20, 20:57:02
Originally posted by loewe


Ich habe hier mal eine gnarf.txt der KYRO II

<...>Riesen-Thx :)
*niederknie*

Es sind ähnliche Verhaltensweisen zu beobachten wie bei dir, nur der prozentuale Abfall ist wesentlich stärker! Gibt es einen besonderen Grund, warum du als Breite der Balken immer 64 Pixel genommen hast? Was geschieht wenn du grundsätzlich nur 32 Pixel nimmst?Die Größe der Blöcke muß konstant sein, das ist der neue Grundsatz für saubere Meßergebnisse ;)
Wenn ich kleinere Blöcke nehme, kann ich auch nur kleinere Alignment-Schritte sinnvoll durchprobieren. Nähme ich zB Blöcke mit Breite 2, wäre es dem Chip höchstwahrscheinlich egal, ob ich sie auf 64er, 32er, 16er ... -Grenzen male. Die Meßergebnisse könnten nicht verwertet werden.

64 habe ich als Obergrenze für maximal meßbare Blockgröße genommen, weil's eben gerade eine Nummer größer ist, als die Kyro-Tiles. Ich wollte aktuelle Karten ausmessen können, und auch noch ein kleines Stück in die Zukunft planen.

Ist das hier gezeite Verhalten unabhängig von der Breite der Balken oder stehen die jeweils depth und stenile Buffer gefundenen 64x64 mit der Breite in Zusammenhang?Verstehe ich jetzt nicht so genau :)
Jedenfalls mißt das Prog immer in Pixeleinheiten, weil es nicht weiß (und nicht wissen kann) wie genau der Framebuffer aufgebaut ist. Gezählt wird ab linker (X-Richtung) bzw oberer (Y-Richtung) Bildschirmkante.

Ich habe die K2 noch einmal mit externen Buffern durchlaufen lassen, dort liefert das Verfahren keine brauchbaren Ergebnisse mehr:

<...>So sollte man seine Kyro auch nicht betreiben :)
Du hast ja im Grunde die die Architektur definierende Eigenschaft abgeschaltet. Kein guter Plan :D

ow
2003-03-20, 21:07:11
Originally posted by zeckensack

Btw, Software-Fallback ist nicht wirklich sinnvoll, weil die Werte überhaupt nicht mehr von der Graka abhängen.

kurze Frage: ist der archmark dann als CPU-Bench brauchbar?:D

zeckensack
2003-03-20, 21:15:13
Originally posted by ow


kurze Frage: ist der archmark dann als CPU-Bench brauchbar?:D

Klar *eg*

Originally posted by [UPS]Erazor
251.308 kVerts/s lit (eight point lights)


Werte verschiedener Windows-Versionen sind aber nicht direkt vergleichbar ;)

loewe
2003-03-20, 21:26:22
Originally posted by zeckensack
Die Größe der Blöcke muß konstant sein, das ist der neue Grundsatz für saubere Meßergebnisse ;)
Wenn ich kleinere Blöcke nehme, kann ich auch nur kleinere Alignment-Schritte sinnvoll durchprobieren. Nähme ich zB Blöcke mit Breite 2, wäre es dem Chip höchstwahrscheinlich egal, ob ich sie auf 64er, 32er, 16er ... -Grenzen male. Die Meßergebnisse könnten nicht verwertet werden.

Das ist schon klar.
Wenn du jetzt aber z.b. mal mit 32 Pixel Blöcken durchlaufen würdest, findest du dann wirklich die gleichen Übergänge?

64 habe ich als Obergrenze für maximal meßbare Blockgröße genommen, weil's eben gerade eine Nummer größer ist, als die Kyro-Tiles. Ich wollte aktuelle Karten ausmessen können, und auch noch ein kleines Stück in die Zukunft planen.

64 ist ja nett, aber wohl eher keine Zukunft. Die Tilegröße wird bei 64 Pixel zu groß, damit steigt die Anzahl der je Tile zu testenden Dreiecke auf ein unvertretbar hohes Mass. Es wird wohl bei 32x32 bleiben, hat sich als effizienteste Größe heraus gestellt, btw. auch die variable Tilegröße ist aus ähnlichen Gründen verworfen worden.

So sollte man seine Kyro auch nicht betreiben :)
Du hast ja im Grunde die die Architektur definierende Eigenschaft abgeschaltet. Kein guter Plan :D
So ganz ja nicht.
Es werden zwar die Buffer ausgelagert, aber die Berechnung erfolgt nach wie vor on Chip auf dem Tile. Ich hätte eigentlich erwartet die Tilegröße trotzdem zu finden, dass er nicht so schnell ist war schon klar!

StefanV
2003-03-20, 21:30:42
Hm, irgendwie funzt das ganze nicht auf 'ner Voodoo5 :|

ArchMark 0.10.04alpha
Driver 3Dfx/Voodoo5 (tm) SLI/2 TMUs/32 MB SDRAM/3DNow!/ICD (Nov 2 2000) v1.1.0
Resolution 1024x768 @ ???Hz
Method Flush
Timer 848.352 MHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 10.488 GB/s
Color 10.423 GB/s
ZAndStencil 10.480 GB/s
Z 3.622 GB/s
Stencil 1.208 GB/s

Draw 11.264 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 11.531 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 32
Height 32

----in color buffer-----------------------------
Width 32
Height 32

----in depth buffer-----------------------------
Width 32
Height 32

----in stencil buffer---------------------------
Width 32
Height 32



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 1.504 GPix/s
Z 1.504 GPix/s
ColorAndZ 1.504 GPix/s
ZTest 905.068 MPix/s
ZCullLEqual 905.081 MPix/s
ZCullGEqual 905.068 MPix/s
ZCullEqual 905.084 MPix/s

--16 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 1.504 GPix/s
Z 1.504 GPix/s
ColorAndZ 1.504 GPix/s
ZTest 905.074 MPix/s
ZCullLEqual 905.072 MPix/s
ZCullGEqual 905.074 MPix/s
ZCullEqual 905.077 MPix/s


Texturing
Mode RGBA8888 Z24 S8
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 1.494 GPix/s
2 1.500 GPix/s

----Unfiltered----------------------------------
1 1.501 GPix/s
2 1.501 GPix/s

----Bilinear filter-----------------------------
1 1.501 GPix/s
2 1.501 GPix/s

----Trilinear filter----------------------------
1 1.501 GPix/s
2 1.501 GPix/s



Geometry
Mode RGBA8888 Z24 S8
--Plain vertices--------------------------------
Fan 5.081 MTris/s
List 2.061 MTris/s
Clip 1.028 MTris/s

--Vertex shading speed--------------------------
LightD1 3.664 MVerts/s
LightP1 3.753 MVerts/s
LightP8 3.720 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
AlphaTest 9
Combiner 2
Interpolator 6

zeckensack
2003-03-20, 21:51:25
Stefan, was passiert wenn du
1)auf einen 16bit-Desktop schaltest, bevor du das Programm startest
2)den 32-bit-Haken wegmachst

Ich habe so den verdacht, daß der V5-Treiber lügt :|
--16 bits---------------------------------------
Mode RGBA8888 Z24 S8

StefanV
2003-03-20, 22:30:19
Originally posted by zeckensack
Stefan, was passiert wenn du
1)auf einen 16bit-Desktop schaltest, bevor du das Programm startest
2)den 32-bit-Haken wegmachst

Ich habe so den verdacht, daß der V5-Treiber lügt :|
--16 bits---------------------------------------
Mode RGBA8888 Z24 S8

Schau selbst...

ArchMark 0.10.03alpha
Driver 3Dfx/Voodoo5 (tm) SLI/2 TMUs/32 MB SDRAM/3DNow!/ICD (Nov 2 2000) v1.1.0
Resolution 1024x768 @ ???Hz
Method Flush
Timer 848.349 MHz

Bandwidth
Mode RGBA5650 Z16 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 4.812 GB/s
Color 10.565 GB/s
ZAndStencil 2.921 GB/s
Z 10.564 GB/s
Stencil 1.026 GB/s

Draw 16.998 MB/s
BurnedByRAMDAC 133.693 MB/s
Physical 150.692 MB/s


Tiling
Mode RGBA5650 Z16 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 4
Height 2

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 4
Height 2

----in stencil buffer---------------------------
Width 4
Height 2



Fillrate
--16 bits---------------------------------------
Mode RGBA5650 Z16 S8
Color 1.505 GPix/s
Z 1.505 GPix/s
ColorAndZ 1.505 GPix/s
ZTest 1.503 GPix/s
ZCullLEqual 1.503 GPix/s
ZCullGEqual 1.503 GPix/s
ZCullEqual 1.503 GPix/s


Texturing
Mode RGBA5650 Z16 S8
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 1.502 GPix/s
2 1.502 GPix/s

----Unfiltered----------------------------------
1 1.502 GPix/s
2 1.502 GPix/s

----Bilinear filter-----------------------------
1 1.502 GPix/s
2 1.502 GPix/s

----Trilinear filter----------------------------
1 1.502 GPix/s
2 1.502 GPix/s



Geometry
Mode RGBA5650 Z16 S8
--Plain vertices--------------------------------
Fan 5.164 MTris/s
List 2.140 MTris/s
Clip 1.044 MTris/s

--Vertex shading speed--------------------------
LightD1 3.821 MVerts/s
LightP1 3.989 MVerts/s
LightP8 3.684 MVerts/s


Precision
Mode RGBA5650 Z16 S8
--fraction bits---------------------------------
ATest 9
Combiner 10
Color 10

Hauwech
2003-03-21, 14:45:19
:...(
Weder G200, Millenium II, ET4000W32P noch TNT funzen. Habe alles ausprobiert was geht auf P2B-LS neuestes BIOS, P3 500MHz = no picture at all.

Schade :( Werde mich wohl mal umschauen wo man Sachen in Acryl giessen lassen kann...

In nomini Tsengis, et Nvidiai, et spiritus Matroxi. Amen :D

(keine Gewaehr das es richtig ist, Latein ist schon zu lange her ;))

zeckensack
2003-03-21, 17:27:52
Originally posted by Hauwech
:...(
Weder G200, Millenium II, ET4000W32P noch TNT funzen. Habe alles ausprobiert was geht auf P2B-LS neuestes BIOS, P3 500MHz = no picture at all.
Also der ET4000 kann garnicht gehen können :)
Millenium II weiß ich jetzt nicht genau, gibt's dafür OpenGL-Treiber?
G200 und TNT sollten aber auf jeden Fall funzen.
Was genau heißt 'no picture at all'?
Absturz? Fehlermeldungen (nach dem Lauf 'View details')???

Unregistered
2003-03-21, 19:03:55
Originally posted by zeckensack


Ich habe so den verdacht, daß der V5-Treiber lügt :|
--16 bits---------------------------------------
Mode RGBA8888 Z24 S8


Das denke ich auch.

Villeicht ist auch dieses ominöse SW-HSR aktiviert.:D

StefanV
2003-03-21, 19:09:04
Originally posted by Unregistered
Das denke ich auch.

Villeicht ist auch dieses ominöse SW-HSR aktiviert.:D

Eigentlich nicht...

DAS muss man ja erst per Hand freischalten, was ich definitiv nicht gemacht hab.
Ich hoffe, daß Quasar mal einige Tests mit der V4 machen kann...

Eventuell hat der Achrchmark ja Probleme mit Multichip Kärtchen...

Hauwech
2003-03-22, 15:07:11
@Zecke

Neee die Karten sind komplett tot :(. Sie funzen einfach nicht mehr. Waere mal witzig gewesen, selbst wenn dein Sackmark :D nich laueft, die Karten wieder in Aktion zu sehen aber sie sind tot. Waren zwar in Antistatiktueten und im Schrank aber was weiss ich was bei denen einfach ueber die Zeit kaputt gegangen ist.

Die Millenium II hat OpenGL Treiber, haette also theoretisch gefunzt.

peanball
2003-03-22, 17:18:29
So, diesmal mit bb und mit 16 bit :)

ArchMark 0.10.04alpha
Driver RagePRO v1.1.3
Resolution 1024x768 @ 131.34Hz
Method Swap
Timer 647.186 MHz

Bandwidth
Mode RGBA5650 Z16 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 165.857 MB/s
Color 119.454 MB/s
ZAndStencil 131.934 MB/s
Z 118.911 MB/s
Stencil 66.475 MB/s

Draw 6.092 MB/s
BurnedByRAMDAC 217.785 MB/s
Physical 223.877 MB/s


Tiling
Mode RGBA5650 Z16 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 16
Height none

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 4
Height 16

----in stencil buffer---------------------------
Width none
Height 2



Fillrate
--16 bits---------------------------------------
Mode RGBA5650 Z16 S8
Color 41.214 MPix/s
Z 41.080 MPix/s
ColorAndZ 41.423 MPix/s
ZTest 38.571 MPix/s
ZCullLEqual 39.929 MPix/s
ZCullGEqual 39.837 MPix/s
ZCullEqual 40.608 MPix/s


Texturing
Mode RGBA5650 Z16 S8
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 40.959 MPix/s

----Unfiltered----------------------------------
1 41.718 MPix/s

----Bilinear filter-----------------------------
1 41.636 MPix/s

----Trilinear filter----------------------------
1 41.634 MPix/s



Geometry
Mode RGBA5650 Z16 S8
--Plain vertices--------------------------------
Fan 2.895 MTris/s
List 1.276 MTris/s
Clip 459.857 kTris/s

--Vertex shading speed--------------------------
LightD1 3.461 MVerts/s
LightP1 3.493 MVerts/s
LightP8 3.464 MVerts/s


Precision
Mode RGBA5650 Z16 S8
--fraction bits---------------------------------
AlphaTest 0
Combiner 0
Interpolator 0

Legolas
2003-03-22, 18:31:00
Originally posted by Stefan Payne


Eigentlich nicht...

DAS muss man ja erst per Hand freischalten, was ich definitiv nicht gemacht hab.
Ich hoffe, daß Quasar mal einige Tests mit der V4 machen kann...

Eventuell hat der Achrchmark ja Probleme mit Multichip Kärtchen...

Teste doch einfach mal im Single Chip Mode gegen. Normalerweise sollten die 2 VSA-100 durch die Applikation nicht wirklich bemerkt werden.

StefanV
2003-03-22, 18:35:59
Originally posted by Legolas
Teste doch einfach mal im Single Chip Mode gegen. Normalerweise sollten die 2 VSA-100 durch die Applikation nicht wirklich bemerkt werden.

DAS ist ja das Problem, dann schmiert der Archmark ab...

Legolas
2003-03-22, 19:12:38
Originally posted by Stefan Payne


DAS ist ja das Problem, dann schmiert der Archmark ab...

Hmm, bei mir unter Win2k mit ner Voodoo 3 2000 und Amigamerlin 2.5 auch.

Unregistered
2003-03-22, 20:22:42
die 3dfx opengl treiber sind einfach mist, that´s it.

Quasar
2003-03-23, 15:13:20
Bei mir bescheisst der Voodoo-Treiber offenbar nicht. BTW verwende ich auch den original 3dfx-Treiber, keinen "billigen" Nachbau. ;)

ArchMark 0.10.04alpha
Driver 3Dfx/Voodoo4 PCI/3Dfx/Voodoo5 Single Chip/3Dfx/Voodoo5 Default/ Voodoo5 mit 4xAA
Resolution 1024x768 @ ???Hz
Method Flush
Timer 601.360 MHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 1.214 GB/s 1.083 GB/s 3.678 GB/s
Color 1.820 GB/s 1.624 GB/s 3.677 GB/s
ZAndStencil 1.820 GB/s 1.624 GB/s 3.677 GB/s
Z 1.365 GB/s 1.218 GB/s 1.274 GB/s
Stencil 455.040 MB/s 405.932 MB/s 424.554 MB/s

Draw 1.991 GB/s 1.821 GB/s 4.101 GB/s
BurnedByRAMDAC 267.387 MB/s 267.387 MB/s 267.387 MB/s
Physical 2.259 GB/s 2.089 GB/s 4.368 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 16 16 16 4
Height 32 32 32 64

----in color buffer-----------------------------
Width 16 16 16 4
Height 32 32 32 64

----in depth buffer-----------------------------
Width 16 16 16 4
Height 32 32 32 64

----in stencil buffer---------------------------
Width 16 16 16 4
Height 32 32 32 64



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 302.368 MPix/s 311.138 MPix/s 587.257 MPix/s
Z 302.377 MPix/s 311.147 MPix/s 587.274 MPix/s
ColorAndZ 302.375 MPix/s 311.147 MPix/s 587.279 MPix/s
ZTest 159.199 MPix/s 143.531 MPix/s 326.594 MPix/s
ZCullLEqual 159.199 MPix/s 143.531 MPix/s 326.591 MPix/s
ZCullGEqual 159.199 MPix/s 143.530 MPix/s 326.591 MPix/s
ZCullEqual 159.199 MPix/s 143.530 MPix/s 326.591 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S8
Color 328.737 MPix/s 328.423 MPix/s 590.586 MPix/s
Z 328.743 MPix/s 328.428 MPix/s 590.608 MPix/s
ColorAndZ 328.743 MPix/s 328.429 MPix/s 590.610 MPix/s
ZTest 312.467 MPix/s 309.951 MPix/s 586.320 MPix/s
ZCullLEqual 312.470 MPix/s 309.953 MPix/s 586.321 MPix/s
ZCullGEqual 312.467 MPix/s 309.950 MPix/s 586.323 MPix/s
ZCullEqual 312.468 MPix/s 309.954 MPix/s 586.318 MPix/s


Texturing
Mode RGBA8888 Z24 S8
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 302.196 MPix/s 311.001 MPix/s 585.582 MPix/s
2 302.209 MPix/s 311.013 MPix/s 585.880 MPix/s

----Unfiltered----------------------------------
1 302.209 MPix/s 311.016 MPix/s 585.879 MPix/s
2 302.207 MPix/s 311.013 MPix/s 585.878 MPix/s

----Bilinear filter-----------------------------
1 302.209 MPix/s 311.014 MPix/s 585.876 MPix/s
2 302.209 MPix/s 311.014 MPix/s 585.876 MPix/s

----Trilinear filter----------------------------
1 302.211 MPix/s 311.012 MPix/s 585.882 MPix/s
2 302.209 MPix/s 311.012 MPix/s 585.879 MPix/s



Geometry
Mode RGBA8888 Z24 S8
--Plain vertices--------------------------------
Fan 3.540 MTris/s 3.525 MTris/s 3.537 MTris/s
List 1.486 MTris/s 1.473 MTris/s 1.477 MTris/s
Clip 735.289 kTris/s 733.206 kTris/s 734.043 kTris/s

--Vertex shading speed--------------------------
LightD1 2.547 MVerts/s 2.481 MVerts/s 2.506 MVerts/s
LightP1 2.576 MVerts/s 2.481 MVerts/s 2.545 MVerts/s
LightP8 2.576 MVerts/s 2.481 MVerts/s 2.546 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
AlphaTest 8 8 8
Combiner 2 2 2
Interpolator 6 6 6


Trilinear ist also nicht drin, der Ar[S]chmark erkennt nicht, wenn der Treiber die Tri-Anforderung ignoriert (IMO). Voodoo4 4500 PCI ist marginal langsamer als Voodoo5 AGP SingleChip und im 4xAA-Modus ändert sich offenbar die Auslesestrategie für den Speicher.

Single-Chip lief bei mir ohne Probleme (1.04.01 Beta von 3dfx, Win98), auch die Voodoo4 ging problemlos, sobald ich vonn 800x600x16 Desktop (-> Absturz) auf 1024x32 Desktop gewechselt hatte.

StefanV
2003-03-23, 15:20:48
Originally posted by Quasar
Bei mir bescheisst der Voodoo-Treiber offenbar nicht. BTW verwende ich auch den original 3dfx-Treiber, keinen "billigen" Nachbau. ;)
Trilinear ist also nicht drin, der Ar[S]chmark erkennt nicht, wenn der Treiber die Tri-Anforderung ignoriert (IMO). Voodoo4 4500 PCI ist marginal langsamer als Voodoo5 AGP SingleChip und im 4xAA-Modus ändert sich offenbar die Auslesestrategie für den Speicher.

Single-Chip lief bei mir ohne Probleme (1.04.01 Beta von 3dfx, Win98), auch die Voodoo4 ging problemlos, sobald ich vonn 800x600x16 Desktop (-> Absturz) auf 1024x32 Desktop gewechselt hatte.

1. welchen 3DFX Treiber hast du genommen ?
Ich hab 1.04.01b (der letzte, den es gab, IIRC) unter Windows 98.

2. ahso, da liegt der Hund begraben...
Hatte den Desktop auf 800x600x32...

PS: fehlen da nicht ein paar Werte ??

Quasar
2003-03-23, 15:24:51
Originally posted by Stefan Payne


1. welchen 3DFX Treiber hast du genommen ?
Ich hab 1.04.01b (der letzte, den es gab, IIRC) unter Windows 98.

2. ahso, da liegt der Hund begraben...
Hatte den Desktop auf 800x600x32...

PS: fehlen da nicht ein paar Werte ??

ad1) Hab ich doch untendrunter geschrieben..... 1.04.01 Beta.

ad2) siehste....OpenGL&3dfx halt ;)

ad3) Nö, welche denn? 2 Texturen Single-Pass, mehr kann der VSA-100 nicht. Und die 4xFSAA Werte wollte ich nicht auch noch reinschreiben, das ist mir zuviel Arbeit. Bis auf die genannten Tiling-Größen sind die nicht allzu spektakulär.

StefanV
2003-03-23, 15:28:36
Originally posted by Quasar


ad1) Hab ich doch untendrunter geschrieben..... 1.04.01 Beta.

ad2) siehste....OpenGL&3dfx halt ;)

ad3) Nö, welche denn? 2 Texturen Single-Pass, mehr kann der VSA-100 nicht. Und die 4xFSAA Werte wollte ich nicht auch noch reinschreiben, das ist mir zuviel Arbeit. Bis auf die genannten Tiling-Größen sind die nicht allzu spektakulär.

1. also nutzen wir die gleichen Treiber :|
Mein W98 ist auch noch recht frish, außer Prosavage DDR Treiber und G550 Treibern ist da nix an GraKa Treibern drin...

2. darauf soll man erstmal kommen...

3. genau die meinte ich (V5 mit 4x FSAA) ;)

Dj dicke Brust
2003-03-23, 23:11:54
Tach Leutz sory das so reinfall aber wollt nur anbieten Archmark auf der ATI Rage Fury MAXX laufen zu lassen da ihr ja glaubt das er probs mit Multichip hat

Nur Angebot

Tschau Dj dicke Brust

ow
2003-03-24, 09:28:20
Originally posted by Dj dicke Brust
Tach Leutz sory das so reinfall aber wollt nur anbieten Archmark auf der ATI Rage Fury MAXX laufen zu lassen da ihr ja glaubt das er probs mit Multichip hat

Nur Angebot

Tschau Dj dicke Brust

Der Archmark hat sicher keine Probs mit Multichips, weil er nicht wissen kann, wieviele Chips da werkeln.
Wenn, dass koennen es nur die OGL Treiber sein, die Probs machen.

Quasar
2003-03-24, 10:52:52
...was zumindest im Falle 3dfx wohl nicht der Fall zu sein scheint. :D

ow
2003-03-24, 13:05:44
Die 3dfx OGL Treiber kommentiere ich mal lieber nicht.;)

IMO hat das mit einem korrekten ICD wenig zu tun, sondern es handelt sich um einen Glide-Wrapper.

Demirug
2003-03-24, 13:10:21
Originally posted by ow
Die 3dfx OGL Treiber kommentiere ich mal lieber nicht.;)

IMO hat das mit einem korrekten ICD wenig zu tun, sondern es handelt sich um einen Glide-Wrapper.

Du meinst einen Glide2OpenGL Wrapper?

Hatte da nicht auch mal jemand einen D3D2OpenGL Wrapper benutzt?

StefanV
2003-03-24, 13:27:28
Originally posted by Demirug
Hatte da nicht auch mal jemand einen D3D2OpenGL Wrapper benutzt?
Ja, Matrox bei der G200...

ow
2003-03-24, 13:39:07
Originally posted by Demirug


Du meinst einen Glide2OpenGL Wrapper?

Hatte da nicht auch mal jemand einen D3D2OpenGL Wrapper benutzt?


Nein, umgekehrt. OGL -> Glide.

Der 3dfx "ICD" setzt alle OGL-Funktionen in entsprechende Glide-Funktionen um.
Ohne die glide3x.dll in windows/system gibts kein hw-beschleunigtes OGL auf den Voodoos. Nur die 3dfxogl.dll in windows/system reicht nicht.

/edit: die 3dfxogl.dll hat noch einen "seltsame" Eigenschaft: man kann sie in opengl32.dll umbenennen (und damit die Windows-Eigene .dll ersetzen), dann meldet sich der Treiber anstatt mit "ICD" als "stand-alone".

Demirug
2003-03-24, 13:44:40
ow, wir meinen beide das gleiche ich habe es nur aus der sicht der Hardware gesehen.

ow
2003-03-24, 13:47:30
Originally posted by Demirug
ow, wir meinen beide das gleiche ich habe es nur aus der sicht der Hardware gesehen.

hmpf...ja... der Gedanke kam mir auch gerade.:D

Modulor
2003-03-24, 19:28:45
Nach umfangreichem Komplettumbau meines Systems hier etwas später als erwartet die Werte der VP560 Swap und Flush:


ArchMark 0.10.04alpha
Driver Wildcat VP560 - GL2 v1.3.1
Resolution 1024x768 @ ???Hz
Method Swap
Timer 2.170 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 2.644 GB/s
Color 3.352 GB/s
ZAndStencil 1.941 GB/s
Z 3.336 GB/s
Stencil 1.045 GB/s

Draw 4.461 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 4.728 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 4
Height 4

----in color buffer-----------------------------
Width 4
Height 4

----in depth buffer-----------------------------
Width 4
Height 4

----in stencil buffer---------------------------
Width 4
Height 4



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 805.608 MPix/s
Z 809.640 MPix/s
ColorAndZ 804.125 MPix/s
ZTest 304.504 MPix/s
ZCullLEqual 384.270 MPix/s
ZCullGEqual 384.249 MPix/s
ZCullEqual 1.081 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z24 S8
Color 535.505 MPix/s
Z 1.076 GPix/s
ColorAndZ 545.368 MPix/s
ZTest 324.036 MPix/s
ZCullLEqual 405.073 MPix/s
ZCullGEqual 401.017 MPix/s
ZCullEqual 1.078 GPix/s


Texturing
Mode RGBA5650 Z24 S8
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 366.909 MPix/s
2 179.390 MPix/s
3 118.698 MPix/s
4 88.693 MPix/s
5 70.796 MPix/s
6 58.903 MPix/s
7 50.432 MPix/s
8 44.099 MPix/s

----Unfiltered----------------------------------
1 364.384 MPix/s
2 179.395 MPix/s
3 118.697 MPix/s
4 88.688 MPix/s
5 70.797 MPix/s
6 58.906 MPix/s
7 50.440 MPix/s
8 44.037 MPix/s

----Bilinear filter-----------------------------
1 367.023 MPix/s
2 179.417 MPix/s
3 118.698 MPix/s
4 88.694 MPix/s
5 70.797 MPix/s
6 58.906 MPix/s
7 50.441 MPix/s
8 43.938 MPix/s

----Trilinear filter----------------------------
1 367.019 MPix/s
2 179.421 MPix/s
3 118.426 MPix/s
4 88.316 MPix/s
5 70.319 MPix/s
6 58.906 MPix/s
7 50.440 MPix/s
8 44.099 MPix/s

----Max anisotropy (16)-------------------------
1 107.251 MPix/s
2 53.687 MPix/s
3 35.809 MPix/s
4 26.863 MPix/s
5 21.493 MPix/s
6 17.912 MPix/s
7 15.354 MPix/s
8 13.436 MPix/s



Geometry
Mode RGBA5650 Z24 S8
--Plain vertices--------------------------------
Fan 14.334 MTris/s
List 4.832 MTris/s
Clip 4.791 MTris/s

--Vertex shading speed--------------------------
LightD1 7.187 MVerts/s
LightP1 7.187 MVerts/s
LightP8 2.372 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
AlphaTest 0
Combiner 6
Interpolator 10





**************************************************************



ArchMark 0.10.04alpha
Driver Wildcat VP560 - GL2 v1.3.1
Resolution 1024x768 @ ???Hz
Method Flush
Timer 2.170 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 2.712 GB/s
Color 3.359 GB/s
ZAndStencil 1.953 GB/s
Z 3.350 GB/s
Stencil 1.052 GB/s

Draw 4.510 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 4.778 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 4
Height 4

----in color buffer-----------------------------
Width 4
Height 4

----in depth buffer-----------------------------
Width 4
Height 4

----in stencil buffer---------------------------
Width 4
Height 4



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 821.206 MPix/s
Z 831.919 MPix/s
ColorAndZ 658.639 MPix/s
ZTest 391.909 MPix/s
ZCullLEqual 386.119 MPix/s
ZCullGEqual 386.074 MPix/s
ZCullEqual 1.110 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z24 S8
Color 555.176 MPix/s
Z 1.104 GPix/s
ColorAndZ 475.741 MPix/s
ZTest 375.770 MPix/s
ZCullLEqual 398.440 MPix/s
ZCullGEqual 398.371 MPix/s
ZCullEqual 1.107 GPix/s


Texturing
Mode RGBA5650 Z24 S8
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 370.224 MPix/s
2 180.143 MPix/s
3 119.030 MPix/s
4 88.879 MPix/s
5 70.914 MPix/s
6 58.991 MPix/s
7 50.500 MPix/s
8 44.146 MPix/s

----Unfiltered----------------------------------
1 370.224 MPix/s
2 180.143 MPix/s
3 119.031 MPix/s
4 88.879 MPix/s
5 70.914 MPix/s
6 58.990 MPix/s
7 50.500 MPix/s
8 44.146 MPix/s

----Bilinear filter-----------------------------
1 370.224 MPix/s
2 180.143 MPix/s
3 119.031 MPix/s
4 88.879 MPix/s
5 70.914 MPix/s
6 58.991 MPix/s
7 50.500 MPix/s
8 44.146 MPix/s

----Trilinear filter----------------------------
1 370.224 MPix/s
2 180.143 MPix/s
3 119.030 MPix/s
4 88.878 MPix/s
5 70.914 MPix/s
6 58.991 MPix/s
7 50.500 MPix/s
8 44.146 MPix/s

----Max anisotropy (16)-------------------------
1 107.519 MPix/s
2 53.762 MPix/s
3 35.842 MPix/s
4 26.882 MPix/s
5 21.505 MPix/s
6 17.921 MPix/s
7 15.361 MPix/s
8 13.441 MPix/s



Geometry
Mode RGBA5650 Z24 S8
--Plain vertices--------------------------------
Fan 14.325 MTris/s
List 4.790 MTris/s
Clip 4.832 MTris/s

--Vertex shading speed--------------------------
LightD1 7.195 MVerts/s
LightP1 7.187 MVerts/s
LightP8 2.369 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
AlphaTest 0
Combiner 6
Interpolator 10




- der Flush Test benötigt eine satte Stunde während Swap in etwa einer Minute durch ist ???

- erst wenn ich 32bit Z-Buffer im Treiber forciere werden 9 fraction bits beim Alpha Test ermittelt - sonst immer 0

zeckensack
2003-03-25, 03:51:43
Originally posted by Modulor
Nach umfangreichem Komplettumbau meines Systems hier etwas später als erwartet die Werte der VP560 Swap und Flush:Cool, thx :)
Sind die Werte im grünen Bereich? Ich habe jetzt die Taktraten der VP560 nicht im Kopf, kommt das ungefähr hin?

- der Flush Test benötigt eine satte Stunde während Swap in etwa einer Minute durch ist ???Kannst du ungefähr eingrenzen, wo er am längsten 'hängt'???
- erst wenn ich 32bit Z-Buffer im Treiber forciere werden 9 fraction bits beim Alpha Test ermittelt - sonst immer 0 Der Präzisionstest funktioniert in der Version nicht besonders gut. Die Zahlen sind bekanntermaßen daneben. Eine neuere Version habe ich noch nicht hochgeladen.
Ich habe zumindest schon ein bisschen weitergebastelt, aber bisher noch ohne echten Erfolg.

Leider (?) muß ich mich diese Woche primär auf mein Geschreibsel konzentrieren, ich muß da noch was fertig kriegen. Wenn ich damit fertig bin, dann geht's zurück an ArchMark :)


edit: VP570 => VP560 :bonk:

Unregistered
2003-03-25, 19:31:18
hm zecki kannst emal einen kurzen überblick über deinen archmark geben :)
thx
die 25 seiten durchzulesen ist doch bisserl viel arbeit :)

ow
2003-03-25, 20:16:43
@zecki

Hab da eine Frage:

Was hat es mit der 'subpixel-precision' unter OGL auf sich?
Mir ist bekannt, dass verschiedene Chips da mit unterschiedlichen Werten (2-11 Bits) arbeiten.

Auslesen lässt sich das Wert wohl über den Treiber, kann man da evtl. auch eine Präzision messen?

AlfredENeumann
2003-03-26, 00:19:37
Originally posted by zeckensack
Du hast PM.

auch haben will.
könnte ne R100 anbieten:D


edit: hab nach langen durchlesen gesehen das ne R100 schon dabei war.

Unregistered
2003-03-26, 08:13:31
Originally posted by ow
[...]'subpixel-precision'[...]
Auslesen lässt sich das Wert wohl über den Treiber, kann man da evtl. auch eine Präzision messen?

Ich denke eher nicht, da der Wert sich auch per Treiber bzw. BIOS ändern läßt. Quadro-Karten haben eine höhere Präzision als normale GeForces, so daß der Wert nicht Chipabhängig sein kann und damit eigentlich nicht sonderlich interessant ist, IMO.

Quasar@work

ow
2003-03-26, 10:41:46
Originally posted by Unregistered


Ich denke eher nicht, da der Wert sich auch per Treiber bzw. BIOS ändern läßt. Quadro-Karten haben eine höhere Präzision als normale GeForces,
Quasar@work


Das bezweifele ich mal. Meine GF4 meldet 8Bits Subpixel-Precision, mehr schaffen iirc auch die Quadros nicht.
TNT bis GF2 arbeiten mit 4 Bits, bei den Radeon liess sich das in frueheren Treibern zwischen 2Bits/4Bits umstellen.
Permedia2 macht 3Bits (SW-GDI uebrigens auch), die dicken Profi-OGL Karten von 3dlabs machen 11Bits.

x-dragon
2003-03-26, 11:02:48
Originally posted by ow



Das bezweifele ich mal. Meine GF4 meldet 8Bits Subpixel-Precision, mehr schaffen iirc auch die Quadros nicht.
TNT bis GF2 arbeiten mit 4 Bits, bei den Radeon liess sich das in frueheren Treibern zwischen 2Bits/4Bits umstellen.
Permedia2 macht 3Bits (SW-GDI uebrigens auch), die dicken Profi-OGL Karten von 3dlabs machen 11Bits. Einspruch :).
Zumindest die neuen Quadros haben sogar 12 bit:
http://www.beyond3d.com/forum/viewtopic.php?topic=3956&forum=9

Naja wahrscheinlich redet ihr von der alten, oder?

ow
2003-03-26, 11:05:51
naja, ueber die FX-Chips ist mir da noch nix bekannt. Vielleicht macht die Konsumer-FX ja auch 12Bits.:D

Modulor
2003-03-26, 14:07:54
Originally posted by zeckensack
...
Sind die Werte im grünen Bereich? Ich habe jetzt die Taktraten der VP570 nicht im Kopf, kommt das ungefähr hin?


Ich habe die Taktraten auch nicht im Kopf :) - außer 3DLabs und wohl nur wenigen Eingeweihten außerhalb kennt die kaum jemand (und wie sich die auch 9 Monate nach release immer noch geheim halten lassen ist wohl einmalig heutzutage)...
Die Füllratenwerte sowie die von ZCullL und ZCullG zumindest stimmen etwa mit den sonst gemessenen Werten überein.

Originally posted by zeckensack
...
Kannst du ungefähr eingrenzen, wo er am längsten 'hängt'???
...


Eindeutig bei den Füllraten und Texturing Tests. Da gibt es so etwa pro Minute ein Bild :)...

ow
2003-03-26, 14:41:26
Auf alle Faelle scheint der VP560 recht verkrueppelt zu sein.

Nach der Fillrate zu urteilen hoechstens 2 Pipes mit nur einer TMU bei etwa 190-200Mhz. Dafuer aber wohl trilineare TMUs (sofern trilinear korrekt funzt, wovon ich aber ausgehe).

*ow@work*

zeckensack
2003-03-26, 15:01:30
Originally posted by Unregistered
hm zecki kannst emal einen kurzen überblick über deinen archmark geben :)
thx
die 25 seiten durchzulesen ist doch bisserl viel arbeit :) Das Ding mißt alle interessanten (und uninteressanten ;) ) Eigenschaften eines 3D-Chips aus, die mir so in den Sinn gekommen sind.

Archmark zeichnet sich erstmal dadurch aus, das bei den Performance-Messungen überall die brutalen Peak-Werte gemessen werden. Im Gegensatz zu 3DMark ist zB der Füllratentest ein echter Füllratentest ... ich messe hier auf allen Chips mindestens 95% vom theoretischen Maximum.
Des weiteren ist der Benchmarkanteil des Programms IMO extrem gut wiederholbar und genau.
Könnte daran liegen, daß ich einen Taktzyklengenauen Timer benutze (x86-RDTSC), und nicht QueryPerformanceTimer ( <= Win32-Funktion mit 'nur' 1.8MHz). Dadurch können die Tests auch vergleichsweise schnell ausgeführt werden*. Die Füllratenbestimmung im Tiling-Test dauert zB nur 1/16s pro Schritt, und hat trotzdem nur <1% Messungenauigkeit.

Das ganze soll letztendlich ein möglichst genaues Analysewerkzeug werden, wobei die Motivation sich aus der allgemeinen Desinformationspolitik und dem 'um den heißen Brei-Gerede' der Chiphersteller ergibt. Man denke da an die offiziellen Wischiwaschi-Aussagen zur Pipeline-Architektur des NV30 *eg*

*wie man bei Modulor sieht, puffern manche Treiber riesige Mengen von Anweisungen, wenn man keine Buffer-Swaps ausführt. Dann dauert's wieder länger, das wird aber sicher noch besser. Auf meiner Radeon8500LE dauert ein kompletter Lauf aller Tests mittlerweile nur noch 40 Sekunden.

StefanV
2003-03-26, 15:09:32
@Zecke

Ist von dir auch ein 'normaler' OGL Benchmark zu erwarten ?? *eg*

Sozusagen als Ersatz zu Tirtanium ?? :)

zeckensack
2003-03-26, 15:25:55
Originally posted by Stefan Payne
@Zecke

Ist von dir auch ein 'normaler' OGL Benchmark zu erwarten ?? *eg*

Sozusagen als Ersatz zu Tirtanium ?? :) Das wäre schon cool, aber ehrlich gesagt sind meine künstlerischen Fähigkeiten im Grafikbereich dafür zu kläglich :(

StefanV
2003-03-26, 15:34:39
Originally posted by zeckensack
Das wäre schon cool, aber ehrlich gesagt sind meine künstlerischen Fähigkeiten im Grafikbereich dafür zu kläglich :(

Also wenn ich das richtig verstanden hab:

Das Programm könntest du hinbekommen, die Texturen aber nicht, oder ??

zeckensack
2003-03-26, 15:41:36
Originally posted by Stefan Payne


Also wenn ich das richtig verstanden hab:

Das Programm könntest du hinbekommen, die Texturen aber nicht, oder ?? Exakt.
Aber nicht nur Texturen, vor allem die Modelle selbst machen mir Sorgen :|

Crazytype
2003-03-26, 16:00:11
hab hier noch ne gf 256 DDR mit 64 Mb rumliegen.

x-dragon
2003-03-26, 16:24:53
Originally posted by zeckensack
Exakt.
Aber nicht nur Texturen, vor allem die Modelle selbst machen mir Sorgen :| Also dafür sollte man hier (bzw. im Grafikbereich) doch ein paar Leute begeistern können. Nach dem was ich bisher im Grafik-Forum gesehen haben sollte es zumindet an den Fähigkeiten nicht mangeln. Und so ein paar Spiele-Entwickler treiben sich hier ja auch noch rum, da gibts bestimmt welche die noch ein interessantes Hobby brauchen :).

ow
2003-03-26, 16:43:06
Originally posted by zeckensack
Exakt.
Aber nicht nur Texturen, vor allem die Modelle selbst machen mir Sorgen :|

ach was. plain ogl rulz.:D
afair nutzt zB. der "GLExcess" genau ein 3D-Modell (das Spaceship in der entsprechenden Szene), der rest ist pures Ogl.

zeckensack
2003-03-26, 16:44:50
Originally posted by ow


ach was. plain ogl rulz.:D
afair nutzt zB. der "GLExcess" genau ein 3D-Modell (das Spaceship in der entsprechenden Szene), der rest ist pures Ogl. Nujo, aber auch prozedurale Gemoetrie muß man 'designen'.

aths
2003-03-26, 17:12:34
Originally posted by ow
ach was. plain ogl rulz.:D
afair nutzt zB. der "GLExcess" genau ein 3D-Modell (das Spaceship in der entsprechenden Szene), der rest ist pures Ogl. Das Spaceship ist iirc ein OpenGL-Modell. Imo ist das Extra-Modell in GL Excess der Kopf am Anfang.

zeckensack
2003-03-27, 10:39:52
Der R200 benutzt* bereits ein Fließkommaformat innerhalb der Combiner ... :|

*Bitte unbedingt beachten: Hypothese heißt "muß nicht stimmen"

zeckensack
2003-03-27, 10:57:41
Ich bräuchte mal jemanden mit mehr als zwei Texturen single-pass, keine ATI, vorzugsweise NV2x.
Versionsnummer rauf: 0.10.09
Paßwort entfällt - war mir jetzt doch zu doof :)
Aniso-Test vorläufig entfernt wg irreführender Ergebnisse - genauere Erklärung irgendwann später
Tiling-Test 'final' - schon wieder *eg*
Laufzeit auf 'aggressiven Flush-Ignoranz-Karten (TM)' verkürzt - schlägt sich leicht auf die Meßergebnisse nieder
Prophylaktischer Bugfix in der Texturing-Sektion: Es wäre auf Karten mit mehr als 8 Texturen/Pass höchstwahrscheinlich zum Crash gekommen. Jetzt nicht mehr.
Präzisionstest überarbeitet - ich bitte um Ergebnisse, siehe oben

StefanV
2003-03-27, 12:00:23
Originally posted by zeckensack
Ich bräuchte mal jemanden mit mehr als zwei Texturen single-pass, keine ATI, vorzugsweise NV2x.
Versionsnummer rauf: 0.10.09
Paßwort entfällt - war mir jetzt doch zu doof :)
Aniso-Test vorläufig entfernt wg irreführender Ergebnisse - genauere Erklärung irgendwann später
Tiling-Test 'final' - schon wieder *eg*
Laufzeit auf 'aggressiven Flush-Ignoranz-Karten (TM)' verkürzt - schlägt sich leicht auf die Meßergebnisse nieder
Prophylaktischer Bugfix in der Texturing-Sektion: Es wäre auf Karten mit mehr als 8 Texturen/Pass höchstwahrscheinlich zum Crash gekommen. Jetzt nicht mehr.
Präzisionstest überarbeitet - ich bitte um Ergebnisse, siehe oben


*meld*

Was soll ich mit meiner NV20 testen ?? ;)

StefanV
2003-03-27, 12:03:02
ArchMark 0.10.09alpha
Driver GeForce3/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 60.19Hz
Method Flush
Timer 1.667 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 14.546 GB/s
Color 8.339 GB/s
ZAndStencil 57.152 GB/s
Z 42.873 GB/s
Stencil 14.290 GB/s

Draw 10.171 GB/s
BurnedByRAMDAC 190.511 MB/s
Physical 10.362 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height 4

----in color buffer-----------------------------
Width 4
Height 4

----in depth buffer-----------------------------
Width 4
Height 4

----in stencil buffer---------------------------
Width 4
Height 4



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 969.531 MPix/s
Z 969.543 MPix/s
ColorAndZ 969.544 MPix/s
ZTest 947.436 MPix/s
ZCullLEqual 2.183 GPix/s
ZCullGEqual 2.174 GPix/s
ZCullEqual 969.568 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z24 S0
Color 888.357 MPix/s
Z 969.518 MPix/s
ColorAndZ 969.550 MPix/s
ZTest 969.567 MPix/s
ZCullLEqual 2.191 GPix/s
ZCullGEqual 2.190 GPix/s
ZCullEqual 965.740 MPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 949.069 MPix/s
2 967.814 MPix/s
3 485.268 MPix/s
4 485.400 MPix/s

----Unfiltered----------------------------------
1 965.139 MPix/s
2 969.466 MPix/s
3 485.399 MPix/s
4 485.406 MPix/s

----Bilinear filter-----------------------------
1 969.467 MPix/s
2 969.470 MPix/s
3 485.394 MPix/s
4 484.523 MPix/s

----Trilinear filter----------------------------
1 969.466 MPix/s
2 485.311 MPix/s
3 323.515 MPix/s
4 242.738 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 30.353 MTris/s
List 9.544 MTris/s
Clip 9.543 MTris/s

--Vertex shading speed--------------------------
LightD1 20.513 MVerts/s
LightP1 10.138 MVerts/s
LightP8 3.687 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 10
Combiner 16
Interpolator 15



PS: kann leider nicht mehr mit einer RV250 dienen...

StefanV
2003-03-27, 12:06:30
G400/16SD

ArchMark 0.10.09alpha
Driver Matrox G400 v1.1.3 Feb 7 2003
Resolution 1024x768 @ ???Hz
Method Flush
Timer 1.470 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 802.994 MB/s
Color 2.018 GB/s
ZAndStencil 530.575 MB/s
Z 765.909 MB/s
Stencil 234.173 MB/s

Draw 1.402 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 1.669 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height 16

----in color buffer-----------------------------
Width 8
Height none

----in depth buffer-----------------------------
Width 4
Height 4

----in stencil buffer---------------------------
Width 4
Height 16



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 248.048 MPix/s
Z 228.187 MPix/s
ColorAndZ 248.052 MPix/s
ZTest 139.038 MPix/s
ZCullLEqual 188.809 MPix/s
ZCullGEqual 190.146 MPix/s
ZCullEqual 218.178 MPix/s

--16 bits---------------------------------------
Mode RGBA8880 Z15 S1
Color 241.292 MPix/s
Z 241.767 MPix/s
ColorAndZ 241.740 MPix/s
ZTest 155.077 MPix/s
ZCullLEqual 214.847 MPix/s
ZCullGEqual 213.448 MPix/s
ZCullEqual 239.612 MPix/s


Texturing
Mode RGBA5650 Z15 S1
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 248.876 MPix/s
2 124.886 MPix/s

----Unfiltered----------------------------------
1 247.004 MPix/s
2 124.662 MPix/s

----Bilinear filter-----------------------------
1 249.025 MPix/s
2 123.284 MPix/s

----Trilinear filter----------------------------
1 135.657 MPix/s
2 66.595 MPix/s



Geometry
Mode RGBA5650 Z15 S1
--Plain vertices--------------------------------
Fan 10.591 MTris/s
List 5.340 MTris/s
Clip 1.486 MTris/s

--Vertex shading speed--------------------------
LightD1 14.969 MVerts/s
LightP1 14.968 MVerts/s
LightP8 14.925 MVerts/s


Precision
Error no pixel format

zeckensack
2003-03-27, 12:24:38
Originally posted by Stefan Payne
G400/16SD

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height 16

----in color buffer-----------------------------
Width 8
Height none

----in depth buffer-----------------------------
Width 4
Height 4

----in stencil buffer---------------------------
Width 4
Height 16

Könnte ich davon bitte mal 'den gnarf' sehen?

zeckensack
2003-03-27, 12:26:41
Originally posted by Stefan Payne
ArchMark 0.10.09alpha
Driver GeForce3/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 60.19Hz
Method Flush
Timer 1.667 GHz
Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 10
Combiner 16
Interpolator 15

PS: kann leider nicht mehr mit einer RV250 dienen... 1. Aha ... der Test muß nochmal ans Zeichenbrett ...

2. Macht nix, bzw wenig :)
Den wichtigsten Unterschied zum R200 haben wir ja schon aufgedeckt :naughty:

StefanV
2003-03-27, 12:45:22
Originally posted by zeckensack

Könnte ich davon bitte mal 'den gnarf' sehen?

1. mal sehen ;)

2. kannst du in den Gnarf auch mal die GraKa und die Version schreiben ??
Irgendwie scheint die nicht überschrieben zu werden...


-----------
64 - 546.822327
64o - 581.799683
32 - 526.078979
32o - 526.307068
16 - 419.330200
16o - 419.456818
8 - 266.438446
8o - 267.229431
4 - 142.420853
4o - 139.987427
2 - 77.662323
2o - 77.845695

-----------
64 - 630.246399
64o - 630.311768
32 - 629.198975
32o - 629.340698
16 - 621.320068
16o - 621.187378
8 - 547.756042
8o - 547.801270
4 - 419.247772
4o - 418.052582
2 - 261.363586
2o - 261.391205

-----------
64 - 440.998169
64o - 440.198364
32 - 329.409729
32o - 329.221344
16 - 217.343567
16o - 217.433762
8 - 131.416626
8o - 131.423370
4 - 72.076958
4o - 68.917381
2 - 40.624161
2o - 40.632557

-----------
64 - 581.095581
64o - 579.249939
32 - 577.692871
32o - 580.305420
16 - 575.855652
16o - 575.878784
8 - 522.580994
8o - 521.984924
4 - 394.803589
4o - 411.139343
2 - 258.585144
2o - 258.296204

-----------
64 - 440.621735
64o - 441.021179
32 - 328.371002
32o - 327.370300
16 - 217.671204
16o - 216.853302
8 - 131.159927
8o - 131.300995
4 - 72.097557
4o - 68.929459
2 - 40.637608
2o - 40.595974

-----------
64 - 580.556763
64o - 578.714600
32 - 577.966614
32o - 579.946594
16 - 575.876892
16o - 574.009155
8 - 524.763855
8o - 522.693909
4 - 411.272491
4o - 411.394165
2 - 247.599030
2o - 258.380249

-----------
64 - 578.774780
64o - 582.341553
32 - 524.567505
32o - 526.263184
16 - 418.120056
16o - 417.045044
8 - 266.624084
8o - 266.762329
4 - 142.894577
4o - 140.287918
2 - 77.883797
2o - 77.840096

-----------
64 - 630.187561
64o - 630.232239
32 - 629.270874
32o - 629.402588
16 - 621.267883
16o - 591.689270
8 - 539.887146
8o - 547.671448
4 - 419.135529
4o - 418.064087
2 - 261.399445
2o - 261.430695

zeckensack
2003-03-27, 13:00:49
Originally posted by Stefan Payne
1. mal sehen ;)

2. kannst du in den Gnarf auch mal die GraKa und die Version schreiben ??
Irgendwie scheint die nicht überschrieben zu werden...
1. Die Datei ist nicht vom gleichen Lauf wie die Ergebnisse oben. Warum schwankt das bei dir eigentlich immer so stark???
Wenn ich die Erkennungsschwelle hoch genug setze, um diese Sachen zu übersehen, dann wird zB auf meiner MX nichts mehr erkannt. Da ist aber definitiv was, wenn ich den Benchmark wiederhole, weichen die Ergebnisse nie um mehr als 0,1% (!!) ab.

2. das Dingens ist nur eine Debugging-Krücke, und hängt nicht am Logging-System. Wird bei jedem Durchlauf des Tiling-Tests neu erzeugt, also gilt der zuletzt gemachte Test. Von der Füllrate her müßte das aber die G400 sein.

StefanV
2003-03-27, 13:12:43
Originally posted by zeckensack

1. Die Datei ist nicht vom gleichen Lauf wie die Ergebnisse oben. Warum schwankt das bei dir eigentlich immer so stark???
Wenn ich die Erkennungsschwelle hoch genug setze, um diese Sachen zu übersehen, dann wird zB auf meiner MX nichts mehr erkannt. Da ist aber definitiv was, wenn ich den Benchmark wiederhole, weichen die Ergebnisse nie um mehr als 0,1% (!!) ab.

2. das Dingens ist nur eine Debugging-Krücke, und hängt nicht am Logging-System. Wird bei jedem Durchlauf des Tiling-Tests neu erzeugt, also gilt der zuletzt gemachte Test. Von der Füllrate her müßte das aber die G400 sein.


1. richtig, ich hab die Datei aus dem lauf umbenannt...
Hm, kanns daran liegen, daß du Windows 98 hast und ich Windows 2000 bzw XP (G400 -> W2k, GF3 -> XP)?

2. ah, mich haben nur die (teilweise) recht hohen Werte etwas verwundert.
PS: falls es hilft, hier ein weiterer Durchlauf mit der NV20:

ArchMark 0.10.09alpha
Driver GeForce3/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 60.66Hz
Method Flush
Timer 1.667 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 14.546 GB/s
Color 8.339 GB/s
ZAndStencil 57.044 GB/s
Z 42.873 GB/s
Stencil 14.290 GB/s

Draw 10.199 GB/s
BurnedByRAMDAC 190.293 MB/s
Physical 10.389 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height 4

----in color buffer-----------------------------
Width 4
Height 4

----in depth buffer-----------------------------
Width 4
Height 4

----in stencil buffer---------------------------
Width 4
Height 4



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 969.605 MPix/s
Z 969.654 MPix/s
ColorAndZ 969.665 MPix/s
ZTest 947.485 MPix/s
ZCullLEqual 2.184 GPix/s
ZCullGEqual 2.180 GPix/s
ZCullEqual 968.536 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z24 S0
Color 967.750 MPix/s
Z 969.645 MPix/s
ColorAndZ 969.669 MPix/s
ZTest 969.603 MPix/s
ZCullLEqual 2.194 GPix/s
ZCullGEqual 2.191 GPix/s
ZCullEqual 969.697 MPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 969.567 MPix/s
2 969.238 MPix/s
3 485.429 MPix/s
4 485.420 MPix/s

----Unfiltered----------------------------------
1 969.596 MPix/s
2 968.649 MPix/s
3 485.421 MPix/s
4 485.423 MPix/s

----Bilinear filter-----------------------------
1 969.619 MPix/s
2 969.668 MPix/s
3 485.432 MPix/s
4 485.430 MPix/s

----Trilinear filter----------------------------
1 969.631 MPix/s
2 485.332 MPix/s
3 323.626 MPix/s
4 242.742 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 28.850 MTris/s
List 9.735 MTris/s
Clip 10.030 MTris/s

--Vertex shading speed--------------------------
LightD1 20.562 MVerts/s
LightP1 9.362 MVerts/s
LightP8 3.688 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 10
Combiner 16
Interpolator 15

Endorphine
2003-03-27, 13:53:41
Stefan Payne mit NV20, NV25, NV15? Was denn noch alles? GeForce Payne? *eg*

@zsack:
Wären weitere R9700 Läufe noch von Wert für dich?

Endorphine
2003-03-27, 13:57:33
Matrox G400 + w2k:

ArchMark 0.10.09alpha
Driver Matrox G400 v1.1.3 Aug 30 2001
Resolution 1024x768 @ ???Hz
Method Swap
Timer 863.786 MHz

Bandwidth
Mode RGBA5650 Z15 S1
--bandwidth-------------------------------------
----available to buffer clears------------------
All 661.200 MB/s
Color 1.808 GB/s
ZAndStencil 404.758 MB/s
Z 756.880 MB/s
Stencil 50.485 MB/s

Draw 1.693 GB/s
BurnedByRAMDAC 133.693 MB/s
Physical 1.827 GB/s


Tiling
Mode RGBA5650 Z15 S1
--preferred block alignment---------------------
----updating all buffers------------------------
Width 8
Height none

----in color buffer-----------------------------
Width 8
Height none

----in depth buffer-----------------------------
Width 8
Height none

----in stencil buffer---------------------------
Width 8
Height none



Fillrate
--16 bits---------------------------------------
Mode RGBA5650 Z15 S1
Color 238.885 MPix/s
Z 238.974 MPix/s
ColorAndZ 238.875 MPix/s
ZTest 233.618 MPix/s
ZCullLEqual 235.235 MPix/s
ZCullGEqual 235.301 MPix/s
ZCullEqual 235.849 MPix/s


Texturing
Mode RGBA5650 Z15 S1
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 237.673 MPix/s
2 119.254 MPix/s

----Unfiltered----------------------------------
1 237.842 MPix/s
2 119.271 MPix/s

----Bilinear filter-----------------------------
1 237.846 MPix/s
2 119.272 MPix/s

----Trilinear filter----------------------------
1 129.976 MPix/s
2 65.127 MPix/s



Geometry
Mode RGBA5650 Z15 S1
--Plain vertices--------------------------------
Fan 6.014 MTris/s
List 3.308 MTris/s
Clip 646.306 kTris/s

--Vertex shading speed--------------------------
LightD1 6.826 MVerts/s
LightP1 6.864 MVerts/s
LightP8 6.855 MVerts/s


Precision
Mode RGBA5650 Z15 S1
--fraction bits---------------------------------
AlphaTest 8.800

StefanV
2003-03-27, 14:06:19
Originally posted by Endorphine
Stefan Payne mit NV20, NV25, NV15? Was denn noch alles? GeForce Payne? *eg*


nein, hab momentan 'nur' eine NV20 und 'bald' (morgen oder übermorgen) eine NV17...

[edit]

Du musst noch ein Häckchen in den MGA Optionen machen, Endo.
Der Archmark mag 32bit mit 16bit Z nicht...

Endorphine
2003-03-27, 14:15:08
Wenn du mal Lust hast, nen Unix-Port von Archmark zu erstellen Zeckensack - ich könnte den Bench dann auch mal auf der Kiste laufen lassen: http://www.hp.com/workstations/risc/standard/bclass/summary.html

http://ascii24.com/news/i/hard/article/2001/07/09/images/images653159.jpg

zeckensack
2003-03-27, 14:16:24
Originally posted by Stefan Payne


1. richtig, ich hab die Datei aus dem lauf umbenannt...
Hm, kanns daran liegen, daß du Windows 98 hast und ich Windows 2000 bzw XP (G400 -> W2k, GF3 -> XP)?

2. ah, mich haben nur die (teilweise) recht hohen Werte etwas verwundert.
PS: falls es hilft, hier ein weiterer Durchlauf mit der NV20:

<...>
1. Könnte sein :)

2. Die Zahlen in 'gnarf.txt' sind fps, keine direkte Füllrate. '64' verbraucht in der Default-Auflösung ~0,4MPix/Frame, allerdings kann der theoretische Spitzenwert nicht so gut erreicht werden wie im echten Füllratentest. 0,4*550=220MPix/s. Paßt auf jeden Fall besser zur G400 als zur Gf3 ;)

ad PS: immerhin scheint der Tiling-Test auf der Gf3 stabil zu sein :)

zeckensack
2003-03-27, 14:18:26
Originally posted by Endorphine
@zsack:
Wären weitere R9700 Läufe noch von Wert für dich? Japp. Tiling wäre spannend, weil das Meßverfahren wieder neu ist.
Der Präzisionstest ist wie's im Moment aussieht mehr oder weniger für die Tonne. Und ansonsten hat sich nix getan, die anderen Ergebnisse können wir uns also eigentlich schenken.

Endorphine
2003-03-27, 14:19:25
Originally posted by Stefan Payne
Du musst noch ein Häckchen in den MGA Optionen machen, Endo.
Der Archmark mag 32bit mit 16bit Z nicht...
Oh, stimmt...

Ich werde mein Posting oben mal editieren. Danke!

zeckensack
2003-03-27, 14:20:35
Originally posted by Endorphine
Wenn du mal Lust hast, nen Unix-Port von Archmark zu erstellen Zeckensack - ich könnte den Bench dann auch mal auf der Kiste laufen lassen: http://www.hp.com/workstations/risc/standard/bclass/summary.htmlErstmal nicht *eg*

StefanV
2003-03-27, 14:27:34
Originally posted by Endorphine

Oh, stimmt...

Ich werde mein Posting oben mal editieren. Danke!

Hm, der Treiber scheint uralt zu sein, kannst du den nicht mal updaten ?? ;)

PS: ist das eine G400/32SG ??

Endorphine
2003-03-27, 14:37:15
Originally posted by Stefan Payne
Hm, der Treiber scheint uralt zu sein, kannst du den nicht mal updaten ?? ;)

PS: ist das eine G400/32SG ?? Wenn ich hier beginne, etwas zu "updaten" oder gar Einstellungen zu "verändern" kommt hier ganz schnell der Rechnerpoolzuständige angeschossen und möchte mir gewaltig auf die Finger klopfen *eg*

Das is ne G450 Dualhead (2x analog). Wird wohl 64-Bit DDR-SGRAM sein, oder? Ich mach hier nix auf, hab den Bench nur mal aus Spass laufen lassen... :)

p.s. @zsack: Is der Passwortschutz aus dem Archmark-ZIP mit Absicht raus? Da kam vorhin keine Abfrage...

Achill
2003-03-27, 15:05:14
zecki, du musst ja nur etwas sagen ...

ArchMark 0.10.09alpha
Driver Radeon 9700 Pro x86/SSE2 v1.3.3604 Win2000 Release
Resolution 1024x768 @ ???Hz
Method Swap
Timer 2.405 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 18.313 GB/s
Color 9.687 GB/s
ZAndStencil 79.363 GB/s
Z 59.316 GB/s
Stencil 2.133 GB/s

Draw 18.758 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 19.026 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 64
Height 32

----in color buffer-----------------------------
Width 4
Height 32

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 2.374 GPix/s
Z 2.466 GPix/s
ColorAndZ 2.375 GPix/s
ZTest 1.760 GPix/s
ZCullLEqual 5.535 GPix/s
ZCullGEqual 5.796 GPix/s
ZCullEqual 2.466 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 2.465 GPix/s
Z 2.466 GPix/s
ColorAndZ 2.466 GPix/s
ZTest 1.908 GPix/s
ZCullLEqual 6.065 GPix/s
ZCullGEqual 6.066 GPix/s
ZCullEqual 2.466 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 2.465 GPix/s
2 1.257 GPix/s
3 844.090 MPix/s
4 641.925 MPix/s
5 513.840 MPix/s
6 414.242 MPix/s
7 367.417 MPix/s
8 321.671 MPix/s

----Unfiltered----------------------------------
1 2.465 GPix/s
2 1.258 GPix/s
3 844.413 MPix/s
4 642.098 MPix/s
5 513.999 MPix/s
6 428.589 MPix/s
7 367.593 MPix/s
8 321.837 MPix/s

----Bilinear filter-----------------------------
1 2.462 GPix/s
2 1.258 GPix/s
3 841.266 MPix/s
4 642.107 MPix/s
5 514.009 MPix/s
6 428.594 MPix/s
7 367.604 MPix/s
8 321.844 MPix/s

----Trilinear filter----------------------------
1 1.258 GPix/s
2 635.781 MPix/s
3 425.776 MPix/s
4 320.250 MPix/s
5 256.766 MPix/s
6 214.362 MPix/s
7 184.055 MPix/s
8 161.288 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 61.154 MTris/s
List 42.498 MTris/s
Clip 2.477 MTris/s

--Vertex shading speed--------------------------
LightD1 90.565 MVerts/s
LightP1 38.955 MVerts/s
LightP8 14.664 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
AlphaTest 9.400
Combiner 24
Interpolator 21

-----------
64 - 3689.695801
64o - 3640.662109
32 - 2618.559326
32o - 3321.853760
16 - 2115.013916
16o - 2770.125732
8 - 2316.570068
8o - 2613.426514
4 - 2712.679932
4o - 1186.793335
2 - 1604.580322
2o - 1607.174194

-----------
64 - 5865.941406
64o - 5810.503418
32 - 5577.220215
32o - 5443.285156
16 - 5265.820313
16o - 5252.393066
8 - 4627.413086
8o - 4791.386230
4 - 4348.900879
4o - 2576.602539
2 - 2629.482422
2o - 2589.346924

-----------
64 - 6336.427246
64o - 6268.937012
32 - 6123.535156
32o - 6104.370605
16 - 5702.380859
16o - 5835.670898
8 - 5125.271973
8o - 5108.478516
4 - 4223.136230
4o - 4213.445801
2 - 3058.430664
2o - 2173.234863

-----------
64 - 6337.740234
64o - 6314.216309
32 - 6197.456543
32o - 6218.564453
16 - 6022.974121
16o - 6042.703125
8 - 5697.427734
8o - 5676.870117
4 - 5079.196289
4o - 5032.596680
2 - 4051.711426
2o - 2605.963379

-----------
64 - 6336.402832
64o - 6268.891113
32 - 6122.965820
32o - 6104.611816
16 - 5702.742676
16o - 5835.571289
8 - 5125.240234
8o - 5108.276367
4 - 4223.120605
4o - 4213.498047
2 - 3059.420654
2o - 2173.220703

-----------
64 - 6337.895996
64o - 6313.986328
32 - 5862.087402
32o - 6218.279297
16 - 6022.977539
16o - 6042.700684
8 - 5697.615723
8o - 5676.778320
4 - 5079.218750
4o - 5032.698730
2 - 4051.817627
2o - 2605.993896

-----------
64 - 3700.031006
64o - 3634.208252
32 - 2624.062500
32o - 3314.866943
16 - 2112.379639
16o - 2765.079102
8 - 2312.802979
8o - 2631.821777
4 - 2717.507324
4o - 1198.275269
2 - 1609.796509
2o - 1596.180908

-----------
64 - 5856.240723
64o - 5822.179199
32 - 5584.550293
32o - 5494.183105
16 - 5243.616699
16o - 5285.388184
8 - 4619.448242
8o - 4804.478027
4 - 4338.670898
4o - 2580.466309
2 - 2625.878662
2o - 2593.116211

Achill
2003-03-27, 15:07:02
ArchMark 0.10.09alpha
Driver Radeon 9700 Pro x86/SSE2 v1.3.3604 Win2000 Release
Resolution 1024x768 @ ???Hz
Method Flush
Timer 2.405 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 18.468 GB/s
Color 9.962 GB/s
ZAndStencil 116.480 GB/s
Z 87.172 GB/s
Stencil 2.176 GB/s

Draw 19.966 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 20.234 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 64
Height 4

----in color buffer-----------------------------
Width 4
Height 32

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 2.438 GPix/s
Z 2.555 GPix/s
ColorAndZ 2.439 GPix/s
ZTest 1.740 GPix/s
ZCullLEqual 6.047 GPix/s
ZCullGEqual 6.030 GPix/s
ZCullEqual 2.543 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 2.531 GPix/s
Z 2.555 GPix/s
ColorAndZ 2.531 GPix/s
ZTest 1.934 GPix/s
ZCullLEqual 6.625 GPix/s
ZCullGEqual 6.596 GPix/s
ZCullEqual 2.543 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 2.506 GPix/s
2 1.278 GPix/s
3 854.841 MPix/s
4 642.195 MPix/s
5 514.237 MPix/s
6 428.808 MPix/s
7 367.744 MPix/s
8 321.975 MPix/s

----Unfiltered----------------------------------
1 2.502 GPix/s
2 1.277 GPix/s
3 854.464 MPix/s
4 642.007 MPix/s
5 514.189 MPix/s
6 428.818 MPix/s
7 367.743 MPix/s
8 321.987 MPix/s

----Bilinear filter-----------------------------
1 2.507 GPix/s
2 1.278 GPix/s
3 855.009 MPix/s
4 642.306 MPix/s
5 514.394 MPix/s
6 428.953 MPix/s
7 367.839 MPix/s
8 322.057 MPix/s

----Trilinear filter----------------------------
1 1.269 GPix/s
2 637.972 MPix/s
3 425.917 MPix/s
4 319.680 MPix/s
5 255.944 MPix/s
6 213.352 MPix/s
7 182.911 MPix/s
8 160.126 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 61.152 MTris/s
List 42.498 MTris/s
Clip 2.477 MTris/s

--Vertex shading speed--------------------------
LightD1 90.560 MVerts/s
LightP1 38.948 MVerts/s
LightP8 14.664 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
AlphaTest 9.400
Combiner 24
Interpolator 21

-----------
64 - 2772.786865
64o - 3640.777100
32 - 2618.604004
32o - 3321.067139
16 - 2123.983643
16o - 2769.409912
8 - 2319.764404
8o - 2633.242676
4 - 2712.405029
4o - 1201.307373
2 - 1610.195679
2o - 1596.127563

-----------
64 - 5862.087891
64o - 5786.251953
32 - 5575.811523
32o - 5418.751953
16 - 5265.966797
16o - 5260.525391
8 - 4628.532227
8o - 4791.294922
4 - 4349.067871
4o - 2576.985596
2 - 2629.312988
2o - 2589.475098

-----------
64 - 6336.879395
64o - 6269.096191
32 - 6123.927246
32o - 6104.477539
16 - 5702.915039
16o - 5835.754395
8 - 5125.287598
8o - 5108.519531
4 - 4223.128906
4o - 4213.361816
2 - 3059.489014
2o - 2173.267822

-----------
64 - 6338.347656
64o - 6314.479004
32 - 6197.665039
32o - 6218.994141
16 - 6023.162598
16o - 6043.064941
8 - 5697.661133
8o - 5677.083984
4 - 5079.532715
4o - 5032.925781
2 - 4051.847900
2o - 2605.987305

-----------
64 - 6336.767090
64o - 6269.003418
32 - 6122.726074
32o - 6104.618652
16 - 5702.760254
16o - 5835.715332
8 - 5125.356445
8o - 5108.516113
4 - 4223.169922
4o - 4213.401367
2 - 3059.338135
2o - 2173.222656

-----------
64 - 6338.258789
64o - 6314.472656
32 - 6197.921387
32o - 6218.647949
16 - 6023.179688
16o - 6043.039551
8 - 5697.722168
8o - 5677.098633
4 - 5079.585938
4o - 5032.934082
2 - 4051.893799
2o - 2605.982666

-----------
64 - 3699.164307
64o - 3632.573975
32 - 2629.961426
32o - 3315.749268
16 - 2118.645264
16o - 2766.661621
8 - 2321.210938
8o - 2624.077148
4 - 2715.196289
4o - 1189.361328
2 - 1611.392334
2o - 1599.815063

-----------
64 - 5844.400879
64o - 5802.300293
32 - 5534.131348
32o - 5494.446777
16 - 5241.078613
16o - 5281.915527
8 - 4620.170410
8o - 4803.889648
4 - 4338.836426
4o - 2580.847412
2 - 2625.634766
2o - 2593.164795

Achill
2003-03-27, 15:10:46
kleine Frage,

kann die Farbkoprimierung des R300 die Werte beim Tiling verfälsch, da es ja immer die gleiche Farbe sollte es also ideal koprimierbar sein und evtl. verfälscht dies die Bestimmung - hab aber keine ahnung ob es sein könnte - mir kam nur die idee weil tiling-test wieder bescheiden aussieht ...

ow
2003-03-27, 15:37:28
Originally posted by Achill
kleine Frage,

kann die Farbkoprimierung des R300 die Werte beim Tiling verfälsch, da es ja immer die gleiche Farbe sollte es also ideal koprimierbar sein und evtl. verfälscht dies die Bestimmung - hab aber keine ahnung ob es sein könnte - mir kam nur die idee weil tiling-test wieder bescheiden aussieht ...


Nein, die Farbkomprimiereung ist nur bei AA aktiv. Da hier ohne AA gemessen wird wirkt keine Farbkompression.

Quasar
2003-03-27, 16:17:42
Was mir vorher noch gar nicht aufgefallen ist:
Hatten einige hier vor einiger Zeit nichtmal aufgrund von Demi's Program dem R300 Tri-TMUs attestieren wollen?

ow
2003-03-27, 16:35:04
Originally posted by Quasar
Was mir vorher noch gar nicht aufgefallen ist:
Hatten einige hier vor einiger Zeit nichtmal aufgrund von Demi's Program dem R300 Tri-TMUs attestieren wollen?


Nein, aber der RV250 aka R9000 hat wohl tri-TMUs. Erstaunlicherweise.

Quasar
2003-03-27, 16:49:13
Originally posted by ow



Nein, aber der RV250 aka R9000 hat wohl tri-TMUs. Erstaunlicherweise.

Nein, nicht in diesem Thread... :) (Kamen die Ergebnisse nicht von Payne? Kein Vorwurf, aber er hat ja so manch seltsames Resultat herausbekommen....)

Ich muss leider weg, aber ich such's heut Nacht mal raus. Es war ein selbstgebasteltes Programm und aus dessen Resultaten wollten etliche Forumsuser dem R300 Tri-TMUs zuschreiben IIRC.

askibo
2003-03-27, 17:07:37
Originally posted by zeckensack
Japp. Tiling wäre spannend, weil das Meßverfahren wieder neu ist.


Neue Kyrowerte :)

ArchMark 0.10.09alpha
Driver PowerVR KYRO v1.2.1
Resolution 1024x768 @ 62.18Hz
Method Swap
Timer 807.188 MHz

Bandwidth

Tiling
Mode RGBA8888 Z32 S4
--preferred block alignment---------------------
----updating all buffers------------------------
Width 64
Height 64

----in color buffer-----------------------------
Width 32
Height 64

----in depth buffer-----------------------------
Width 64
Height 64

----in stencil buffer---------------------------
Width 64
Height 64



Fillrate

Texturing

Geometry

Precision



gnarf.txt
-----------
64 - 228.045776
64o - 238.358322
32 - 222.982422
32o - 198.174484
16 - 193.253571
16o - 183.224243
8 - 178.721283
8o - 171.107956
4 - 155.683487
4o - 149.383606
2 - 122.494774
2o - 123.350845

-----------
64 - 273.571808
64o - 241.979599
32 - 240.974533
32o - 241.457260
16 - 240.749100
16o - 224.322083
8 - 211.773422
8o - 211.767853
4 - 210.667191
4o - 201.620514
2 - 197.935669
2o - 192.973679

-----------
64 - 207.236816
64o - 182.237991
32 - 177.293427
32o - 178.409637
16 - 174.164886
16o - 174.790573
8 - 167.489532
8o - 166.571198
4 - 154.726730
4o - 152.383652
2 - 132.304413
2o - 131.603745

-----------
64 - 209.849121
64o - 180.313812
32 - 181.883820
32o - 181.785934
16 - 179.730621
16o - 181.328308
8 - 179.992767
8o - 178.085373
4 - 175.825531
4o - 177.289764
2 - 172.363281
2o - 170.684860

-----------
64 - 207.739105
64o - 178.883270
32 - 180.581238
32o - 176.821625
16 - 174.022614
16o - 176.760864
8 - 167.110870
8o - 166.637985
4 - 154.645233
4o - 153.539963
2 - 130.888611
2o - 133.203308

-----------
64 - 211.611267
64o - 182.088821
32 - 182.088409
32o - 182.072281
16 - 181.319138
16o - 179.806702
8 - 181.176712
8o - 181.282730
4 - 177.434601
4o - 177.346863
2 - 172.406708
2o - 170.675156

-----------
64 - 270.733673
64o - 236.146088
32 - 230.008041
32o - 200.150711
16 - 193.622604
16o - 184.854446
8 - 178.658264
8o - 169.554123
4 - 156.248810
4o - 149.269714
2 - 117.902077
2o - 123.331093

-----------
64 - 273.560333
64o - 242.196762
32 - 241.574295
32o - 239.586212
16 - 240.576965
16o - 224.414597
8 - 211.666275
8o - 211.807251
4 - 208.879745
4o - 203.304825
2 - 197.858673
2o - 192.846100

Demirug
2003-03-27, 17:14:11
Originally posted by Quasar
Was mir vorher noch gar nicht aufgefallen ist:
Hatten einige hier vor einiger Zeit nichtmal aufgrund von Demi's Program dem R300 Tri-TMUs attestieren wollen?

Ein Programm von mir kann es eigentlich nicht gewesen sein. Das einzige Testprogramm von mir das Mip-Map Level bei den Texturen hat ist der AF-Tester und der hat keine Performances Messung.

Endorphine
2003-03-27, 17:33:18
Originally posted by Demirug
Ein Programm von mir kann es eigentlich nicht gewesen sein. Das einzige Testprogramm von mir das Mip-Map Level bei den Texturen hat ist der AF-Tester und der hat keine Performances Messung. Du könntest ja nen TMU-Tester schreiben, der nachweisen könnte, was die Renderingpipelines so vermögen :naughty:

Das wäre ne echte Marktlücke hier :)

ow
2003-03-27, 17:46:00
Originally posted by Endorphine
Du könntest ja nen TMU-Tester schreiben, der nachweisen könnte, was die Renderingpipelines so vermögen :naughty:

Das wäre ne echte Marktlücke hier :)


Ich dachte da zunächst eher an eine komlette D3D-Portierung des archmark. In beiden APis natürlich mit TMU-Tester.:D;)

loewe
2003-03-27, 20:30:11
und noch einmal KYRO II @ 185 MHz

ArchMark 0.10.09alpha
Driver PowerVR KYRO v1.2.1
Resolution 1024x768 @ 61.69Hz
Method Flush
Timer 1.537 GHz

Bandwidth
Mode RGBA8888 Z32 S4
--bandwidth-------------------------------------
----available to buffer clears------------------
All 2.447 GB/s
Color 1.159 GB/s
ZAndStencil 701.898 MB/s
Z 635.135 MB/s
Stencil 78.006 MB/s

Draw 2.244 GB/s
BurnedByRAMDAC 193.798 MB/s
Physical 2.438 GB/s


Tiling
Mode RGBA8888 Z32 S4
--preferred block alignment---------------------
----updating all buffers------------------------
Width 64
Height 64

----in color buffer-----------------------------
Width 64
Height 64

----in depth buffer-----------------------------
Width 64
Height 64

----in stencil buffer---------------------------
Width 64
Height 64



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z32 S4
Color 283.850 MPix/s
Z 157.284 MPix/s
ColorAndZ 275.807 MPix/s
ZTest 200.179 MPix/s
ZCullLEqual 286.839 MPix/s
ZCullGEqual 159.367 MPix/s
ZCullEqual 158.753 MPix/s

--16 bits---------------------------------------
Mode RGBA8888 Z16 S0
Color 362.683 MPix/s
Z 263.126 MPix/s
ColorAndZ 357.978 MPix/s
ZTest 303.558 MPix/s
ZCullLEqual 365.669 MPix/s
ZCullGEqual 273.965 MPix/s
ZCullEqual 265.362 MPix/s


Texturing
Mode RGBA8888 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 365.356 MPix/s
2 182.191 MPix/s
3 119.776 MPix/s
4 88.475 MPix/s

----Unfiltered----------------------------------
1 360.987 MPix/s
2 182.175 MPix/s
3 121.800 MPix/s
4 91.380 MPix/s

----Bilinear filter-----------------------------
1 360.953 MPix/s
2 182.173 MPix/s
3 121.796 MPix/s
4 91.478 MPix/s

----Trilinear filter----------------------------
1 185.145 MPix/s
2 94.461 MPix/s
3 64.058 MPix/s
4 48.885 MPix/s



Geometry
Mode RGBA8888 Z0 S0
--Plain vertices--------------------------------
Fan 1.232 MTris/s
List 613.027 kTris/s
Clip 613.057 kTris/s

--Vertex shading speed--------------------------
LightD1 1.846 MVerts/s
LightP1 1.838 MVerts/s
LightP8 1.073 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 8
Combiner 14
Interpolator 6



und die gnarf.txt

-----------
64 - 285.218842
64o - 253.098190
32 - 242.464828
32o - 212.145401
16 - 206.821365
16o - 197.309235
8 - 193.209061
8o - 182.547684
4 - 168.762817
4o - 161.054306
2 - 133.355484
2o - 131.762009

-----------
64 - 296.145782
64o - 260.922150
32 - 260.286865
32o - 258.142365
16 - 259.711426
16o - 242.596527
8 - 229.855362
8o - 227.925018
4 - 225.127213
4o - 218.193314
2 - 218.272614
2o - 207.100052

-----------
64 - 223.099060
64o - 195.832016
32 - 189.792786
32o - 193.186462
16 - 191.484360
16o - 188.611023
8 - 181.143585
8o - 181.034042
4 - 165.028885
4o - 165.830215
2 - 143.301422
2o - 142.962830

-----------
64 - 227.500763
64o - 195.951904
32 - 197.420258
32o - 195.650604
16 - 195.102066
16o - 195.143875
8 - 195.020569
8o - 194.932068
4 - 192.884949
4o - 191.476761
2 - 186.899368
2o - 183.580795

-----------
64 - 224.977066
64o - 194.240509
32 - 193.604294
32o - 190.922928
16 - 188.153671
16o - 191.818008
8 - 181.123596
8o - 182.345627
4 - 166.472443
4o - 165.861420
2 - 142.032135
2o - 144.041855

-----------
64 - 225.526321
64o - 199.380280
32 - 195.501068
32o - 195.672745
16 - 195.207962
16o - 195.211060
8 - 195.033844
8o - 195.031738
4 - 191.503525
4o - 192.824646
2 - 182.138779
2o - 183.648193

-----------
64 - 285.216064
64o - 255.510284
32 - 245.985123
32o - 212.228012
16 - 206.758636
16o - 195.520599
8 - 193.299774
8o - 182.489258
4 - 167.382126
4o - 159.772400
2 - 133.292572
2o - 132.840729

-----------
64 - 296.089294
64o - 260.778198
32 - 260.295410
32o - 258.169800
16 - 261.699921
16o - 242.722351
8 - 229.852264
8o - 227.941040
4 - 223.274460
4o - 218.234299
2 - 218.277359
2o - 207.140381


BTW, hättest du auch noch mit 128 Pixel getestet, dann wäre es 128 geworden. Ich denke mal die HSR Einheit ist so nicht zu überlisten. Du hast keinen Overdraw, damit hast du doch in allen Tiles immer nur sehr wenige Dreiecke, damit wird die Einheit immer fertig ohne sich anstrengen zu müssen. Bietest du große Dreiecke, dann ist auch die Füllrate ma größten, da am meisten Pixel gezeichnet werden müssen. Die Aufteilung deiner Dreiecke auf die Tiles ist kein Problem.

Mal ne andere Idee, kann ja blöd sein aber trotzdem. :))

Die Füllrate allein tut es eher nicht. Du müßtest doch die besten Werte bekommen, wenn es dir gelingt die Binning-Einheit arbeitslos zu machen und gleichzeitig nur je ein Rechteck je Tile zu haben.
Vorschlag:
Du bedeckst immer den kompletten Bildschirm mit Rechtecken von 2x2, 2x4, 2x8, 2x16, 2x32, 2x64, 4x2, 4x4, ..., 64x64 Pixel Rechtecke. Von unten her müßte die Füllrate immer besser werden bis du bei der richtigen Tile-Größe bist. Binning spielt zwar eher keine Rolle aber du hast je mehr Dreiecke im Tile. Wenn du über die echte Tilegröße gehst bleibt zwar die Anzahl der Dreiecke je Tile konstant, dafür braucht das Binning aber Zeit.
Wenn die Last für die HSR-Einheit zu klein ist, arbeite doch mit mit mehreren über einanderliegenden durchsichtigen Rechtecken.

zeckensack
2003-03-27, 20:42:03
loewe,

erstmal Danke für die aktuellen Daten.
Das funktioniert im Moment so:
1)
Streifen malen, 64 Pixel breit. Benchen. ('64')
Nochmal Streifen malen, gleiche Breite, aber diesmal um 32 Pixel verschoben. ('64o')
2)
Streifen malen, 32 Pixel breit. Benchen. ('32')
Nochmal Streifen malen, gleiche Breite, aber diesmal um 16 Pixel verschoben. ('32o')
.
.
.

Das hatte ich mir so vorgestellt, daß bei einem Treffer auf die Tilegröße im ersten Schritt alles optimal läuft. Es werden ganze Tiles beschrieben, und zwar vollständig. Zwischen den Streifen ist eine Lücke gleicher Breite. Dort wird nichts gezeichnet, also brauchen diese Tiles auch nicht bearbeitet zu werden.

Beim zweite Schritt, der um eine halbe Tilegröße verschoben ist, müssen jeweils zwei Tiles bearbeitet werden. Die eine Hälfte des Streifens liegt links, die andere rechts von der Tilegrenze. Von diesen Tiles wird aber jeweils nur die Hälfte geändert, sodaß effektiv Füllrate verloren geht (Effizienzverlust im Speichercontroller, weil immer nur ganze Tiles geladen und gespeichert werden).

So weit jedenfalls die Theorie. Daß es nicht hinhaut sehe ich, verstehen tue ich's noch nicht :(

Btw, seit der Urversion dieses Tests kommt bei meinem R200 immer das gleiche heraus, über alle Änderungen des Algos hinweg hat sich dort stets das gleiche abgezeichnet.
*kopfkratz*

edit: jeder Streifen ist ein einzelnes Viereck. Ich gehe mal davon aus, daß der Kyro dies optimal zerlegen kann, insofern sollte das Binning tatsächlich beinahe 'arbeitslos' sein.

loewe
2003-03-27, 21:08:04
Originally posted by zeckensack
Beim zweite Schritt, der um eine halbe Tilegröße verschoben ist, müssen jeweils zwei Tiles bearbeitet werden. Die eine Hälfte des Streifens liegt links, die andere rechts von der Tilegrenze. Von diesen Tiles wird aber jeweils nur die Hälfte geändert, sodaß effektiv Füllrate verloren geht (Effizienzverlust im Speichercontroller, weil immer nur ganze Tiles geladen und gespeichert werden).


Genau den Effiziensverlust sehe ich überhaupt nicht!
Es werden immer ganze Tiles übertragen, also 512 Pixel. Welchen Farbwert die Pixel dabei haben ist doch egal.

In die HSR Einheit gehen Dreiecke rein und es kommen komplette Tiles raus, wieviel Pixel des Tile durch die Dreiecke wirklich bedeckt werden ist doch egal, höchstens die Menge der Dreiecke spielt für die Geschwindikgeit eine Rolle.
Selbst ein völlig leerer Tile wird doch sicher durch die Einheit müssen, dann nur sehr schnell abgearbeitet.

Genau das ist doch der Grund, warum PowerVR immer mit nahezu konstanter maximaler Füllrate läuft, wenn er nicht überlastet ist.
Egal was du vorn reinsteckst an Dreiecken, hinten kommen immer komplette Tiles raus und jedes besteht nun mal aus genau 512 Pixel.

Demirug
2003-03-27, 21:09:46
Originally posted by zeckensack
Das hatte ich mir so vorgestellt, daß bei einem Treffer auf die Tilegröße im ersten Schritt alles optimal läuft. Es werden ganze Tiles beschrieben, und zwar vollständig. Zwischen den Streifen ist eine Lücke gleicher Breite. Dort wird nichts gezeichnet, also brauchen diese Tiles auch nicht bearbeitet zu werden.

Beim zweite Schritt, der um eine halbe Tilegröße verschoben ist, müssen jeweils zwei Tiles bearbeitet werden. Die eine Hälfte des Streifens liegt links, die andere rechts von der Tilegrenze. Von diesen Tiles wird aber jeweils nur die Hälfte geändert, sodaß effektiv Füllrate verloren geht (Effizienzverlust im Speichercontroller, weil immer nur ganze Tiles geladen und gespeichert werden).

So weit jedenfalls die Theorie. Daß es nicht hinhaut sehe ich, verstehen tue ich's noch nicht :(

Btw, seit der Urversion dieses Tests kommt bei meinem R200 immer das gleiche heraus, über alle Änderungen des Algos hinweg hat sich dort stets das gleiche abgezeichnet.
*kopfkratz*

edit: jeder Streifen ist ein einzelnes Viereck. Ich gehe mal davon aus, daß der Kyro dies optimal zerlegen kann, insofern sollte das Binning tatsächlich beinahe 'arbeitslos' sein.


mhm, aber aus dem Quads werden doch wohl jeweils 2 Dreiecke und die Kante die dann quer durch die Tiles läuft dürfte die Messung beeinflussen.

Demirug
2003-03-27, 21:17:28
Originally posted by loewe


Genau den Effiziensverlust sehe ich überhaupt nicht!
Es werden immer ganze Tiles übertragen, also 512 Pixel. Welchen Farbwert die Pixel dabei haben ist doch egal.

In die HSR Einheit gehen Dreiecke rein und es kommen komplette Tiles raus, wieviel Pixel des Tile durch die Dreiecke wirklich bedeckt werden ist doch egal, höchstens die Menge der Dreiecke spielt für die Geschwindikgeit eine Rolle.
Selbst ein völlig leerer Tile wird doch sicher durch die Einheit müssen, dann nur sehr schnell abgearbeitet.

nicht die Menge der Dreiecke sondern die Anzahl der Dreiecksfragmente entscheidet. Wenn man also genau die Tilegrenzen trift wird das ganze in weniger Fragmente zerlegt. Wenn aber pro Tile nicht eine mindestmenge von Fragmenten zusammenkommt braucht das Pixelshading für diese Tile mehr Takte als das HSR.

Man müsste also wohl erst mal eine ordentliche anzahl von Fragmente in jede Tile pumpen und dann noch zusätzlich die Streifen auftragen. Ansonsten bekommt man das HSR wohl nicht zum limitieren.

zeckensack
2003-03-27, 21:32:22
Originally posted by loewe
Egal was du vorn reinsteckst an Dreiecken, hinten kommen immer komplette Tiles raus und jedes besteht nun mal aus genau 512 Pixel.Aber das gilt doch nur dann, wenn überhaupt irgendwas in den von der Tile bedeckten Bereich gezeichnet wurde???
Ich zeichne auf der Hälfte des Bildes buchstäblich nichts. Warum sollte der Kyro dort eine fertige Tile rausschreiben???

Demirug
2003-03-27, 21:37:50
Originally posted by zeckensack
Aber das gilt doch nur dann, wenn überhaupt irgendwas in den von der Tile bedeckten Bereich gezeichnet wurde???
Ich zeichne auf der Hälfte des Bildes buchstäblich nichts. Warum sollte der Kyro dort eine fertige Tile rausschreiben???

Gute Frage. Wie reagieren Kyros eigentlich wenn man den Hintergrund nicht löscht? Und wenn man dann ganz gemein ist und nur mit Alphablending rendert?

zeckensack
2003-03-27, 21:41:02
Originally posted by Demirug


nicht die Menge der Dreiecke sondern die Anzahl der Dreiecksfragmente entscheidet. Wenn man also genau die Tilegrenzen trift wird das ganze in weniger Fragmente zerlegt. Wenn aber pro Tile nicht eine mindestmenge von Fragmenten zusammenkommt braucht das Pixelshading für diese Tile mehr Takte als das HSR.

Man müsste also wohl erst mal eine ordentliche anzahl von Fragmente in jede Tile pumpen und dann noch zusätzlich die Streifen auftragen. Ansonsten bekommt man das HSR wohl nicht zum limitieren. Der Angriffspunkt ist garnicht das HSR, sondern der Schreibvorgang in den Framebuffer. Die Tiling-Charakteristik sollte auch da ausgeprägt sein, wenn das Design in sich abgestimmt ist.
Nochmal umformuliert, ich suche nach Füllratenverlust, der durch suboptimalen Speicherzugriff entsteht. Also mehr in Richtung 'effektiv erreichbare' Füllrate unter bestimmten Voraussetzungen.
*grübel*
Schwer in griffige Worte zu packen :(

Echtes HSR mißt das Programm nicht, auch in den Culling-Tests (in der Füllraten-Sektion) 'darf' der Kyro seine Stärken nicht ausspielen, weil immer geflusht wird, bevor sich überhaupt Overdraw ansammeln kann.


Btw, ich habe gerade von Ikon eine Kyro 2 gekauft. Ich werde mich diesem Gerät dann so bald wie möglich ausführlich widmen :)

Demirug
2003-03-27, 22:00:21
Originally posted by zeckensack
Der Angriffspunkt ist garnicht das HSR, sondern der Schreibvorgang in den Framebuffer. Die Tiling-Charakteristik sollte auch da ausgeprägt sein, wenn das Design in sich abgestimmt ist.
Nochmal umformuliert, ich suche nach Füllratenverlust, der durch suboptimalen Speicherzugriff entsteht. Also mehr in Richtung 'effektiv erreichbare' Füllrate unter bestimmten Voraussetzungen.
*grübel*
Schwer in griffige Worte zu packen :(

Echtes HSR mißt das Programm nicht, auch in den Culling-Tests (in der Füllraten-Sektion) 'darf' der Kyro seine Stärken nicht ausspielen, weil immer geflusht wird, bevor sich überhaupt Overdraw ansammeln kann.


Btw, ich habe gerade von Ikon eine Kyro 2 gekauft. Ich werde mich diesem Gerät dann so bald wie möglich ausführlich widmen :)

Wenn ich den Test richtig verstanden habe bleibt die Anzahl der Pixel die gerendert werden konstant. Ich vermute mal stark das in den Kyros keine spezielle optimierung für leere Tiles vorhanden ist. Die Frage ist also ob das schreiben von leeren Tiles wirklich unterdrückt werden kann? Aber selbst wenn die Bandbreite sollte kaum am Limit sein.

loewe
2003-03-27, 22:44:35
Originally posted by zeckensack
Aber das gilt doch nur dann, wenn überhaupt irgendwas in den von der Tile bedeckten Bereich gezeichnet wurde???
Ich zeichne auf der Hälfte des Bildes buchstäblich nichts. Warum sollte der Kyro dort eine fertige Tile rausschreiben???

Genau das scheint aber der Punkt zu sein. KYRO schreibt immer eine komplette Tile, egal was darin passiert ist. Jede Logik die da noch irgend etwas überprüfen würde würde Zeit und Transistoren kosten.
So ist PowerVR nicht bei zu kommen.

loewe
2003-03-27, 22:59:34
Originally posted by zeckensack
Der Angriffspunkt ist garnicht das HSR, sondern der Schreibvorgang in den Framebuffer. Die Tiling-Charakteristik sollte auch da ausgeprägt sein, wenn das Design in sich abgestimmt ist.
Nochmal umformuliert, ich suche nach Füllratenverlust, der durch suboptimalen Speicherzugriff entsteht.

Ich denke es gibt hier keine "suboptimalen Speicherzugriffe", es werden immer 16 Zeilen a 32 Pixel übertragen und fertig. Wie oft kommt in realen Anwendungen der Fall vor, dass eine Tile leer ist oder nur halb gefüllt?
Das Konzept ist hoch effizient, es vermeidet sinnlose Optimierungen.

Echtes HSR mißt das Programm nicht, auch in den Culling-Tests (in der Füllraten-Sektion) 'darf' der Kyro seine Stärken nicht ausspielen, weil immer geflusht wird, bevor sich überhaupt Overdraw ansammeln kann.

Btw, ich habe gerade von Ikon eine Kyro 2 gekauft. Ich werde mich diesem Gerät dann so bald wie möglich ausführlich widmen :)


Mein Vorschlag geht aber gerade darauf hinaus, das HSR zu testen. Die Füllrate ist denke ich hier nicht der richtige Ansatzpunkt.
BTW, hättest du mal was wegen der KYRO gesagt, ich habe genug Karten davon. :)

loewe
2003-03-27, 23:08:33
Originally posted by Demirug


nicht die Menge der Dreiecke sondern die Anzahl der Dreiecksfragmente entscheidet. Wenn man also genau die Tilegrenzen trift wird das ganze in weniger Fragmente zerlegt. Wenn aber pro Tile nicht eine mindestmenge von Fragmenten zusammenkommt braucht das Pixelshading für diese Tile mehr Takte als das HSR.

Je Tile ist es egal, ob das Dreieck jetzt ein Fragment ist oder komplett. Deshalb ja auch mein Vorschlag mehr durchsichtige Rechtecke zu nehmen, damit ist die Frage Overdraw erledigt und die Menge wird sich irgend wann bemerkbar machen.

Man müsste also wohl erst mal eine ordentliche anzahl von Fragmente in jede Tile pumpen und dann noch zusätzlich die Streifen auftragen. Ansonsten bekommt man das HSR wohl nicht zum limitieren.

Wie ich schon sagte, die HSR-Einheit beschäftigen und die Fragmenterzeugung testen, dort würde ich den Ansatzpunkt suchen.

Quasar
2003-03-27, 23:19:31
Tiling bei der R9500:
ArchMark 0.10.09alpha
Driver Radeon 9500 x86/SSE2 v1.3.3604 WinXP Release
Resolution 1024x768 @ ???Hz
Method Flush
Timer 2.524 GHz

Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 4
Height 4

----in color buffer-----------------------------
Width 4
Height 4

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2

Ist bei mir 100% identisch zu Version 0.10.04a....


edit:
Die "gnarf.txt"

-----------
64 - 2354.282227
64o - 2411.762939
32 - 1745.276001
32o - 2098.869873
16 - 1234.213745
16o - 1754.012207
8 - 1424.249634
8o - 1652.500610
4 - 1557.009399
4o - 807.066162
2 - 925.640320
2o - 946.872192

-----------
64 - 2610.121094
64o - 2600.833740
32 - 2494.666748
32o - 2481.085693
16 - 2301.363281
16o - 2294.563965
8 - 2004.985474
8o - 2039.455811
4 - 1716.837891
4o - 1113.288818
2 - 1122.598999
2o - 1113.992798

-----------
64 - 2723.970215
64o - 2717.235596
32 - 2672.705078
32o - 2673.969727
16 - 2591.632568
16o - 2592.243652
8 - 2439.006836
8o - 2439.958008
4 - 2160.881348
4o - 2162.667969
2 - 1709.423950
2o - 1116.718628

-----------
64 - 2726.062744
64o - 2714.776855
32 - 2676.664307
32o - 2674.113525
16 - 2597.756592
16o - 2597.242188
8 - 2456.112061
8o - 2439.290771
4 - 2188.450684
4o - 2161.079102
2 - 1743.091919
2o - 1114.988037

-----------
64 - 2722.054932
64o - 2717.080078
32 - 2672.687500
32o - 2673.835205
16 - 2591.955566
16o - 2594.389404
8 - 2439.190186
8o - 2439.856201
4 - 2161.322021
4o - 2161.119629
2 - 1709.499268
2o - 1116.753784

-----------
64 - 2725.862549
64o - 2714.502930
32 - 2674.545410
32o - 2674.086670
16 - 2597.771729
16o - 2597.112549
8 - 2456.170410
8o - 2439.033203
4 - 2188.210938
4o - 2161.405518
2 - 1743.045898
2o - 1113.751099

-----------
64 - 2413.590820
64o - 2412.268799
32 - 1744.080811
32o - 2099.979980
16 - 1233.615601
16o - 1755.168701
8 - 1423.379517
8o - 1653.551147
4 - 1556.468628
4o - 807.186768
2 - 925.522400
2o - 947.251465

-----------
64 - 2612.383301
64o - 2600.843994
32 - 2494.527100
32o - 2480.498535
16 - 2302.035645
16o - 2292.593018
8 - 2005.304688
8o - 2039.474976
4 - 1718.286011
4o - 1112.907471
2 - 1122.842773
2o - 1113.537354

Endorphine
2003-03-28, 00:38:27
Tiling 9700NP @ Standardclocks:
ArchMark 0.10.09alpha
Driver Radeon 9700 x86/SSE2 v1.3.3604 WinXP Release
Resolution 1024x768 @ 86.22Hz
Method Flush
Timer 2.289 GHz

Bandwidth

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height 4

----in color buffer-----------------------------
Width 4
Height 32

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2gnarf.txt:-----------
64 - 3190.871826
64o - 3162.403320
32 - 2277.412354
32o - 2884.488770
16 - 1841.944214
16o - 2404.658203
8 - 2022.003540
8o - 2309.565674
4 - 2329.213867
4o - 1050.434204
2 - 1393.879761
2o - 1388.012329

-----------
64 - 5075.213867
64o - 5018.199219
32 - 4806.683105
32o - 4722.916504
16 - 4538.802246
16o - 4553.139160
8 - 3951.079834
8o - 4095.814453
4 - 3716.375000
4o - 2201.584229
2 - 2246.697510
2o - 2212.072754

-----------
64 - 5412.254395
64o - 5355.277832
32 - 5236.203613
32o - 5219.511230
16 - 4876.394531
16o - 4990.144531
8 - 4381.833008
8o - 4367.594727
4 - 3607.788818
4o - 3598.828369
2 - 2613.153320
2o - 1856.221191

-----------
64 - 5412.778320
64o - 5389.453125
32 - 5297.243652
32o - 5318.121582
16 - 5149.292480
16o - 5167.261719
8 - 4871.079590
8o - 4853.763184
4 - 4339.577637
4o - 4301.452148
2 - 3461.077881
2o - 2226.178955

-----------
64 - 5412.236816
64o - 5355.687500
32 - 5237.282715
32o - 5219.761230
16 - 4876.365723
16o - 4990.140137
8 - 4381.937988
8o - 4367.534180
4 - 3607.688721
4o - 3598.893311
2 - 2613.374023
2o - 1856.224854

-----------
64 - 5413.559082
64o - 5388.833984
32 - 5298.372559
32o - 5318.076660
16 - 5149.466309
16o - 5167.427246
8 - 4870.837891
8o - 4853.674316
4 - 4339.352539
4o - 4301.298828
2 - 3461.207520
2o - 2226.261230

-----------
64 - 3201.248535
64o - 3154.732910
32 - 2281.450195
32o - 2877.217041
16 - 1848.538086
16o - 2401.364258
8 - 2027.488159
8o - 2296.241943
4 - 2337.203369
4o - 1047.561523
2 - 1361.215210
2o - 1386.071533

-----------
64 - 5060.867188
64o - 5039.256348
32 - 4788.977051
32o - 4724.054199
16 - 4525.736328
16o - 4556.734863
8 - 3955.052246
8o - 4106.543457
4 - 3707.191895
4o - 2204.955322
2 - 2243.468506
2o - 2215.502686

AlfredENeumann
2003-03-28, 00:38:27
Mal so ne Frage am rande eines unwissenden. Würde es theoretisch was bringen Radeon-Karten unter Truform zu messen um genaueres rauszufinden welche Pipes wie damit beschäftigt sind, oder so ?

Endorphine
2003-03-28, 00:50:23
Originally posted by Quasar
ArchMark 0.10.04alpha
[...]

Ist bei mir 100% identisch zu Version 0.10.04a....

???
Du verwendest die .04 und vergleichst mit der .04? :confused:

Quasar
2003-03-28, 01:07:41
Originally posted by Endorphine


???
Du verwendest die .04 und vergleichst mit der .04? :confused:

Sorry, ein simpler C&P-Fehler.... das Kärtlein-wechsle-dich läuft auf 'nem anderen Rechner, und da der nicht immer am Netz hängt, hab ich aufgrund der gleichen Ergebnisse das alte Ergebnis mit den .04ern gepostet, welches ich noch in .09 ändern wollte, was erst nach deinem Hinweis passierte...

Demirug
2003-03-28, 07:21:12
Originally posted by loewe

Je Tile ist es egal, ob das Dreieck jetzt ein Fragment ist oder komplett. Deshalb ja auch mein Vorschlag mehr durchsichtige Rechtecke zu nehmen, damit ist die Frage Overdraw erledigt und die Menge wird sich irgend wann bemerkbar machen.


Wie ich schon sagte, die HSR-Einheit beschäftigen und die Fragmenterzeugung testen, dort würde ich den Ansatzpunkt suchen.

Mit Fragment meinte ich nicht ob das Dreieck die Tile nun komplett oder nur teilweise bedeckt. Ich bezog mich darauf das es beim Tilen ja vorkommt das ein Dreieck in mehrer Teile zerlegt wird weil es mehrer Tiles bedeckt. Und diese Tile nannte ich fragmente weil sie eben nur einen Teil des gesamten Dreiecks darstellen.

ow
2003-03-28, 07:22:37
Originally posted by AlfredENeumann
Mal so ne Frage am rande eines unwissenden. Würde es theoretisch was bringen Radeon-Karten unter Truform zu messen um genaueres rauszufinden welche Pipes wie damit beschäftigt sind, oder so ?

Nein, das bringt nix. Truform ist ein 'Geometrie-Feature' und hat mit den Pixelpipes nichts zu tun.
Vielleicht zeigen aber die T&L Tests des archmark eine Auswirkung, denn Truforming erfolgt vor dem HWTL.

Demirug
2003-03-28, 07:24:32
Originally posted by AlfredENeumann
Mal so ne Frage am rande eines unwissenden. Würde es theoretisch was bringen Radeon-Karten unter Truform zu messen um genaueres rauszufinden welche Pipes wie damit beschäftigt sind, oder so ?

Truform wird ja noch vor dem Vertexshader bzw T&L durchgeführt. Dabei ist die Hardware einheit im R200 aber nicht in der Lage das tesselasieren so schnell durchzuführen das der Rest der Pipeline mit maximaler Last läuft. Wir haben das mal gemessen. So gesehen bringt es also nichts weil immer die HOS-Einheit der Flaschenhals ist.

Quasar
2003-03-28, 10:46:41
So, nach einer halben Stunde rumtesten mit drei Radeons hab' ich wohl was halbwegs interessantes rausbekommen:

Die RV250 hat KEINE TriTMUs!
:D
Der Trick liegt im Control Panel. Zuerst hatte ich nur den Treiber installiert und bekam dieselben Ergebnisse, wie SP. Ich dachte, nagut, hat er halt Recht gehabt.
Danach baute ich meine R7500 ein und bekam wiederum TriTMUs vermeldet....da wurde ich doch etwas stutzig.
ArchMark 0.10.09alpha
Driver Radeon 7500 DDR / Radeon9000 Pro
beide mit: x86/MMX/3DNow! v1.3.3604 Win9x Release
Resolution 1024x768 @ ???Hz
Method Flush
Timer 601.363 MHz
[...snip...]
Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 8 8
Height none 2

----in color buffer-----------------------------
Width 8 8
Height none 2

----in depth buffer-----------------------------
Width 2 32
Height none 2

----in stencil buffer---------------------------
Width 2 2
Height none 2
[...snip...]
Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 577.172 MPix/s 1.086 GPix/s
2 577.117 MPix/s 544.233 MPix/s
3 576.993 MPix/s 363.231 MPix/s
4 273.044 MPix/s
5 218.532 MPix/s
6 182.137 MPix/s

----Trilinear filter----------------------------
1 455.940 MPix/s 926.428 MPix/s
2 455.859 MPix/s 464.558 MPix/s
3 455.794 MPix/s 310.009 MPix/s
4 232.627 MPix/s
5 186.141 MPix/s
6 155.159 MPix/s

Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 23.229 MTris/s 51.858 MTris/s
List 8.339 MTris/s 21.551 MTris/s
Clip 2.557 MTris/s 2.030 MTris/s

--Vertex shading speed--------------------------
LightD1 20.573 MVerts/s 16.986 MVerts/s
LightP1 19.983 MVerts/s 5.814 MVerts/s
LightP8 18.982 MVerts/s 3.799 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
AlphaTest 9 8
Combiner 4 18
Interpolator 4 18

TriTMUs bei der alten Gurke??? Niemals...

Danach habe ich das Control Panel installiert und mal ein wenig herumgespielt (genauer gesagt, die OPenGL-Texturqualität auf Maximum gesetzt, siehe Bild).

P.S.: Findet ausser mir noch jemand die Vertex-Leistung seltsam verteilt? Zecki, was macht der VS-Teil des Tests?

Quasar
2003-03-28, 10:55:35
...continue:

Als ich die Texturqualität auf Maximum einstellte, ergab sich folgendes:
ArchMark 0.10.09alpha
Driver Radeon 7500 DDR / Radeon9000 Pro
Beide mit: x86/MMX/3DNow! v1.3.3604 Win9x Release
Resolution 1024x768 @ ???Hz
Method Flush
Timer 601.360 MHz
Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 577.194 MPix/s 1.184 GPix/s
2 577.085 MPix/s 592.785 MPix/s
3 576.977 MPix/s 394.627 MPix/s
4 297.614 MPix/s
5 238.201 MPix/s
6 198.525 MPix/s

----Trilinear filter----------------------------
1 577.317 MPix/s 603.335 MPix/s
2 291.055 MPix/s 302.310 MPix/s
3 291.027 MPix/s 201.677 MPix/s
4 151.297 MPix/s
5 121.069 MPix/s
6 100.911 MPix/s
Tja, so schnell kanns gehen, vorbei ist die Glorie....

Dieser kleine Schalter im OpenGL-Tab scheint im Übrigen für die R300 nichts ähnliches zu bewirken, dort bleiben die Füllraten von der Schalterstellung unbeeindruckt (i.e. halbieren sich von bilinear zu trilinear).

Es scheint, als hätte ATi mehr Tricks im Ärmel, als man ihnen gemeinhin zutraut.

zeckensack
2003-03-28, 11:01:15
Vielen Dank, sehr aufschlußreich ;)

Es ist immer gut, einen Quasar im Haus zu haben =)

wg dem 'Vertex Shading Speed':
*suchengeh*
edit: *gefundenhab*
Originally posted by zeckensack
Geo-Test:
Dort werden ganz einfach Dreiecke auf die Karte geschmissen. Die werden später durchs Backface culling eliminiert, sodaß keine Füllrate dabei draufgeht. Es wird also die reine Transformationsleistung gemessen.
'Fan' ist eben das, ein Fan, also eine geschlossene Fläche mit einem gemeinsamen Zentrum. Der Chip braucht hier pro Dreieck nur einen Eckpunkt zu transformieren, weil die beiden anderen aus dem unmittelbar vorangegangenen Dreieck übernommen werden.

'List' zeichnet unabhängige Dreiecke, also ohne gemeinsame Eckpunkte.

'Clip' funktioniert wie List, nur wird der Dreieckshaufen so weit skaliert, daß jedes Dreieck über den Bildschirmrand hinausragt. Der Chip muß nun die Eckpunkte so weit nach innen verschieben, daß sie wieder auf der Bildfläche zu liegen kommen. Das nennt man 'Clipping'.

'LightD1', 'LightP1' und 'LightP8' benutzen Lichter nach der Definition von fixed-function-T&L. Diese sollten auf moderneren Chips als Vertex Shader gelöst sein - oder auch nicht. Der Vorteil dieser Methode ist, daß jeder Grafiktreiber dieses beherrscht, und ich nicht zig verschiedene 'richtige' Vertex Shader schreiben und testen muß. Selbst T&L-lose Karten können das, der Treiber muß es dann in Software emulieren.
Ich halte insbesondere LightP8 für einen angemessenen Ersatz für komplexe Vertex Shader, weil dafür schon ganz ordentlich gerechnet werden muß.


Und noch 'ne Anmerkung dazu:
Karten ohne HW-T&L können idR ohne große Probleme das Culling vor der Beleuchtungsberechnung ausführen, sodaß hier alle Licht-Tests gleich schnell, und auf dem selben Niveau wie 'List' sind. Dort wird halt nur in Tris/s angegeben statt in Verts/s, deshalb sind die Ergebnisse dreimal so hoch.

zeckensack
2003-03-28, 11:39:25
Originally posted by loewe

Ich denke es gibt hier keine "suboptimalen Speicherzugriffe", es werden immer 16 Zeilen a 32 Pixel übertragen und fertig. Wie oft kommt in realen Anwendungen der Fall vor, dass eine Tile leer ist oder nur halb gefüllt?
Das Konzept ist hoch effizient, es vermeidet sinnlose Optimierungen.Das leuchtet ein. Dann verstehe ich aber jetzt umso weniger, warum die älteren Versionen dieses Tests auf der Kyro angeschlagen haben (war ja schon recht nah dran)???

Mein Vorschlag geht aber gerade darauf hinaus, das HSR zu testen. Die Füllrate ist denke ich hier nicht der richtige Ansatzpunkt.Ich werd's glaube ich mal mit kleineren Quads und/oder Blending ausprobieren. Das hebe ich mir aber für nächste Woche auf, dann habe ich (hoffentlich) selbst die K2 hier. Auf die Weise kann ich schneller arbeiten.
BTW, hättest du mal was wegen der KYRO gesagt, ich habe genug Karten davon. :) Tja, eigentlich war das auch nicht wirklich geplant :)
Ich habe in den letzten Wochen schon ein paarmal wg einer Kyro beim Geizhals vorbeigeschaut, aber für eine Karte die ich nur zum Testen brauche war mir das dann alles zu teuer.

In der Zwischenzeit war ich auch davon ausgegangen, jetzt endlich das richtige Testverfahren zu haben, womit sich das erledigt haben sollte. War wohl nix, wie wir gesehen haben :D

Und dann bin ich gestern mehr oder weniger zufällig über Ikon's Angebot gestolpert. Kostet mich letztendlich 25€ inklusive Versand für 'ne K2 AGP/32MB/TV, das war einfach zu verlockend. Impulskauf ahoi :)

zeckensack
2003-03-28, 11:45:25
Originally posted by Demirug


Wenn ich den Test richtig verstanden habe bleibt die Anzahl der Pixel die gerendert werden konstant.Ja. Die Effizienz sinkt auf allen getesteten Karten mit kleineren Blockgrößen ab (wie erwartet), aber die Pixelanzahl bleibt gleich. Verglichen wird jeweils 'natural alignment' für diesen Block, und die verschobene Version. Ist der Verlust oberhalb einer festen Schwelle, wird diese Blockgröße genommen.
Ich vermute mal stark das in den Kyros keine spezielle optimierung für leere Tiles vorhanden ist.So sieht's aus :(
Die Frage ist also ob das schreiben von leeren Tiles wirklich unterdrückt werden kann? Aber selbst wenn die Bandbreite sollte kaum am Limit sein. Die Bandbreite idR nicht, aber Alignment-Restriktionen schlagen bei dem Test recht gut durch (zumindest auf IMRs).

StefanV
2003-03-29, 10:59:46
270/200

ArchMark 0.10.09alpha
Driver GeForce4 MX 440/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 60.71Hz
Method Flush
Timer 1.667 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 4.329 GB/s
Color 4.515 GB/s
ZAndStencil 4.158 GB/s
Z 33.133 GB/s
Stencil 704.858 MB/s

Draw 4.950 GB/s
BurnedByRAMDAC 188.316 MB/s
Physical 5.138 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height 2

----in color buffer-----------------------------
Width 4
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 534.240 MPix/s
Z 1.060 GPix/s
ColorAndZ 534.248 MPix/s
ZTest 503.747 MPix/s
ZCullLEqual 1.288 GPix/s
ZCullGEqual 1.283 GPix/s
ZCullEqual 3.866 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 536.310 MPix/s
Z 536.329 MPix/s
ColorAndZ 536.327 MPix/s
ZTest 536.384 MPix/s
ZCullLEqual 1.523 GPix/s
ZCullGEqual 1.512 GPix/s
ZCullEqual 3.937 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 511.916 MPix/s
2 536.264 MPix/s

----Unfiltered----------------------------------
1 536.269 MPix/s
2 536.268 MPix/s

----Bilinear filter-----------------------------
1 536.278 MPix/s
2 535.476 MPix/s

----Trilinear filter----------------------------
1 536.238 MPix/s
2 269.866 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 33.729 MTris/s
List 12.851 MTris/s
Clip 12.846 MTris/s

--Vertex shading speed--------------------------
LightD1 16.270 MVerts/s
LightP1 12.272 MVerts/s
LightP8 4.030 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 10
Combiner 12
Interpolator 11

ow
2003-03-29, 15:55:57
Mal noch ein paaer Oldie-Ergebnisse, Permedia2 @80/80MHz:

32Bit/flush:

ArchMark 0.10.09alpha
Driver PERMEDIA2 v1.1.23
Resolution 1024x768 @ ???Hz
Method Flush
Timer 1.470 GHz

Bandwidth
Error no pixel format

Tiling
Error no pixel format

Fillrate
--32 bits---------------------------------------
Error no pixel format

--16 bits---------------------------------------
Mode RGBA5551 Z15 S1
Color 79.495 MPix/s
Z 79.521 MPix/s
ColorAndZ 79.520 MPix/s
ZTest 61.810 MPix/s
ZCullLEqual 76.510 MPix/s
ZCullGEqual 76.154 MPix/s
ZCullEqual 77.908 MPix/s


Texturing
Mode RGBA5551 Z15 S1
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 79.499 MPix/s

----Unfiltered----------------------------------
1 79.485 MPix/s

----Bilinear filter-----------------------------
1 79.520 MPix/s

----Trilinear filter----------------------------
1 79.514 MPix/s



Geometry
Mode RGBA5551 Z15 S1
--Plain vertices--------------------------------
Fan 15.109 MTris/s
List 6.637 MTris/s
Clip 2.003 MTris/s

--Vertex shading speed--------------------------
LightD1 19.071 MVerts/s
LightP1 16.518 MVerts/s
LightP8 16.540 MVerts/s


Precision
Mode RGBA8888 Z15 S1
--fraction bits---------------------------------
AlphaTest 10



16Bit/flush:

ArchMark 0.10.09alpha
Driver PERMEDIA2 v1.1.23
Resolution 1024x768 @ 111.93Hz
Method Flush
Timer 1.470 GHz

Bandwidth
Mode RGBA5551 Z15 S1
--bandwidth-------------------------------------
----available to buffer clears------------------
All 1.646 GB/s
Color 1.632 GB/s
ZAndStencil 1.658 GB/s
Z 1.554 GB/s
Stencil 103.633 MB/s

Draw 291.925 MB/s
BurnedByRAMDAC 176.228 MB/s
Physical 468.153 MB/s


Tiling
Mode RGBA5551 Z15 S1
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height none

----in color buffer-----------------------------
Width 4
Height none

----in depth buffer-----------------------------
Width 4
Height none

----in stencil buffer---------------------------
Width 4
Height none



Fillrate
--16 bits---------------------------------------
Mode RGBA5551 Z15 S1
Color 79.514 MPix/s
Z 79.506 MPix/s
ColorAndZ 79.501 MPix/s
ZTest 61.821 MPix/s
ZCullLEqual 76.457 MPix/s
ZCullGEqual 76.154 MPix/s
ZCullEqual 77.884 MPix/s


Texturing
Mode RGBA5551 Z15 S1
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 79.483 MPix/s

----Unfiltered----------------------------------
1 79.376 MPix/s

----Bilinear filter-----------------------------
1 79.503 MPix/s

----Trilinear filter----------------------------
1 79.505 MPix/s



Geometry
Mode RGBA5551 Z15 S1
--Plain vertices--------------------------------
Fan 15.002 MTris/s
List 6.608 MTris/s
Clip 2.003 MTris/s

--Vertex shading speed--------------------------
LightD1 19.510 MVerts/s
LightP1 19.487 MVerts/s
LightP8 19.617 MVerts/s


Precision
Mode RGBA5551 Z15 S1
--fraction bits---------------------------------
AlphaTest 10




Bandbreitenberechnung stimmt nicht.:| Sind höchstens 640MB/s (80MHz, 64Bit).

StefanV
2003-03-29, 17:45:30
hier mal die Werte von einer GF4 MX440 mit 2x FSAA:


ArchMark 0.10.09alpha
Driver GeForce4 MX 440/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 60.71Hz
Method Flush
Timer 1.667 GHz


0x FSAA 2x'MSAA'


Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 4.329 GB/s 2.075 GB/s
Color 4.515 GB/s. 2.127 GB/s
ZAndStencil 4.158 GB/s 1.991 GB/s
Z 33.133 GB/s 16.001 GB/s
Stencil 704.858 MB/s 658.839 kB/s

Draw 4.950 GB/s 3.579 GB/s
BurnedByRAMDAC 188.316 MB/s 188.926 MB/s
Physical 5.138 GB/s 3.768 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4 2
Height 2 2

----in color buffer-----------------------------
Width 4 2
Height 2 2

----in depth buffer-----------------------------
Width 2 none
Height 2 2

----in stencil buffer---------------------------
Width 2 none
Height 2 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 534.240 MPix/s 267.511 MPix/s
Z 1.060 GPix/s 530.899 MPix/s
ColorAndZ 534.248 MPix/s 267.515 MPix/s
ZTest 503.747 MPix/s 244.814 MPix/
ZCullLEqual 1.288 GPix/s 617.954 MPix/s
ZCullGEqual 1.283 GPix/s 612.260 MPix/s
ZCullEqual 3.866 GPix/s 1.883 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 536.310 MPix/s 267.070 MPix/s
Z 536.329 MPix/s 268.536 MPix/s
ColorAndZ 536.327 MPix/s 268.277 MPix/s
ZTest 536.384 MPix/s 268.570 MPix/s
ZCullLEqual 1.523 GPix/s 759.329 MPix/s
ZCullGEqual 1.512 GPix/s 755.016 MPix/s
ZCullEqual 3.937 GPix/s 1.945 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 511.916 MPix/s 266.035 MPix/s
2 536.264 MPix/s 268.557 MPix/s

----Unfiltered----------------------------------
1 536.269 MPix/s 268.534 MPix/s
2 536.268 MPix/s 268.560 MPix/s

----Bilinear filter-----------------------------
1 536.278 MPix/s 268.047 MPix/s
2 535.476 MPix/s 268.558 MPix/s

----Trilinear filter----------------------------
1 536.238 MPix/s 268.559 MPix/s
2 269.866 MPix/s 133.321 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 33.729 MTris/s 18.583 MTris/s
List 12.851 MTris/s 5.290 MTris/s
Clip 12.846 MTris/s 5.296 MTris/s

--Vertex shading speed--------------------------
LightD1 16.270 MVerts/s 8.598 MVerts/s
LightP1 12.272 MVerts/s 8.594 MVerts/s
LightP8 4.030 MVerts/s 4.029 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 10
Combiner 12
Interpolator 11


Bei diesen Werten hätte NV auch gleich SSAA nehmen können, wenn sie das nicht auch machen...

StefanV
2003-03-29, 18:58:56
@Zeckie

kannst du auch mal eine Funktion zum 'vergleichsbenchen' einbauen ??

ALso wenn man mehrere Karten hat, daß es dann so eine schöne Tabelle ergibt wie die, die ich gemacht hab ??

Kann auch eine Excel Tabelle oder sonstiges sein...

StefanV
2003-03-29, 19:23:19
hm, wenn ich mir die Werte der GF4 MX so anschaue, dann frage ich mich, was NV am FSAA rumgemurxt hat...

zeckensack
2003-03-30, 13:08:07
Originally posted by ow
Bandbreitenberechnung stimmt nicht.:| Sind höchstens 640MB/s (80MHz, 64Bit). Ich habe gerade nochmal durch den Code geschaut, und kann einen Bug eigentlich ausschließen.
Die Anzahl der Bits in den verschiedenen Buffern wird vom Treiber abgefragt (siehe 'Mode'). Und daraus wird auch der Bandbreitenbedarf pro Frame errechnet.
Deswegen ist auch bei den frühen Tests mit Gf4Ti die Farb-Bandbreite 25% niedriger als jetzt - weil da noch 32bit-Formate ohne destination alpha genommen wurden.

Das fliesst also ein, deswegen Gegenfrage: ganz sicher keine 128bittige Speicheranbindung? AFAIK hatte die Riva128 dieses, und der Permedia 2 stammt ja mehr oder weniger aus der gleichen Zeit.

zeckensack
2003-03-30, 13:09:51
Originally posted by Stefan Payne
hier mal die Werte von einer GF4 MX440 mit 2x FSAA:
<...>
Bei diesen Werten hätte NV auch gleich SSAA nehmen können, wenn sie das nicht auch machen... Teilweises Ack :|
Aber: 2xAA ist immer noch RG, ergo sinnvoller als eine (gleich teure) Auflösungserhöhung. Und damit ist dieses AA auch auf jeden Fall besser als das 2x auf 'ner R200.

zeckensack
2003-03-30, 13:13:15
Originally posted by Stefan Payne
@Zeckie

kannst du auch mal eine Funktion zum 'vergleichsbenchen' einbauen ??

ALso wenn man mehrere Karten hat, daß es dann so eine schöne Tabelle ergibt wie die, die ich gemacht hab ??

Kann auch eine Excel Tabelle oder sonstiges sein... Die Auswertung sollte IMO mit einem externen Programm erfolgen. results.txt (ohne bb) enthält alle Infos und ist IMO ganz gut abgrasbar. Ob und wie ich da etwas liefern werde, kann ich im Moment noch nicht sagen. Aber Excel-Support wird es von mir jedenfalls nicht geben. MS Office ist 'der Feind', um es mal deutlich zu sagen.

ow
2003-03-30, 13:16:41
Originally posted by zeckensack
Ich habe gerade nochmal durch den Code geschaut, und kann einen Bug eigentlich ausschließen.
Die Anzahl der Bits in den verschiedenen Buffern wird vom Treiber abgefragt (siehe 'Mode'). Und daraus wird auch der Bandbreitenbedarf pro Frame errechnet.
Deswegen ist auch bei den frühen Tests mit Gf4Ti die Farb-Bandbreite 25% niedriger als jetzt - weil da noch 32bit-Formate ohne destination alpha genommen wurden.

Das fliesst also ein, deswegen Gegenfrage: ganz sicher keine 128bittige Speicheranbindung? AFAIK hatte die Riva128 dieses, und der Permedia 2 stammt ja mehr oder weniger aus der gleichen Zeit.

Ja, da bin ich mir eigentlich sicher. Erst der Permedia3 (aka Glint R3) hat ein 128Bit (SDRAM) Interface.
(Und selbst falls ich irren sollte, sind die 1,6GB/s noch zu hoch, 128Bit@80MHz sind eben auch nur 4/5 von 1,6GB.


btw. bis zum archmark 0.09.01 laufen auch die 32Bit Tests, erst ab archmark 0.09.05 heisst´s da 'no pixel format'.


ArchMark 0.09.01alpha
Driver PERMEDIA2 v1.1.23
Resolution 1024x768 @ 111.62Hz
Method Flush
Timer 1.470 GHz

Memory
Mode RGBA8888 Z15 S1
--bandwidth-------------------------------------
----available to buffer clears------------------
All 1043.99 MB/s
Color 1042.07 MB/s
ZAndStencil 1050.53 MB/s
Z 984.92 MB/s
Stencil 65.56 MB/s

Draw 269.05 MB/s
BurnedByRAMDAC 267.39 MB/s
Physical 536.44 MB/s

--preferred block size--------------------------
----in color buffer-----------------------------
Width 18
Height 46

----in depth buffer-----------------------------
Width 14
Height 29

----in stencil buffer---------------------------
Width 16
Height 53



Fillrate
--RGBA8888 Z15 S1-------------------------------
Color 58.35 MPix/s
Z 58.29 MPix/s
ColorAndZ 58.36 MPix/s
ZTest 36.07 MPix/s
ZCullLEqual 61.58 MPix/s
ZCullGEqual 60.40 MPix/s
ZCullEqual 76.25 MPix/s

--RGBA5551 Z16 S0-------------------------------
Color 79.50 MPix/s
Z 79.52 MPix/s
ColorAndZ 79.52 MPix/s
ZTest 61.80 MPix/s
ZCullLEqual 76.28 MPix/s
ZCullGEqual 75.95 MPix/s
ZCullEqual 77.90 MPix/s


Texturing
Mode RGBA5551 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 79.50 MPix/s

----Unfiltered----------------------------------
1 79.50 MPix/s

----Bilinear filter-----------------------------
1 79.51 MPix/s

----Trilinear filter----------------------------
1 79.51 MPix/s



Geometry
Mode RGBA5551 Z16 S0
--Plain vertices--------------------------------
Fan 14.95 MTris/s
List 6.62 MTris/s
Clip 2.00 MTris/s

--Other triangle lists--------------------------
TexM 6.60 MTris/s
ColTex1Light0 5.49 MTris/s
ColTex1Light1 6.54 MTris/s
ColTex1Light8 6.53 MTris/s

StefanV
2003-03-30, 13:31:01
Originally posted by zeckensack
Die Auswertung sollte IMO mit einem externen Programm erfolgen. results.txt (ohne bb) enthält alle Infos und ist IMO ganz gut abgrasbar. Ob und wie ich da etwas liefern werde, kann ich im Moment noch nicht sagen. Aber Excel-Support wird es von mir jedenfalls nicht geben. MS Office ist 'der Feind', um es mal deutlich zu sagen.

Im prinzip ists egal, was für ein Format die Tabelle hat ;)

Mir gehts nur darum, daß der Archmark die Ergebnisse eines neuen Durchlaufes neben dem alten schreiben kann (so wie ich das in der Tabelle mit den beiden GF4 MX Werten gemacht hab, in etwa).

Der Grund ist die bessere Übersichtlichkeit, wenn man Mehrere Grafikkarten/Durchläufe vergleichen möchte.

Letztendlich ists egal, obs ein Format einer Tabellenkalkulation (z.B. CSV wie bei UT) ist oder eine einfache TXT Datei...

StefanV
2003-03-30, 23:29:18
Zeckie ??

Wie ist deine Meinung dazu ??

zeckensack
2003-03-31, 08:04:12
Originally posted by Stefan Payne
Zeckie ??

Wie ist deine Meinung dazu ?? Ack :D

Labberlippe
2003-03-31, 09:43:53
Hi darf ich auch mit testen. :D

g.zuschlag@gmx.at

@zecki Falls Du mir ein mail senden willst.

Gruss Labberlippe

StefanV
2003-03-31, 13:39:29
Originally posted by zeckensack
Ack :D

...

Wirst du sowas in der Art in einen zukünftigen Ar(s)chmark einbauen ?? ;)

am besten mit häckchen (overwrite results) :)

*aufknienfleh*

ow
2003-04-03, 10:40:12
@Sp: du weisst ja wo Spam landet...

Quasar
2003-04-03, 10:40:51
bitte mitlöschen :D

zeckensack
2003-04-03, 12:22:40
Bisserl zuviel weggeflext, ow. Ich glaube SP wollte auf dies hier hinweisen:
Originally posted by Stefan Payne
ArchMark 0.10.09alpha
Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
AlphaTest 9.400
Combiner 24
Interpolator 21

Quasar
2003-04-03, 12:31:13
Originally posted by zeckensack
Bisserl zuviel weggeflext, ow. Ich glaube SP wollte auf dies hier hinweisen:

Ja, und genau dasselbe hat Achill schon vor Tagen gepostet... ;)

StefanV
2003-04-03, 12:43:48
Originally posted by Quasar

Ja, und genau dasselbe hat Achill schon vor Tagen gepostet... ;)

da ists aber niemandem aufgefallen :P

zeckensack
2003-04-03, 12:51:08
Originally posted by Stefan Payne
da ists aber niemandem aufgefallen :P Doch, mir schon :D

Da du in einem Posting (das jetzt im Trash liegt) noch was zum 'Versauern' dieses Threads gesagt hast:

Bin mit dem 'großen Werk' jetzt erstmal durch (seit gestern nachmittag). Können noch ein paar Endkorrekturen kommen, kA.
Im Moment habe ich einen schweren Anfall von Post-Crunch-Bocklosigkeit. Mal abwarten, ob der Postbote mir heute neues Spielzeug bringt :)

Jedenfalls, der Präzi-Test ist 'Müll'. Ich weiß zwar nicht warum, aber irgend was stimmt da nicht.
Auf einigen Karten kommen 'richtige' Werte raus, auf anderen nur Unsinn. Btw 24 bit ist das 'meßbare Maximum', korrekt sollte es '24 or more' heißen. Ist sowieso nur für Integereinheiten gültig. Kurz gesagt, da muß ich noch weiterbasteln, bevor man diese Zahlen vergleichen/ernstnehmen darf. Und das wird (wie oben angesprochen) noch ein, zwei Tage dauern.

Quasar
2003-04-03, 12:53:48
Originally posted by Stefan Payne
da ists aber niemandem aufgefallen :P

Wie erklärst du dir dann mein Posting? (Und hat dir deine Mama nicht beigebracht, anderen Leuten nicht die Zunge rauszustrecken?)

Quasar
2003-04-11, 16:01:18
ArchMark 0.10.09alpha
Driver GeForce FX 5200/AGP/3DNOW! v1.4.0
Resolution 1024x768 @ ???Hz
Method Flush
Timer 601.363 MHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 5.376 GB/s
Color 5.702 GB/s
ZAndStencil 5.084 GB/s
Z 31.784 GB/s
Stencil 983.476 kB/s

Draw 4.880 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 5.147 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height 2

----in color buffer-----------------------------
Width 4
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 968.396 MPix/s
Z 978.250 MPix/s
ColorAndZ 968.421 MPix/s
ZTest 499.871 MPix/s
ZCullLEqual 1.174 GPix/s
ZCullGEqual 1.170 GPix/s
ZCullEqual 3.743 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 988.181 MPix/s
Z 985.575 MPix/s
ColorAndZ 988.198 MPix/s
ZTest 899.116 MPix/s
ZCullLEqual 1.888 GPix/s
ZCullGEqual 1.884 GPix/s
ZCullEqual 3.797 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 917.851 MPix/s
2 498.011 MPix/s
3 205.167 MPix/s
4 205.160 MPix/s

----Unfiltered----------------------------------
1 988.181 MPix/s
2 498.046 MPix/s
3 205.048 MPix/s
4 205.166 MPix/s

----Bilinear filter-----------------------------
1 988.130 MPix/s
2 498.042 MPix/s
3 205.157 MPix/s
4 205.169 MPix/s

----Trilinear filter----------------------------
1 499.152 MPix/s
2 249.626 MPix/s
3 163.338 MPix/s
4 123.330 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 40.871 MTris/s
List 11.060 MTris/s
Clip 11.058 MTris/s

--Vertex shading speed--------------------------
LightD1 18.697 MVerts/s
LightP1 7.850 MVerts/s
LightP8 2.714 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 10
Combiner 16
Interpolator 15


Auch der nV34 hat also eindeutige 4 Pipes, seine Vertexeinheit kann aber anscheinend nichtmal mit der einer R9000Pro mithalten.

4 Texturen pro Pass in OpenGL :| Der Templemark (D3D) läuft mit 6 Texturen als Single-Pass durch.
edit:
Kannst ruhig weiterschlafen, Zecki. Quake3-Engine vermeldet auch nur 4 Texturen pro Pass...vielleicht absichtlich heruntergesetzt?

Ein Bug im Ar[S]chmark? ;)

ow
2003-04-11, 17:16:33
Originally posted by Quasar

4 Texturen pro Pass in OpenGL :| Der Templemark (D3D) läuft mit 6 Texturen als Single-Pass durch.
edit:
Kannst ruhig weiterschlafen, Zecki. Quake3-Engine vermeldet auch nur 4 Texturen pro Pass...vielleicht absichtlich heruntergesetzt?

Ein Bug im Ar[S]chmark? ;)


Schau mal hiermit: http://www.delphi3d.net/hardware/glinfo2.zip

was der Treiber so anbietet.