PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : ArchMark!? *hrhr* *pimp*


Seiten : 1 2 [3]

Quasar
2003-04-11, 17:23:39
Ist das eine neue Version? Ich habe wohl nur eine alte, die die unterstützten Extensions anzeigt. Ich guck mal....thx!

edit:
Genau wie die erste Version, nur mit graphischem Schnickschnack drumrum (i.e. keine Anzeige von GL_Max_Active_Textures_ARB). Schade. :(

ow
2003-04-11, 17:37:35
???
->

Quasar
2003-04-11, 17:48:00
Ah so. Ich hatte das nur mal auf der G400 hier kurz probiert, die mag unter meinen 24Bit-Desktop gar keine OGL-Beschleunigung, deswegen zeigte sie nix an... edit: :bonk: <- den hab' ich verdient!!!

Xmas
2003-04-11, 20:09:56
Originally posted by Quasar
Auch der nV34 hat also eindeutige 4 Pipes, seine Vertexeinheit kann aber anscheinend nichtmal mit der einer R9000Pro mithalten.

Ja, 4 Pipes in NV31 und NV34 war auch die Aussage von Luciano Alibrandi auf der CeBIT. Erstaunlich aber der Wert für 3 Bi-Texturen. Scheinbar ist das Combining doch nicht ganz so flexibel.

Quasar
2003-04-11, 20:12:29
Ich hab's noch nicht probiert, aber ich glaube, hier ist das RAM ein wenig zu langsam, um den Chip weiter bei Laune halten zu können.

GL_EXT_reme legt auch die Vermutung nahe, das der Texturcache recht knapp bemessen ist.

StefanV
2003-04-11, 20:12:46
Originally posted by Xmas

Ja, 4 Pipes in NV31 und NV34 war auch die Aussage von Luciano Alibrandi auf der CeBIT. Erstaunlich aber der Wert für 3 Bi-Texturen. Scheinbar ist das Combining doch nicht ganz so flexibel.

Hm, mit Pipelinecombining kommt der Wert doch hin (2x2)...

StefanV
2003-04-11, 20:13:48
Originally posted by Quasar
Ich hab's noch nicht probiert, aber ich glaube, hier ist das RAM ein wenig zu langsam, um den Chip weiter bei Laune halten zu können.

GL_EXT_reme legt auch die Vermutung nahe, das der Texturcache recht knapp bemessen ist.

Das kannst du (eigentlich) Testen, in dem du die Texturing Tests von 3DMark 00 und 01 ausprobierst, meine G550 schneidet beim 01er auch recht beschissen ab...

Quasar
2003-04-13, 23:52:06
Originally posted by ow
naja, ueber die FX-Chips ist mir da noch nix bekannt. Vielleicht macht die Konsumer-FX ja auch 12Bits.:D

Stimmt tatsächlich! :D

StefanV
2003-04-26, 15:40:24
hier mal die Werte einer Rage 128 ULTRA GL (lt. Windows).

Takt ist laut Powerstrip 130/130MHz, das Häckchen 'convert32bitTexturesTo16bit' war gesetzt.

Ach ja:
Der Archmark war ziehmlich lahm auf dem Schätzchen :naughty:

ArchMark 0.10.09alpha
Driver RAGE 128 Pro Ultra x86/MMX/3DNow! v1.2.1652 WinXP Release
Resolution 1024x768 @ ???Hz
Method Flush
Timer 849.973 MHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 1.198 GB/s
Color 1.715 GB/s
ZAndStencil 899.048 MB/s
Z 1.348 GB/s
Stencil 448.183 MB/s

Draw 1.503 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 1.770 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 16
Height 32

----in color buffer-----------------------------
Width 16
Height 64

----in depth buffer-----------------------------
Width none
Height none

----in stencil buffer---------------------------
Width none
Height none



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 255.904 MPix/s
Z 252.821 MPix/s
ColorAndZ 253.880 MPix/s
ZTest 120.154 MPix/s
ZCullLEqual 160.647 MPix/s
ZCullGEqual 164.481 MPix/s
ZCullEqual 188.912 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 251.648 MPix/s
Z 253.762 MPix/s
ColorAndZ 254.129 MPix/s
ZTest 235.477 MPix/s
ZCullLEqual 247.296 MPix/s
ZCullGEqual 188.278 MPix/s
ZCullEqual 252.772 MPix/s

Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 252.633 MPix/s
2 126.444 MPix/s

----Unfiltered----------------------------------
1 244.297 MPix/s[b]
2 128.649 MPix/s

----[b]Bilinear filter-----------------------------
1 139.998 MPix/s
2 70.058 MPix/s

----Trilinear filter----------------------------
1 93.815 MPix/s
2 46.909 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 3.056 MTris/s
List 1.059 MTris/s
Clip 472.214 kTris/s

--Vertex shading speed--------------------------
LightD1 1.876 MVerts/s
LightP1 1.216 MVerts/s
LightP8 431.881 kVerts/s


Precision
Mode RGBA8888 Z16 S0
--fraction bits---------------------------------
AlphaTest 8.900
Combiner 12
Interpolator 12

aths
2003-04-26, 16:48:14
Originally posted by Xmas
Ja, 4 Pipes in NV31 und NV34 war auch die Aussage von Luciano Alibrandi auf der CeBIT. Erstaunlich aber der Wert für 3 Bi-Texturen. Scheinbar ist das Combining doch nicht ganz so flexibel. Oder der Herr hat schlicht nicht die Wahrheit gesagt, oder nVidias Auffassung, was eine Pipeline definiert, entspricht nicht dem gängigen Verständnis.

Demirug
2003-04-26, 17:02:43
Originally posted by aths
Oder der Herr hat schlicht nicht die Wahrheit gesagt, oder nVidias Auffassung, was eine Pipeline definiert, entspricht nicht dem gängigen Verständnis.

Einfache frage dazu: "Wie viele Pipelines hat deiner Meinung nach der NV10 Chip? 4 oder 2?"

Quasar hast du die 5200 Karten noch?. Falls ja würden mich ein paar bestimmte Testergebnisse interesieren.

StefanV
2003-04-26, 18:57:12
:bawling:

Und für mein Ergebnis interessiert sich mal wieder keiner

:bawling:

Ich editier mal das vorige...

zeckensack
2003-04-26, 19:14:10
Originally posted by Stefan Payne
:bawling:

Und für mein Ergebnis interessiert sich mal wieder keiner

:bawling:

Ich editier mal das vorige... Kein Texturcache?
Eine TMU, die nichtmal ein bilineares Sample 'for free' erzeugen kann, würde mich doch extrem wundern.

StefanV
2003-04-26, 20:44:39
Originally posted by zeckensack
Kein Texturcache?
Eine TMU, die nichtmal ein bilineares Sample 'for free' erzeugen kann, würde mich doch extrem wundern.

Ich hab keine Ahnung...
Windows ist XP, das ganze ist auch noch 'neu', nur der M$ Rage 128 PRO Treiber ist drin...

PS: da die Karte einen TV Out hat, nutze ich natürlich den ATI Treiber!
PPS: die 3DMark Werte liegen mit 'etwas oc' etwa auf Rage128 PRO Werte, laut Futuremark...

StefanV
2003-04-26, 22:31:44
im 3DMark 01 Fillrate Test bekomm ich auch 'nur' 103,9MTex/ST und 161,8MTex/MT

zeckensack
2003-04-26, 22:50:14
Originally posted by Stefan Payne
im 3DMark 01 Fillrate Test bekomm ich auch 'nur' 103,9MTex/ST und 161,8MTex/MT Es ist Gotteslästerung, in diesem Thread über 3DMark-'Füllrate' zu sprechen :nono:

;)

StefanV
2003-04-27, 14:01:56
Originally posted by zeckensack
Es ist Gotteslästerung, in diesem Thread über 3DMark-'Füllrate' zu sprechen :nono:

;)

Oh, sorry :sulkoff:

Wollte nur den 'Beweis', daß der Archmark richtig 'schätzt' oder nicht.

BTW: kannst du einen Test vom Texturecache oder sowas in der Art einbauen ??

Ist z.B. bei der G550 zu beobachten, daß die Fillrate beim 3Dmark 01 ziemlich beschissen ist (IIRC 55mpix), beim 00er hingegen so, wie man sie erwarten würde.

ow
2003-04-27, 14:38:31
SP: die 3DMarks haben keine 'Fillrate-Tests'.
Die dort verwendeten Prozeduren sind untauglich zur Fillrate-Bestimung.

Quasar
2003-04-28, 11:04:49
Originally posted by Demirug


Einfache frage dazu: "Wie viele Pipelines hat deiner Meinung nach der NV10 Chip? 4 oder 2?"

Quasar hast du die 5200 Karten noch?. Falls ja würden mich ein paar bestimmte Testergebnisse interesieren.

Aber sicher und seit heute (bin aber erst abends wieder zuhaus') auch noch eine Nummer größer.
Was willste denn wissen?

Demirug
2003-04-28, 12:25:54
Originally posted by Quasar


Aber sicher und seit heute (bin aber erst abends wieder zuhaus') auch noch eine Nummer größer.
Was willste denn wissen?

Hat sich inzwischen erledigt. Ich hatte da was falsch in errinerung und zwar das der spezielle Singletextur mode im NV34 vorhanden ist. Dieser ist aber ja scheinbar im NV31 verbaut und dort gehe ich dann schon davon aus das auch jede Pipelines vollständige AA-Sampler hat.

Quasar
2003-04-28, 19:41:57
Originally posted by Demirug


Hat sich inzwischen erledigt. Ich hatte da was falsch in errinerung und zwar das der spezielle Singletextur mode im NV34 vorhanden ist. Dieser ist aber ja scheinbar im NV31 verbaut und dort gehe ich dann schon davon aus das auch jede Pipelines vollständige AA-Sampler hat.

Was für eine spezieller Single-Texturing Modus?

Demirug
2003-04-28, 19:59:00
Originally posted by Quasar


Was für eine spezieller Single-Texturing Modus?

NVIDIA hat beim NV31 die alte Pipeline combinding Technik des NV10 wieder ausgeraben. Der Chip ist primär ein 4x1 Chip welcher aber sobald mehr als eine Texture pro Pixel gebraucht wird auf 2x2 umschaltet. Wie die ALUs und das Alphablendig da genau reinpassen (sprich was man mit dieser einen Texture anstellen kann) weiss ich aber derzeit noch nicht.

Endorphine
2003-05-11, 22:25:05
Noch mal eine kleine Untersuchung am Rande : mich hat es schon seit längerem interessiert, was die eigenartigen Resultate von Anandtech zur nutzbaren Speicherbandbreite in UT2k3 auszusagen haben: http://www.anandtech.com/video/showdoc.html?i=1647&p=5

Edit: Payne hat sich bereiterklärt, GF3 Ti200 Ergebnisse zu posten. Es wäre jetzt gut, wenn sich noch jemand finden könnte, der GF4Ti Ergebnisse mit den exakt gleichen Takten von Payne's GF3 posten könnte :)

aths
2003-05-11, 22:50:40
Ich bräuchte erst mal den aktuellen Archmark inkl. PW.

Endorphine
2003-05-11, 23:02:15
PM...

StefanV
2003-05-11, 23:18:25
Takt meiner GF3 TI200 (momentan):

220/250MHz

Tests: Bandwith, Texturing, Häckchen vor Swap Buffers entfernt.

*running*

ArchMark 0.10.09alpha
Driver GeForce3/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ ???Hz
Method Flush
Timer 1.463 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 13.334 GB/s
Color 7.651 GB/s
ZAndStencil 51.983 GB/s
Z 38.986 GB/s
Stencil 12.996 GB/s

Draw 9.341 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 9.608 GB/s


Tiling

Fillrate

Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 865.223 MPix/s
2 874.837 MPix/s
3 437.923 MPix/s
4 437.925 MPix/s

----Unfiltered----------------------------------
1 874.813 MPix/s
2 874.849 MPix/s
3 437.923 MPix/s
4 437.921 MPix/s

----Bilinear filter-----------------------------
1 874.821 MPix/s
2 874.805 MPix/s
3 437.912 MPix/s
4 437.928 MPix/s

----Trilinear filter----------------------------
1 874.841 MPix/s
2 437.921 MPix/s
3 291.959 MPix/s
4 218.973 MPix/s



Geometry

Precision

aths
2003-05-11, 23:41:56
Gleicher Graka-Takt (220/250), gleiche Auflösung (1024x768, 100 Hz)

Erst mit Flush, dann mit Swap.

Kann mir bitte jemand erklären, wieso bei mir solch geringen Füllraten rauskommen?

ArchMark 0.10.09alpha
Driver GeForce4 Ti 4600/AGP/SSE2 v1.4.0
Resolution 1024x768 @ ???Hz
Method Flush
Timer 1.818 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 11.381 GB/s
Color 7.275 GB/s
ZAndStencil 26.102 GB/s
Z 19.577 GB/s
Stencil 12.098 GB/s

Draw 8.927 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 9.194 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 2
Height 2

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 878.737 MPix/s
Z 878.796 MPix/s
ColorAndZ 878.745 MPix/s
ZTest 784.209 MPix/s
ZCullLEqual 1.940 GPix/s
ZCullGEqual 1.936 GPix/s
ZCullEqual 3.257 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 785.678 MPix/s
Z 878.799 MPix/s
ColorAndZ 878.783 MPix/s
ZTest 879.315 MPix/s
ZCullLEqual 1.963 GPix/s
ZCullGEqual 1.960 GPix/s
ZCullEqual 3.334 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 878.701 MPix/s
2 878.776 MPix/s
3 439.706 MPix/s
4 439.702 MPix/s

----Unfiltered----------------------------------
1 305.674 MPix/s
2 305.636 MPix/s
3 152.837 MPix/s
4 152.793 MPix/s

----Bilinear filter-----------------------------
1 305.676 MPix/s
2 305.636 MPix/s
3 152.696 MPix/s
4 152.794 MPix/s

----Trilinear filter----------------------------
1 269.646 MPix/s
2 137.873 MPix/s
3 88.800 MPix/s
4 60.229 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 43.923 MTris/s
List 22.369 MTris/s
Clip 22.326 MTris/s

--Vertex shading speed--------------------------
LightD1 37.408 MVerts/s
LightP1 20.042 MVerts/s
LightP8 4.408 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 10
Combiner 16
Interpolator 15







ArchMark 0.10.09alpha
Driver GeForce4 Ti 4600/AGP/SSE2 v1.4.0
Resolution 1024x768 @ ???Hz
Method Swap
Timer 1.818 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 11.266 GB/s
Color 7.011 GB/s
ZAndStencil 24.052 GB/s
Z 17.884 GB/s
Stencil 9.951 GB/s

Draw 8.427 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 8.694 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 2
Height 2

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 840.356 MPix/s
Z 865.288 MPix/s
ColorAndZ 859.395 MPix/s
ZTest 781.443 MPix/s
ZCullLEqual 1.866 GPix/s
ZCullGEqual 1.872 GPix/s
ZCullEqual 3.076 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 162.573 MPix/s
Z 863.383 MPix/s
ColorAndZ 861.919 MPix/s
ZTest 864.381 MPix/s
ZCullLEqual 1.894 GPix/s
ZCullGEqual 1.889 GPix/s
ZCullEqual 3.127 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 695.510 MPix/s
2 863.280 MPix/s
3 435.652 MPix/s
4 435.675 MPix/s

----Unfiltered----------------------------------
1 303.638 MPix/s
2 303.713 MPix/s
3 152.266 MPix/s
4 152.318 MPix/s

----Bilinear filter-----------------------------
1 303.487 MPix/s
2 303.744 MPix/s
3 152.371 MPix/s
4 152.317 MPix/s

----Trilinear filter----------------------------
1 268.256 MPix/s
2 137.484 MPix/s
3 88.595 MPix/s
4 60.114 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 43.953 MTris/s
List 22.405 MTris/s
Clip 22.391 MTris/s

--Vertex shading speed--------------------------
LightD1 37.450 MVerts/s
LightP1 20.042 MVerts/s
LightP8 4.409 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 10
Combiner 16
Interpolator 15



Die Werte bei 300/350, so fahre ich die Karte sonst:
ArchMark 0.10.09alpha
Driver GeForce4 Ti 4600/AGP/SSE2 v1.4.0
Resolution 1024x768 @ ???Hz
Method Swap
Timer 1.818 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 16.246 GB/s
Color 10.060 GB/s
ZAndStencil 34.155 GB/s
Z 24.807 GB/s
Stencil 9.943 GB/s

Draw 12.124 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 12.391 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 2
Height 2

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 1.127 GPix/s
Z 1.175 GPix/s
ColorAndZ 1.170 GPix/s
ZTest 1.108 GPix/s
ZCullLEqual 2.560 GPix/s
ZCullGEqual 2.545 GPix/s
ZCullEqual 4.197 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 560.262 MPix/s
Z 1.171 GPix/s
ColorAndZ 1.173 GPix/s
ZTest 1.163 GPix/s
ZCullLEqual 2.571 GPix/s
ZCullGEqual 2.572 GPix/s
ZCullEqual 4.283 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 1.173 GPix/s
2 1.151 GPix/s
3 592.535 MPix/s
4 592.625 MPix/s

----Unfiltered----------------------------------
1 412.845 MPix/s
2 412.803 MPix/s
3 207.419 MPix/s
4 207.306 MPix/s

----Bilinear filter-----------------------------
1 413.468 MPix/s
2 413.296 MPix/s
3 207.281 MPix/s
4 207.353 MPix/s

----Trilinear filter----------------------------
1 350.106 MPix/s
2 186.706 MPix/s
3 120.575 MPix/s
4 82.248 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 59.806 MTris/s
List 22.261 MTris/s
Clip 22.247 MTris/s

--Vertex shading speed--------------------------
LightD1 37.328 MVerts/s
LightP1 26.618 MVerts/s
LightP8 6.006 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 10
Combiner 16
Interpolator 15

aths
2003-05-11, 23:49:43
Zecki, wieso 10 Bit Präzision? Ich denke, GF3/4 hat 9 Bit (1+8)?

Tiling 2x2? Sollte der Chip, wie auch die FX, in 2x2-Tiles rendern?

StefanV
2003-05-11, 23:51:01
Originally posted by aths
Gleicher Graka-Takt (220/250), gleiche Auflösung (1024x768, 100 Hz)

edit: Ergebnis folgt.

Nicht ganz :)

Auf meinem TFT hab ich 60Hz, dafür aber auch per DVI angebunden (deswegen sitzt die GF3 in dem Rechner)...

Endorphine
2003-05-12, 00:00:05
aths, poste bitte mal Ergebnisse mit flushing, sonst ist keine Vergleichbarkeit gegeben.

StefanV
2003-05-12, 00:02:01
Originally posted by Endorphine
aths, poste bitte mal Ergebnisse mit flushing, sonst ist keine Vergleichbarkeit gegeben.

Er ist gerade dabei ;)

PS: hier mal meine mit Haken:


[CODE]ArchMark 0.10.09alpha
Driver GeForce3/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ ???Hz
Method Swap
Timer 1.463 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 9.996 GB/s
Color 5.724 GB/s
ZAndStencil 30.999 GB/s
Z 22.820 GB/s
Stencil 7.737 GB/s

Draw 7.255 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 7.523 GB/s


Tiling

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 562.973 MPix/s
Z 562.041 MPix/s
ColorAndZ 568.843 MPix/s
ZTest 557.988 MPix/s
ZCullLEqual 1.268 GPix/s
ZCullGEqual 1.255 GPix/s
ZCullEqual 547.552 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z24 S0
Color 507.585 MPix/s
Z 557.635 MPix/s
ColorAndZ 570.774 MPix/s
ZTest 565.718 MPix/s
ZCullLEqual 1.274 GPix/s
ZCullGEqual 1.273 GPix/s
ZCullEqual 547.738 MPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 567.431 MPix/s
2 568.905 MPix/s
3 285.401 MPix/s
4 286.962 MPix/s

----Unfiltered----------------------------------
1 565.441 MPix/s
2 558.647 MPix/s
3 283.947 MPix/s
4 286.784 MPix/s

----Bilinear filter-----------------------------
1 568.999 MPix/s
2 567.864 MPix/s
3 286.550 MPix/s
4 282.859 MPix/s

----Trilinear filter----------------------------
1 553.379 MPix/s
2 286.428 MPix/s
3 188.707 MPix/s
4 144.159 MPix/s



Geometry

Precision

Endorphine
2003-05-12, 00:04:23
Die Z-Buffer Komprimierung scheint wohl bei deiner GF3 besser als bei aths' GF4Ti zu arbeiten?

Auf jeden Fall scheint die GF3 mehr nutzbare Bandbreite zur Verfügung zu haben, warum auch immer...

aths
2003-05-12, 00:10:00
Originally posted by Endorphine
Die Z-Buffer Komprimierung scheint wohl bei deiner GF3 besser als bei aths' GF4Ti zu arbeiten?

Auf jeden Fall scheint die GF3 mehr nutzbare Bandbreite zur Verfügung zu haben, warum auch immer... Guck mal auf die Füllraten - solange das nicht geklärt ist, würde ich den Test nicht für bare Münze nehmen.

Endorphine
2003-05-12, 00:12:40
Payne hat wohl AA oder AF angeschaltet? :naughty:

StefanV
2003-05-12, 00:12:58
aths, irgendwas stimmt mit deiner GF4 bzw deinem Rechner nicht, siehe hier (bandwith sollte bei mir ungefähr hinkommen):

Originally posted by ow
Neues GF4ti4200 Ergebnis / Flush:

ArchMark 0.10.04alpha
Driver GeForce4 Ti 4200/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 88.16Hz
Method Flush
Timer 1.470 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 12.057 GB/s
Color 7.651 GB/s
ZAndStencil 28.421 GB/s
Z 21.317 GB/s
Stencil 13.275 GB/s

Draw 9.094 GB/s
BurnedByRAMDAC 277.611 MB/s
Physical 9.372 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block size--------------------------
----updating all buffers------------------------
Width 2
Height 2

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 995.643 MPix/s
Z 995.628 MPix/s
ColorAndZ 995.637 MPix/s
ZTest 867.407 MPix/s
ZCullLEqual 1.943 GPix/s
ZCullGEqual 1.942 GPix/s
ZCullEqual 3.721 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 995.643 MPix/s
Z 995.642 MPix/s
ColorAndZ 995.642 MPix/s
ZTest 996.049 MPix/s
ZCullLEqual 1.960 GPix/s
ZCullGEqual 1.959 GPix/s
ZCullEqual 3.799 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 995.626 MPix/s
2 995.638 MPix/s
3 498.144 MPix/s
4 498.144 MPix/s

----Unfiltered----------------------------------
1 995.640 MPix/s
2 995.639 MPix/s
3 498.144 MPix/s
4 498.144 MPix/s

----Bilinear filter-----------------------------
1 995.640 MPix/s
2 995.640 MPix/s
3 498.145 MPix/s
4 498.144 MPix/s

----Trilinear filter----------------------------
1 995.638 MPix/s
2 498.145 MPix/s
3 332.097 MPix/s
4 249.073 MPix/s

----Max anisotropy (8)--------------------------
1 498.456 MPix/s
2 249.228 MPix/s
3 166.430 MPix/s
4 149.551 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 49.691 MTris/s
List 18.007 MTris/s
Clip 18.102 MTris/s

--Vertex shading speed--------------------------
LightD1 32.645 MVerts/s
LightP1 22.087 MVerts/s
LightP8 4.994 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 9
Combiner 6
Interpolator 10

StefanV
2003-05-12, 00:14:11
Originally posted by Endorphine
Payne hat wohl AA oder AF angeschaltet? :naughty:

nur beim 2. :)

Und zwar 4° AF.

Xmas
2003-05-12, 02:16:54
Originally posted by aths
Tiling 2x2? Sollte der Chip, wie auch die FX, in 2x2-Tiles rendern?
Natürlich, was sonst? Das sieht man schon bei der LOD-Auswahl, die immer für 2x2 Pixel gleich ist.

aths
2003-05-12, 17:51:31
Originally posted by Xmas
Natürlich, was sonst? Das sieht man schon bei der LOD-Auswahl, die immer für 2x2 Pixel gleich ist. Wieder eine Feinheit, wo die GeForce3 schon weiter war, als gedacht. Warum das LOD dafür ein Anzeichen ist, finde ich jetzt auf den ersten Moment allerdings nicht so einsichtig...

zeckensack
2003-05-13, 22:46:18
Originally posted by aths
Zecki, wieso 10 Bit Präzision? Ich denke, GF3/4 hat 9 Bit (1+8)?

Tiling 2x2? Sollte der Chip, wie auch die FX, in 2x2-Tiles rendern? Präzision und Tiling sind immer noch leicht bescheuert, diese beiden Einzelwerte darf man nicht wirklich ernst nehmen :(

PCGH_Thilo
2003-05-28, 17:27:05
*arschmark-nebwie-alarm*

0x AA + AF

ArchMark 0.10.09alpha
Driver GeForce FX 5900 Ultra/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 60.33Hz
Method Flush
Timer 2.163 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 34.057 GB/s
Color 25.961 GB/s
ZAndStencil 48.028 GB/s
Z 17.142 GB/s
Stencil 6.494 GB/s

Draw 26.664 GB/s
BurnedByRAMDAC 189.227 MB/s
Physical 26.853 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 2
Height 2

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 4
Height none

----in stencil buffer---------------------------
Width 4
Height none



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 1.795 GPix/s
Z 3.580 GPix/s
ColorAndZ 1.795 GPix/s
ZTest 1.794 GPix/s
ZCullLEqual 3.968 GPix/s
ZCullGEqual 3.961 GPix/s
ZCullEqual 6.657 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 1.780 GPix/s
Z 3.578 GPix/s
ColorAndZ 1.795 GPix/s
ZTest 1.795 GPix/s
ZCullLEqual 3.980 GPix/s
ZCullGEqual 3.974 GPix/s
ZCullEqual 6.674 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 1.795 GPix/s
2 1.795 GPix/s
3 845.715 MPix/s
4 845.714 MPix/s

----Unfiltered----------------------------------
1 1.795 GPix/s
2 1.795 GPix/s
3 846.604 MPix/s
4 846.605 MPix/s

----Bilinear filter-----------------------------
1 1.795 GPix/s
2 1.795 GPix/s
3 846.607 MPix/s
4 846.601 MPix/s

----Trilinear filter----------------------------
1 1.795 GPix/s
2 958.654 MPix/s
3 609.950 MPix/s
4 473.555 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 134.355 MTris/s
List 42.475 MTris/s
Clip 42.459 MTris/s

--Vertex shading speed--------------------------
LightD1 74.902 MVerts/s
LightP1 40.909 MVerts/s
LightP8 13.636 MVerts/s


Precision

PCGH_Thilo
2003-05-28, 17:31:25
und weils so schön war...
nun auch mit schweppes.

ArchMark 0.10.09alpha
Driver GeForce FX 5900 Ultra/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 60.16Hz
Method Swap
Timer 2.163 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 32.256 GB/s
Color 23.836 GB/s
ZAndStencil 36.940 GB/s
Z 27.814 GB/s
Stencil 13.766 GB/s

Draw 26.341 GB/s
BurnedByRAMDAC 188.638 MB/s
Physical 26.530 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 2
Height 2

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 4
Height none

----in stencil buffer---------------------------
Width 4
Height none



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 1.746 GPix/s
Z 3.395 GPix/s
ColorAndZ 1.746 GPix/s
ZTest 1.740 GPix/s
ZCullLEqual 3.715 GPix/s
ZCullGEqual 3.771 GPix/s
ZCullEqual 6.139 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 1.515 GPix/s
Z 3.178 GPix/s
ColorAndZ 1.753 GPix/s
ZTest 1.740 GPix/s
ZCullLEqual 3.788 GPix/s
ZCullGEqual 3.743 GPix/s
ZCullEqual 6.181 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 1.743 GPix/s
2 1.746 GPix/s
3 834.171 MPix/s
4 834.852 MPix/s

----Unfiltered----------------------------------
1 1.740 GPix/s
2 1.741 GPix/s
3 832.610 MPix/s
4 832.904 MPix/s

----Bilinear filter-----------------------------
1 1.747 GPix/s
2 1.748 GPix/s
3 834.505 MPix/s
4 834.353 MPix/s

----Trilinear filter----------------------------
1 1.747 GPix/s
2 942.809 MPix/s
3 603.507 MPix/s
4 469.343 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 134.450 MTris/s
List 42.440 MTris/s
Clip 42.427 MTris/s

--Vertex shading speed--------------------------
LightD1 74.885 MVerts/s
LightP1 43.801 MVerts/s
LightP8 13.632 MVerts/s


Precision

Endorphine
2003-05-28, 18:35:09
:o :o

Teilweise fast doppelt so viel Geschwindigkeit wie meine kleine R9700, z.B. bei TF Fillrate und 4 Layer. Stencilbufferstärke war ja zu erwarten *eg* Die Geometrieleistung ist aber etwas mager, aber wohl im Lebenszyklus des NV35 völlig ausreichend.

Danke für die Resultate :)

Achill
2003-05-28, 22:13:23
*ein paar fragen hat*

erst nochmal die Ergebnise einer R9700 Pro mit neustem Treiber

ArchMark 0.10.09alpha
Driver Radeon 9700 Pro x86/SSE2 v1.3.3717 Win2000 Release
Resolution 1024x768 @ 86.20Hz
Method Swap
Timer 2.405 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 18.013 GB/s
Color 9.587 GB/s
ZAndStencil 77.205 GB/s
Z 58.292 GB/s
Stencil 2.128 GB/s

Draw 18.762 GB/s
BurnedByRAMDAC 270.987 MB/s
Physical 19.033 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 64
Height 4

----in color buffer-----------------------------
Width 4
Height 32

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 2.349 GPix/s
Z 2.457 GPix/s
ColorAndZ 2.349 GPix/s
ZTest 1.751 GPix/s
ZCullLEqual 5.364 GPix/s
ZCullGEqual 5.731 GPix/s
ZCullEqual 2.457 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 2.454 GPix/s
Z 2.457 GPix/s
ColorAndZ 2.457 GPix/s
ZTest 1.912 GPix/s
ZCullLEqual 6.042 GPix/s
ZCullGEqual 6.020 GPix/s
ZCullEqual 2.457 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 2.455 GPix/s
2 1.257 GPix/s
3 844.995 MPix/s
4 636.619 MPix/s
5 510.816 MPix/s
6 427.376 MPix/s
7 368.734 MPix/s
8 322.833 MPix/s

----Unfiltered----------------------------------
1 2.455 GPix/s
2 1.257 GPix/s
3 845.324 MPix/s
4 636.872 MPix/s
5 510.959 MPix/s
6 427.674 MPix/s
7 368.892 MPix/s
8 322.987 MPix/s

----Bilinear filter-----------------------------
1 2.456 GPix/s
2 1.257 GPix/s
3 845.306 MPix/s
4 636.866 MPix/s
5 510.999 MPix/s
6 427.543 MPix/s
7 368.899 MPix/s
8 322.881 MPix/s

----Trilinear filter----------------------------
1 1.257 GPix/s
2 636.510 MPix/s
3 426.550 MPix/s
4 319.779 MPix/s
5 256.279 MPix/s
6 214.085 MPix/s
7 183.990 MPix/s
8 161.312 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 61.141 MTris/s
List 42.495 MTris/s
Clip 2.477 MTris/s

--Vertex shading speed--------------------------
LightD1 90.555 MVerts/s
LightP1 38.946 MVerts/s
LightP8 14.664 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
AlphaTest 9.400
Combiner 24
Interpolator 21

Achill
2003-05-28, 22:28:46
Test: TestGF FX r300

Warum verhält sich das genau umgekehrt und sind damit die z-tests
gemeint, den wenn ja, wie soll man dann eine Anwendung schreiben die
auf beiden optimal läuft (wenn nicht zur laufzeit entschieden wird)?

Fillrate
--32 bits------------------------------------------
ZCullLEqual 3.715 GPix/s 5.364 GPix/s
ZCullGEqual 3.771 GPix/s 5.731 GPix/s
ZCullEqual 6.139 GPix/s 2.457 GPix/s

Warum läuft hier die GFFX mit 0 z-Buffer (andere test mit NV GPU
genauso und sind diese dann noch vergleichbar?), geht da überhaupt
clipping und warum ist der Wert so hoch, wird die Geo. vom CPU
berechnet (hatten das glaube vorher mal gesagt wenn clipping so hoch
ist)?

Geometry
Mode RGBA5650 Z0 S0 RGBA5650 Z16 S0
--Plain vertices-----------------------------------
Fan 134.450 MTris/s 61.141 MTris/s
List 42.440 MTris/s 42.495 MTris/s
Clip 42.427 MTris/s 2.477 MTris/s

--Vertex shading speed--------------------------
LightD1 74.885 MVerts/s 90.555 MVerts/s
LightP1 43.801 MVerts/s 38.946 MVerts/s
LightP8 13.632 MVerts/s 14.664 MVerts/s

Achill
2003-05-28, 22:44:14
habe mir mal alle Tests bzgl. Geom. angeschaut, überall wo der ZBuffer auf 0 steht, wird das Clipping sehr schnell ausgeführt, bei inigen Karten (TNT, Matrox, ATI, Software) steht der wert aber auf 16 und das clipping ist sehr langsam.

Demirug
2003-05-28, 22:59:12
Original geschrieben von Achill


Test: TestGF FX r300

Warum verhält sich das genau umgekehrt und sind damit die z-tests
gemeint, den wenn ja, wie soll man dann eine Anwendung schreiben die
auf beiden optimal läuft (wenn nicht zur laufzeit entschieden wird)?

Fillrate
--32 bits------------------------------------------
ZCullLEqual 3.715 GPix/s 5.364 GPix/s
ZCullGEqual 3.771 GPix/s 5.731 GPix/s
ZCullEqual 6.139 GPix/s 2.457 GPix/s



Das der R300 bei ZCullEqual einbricht ist verständlich. ZCullEqual deaktiviert beim R300 das HirZ.

Wieso der NV35 bei ZCullEqual einen solchen Sprung macht ist mir noch nicht so ganz klar. Das dürfte ihm allerdings bei Multipass und Z-First Engines einen Vorteil bringen wenn der Entwickler den entsprechenden Absatz in den Performanceguides von ATI übersieht.

Der einzige Weg es denoch für beide Chips optimal zu lösen ist hier wirklich eine Laufzeit Erkennung.

Xmas
2003-05-28, 23:04:02
Achill, das Clipping ist so schnell weil die GeForce-Karten Infinite Guardband Clipping beherrschen. Das heißt, einfach gesagt, dass die Koordinaten nach der Transformation beliebig weit über den Bildschirmrand hinweggehen können, es muss nicht geclippt und neu tesselliert werden wie bei anderen Karten.

Endorphine
2003-05-28, 23:06:58
Original geschrieben von Xmas
Achill, das Clipping ist so schnell weil die GeForce-Karten Infinite Guardband Clipping beherrschen. Das heißt, einfach gesagt, dass die Koordinaten nach der Transformation beliebig weit über den Bildschirmrand hinweggehen können, es muss nicht geclippt und neu tesselliert werden wie bei anderen Karten. Und wieso hat nVidia das schon seit längerem und ATI immer noch nicht? Patentprobleme?

Matti
2003-05-29, 16:31:38
Guardband Clipping hat nV nur von 3dfx geklaut! Auch meine Voodoo3 kann das schon!

Demirug
2003-05-29, 16:54:28
Original geschrieben von Matti
Guardband Clipping hat nV nur von 3dfx geklaut! Auch meine Voodoo3 kann das schon!

Du must hier aber zwischen Guardband Clipping und Infinite Guardband Clipping unterscheiden.

Das "normale" Guardband Clipping konnte schon der Riva 128 Chip.

zeckensack
2003-05-29, 16:59:28
Original geschrieben von Achill
Warum verhält sich das genau umgekehrt und sind damit die z-tests
gemeint, den wenn ja, wie soll man dann eine Anwendung schreiben die
auf beiden optimal läuft (wenn nicht zur laufzeit entschieden wird)?
Fillrate
--32 bits------------------------------------------
ZCullLEqual 3.715 GPix/s 5.364 GPix/s
ZCullGEqual 3.771 GPix/s 5.731 GPix/s
ZCullEqual 6.139 GPix/s 2.457 GPix/s
Wurde schon gesagt: Man kann es scheinbar nicht beiden Architekturen gleichzeitig recht machen. Noch ein Anhaltspunkt für die hohe Leistung der FX bei 'ZCullEqual':
Hier kann man sich sämtliche Z-Writes sparen. Entweder der 'durchgelassene' Pixel hat den gleichen Z-Wert der schon im Z-Buffer steht (=> ein Update desselben wäre Verschwendung), oder er kommt erst garnicht durch den Z-Test durch, wodurch der Schreibvorgang per se nicht erfolgen darf.

Möglicherweise ist der NV-Treiber clever genug das zu wissen, und schaltet Z-Writes automatisch aus. Das ist eine legale Optimierung. Ich kann mal schauen, wie sich der R300 verhält, wenn ich explizit glDepthMask(false); setze.
Warum läuft hier die GFFX mit 0 z-Buffer (andere test mit NV GPU
genauso und sind diese dann noch vergleichbar?), geht da überhaupt
clipping und warum ist der Wert so hoch, wird die Geo. vom CPU
berechnet (hatten das glaube vorher mal gesagt wenn clipping so hoch
ist)?

Geometry
Mode RGBA5650 Z0 S0 RGBA5650 Z16 S0
--Plain vertices-----------------------------------
Fan 134.450 MTris/s 61.141 MTris/s
List 42.440 MTris/s 42.495 MTris/s
Clip 42.427 MTris/s 2.477 MTris/s

--Vertex shading speed--------------------------
LightD1 74.885 MVerts/s 90.555 MVerts/s
LightP1 43.801 MVerts/s 38.946 MVerts/s
LightP8 13.632 MVerts/s 14.664 MVerts/s

Die Werte sind vergleichbar. Der Geometrietest fordert keinen Z-Buffer an, braucht er auch nicht. Die komplette durchgeschleuste Geometrie ist nach der Transformation 'back facing', es werden also keine Pixel erzeugt.
Das Framebufferlayout hat nur dann überhaupt einen Effekt, wenn man 'swap buffers' aktiviert hat und der Treiber 'block copy' anstatt 'pointer flip' betreibt. Dann muß nämlich beim swappen der Backbuffer in den Frontbuffer kopiert werden (der Z-Buffer bleibt weiter irrelevant).

ATI gibt halt immer automatisch einen Z-Buffer mit, daran kann ich auch nichts schlechtes erkennen. 99,999% aller 3D-Applikationen brauchen diesen sowieso, und wenn nicht, kostet er nur Speicherplatz, aber keine Performance.

Edit:
Clipping (genauso wie Backface culling) passiert nach der T&L-Stufe und passiert bei allen Karten mit mindestens Fixed Function HW-T&L auf dem Grafikchip. Warum das bei NV so schnell ist wurde ja bereits gesagt: infinite guardband.
ATI krebst hier noch mit der Clipping-Einheit des R100 herum (die Performance pro Takt ist absolut gleich).

Unter D3D beherrscht der R300 laut DXCaps ein limited Guardband von -960 bis +2880, was für den Clipping-Test vom Koordinatenraum her perfekt geeignet wäre. Wenn das so stimmt, dann dürfte die Performance in diesem Test nicht mehr einbrechen (gleiche Leistung wie bei 'List', eben so wie auf NV-Hardware). Wie man in den Genuß kommt, dieses auch zu nutzen, weiß ich leider nicht.

zeckensack
2003-05-29, 17:06:25
Original geschrieben von Demirug
Du must hier aber zwischen Guardband Clipping und Infinite Guardband Clipping unterscheiden.

Das "normale" Guardband Clipping konnte schon der Riva 128 Chip. Der R100 konnte auch Guardband clipping, aber (wie man das von kleinen Guardbands erwarten sollte), führte dieses zu Renderingfehlern und war deshalb standardmäßig deaktiviert.

Matti
2003-05-29, 17:17:04
Guardband Clipping und Infinite Guardband Clipping - Was ist der Unterschied??

ow
2003-05-29, 17:20:23
:| hmm....spezieller speedup-Modus im neuen Kyro-Treiber? ;)

:o
->

ArchMark 0.10.09alpha
Driver PowerVR KYRO v1.2.1
Resolution 1024x768 @ ???Hz
Method Flush
Timer 1.470 GHz

Bandwidth
Mode RGBA8888 Z32 S4
--bandwidth-------------------------------------
----available to buffer clears------------------
All 20.669 TB/s
Color 11.913 TB/s
ZAndStencil 12.482 TB/s
Z 15.408 TB/s
Stencil 1.823 TB/s

Draw 3.783 TB/s
BurnedByRAMDAC 267.387 MB/s
Physical 3.783 TB/s


Tiling
Mode RGBA8888 Z32 S4
--preferred block alignment---------------------
----updating all buffers------------------------
Width 64
Height 8

----in color buffer-----------------------------
Width 16
Height 16

----in depth buffer-----------------------------
Width 16
Height 32

----in stencil buffer---------------------------
Width 64
Height 64



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z32 S4
Color 127.708 GPix/s
Z 590.307 GPix/s
ColorAndZ 9.895 GPix/s
ZTest 11.832 GPix/s
ZCullLEqual 617.963 GPix/s
ZCullGEqual 627.371 GPix/s
ZCullEqual 624.003 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 134.705 GPix/s
Z 552.909 GPix/s
ColorAndZ 10.189 GPix/s
ZTest 12.430 GPix/s
ZCullLEqual 614.543 GPix/s
ZCullGEqual 646.267 GPix/s
ZCullEqual 471.731 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 233.654 GPix/s
2 20.332 GPix/s
3 16.584 GPix/s
4 17.396 GPix/s

----Unfiltered----------------------------------
1 509.257 GPix/s
2 17.366 GPix/s
3 18.233 GPix/s
4 17.320 GPix/s

----Bilinear filter-----------------------------
1 17.514 GPix/s
2 17.376 GPix/s
3 17.377 GPix/s
4 17.446 GPix/s

----Trilinear filter----------------------------
1 17.348 GPix/s
2 17.382 GPix/s
3 17.384 GPix/s
4 17.315 GPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 629.826 kTris/s
List 229.486 kTris/s
Clip 205.103 kTris/s

--Vertex shading speed--------------------------
LightD1 502.449 kVerts/s
LightP1 400.259 kVerts/s
LightP8 308.717 kVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 8
Combiner 14
Interpolator 15

Demirug
2003-05-29, 17:22:56
@zeckensack: Bei der Fillrate Messung mit den Z-Tests wie ist den dort das Pass/Fail verhältniss?

ow
2003-05-29, 17:24:13
mit Swap passt das schon eher:

ArchMark 0.10.09alpha
Driver PowerVR KYRO v1.2.1
Resolution 1024x768 @ ???Hz
Method Swap
Timer 1.470 GHz

Bandwidth
Mode RGBA8888 Z32 S4
--bandwidth-------------------------------------
----available to buffer clears------------------
All 1.210 GB/s
Color 583.793 MB/s
ZAndStencil 312.242 MB/s
Z 284.038 MB/s
Stencil 34.726 MB/s

Draw 1.066 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 1.334 GB/s


Tiling
Mode RGBA8888 Z32 S4
--preferred block alignment---------------------
----updating all buffers------------------------
Width 16
Height 16

----in color buffer-----------------------------
Width 16
Height 8

----in depth buffer-----------------------------
Width 16
Height 16

----in stencil buffer---------------------------
Width 16
Height 8



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z32 S4
Color 106.421 MPix/s
Z 71.298 MPix/s
ColorAndZ 141.224 MPix/s
ZTest 93.462 MPix/s
ZCullLEqual 144.785 MPix/s
ZCullGEqual 73.282 MPix/s
ZCullEqual 72.169 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 222.648 MPix/s
Z 151.298 MPix/s
ColorAndZ 224.625 MPix/s
ZTest 180.915 MPix/s
ZCullLEqual 227.648 MPix/s
ZCullGEqual 153.111 MPix/s
ZCullEqual 152.424 MPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 225.408 MPix/s
2 115.201 MPix/s
3 76.996 MPix/s
4 57.861 MPix/s

----Unfiltered----------------------------------
1 225.393 MPix/s
2 115.319 MPix/s
3 77.555 MPix/s
4 58.655 MPix/s

----Bilinear filter-----------------------------
1 225.217 MPix/s
2 115.203 MPix/s
3 77.578 MPix/s
4 58.640 MPix/s

----Trilinear filter----------------------------
1 115.930 MPix/s
2 59.446 MPix/s
3 40.430 MPix/s
4 30.921 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 630.977 kTris/s
List 227.530 kTris/s
Clip 203.971 kTris/s

--Vertex shading speed--------------------------
LightD1 502.103 kVerts/s
LightP1 403.745 kVerts/s
LightP8 310.257 kVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 8
Combiner 14
Interpolator 15

Demirug
2003-05-29, 17:26:12
Original geschrieben von Matti
Guardband Clipping und Infinite Guardband Clipping - Was ist der Unterschied??

Beim Guardband Clipping kann es immer noch notwendig sein das ein Dreieck abgeschnitten werden muss. Das kostet Leistung. Beim Infinite Guardband Clipping entfällt dieses abschneiden komplett.

zeckensack
2003-05-29, 17:35:12
Original geschrieben von Demirug
@zeckensack: Bei der Fillrate Messung mit den Z-Tests wie ist den dort das Pass/Fail verhältniss? LEQUAL: clear, 1x pass, 3x fail
GEQUAL: clear, 2x pass, 2x fail - war so nicht geplant, ist wohl ein Bug meinerseits :|
EQUAL: clear, 4x fail

Das ändert natürlich erheblich die Verwertbarkeit (weil man die Werte der Einzeltests nicht gut genug vergleichen kann).
Danke daß du nachgefragt hast, sonst hätte ich nicht nochmal in den Code geschaut.

Matti
2003-05-29, 17:43:17
Original geschrieben von Demirug
Beim Guardband Clipping kann es immer noch notwendig sein das ein Dreieck abgeschnitten werden muss. Das kostet Leistung. Beim Infinite Guardband Clipping entfällt dieses abschneiden komplett.

Das füllen der Dreiecke geschieht doch nach dem Scan-Line-Verfahren, oder?? Wenn ja, ist das Dreieck dann sowieso auf Bildschirmgröße zurechtgeschnitten. Ich hab vor ein paar Jahren mal nen Software-Renderer in Pascal geschrieben, und da habe ich das mit dem Scan-Line-Verfahren gemacht.

Demirug
2003-05-29, 17:44:33
Original geschrieben von zeckensack
LEQUAL: clear, 1x pass, 3x fail
GEQUAL: clear, 2x pass, 2x fail - war so nicht geplant, ist wohl ein Bug meinerseits :|
EQUAL: clear, 4x fail

Das ändert natürlich erheblich die Verwertbarkeit (weil man die Werte der Einzeltests nicht gut genug vergleichen kann).
Danke daß du nachgefragt hast, sonst hätte ich nicht nochmal in den Code geschaut.

dazu das

Anhaltspunkt für die hohe Leistung der FX bei 'ZCullEqual':
Hier kann man sich sämtliche Z-Writes sparen. Entweder der 'durchgelassene' Pixel hat den gleichen Z-Wert der schon im Z-Buffer steht (=> ein Update desselben wäre Verschwendung), oder er kommt erst garnicht durch den Z-Test durch, wodurch der Schreibvorgang per se nicht erfolgen darf.

Möglicherweise ist der NV-Treiber clever genug das zu wissen, und schaltet Z-Writes automatisch aus. Das ist eine legale Optimierung. Ich kann mal schauen, wie sich der R300 verhält, wenn ich explizit glDepthMask(false); setze.

Diese Überlegung macht dann aber keinen Sinn mehr. Da es ja bei EQUAL niemals zu einem Pass kommt müssen beide auch niemals etwas schreiben.

Wie wäre es den Test so zu erweitern das die ZTests jeweils 3 mal durchlaufen?

1. Allways Pass
2. Allways Fail
3. 50%/50% Pass/Fail

25%/75% und 75%/25% wäre vielleicht auch noch ganz interresant.

Demirug
2003-05-29, 17:56:29
Original geschrieben von Matti
Das füllen der Dreiecke geschieht doch nach dem Scan-Line-Verfahren, oder?? Wenn ja, ist das Dreieck dann sowieso auf Bildschirmgröße zurechtgeschnitten. Ich hab vor ein paar Jahren mal nen Software-Renderer in Pascal geschrieben, und da habe ich das mit dem Scan-Line-Verfahren gemacht.

Zumindestens nVidia benutzt kein Scanlineverfahren mehr wenn das Patent das ich hier liegen habe auch zum Einsatz gekommen ist und auch bei ATI kann es aufgrund von HirZ kein reines Scanlineverfahren sein.

Zudem braucht man auch beim Scanlineverfahren clipping. Denn sonst kann es leicht passieren das der zur Verfügung stehende Zahlenraum nicht ausreicht. Bei einem Softwarerenderer ist die Gefahr nicht so gross aber bei einer Hardwareimplementierung wo man mit jedem zusätzlichen Bit bei den Registern geizt geht das schnell.

Zudem gehe mal mal davon aus das du dann die einzelnen Scanlines geclippt hast

Matti
2003-05-29, 17:59:42
ja. anders gehts auch garnicht.

zeckensack
2003-05-29, 18:00:28
Original geschrieben von Demirug
dazu das



Diese Überlegung macht dann aber keinen Sinn mehr. Da es ja bei EQUAL niemals zu einem Pass kommt müssen beide auch niemals etwas schreiben.

Wie wäre es den Test so zu erweitern das die ZTests jeweils 3 mal durchlaufen?

1. Allways Pass
2. Allways Fail
3. 50%/50% Pass/Fail

25%/75% und 75%/25% wäre vielleicht auch noch ganz interresant. Jau, ich glaube ich habe das 'Problem' gefunden. Der ursprüngliche Plan war, daß alle Pixel durch den Z-Test fallen (O-Ton im HTML-Report: "discardable by 'LEQUAL' depth test"). Demzufolge wird der Clear-Wert gewählt, nur im Zuge des 'Verbots' der Hierarchie-Optimierung für den 'echten' Z-tested Füllratentest (wo Overdraw herrscht) habe ich wohl die Clear-Werte kaputtgemacht (genau umgekehrt).

Hier mal als Kontrastprogramm jeweils
clear, 4x fail auf R300:
ArchMark 0.10.09alpha
Driver Radeon 9500 Pro x86/MMX/3DNow!/SSE v1.3.3717 Win9x Release
Resolution 1024x768 @ ???Hz
Method Flush
Timer 1.528 GHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 1.870 GPix/s
Z 2.181 GPix/s
ColorAndZ 1.868 GPix/s
ZTest 919.418 MPix/s
ZCullLEqual 29.586 GPix/s
ZCullGEqual 29.483 GPix/s
ZCullEqual 2.171 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 2.153 GPix/s
Z 2.182 GPix/s
ColorAndZ 2.139 GPix/s
ZTest 1.192 GPix/s
ZCullLEqual 29.538 GPix/s
ZCullGEqual 29.558 GPix/s
ZCullEqual 2.170 GPix/s



Edit: Sorry, falsche Ergebnisse. Hab's ersetzt.

zeckensack
2003-05-29, 18:04:29
Original geschrieben von ow
:| hmm....spezieller speedup-Modus im neuen Kyro-Treiber? ;)

:o
->Ui, Terabytes! ?-)

Demirug
2003-05-29, 18:07:27
ZCullEqual ist also wirklich eine ganz schlechte Idee auf dem R300. Hoffen wir mal das nicht so viele auf die Idee kommen einen Z-Pass first renderer zu schreiben der nach dem Z-Pass den Z-Test auf ZCullEqual setzt

zeckensack
2003-05-29, 18:08:26
Original geschrieben von Matti
ja. anders gehts auch garnicht. Eben ;)
Bei der Hardware hast du das gleiche Problem, du addressierst ja am Schluß den Framebuffer nach Schema y*Zeilenlänge+x. Du mußt irgendwie sicherstellen, daß du nicht über den Framebuffer hinausaddressierst, oder Polygone die rechts hinausragen, von links wieder ins Bild kommen. Ganz ohne Clipping geht's nicht.

Mogadischu
2003-07-10, 01:00:11
wurde eigentlich schon mal der Intel Extreme Graphics vermessen?

Aqualon
2003-07-10, 07:41:36
Original geschrieben von Mogadischu
wurde eigentlich schon mal der Intel Extreme Graphics vermessen?

Ich könnte auch nen SIS630 onboard-Chip anbieten, der ist bestimmt noch besser :lolaway:

@Zeckensack:

Was macht denn der Archmark? Gibts da mal ne public version? Und wenn ja, wann kann man damit rechnen?

Aqua

zeckensack
2003-07-11, 05:27:44
Sorry, es gibt immer noch keine 'fertige' Version, die meinen Ansprüchen gerecht wird. Insbesondere der Präzisionstest und der Tiling-Test arbeiten nicht zuverlässig.

Da das Interesse aber vorhanden ist (habe ein paar PMs bekommen), hier der Link für die letzte Alpha-Version:
Üpp (http://home.t-online.de/home/zsack/archmark_alpha.zip)

Das ist der gleiche Link, den auch die 'Eingeweihten' benutzt haben. Das ZIP-Archiv ist auch schon länger nicht mehr verschlüsselt. Das ist bei ZIPs zwar nicht besonders sicher, trotzdem war es in der Frühphase des Projekts der einzige Schutzmechanismus.

Aqualon
2003-07-11, 10:02:30
Also meine G450DH hier kommt mit dem Archmark gar nicht zu Recht.

Wenn ich 32bit aktiviert habe, gibt es keine Ergebnisse bei Bandwidth und Tiling, sondern ne error... Ausgabe

Ausserdem hab ich das Problem, dass der Archmark beim Precisiontest abstürzt (egal ob Swap/Flush oder 32bit an/aus).

Hier mal das Ergebnis mit allen Optionen deaktiviert und ohne Precisiontest:

ArchMark 0.10.09alpha
Driver Matrox G400 v1.1.3 Feb 12 2002
Resolution 1024x768 @ ???Hz
Method Flush
Timer 864.460 MHz

Bandwidth
Mode RGBA5650 Z15 S1
--bandwidth-------------------------------------
----available to buffer clears------------------
All 727.588 MB/s
Color 1.578 GB/s
ZAndStencil 434.130 MB/s
Z 828.317 MB/s
Stencil 54.820 MB/s

Draw 1.816 GB/s
BurnedByRAMDAC 133.693 MB/s
Physical 1.950 GB/s


Tiling
Mode RGBA5650 Z15 S1
--preferred block alignment---------------------
----updating all buffers------------------------
Width 64
Height 4

----in color buffer-----------------------------
Width 8
Height 32

----in depth buffer-----------------------------
Width 8
Height 64

----in stencil buffer---------------------------
Width 4
Height 32



Fillrate
--16 bits---------------------------------------
Mode RGBA5650 Z15 S1
Color 238.491 MPix/s
Z 254.816 MPix/s
ColorAndZ 256.123 MPix/s
ZTest 250.099 MPix/s
ZCullLEqual 251.504 MPix/s
ZCullGEqual 251.296 MPix/s
ZCullEqual 246.248 MPix/s


Texturing
Mode RGBA5650 Z15 S1
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 249.618 MPix/s
2 112.253 MPix/s

----Unfiltered----------------------------------
1 254.043 MPix/s
2 111.937 MPix/s

----Bilinear filter-----------------------------
1 245.782 MPix/s
2 115.141 MPix/s

----Trilinear filter----------------------------
1 131.387 MPix/s
2 67.864 MPix/s



Geometry
Mode RGBA5650 Z15 S1
--Plain vertices--------------------------------
Fan 3.423 MTris/s
List 1.974 MTris/s
Clip 421.613 kTris/s

--Vertex shading speed--------------------------
LightD1 4.166 MVerts/s
LightP1 4.519 MVerts/s
LightP8 4.146 MVerts/s


Precision



Die eingestellte Auflösung war übrigens 2304*864*32bit @85Hz (DH-Modus)

Aqua

StefanV
2003-07-11, 13:11:14
Original geschrieben von Aqualon
Also meine G450DH hier kommt mit dem Archmark gar nicht zu Recht.

Wenn ich 32bit aktiviert habe, gibt es keine Ergebnisse bei Bandwidth und Tiling, sondern ne error... Ausgabe

Ausserdem hab ich das Problem, dass der Archmark beim Precisiontest abstürzt (egal ob Swap/Flush oder 32bit an/aus).

Hier mal das Ergebnis mit allen Optionen deaktiviert und ohne Precisiontest:
Die eingestellte Auflösung war übrigens 2304*864*32bit @85Hz (DH-Modus)

Aqua

Schau mal im MGA Panel ob der 32bit Z-Buffer an ist...

Mogadischu
2003-07-11, 13:13:00
ArchMark 0.10.09alpha
Driver Intel Brookdale-G v1.3.0 - Build 4.13.10.3510
Resolution 1024x768 @ 120.38Hz
Method Swap
Timer 2.278 GHz

Bandwidth
Error no pixel format

Tiling
Error no pixel format

Fillrate
--32 bits---------------------------------------
Error no pixel format

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 135.395 MPix/s
Z 320.693 MPix/s
ColorAndZ 117.010 MPix/s
ZTest 131.357 MPix/s
ZCullLEqual 142.937 MPix/s
ZCullGEqual 144.186 MPix/s
ZCullEqual 146.860 MPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 196.277 MPix/s
2 196.414 MPix/s
3 126.487 MPix/s
4 99.802 MPix/s

----Unfiltered----------------------------------
1 196.103 MPix/s
2 195.683 MPix/s
3 39.132 MPix/s
4 29.194 MPix/s

----Bilinear filter-----------------------------
1 193.693 MPix/s
2 140.132 MPix/s
3 24.541 MPix/s
4 16.734 MPix/s

----Trilinear filter----------------------------
1 190.555 MPix/s
2 16.675 MPix/s
3 4.052 MPix/s
4 2.955 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 11.175 MTris/s
List 3.701 MTris/s
Clip 884.240 kTris/s

--Vertex shading speed--------------------------
LightD1 24.675 MVerts/s
LightP1 24.449 MVerts/s
LightP8 23.736 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 8
Combiner 14
Interpolator 15



besser so? :)

StefanV
2003-07-11, 15:04:11
Original geschrieben von Mogadischu

ArchMark 0.10.09alpha
Driver: Intel Brookdale-G v1.3.0 - Build 4.13.10.3510
1024x768 @ ???Hz (assuming 85Hz)
Swapping buffers
2.278 GHz timer speed (should match your CPU clock)


Ersetz mal den Codeinhalt durch das, was in der Results.bb.txt steht...

Aqualon
2003-07-11, 16:32:27
Original geschrieben von Stefan Payne
Schau mal im MGA Panel ob der 32bit Z-Buffer an ist...

War aus, das hat immerhin das 32bit Problem gelöst, aber der Precision Test stürzt immer noch ab :(

Swap:

ArchMark 0.10.09alpha
Driver Matrox G400 v1.1.3 Feb 12 2002
Resolution 1024x768 @ ???Hz
Method Swap
Timer 864.462 MHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 994.009 MB/s
Color 1.282 GB/s
ZAndStencil 551.091 MB/s
Z 953.202 MB/s
Stencil 286.361 MB/s

Draw 1.505 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 1.772 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 64
Height 32

----in color buffer-----------------------------
Width 16
Height 4

----in depth buffer-----------------------------
Width 4
Height none

----in stencil buffer---------------------------
Width 16
Height none



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 190.613 MPix/s
Z 181.597 MPix/s
ColorAndZ 206.813 MPix/s
ZTest 112.725 MPix/s
ZCullLEqual 132.414 MPix/s
ZCullGEqual 152.697 MPix/s
ZCullEqual 169.694 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z15 S1
Color 203.603 MPix/s
Z 181.669 MPix/s
ColorAndZ 192.153 MPix/s
ZTest 196.545 MPix/s
ZCullLEqual 187.343 MPix/s
ZCullGEqual 190.990 MPix/s
ZCullEqual 191.689 MPix/s


Texturing
Mode RGBA5650 Z15 S1
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 193.033 MPix/s
2 115.760 MPix/s

----Unfiltered----------------------------------
1 204.774 MPix/s
2 127.488 MPix/s

----Bilinear filter-----------------------------
1 208.390 MPix/s
2 127.494 MPix/s

----Trilinear filter----------------------------
1 122.724 MPix/s
2 69.665 MPix/s



Geometry
Mode RGBA5650 Z15 S1
--Plain vertices--------------------------------
Fan 5.069 MTris/s
List 2.731 MTris/s
Clip 407.939 kTris/s

--Vertex shading speed--------------------------
LightD1 2.628 MVerts/s
LightP1 3.364 MVerts/s
LightP8 3.276 MVerts/s


Precision



Flush:

ArchMark 0.10.09alpha
Driver Matrox G400 v1.1.3 Feb 12 2002
Resolution 1024x768 @ ???Hz
Method Flush
Timer 864.460 MHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 1.185 GB/s
Color 1.827 GB/s
ZAndStencil 952.585 MB/s
Z 1.427 GB/s
Stencil 476.465 MB/s

Draw 1.728 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 1.995 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 64
Height 64

----in color buffer-----------------------------
Width 64
Height 64

----in depth buffer-----------------------------
Width 4
Height 64

----in stencil buffer---------------------------
Width 4
Height none



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 234.453 MPix/s
Z 231.791 MPix/s
ColorAndZ 242.223 MPix/s
ZTest 141.842 MPix/s
ZCullLEqual 179.673 MPix/s
ZCullGEqual 162.677 MPix/s
ZCullEqual 192.828 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z15 S1
Color 255.934 MPix/s
Z 255.919 MPix/s
ColorAndZ 255.476 MPix/s
ZTest 249.940 MPix/s
ZCullLEqual 235.014 MPix/s
ZCullGEqual 234.272 MPix/s
ZCullEqual 252.345 MPix/s


Texturing
Mode RGBA5650 Z15 S1
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 254.139 MPix/s
2 127.420 MPix/s

----Unfiltered----------------------------------
1 254.492 MPix/s
2 124.772 MPix/s

----Bilinear filter-----------------------------
1 254.096 MPix/s
2 123.484 MPix/s

----Trilinear filter----------------------------
1 138.994 MPix/s
2 69.711 MPix/s



Geometry
Mode RGBA5650 Z15 S1
--Plain vertices--------------------------------
Fan 3.010 MTris/s
List 1.631 MTris/s
Clip 342.793 kTris/s

--Vertex shading speed--------------------------
LightD1 3.348 MVerts/s
LightP1 3.555 MVerts/s
LightP8 3.693 MVerts/s


Precision



Aqua

Aqualon
2003-07-11, 22:07:48
Also den SIS630 Onboard-Grafikchip in meinem Laptop mag der Archmark anscheinend überhaupt nicht *g*

Bei allen Messungen gibt es Error-Meldungen und der Softwarefallback bringt nur das System zum rattern, aber der Archmark bringt kein Ergebnis sondern bleibt mitten drin hängen.

Ich glaub die 3D-Funktionen von dem Teil sind eher fürn Gullie *g*

Aqua

Kennung Eins
2003-07-25, 22:28:58
Lange nicht mehr hier drin gewesen, und gleich gibts mal nen öffentlichen Link, cool.
Wollte nur mal sagen "gefällt mir, das Programm!" :)

Wie sicher oder unsicher ist das gegen irgendwelche versteckten Optimierungen? Also: können die erreichten Werte künstlich per Cheat erschummelt werden?

Um mal nicht nur zu Spammen, vielleicht nützts ja was (vermutlich wohl aber nicht :) ):

(Deto 43.51, GF4MX, kein AA, PIII 800)
ArchMark 0.10.09alpha
Driver GeForce4 MX 440/AGP/SSE v1.4.0
Resolution 1024x768 @ 50.52Hz
Method Swap
Timer 797.962 MHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 2.653 GB/s
Color 2.545 GB/s
ZAndStencil 2.220 GB/s
Z 5.346 GB/s
Stencil 1.474 MB/s

Draw 3.777 GB/s
BurnedByRAMDAC 158.762 MB/s
Physical 3.936 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height 2

----in color buffer-----------------------------
Width 4
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 64



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 336.921 MPix/s
Z 574.789 MPix/s
ColorAndZ 325.507 MPix/s
ZTest 361.365 MPix/s
ZCullLEqual 936.924 MPix/s
ZCullGEqual 928.078 MPix/s
ZCullEqual 1.882 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 469.412 MPix/s
Z 469.813 MPix/s
ColorAndZ 469.132 MPix/s
ZTest 469.732 MPix/s
ZCullLEqual 1.080 GPix/s
ZCullGEqual 1.077 GPix/s
ZCullEqual 1.914 GPix/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 468.578 MPix/s
2 467.398 MPix/s

----Unfiltered----------------------------------
1 468.989 MPix/s
2 455.542 MPix/s

----Bilinear filter-----------------------------
1 469.053 MPix/s
2 422.280 MPix/s

----Trilinear filter----------------------------
1 468.579 MPix/s
2 223.528 MPix/s



Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 33.720 MTris/s
List 11.385 MTris/s
Clip 10.962 MTris/s

--Vertex shading speed--------------------------
LightD1 16.223 MVerts/s
LightP1 12.263 MVerts/s
LightP8 4.030 MVerts/s


Precision
Mode RGBA8888 Z0 S0
--fraction bits---------------------------------
AlphaTest 10
Combiner 12
Interpolator 11

Kennung Eins
2003-07-25, 22:34:22
.

(war blödsinn)

Quasar
2003-07-26, 10:31:05
von Zecki:
Edit:
Clipping (genauso wie Backface culling) passiert nach der T&L-Stufe und passiert bei allen Karten mit mindestens Fixed Function HW-T&L auf dem Grafikchip. Warum das bei NV so schnell ist wurde ja bereits gesagt: infinite guardband.
ATI krebst hier noch mit der Clipping-Einheit des R100 herum (die Performance pro Takt ist absolut gleich).

Unter D3D beherrscht der R300 laut DXCaps ein limited Guardband von -960 bis +2880, was für den Clipping-Test vom Koordinatenraum her perfekt geeignet wäre. Wenn das so stimmt, dann dürfte die Performance in diesem Test nicht mehr einbrechen (gleiche Leistung wie bei 'List', eben so wie auf NV-Hardware). Wie man in den Genuß kommt, dieses auch zu nutzen, weiß ich leider nicht.

Schau mal =)
ArchMark 0.10.09alpha
Driver RADEON 9600 x86/SSE2 v1.3.3842 WinXP Release
Resolution 1024x768 @ ???Hz
Method Swap
Timer 3.000 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 10.143 GB/s
Color 5.246 GB/s
ZAndStencil 86.982 GB/s
Z 65.565 GB/s
Stencil 1.463 GB/s

Draw 10.998 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 11.265 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height 4

----in color buffer-----------------------------
Width 4
Height 4

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 1.312 GPix/s
Z 1.522 GPix/s
ColorAndZ 1.312 GPix/s
ZTest 1.043 GPix/s
ZCullLEqual 1.449 GPix/s
ZCullGEqual 1.448 GPix/s
ZCullEqual 1.522 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 282.362 kPix/s
Z 1.476 GPix/s
ColorAndZ 1.522 GPix/s
ZTest 1.227 GPix/s
ZCullLEqual 1.507 GPix/s
ZCullGEqual 1.506 GPix/s
ZCullEqual 1.522 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 1.520 GPix/s
2 776.593 MPix/s
3 529.008 MPix/s
4 397.147 MPix/s
5 318.029 MPix/s
6 265.270 MPix/s
7 227.595 MPix/s
8 199.349 MPix/s

----Unfiltered----------------------------------
1 1.521 GPix/s
2 776.817 MPix/s
3 529.136 MPix/s
4 397.240 MPix/s
5 318.109 MPix/s
6 265.348 MPix/s
7 227.667 MPix/s
8 199.398 MPix/s

----Bilinear filter-----------------------------
1 1.521 GPix/s
2 776.800 MPix/s
3 529.151 MPix/s
4 397.232 MPix/s
5 318.110 MPix/s
6 265.348 MPix/s
7 227.664 MPix/s
8 199.399 MPix/s

----Trilinear filter----------------------------
1 951.241 MPix/s
2 482.405 MPix/s
3 323.493 MPix/s
4 243.517 MPix/s
5 195.357 MPix/s
6 163.213 MPix/s
7 139.683 MPix/s
8 122.545 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 144.903 MTris/s
List 49.836 MTris/s
Clip 9.819 MTris/s

--Vertex shading speed--------------------------
LightD1 59.504 MVerts/s
LightP1 24.923 MVerts/s
LightP8 9.126 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
AlphaTest 9.400
Combiner 24
Interpolator 21



edit:
Ist die Fireblade-Edition @400/330MHz

ATI-Andi
2003-07-26, 19:20:12
Werte für unten genanntes System R300 9500Pro:

ArchMark 0.10.09alpha
Driver: RADEON 9500 Pro x86/SSE2 v1.3.3842 WinXP Release
1024x768 @ ???Hz (assuming 85Hz)
Swapping buffers
2.663 GHz timer speed (should match your CPU clock)
Bandwidth
Mode: RGBA8888 Z24 S8

bandwidth
available to buffer clears
13.531 GB/s all buffers
7.300 GB/s color only
62.867 GB/s depth and stencil
45.942 GB/s depth only
1.514 GB/s stencil only
9.913 GB/s worst case draw bandwidth
267.387 MB/s burned by the RAMDAC
10.181 GB/s estimated physical bandwidth
Tiling
Mode: RGBA8888 Z24 S8

preferred block alignment
updating all buffers
4 pixels wide
16 pixels high
in color buffer
4 pixels wide
16 pixels high
in depth buffer
2 pixels wide
2 pixels high
in stencil buffer
2 pixels wide
2 pixels high
Fillrate

32 bits
Mode: RGBA8888 Z24 S8
2.049 GPix/s color only
2.461 GPix/s depth only
2.058 GPix/s color and depth
1.006 GPix/s color and depth with depth test
3.359 GPix/s discardable by 'LEQUAL' depth test
1.751 GPix/s discardable by 'GEQUAL' depth test
2.269 GPix/s discardable by 'EQUAL' depth test
16 bits
Mode: RGBA5650 Z24 S8
306.540 kPix/s color only
2.304 GPix/s depth only
2.288 GPix/s color and depth
1.203 GPix/s color and depth with depth test
3.918 GPix/s discardable by 'LEQUAL' depth test
1.836 GPix/s discardable by 'GEQUAL' depth test
2.183 GPix/s discardable by 'EQUAL' depth test
Texturing
Mode: RGBA5650 Z24 S8

Textured fillrate
Peak
2.151 GPix/s w 1 layers
1.060 GPix/s w 2 layers
862.144 MPix/s w 3 layers
653.058 MPix/s w 4 layers
518.751 MPix/s w 5 layers
436.488 MPix/s w 6 layers
361.876 MPix/s w 7 layers
313.044 MPix/s w 8 layers
Unfiltered
2.151 GPix/s w 1 layers
1.073 GPix/s w 2 layers
864.596 MPix/s w 3 layers
656.048 MPix/s w 4 layers
520.922 MPix/s w 5 layers
438.139 MPix/s w 6 layers
361.126 MPix/s w 7 layers
304.273 MPix/s w 8 layers
Bilinear filter
2.110 GPix/s w 1 layers
1.040 GPix/s w 2 layers
860.758 MPix/s w 3 layers
623.921 MPix/s w 4 layers
514.460 MPix/s w 5 layers
435.068 MPix/s w 6 layers
359.532 MPix/s w 7 layers
311.738 MPix/s w 8 layers
Trilinear filter
1.102 GPix/s w 1 layers
580.337 MPix/s w 2 layers
429.734 MPix/s w 3 layers
326.127 MPix/s w 4 layers
261.709 MPix/s w 5 layers
218.514 MPix/s w 6 layers
184.371 MPix/s w 7 layers
158.402 MPix/s w 8 layers
Geometry
Mode: RGBA5650 Z24 S8

Plain vertices
120.694 MTris/s as triangle fan
42.031 MTris/s as triangle list
8.005 MTris/s clipped
Vertex shading speed
95.823 MVerts/s lit (one directional light)
40.308 MVerts/s lit (one point light)
15.001 MVerts/s lit (eight point lights)
Precision
Mode: RGBA8888 Z24 S8

fraction bits
9.400 in alpha test
24 in combiners
21 in color interpolator

apollo
2003-07-28, 09:04:06
ich muss zu meiner Schande gestehen, dass ich nicht den ganzen Thread gelesen hab.

Aber:
bei Bedarf kann ich hier @work nen SiS onboard karte testen und @home ne R9000pro. :)

Firepower
2003-07-28, 10:06:58
Hab aus Langeweile mal nen Test mit meinem Büro-PC gemacht :)

ArchMark 0.10.09alpha
Driver: RIVA TNT2/PCI/SSE2 v1.2.1
Resolution: 1024x768 @ 84.35Hz
Swapping buffers
1.599 GHz timer speed (should match your CPU clock)
Bandwidth
Mode: RGBA8888 Z24 S8

* bandwidth
o available to buffer clears
+ 369.284 MB/s all buffers
+ 243.927 MB/s color only
+ 243.633 MB/s depth and stencil
+ 182.709 MB/s depth only
+ 60.878 MB/s stencil only
o 483.373 MB/s worst case draw bandwidth
o 266.677 MB/s burned by the RAMDAC
o 750.050 MB/s estimated physical bandwidth

Tiling
Mode: RGBA8888 Z24 S8

* preferred block alignment
o updating all buffers
+ 4 pixels wide
+ none detected in y-direction
o in color buffer
+ 4 pixels wide
+ none detected in y-direction
o in depth buffer
+ 4 pixels wide
+ none detected in y-direction
o in stencil buffer
+ 4 pixels wide
+ none detected in y-direction

Fillrate

* 32 bits
o Mode: RGBA8888 Z24 S8
o 60.273 MPix/s color only
o 44.945 MPix/s depth only
o 60.279 MPix/s color and depth
o 35.977 MPix/s color and depth with depth test
o 45.938 MPix/s discardable by 'LEQUAL' depth test
o 45.272 MPix/s discardable by 'GEQUAL' depth test
o 50.623 MPix/s discardable by 'EQUAL' depth test
* 16 bits
o Mode: RGBA5650 Z16 S0
o 114.503 MPix/s color only
o 103.475 MPix/s depth only
o 114.654 MPix/s color and depth
o 82.533 MPix/s color and depth with depth test
o 102.256 MPix/s discardable by 'LEQUAL' depth test
o 101.636 MPix/s discardable by 'GEQUAL' depth test
o 111.213 MPix/s discardable by 'EQUAL' depth test

Texturing
Mode: RGBA5650 Z16 S0

* Textured fillrate
o Peak
+ 113.365 MPix/s w 1 layers
+ 78.581 MPix/s w 2 layers
o Unfiltered
+ 114.418 MPix/s w 1 layers
+ 78.586 MPix/s w 2 layers
o Bilinear filter
+ 114.568 MPix/s w 1 layers
+ 78.578 MPix/s w 2 layers
o Trilinear filter
+ 78.567 MPix/s w 1 layers
+ 78.590 MPix/s w 2 layers

Geometry
Mode: RGBA5650 Z16 S0

* Plain vertices
o 1.933 MTris/s as triangle fan
o 676.498 kTris/s as triangle list
o 780.052 kTris/s clipped
* Vertex shading speed
o 1.861 MVerts/s lit (one directional light)
o 5.315 MVerts/s lit (one point light)
o 5.292 MVerts/s lit (eight point lights)

Precision
Mode: RGBA8888 Z24 S0

* fraction bits
o 9 in alpha test
o 2 in combiners
o 2 in color interpolator

DocEW
2003-07-28, 10:14:40
Bei mir lööpt's nich! :(

Hab's auch auf'm Bürorechner getestet:

Pentium 4 auf Intel 845G Chipsatz mit 1024 MB RAM.

DocEW
2003-07-28, 10:24:06
Ok, mit Software Fallback gibt's immerhin ein paar Teilergebnisse:


ArchMark 0.10.09alpha
Driver: GL initialization failed ...
1024x768 @ ???Hz (assuming 85Hz)
Swapping buffers
2.392 GHz timer speed (should match your CPU clock)
Bandwidth
Error: no pixel format
Tiling
Error: no pixel format
Fillrate

32 bits
Error: no pixel format
16 bits
Mode: RGBA8880 Z16 S8
19.838 MPix/s color only
11.696 MPix/s depth only
19.111 MPix/s color and depth
16.595 MPix/s color and depth with depth test
21.619 MPix/s discardable by 'LEQUAL' depth test
21.060 MPix/s discardable by 'GEQUAL' depth test
24.437 MPix/s discardable by 'EQUAL' depth test
Texturing
Mode: RGBA8880 Z16 S8

Textured fillrate
Peak
18.697 MPix/s w 1 layers
Unfiltered
19.162 MPix/s w 1 layers
Bilinear filter
19.031 MPix/s w 1 layers
Trilinear filter
19.182 MPix/s w 1 layers
Geometry
Mode: RGBA8880 Z16 S8

Plain vertices
7.039 MTris/s as triangle fan
3.687 MTris/s as triangle list
1.404 MTris/s clipped
Vertex shading speed
9.017 MVerts/s lit (one directional light)
3.060 MVerts/s lit (one point light)
588.345 kVerts/s lit (eight point lights)
Precision
Error: no pixel format

TheRealTentacle
2003-07-28, 14:02:34
Eine Radeon 8500 LE@ 295/280: (NoAA/AF)

Swap

ArchMark 0.10.09alpha
Driver Radeon 8500 DDR x86/MMX/3DNow!/SSE v1.3.3717 WinXP Release
Resolution 1024x768 @ ???Hz
Method Swap
Timer 1.610 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 8.173 GB/s
Color 4.133 GB/s
ZAndStencil 39.077 GB/s
Z 28.195 GB/s
Stencil 1.087 GB/s

Draw 7.849 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 8.117 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 8
Height 2

----in color buffer-----------------------------
Width 64
Height 2

----in depth buffer-----------------------------
Width 16
Height 4

----in stencil buffer---------------------------
Width 16
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 1.073 GPix/s
Z 1.043 GPix/s
ColorAndZ 1.056 GPix/s
ZTest 775.926 MPix/s
ZCullLEqual 2.234 GPix/s
ZCullGEqual 1.995 GPix/s
ZCullEqual 979.261 MPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 833.641 MPix/s
Z 1.015 GPix/s
ColorAndZ 1.003 GPix/s
ZTest 1.001 GPix/s
ZCullLEqual 2.936 GPix/s
ZCullGEqual 2.986 GPix/s
ZCullEqual 1.075 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 948.817 MPix/s
2 1.077 GPix/s
3 560.821 MPix/s
4 559.136 MPix/s
5 385.211 MPix/s
6 385.808 MPix/s

----Unfiltered----------------------------------
1 924.705 MPix/s
2 1.049 GPix/s
3 540.294 MPix/s
4 526.408 MPix/s
5 383.464 MPix/s
6 387.731 MPix/s

----Bilinear filter-----------------------------
1 1.068 GPix/s
2 1.079 GPix/s
3 543.735 MPix/s
4 484.327 MPix/s
5 386.071 MPix/s
6 386.380 MPix/s

----Trilinear filter----------------------------
1 560.722 MPix/s
2 559.736 MPix/s
3 294.424 MPix/s
4 276.623 MPix/s
5 199.688 MPix/s
6 198.432 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 56.400 MTris/s
List 17.676 MTris/s
Clip 2.416 MTris/s

--Vertex shading speed--------------------------
LightD1 36.433 MVerts/s
LightP1 12.470 MVerts/s
LightP8 8.131 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------



Flush

ArchMark 0.10.09alpha
Driver Radeon 8500 DDR x86/MMX/3DNow!/SSE v1.3.3717 WinXP Release
Resolution 1024x768 @ ???Hz
Method Flush
Timer 1.610 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 8.711 GB/s
Color 4.696 GB/s
ZAndStencil 57.537 GB/s
Z 43.062 GB/s
Stencil 1.152 GB/s

Draw 8.216 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 8.483 GB/s


Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 8
Height 2

----in color buffer-----------------------------
Width 8
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2



Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 1.159 GPix/s
Z 1.169 GPix/s
ColorAndZ 1.163 GPix/s
ZTest 834.119 MPix/s
ZCullLEqual 2.858 GPix/s
ZCullGEqual 2.827 GPix/s
ZCullEqual 1.162 GPix/s

--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Color 1.087 GPix/s
Z 1.164 GPix/s
ColorAndZ 1.163 GPix/s
ZTest 1.103 GPix/s
ZCullLEqual 3.406 GPix/s
ZCullGEqual 3.595 GPix/s
ZCullEqual 1.156 GPix/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Peak----------------------------------------
1 1.167 GPix/s
2 1.168 GPix/s
3 585.723 MPix/s
4 585.663 MPix/s
5 390.876 MPix/s
6 390.849 MPix/s

----Unfiltered----------------------------------
1 1.168 GPix/s
2 1.168 GPix/s
3 566.129 MPix/s
4 557.788 MPix/s
5 390.852 MPix/s
6 390.826 MPix/s

----Bilinear filter-----------------------------
1 1.167 GPix/s
2 1.168 GPix/s
3 583.866 MPix/s
4 582.806 MPix/s
5 390.334 MPix/s
6 390.808 MPix/s

----Trilinear filter----------------------------
1 594.797 MPix/s
2 594.752 MPix/s
3 297.861 MPix/s
4 297.845 MPix/s
5 198.628 MPix/s
6 198.670 MPix/s



Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 56.417 MTris/s
List 17.538 MTris/s
Clip 2.416 MTris/s

--Vertex shading speed--------------------------
LightD1 36.297 MVerts/s
LightP1 12.473 MVerts/s
LightP8 8.131 MVerts/s


Precision
Mode RGBA8888 Z24 S8
--fraction bits---------------------------------
AlphaTest 8
Combiner 18
Interpolator 18



TribbleBuffering fisst bei mir 1,6GB/s Bandrbreite, es war wegen dem RTool aktiv. (dieser Test wurde ohne TB gemacht)

Die versprochenen 2,4 GTexel scheint die Karte wirklich nicht zu erreichen (selbst übertaktet nur knapp 2,19 Swap / 2,35 Flush)
------
Ein sehr gutes Programm :)

Demirug
2003-08-08, 18:36:23
Thread ausgraben.

@ZBag: wahrscheinlich steht es schon irgendwo aber bei so vielen Seiten finde ich es nicht so schnell.

Wie wird die Bandbreite den genau berechnet? Es geht darum welche Einheiten beteiligt sind und möglicherweise vor dem Memory Controller am Ende sein könnten.

zeckensack
2003-08-08, 18:46:27
Original geschrieben von Demirug
Thread ausgraben.

@ZBag: wahrscheinlich steht es schon irgendwo aber bei so vielen Seiten finde ich es nicht so schnell.

Wie wird die Bandbreite den genau berechnet? Es geht darum welche Einheiten beteiligt sind und möglicherweise vor dem Memory Controller am Ende sein könnten. Nein, steht AFAIR noch nicht hier :)

Erstmal das einfache:
Die RAMDAC-Bandbreite wird ausgerechnet. Das Refresh-Intervall wird gemessen, wenn die Messung nicht funktioniert (VSync auf 'always off'), werden 85Hz angenommen.

Die andere Komponente ist das, was AM als 'worst case draw bandwidth' ausgibt. Das sind RMW-Operationen auf alle verfügbaren Buffer (Farbe, Z, Stencil). Also Blending, B2F-Rendering mit aktivem Z-Test, und eine Stencil-Op, die ein paar Bits umkippt.

Dabei werden die benutzten Komponenten-Auflösungen vom GL-Treiber abgefragt, aufaddiert, das ganze mit der Auflösung und den gemessenen fps multipliziert, und dann durch acht geteilt (Bits/s=>Bytes/s). In dieser Reihenfolge :)

Die 'physical bandwidth', die übrigens mit Absicht (leider in der HTML-Ansicht) mit "estimated" deklariert wird, ist die Summe aus 'worst case draw' und 'burnt by RAMDAC'.

Demirug
2003-08-08, 19:00:01
Also für 32RGBA+24Z+8S wären das pro Pixel dann 16 Byte oder?.

Bei 4 Pixel pro Takt komme ich auf 64 Byte bzw 512 Bit.

Wenn ja dann hat dein Programm hat ein Problem mit dem NV35.

zeckensack
2003-08-08, 19:04:54
Original geschrieben von Demirug
Also für 32RGBA+24Z+8S wären das pro Pixel dann 16 Byte oder?.Ja.
Die tatsächlich benutzten Bits werden btw in 'mode' mitprotokolliert.
Bei 4 Pixel pro Takt komme ich auf 64 Byte bzw 512 Bit.

Wenn ja dann hat dein Programm hat ein Problem mit dem NV35. Was kommt denn dabei heraus?

Demirug
2003-08-08, 19:12:53
Original geschrieben von zeckensack
Was kommt denn dabei heraus?

Wohl zu wenig. Dein Worst Case Fall erzeugt maximal 512 Bit pro Takt diese werden dann noch komprimiert. Das 256 Bit Bus interface schaufelt 512 Bit pro Takt über den Bus. Der Speicher läuft einem höhren Takt als der Core. Der Rest ist Logic.

zeckensack
2003-08-08, 19:22:17
Original geschrieben von Demirug
Wohl zu wenig. Dein Worst Case Fall erzeugt maximal 512 Bit pro Takt diese werden dann noch komprimiert. Das 256 Bit Bus interface schaufelt 512 Bit pro Takt über den Bus. Der Speicher läuft einem höhren Takt als der Core. Der Rest ist Logic. Dann halten wir doch einfach fest, daß der NV35 viel zu wenig Füllrate hat, um sein Speicherinterface auszureizen. Ich wüßte nicht, wie ich unter kontrollierbaren Bedingungen eine höhere Bandbreitenlast erzeugen kann. Ich könnte noch Texturen einlesen, aber dabei gibt es zuviele Variablen, um eine halbwegs aussagekräftige Rechnung zu machen.

Ist denn bei deaktiviertem AA die Kompression überhaupt aktiv?

Demirug
2003-08-08, 19:51:48
Original geschrieben von zeckensack
Dann halten wir doch einfach fest, daß der NV35 viel zu wenig Füllrate hat, um sein Speicherinterface auszureizen. Ich wüßte nicht, wie ich unter kontrollierbaren Bedingungen eine höhere Bandbreitenlast erzeugen kann. Ich könnte noch Texturen einlesen, aber dabei gibt es zuviele Variablen, um eine halbwegs aussagekräftige Rechnung zu machen.

Ist denn bei deaktiviertem AA die Kompression überhaupt aktiv?

Ja für den Z-Buffer.

Das mit der Texture ist gar keine so schlechte Idee. wenn man diese mindestens so gross wie die Bildschirmauflösung ist und man direktes Texel zu Pixel mapping (Pointsampling) betreibt muss die Texture mindestens einmal komplett eingelesen werden. Mit 2 Texturen wäre es aber auch ganz nett.

Razor
2003-08-09, 09:10:01
Habe den Archmark mal mit ein paar Durchläufen gefüttert...
FX5900 128MB - Deto 45.23
Standard (erster Durchlauf)
ArchMark 0.10.09alpha
Driver GeForce FX 5900/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ ?Hz
Method Flush
Timer 2.172 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 33.124 GB/s
Color 25.433 GB/s
ZAndStencil 44.575 GB/s
Z 21.928 GB/s <--- zu wenig
Stencil 8.883 GB/s <--- zu wenig

Draw 24.162 GB/s <--- zu wenig
BurnedByRAMDAC 267.387 MB/s
Physical 24.430 GB/s <--- zu wenig
Standard (zweiter Druchlauf)
ArchMark 0.10.09alpha
Driver GeForce FX 5900/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ Hz
Method Flush
Timer 2.172 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 33.103 GB/s
Color 25.433 GB/s
ZAndStencil 44.572 GB/s
Z 28.070 GB/s <--- jetzt OK
Stencil 12.481 GB/s <--- jetzt OK

Draw 24.158 GB/s <--- zu wenig
BurnedByRAMDAC 267.387 MB/s
Physical 24.426 GB/s <--- zu wenig
@ 450/425
ArchMark 0.10.09alpha
Driver GeForce FX 5900/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ ?Hz
Method Flush
Timer 2.172 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 33.226 GB/s
Color 25.441 GB/s
ZAndStencil 45.454 GB/s
Z 33.927 GB/s
Stencil 16.144 GB/s

Draw 25.388 GB/s <--- mehr, aber immer noch zu wenig
BurnedByRAMDAC 267.387 MB/s
Physical 25.655 GB/s <--- mehr, aber immer noch zu wenig
@ 400/475
ArchMark 0.10.09alpha
Driver GeForce FX 5900/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ ?Hz
Method Flush
Timer 2.172 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 36.941 GB/s
Color 28.452 GB/s
ZAndStencil 48.984 GB/s
Z 36.577 GB/s
Stencil 18.051 GB/s

Draw 25.026 GB/s <--- mehr, aber immer noch zu wenig
BurnedByRAMDAC 267.387 MB/s
Physical 25.293 GB/s <--- mehr, aber immer noch zu wenig
@ 450/475
ArchMark 0.10.09alpha
Driver GeForce FX 5900/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ ?Hz
Method Flush
Timer 2.172 GHz

Bandwidth
Mode RGBA8888 Z24 S8
--bandwidth-------------------------------------
----available to buffer clears------------------
All 37.090 GB/s
Color 28.467 GB/s
ZAndStencil 49.977 GB/s
Z 37.326 GB/s
Stencil 18.061 GB/s

Draw 27.159 GB/s <--- OK für 256Bit mit 425MHz ?
BurnedByRAMDAC 267.387 MB/s
Physical 27.426 GB/s <--- OK für 256Bit mit 425MHz ?
Also irgendetwas stimmt da nicht... und damit meine ich nicht den ersten Durchlauf.
Erst wenn beides (GPU und RAM) übertaktet wird kommt man auf die eigentliche Bandbreite des (unübertakteten) 256Bit Speicherinterfaces. Füllrate allein kann hier nicht die Ursache sein...

Razor

zeckensack
2003-08-10, 13:59:56
Original geschrieben von Razor
Habe den Archmark mal mit ein paar Durchläufen gefüttert...
FX5900 128MB - Deto 45.23

Also irgendetwas stimmt da nicht... und damit meine ich nicht den ersten Durchlauf.
Erst wenn beides (GPU und RAM) übertaktet wird kommt man auf die eigentliche Bandbreite des (unübertakteten) 256Bit Speicherinterfaces. Füllrate allein kann hier nicht die Ursache sein...

Razor Razor, rein von der Füllrate her kann die FX maximal 64 Bytes/Takt verbrauchen (nach der Testmethodik von AM). Was du da mißt, liegt nur fünf Prozent unter dem theoretischen Wert (ausgehend von 400/425MHz Standardtakt; bitte korrigier mich, wenn das falsch ist).

Die Abweichung ist in jedem Fall da, und zugegeben auch viel stärker als zB auf R200, wo man ziemlich genau die theoretische Maximal-Bandbreite herausbekommt.

Vielleicht ist's irgendeine Synchronisierungs-Geschichte, vielleicht blockiert der RAMDAC mit seinen 'dazugemischten' Speicherzugriffen architekturbedingt stärker als auf anderen Chips, vielleicht sind die Speicherlatenzen sehr hoch (was die nutzbare Bandbreite absenken kann), etc.

Genau ergründen kann ich das nicht, aber ich möchte nochmal wiederholen: die Abweichung ist sehr gering.

Für Analyse-Zwecke ist das ganze nach wie vor geeignet, vA da man für analytische Arbeit neben den Meßwerten eben auch die Theorie (in Form von Taktraten und Busbreite) kennen sollte.

Ich käme aufgrund deiner Zahlen zB nicht in Versuchung, zu proklamieren daß der 256bit-Speicherbus eine Marketinglüge ist, eben wie AM mir gezeigt hat, daß das Pipeline-Wischi-Waschi von NV eine faule Ausrede war, um von der simplen Wahrheit "4x2 oder 8x0" abzulenken (andere mögen das auf anderen Wegen und/oder früher erkannt haben).
Gerade darum ging's mir beim AM: Wahrheit von Wischi-Waschi zu trennen. Fakten auf den Tisch zu bringen, anstatt sich an Marketing-Unsinn orientieren zu müssen.

Als "Angeber-Benchmark" ala Sisoft Sandra oder 3DMark01 war dieses Programm nie gedacht. Es ist wirklich nicht wichtig, die höchste Zahl zu erreichen. Von daher ist dein Einwand zwar korrekt, aber deine Beobachtung verfälscht IMO keineswegs die Verwertbarkeit.

Razor
2003-08-10, 20:53:48
Hi zeckensack,

ich wollte mit meinem Beitrag keinesfalls den Nutzen oder auch die Verwertbarkeit der Ergebnisse Deines ArchMarks in Frage stellen. Ganz im Gegenteil bin ich der Meinung, dass irgendetwas mit der FX5900 nicht stimmt. Du schreibst zwar, dass die Abweichung mit nur 5% recht nah an dem Sollwert ist, aber bei anderen Karten wird der Sollwert ja auch erreicht.

Insofern mein Beitrag nicht dazu dienen sollte, Dein Tool in Frage zu stellen, sondern vielmehr einen möglichen Hintergrund für die geringere Bandbreite bei definiertem Chip/Speichertakt zu erhalten.

So wunderte mich halt, dass die Bandbreite sowohl bei Steigerung des GPU- als auch des RAM-Taktes zunimmt, ich insofern vermutete (auch aufgrund der Anmerkung von Demirug im anderen Thread), dass zur vollen Nutzung der verfügbaren Bandbreite eine ebenfalls hoch getaktete GPU notwendig ist.

Wie dem auch sei, Dein Tool ist wohl das derzeit einzige, welches es ermöglicht, wenigstens nahe an die theoretischen Leitungsgrenzen heran zu kommen und diese auch zu dokumentieren. Etwaige Veränderungen in der Arbeitsweise der Treiber lassen sich damit unter Umständen auch dingfest machen.

Ergo: Ein hoch auf den ArchMark !
Und sorry, wenn mein Beitrag irgendwie falsch rüber gekommen ist...

Razor

zeckensack
2003-08-10, 21:13:07
Original geschrieben von Razor
Und sorry, wenn mein Beitrag irgendwie falsch rüber gekommen ist...

Razor Gleiches gebe ich zurück :)
Ich wollte eigentlich zum Ausdruck bringen, daß deine Beobachtung "nicht schlimm" ist. Was genau da los ist, wäre interessant zu wissen, und ich kann außer Spekulation derzeit nichts dazu anbieten.

Jetzt so im Nachhinein nochmal gelesen, klingt mein Posting tatsächlich nicht so, wie es hätte klingen sollen. Der "Stolz auf's Kind" hat mich womöglich wirklich übermannt :|

Nichts für ungut :)

StefanV
2003-08-21, 13:22:40
Ich grab den Thread schonmal aus, um gleich mal die Werte meiner Radeon 9600LE (325/200MHz, DDR-SDRAM, 64bit) zu posten...

ArchMark 0.10.09alpha
auf Zeckes Wunsch nicht gepostet =)

zeckensack
2003-08-21, 13:24:02
Stefan, kannst du noch ein paar Stunden warten? :naughty:

StefanV
2003-08-21, 13:28:31
Original geschrieben von zeckensack
Stefan, kannst du noch ein paar Stunden warten? :naughty:

Öhm, 'ein paar Stunden' wäre bei mir ab 2015, wenn ich mich bei der Arbeit beeile ;)

Oder du zauberst a bisserl und schaffst es vor 1600 fertig zu werden.

Solange werd ich die Ergebnisse wieder entfernen =)

zeckensack
2003-08-21, 13:57:49
Original geschrieben von Stefan Payne
Öhm, 'ein paar Stunden' wäre bei mir ab 2015, wenn ich mich bei der Arbeit beeile ;)

Oder du zauberst a bisserl und schaffst es vor 1600 fertig zu werden.*gnarf*
Du hast ja keine Vorstellung, wie lange es dauert bis man eine saubere Dokumentation zusammengeflickt hat.
Ich wollte in die Release version eine "example competitive analysis" 8500LE vs Geforce3Ti200 reinschrauben. Das wird dann wohl warten müssen ;)

Solange werd ich die Ergebnisse wieder entfernen =) Warense denn aufschlußreich? =)
(nein, ich habe sie nicht gesehen, du warst zu schnell)

StefanV
2003-08-21, 14:06:27
Original geschrieben von zeckensack
*gnarf*
Du hast ja keine Vorstellung, wie lange es dauert bis man eine saubere Dokumentation zusammengeflickt hat.
Ich wollte in die Release version eine "example competitive analysis" 8500LE vs Geforce3Ti200 reinschrauben. Das wird dann wohl warten müssen ;)

Warense denn aufschlußreich? =)
(nein, ich habe sie nicht gesehen, du warst zu schnell)

1. och, nicht wirklich, kann mir aber Vorstellen, daß das a bisserl dauert ;)
Naja, hätte es auch andersrum sagen können:
Bin von ~1615 bis ~2015 nicht da, da ich noch a bisserl arbeiten 'darf' ;)

Öhm, warum wird das warten müssen?? ;)
PS: läuft die viel rumgekommene ELSA Gladiac 721 denn noch??
PPS: sagte ich schon, daß die SQ meiner Club3D Radeon 9600LE besser ist?? *eg*

2. hm, keine Ahnung, hab sie mir nicht weiter angezeigt, nur scheint die Bandbreite, die Arschmark anzeigt ~500MB/sec zu hoch zu sein...

zeckensack
2003-08-21, 14:22:42
Original geschrieben von Stefan Payne
1. och, nicht wirklich, kann mir aber Vorstellen, daß das a bisserl dauert ;)
Naja, hätte es auch andersrum sagen können:
Bin von ~1615 bis ~2015 nicht da, da ich noch a bisserl arbeiten 'darf' ;)Ja. Du drängelst. Zu recht :D
Öhm, warum wird das warten müssen??
Weil ich dafür bis mindestens 17:00 brauche. Ich muß aber auch noch an der 'Usability' schrauben. Eins von beidem muß entfallen.
PS: läuft die viel rumgekommene ELSA Gladiac 721 denn noch??
PPS: sagte ich schon, daß die SQ meiner Club3D Radeon 9600LE besser ist?? *eg*Die ELSA läuft noch. Daß die SQ jeder beliebigen anderen Graka besser ist, glaube ich dir sofort und unbesehen.
2. hm, keine Ahnung, hab sie mir nicht weiter angezeigt, nur scheint die Bandbreite, die Arschmark anzeigt ~500MB/sec zu hoch zu sein... Tja, also meine ELSA hat auch 7,5GB/s ... obwohl sie eigentlich nur 6,4GB/s haben darf. Da steht nicht ganz ohne Absicht "estimated" daneben ;)

StefanV
2003-08-21, 14:43:54
Original geschrieben von zeckensack
Ja. Du drängelst. Zu recht :D

Dann gehts ja noch =)

Original geschrieben von zeckensack
Weil ich dafür bis mindestens 17:00 brauche. Ich muß aber auch noch an der 'Usability' schrauben. Eins von beidem muß entfallen.

Oh, das is schlecht ;)
Naja, du kannst auch bis 8 warten, dann bin ich hoffentlich wieder da...

Original geschrieben von zeckensack
Die ELSA läuft noch. Daß die SQ jeder beliebigen anderen Graka besser ist, glaube ich dir sofort und unbesehen.

Naja, da gibts schon schlechtere...
'ne original Powercolor Radeon 8500LE z.B. ;)
Naja, hab sie leider nicht direkt an dich verkauft, sonst hätte ich auch (gegen Aufpreis natürlich =)) den RF Filter entfernt...

Original geschrieben von zeckensack
Tja, also meine ELSA hat auch 7,5GB/s ... obwohl sie eigentlich nur 6,4GB/s haben darf. Da steht nicht ganz ohne Absicht "estimated" daneben ;)

Naja, dann steht dir noch a bisserl Arbeit bevor ;)

zeckensack
2003-08-21, 20:24:23
Release (http://www.forum-3dcenter.org/vbulletin/showthread.php?threadid=89433)

StefanV
2003-08-21, 20:40:37
ArchMark 0.22.05
Driver Radeon 7200 SDR x86/SSE2 v1.3.3803 WinXP Release
Resolution 1024x768 @ unknown refresh rate
Comment
Method Flush
Timer 1.800 GHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 287.764 MPix/s
Z 255.769 MPix/s
ColZ 196.949 MPix/s
ZPassColZ 265.449 MPix/s
ZCullLEqual 303.829 MPix/s
ZCullGEqual 303.646 MPix/s
ZCullEqual 303.817 MPix/s
S 268.852 MPix/s
SCull 268.819 MPix/s
----stencil test passed-------------------------
S 268.819 MPix/s
ZFailS 270.741 MPix/s
------z test passed (LEQUAL)--------------------
S 270.702 MPix/s
ZS 270.733 MPix/s
Col 265.468 MPix/s
ColZ 265.471 MPix/s
ColS 265.359 MPix/s
ColZS 265.360 MPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Col 305.544 MPix/s
Z 300.263 MPix/s
ColZ 289.055 MPix/s
ZPassColZ 296.684 MPix/s
ZCullLEqual 311.130 MPix/s
ZCullGEqual 298.380 MPix/s
ZCullEqual 309.951 MPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 4.094 GB/s
Color 2.100 GB/s
ZAndStencil 75.006 GB/s
Z 49.895 GB/s
Stencil 270.979 MB/s

Draw 3.097 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 3.364 GB/s

Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 13.716 MTris/s
List 4.891 MTris/s
Clip 1.262 MTris/s

--Vertex shading speed--------------------------
LightD1 3.884 MTris/s
LightP1 3.665 MTris/s
LightP8 3.642 MTris/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 307.832 MPix/s
2 316.636 MPix/s
3 299.166 MPix/s

----Trilinear filter----------------------------
1 308.053 MPix/s
2 160.237 MPix/s
3 158.435 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 1.024 kB
DXT1 16.384 kB
DXT5 4.096 kB

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 8
Height 8

----in color buffer-----------------------------
Width 8
Height 8

----in depth buffer-----------------------------
Width 8
Height 4

----in stencil buffer---------------------------
Width 8
Height 64




€dit:

Radeon Modell hervorgehoben ;)

BlackArchon
2003-08-21, 21:23:23
ArchMark 0.22.05
Driver RADEON 9800 Pro x86/MMX/3DNow!/SSE v1.3.3842 WinXP Release
Resolution 1024x768 @ 86.30Hz
Comment
Method Flush
Timer 1.995 GHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 1.971 GPix/s
Z 1.853 GPix/s
ColZ 1.393 GPix/s
ZPassColZ 1.914 GPix/s
ZCullLEqual 40.212 GPix/s
ZCullGEqual 2.957 GPix/s
ZCullEqual 2.942 GPix/s
S 2.585 GPix/s
SCull 2.526 GPix/s
----stencil test passed-------------------------
S 2.454 GPix/s
ZFailS 2.538 GPix/s
------z test passed (LEQUAL)--------------------
S 2.311 GPix/s
ZS 2.634 GPix/s
Col 2.572 GPix/s
ColZ 1.922 GPix/s
ColS 2.086 GPix/s
ColZS 2.059 GPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Col 2.575 GPix/s
Z 2.262 GPix/s
ColZ 2.270 GPix/s
ZPassColZ 2.238 GPix/s
ZCullLEqual 40.238 GPix/s
ZCullGEqual 2.966 GPix/s
ZCullEqual 2.965 GPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 20.209 GB/s
Color 9.937 GB/s
ZAndStencil 135.848 GB/s
Z 81.461 GB/s
Stencil 2.593 GB/s

Draw 22.725 GB/s
BurnedByRAMDAC 267.965 MB/s
Physical 22.993 GB/s

Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 152.860 MTris/s
List 50.101 MTris/s
Clip 5.146 MTris/s

--Vertex shading speed--------------------------
LightD1 31.800 MTris/s
LightP1 15.417 MTris/s
LightP8 5.700 MTris/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 2.915 GPix/s
2 1.487 GPix/s
3 996.118 MPix/s
4 748.685 MPix/s
5 581.789 MPix/s
6 499.994 MPix/s
7 426.080 MPix/s
8 370.763 MPix/s

----Trilinear filter----------------------------
1 1.476 GPix/s
2 743.838 MPix/s
3 496.973 MPix/s
4 371.961 MPix/s
5 298.648 MPix/s
6 248.363 MPix/s
7 213.472 MPix/s
8 185.935 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 8.192 kB
DXT1 8.192 kB
DXT5 16.384 kB

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height 4

----in color buffer-----------------------------
Width 4
Height 4

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2

StefanV
2003-08-21, 21:27:05
Original geschrieben von BlackArchon

ArchMark 0.22.05
Driver: RADEON 9800 Pro x86/MMX/3DNow!/SSE v1.3.3842 WinXP Release
Resolution: 1024x768 @ 86.30Hz
Comment:
Flushing commands, no buffer swaps
1.995 GHz timer speed (should match your CPU clock)
Fillrate

*snip


BlackArchonl, ersetz den Teil, den du gepostet hast, bitte durch den Inhalt der 'Results.bb.txt Datei.

BlackArchon
2003-08-21, 21:28:30
Done.

FX 5900 Ergebnisse erwünscht?

Quasar
2003-08-21, 21:41:33
zecki, was hast du nur angerichtet?

Keine Radeon erreicht mehr ihre anständige Single-Texturing Leistung (unter der letzten Beta noch problemlos ~2,6GPix/s auf der R9800p, und nu nicht mal 2,0GPix/s) und dazu noch diese garstigen Dinge, die sich Texturcache schimpfen und überhaupt: wieso ist die Bandbreite einer 256Bit-Radeon jetzt 4GB niedriger als die einer 128Bit GFFX?


Du hast ja eine Menge wohl geändert, oder?

zeckensack
2003-08-21, 21:46:40
Original geschrieben von Quasar
zecki, was hast du nur angerichtet?

Keine Radeon erreicht mehr ihre anständige Single-Texturing Leistung (unter der letzten Beta noch problemlos ~2,6GPix/s auf der R9800p, und nu nicht mal 2,0GPix/s) und dazu noch diese garstigen Dinge, die sich Texturcache schimpfen... Black Archon hat's doch hingekriegt???
Um das genauer zu erforschen, werde ich wohl mal einen Reboot machen müssen ?-)

Quasar
2003-08-21, 21:48:55
Original geschrieben von zeckensack
Black Archon hat's doch hingekriegt???
Um das genauer zu erforschen, werde ich wohl mal einen Reboot machen müssen ?-)

*urgs* 16Bit.... *spuckpfui*

Ich meinte natürlich die 32Bit-Füllrate. Unter 16Bit hätten's dann ja knapp an 3GPix sein dürfen.

BlackArchon
2003-08-21, 21:50:06
ArchMark 0.22.05
Driver GeForce FX 5900/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 85.25Hz
Comment
Method Flush
Timer 1.995 GHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 1.590 GPix/s
Z 3.166 GPix/s
ColZ 1.591 GPix/s
ZPassColZ 1.590 GPix/s
ZCullLEqual 6.024 GPix/s
ZCullGEqual 6.024 GPix/s
ZCullEqual 6.025 GPix/s
S 3.174 GPix/s
SCull 3.174 GPix/s
----stencil test passed-------------------------
S 3.174 GPix/s
ZFailS 2.865 GPix/s
------z test passed (LEQUAL)--------------------
S 2.866 GPix/s
ZS 2.866 GPix/s
Col 1.591 GPix/s
ColZ 1.591 GPix/s
ColS 1.588 GPix/s
ColZS 1.590 GPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Col 1.591 GPix/s
Z 3.145 GPix/s
ColZ 1.591 GPix/s
ZPassColZ 1.591 GPix/s
ZCullLEqual 6.100 GPix/s
ZCullGEqual 6.100 GPix/s
ZCullEqual 6.100 GPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 33.336 GB/s
Color 25.590 GB/s
ZAndStencil 44.824 GB/s
Z 33.537 GB/s
Stencil 16.311 GB/s

Draw 24.638 GB/s
BurnedByRAMDAC 267.595 MB/s
Physical 24.906 GB/s

Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 130.961 MTris/s
List 41.492 MTris/s
Clip 41.497 MTris/s

--Vertex shading speed--------------------------
LightD1 24.207 MTris/s
LightP1 12.651 MTris/s
LightP8 4.030 MTris/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 1.590 GPix/s
2 1.591 GPix/s
3 750.616 MPix/s
4 749.725 MPix/s

----Trilinear filter----------------------------
1 1.591 GPix/s
2 849.966 MPix/s
3 540.793 MPix/s
4 419.879 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 4.096 kB
DXT1 4.096 kB
DXT5 1.024 kB
Pal 1.024 kB

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height 8

----in color buffer-----------------------------
Width 4
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2

Quasar
2003-08-21, 21:57:50
Kann es sein, dass der Geometrie-Subtest trotz allem CPU-Abhängig ist?

Quasar
2003-08-22, 13:02:41
Also der Geo-Teil ist, m.E., CPU-beschränkt.

Auf meinem 1GHz-Celeron krieg ich folgendes:

Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 71.140 MTris/s
List 16.866 MTris/s
Clip 16.853 MTris/s

--Vertex shading speed--------------------------
LightD1 9.731 MTris/s
LightP1 9.734 MTris/s
LightP8 5.060 MTris/s

Auf dem P4-3,0C kommt folgendes heraus:

Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 148.523 MTris/s
List 45.425 MTris/s
Clip 45.438 MTris/s

--Vertex shading speed--------------------------
LightD1 25.115 MTris/s
LightP1 13.918 MTris/s
LightP8 4.544 MTris/s

Ok, aufm Celli ist's eine 5800u und auf dem P4 eine 5900u, aber rein Bandbreitenlimitiert ist der Geo-Test doch nicht, oder?

zeckensack
2003-08-22, 14:17:08
Quasar,
1. Der Geometrie-Test
hat sich nicht verändert. Ehrlich.
Es gibt aber Anzeichen dafür, daß neuere Detos "display lists" im AGP-Speicher ablegen, statt im Graka-RAM.
Das würde eine Abhängigkeit von System-Bandbreite erzeugen :(

2. Füllrate/R300
Alte Version:
ArchMark 0.10.09alpha
Driver RADEON 9500 Pro x86/MMX/3DNow!/SSE
<...>

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Color 1.862 GPix/s
Z 2.126 GPix/s
ColorAndZ 1.870 GPix/s
Das ist IMO überhaupt nicht möglich! Bei 8,64GB/s Bandbreite (9500Pro) darf ColorAndZ nicht über 1,2.. GP/s liegen.

Ich muß leider feststellen, daß alle alten Versionen hier Mist gebaut haben, aufgrund eines Verständnisfehlers meinerseits (http://www.opengl.org/discussion_boards/ubb/Forum3/HTML/010152.html) :(

Ich habe nochmal die halbe Nacht an meiner R300 herumgepopelt, und vermute mittlerweile auch nicht ganz koscheres Treiberverhalten. Jedenfalls ist es unmöglich, halbwegs vernünftige Zahlen zu erzeugen.
Erwarten würde ich zB, daß die reine Z-Füllrate auf den gleichen Wert (bandbreiten-)limitiert ist, wie die Farbfüllrate. Kriege ich aber nicht hin. Ich versuche momentan, ein paar Antworten von ATI zu bekommen, was denn da los ist.

zeckensack
2003-08-22, 14:21:47
Nochens Quasar,
"Fan-Dingens" überträgt ziemlich genau 12 Byte pro letztendlich angezeigtem Dreieck.
"As list" überträgt 36 Byte pro Dreieck, "clipped" dito.

Die Beleuchtungstests übertragen pro angezeigtem Dreieck 60 Byte.

Zumindest einige deiner Zahlen passen recht gut zu der erwarteten System-Bandbreite (die auf dem P4 noch von AGP8x weiter eingebremst wird).

Ich habe nicht die geringste Ahnung, was NV sich bei diesem Unsinn gedacht hat.

Quasar
2003-08-22, 15:35:28
Ich habe in der Zwischenzeit mal ein bißchen weitegemessen.

Den Speichertakt habe ich bei gleichbleibendem GPU-Takt bei der nV30 auf 200MHz und beim nV35 auf 125MHz abgesenkt: Ohne Effekt jeweils, von der lokalen Bandbreite hast du den Geo-Teil offenbar sehr gut entkoppelt. :up: :up:

Selbgies habe ich mit dem GPU-Takt getan, das Ergebnis ist etwas komplizierter:

Die Leistungsangleichung tritt bei jeweils unterschiedlichen Taktraten auf, abhängig von der Art der Dreiecksverarbeitung.
Fan: 200MHz GPU-Takt ~65MT
List: 150MHz GPU, ~15MT
Clip: 150MHz GPU, ~15MT

LightD1: 100MHz GPU, ~8MT
LightP1: 150MHz GPU, ~5MT
LightP8: 350MHz GPU, ~3,5MT


AGPx4 bringt gegenüber AGP8X ja "nur" doppelt soviel Bandbreite aber List, Clip und LightD1 sind mit AGP8X deutlich mehr als doppelt so hoch, wie mit AGPx4.
Wie passt das zusammen?

Wenn du magst, mail ich die die OO-Tabelle...

loewe
2003-08-24, 19:23:12
ArchMark 0.22.05
Driver PowerVR KYRO v1.2.1
Resolution 1024x768 @ 62.18Hz
Comment
Method Flush
Timer 867.966 MHz

Tiling
Mode RGBA8888 Z32 S4
--preferred block alignment---------------------
----updating all buffers------------------------
Width 64
Height 64

----in color buffer-----------------------------
Width 64
Height 64

----in depth buffer-----------------------------
Width 64
Height 64

----in stencil buffer---------------------------
Width 64
Height 64




Das ist nun noch einmal eine gute alte KYRO I, auch wenn sie nicht wirklich interessiert! :))

Das Tilling ist aber nach wie vor nicht so die Lösung, du gehst auf das Verfahren aber auch nicht weiter ein.
Mag sein das du Software Tilling richtig erkennst, aber beim bisher einzigen echten Tiller versagt das Verfahren.

zeckensack
2003-08-24, 19:44:58
Original geschrieben von loewe
ArchMark 0.22.05
Driver PowerVR KYRO v1.2.1
Resolution 1024x768 @ 62.18Hz
Comment
Method Flush
Timer 867.966 MHz

Tiling
Mode RGBA8888 Z32 S4
--preferred block alignment---------------------
----updating all buffers------------------------
Width 64
Height 64

----in color buffer-----------------------------
Width 64
Height 64

----in depth buffer-----------------------------
Width 64
Height 64

----in stencil buffer---------------------------
Width 64
Height 64




Das ist nun noch einmal eine gute alte KYRO I, auch wenn sie nicht wirklich interessiert! :))

Das Tilling ist aber nach wie vor nicht so die Lösung, du gehst auf das Verfahren aber auch nicht weiter ein.
Mag sein das du Software Tilling richtig erkennst, aber beim bisher einzigen echten Tiller versagt das Verfahren. Hi Loewe, und Danke.

Das Grundverfahren ist mittlerweile so:
n={1,2,3,4,5,6}
1)n² Pixel breite/hohe Streifen rendern,
2)Streifen nochmal rendern, diesmal versetzt um (n-1)².
3)Erreichte Füllrate vergleichen. Wenn 2) deutlich unter 1) liegt, ist von einer unpassenden Blocklage auszugehen, dieser Wert kommt dann in die engere Wahl.

Also für die 64er-Prüfung senkrecht sind die Streifen immer 64 Pixel breit. In Schritt 1 beginnen sie an X-Koordinaten 0,128,256 ..., in Schritt 2 bei 32,160,288 etc.

Das ganze erfolgt jetzt mit aktivem Blending, um einen Teil des HSR-Mechanismus auszuschalten. Die Idee im Bezug auf echte TBDRs war dabei, mehrere Dreiecke pro Tile in die Display List zu bekommen.

Ist die Blockgröße gleich Tilegröße, dann sind bei 1)in der Hälfte der Tiles jeweils viele Dreiecke, in der anderen Hälfte garnichts. Bei 2)sind in allen Tiles gleichviele Dreiecke. Dadurch hatte ich mir erhofft, vielleicht durch die ungleichmäßige Belastung auch auf TBDRs einen Geschwindigkeitsunterschied herausarbeiten zu können. Leider - wie du siehst - reicht das aber immer noch nicht aus, um Kyro zu beeindrucken.

Auf IMRs ermittelt dieser Test (aufgrund der gestiegenen Bandbreitenlast) vornehmlich die Framebuffer-Organisation, so wie sie der Speichercontroller sieht. Da man guten Gewissens davon ausgehen kann, daß der Speichercontroller und die 'räumliche' Pipeline-Organisation bei IMRs aufeinander abgestimmt sind, ist das auch nicht weiter tragisch.

ow
2003-09-03, 17:00:15
Hab noch keine neuen GF4 Werte hier entdeckt, daher hier mal meine.

GF4ti4200 @250/513 (default), Deto 45.23

ArchMark 0.22.05
Driver GeForce4 Ti 4200/AGP/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 87.56Hz
Comment
Method Flush
Timer 1.470 GHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 977.417 MPix/s
Z 994.654 MPix/s
ColZ 946.673 MPix/s
ZPassColZ 867.094 MPix/s
ZCullLEqual 3.714 GPix/s
ZCullGEqual 3.713 GPix/s
ZCullEqual 3.673 GPix/s
S 993.608 MPix/s
SCull 977.747 MPix/s
----stencil test passed-------------------------
S 995.161 MPix/s
ZFailS 995.720 MPix/s
------z test passed (LEQUAL)--------------------
S 992.447 MPix/s
ZS 995.750 MPix/s
Col 994.065 MPix/s
ColZ 967.190 MPix/s
ColS 914.733 MPix/s
ColZS 924.482 MPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Col 984.218 MPix/s
Z 995.103 MPix/s
ColZ 976.182 MPix/s
ZPassColZ 995.561 MPix/s
ZCullLEqual 3.788 GPix/s
ZCullGEqual 3.668 GPix/s
ZCullEqual 3.666 GPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 12.054 GB/s
Color 7.642 GB/s
ZAndStencil 28.423 GB/s
Z 21.259 GB/s
Stencil 13.276 GB/s

Draw 8.986 GB/s
BurnedByRAMDAC 272.241 MB/s
Physical 9.259 GB/s

Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 49.422 MTris/s
List 17.307 MTris/s
Clip 17.369 MTris/s

--Vertex shading speed--------------------------
LightD1 10.655 MTris/s
LightP1 7.292 MTris/s
LightP8 1.646 MTris/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 983.735 MPix/s
2 994.943 MPix/s
3 497.959 MPix/s
4 497.893 MPix/s

----Trilinear filter----------------------------
1 994.094 MPix/s
2 497.391 MPix/s
3 332.004 MPix/s
4 249.022 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 4.096 kB
DXT1 1.024 kB
DXT5 1.024 kB
Pal 1.024 kB

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 2
Height 2

----in color buffer-----------------------------
Width 2
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2





Auffällig ggü. Version 0.10.09:

Vertex Shading Speed hat sich ziemlich exakt gedrittelt, ZCullG(L)Equal Werte haben sich verdoppelt.

zeckensack
2003-09-03, 18:41:04
Thx :)
Original geschrieben von ow
Auffällig ggü. Version 0.10.09:

Vertex Shading Speed hat sich ziemlich exakt gedrittelt, ZCullG(L)Equal Werte haben sich verdoppelt. Bei VSP haben sich nur die Zahlen verändert. Die aktuelle Version gibt Tris/s aus, die alte Verts/s.

Beim Culling bin ich etwas ratlos. Evtl ein ähnliches Prob wie bei ATI ... ich bin diesbezüglich leider unter NDA.

ow
2003-09-03, 19:02:01
Original geschrieben von zeckensack
Thx :)
Bei VSP haben sich nur die Zahlen verändert. Die aktuelle Version gibt Tris/s aus, die alte Verts/s.



:bonk: hätte mir eigentlich auffallen können, da eine Messgrösse immer aus Zahlenwert + Masseinheit besteht.

StefanV
2003-09-03, 20:39:51
@Zecke

Bei mir kommt beim Archmark bei Single Fillrate bei meiner Radeon 9600LE/SE/whatever nur ~350MPix/sec raus.

Irgendwas stimmt da nicht wirklich :|

zeckensack
2003-09-04, 09:01:54
Stefan,
Original geschrieben von zeckensack
ich bin diesbezüglich leider unter NDA.
... aber "bald" (TM).
Ist ein bekanntes Problem.

StefanV
2003-09-06, 14:16:55
@Zecke

Falls es dich beruhigt:

Das betrifft irgendwie auch den 3DMurx(tm)...

btw, hier mal die Ergebnisse meiner 'neuen' Radeon 7500 PCI, welche auf 250/200Mhz getaktet ist und ein 64bit RAM Interface besitzt:

ArchMark 0.22.05
Driver RADEON 7500 DDR x86/SSE2 v1.3.3920 WinXP Release
Resolution 1024x768 @ 61.02Hz
Comment Radeon 7500 PCI, 64bit RAM Interface
Method Flush
Timer 1.800 GHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 218.924 MPix/s
Z 408.256 MPix/s
ColZ 266.671 MPix/s
ZPassColZ 331.779 MPix/s
ZCullLEqual 471.104 MPix/s
ZCullGEqual 471.076 MPix/s
ZCullEqual 471.136 MPix/s
S 444.601 MPix/s
SCull 444.829 MPix/s
----stencil test passed-------------------------
S 444.811 MPix/s
ZFailS 446.347 MPix/s
------z test passed (LEQUAL)--------------------
S 446.329 MPix/s
ZS 446.345 MPix/s
Col 331.868 MPix/s
ColZ 331.856 MPix/s
ColS 331.382 MPix/s
ColZS 331.350 MPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Col 378.221 MPix/s
Z 443.067 MPix/s
ColZ 337.786 MPix/s
ZPassColZ 356.865 MPix/s
ZCullLEqual 477.325 MPix/s
ZCullGEqual 483.153 MPix/s
ZCullEqual 483.164 MPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 4.528 GB/s
Color 2.254 GB/s
ZAndStencil 74.798 GB/s
Z 55.726 GB/s
Stencil 446.257 MB/s

Draw 2.899 GB/s
BurnedByRAMDAC 187.683 MB/s
Physical 3.087 GB/s

Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 19.064 MTris/s
List 6.921 MTris/s
Clip 1.579 MTris/s

--Vertex shading speed--------------------------
LightD1 5.604 MTris/s
LightP1 5.446 MTris/s
LightP8 5.300 MTris/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 462.628 MPix/s
2 492.542 MPix/s
3 492.062 MPix/s

----Trilinear filter----------------------------
1 389.914 MPix/s
2 385.673 MPix/s
3 389.355 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 1.024 kB
DXT1 1.024 kB
DXT5 2.048 kB

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 8
Height 8

----in color buffer-----------------------------
Width 8
Height 8

----in depth buffer-----------------------------
Width 2
Height none

----in stencil buffer---------------------------
Width 2
Height none

ow
2003-09-06, 15:50:51
.

ow
2003-09-13, 13:03:22
.

zeckensack
2003-09-13, 16:40:55
Ja. Die MX ist in 32 bit stark bandbreitenlimitiert.

ow
2003-09-13, 16:48:20
.

avalanche
2003-09-14, 04:14:29
Hat eigentlich mal wer 'ne Voodoo5 6000 gearchmarkt, bzw. hat jemand die Möglichkeit 'ne V5 6000 zu testen?

ow
2003-09-14, 11:16:39
.

Modulor
2003-09-14, 15:10:45
Wird etwas länger :)


VP970 Texture Optimization

ArchMark 0.22.05
Driver Wildcat VP970 - GL2 v1.3.1
Resolution 1024x768 @ unknown refresh rate
Comment Texture Optimization
Method Flush
Timer 2.205 GHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 1.739 GPix/s
Z 1.068 GPix/s
ColZ 1.047 GPix/s
ZPassColZ 706.898 MPix/s
ZCullLEqual 2.855 GPix/s
ZCullGEqual 2.855 GPix/s
ZCullEqual 2.041 GPix/s
S 1.554 GPix/s
SCull 4.180 GPix/s
----stencil test passed-------------------------
S 4.166 GPix/s
ZFailS 907.443 MPix/s
------z test passed (LEQUAL)--------------------
S 634.975 MPix/s
ZS 634.979 MPix/s
Col 615.389 MPix/s
ColZ 611.360 MPix/s
ColS 615.733 MPix/s
ColZS 611.611 MPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z24 S8
Col 2.034 GPix/s
Z 1.485 GPix/s
ColZ 1.463 GPix/s
ZPassColZ 884.328 MPix/s
ZCullLEqual 2.948 GPix/s
ZCullGEqual 2.948 GPix/s
ZCullEqual 2.036 GPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 7.674 GB/s
Color 8.209 GB/s
ZAndStencil 7.224 GB/s
Z 8.194 GB/s
Stencil 5.319 GB/s

Draw 7.703 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 7.971 GB/s

Geometry
Mode RGBA5650 Z24 S8
--Plain vertices--------------------------------
Fan 97.248 MTris/s
List 32.616 MTris/s
Clip 32.615 MTris/s

--Vertex shading speed--------------------------
LightD1 19.307 MTris/s
LightP1 10.891 MTris/s
LightP8 1.941 MTris/s


Texturing
Mode RGBA5650 Z24 S8
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 908.599 MPix/s
2 442.149 MPix/s
3 292.159 MPix/s
4 218.157 MPix/s
5 174.060 MPix/s
6 144.794 MPix/s
7 123.953 MPix/s
8 108.358 MPix/s

----Trilinear filter----------------------------
1 908.568 MPix/s
2 442.150 MPix/s
3 292.156 MPix/s
4 218.156 MPix/s
5 174.060 MPix/s
6 144.794 MPix/s
7 123.953 MPix/s
8 108.357 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 32.768 kB

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 8
Height 8

----in color buffer-----------------------------
Width 8
Height 8

----in depth buffer-----------------------------
Width 8
Height 8

----in stencil buffer---------------------------
Width 8
Height 8






VP970 Geometry Optimization

ArchMark 0.22.05
Driver Wildcat VP970 - GL2 v1.3.1
Resolution 1024x768 @ unknown refresh rate
Comment Geometry Optimization
Method Flush
Timer 2.205 GHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 1.115 GPix/s
Z 1.074 GPix/s
ColZ 1.041 GPix/s
ZPassColZ 710.240 MPix/s
ZCullLEqual 2.860 GPix/s
ZCullGEqual 2.861 GPix/s
ZCullEqual 2.229 GPix/s
S 1.486 GPix/s
SCull 4.376 GPix/s
----stencil test passed-------------------------
S 4.333 GPix/s
ZFailS 909.819 MPix/s
------z test passed (LEQUAL)--------------------
S 634.729 MPix/s
ZS 634.695 MPix/s
Col 616.889 MPix/s
ColZ 613.099 MPix/s
ColS 616.781 MPix/s
ColZS 613.063 MPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z24 S8
Col 1.485 GPix/s
Z 1.461 GPix/s
ColZ 1.452 GPix/s
ZPassColZ 888.377 MPix/s
ZCullLEqual 2.951 GPix/s
ZCullGEqual 2.953 GPix/s
ZCullEqual 2.224 GPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 7.815 GB/s
Color 8.212 GB/s
ZAndStencil 7.478 GB/s
Z 8.197 GB/s
Stencil 5.932 GB/s

Draw 7.699 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 7.966 GB/s

Geometry
Mode RGBA5650 Z24 S8
--Plain vertices--------------------------------
Fan 106.257 MTris/s
List 35.634 MTris/s
Clip 35.636 MTris/s

--Vertex shading speed--------------------------
LightD1 21.095 MTris/s
LightP1 11.901 MTris/s
LightP8 2.121 MTris/s


Texturing
Mode RGBA5650 Z24 S8
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 248.236 MPix/s
2 120.778 MPix/s
3 79.769 MPix/s
4 59.574 MPix/s
5 47.526 MPix/s
6 39.546 MPix/s
7 33.855 MPix/s
8 29.601 MPix/s

----Trilinear filter----------------------------
1 248.187 MPix/s
2 120.766 MPix/s
3 79.810 MPix/s
4 59.567 MPix/s
5 47.536 MPix/s
6 39.544 MPix/s
7 33.855 MPix/s
8 29.596 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 32.768 kB

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 8
Height 8

----in color buffer-----------------------------
Width 8
Height 8

----in depth buffer-----------------------------
Width 4
Height 4

----in stencil buffer---------------------------
Width 4
Height 4





VP560 Texture Optimization

ArchMark 0.22.05
Driver Wildcat VP560 - GL2 v1.3.1
Resolution 1024x768 @ unknown refresh rate
Comment Texture Optimization
Method Flush
Timer 2.205 GHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 820.203 MPix/s
Z 544.829 MPix/s
ColZ 395.364 MPix/s
ZPassColZ 391.896 MPix/s
ZCullLEqual 444.100 MPix/s
ZCullGEqual 444.112 MPix/s
ZCullEqual 1.110 GPix/s
S 603.774 MPix/s
SCull 1.045 GPix/s
----stencil test passed-------------------------
S 1.043 GPix/s
ZFailS 484.517 MPix/s
------z test passed (LEQUAL)--------------------
S 377.934 MPix/s
ZS 378.068 MPix/s
Col 349.533 MPix/s
ColZ 334.735 MPix/s
ColS 349.509 MPix/s
ColZS 334.995 MPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z24 S8
Col 554.137 MPix/s
Z 563.858 MPix/s
ColZ 360.054 MPix/s
ZPassColZ 375.084 MPix/s
ZCullLEqual 443.413 MPix/s
ZCullGEqual 443.336 MPix/s
ZCullEqual 1.105 GPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 2.712 GB/s
Color 3.359 GB/s
ZAndStencil 1.952 GB/s
Z 3.348 GB/s
Stencil 1.053 GB/s

Draw 4.504 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 4.771 GB/s

Geometry
Mode RGBA5650 Z24 S8
--Plain vertices--------------------------------
Fan 39.820 MTris/s
List 13.316 MTris/s
Clip 13.316 MTris/s

--Vertex shading speed--------------------------
LightD1 7.879 MTris/s
LightP1 4.442 MTris/s
LightP8 790.827 kTris/s


Texturing
Mode RGBA5650 Z24 S8
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 369.293 MPix/s
2 180.075 MPix/s
3 119.018 MPix/s
4 88.806 MPix/s
5 70.916 MPix/s
6 58.993 MPix/s
7 50.502 MPix/s
8 44.148 MPix/s

----Trilinear filter----------------------------
1 369.672 MPix/s
2 180.081 MPix/s
3 119.020 MPix/s
4 88.880 MPix/s
5 70.916 MPix/s
6 58.993 MPix/s
7 50.502 MPix/s
8 44.148 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 32.768 kB

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 8
Height 4

----in color buffer-----------------------------
Width 8
Height 4

----in depth buffer-----------------------------
Width 8
Height 4

----in stencil buffer---------------------------
Width 4
Height 4






VP560 Geometry Optimization

ArchMark 0.22.05
Driver Wildcat VP560 - GL2 v1.3.1
Resolution 1024x768 @ unknown refresh rate
Comment Geometry Optimization
Method Flush
Timer 2.205 GHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 826.291 MPix/s
Z 588.994 MPix/s
ColZ 625.412 MPix/s
ZPassColZ 409.834 MPix/s
ZCullLEqual 949.778 MPix/s
ZCullGEqual 949.941 MPix/s
ZCullEqual 1.417 GPix/s
S 611.370 MPix/s
SCull 1.104 GPix/s
----stencil test passed-------------------------
S 1.104 GPix/s
ZFailS 504.613 MPix/s
------z test passed (LEQUAL)--------------------
S 380.104 MPix/s
ZS 379.970 MPix/s
Col 360.419 MPix/s
ColZ 351.791 MPix/s
ColS 360.432 MPix/s
ColZS 351.939 MPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z24 S8
Col 712.326 MPix/s
Z 647.214 MPix/s
ColZ 674.670 MPix/s
ZPassColZ 444.074 MPix/s
ZCullLEqual 948.743 MPix/s
ZCullGEqual 948.718 MPix/s
ZCullEqual 1.263 GPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 2.845 GB/s
Color 4.314 GB/s
ZAndStencil 2.036 GB/s
Z 4.022 GB/s
Stencil 1.117 GB/s

Draw 4.565 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 4.833 GB/s

Geometry
Mode RGBA5650 Z24 S8
--Plain vertices--------------------------------
Fan 51.150 MTris/s
List 17.100 MTris/s
Clip 17.101 MTris/s

--Vertex shading speed--------------------------
LightD1 10.118 MTris/s
LightP1 5.704 MTris/s
LightP8 1.015 MTris/s


Texturing
Mode RGBA5650 Z24 S8
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 237.758 MPix/s
2 115.671 MPix/s
3 76.434 MPix/s
4 57.072 MPix/s
5 45.537 MPix/s
6 37.880 MPix/s
7 32.428 MPix/s
8 28.348 MPix/s

----Trilinear filter----------------------------
1 237.748 MPix/s
2 115.681 MPix/s
3 76.434 MPix/s
4 57.072 MPix/s
5 45.536 MPix/s
6 37.880 MPix/s
7 32.428 MPix/s
8 28.348 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 32.768 kB

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 8
Height 4

----in color buffer-----------------------------
Width 8
Height 4

----in depth buffer-----------------------------
Width 4
Height 4

----in stencil buffer---------------------------
Width 4
Height 4

BlackArchon
2003-09-16, 02:22:19
Hier mal eine GF4 MX440 mit PCI-Interface:

ArchMark 0.22.05
Driver GeForce4 MX 440/PCI/SSE/3DNOW! v1.4.0
Resolution 1024x768 @ 60.89Hz
Comment
Method Flush
Timer 2.005 GHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 534.209 MPix/s
Z 1.020 GPix/s
ColZ 527.712 MPix/s
ZPassColZ 496.812 MPix/s
ZCullLEqual 3.773 GPix/s
ZCullGEqual 3.621 GPix/s
ZCullEqual 3.699 GPix/s
S 3.709 GPix/s
SCull 3.535 GPix/s
----stencil test passed-------------------------
S 3.653 GPix/s
ZFailS 556.675 MPix/s
------z test passed (LEQUAL)--------------------
S 556.829 MPix/s
ZS 556.865 MPix/s
Col 432.662 MPix/s
ColZ 401.878 MPix/s
ColS 432.685 MPix/s
ColZS 388.769 MPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Col 536.256 MPix/s
Z 536.328 MPix/s
ColZ 536.313 MPix/s
ZPassColZ 536.381 MPix/s
ZCullLEqual 3.953 GPix/s
ZCullGEqual 3.953 GPix/s
ZCullEqual 3.953 GPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 4.362 GB/s
Color 4.543 GB/s
ZAndStencil 4.193 GB/s
Z 33.361 GB/s
Stencil 1.125 MB/s

Draw 5.043 GB/s
BurnedByRAMDAC 190.061 MB/s
Physical 5.233 GB/s

Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 33.728 MTris/s
List 10.956 MTris/s
Clip 10.760 MTris/s

--Vertex shading speed--------------------------
LightD1 8.300 MTris/s
LightP1 4.090 MTris/s
LightP8 1.343 MTris/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 536.040 MPix/s
2 535.081 MPix/s

----Trilinear filter----------------------------
1 501.140 MPix/s
2 269.867 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 2.048 kB
DXT1 512B
DXT5 512B
Pal 512B

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height 2

----in color buffer-----------------------------
Width 4
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width none
Height 2

ow
2003-09-26, 20:31:36
.

mapel110
2003-09-27, 00:02:32
ArchMark 0.22.05
Driver: RADEON 9800 Pro x86/MMX/3DNow!/SSE v1.3.3963 WinXP Release
1024x768 @ unknown refresh rate (assuming 85Hz)
Comment:
Flushing commands, no buffer swaps
2.205 GHz timer speed (should match your CPU clock)
Fillrate

32 bits
Mode: RGBA8888 Z24 S8
2.101 GPix/s color only
1.986 GPix/s z only
1.454 GPix/s color and z
2.138 GPix/s z tested (pass), color and z
43.418 GPix/s discardable by LEQUAL depth test
3.217 GPix/s discardable by GEQUAL depth test
3.226 GPix/s discardable by EQUAL depth test
2.893 GPix/s stencil writes
2.888 GPix/s discardable by EQUAL stencil test
stencil test passed
2.883 GPix/s pure stencil updates
2.879 GPix/s z fail (LEQUAL), stencil update
z test passed (LEQUAL)
2.894 GPix/s stencil update
2.883 GPix/s stencil update, z update
2.615 GPix/s color replace
2.139 GPix/s z update, color replace
2.146 GPix/s stencil update, color replace
2.021 GPix/s stencil update, z update, color replace
16 bits
Mode: RGBA5650 Z16 S0
2.754 GPix/s color only
2.598 GPix/s z only
2.265 GPix/s color and z
2.345 GPix/s z tested (pass), color and z
43.392 GPix/s discardable by LEQUAL depth test
3.259 GPix/s discardable by GEQUAL depth test
3.233 GPix/s discardable by EQUAL depth test
Bandwidth
Mode: RGBA8888 Z24 S8

available to buffer clears
21.078 GB/s all buffers
11.244 GB/s color only
145.993 GB/s depth and stencil
109.030 GB/s depth only
2.875 GB/s stencil only
23.242 GB/s worst case draw bandwidth
267.387 MB/s burned by the RAMDAC
23.509 GB/s estimated physical bandwidth
Geometry
Mode: RGBA5650 Z16 S0

Plain vertices
163.428 MTris/s as triangle fan
59.009 MTris/s as triangle list
5.726 MTris/s clipped
Vertex shading speed
39.708 MTris/s lit (one directional light)
16.891 MTris/s lit (one point light)
6.272 MTris/s lit (eight point lights)
Texturing
Mode: RGBA5650 Z16 S0

Textured fillrate
Bilinear filter
3.195 GPix/s w 1 layers
1.607 GPix/s w 2 layers
1.093 GPix/s w 3 layers
819.366 MPix/s w 4 layers
631.227 MPix/s w 5 layers
542.230 MPix/s w 6 layers
467.958 MPix/s w 7 layers
411.134 MPix/s w 8 layers
Trilinear filter
1.603 GPix/s w 1 layers
815.304 MPix/s w 2 layers
544.173 MPix/s w 3 layers
408.551 MPix/s w 4 layers
326.094 MPix/s w 5 layers
273.768 MPix/s w 6 layers
234.598 MPix/s w 7 layers
205.263 MPix/s w 8 layers

9800 pro @420/350 =)
100 hz refreshrate

Quasar
2003-09-27, 01:24:03
Zecki, zecki, was misst du hier nur.... (Bandwidht...???)


ArchMark 0.22.05
Driver GeForce FX 5800 Ultra/AGP/SSE2 v1.4.0
Resolution 1024x768 @ unknown refresh rate
Comment FX5800u-128 Det45.23 @ 550/1050
Method Flush
Timer 2.993 GHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 2.198 GPix/s
Z 4.387 GPix/s
ColZ 2.200 GPix/s
ZPassColZ 2.062 GPix/s
ZCullLEqual 7.680 GPix/s
ZCullGEqual 7.680 GPix/s
ZCullEqual 7.680 GPix/s
S 4.388 GPix/s
SCull 4.387 GPix/s
----stencil test passed-------------------------
S 4.387 GPix/s
ZFailS 3.485 GPix/s
------z test passed (LEQUAL)--------------------
S 3.486 GPix/s
ZS 3.485 GPix/s
Col 2.125 GPix/s
ColZ 2.125 GPix/s
ColS 1.838 GPix/s
ColZS 1.838 GPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Col 2.199 GPix/s
Z 4.348 GPix/s
ColZ 2.200 GPix/s
ZPassColZ 2.192 GPix/s
ZCullLEqual 7.738 GPix/s
ZCullGEqual 7.738 GPix/s
ZCullEqual 7.738 GPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 22.877 GB/s
Color 15.953 GB/s
ZAndStencil 40.422 GB/s
Z 30.136 GB/s
Stencil 14.725 GB/s

Draw 20.127 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 20.394 GB/s

Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 162.162 MTris/s
List 45.516 MTris/s
Clip 45.542 MTris/s

--Vertex shading speed--------------------------
LightD1 25.057 MTris/s
LightP1 16.407 MTris/s
LightP8 5.571 MTris/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 1.905 GPix/s
2 2.200 GPix/s
3 1.038 GPix/s
4 1.038 GPix/s

----Trilinear filter----------------------------
1 2.200 GPix/s
2 1.175 GPix/s
3 747.602 MPix/s
4 579.925 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 4.096 kB
DXT1 4.096 kB
DXT5 512B
Pal 512B

misterh
2003-09-29, 05:27:41
ArchMark 0.22.05
Driver: RADEON 9800 SE x86/MMX/3DNow!/SSE v1.3.3920 Win2000 Release
1024x768 @ unknown refresh rate (assuming 85Hz)
Comment:
Flushing commands, no buffer swaps
2.172 GHz timer speed (should match your CPU clock)
Fillrate

32 bits
Mode: RGBA8888 Z24 S8
324.818 MPix/s color only
332.334 MPix/s z only
314.010 MPix/s color and z
702.683 MPix/s z tested (pass), color and z
749.335 MPix/s discardable by LEQUAL depth test
749.390 MPix/s discardable by GEQUAL depth test
749.410 MPix/s discardable by EQUAL depth test
740.312 MPix/s stencil writes
740.572 MPix/s discardable by EQUAL stencil test
stencil test passed
741.084 MPix/s pure stencil updates
742.571 MPix/s z fail (LEQUAL), stencil update
z test passed (LEQUAL)
742.642 MPix/s stencil update
742.441 MPix/s stencil update, z update
736.545 MPix/s color replace
701.134 MPix/s z update, color replace
699.454 MPix/s stencil update, color replace
702.087 MPix/s stencil update, z update, color replace
16 bits
Mode: RGBA5650 Z16 S0
1.434 GPix/s color only
1.413 GPix/s z only
1.314 GPix/s color and z
1.338 GPix/s z tested (pass), color and z
1.358 GPix/s discardable by LEQUAL depth test
1.491 GPix/s discardable by GEQUAL depth test
1.491 GPix/s discardable by EQUAL depth test
Bandwidth
Mode: RGBA8888 Z24 S8

available to buffer clears
268.093 GB/s all buffers
115.312 GB/s color only
271.863 GB/s depth and stencil
192.522 GB/s depth only
749.978 MB/s stencil only
11.226 GB/s worst case draw bandwidth
267.387 MB/s burned by the RAMDAC
11.493 GB/s estimated physical bandwidth
Geometry
Mode: RGBA5650 Z16 S0

Plain vertices
143.630 MTris/s as triangle fan
49.784 MTris/s as triangle list
5.166 MTris/s clipped
Vertex shading speed
35.317 MTris/s lit (one directional light)
15.404 MTris/s lit (one point light)
5.722 MTris/s lit (eight point lights)
Texturing
Mode: RGBA5650 Z16 S0

Textured fillrate
Bilinear filter
370.152 MPix/s w 1 layers
185.450 MPix/s w 2 layers
123.676 MPix/s w 3 layers
92.780 MPix/s w 4 layers
74.227 MPix/s w 5 layers
61.866 MPix/s w 6 layers
53.029 MPix/s w 7 layers
46.406 MPix/s w 8 layers
Trilinear filter
370.271 MPix/s w 1 layers
185.443 MPix/s w 2 layers
123.674 MPix/s w 3 layers
92.770 MPix/s w 4 layers
74.227 MPix/s w 5 layers
61.865 MPix/s w 6 layers
53.029 MPix/s w 7 layers
46.406 MPix/s w 8 layers
Texture cache
Mode: RGBA8888 Z24 S8

0B using RGBA textures
Tiling
Mode: RGBA8888 Z24 S8

preferred block alignment
updating all buffers
32 pixels wide
4 pixels high
in color buffer
32 pixels wide
4 pixels high
in depth buffer
2 pixels wide
2 pixels high
in stencil buffer
2 pixels wide
2 pixels high

del_4901
2003-09-29, 07:37:59
ist ein kleinwenig untertaktet Core->230Mhz RAM->513@510

ArchMark 0.22.05
Driver GeForce FX Go5200/AGP/SSE2 v1.4.1
Resolution 1024x768 @ 58.82Hz
Comment
Method Flush
Timer 2.599 GHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 868.293 MPix/s
Z 864.780 MPix/s
ColZ 770.058 MPix/s
ZPassColZ 682.050 MPix/s
ZCullLEqual 3.462 GPix/s
ZCullGEqual 3.166 GPix/s
ZCullEqual 3.391 GPix/s
S 864.702 MPix/s
SCull 844.145 MPix/s
----stencil test passed-------------------------
S 814.332 MPix/s
ZFailS 725.108 MPix/s
------z test passed (LEQUAL)--------------------
S 660.186 MPix/s
ZS 738.814 MPix/s
Col 512.687 MPix/s
ColZ 512.467 MPix/s
ColS 512.603 MPix/s
ColZS 512.506 MPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Col 873.220 MPix/s
Z 859.177 MPix/s
ColZ 893.581 MPix/s
ZPassColZ 907.181 MPix/s
ZCullLEqual 3.445 GPix/s
ZCullGEqual 3.532 GPix/s
ZCullEqual 3.415 GPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 5.717 GB/s
Color 6.037 GB/s
ZAndStencil 5.426 GB/s
Z 36.641 GB/s
Stencil 1.147 MB/s

Draw 6.115 GB/s
BurnedByRAMDAC 174.831 MB/s
Physical 6.290 GB/s

Geometry
Mode RGBA5650 Z0 S0
--Plain vertices--------------------------------
Fan 35.735 MTris/s
List 14.491 MTris/s
Clip 13.596 MTris/s

--Vertex shading speed--------------------------
LightD1 8.388 MTris/s
LightP1 2.731 MTris/s
LightP8 828.506 kTris/s


Texturing
Mode RGBA5650 Z0 S0
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 868.912 MPix/s
2 456.447 MPix/s
3 188.186 MPix/s
4 188.768 MPix/s

----Trilinear filter----------------------------
1 861.006 MPix/s
2 431.529 MPix/s
3 176.590 MPix/s
4 182.384 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 4.096 kB
DXT1 4.096 kB
DXT5 256B
Pal 1.024 kB

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 4
Height 2

----in color buffer-----------------------------
Width 4
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2

del_4901
2003-09-29, 08:00:07
Original geschrieben von misterh
ArchMark 0.22.05
Driver: RADEON 9800 SE x86/MMX/3DNow!/SSE v1.3.3920 Win2000 Release
1024x768 @ unknown refresh rate (assuming 85Hz)
Comment:
Flushing commands, no buffer swaps
2.172 GHz timer speed (should match your CPU clock)
Fillrate

32 bits
Mode: RGBA8888 Z24 S8
324.818 MPix/s color only
332.334 MPix/s z only
314.010 MPix/s color and z
702.683 MPix/s z tested (pass), color and z
749.335 MPix/s discardable by LEQUAL depth test
749.390 MPix/s discardable by GEQUAL depth test
749.410 MPix/s discardable by EQUAL depth test
740.312 MPix/s stencil writes
740.572 MPix/s discardable by EQUAL stencil test
stencil test passed
741.084 MPix/s pure stencil updates
742.571 MPix/s z fail (LEQUAL), stencil update
z test passed (LEQUAL)
742.642 MPix/s stencil update
742.441 MPix/s stencil update, z update
736.545 MPix/s color replace
701.134 MPix/s z update, color replace
699.454 MPix/s stencil update, color replace
702.087 MPix/s stencil update, z update, color replace
16 bits
Mode: RGBA5650 Z16 S0
1.434 GPix/s color only
1.413 GPix/s z only
1.314 GPix/s color and z
1.338 GPix/s z tested (pass), color and z
1.358 GPix/s discardable by LEQUAL depth test
1.491 GPix/s discardable by GEQUAL depth test
1.491 GPix/s discardable by EQUAL depth test
Bandwidth
Mode: RGBA8888 Z24 S8

available to buffer clears
268.093 GB/s all buffers
115.312 GB/s color only
271.863 GB/s depth and stencil
192.522 GB/s depth only
749.978 MB/s stencil only
11.226 GB/s worst case draw bandwidth
267.387 MB/s burned by the RAMDAC
11.493 GB/s estimated physical bandwidth
Geometry
Mode: RGBA5650 Z16 S0

Plain vertices
143.630 MTris/s as triangle fan
49.784 MTris/s as triangle list
5.166 MTris/s clipped
Vertex shading speed
35.317 MTris/s lit (one directional light)
15.404 MTris/s lit (one point light)
5.722 MTris/s lit (eight point lights)
Texturing
Mode: RGBA5650 Z16 S0

Textured fillrate
Bilinear filter
370.152 MPix/s w 1 layers
185.450 MPix/s w 2 layers
123.676 MPix/s w 3 layers
92.780 MPix/s w 4 layers
74.227 MPix/s w 5 layers
61.866 MPix/s w 6 layers
53.029 MPix/s w 7 layers
46.406 MPix/s w 8 layers
Trilinear filter
370.271 MPix/s w 1 layers
185.443 MPix/s w 2 layers
123.674 MPix/s w 3 layers
92.770 MPix/s w 4 layers
74.227 MPix/s w 5 layers
61.865 MPix/s w 6 layers
53.029 MPix/s w 7 layers
46.406 MPix/s w 8 layers
Texture cache
Mode: RGBA8888 Z24 S8

0B using RGBA textures
Tiling
Mode: RGBA8888 Z24 S8

preferred block alignment
updating all buffers
32 pixels wide
4 pixels high
in color buffer
32 pixels wide
4 pixels high
in depth buffer
2 pixels wide
2 pixels high
in stencil buffer
2 pixels wide
2 pixels high


Du hast schlechte werte deine Karte ist scheisse ;)
ne, mach mal AA und AF und so aus, dann wird's auch was mit dem score.

StefanV
2003-10-08, 13:56:45
hier mal ein richtig geiles schmankerl *eg*

ArchMark 0.22.05
Driver RAGE 128 Pro Dual C21 AGP 4x x86/SSE v1.2.1351 Win9x Release
Resolution 1024x768 @ unknown refresh rate
Comment Fury MaXX
Method Flush
Timer 808.078 MHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 245.573 MPix/s
Z 245.641 MPix/s
ColZ 205.510 MPix/s
ZPassColZ 132.469 MPix/s
ZCullLEqual 205.459 MPix/s
ZCullGEqual 205.461 MPix/s
ZCullEqual 205.461 MPix/s
S 173.581 MPix/s
SCull 173.579 MPix/s
----stencil test passed-------------------------
S 173.578 MPix/s
ZFailS 173.580 MPix/s
------z test passed (LEQUAL)--------------------
S 173.581 MPix/s
ZS 173.578 MPix/s
Col 132.462 MPix/s
ColZ 132.463 MPix/s
ColS 132.463 MPix/s
ColZS 132.462 MPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Col 245.610 MPix/s
Z 245.613 MPix/s
ColZ 245.629 MPix/s
ZPassColZ 236.887 MPix/s
ZCullLEqual 245.551 MPix/s
ZCullGEqual 245.551 MPix/s
ZCullEqual 245.544 MPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 1.297 GB/s
Color 1.943 GB/s
ZAndStencil 971.045 MB/s
Z 1.454 GB/s
Stencil 484.649 MB/s

Draw 1.678 GB/s
BurnedByRAMDAC 267.387 MB/s
Physical 1.945 GB/s

Geometry

Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 136.055 MPix/s
2 68.249 MPix/s

----Trilinear filter----------------------------
1 146.399 MPix/s
2 73.726 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 256B

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 16
Height none

----in color buffer-----------------------------
Width 16
Height none

----in depth buffer-----------------------------
Width 16
Height none

----in stencil buffer---------------------------
Width 16
Height none

ow
2003-10-08, 14:18:50
.

StefanV
2003-10-08, 16:09:37
hm, irgendwie ist der Ar(s)chmark inkompatibel mitm AFR...

Kann auch leider nicht wirklich viel mit der MaXX testen, da das anscheinend 'nur' eine 3,3V AGP Karte ist, zumindest die mir vorliegende Rev. 1.0...

StefanV
2003-10-08, 23:34:15
hier mal meine Low Profile Radeon 9100 von C.P. Technologys (aka Powercolor)

Das Teil ist mit 222/184MHz getaktet und besitzt anscheinend ein 128bit RAM INterface (ein WUNDER!!!)


Damit dürfte dieses Kärtchen mit Abstand die schnellste Low Profile GraKa sein, immerhin...
ArchMark 0.22.05
Driver RADEON 9100 DDR x86/SSE v1.3.3966 WinXP Release
Resolution 1024x768 @ 86.69Hz
Comment
Method Flush
Timer 808.082 MHz

Fillrate
--32 bits---------------------------------------
Mode RGBA8888 Z24 S8
Col 649.144 MPix/s
Z 865.098 MPix/s
ColZ 568.428 MPix/s
ZPassColZ 577.895 MPix/s
ZCullLEqual 11.013 GPix/s
ZCullGEqual 11.027 GPix/s
ZCullEqual 872.051 MPix/s
S 871.126 MPix/s
SCull 865.352 MPix/s
----stencil test passed-------------------------
S 867.676 MPix/s
ZFailS 868.279 MPix/s
------z test passed (LEQUAL)--------------------
S 865.759 MPix/s
ZS 867.298 MPix/s
Col 571.420 MPix/s
ColZ 577.137 MPix/s
ColS 576.322 MPix/s
ColZS 573.380 MPix/s



--16 bits---------------------------------------
Mode RGBA5650 Z16 S0
Col 831.390 MPix/s
Z 716.494 MPix/s
ColZ 698.448 MPix/s
ZPassColZ 757.004 MPix/s
ZCullLEqual 11.025 GPix/s
ZCullGEqual 10.437 GPix/s
ZCullEqual 865.133 MPix/s


Bandwidth
Mode RGBA8888 Z24 S8
--available to buffer clears--------------------
All 6.565 GB/s
Color 3.468 GB/s
ZAndStencil 43.237 GB/s
Z 32.205 GB/s
Stencil 835.564 MB/s

Draw 5.864 GB/s
BurnedByRAMDAC 235.821 MB/s
Physical 6.100 GB/s

Geometry
Mode RGBA5650 Z16 S0
--Plain vertices--------------------------------
Fan 40.870 MTris/s
List 13.911 MTris/s
Clip 1.310 MTris/s

--Vertex shading speed--------------------------
LightD1 8.699 MTris/s
LightP1 3.095 MTris/s
LightP8 2.094 MTris/s


Texturing
Mode RGBA5650 Z16 S0
--Textured fillrate-----------------------------
----Bilinear filter-----------------------------
1 866.210 MPix/s
2 867.595 MPix/s
3 433.557 MPix/s
4 438.315 MPix/s
5 290.688 MPix/s
6 291.219 MPix/s

----Trilinear filter----------------------------
1 736.688 MPix/s
2 740.078 MPix/s
3 370.768 MPix/s
4 374.300 MPix/s
5 244.007 MPix/s
6 249.290 MPix/s



Texture cache
Mode RGBA8888 Z24 S8
RGBA 1.024 kB
DXT1 1.024 kB
DXT5 1.024 kB

Tiling
Mode RGBA8888 Z24 S8
--preferred block alignment---------------------
----updating all buffers------------------------
Width 8
Height 2

----in color buffer-----------------------------
Width 8
Height 2

----in depth buffer-----------------------------
Width 2
Height 2

----in stencil buffer---------------------------
Width 2
Height 2

StefanV
2003-10-08, 23:41:24
Original geschrieben von Stefan Payne
ArchMark 0.22.05
Driver Radeon 7200 SDR x86/SSE2 v1.3.3803 WinXP Release
Resolution 1024x768 @ unknown refresh rate
Comment
Method Flush
Timer 1.800 GHz

Texture cache
Mode RGBA8888 Z24 S8
RGBA 1.024 kB
DXT1 16.384 kB
DXT5 4.096 kB


€dit:

Radeon Modell hervorgehoben ;)

Hm, kanns sein, daß der ARchmark da mist gemessen hat, oder hat die R100 wirklich so einen Monster Texture Cache?? :O

zeckensack
2003-10-09, 16:47:14
R100 hat AFAIK 1kiB Texturcache.
Bitte den "paranoid's guide" beachten - ich vermute du hattest noch ein heftig animiertes Browser-Fenster offen.