PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : stencil performance r420 vs nv40


christoph
2004-05-10, 20:09:14
hallo,
soweit ich weiß siehts so aus:

nv40: 32 z/stencil operations per clock cycle
nv40 mit multisampling: 32 z/stencil operations per clock cycle

also nv40@400mhz= 12.8 gpixels/sec stencil fill-rate oder
12.8 gigasamples/sec color/stencil/Z fillrate mit fsaa

r420: 16 z/stencil operations per clock cycle
r420 mit multisampling: 32 z/stencil operations per clock cycle

also r420@520mhz= 8.3 gpixels/sec stencil fill-rate oder
16.6 gigasamples/sec color/stencil/Z fillrate mit fsaa

3dmk03 gt2 nutzt ja massig stencil schatten, warum ist nv40 unter fsaa so viel schneller als r420...ultrashadow?

aus den b3d reviews, 3dmk03 gt2, kein af, 1600x1200

r420
http://www.beyond3d.com/reviews/ati/r420_x800/chart/image031.gif

nv40
http://www.beyond3d.com/previews/nvidia/nv40/chart/image025.gif

LovesuckZ
2004-05-10, 20:11:20
Haben die Karten wirklich 32 32 z/stencil operations/c beim AA oder halbiert bzw. bleibt es nicht gleich (16)?

ShadowXX
2004-05-10, 20:13:49
Beim r420 ist das wohl mehr ein "up to" 32 z/stencil operations per clock cycle...(bei MSAA)

christoph
2004-05-10, 20:14:23
^^^^^^soweit ich weiß bleibts beim nv40 gleich und verdoppelt sich beim r420 unter fsaa

Demirug
2004-05-10, 21:02:04
Beide können 32 Stencil-Ops pro Takt. Der R420 kann aber maximal 16 Pixel pro Takt. Daher bleiben ohne AA beim R420 16 Ops pro Takt ungenutzt.

Mit AA herscht dann theoretisch Gleichstand.

Gerade bei diesen Z/Stencil Passes spielt aber dann noch das Coretakt zu Bandbreiten Verhältniss eine grosse Rolle. Die XT wird da vom Speicher böse runtergebremst. Für den NV40 habe ich leider gerade keine Zahlen zur Hand.

Gas9t
2004-05-10, 22:29:50
Original geschrieben von Demirug
Beide können 32 Stencil-Ops pro Takt. Der R420 kann aber maximal 16 Pixel pro Takt. Daher bleiben ohne AA beim R420 16 Ops pro Takt ungenutzt.

Mit AA herscht dann theoretisch Gleichstand.

Gerade bei diesen Z/Stencil Passes spielt aber dann noch das Coretakt zu Bandbreiten Verhältniss eine grosse Rolle. Die XT wird da vom Speicher böse runtergebremst. Für den NV40 habe ich leider gerade keine Zahlen zur Hand.

Böse runtergebremst !!!!

Sagmal Demi wie bezeichnest du dann den Speed der NV40 ???

Quasar
2004-05-10, 22:49:00
Original geschrieben von Gas9t
Böse runtergebremst !!!!

Sagmal Demi wie bezeichnest du dann den Speed der NV40 ???

SChau dir einfach oben die Diagramme an: 50% schneller bei 4xAA.

Gas9t
2004-05-10, 22:51:02
Original geschrieben von Quasar
SChau dir einfach oben die Diagramme an: 50% schneller bei 4xAA.

3DMark ist mir völlig EGAL, für mich zählen Games ! und Apps und nichts anderes.

Quasar
2004-05-10, 23:08:41
Dann gib' doch bitte mal ein paar Links zu gebenchten Applikationen, die einen Pre-Z Pass machen und ohne AF in 2x und 4xMS vermessen wurden, Gas9t.

deekey777
2004-05-10, 23:25:29
Original geschrieben von Quasar
Dann gib' doch bitte mal ein paar Links zu gebenchten Applikationen, die einen Pre-Z Pass machen und ohne AF in 2x und 4xMS vermessen wurden, Gas9t.


Du hast aber Wünsche. Sonst noch was? ;D

Ehrlich gesagt warte ich auf einen Post eines bestimmten Mods, der den GT2 zur Schnecke macht. :D

Flame:
nVidia's Kritik (http://www.de.tomshardware.com/column/20030215/3dmark2003-01.html)
Diese zwei Tests versuchen, den "Z-first" Rendering Style zu duplizieren, der im künftigen First-Person-Shooter Doom 3 zum Einsatz kommen soll. Sie besitzen einen "Doom-ähnlichen" Look, verwenden jedoch eine bizarre Rendering-Methode, die weit von Doom 3 oder eines anderen bekannten Spiels entfernt ist. Dieses Verfahren stellt ein interessantes Demo dar, ist aber so ineffektiv, dass kein Spiel darauf basieren wird.

Gast
2004-05-10, 23:26:28
@Gas9t und quasar
das ist ot.....habt ihr ne erklärung?

christoph
2004-05-10, 23:30:54
der gast war ich,
@deekey777
ebenfalls ot, sorry.

deekey777
2004-05-10, 23:32:42
Original geschrieben von christoph
der gast war ich,
@deekey777
ebenfalls ot, sorry.

Wofür? Bei mir gilt: Auch ein sinnloser Post ist ein Post. :D Ich wollte dich nicht kritisieren oder ähnliches.

Demirug
2004-05-10, 23:47:35
Original geschrieben von Gas9t
Böse runtergebremst !!!!

Sagmal Demi wie bezeichnest du dann den Speed der NV40 ???

Was soll ich den sonst sagen wenn die entsprechenden Messergebnisse sagen das der Chip nur 71,4% von dem was er bringen müsste auch wirklich bringt. Mit 2xAA sind es dann sogar nur noch 57,1%.

Der NV40 kommt auf 85,8% Prozent seiner theoretischen Leistung bei 0xAA. Diese liegt in etwa um 54% höher als die des R420.

Die 2xAA Werte habe ich gerade leider nicht zur Hand. Bei 2xAA ist die Theoretische Leistung des NV40 allerdings um etwa 24% kleiner als beim R420.

Ohne AA ist der NV40 also in der Diziplin Stencilschatten auf jeden Fall sehr schnell. Die Zahlen für 2xAA liefere ich noch nach.

Quasar
2004-05-10, 23:51:31
Original geschrieben von deekey777
Du hast aber Wünsche. Sonst noch was? ;D

Ehrlich gesagt warte ich auf einen Post eines bestimmten Mods, der den GT2 zur Schnecke macht. :D

Flame:
nVidia's Kritik (http://www.de.tomshardware.com/column/20030215/3dmark2003-01.html)

Nö, ich habe keine Wünsche. Aber wenn der Gas9t meint, völlig ohne den Zusammenhang mal ein bißchen auf den NV40 einzudreschen - WTF?

Wir haben hier Zahlen bezgl. des GT2 und die sprechen eine eindeutige Sprache.

Klar, das Warum ist interessant.
Die wenigen AA-only Benches, die ich bisher gesehen habe, sahen allesamt den NV40 mehr oder minder deutlich vorn. Da die Bandbreite als Faktor ausfällt, da beide nahezu denselben Speichertakt haben, müssen wir woanders suchen.
Hier haben wir die Stencil-Füllrate als besonderen Faktor, in der der NV40 für sich allein, auch sehr stark ist.

IMO ist die Kombination von Stencil mit MSAA wohl ein Gericht, welches dem R420 noch nicht so gut schmeckt.

DanMan
2004-05-11, 02:57:11
Können NV40 und R420 eigentlich Stencil Schatten anti-aliasen (oder so)? Der PowerVR kann das ja soweit ich das gestern gelesen hab. :spock:
Oder liegt das nur daran, dass der PowerVR halt SSAA nutzt?

Demirug
2004-05-11, 07:15:35
Original geschrieben von DanMan
Können NV40 und R420 eigentlich Stencil Schatten anti-aliasen (oder so)? Der PowerVR kann das ja soweit ich das gestern gelesen hab. :spock:
Oder liegt das nur daran, dass der PowerVR halt SSAA nutzt?

NV40 und R420 bearbeiten auch bei MSAA die Stencilwerte von jedem Sample getrennt. Ergo greift das AA auch dort.

Gas9t
2004-05-11, 07:27:52
Original geschrieben von Quasar
Dann gib' doch bitte mal ein paar Links zu gebenchten Applikationen, die einen Pre-Z Pass machen und ohne AF in 2x und 4xMS vermessen wurden, Gas9t.

Deine Aussage wären seriöser wenn du eine NV40 und eine R420 dein EIGEN nennst und mit SICHERHEIT keinen Cheat-Treiber auf deinem System hast.

Weiterhin ist ohne AA im Highend ein Witz, kapische!

Quasar
2004-05-11, 08:14:22
Original geschrieben von Gas9t
Deine Aussage wären seriöser wenn du eine NV40 und eine R420 dein EIGEN nennst und mit SICHERHEIT keinen Cheat-Treiber auf deinem System hast.

Weiterhin ist ohne AA im Highend ein Witz, kapische!

Schade, daß von dir nichts konstruktives kommt. Erst beschwerst du dich, der 3DMark sei dir zu synthetisch (wobei ich natürlich völlig recht gebe, aber). Dann kommt auf die Aufforderung mal selbst ein paar Benches die zum Thema relevant sind, beizusteuern (gern auch als Links), nichts weiter als ein abfälliger und besserwisserischer Kommentar über meine Glaubwürdigkeit.
Schade.

Aber ich biete dir gern an, daß wenn ich demnächst eine X800 bekomme, du mir einen "garantiert Cheatfreien" Treiber mailen kannst, den ich dann probieren werde, ja?
Selbiges für die NV40.

christoph
2004-05-11, 10:07:38
morgen alle :)
richtig schlauer bin ich leider immer noch nicht.....
kann man denn aus den von mir geposteten ergebnissen von gt2 überhaupt auf die stencil leistung der karten schließen oder liegt das 'problem' woanders? immerhin liegt der unterschied im 50% bereich unter 4xaa

demi hat ja schon die bandbreitenlimitierung und die schlechte ausnutzung der bandbreite beim r420 angesprochen.

dave baumann meinte man solle sich mal die front-to-back render leistungen anschauen:

http://www.beyond3d.com/reviews/ati/r420_x800/index.php?p=18
http://www.beyond3d.com/previews/nvidia/nv40/index.php?p=22

Radeonator
2004-05-11, 12:58:47
Gibt es irgendwo eine ausführliche Erklärung zum Thema Stencil???

DanMan
2004-05-11, 14:27:26
Original geschrieben von Demirug
NV40 und R420 bearbeiten auch bei MSAA die Stencilwerte von jedem Sample getrennt. Ergo greift das AA auch dort.
Ahja, dankeschööhn. :)
Original geschrieben von Radeonator
Gibt es irgendwo eine ausführliche Erklärung zum Thema Stencil???
Nun, wie wärs z.B. damit: http://www.pvrdev.com/pub/PC/doc/f/The%20Stencil%20Buffer.htm

ow
2004-05-11, 16:17:44
.

Quasar
2004-05-11, 16:24:06
Original geschrieben von christoph
dave baumann meinte man solle sich mal die front-to-back render leistungen anschauen:

http://www.beyond3d.com/reviews/ati/r420_x800/index.php?p=18
http://www.beyond3d.com/previews/nvidia/nv40/index.php?p=22

Der R420 kann deutlich mehr Pixel/Takt verwerfen, als der NV40, wenn ich das richtig sehe. Das war aber auch beim R3xx/nV3x schon so.
Inwiefern sollte uns das beim Stencil-"Problem" weiterhelfen?

Demirug
2004-05-11, 16:55:56
Original geschrieben von ow
Tun das nicht alle MSAA-fähigen Chips wie >NV2x und R300?

Im Prinzip ja. Die Frage ist eben nur ob man FAA auch als MSAA zählt. Dort funktioniert es nämlich nicht.

Demirug
2004-05-11, 16:58:01
Original geschrieben von christoph
dave baumann meinte man solle sich mal die front-to-back render leistungen anschauen:

http://www.beyond3d.com/reviews/ati/r420_x800/index.php?p=18
http://www.beyond3d.com/previews/nvidia/nv40/index.php?p=22

Womit er sich wahrscheinlich selbst reingelegt hat. Für die Stencilschatten dreht D3 den Z-Test sozusagen um. Dadurch wird das Hir-Z bei den Radeons deaktiviert.

christoph
2004-05-13, 09:36:14
quote von opengl guy zum thema:
There's still some tuning work to be done on the X800, especially for AA. As someone mentioned in a review, the memory controller is very programmable, however it's not always obvious what the best settings are (i.e. what's best for one mode may not be best for another) and the combinations are enourmous. Expect large improvements with AA as we find more optimal settings. Stay tuned.

robbitop
2004-05-13, 13:46:16
ich lese aus dem diagramm ein besseres Z-Culling für die NV40 raus.
Erst ab 16x12 gewinnt die R420, ich denk mal da schlägt dann die 30% mehr an Füllrate durch.
Naja aber das Z-Culling vom NV40 ist sowieso extrem verbessert worden (theoretisch 4x soviele Pixel/Takt verwerfen wie NV3x)

Quasar
2004-05-13, 13:53:39
Welche Diagramme? Die hier im Thread oder von B3D?

robbitop
2004-05-13, 14:27:05
B3D ;)
bzw die Tabellen darunter

Quasar
2004-05-13, 14:38:31
Hm, also GL_ext_reme gibt da 2 bzw. 3 GPix/s für die 6800U an (bei OD von 8 bzw. 3) - ein Einbruch von ca. einem Drittel.

Die X800XT kommt hingegen auf 4 bzw. 3,5 GPix/s, ein Einbruch von nur ~12,5%.

Ich würde insgesamt das HSR der Radeon als effizienter einschätzen.