Schwindelt ATI bei den AA-Füllraten? [Archiv]

Archiv verlassen und diese Seite im Standarddesign anzeigen : Schwindelt ATI bei den AA-Füllraten?

aths

2003-09-03, 20:06:42

Kommen auf offiziellen PDFs (habe leider im Moment nichts zur Hand) nicht AA-Füllratenvergleiche ggü. GF4 Ti? Wenn R300 bzw. R350 nur 2 ROPs pro Pipe haben, sind diese Angaben von ca. 15 Mio AA-Samples dann überhaupt (wenigstens unter Laborbedingungen) erreichbar?

aths

2003-09-04, 15:43:18

*Hüstel*

robbitop

2003-09-05, 00:11:36

ich hätte diesbezüglich eine Frage an dich Aths:

ist die AA Füllrate beim AA mögliche limitierende komponente?

folgende Untersuchung meinerseits:
Radeon9500NonPro 128MB 256bit DDR 4Pipelines
1024
zw 2xAA und 4xx AA gab es bei UT2k3 und 3DMark2001 enorme Einbrüche..zw 30-40%.

Wir alle wissen MSAA ist Bandbreitenlimitierend. Ich also erhöhe nur den Speichertakt...keine signifikante Steigerung des Ergebnisses. Ich erhöhe den Chiptakt und tada es ergibt sich eine nahezu lineare Skallierung. War das hier die AA Füllrate? denn die normale Füllrate kann es im Prinzip nicht sein...

Sorry deine Frage kann ich leider nicht beantworten :(

Quasar

2003-09-05, 00:35:28

Original geschrieben von aths
Kommen auf offiziellen PDFs (habe leider im Moment nichts zur Hand) nicht AA-Füllratenvergleiche ggü. GF4 Ti? Wenn R300 bzw. R350 nur 2 ROPs pro Pipe haben, sind diese Angaben von ca. 15 Mio AA-Samples dann überhaupt (wenigstens unter Laborbedingungen) erreichbar?

Offizielles habe ich dazu nicht, nur einen Reviewers' Guide (edit: gestrichen, setze: Technology White Paper), dort wird der AA-Sample-Fillrate Vergleich gezogen. Wenn man davon ausgeht, dass jede der "8 Pipelines" 6 AA-Samples erzeugen kann, stimmt das rechnerisch ja mit den 15,6 GSamples/s.

Ob allerdings die dazu nötige Pixelfüllrate von 2,6GPix/s mit 1-Pixel-Dreiecken erreicht wird, wage ich zu bezweifeln, da diese zwei Zeilen weiter oben mit 325MTri/s angegeben ist.

Maximal dürften demnach eher 1,95 Milliarden AA-Samples pro Sekunde sein.

Ailuros

2003-09-05, 03:49:46

Maximal dürften demnach eher 1,95 Milliarden AA-Samples pro Sekunde sein.

Woher kommt die Zahl denn her?

8 * 2z * 325 = 5.6GSamples/sec mit 2xAA

6xAA wird durch 3 loops erreicht ergo 3*2xAA.

Hier nochmal R350 Fuellraten mit und ohne AA (vergiss mal die Shader Resultate):

http://www.beyond3d.com/forum/viewtopic.php?t=7486

aths

2003-09-05, 07:19:16

Quasar, wieso 1-Pixel-Dreiecke?

robbitop, bei nur 2 ROPs wären 4x und 6x MSAA durch AA-Füllrate limitiert, falls z.B. bilineares single texturing genutzt würde. Je aufwändiger der Filter, desto weniger Limitierung durch die Zahl der ROPs.

Ailuros

2003-09-05, 07:40:40

R3xx haben 16Z/stencil units, ergo 2 pro pipeline, sonst wuerden sie nicht zu loops gezwungen mit hoeher als 2xAA.

Quasar

2003-09-05, 14:37:00

1-Pixel Dreiecke deshalb, weil wenn jede "Pipeline" 6AA-Samples/Takt erzeugen könnte, wie von ATi nahegelegt, bräuchte man für 15,6G AA-Samples/s rechnerisch 2,6GPix, da ja nur Kantenpixel wg. MSAA mehrfach gesampelt werden.

Und 2,6Mrd. Kantenpixel krieg' ich bei 2,6GPix/s Füllrate nur mit 1-Pixel-Dreiecken hin, oder? (Jetzt mal ab vom HSR).

zeckensack

2003-09-05, 14:50:29

Original geschrieben von Quasar
1-Pixel Dreiecke deshalb, weil wenn jede "Pipeline" 6AA-Samples/Takt erzeugen könnte, wie von ATi nahegelegt, bräuchte man für 15,6G AA-Samples/s rechnerisch 2,6GPix, da ja nur Kantenpixel wg. MSAA mehrfach gesampelt werden.

Und 2,6Mrd. Kantenpixel krieg' ich bei 2,6GPix/s Füllrate nur mit 1-Pixel-Dreiecken hin, oder? (Jetzt mal ab vom HSR). Die Anzahl der erzeugten Samples ist unabhängig von "Kante oder nicht". Anders geht's auch nicht, sonst gäbe es Parhelia-like Probleme mit Schnittkanten.
Nur die erreichbare 'Kompression' ist im Polygon-Inneren besser.

Quasar

2003-09-05, 14:54:41

Original geschrieben von zeckensack
Die Anzahl der erzeugten Samples ist unabhängig von "Kante oder nicht". Anders geht's auch nicht, sonst gäbe es Parhelia-like Probleme mit Schnittkanten.
Nur die erreichbare 'Kompression' ist im Polygon-Inneren besser.

Das wäre dann aber quasi-Supersampling, wenn von jedem Pixel bis zu sechs Samples angefertigt würden, oder?

zeckensack

2003-09-05, 14:58:03

Original geschrieben von Quasar
Das wäre dann aber quasi-Supersampling, wenn von jedem Pixel bis zu sechs Samples angefertigt würden, oder? Nein. Die geschriebenen Samples sind bei MSAA alle gleichfarbig, die Pixelpipe muß daher auch nur einmal durchlaufen werden. Im Polygoninneren liegen in allen Multisample-Buffern die gleichen Farben. An Kanten werden nur die bedeckten Samples rausgeschrieben.

Diese 'überflüssige' Arbeit macht sich wie gesagt dann vorteilhaft bemerkbar, wenn Schnittkanten ins Spiel kommen.

aths

2003-09-05, 18:03:44

Original geschrieben von zeckensack
Nur die erreichbare 'Kompression' ist im Polygon-Inneren besser. Afaik werden Kantenpixel gar nicht "komprimiert". Oder sagt dein Archmark was anderes?

Original geschrieben von Quasar
Das wäre dann aber quasi-Supersampling, wenn von jedem Pixel bis zu sechs Samples angefertigt würden, oder? ??? ??? ??? MSAA erzeugt, Kantenpixel oder nicht, so viele Subpixel wie die Stufe angibt, aber pro Polygon was das Pixel bedeckt ein Subtexel.

zeckensack

2003-09-05, 18:58:28

Original geschrieben von aths
Afaik werden Kantenpixel gar nicht "komprimiert". Oder sagt dein Archmark was anderes?Momentan nicht. Aber denkbar wär's.
Dazu bräuchte man aber dann wirklich Kompression, und nicht nur - wie aktuell - ein Bit das sagt "wir sind alle gleich".