PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : S3-Artikel-Fragen


eXodia
2005-11-25, 12:49:56
Hi @ all

Ich verstehe das (http://www.3dcenter.org/artikel/s3_nov2005/index2.php) irgendwie nicht richtig.

Wird da OG verwendet?Die Graka (oder der Treiber :confused: ) drehen dann das Bild so das da automatisch RG draus wird. Dadurch werden doch die Subpixel extrem weit "an den Rand" getrieben, was dann dem RG-Effekt auch nicht grade hilft.

Zumahl das ganze doch bestimmt extrem Leistung zieht, oder?

THX, Greetz

robbitop
2005-11-25, 13:02:10
Hi @ all

Ich verstehe das (http://www.3dcenter.org/artikel/s3_nov2005/index2.php) irgendwie nicht richtig.

Wird da OG verwendet?Die Graka (oder der Treiber :confused: ) drehen dann das Bild so das da automatisch RG draus wird. Dadurch werden doch die Subpixel extrem weit "an den Rand" getrieben, was dann dem RG-Effekt auch nicht grade hilft.

Zumahl das ganze doch bestimmt extrem Leistung zieht, oder?

THX, Greetz
Die Glättung geschieht ja VOR dem Drehen.
Erst wird geometrisch gedreht, dann mit 2xOG gerendert und dann wird das Bild ausgeschnitten und gedreht. Dabei ändert sich nichts am Subpixel.
Und da die Kanten im anderen Winkel mit OG gerendert wurden, sind beide Values pro Pixel höchsstwahrscheinlich viel "besser" als sie es ohne Drehung wären. Also ein Quasi-RG.

Kostet natürlich Leistung, etwas mehr als Normales 2xOGSS. Der Verschnitt möchte ja auch mitgerendert werden. Im DC Artikel findest du IIRC einzelne Benches mit 2xSSAA.

Coda
2005-11-25, 15:35:51
robbitop das klingt ja durchaus alles logisch, aber das 5x "ordered grid" verbraucht so auch nicht weniger Logik als ein sparsed-grid, da sich das Muster nicht durch Skalieren erzeugen lässt. Man braucht also wie man es dreht und wendet spezielle ROPs und wieso sollte man dort dann nur solche (auch komplexen) Muster benützen und nicht gleich sparsed?

Mr. Lolman
2005-11-25, 15:55:19
Man könnte zuerst 4xOG rechnen und die 4 Samples mit dem einen von noAA überblenden. :upara:

Coda
2005-11-25, 15:58:35
Warum gibt es dann keinen 4x Modus?

Mr. Lolman
2005-11-25, 16:05:52
Warum gibt es dann keinen 4x Modus?

Gute Frage :biggrin:

Vll. braucht die Rückdrehung per Pixelshader so viel Rechenleistung, dass man bei kaum schlechterer Performance noch 25% mehr Füllrate verblasen kann (Das noAA Bild müsste ja nichtmal gedreht gerendert werden)

Coda
2005-11-25, 16:10:26
Die "Rückdrehung" (die imho nicht stattfindet) würde ja nach dem fertigberechneten Bild passieren, man kann also keinen Bottleneck ausnützen.

Überhaupt: Wenn ich nur ordered-grid hätte würde ich lieber das anbieten anstatt so nen Nonsense zu machen.

Ailuros
2005-11-25, 16:16:45
Warum gibt es dann keinen 4x Modus?

Ich kann mich noch an geplantes 16xMSAA vor der Veroeffentlichung erinnern; vielleicht war es eben nur eine Implementierung der letzten Minute um die GPUs nicht ganz ohne FSAA zu veroeffentlichen.

Wenn robbi schon sagt dass 2xRGSS etwas mehr Leistung als 2xOGSS kostet, waere 4xRGSS Leistung theoretisch um einiges schlechter.

StefanV2
2005-11-25, 16:16:55
Die Glättung geschieht ja VOR dem Drehen.
Erst wird geometrisch gedreht, dann mit 2xOG gerendert und dann wird das Bild ausgeschnitten und gedreht. Dabei ändert sich nichts am Subpixel.
Und da die Kanten im anderen Winkel mit OG gerendert wurden, sind beide Values pro Pixel höchsstwahrscheinlich viel "besser" als sie es ohne Drehung wären. Also ein Quasi-RG.

Kostet natürlich Leistung, etwas mehr als Normales 2xOGSS. Der Verschnitt möchte ja auch mitgerendert werden. Im DC Artikel findest du IIRC einzelne Benches mit 2xSSAA.
Öhm, also wenn das wirklich so geht, wie du behauptest, dann ists ja schon fast 'nen perpetuummobile oder aber man haut massig irgendwelche Transistoren raus, damit der shit so einigermaßen performant wird und man nicht bei jeder Situation die Leistung in SPF messen muss :ugly:

Coda
2005-11-25, 16:19:07
Ich kann mich noch an geplantes 16xMSAA vor der Veroeffentlichung erinnern; vielleicht war es eben nur eine Implementierung der letzten Minute um die GPUs nicht ganz ohne FSAA zu veroeffentlichen."in der letzten Minute" implementiert man sicher kein solches 5xAA Muster, egal ob gedreht oder nicht.

Wenn robbi schon sagt dass 2xRGSS etwas mehr Leistung als 2xOGSS kostet, waere 4xRGSS Leistung theoretisch um einiges schlechter.Was möchstest du mir damit sagen?

Mr. Lolman
2005-11-25, 16:19:18
Die "Rückdrehung" (die imho nicht stattfindet) würde ja nach dem fertigberechneten Bild passieren, man kann also keinen Bottleneck ausnützen.

Kann man nicht das 4xOG Bild im Pixelshader rückdrehen, buffern und währenddessen das noAA Bild durch die Pipe schicken um dieses dann abermals im Pixelshader mit dem zuvor gebufferten verrechnen?

Der Mehraufwand wär die zusätzlich notwendige Überblendung. Wenn die aber weniger als 25% Performance kostet lohnt sich das zusätzliche Sample schon wieder. Außerdem vermeidet man damit gleichzeitig auch, gegen andere Hersteller gebencht zu werden, deren AA ohnehin viel schneller ist.

Dementsprechend sollte man auf den Chromechips den Performanceunterscheid zw. 2xOG und 2xRG benchen...

Coda
2005-11-25, 16:20:38
Kann man nicht das 4xOG Bild im Pixelshader rückdrehen, buffern und währenddessen das noAA Bild durch die Pipe schicken um dieses dann abermals im Pixelshader mit dem zuvor gebufferten verrechnen?Nein. Die Begründung dafür ist mir jetzt zu technisch.

Ailuros
2005-11-25, 16:20:52
Die "Rückdrehung" (die imho nicht stattfindet) würde ja nach dem fertigberechneten Bild passieren, man kann also keinen Bottleneck ausnützen.

Überhaupt: Wenn ich nur ordered-grid hätte würde ich lieber das anbieten anstatt so nen Nonsense zu machen.

Ich wuerde viel lieber wissen was genau schief ging und sie ueberhaupt kein Multisampling jeglicher Art anbieten konnten. 16x samples sind ja erst mal verdammt viel fuer die geplante Bandbreite und Speichermenge. Bei 4xMSAA pro Takt ergo 4 Takte fuer 16x wuerde das Ganze ja noch halbwegs gehen; waren es aber 2x samples/clk....au weia...

Mr. Lolman
2005-11-25, 16:21:22
IWenn robbi schon sagt dass 2xRGSS etwas mehr Leistung als 2xOGSS kostet, waere 4xRGSS Leistung theoretisch um einiges schlechter.

Wieso? Eher wärs besser, weil man das Bild nicht so stark drehen muss.(wobei das imo vernachlässigbar ist)

Coda
2005-11-25, 16:21:40
Ich wuerde viel lieber wissen was genau schief ging und sie ueberhaupt kein Multisampling jeglicher Art anbieten konnten.Darum geht es mir doch gar nicht. Ich sage nur das diese Theorie Quatsch mit Soße ist (will keinem zu Nahe treten).

Mr. Lolman
2005-11-25, 16:21:56
Nein. Die Begründung dafür ist mir jetzt zu technisch.

Ich wills wissen. Bitte =)

Ailuros
2005-11-25, 16:23:44
"in der letzten Minute" implementiert man sicher kein solches 5xAA Muster, egal ob gedreht oder nicht.

Letzte Minute ist eher relativ zu der Zeitspanne zwischen Paper-Launch und finaler Veroeffentlichung.

Was möchstest du mir damit sagen?

Da die Leistung von 2xRGSS niedriger als 2xOGSS zu sein scheint, waere 4xRGSS noch um einiges schlimmer als stinknormales 4xOGSS.

Coda
2005-11-25, 16:25:10
Ich wills wissen. Bitte Es gibt für Pixelshader keinen Zwischenspeicher der über mehrere Polygone verwaltet wird. Er "sieht" zu jeder Zeit nur seinen Texturen und interpolierten Vertex-Inputs, der Output wird fest an die vorgesehene Stelle im Framebuffer geschrieben. Es gibt keine weitere Ausgabemöglichkeit.

Ailuros
2005-11-25, 16:25:12
Darum geht es mir doch gar nicht. Ich sage nur das diese Theorie Quatsch mit Soße ist (will keinem zu Nahe treten).

Welche These genau? Dass sie original fuer Multisampling geplant hatten oder was?

Coda
2005-11-25, 16:25:56
Nein, dass das 5xAA so wie im Artikel dargestellt erzeugt wird.

Ailuros
2005-11-25, 16:29:18
Nein, dass das 5xAA so wie im Artikel dargestellt erzeugt wird.

Dazu kann ich mich nicht aeussern. Ich wuerde denken dass robbi sich mit S3 in Kontakt gesetzt haben koennte; da kommt es darauf an ob er eine eindeutige Antwort bekommen hat oder nicht.

Coda
2005-11-25, 16:30:43
Wenn es wirklich so ist wie es im Artikel steht ist S3 irgendwie doof, oder ich sehe nur die guten Gründe dafür nicht. Dazu kommt warum man dann nicht 4xAA anbietet, etc.

Niemand würde zuerst so ein schlechtes sparsed-grid implementieren um es dann mit so ner Methode noch zu rotieren, wenn man die Transistoren dafür eh verbrauchen muss.

Ailuros
2005-11-25, 16:35:33
Wenn es wirklich so ist wie es im Artikel steht ist S3 irgendwie doof, oder ich sehe nur die guten Gründe dafür nicht. Dazu kommt warum man dann nicht 4xAA anbietet, etc.

Niemand würde zuerst so ein schlechtes sparsed-grid implementieren um es dann mit so ner Methode noch zu rotieren, wenn man die Transistoren dafür eh verbrauchen muss.

http://www.3dcenter.de/artikel/s3_nov2005/index2.php

Schau Dir mal den Treiberbug hier und das entsprechende Muster an:

http://www.3dcenter.de/images/s3_nov2005/s3_aa_bug_small.jpg

Es gibt zu vieles das hier merkwuerdig ist. So einfach schleicht sich ein solcher "bug" auch nicht in einen Treiber IMO; sieht eher nach sehr merkwuerdigen Experimenten mit fehlerhaften Resultaten aus.

Mr. Lolman
2005-11-25, 16:41:42
Es gibt für Pixelshader keinen Zwischenspeicher der über mehrere Polygone verwaltet wird. Er "sieht" zu jeder Zeit nur seinen Texturen und interpolierten Vertex-Inputs, der Output wird fest an die vorgesehene Stelle im Framebuffer geschrieben. Es gibt keine weitere Ausgabemöglichkeit.

Man könnt das komplett fertig berechnete 4xRGAA-Bild ja im Framebuffer speichern und von dort wieder auslesen, oder?

robbitop
2005-11-25, 17:10:41
robbitop das klingt ja durchaus alles logisch, aber das 5x "ordered grid" verbraucht so auch nicht weniger Logik als ein sparsed-grid, da sich das Muster nicht durch Skalieren erzeugen lässt. Man braucht also wie man es dreht und wendet spezielle ROPs und wieso sollte man dort dann nur solche (auch komplexen) Muster benützen und nicht gleich sparsed?
Das ist mir leider unbekannt. Möglicherweise ist es gar kein 5x AA sondern nur ein 4xAA. S3 nennt es so und B3D auch. Der Sampletester zeigt jedoch 5 Samples an aber der ist manchmal auch nicht ganz akurat.

robbitop
2005-11-25, 17:11:33
Die "Rückdrehung" (die imho nicht stattfindet) würde ja nach dem fertigberechneten Bild passieren, man kann also keinen Bottleneck ausnützen.

Überhaupt: Wenn ich nur ordered-grid hätte würde ich lieber das anbieten anstatt so nen Nonsense zu machen.
Die Glättung ist in der Praxis allerdings RG like zu normalen SSAA Preisen.

Mr. Lolman
2005-11-25, 17:30:46
Das ist mir leider unbekannt. Möglicherweise ist es gar kein 5x AA sondern nur ein 4xAA. S3 nennt es so und B3D auch. Der Sampletester zeigt jedoch 5 Samples an aber der ist manchmal auch nicht ganz akurat.

Na das kann man ja leicht nachprüfen obs 5xAA ist. Gibts 3 oder 4 Zwischenstufen?

Coda
2005-11-25, 17:47:43
Man könnt das komplett fertig berechnete 4xRGAA-Bild ja im Framebuffer speichern und von dort wieder auslesen, oder?Selbst wenn ergäbe es einfach keinen Sinn. Ja man könnte zuerst ein 4xOGSS Bild berechnen und danach noch ein normales und diese mischen, aber auch so würde man aber den 5. Sample nicht umsonst bekommen (im Gegenteil, man müsste die ganze Vertexarbeit nochmal machen). Außerdem sieht es auf dem Muster nicht so aus, als wären die 4 äußeren Samples ein normales skaliertes OGSS (zu weit weg vom Mittelpunkt).

Die Glättung ist in der Praxis allerdings RG like zu normalen SSAA Preisen.Das hat doch nichts mit dem Muster zu tun. jedes 5xSSAA ist theoretisch gleich teuer.

Es gibt noch die Variante dass S3 5 Buffer alloziert und das Bild 5x leicht verschoben rendert, damit lassen sich manche Sachen auch erklären.

Mr. Lolman
2005-11-25, 18:37:52
Es gibt noch die Variante dass S3 5 Buffer alloziert und das Bild 5x leicht verschoben rendert, damit lassen sich manche Sachen auch erklären.

Nur nicht, warum kein 3x oder 4xAA angeboten wird...

Coda
2005-11-25, 18:44:59
Richtig, das erklärt aber Robbis genauso wenig.

aths
2005-11-26, 18:18:05
http://www.3dcenter.de/artikel/s3_nov2005/index2.php

Schau Dir mal den Treiberbug hier und das entsprechende Muster an:

http://www.3dcenter.de/images/s3_nov2005/s3_aa_bug_small.jpg

Es gibt zu vieles das hier merkwuerdig ist. So einfach schleicht sich ein solcher "bug" auch nicht in einen Treiber IMO; sieht eher nach sehr merkwuerdigen Experimenten mit fehlerhaften Resultaten aus.Ich brauche mal die vollen Screenshots vom Subpixel-Tester, nicht nur die Maske die er anzeigt.

aths
2005-12-03, 07:42:38
... Solche Screenshots bräuchte ich wirklich :)

robbitop
2005-12-03, 10:23:48
... Solche Screenshots bräuchte ich wirklich :)
Bei mir wird das ne Zeit lang schwer, da der Delta Chrome in Rostock liegt und ich in Stralsund bin. Das wird sich ne Weile nicht ändern (mangels Zeit wg Prüfungen). Ich frage mal jmd ob er das für mich machen kann.

BlackArchon
2005-12-03, 10:47:32
Ich hab meine Deltachrome noch hier. Was soll ich tun?