PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : @Thilo: Frage zum DC-AA


MadManniMan
2004-01-07, 13:19:58
...in eurer aktuellen Ausgabe schreibt ihr etwas von "2X SSAA(also 2X horizontal und 2X vertikal), was andere 4X AA nennen".

:| :cop: BAHNHOF :cop: ?-)

Was heißt das denn nun bitte? 2*RGSS oder 4*OGSS?


Und falls der liebe Thilo hier nicht vorbeihuscht(btw: schön bekloppte Interviews mit nV und ATi - ich sach dazu nischt mehr...), dann darf auch gern wer anders antworten!


Grützi, euchs Manni



/edit: ich vermute einfach mal 2*RG, da ihr auch was von 40% Leistungsverlust schreibt

Mackg
2004-01-07, 14:37:27
was hat denn bitte rgaa mit leistungsverlust zu tun?
Nach der Beschreibung 2x vertikal +2x horizontal würde ich mal auf ganz normales 4 ogssaa tippen, womit man auch gleich noch 2AF hinterhergeschmissen bekommt...

StefanV
2004-01-07, 14:40:46
Original geschrieben von Mackg
was hat denn bitte rgaa mit leistungsverlust zu tun?
Nach der Beschreibung 2x vertikal +2x horizontal würde ich mal auf ganz normales 4 ogssaa tippen, womit man auch gleich noch 2AF hinterhergeschmissen bekommt...

Ganz einfach:

Wenns SSAA ist, dann geht bei 2x schon die hälfte der Füllrate drauf, bei 4x ists doppelt so viel.

Bleiben demnach noch 25% über oder aber 2 Pipes, je nach dem, wie mans nimmt...

Hm...

Andererseits könntest du auch Recht haben, da der DC teilweise enorm Bandbreitenlimitiert ist...

Ailuros
2004-01-07, 15:06:20
...in eurer aktuellen Ausgabe schreibt ihr etwas von "2X SSAA(also 2X horizontal und 2X vertikal), was andere 4X AA nennen".

Ich kann zwar nicht genau wissen was Thilo meinte, aber mit dem obrigen kann nur das folgende gemeint sein:

http://www.forum-hardtecs4u.com/3dcenter/images/anti-aliasing-masken/ogrg2.gif

2x sparse (oder rotated) ergibt einen 2*2 grid (x=2,y=2).

***edit: ooops natuerlich ist das rechte Bildchen gemeint.

PCGH_Thilo
2004-01-07, 15:06:28
Original geschrieben von MadManniMan
...in eurer aktuellen Ausgabe schreibt ihr etwas von "2X SSAA(also 2X horizontal und 2X vertikal), was andere 4X AA nennen".

:| :cop: BAHNHOF :cop: ?-)

Was heißt das denn nun bitte? 2*RGSS oder 4*OGSS?


Und falls der liebe Thilo hier nicht vorbeihuscht(btw: schön bekloppte Interviews mit nV und ATi - ich sach dazu nischt mehr...), dann darf auch gern wer anders antworten!


Grützi, euchs Manni



/edit: ich vermute einfach mal 2*RG, da ihr auch was von 40% Leistungsverlust schreibt

in der eile der ganzen prozedur (dc-test, heftabgabe vor weihnachten) haben es leider nicht mehr alle infos ins heft geschafft ;-)

nach analyse mit demi ist es doch "nur" 2x RG. 4x OG sieht etwas anders aus.

Ailuros
2004-01-07, 15:08:23
2x sparse ist gut genug fuer einen mainstream Teil; wenn nur die bekloppte Aufloesungs-Limitierung nicht waere....

Gast
2004-01-07, 15:28:55
ist mit dem YxSS nicht wie bei MS die anzahl der subpixel gemeint?

die x-fach höhere auflösung wär doch dann das EER oder?

StefanV
2004-01-07, 15:33:22
Original geschrieben von Gast
ist mit dem YxSS nicht wie bei MS die anzahl der subpixel gemeint?

die x-fach höhere auflösung wär doch dann das EER oder?

Lies dir mal jenes (http://3dcenter.de/artikel/anti-aliasing/) durch und schau dir auch noch andere Anti Aliasing Artikel dieser Seite an.

robbitop
2004-01-07, 18:26:36
Supersampling AA hat erst bei 8x einen 2xAF ähnlichen Effekt.
Mit 2x2 ist hier das EER gemeint. 2xRG glättet 2x horizontal und 2x vertikal. Dazu braucht OG 4 Samples..

Nunja angeblich soll der DC Hardwareseitig sogar 4xAA können auch RG. Aber das sollte nicht mehr wirklich nutzbar sein in der Praxis, wobei ich schon daran zweifle ob 2xRGSSAA durchgängig nutzbar ist...

schade, daß MSAA wohl nich ins Transistorbudge passte. Naja für nen Refresh ist jedenfalls viel luft :)
Man könnte recht einfach aus diesem Chip für den REFRESH mehr leistung bekommen:
für die HighEnd Variante 256bit und weiterhin 300Mhz oder einfach den Takt etwas erhöhen auf 400-450Mhz.
Selbiges mit dem Chiptakt.
Evl An den PS ein wenig herrumschrauben
ein X-Bar Controller dazu tun

Xmas
2004-01-07, 18:32:41
Original geschrieben von robbitop
Supersampling AA hat erst bei 8x einen 2xAF ähnlichen Effekt.
Nein, bei 4x (bzw. 2x2, denn nur bei OG hat man optimale Sample-Abstände)

Xmas
2004-01-07, 18:35:03
Achja, zum Topic: Welche "anderen" nennen 2xAA 4xAA?

dead
2004-01-07, 18:47:26
ohne allzusehr in MMMs Gehirn herumzuwühlen, ich habe ihn so verstanden das bspw nV 'damals' (GF2) 4xOGAA als 4x im Treiber bezeichnete, was aber keine besseren Resultate als das, auch im Treiber so bezeichnete, 2x (RGAA) von 3Dfx bot.

PCGH_Thilo
2004-01-07, 18:55:13
Original geschrieben von dead
ohne allzusehr in MMMs Gehirn herumzuwühlen, ich habe ihn so verstanden das bspw nV 'damals' (GF2) 4xOGAA als 4x im Treiber bezeichnete, was aber keine besseren Resultate als das, auch im Treiber so bezeichnete, 2x (RGAA) von 3Dfx bot.

so könnte man es auslegen, aber nein. die aussage geht vor der annahme aus, es sei wirklich 2x2 und wird nur als 2x bezeichnet.

allerdings scheint man bei s3 selbst nicht genau zu wissen, was der DC macht. der verantwortliche PM hat mir brief und siegel darauf gegeben, der DC mache 2x2 rotated grid! was er aber definitiv nicht macht.

dead
2004-01-07, 19:08:54
Steht PM für Program Manager? Der muß von der Technik ja auch nichts wissen :D

Mein Posting bezog sich auf Xmas Topic-Frage, ich bin eigentlich recht optimistisch das sich mittlerweile die Treiberangaben auf die tatsächliche Glättung in x + y beziehen.

Ailuros
2004-01-08, 03:05:55
Original geschrieben von dead
ohne allzusehr in MMMs Gehirn herumzuwühlen, ich habe ihn so verstanden das bspw nV 'damals' (GF2) 4xOGAA als 4x im Treiber bezeichnete, was aber keine besseren Resultate als das, auch im Treiber so bezeichnete, 2x (RGAA) von 3Dfx bot.

Sampling Methode ist irrelevant zu der Anzahl von samples. 4x samples SIND 4x samples, egal ob es sich um ordered, rotated, sparse etc grid handelt.

Der idealste Fall fuer derartige sampling Methoden ist fuer N Anzahl von Samples einen N*N wertigen grid zu haben. Trotz allem ist es falsch 2x sparse als 4xAA (nur wegen des 2*2 grids) zu bezeichnen, egal wie hoch die reale Effizienz der Implementation ist.

Uebrigens - egal ob es sich um MS oder SSAA handelt - liegt 4x ordered grid eine kleine Stufe hoeher als 2x sparse grid. In etwa so:

2x sparse < 4x ordered << 4x sparse

Ja 4xOG liegt verdammt nahe an 2x sparse und macht tatsaechlich wenig Sinn es anzuwenden wenn HW beide Alternativen bietet, das heisst aber nicht das 2x sparse von jeder Ansicht an besser ist; effizienter ja.

Ailuros
2004-01-08, 03:14:57
...der DC mache 2x2 rotated grid! was er aber definitiv nicht macht.

Wenn die Original-Aussage nur auf den grid konzentriert war, dann ist es wohl nicht falsch, oder hab ich hier was nicht verstanden?

2*2 grid kann entweder 2xRG oder 4xOG sein; ordered grid hat nun mal den grossen Nachteil dass Sample-Positionen in x und y Richtung auf der gleichen Ebene liegen.

Ich entschuldige mich im voraus aber das Ganze hoert sich zu verwirrend an. Ich versuche es mal so; eine Aussage der folgenden Art:

a) DC kann 4x sample AA equivalent rendern = falsch
b) DC kann 4xOGSS equivalent rendern = halbwegs akzeptabel.

PCGH_Thilo
2004-01-08, 08:28:21
Original geschrieben von Ailuros
Wenn die Original-Aussage nur auf den grid konzentriert war, dann ist es wohl nicht falsch, oder hab ich hier was nicht verstanden?

2*2 grid kann entweder 2xRG oder 4xOG sein; ordered grid hat nun mal den grossen Nachteil dass Sample-Positionen in x und y Richtung auf der gleichen Ebene liegen.

Ich entschuldige mich im voraus aber das Ganze hoert sich zu verwirrend an. Ich versuche es mal so; eine Aussage der folgenden Art:

a) DC kann 4x sample AA equivalent rendern = falsch
b) DC kann 4xOGSS equivalent rendern = halbwegs akzeptabel.

die originalaussage =)

Our 2x AA is actually 2x in X and 2x in Y, so it’s a 4 sample rotated supersample.

jetzt darfst du wieder ;-)

robbitop
2004-01-08, 10:37:39
hört sich für mich stark nach PR Aussage an.
Denn das EER von 2xRG ist in der Tat 2x2 (x und y Achse) und somit ist es annähernd äquivalent zum 4x OGAA.
Denn ab 4xOG werden erst beide richtugnen 2-Fach geglättet.

Vieleicht kann der DC nur 2xRGSS (mehr braucht er eigendlich nicht)und man nennt es aufgrund der Werbewirksamkeit dann 4xAA da das EER ja so ähnlich ist.

Sorry für die Redundanz

just my 2cents

Gast
2004-01-08, 10:52:49
Original geschrieben von Ailuros
Sampling Methode ist irrelevant zu der Anzahl von samples. 4x samples SIND 4x samples, egal ob es sich um ordered, rotated, sparse etc grid handelt.
[...]


Technisch betrachtet!

Leider ist, vom sichtbaren Ergebnis her, 4x AA nicht gleich 4x AA genausowenig wie 8x AF = 8x AF ist.
Für das Marketing der Hersteller sind diese details allerdings ja relativ unerheblich; jedenfalls für gerade den Hersteller der das jeweils qalitativ schlechtere Ergebnis bietet.

Die Aussage von S3 interpretiere ich als 2x RGSSAA (wobei die Angaben für sich nicht zusammenpassen).
Aber abwarten bis jemand den DC vernünftig testen darf/kann. Schade das PCGHW dafür nicht genügend Zeit bekam.

dead
2004-01-08, 10:54:49
grrrrr...
Falscher Browser, noch keine neuen Kekse gesetzt.
Der Gast war ich...

MadManniMan
2004-01-08, 12:58:45
Danke für die Antworten, zumindest besitzt der Chip 2*RGSS, was zusammen mit den Tri-Pipes (warum nur in D3D) ein richtig schönes Argument für den Chip ist :bounce:

Aber Thilo, mich verwundert, daß du von 4*OG ausgegangen bist, wenn dabei der genannte Performanceabfall nur 40% betrug? Sicherlich ist das Gerät vorrangig Bandbreitenbegrenzt, aber dennoch zieht SS vor allem Füllrate, Füllrate und nochmal Füllrate. 2.400MPixel sind dabei nicht allzu viel...

BTW: hast Dich nicht auch über die scheiß PR-Antworten von ATi und nV bezüglich des AF-Optimierens geärgert?

Gast
2004-01-08, 13:16:30
Original geschrieben von MadManniMan
Danke für die Antworten, zumindest besitzt der Chip 2*RGSS, was zusammen mit den Tri-Pipes (warum nur in D3D) ein richtig schönes Argument für den Chip ist :bounce:



Das ist eher ein Argument gegen den Chip weil unbrauchbar langsam. Uralte Technik halt. Und dann noch diese Aufloesungslimitierung......nene... vielleicht wird's beim naechsten Versauch ja was mit S3 und AA.

MadManniMan
2004-01-08, 13:43:26
Original geschrieben von Gast
Das ist eher ein Argument gegen den Chip weil unbrauchbar langsam. Uralte Technik halt.

:ratlos: Meinungssache. Wenn ich mein 4*RGMS gegen 2*RGSS tauschen könnte, würd ich es sofort tun.

Original geschrieben von Gast
Und dann noch diese Aufloesungslimitierung......nene... vielleicht wird's beim naechsten Versauch ja was mit S3 und AA.

Was eigentlich für ne Auflösungsbegrenzung?
Und ja, der nächste Versuch könnte heftig besser werden :) Im Grunde fehlts dem Chip momentan vorangig an effektiverer Bandbreitennutzung und optimierterem Treiber. Letzteres können wir nur erhoffen, ersteres kann mit einer "neuen Revision" mit X-Bar schon ordentlich Vorschub bekommen.

Gast
2004-01-08, 13:48:17
Original geschrieben von MadManniMan
:ratlos: Meinungssache. Wenn ich mein 4*RGMS gegen 2*RGSS tauschen könnte, würd ich es sofort tun.


Aus welchem Grund?
Weniger Leistung UND schlechtere Kantenglaettung. Wozu soll das nuetzlich sein?


Was eigentlich für ne Auflösungsbegrenzung?
Und ja, der nächste Versuch könnte heftig besser werden :) Im Grunde fehlts dem Chip momentan vorangig an effektiverer Bandbreitennutzung und optimierterem Treiber. Letzteres können wir nur erhoffen, ersteres kann mit einer "neuen Revision" mit X-Bar schon ordentlich Vorschub bekommen.

AFAIK funzt das AA des DC nur bis zu einer Aufloesung von 1024x768 (oder waren es 1280x1024 ?:kratz:).

StefanV
2004-01-08, 13:50:34
Original geschrieben von Gast
Aus welchem Grund?
Weniger Leistung UND schlechtere Kantenglaettung. Wozu soll das nuetzlich sein?


Dafür aber auch geglättete Texturen und Alpha Test Dingens...

Original geschrieben von Gast
AFAIK funzt das AA des DC nur bis zu einer Aufloesung von 1024x768 (oder waren es 1280x1024 ?:kratz:).

Hm, vermuten würd ich an dieser Stelle eher 1280x1024...
Werds aber wohl in 1-2 Monaten genauer sagen können, da der DC fest eingeplant ist ;D

MadManniMan
2004-01-08, 13:53:16
Original geschrieben von Stefan Payne
Dafür aber auch geglättete Texturen und Alpha Test Dingens...

+ Gesamtoversampling -> ruhigeres Bild in allen Lebenslagen

Original geschrieben von Stefan Payne
Hm, vermuten würd ich an dieser Stelle eher 1280x1024...
Werds aber wohl in 1-2 Monaten genauer sagen können, da der DC fest eingeplant ist ;D

1280 wäre schon nett, 1024 ... nee! :(


(Oha, die Spätschicht ruft!)

Tesseract
2004-01-08, 14:05:03
Original geschrieben von MadManniMan
:ratlos: Meinungssache. Wenn ich mein 4*RGMS gegen 2*RGSS tauschen könnte, würd ich es sofort tun.

wenn du einen CRT hast könntest du es mal mit 2xRGMS und höherer auflösung probieren

PCGH_Thilo
2004-01-08, 15:00:29
Original geschrieben von MadManniMan
BTW: hast Dich nicht auch über die scheiß PR-Antworten von ATi und nV bezüglich des AF-Optimierens geärgert?

OT: Bei einem Interview muss man immer davon ausgehen, dass manche Antworten vielleicht nicht den Detailgrad an "hose-runterlassen" haben, den man selbst gerne hätte ;-)

ganz ehrlich: ich bin froh, dass hier überhaupt antworten kamen (hätte ich gar nicht erwartet).

Ailuros
2004-01-08, 15:56:09
Original geschrieben von Gast
Technisch betrachtet!

Leider ist, vom sichtbaren Ergebnis her, 4x AA nicht gleich 4x AA genausowenig wie 8x AF = 8x AF ist.
Für das Marketing der Hersteller sind diese details allerdings ja relativ unerheblich; jedenfalls für gerade den Hersteller der das jeweils qalitativ schlechtere Ergebnis bietet.

Die Aussage von S3 interpretiere ich als 2x RGSSAA (wobei die Angaben für sich nicht zusammenpassen).
Aber abwarten bis jemand den DC vernünftig testen darf/kann. Schade das PCGHW dafür nicht genügend Zeit bekam.

Implementation ist eher eine Qualitaet's als Quantitaet's-Angelegenheit.

4x MSAA Leistung-Einbrueche zwischen NV und ATI sind im Durchschnitt und in der Mehrzahl der Faelle auf etwa gleichem Niveau.

Anisotropy ist ein ganz anderes Kapitel was heutige Implementationen betrifft, da Adaptivitaet einen ganz anderen Sinn bei jeglicher Methode hat. Zeitige anti-aliasing Methoden sind keineswegs adaptive.

Thilo hat sich ja den originalen Kommentar gepostet (siehe naechster post)...

Ailuros
2004-01-08, 16:02:34
Original geschrieben von PCGH_Thilo
die originalaussage =)

Our 2x AA is actually 2x in X and 2x in Y, so it’s a 4 sample rotated supersample.

jetzt darfst du wieder ;-)

Also ist es 2x sparse sampled Super sampling und die obrige Aussage gehoert wohl zum bloedesten Marketing-Geblubber der letzten Zeit.

Ich haette ein Auge zugedrueckt, waere die Aussage wie folgendes gewesen:

Our 2x AA is actually 2x in X and 2x in Y, so it’s 4x ordered grid supersampling equivalent.

Ich weiss es klingt nach Haarspalterei, aber man muss nicht zu solchen Uebertreibungen heutzutage resultieren. Das Publikum weiss in seiner Mehrzahl was die Vorteile von sparse/rotated gegen (garden variety :D ) ordered grid eigentlich sind.

Ailuros
2004-01-09, 03:21:38
Original geschrieben von Stefan Payne
Dafür aber auch geglättete Texturen und Alpha Test Dingens...



Hm, vermuten würd ich an dieser Stelle eher 1280x1024...
Werds aber wohl in 1-2 Monaten genauer sagen können, da der DC fest eingeplant ist ;D

AFAIK ist die zeitige Limitierung bei 1024*768. Mit der Ausnahme von alphas, verschwindet der obrige Punkt ueber Texturen-"Glaettung" schnell, wenn man zu 2xRGSS@1024 gleich 2xRGMS/8xAF@1600 hingegensetzt.

Natuerlich kann man beim DC SSAA gleich mit AF kombinieren und dabei sehr gute Texturenqualitaet und LOD Werte ohne groessere aliasing Effekte erreichen, aber nicht zu dem Grad dass das obrige scenario ueberrennen wuerde. Textur-Filterung die mehr oder weniger zu 2xAF equivalent ist, erreicht man nur mit 4x sample SSAA.

Leistung duerfte kein Problem sein in ein paar Ausnahmen wie dem sehr CPU limitierten FS2002 (oder FS2004 = FS2002+extra Wolken :D ). Aber in dem spezifischen Spiel konnte ich selbst mit der NV25 noch 8xS (4*4) mit 8xAF in 1024*768 kombinieren.

Summa summarum: wenn DC einen Vorteil hat beim Thema FSAA, dann eher im Vergleich zu Volari als Beispiel.

Gast
2004-01-09, 20:12:04
"wenn DC einen Vorteil hat beim Thema FSAA, dann eher im Vergleich zu Volari als Beispiel."

Falsch! Quatsch!
Volari nutzt auch RGSS 2x...

Demirug
2004-01-09, 20:17:15
Original geschrieben von Gast
"wenn DC einen Vorteil hat beim Thema FSAA, dann eher im Vergleich zu Volari als Beispiel."

Falsch! Quatsch!
Volari nutzt auch RGSS 2x...

Ich weiss nicht. Für mich sah das 2xAA und 4xAA beim Volari einfach nur verblurt aus.

robbitop
2004-01-09, 20:19:28
2xOGSSAA beherrscht der Volari kein RG

dort wird nur eine Ebene geglättet nicht 2.

Man kann sagen was man will der Volari ist ein aufgebohrter Xabre -> ineffizient und in gewissen Belangen einfach nur veraltet..SiS Entwicklung eben...man wird erst in ein paar Jahren sehen, was XGI draufhat und bis dahin haben sie einiges Nachzuholen.

Der DC scheint primär für den Mobilen und integrierten Betrieb konzipiert zu sein. Vergleiche zu High End Geschossen sind in Punkto Preis und Zielsetzung somit völlig sinnfrei :)

Ailuros
2004-01-10, 03:33:46
Original geschrieben von Gast
"wenn DC einen Vorteil hat beim Thema FSAA, dann eher im Vergleich zu Volari als Beispiel."

Falsch! Quatsch!
Volari nutzt auch RGSS 2x...

Traeum weiter ;D

aths
2004-01-10, 12:15:54
Original geschrieben von MadManniMan
/edit: ich vermute einfach mal 2*RG, da ihr auch was von 40% Leistungsverlust schreibt Der Leistungs-Aspekt ist schon mal ein guter Ansatzpunkt :)
Original geschrieben von Ailuros
2x sparse ist gut genug fuer einen mainstream Teil; wenn nur die bekloppte Aufloesungs-Limitierung nicht waere.... Jo. Um MSAA vernünftig zu machen, ist bekanntlich einiger Aufwand erforderlich. GeForce3 z. B. kann bei 2x RGMSAA immerhin bis zu 40% Leistung einbüßen, GeForce4 Ti 4600 kann noch bis zu 30% Leistung verlieren. Wenn man schon kein ausgefuchstes MSAA anbieten kann, ist 2x RGSSAA für bis zu 50% Leistungsverlust akzeptabel.

StefanV
2004-01-10, 12:54:38
Original geschrieben von aths
Jo. Um MSAA vernünftig zu machen, ist bekanntlich einiger Aufwand erforderlich. GeForce3 z. B. kann bei 2x RGMSAA immerhin bis zu 40% Leistung einbüßen, GeForce4 Ti 4600 kann noch bis zu 30% Leistung verlieren. Wenn man schon kein ausgefuchstes MSAA anbieten kann, ist 2x RGSSAA für bis zu 50% Leistungsverlust akzeptabel.

Hm, kann man mit Kompressionstechniken SSAA nicht auch bis zu einem gewissen Punkt beschleunigen??

Ist eigentlich eher die Bandbreite oder die Füllrate ein Problem??

MadManniMan
2004-01-10, 12:58:46
Original geschrieben von Tesseract
wenn du einen CRT hast könntest du es mal mit 2xRGMS und höherer auflösung probieren

Von CRTs hab ich mich verabschiedet. Zudem hab ich - wenn denn AA möglich war - stets 4*RGMS allen anderen BQ+ Features vorgezogen.
Aber ich bin dermaßen SSAA verliebt, daß man da wohl kaum irgend argumentieren kann.

;)


BTW @Thilo: stimmt schon, aber es ist doch auffällig, wie intensiv und schönredend über das AF geblubbert wurde...

BTW #2 -> 2 Fehler in eurer Ausgabe, die mir grad einfallen: einmal schreibt Nero24 in seinem Artikel von 11 als Binärfolge für 4 und dann gibts bei euch keine TBreds mit 166er FSB. Zumindest nicht im Aufrüstdingsratgeberpraxiskramteil.

ow
2004-01-10, 13:06:37
.

robbitop
2004-01-10, 13:44:37
nur beim Multisampling kann eine Framebufferkompression erfolgen. Bei Supersampling wird nämlich alles interpoliert, nicht nur die Kanten.
Probleme: Bandbreite UND Füllrate das dürfter für den DC ebenso gelten. Aber bei 40% Drop hört sich das bei mir ein bisschen nach mehr bandbreitenproblemen an...MSAA wäre vermutlich nicht deutlich schneller gewesen, weil es die Bandbreite ähnlich beansprucht und es war scheinbar auch kein Platz mehr dafür da. Also haben sie es halt gelassen.
Für den Refresh kann man da scheinbar noch einiges aus der Trickkiste ziehen :)

Demirug
2004-01-10, 13:55:10
Man kann auch bei SS eine Framebufferkompresion nutzen. Allerdings ist ein Framebufer welcher mit SS-AA errechnet wurde ungleich komplizierter zu komprimieren.

robbitop
2004-01-10, 14:47:47
wie wäre der Wirkungsgrad dabei einzuschätzen?

Ailuros
2004-01-10, 14:50:45
Original geschrieben von Demirug
Man kann auch bei SS eine Framebufferkompresion nutzen. Allerdings ist ein Framebufer welcher mit SS-AA errechnet wurde ungleich komplizierter zu komprimieren.

Selbst bei komplizierterer Implementierung, sind die Resultate bei SSAA im Vergleich zu MSAA genauso positiv? Ich hab komischerweise den Eindruck das der tradeoff ziemlich kleiner ist, oder hab ich mich da wieder verwirrt?

robbitop
2004-01-10, 16:33:41
Füllrate würde man dabei imo allerdings nicht sparen, lediglich ähnlich Bandbreite wie beim MSAA.
Somit ist der vorteil für SSAA bei Kompression natürlich nicht zu vergleichen. (es wird ja das ganze Bild interpoliert).
Das würde mit Sicherheit eh kein IHV mehr machen. SSAA ist der Performancehit zu groß und es ist als "veraltet" angesehen

Blutgrätsche
2004-01-10, 21:20:59
Original geschrieben von Demirug
Man kann auch bei SS eine Framebufferkompresion nutzen. Allerdings ist ein Framebufer welcher mit SS-AA errechnet wurde ungleich komplizierter zu komprimieren.
Frame-Buffer = Z-Buffer + Color-Buffer
Für Z-Buffer Kompression macht SS oder MS keinen Unterschied, nur eben für den Color-Buffer. "Ungleich komplizierter" ist nicht der beste Ausdruck, da die Effizienz der Color-Kompression auch mit einem aufwendigen Verfahren nicht an die Effizienz der Z-Buffer-Kompression heranreichen kann. Detailreiche Texturen oder im schlimmsten Fall Rauschen sind schlecht verlustfrei zu komprimieren, von HW-Aspekten mal ganz abgesehen.

Ailuros
2004-01-11, 05:45:00
Original geschrieben von robbitop
Füllrate würde man dabei imo allerdings nicht sparen, lediglich ähnlich Bandbreite wie beim MSAA.
Somit ist der vorteil für SSAA bei Kompression natürlich nicht zu vergleichen. (es wird ja das ganze Bild interpoliert).
Das würde mit Sicherheit eh kein IHV mehr machen. SSAA ist der Performancehit zu groß und es ist als "veraltet" angesehen

In dem Fall aber haettest Du theoretisch TBDR-alike SSAA ;)

Super sampling hat einen grossen Fuellraten- bzw. Leistungseinbruch aber wieso man es als "veraltet" ansehen sollte ist mir fremd.

Stell Dir mal einen hypothetischen - weit in die Zukunft - gegriffenen Fall wo edge data > interior polygon data. Hoppla wieviel Sinn macht dann da noch MSAA?

Unter der Hypothese koennte ich genauso leicht Super sampling als die anti-aliasing Methode der Zukunft ansehen. Also mal Vorsicht mit den eiligen Schlussvolgerungen.

robbitop
2004-01-11, 10:38:20
Supersampling ist einfacher in HW zu realisieren als MS und ausserdem ist Supersampling "Bruteforce".

Bald sollten die Spielehersteller sich die Alphatexturen endlich verkniffen haben, dann ist SSAA nämlich um einen Hauptvorteil beraubt...ist schon eine Unart diese alpha Texturen

Ailuros
2004-01-11, 11:25:13
Original geschrieben von robbitop
Supersampling ist einfacher in HW zu realisieren als MS und ausserdem ist Supersampling "Bruteforce".

Bald sollten die Spielehersteller sich die Alphatexturen endlich verkniffen haben, dann ist SSAA nämlich um einen Hauptvorteil beraubt...ist schon eine Unart diese alpha Texturen

Es sollte wohl klar sein dass ich nicht die absehbare Zukunft angesprochen habe.

Lies nochmal oben nach und versuch dem Gedanken zu folgen. In der gegebenen Hypothese haette MSAA kaum einen Leistungsvorteil gegenueber SSAA.

Nochmal momentan (und noch fuer sehr lange Zeit) sind Polygone so gross dass:

edge pixels <<<<< non-edge pixels

Je kleiner die polys werden und daher das edge pixel ratio sich vergroessert, desto mehr verkleinern sich die Vorteile von Multisampling.

Das mit den Entwicklern und Spielen ist ein ganz anderes Kapitel; in einer idealen Welt waere das alpha Problem schon seit langem geloest und ich haette auch keinen Grund mir Sorgen zu machen was die da verpatzen koennten mit zunehmender Pixel Shader Laenge und Komplexitaet als ein weiteres Beispiel.

Anti-aliasing ist immer noch ein "Luxus-Feature" im relativen Sinn; je mehr sich AA verbreiten wird und HW in AA-Staerken skalieren wird, desto mehr werden Entwickler AA auch in Betracht ziehen.

aths
2004-01-11, 12:06:38
Original geschrieben von Ailuros
edge pixels <<<<< non-edge pixels

Je kleiner die polys werden und daher das edge pixel ratio sich vergroessert, desto mehr verkleinern sich die Vorteile von Multisampling.Das ist natürlich richtig. Aber Polygone werden wohl immer groß genug bleiben, dass sich MSAA noch lohnt. Ansonsten hätte die Graka, vom AA mal abgesehen, sowieso extreme Schwierigkeiten.

Original geschrieben von Ailuros
Anti-aliasing ist immer noch ein "Luxus-Feature" im relativen Sinn; je mehr sich AA verbreiten wird und HW in AA-Staerken skalieren wird, desto mehr werden Entwickler AA auch in Betracht ziehen. Für mich ist AA ein Muss-Feature :) Für die meisten Entwickler wird AA aber wohl in der Tat nur als Luxus-Feature gesehen. Schade, imo.

Ailuros
2004-01-11, 13:24:40
Für mich ist AA ein Muss-Feature Für die meisten Entwickler wird AA aber wohl in der Tat nur als Luxus-Feature gesehen. Schade, imo.

Entwickler werden dazu gezwungen sein, mehr Achtung auf AA zu geben, wenn das Abschalten von 4xFSAA z.B. fast nichts mehr bringt selbst bei low-end Loesungen. Sooooo weit entfernt davon schaetze ich persoenlich sind wir nun auch wieder nicht.

Irgendwann wird es wohl auch Zeit dass wir endlich hoch qualitatives motion blur sehen (nein ich meine nicht den heutigen verschmier-motion-trail Quatsch den wir heute in den meisten Faellen sehen).

Das ist natürlich richtig. Aber Polygone werden wohl immer groß genug bleiben, dass sich MSAA noch lohnt. Ansonsten hätte die Graka, vom AA mal abgesehen, sowieso extreme Schwierigkeiten.

Wichtig fuer zukuenftige Entscheidungen was HW betrifft, wird wohl das genaue ratio in der nicht absehbaren Zukunft sein und das wohl in Kombination mit allen moeglichen zukuenftigen AA-Algorithmen und die implementierten Loesungen fuer problematische Faelle.

Mein Einspruch besteht nur darauf jetzt gleich einen vorzeitigen Grabstein ueber Super sampling zu legen, nur weil momentan und fuer die absehbare Zukunft jegliche Form von Multisampling (ja selbst mit analytischen AA Algorithmen) mehr Sinn macht.

robbitop
2004-01-11, 13:32:33
@AiL
ich wage trotzdem zu behaupten, so plausibel wie deine Äusserungen auch sind, daß SSAA mittelfristig aussterben wird :) vieleicht wird es dann später weit in der Zukunft wieder leben. Letztendlich ist der momentane Trend eher hin zu MSAA->FAA und wer weiss was noch. (Wobei MSAA auf einem TBDR fast 4free wäre).

SSAA braucht Füllrate..davon haben wir nicht genug.

und ja ich kann deinen Gedankengängen folgen ;)

StefanV
2004-01-11, 13:46:19
Original geschrieben von robbitop
SSAA braucht Füllrate..davon haben wir nicht genug.

Naja, man kann ja auch auf den (bekoloppten) Gedanken kommen, SSAA Füllratenfrei zu machen :eyes:

Ailuros
2004-01-11, 14:32:14
ich wage trotzdem zu behaupten, so plausibel wie deine Äusserungen auch sind, daß SSAA mittelfristig aussterben wird :)

vieleicht wird es dann später weit in der Zukunft wieder leben.

Nettes Oxymoron :) Um das "vielleicht" geht es ja gerade hier.

Letztendlich ist der momentane Trend eher hin zu MSAA->FAA und wer weiss was noch.

Es macht was fuer einen Unterschied ob man SS oder MSAA edge-AA bei einem Fragment AA Algorithmus benutzt?

Ich hab gerade nochmal Matrox's FAA whitepaper runtergeladen, aber da steht nur drin dass sie FAA mit SSAA Qualitaet anwenden. Bin mir zwar nicht mehr sicher, aber ich glaube sie verwenden multisampling dafuer.

Uebrigens falls es keinen Weg geben sollte, fuer N samples einen N*N grid fuer fragment AA zu bekommen und alle problematische Faelle zu loesen, ist die Methode absoluter Schwachsinn. Interessant ja, aber Matrox's Implementation war mehr als nur primitiv. Uebrigens wenn Du Lust hast lies Dir mal das FAA.pdf nochmal durch; das ganze Marketing-yadda yadda ist ja nur auf Ordered grid MSAA/SSAA im Vergleich zu deren FAA konzentriert.

Was "wer weiss was noch" betrifft, denkt man an adaptive/analytische Algorithmen, muss man erstmal sicher ob und bis zu welchem Grad solche Loesungen Sinn machen.

(Wobei MSAA auf einem TBDR fast 4free wäre).

Und TBDRs werden MSAA wohl auch benutzen. Wenn Du wuesstest woher der Gedankenschlag was die Zukunft betrifft ueberhaupt herkommt, wuerdest Du den obrigen Kommentar eher vermeiden hm? Noch mehr wenn man bedenkt dass kleine polys theoretisch ohne effektive workarounds fuer einen TBDR ein groesseres Problem darstellt als bei einem IMR.

SSAA braucht Füllrate..davon haben wir nicht genug.

Zweifellos. Ich schliesse nur die Moeglichkeit nicht aus dass der Fuellraten Gewinn sich irgendwann um so viel verkleinern koennte, dass MSAA immer mehr seine Vorteile verliert. Ging es NICHT um Fuellrate, gaebe es genau welchen Grund MSAA ueber SSAA zu bevorzugen?

robbitop
2004-01-11, 14:35:59
mach das doch Stefan...das wäre mal was ganz neues ;D
Ich wüsste nicht wie. Durch eine Colorcompression für SSAA sparst du gleiche Bandbreite aber wie willst du das mit der Füllrate hinbekommen?

für SSAA (Bruteforce ^^) musst das ganze Bild Chipintern auf die x-fache Auflösung Hochgerechnet werden (das kostet nunmal Füllrate) und dann wieder herrunter gerechnet und interpoliert werden...

Ailuros
2004-01-11, 14:38:19
Mal zurueck zum eigentlichen Thema: der Abschlag kam mir eher als ich aths' Post ueber die ~40% Leistungseinbruch von DC's 2xRGSS.

Wenn das Prozentual auch fuer sehr Fuellraten-limitierte Faelle gelten sollte, ist deren Implementierung wohl ein bisschen mehr Forschung wert von den Profis hier. Als ich zuerst von "arbitrary super sampling" von S3 hoerte, dachte ich erst an sample Positionen; kann es sein dass was anderes "missgebraucht" wird?

MadManniMan
2004-01-11, 14:55:19
Original geschrieben von Ailuros
...als ich aths' Post ueber die ~40% Leistungseinbruch von DC's 2xRGSS...

Original in der PCGH und dann herangezogen von mir, also bitte :D ;)

BTW warum überhaupt der Gedankengang, bei FAA irgend zwischen SS und MS zu unterscheiden? MS führt unweigerlich zu Kanten-SS. Oder gibts eine Phase beim FAA, die da noch unterscheidet?

Ailuros
2004-01-11, 15:03:30
Die Unterschiede sind wohl bei FAA so gering dass es sich dann eher um Definierungs-Firlefanz handelt.

Bei jeglicher Form von deferred rendering/shading, muesste man eigentlich das Schnittkanten Problem von FAA leicher umgehen koennen.

MadManniMan
2004-01-11, 15:07:59
Original geschrieben von Ailuros
Die Unterschiede sind wohl bei FAA so gering dass es sich dann eher um Definierungs-Firlefanz handelt.

Hm, im Endeffekt gibts doch - wenn überhaupt - nur Unterschiede im feinsten Detail des Bearbeitungsablaufs. Ob nun durch simplen Üb0rsämpling oder durch Jittering oder bei MSAA: immer brauchts zumindest im Kantenbereich die gleiche Menge an Daten. Und bei FAA wäre Kompression ein Lotteriespiel, wie überhaupt schon bei FSSSAA.

Ailuros
2004-01-11, 15:14:03
Original geschrieben von MadManniMan
Hm, im Endeffekt gibts doch - wenn überhaupt - nur Unterschiede im feinsten Detail des Bearbeitungsablaufs. Ob nun durch simplen Üb0rsämpling oder durch Jittering oder bei MSAA: immer brauchts zumindest im Kantenbereich die gleiche Menge an Daten. Und bei FAA wäre Kompression ein Lotteriespiel, wie überhaupt schon bei FSSSAA.

Ich hab schon interessante Spekulationen ueber Moeglichkeiten FAA auf einem TBDR zu implementieren gelesen; ob das was draus werden wuerde steht noch in den Sternen.

Es ist zwar klar dass IHVs schon mit stochastic oder FAA Methoden geforscht haben oder auch weiterforschen; zur Implementation kommt es dann nur wenn der Aufwand vs tradeoff der Rede wert ist und die "neue Idee" sich nirgends als problematisch aufweist.

Stochastic kann man voruebergehend erstmal abkreiden als naheliegende Moeglichkeit AFAIK.

Exxtreme
2004-01-11, 15:23:46
Original geschrieben von Stefan Payne
Naja, man kann ja auch auf den (bekoloppten) Gedanken kommen, SSAA Füllratenfrei zu machen :eyes:
SSAA wird nie und nimmer füllratenfrei sein. Das Einzige was du machen kannst ist der GraKa soviel Füllrate zu spendieren, daß diese extrem CPU-limitiert wird und der Füllrateneinbruch in der Praxis kaum auffällt. Und selbst MSAA zieht etwas Füllrate. Zwar um Dimensionen weniger als SSAA aber etwas ist immer dabei. Die Rechnung ist eigentlich ganz einfach. Man muss sich halt fragen wieviel Zusatzinformationen in das endgültige Bild einfliessen. Laut Matrox gibt es in einem typischen 3D-Szenario ca. 5 - 10% an sichtbaren Polygonkanten. wenn du diese mit 4x AA MSglättest, fliessen ca. 20 - 40% an Zusatzinformationen in das endgültige Bild ein. Bei 4x SSAA fliessen 400% an zusätzlichen Informationen ein. Und dementsprechend sieht das mit 4x SSAA-geglättete Bild auch aus. MSAA kann eigentlich bezüglich BQ nur im Wireframe-Modus oder bei nackten Polygonen mithalten. Ansonsten dürfte SSAA immer deutlich überlegen sein. Wobei man hier aufpassen muss, daß beim Downsampling immer etwas an Informationen wieder verloren geht.

robbitop
2004-01-11, 15:25:31
@AiL
ich bin für meine Oxymorons bekannt ;)
meine Meinung ist halt nicht immer "linear"

was deinen Ansatz zu SSAA angeht gebe ich dir recht. Aber ich sagte ja "mittelfristig" nicht "langfristig"
somit mittelfristig: MSAA/FAA langfristig: wer weiss (vieleicht SSAA)

Brauch man auf TBDRs überhaupt FAA? dort ist MSAA fast ohne jegliche Limitierung...


P.S ich habe mal gelesen dass die nächsten DX Specs TBDR ähnliche Specs von einer GPU erwarten...stimmt das?
Der weg dorthin vom Bruteforce ist allein jetzt rückblickend auf "früher" schon "amazing"

StefanV
2004-01-11, 15:28:44
Original geschrieben von Exxtreme
SSAA wird nie und nimmer füllratenfrei sein.

Stimmt, wobei es aber eigentlich möglich sein sollte :)

Allerdings ist dieser Gedankengang ziemlich bekloppt und wenn das jemand implementieren sollte, dann würd ich mal ganz stark an der Zurechnungsfähigkeit der entsprechenden Person zweifeln...

Eine 'Füllratenfreie' SSAA Implementierung wäre einfach 'zu teuer' und würde unmengen an Transistoren fressen, die man anderweitig sinnvoller nutzen sollte...

Exxtreme
2004-01-11, 15:37:24
Original geschrieben von robbitop

Bald sollten die Spielehersteller sich die Alphatexturen endlich verkniffen haben, dann ist SSAA nämlich um einen Hauptvorteil beraubt

Naja, der Vorteil der Alphatexturen ist halt, daß diese relativ "for free" zu haben sind. Mit Polygonen ausmodellieren oder gar Alpha Blending zu nutzen zieht halt stark an Leistung auch ohne AA.
Original geschrieben von robbitop
...ist schon eine Unart diese alpha Texturen
Kann man auch andersrum sehen. ;)

MadManniMan
2004-01-11, 15:50:50
Original geschrieben von Exxtreme
Kann man auch andersrum sehen. ;)

Eben :D Die Leistung, die man hier spart, bedeutet mehr Bandbreite, die man gar nicht erst mehr implementieren muß. Also mehr Platz für Füllrate auf der Karte und SSAA kann kommen :naughty:

...ich geh dann mal besser in meine Spätschicht...

Ailuros
2004-01-12, 05:31:55
Original geschrieben von robbitop
@AiL
ich bin für meine Oxymorons bekannt ;)
meine Meinung ist halt nicht immer "linear"

Ich bin eben mal ein bisschen allergisch gegen absolute POVs. Keine Sorge.

was deinen Ansatz zu SSAA angeht gebe ich dir recht. Aber ich sagte ja "mittelfristig" nicht "langfristig"
somit mittelfristig: MSAA/FAA langfristig: wer weiss (vieleicht SSAA)

Es besteht eine Moeglichkeit dass anti-aliasing (fuer mehrere Gruende) den ISVs ueberlassen wird, wo diese dann entscheiden werden wo man was anwendet und ja es betrifft auch den Einsatz von SSAA stellenweise fuer PS wenn dieses noetig sein wird. Der IHV muss eben dann HW/SW support fuer MSAA und SSAA haben. Der primaere Focus aber fuer die absehbare Zukunft wird auf MSAA bleiben.

Brauch man auf TBDRs überhaupt FAA? dort ist MSAA fast ohne jegliche Limitierung...

Was heisst ohne Limitierung? Leistung ist immer wichtig LOL. Die Entscheidung ob man bei einem TBDR bei MSAA bleiben sollte, oder auf exotischere Algorithmen zu greifen (coverage mask, FAA usw.) ist dann eher direkt damit verbunden was billiger ist in HW zu implementieren.


P.S ich habe mal gelesen dass die nächsten DX Specs TBDR ähnliche Specs von einer GPU erwarten...stimmt das?
Der weg dorthin vom Bruteforce ist allein jetzt rückblickend auf "früher" schon "amazing"

Ist eigentlich im Grunde Quatsch. Bei unlimited resources wird wohl eher die Leistung erstmal zur Seite geschoben. Hauptsache ist dann dass dem Entwickler X-Anzahl von Moeglichkeiten bereitstehen. Wie das jeder IHV jetzt in HW realisiert ist doch sch**ssegal, es muss einfach laufen selbst wenn es nur mit 10fps in 640*480 geht.

Dreh mal Deinen Gedanken um 360 Grad um, dann bist Du vielleicht naeher an der Realitaet. ;)

robbitop
2004-01-12, 11:10:38
meinst du wirklich 360° AiL ;D

naja das wird eine GROßE Veränderung geben ^^

Demirug
2004-01-12, 12:46:16
Was habt ihr eigentlich immer mit FAA? FAA ist eine MSAA Variante bei der auf Kosten der Qualität Speicher gespart wird. Da ist mir ehrlich gesagt eine Z3-AA Variante noch lieber.

Bei einem DR könnten man natürlich Nägel mit Köpfen machen und matematisch korrektes AA anbieten was bei einem IMR sehr viel Speicher kostet.

Und was DX-Next und TBDR angeht so sagte ich schon damals das da wohl der Wunsch der Vater des Gedanken war. IMHO bevorzug DX-Next aufgrund des "General I/O Model" und den unified Shader eher IMRs.

aths
2004-01-12, 12:58:58
Original geschrieben von Exxtreme
Laut Matrox gibt es in einem typischen 3D-Szenario ca. 5 - 10% an sichtbaren Polygonkanten. wenn du diese mit 4x AA MSglättest, fliessen ca. 20 - 40% an Zusatzinformationen in das endgültige Bild ein.Es sind weniger, da das Dreieck in der Regel mehrere Subpixel bedeckt.
Original geschrieben von Exxtreme
Bei 4x SSAA fliessen 400% an zusätzlichen Informationen ein. Und dementsprechend sieht das mit 4x SSAA-geglättete Bild auch aus.Eben nicht. Es sieht nicht um so viel besser aus, wie es mehr Leistung frisst.

robbitop
2004-01-12, 13:20:53
@Demi es soll auch ein Z3-FAA Derivat möglich sein.

TBDR- diese Technologie in aktuellen Chips verfügt eben nur PowerVR. Bei allen anderen würde solch eine Entwicklung Jahre und evl Risiko bedeuten...

Ailuros
2004-01-12, 14:41:03
Original geschrieben von robbitop
meinst du wirklich 360° AiL ;D

naja das wird eine GROßE Veränderung geben ^^

Demi hat Dir schon in seinem vorletzten Satz geantwortet.

@Demi es soll auch ein Z3-FAA Derivat möglich sein.

Nur ist es dann eher ein coverage mask als ein fragment AA basierender Algorithmus.

Was habt ihr eigentlich immer mit FAA?

Unser robbi hat einen kleinen FAA-Tick in letzter Zeit entwickelt. Wie ich schon gerade (robbi) bei B3D antwortete: wenn mir keiner eine Loesung zeigen kann wie man mit FAA fuer N samples einen N*N grid erreichen koennte, will ich gar nichts davon hoeren; es waere dann effektiv ein Schritt voraus und zwei Schritte zurueck mit jeglicher niedriger sample Anzahl von sparse grid MSAA.

Robbi,

Ich bin mir sicher dass Du den hier schon durchgelesen hast:

http://www.3dcenter.de/artikel/anti-aliasing-masken/

Oder doch nicht?

Tesseract
2004-01-12, 15:42:00
Original geschrieben von Exxtreme
wenn du diese mit 4x AA MSglättest, fliessen ca. 20 - 40% an Zusatzinformationen in das endgültige Bild ein. Bei 4x SSAA fliessen 400% an zusätzlichen Informationen ein.
[...]
Wobei man hier aufpassen muss, daß beim Downsampling immer etwas an Informationen wieder verloren geht.

dieses "etwas" macht aber einen großteil der 400% aus

für das gesammte bild bringt SS natürlich viel mehr als MS, jedoch kann man mit MS + bessere filterung bei weitem effektiver auf annähernd gleiche quallität kommen

robbitop
2004-01-12, 15:46:36
richtig getippt AiL ..ich habe diesen und andere Tech Artikel bei 3dc verschlungen.

Daraus resultiert für mich dass Sparse ab 8 Samples OG immer näher kommt, auch wenn das EER unverändert steigt.
Und eine Lösung wäre Stochastic Grid wobei man durch mehr Samples durch ein "Mehr" an Informationen das entstandene Pixelrauschen lindert. Aber das ist erst ab 16-32 Samples möglich.

Und um 16-32 samples performant durchzuführen kam eben die FAA Idee ("FAA Tick")

lasse mich aber nach wie vor gern eines Besseren belehren ;)

MadManniMan
2004-01-13, 01:05:11
Warum bist du eigentlich so sehr der Meinung, daß Sparsed gegenüber OG immer weniger klasse wär?

Ailuros
2004-01-13, 04:45:45
Original geschrieben von robbitop
richtig getippt AiL ..ich habe diesen und andere Tech Artikel bei 3dc verschlungen.

Daraus resultiert für mich dass Sparse ab 8 Samples OG immer näher kommt, auch wenn das EER unverändert steigt.
Und eine Lösung wäre Stochastic Grid wobei man durch mehr Samples durch ein "Mehr" an Informationen das entstandene Pixelrauschen lindert. Aber das ist erst ab 16-32 Samples möglich.

Und um 16-32 samples performant durchzuführen kam eben die FAA Idee ("FAA Tick")

lasse mich aber nach wie vor gern eines Besseren belehren ;)

Eigentlich sollte man den ganzen Thread durchlesen aber hier mal gleich zum Punkt:

http://www.beyond3d.com/forum/viewtopic.php?t=3233&postdays=0&postorder=asc&highlight=sparse*&start=60

http://www.beyond3d.com/forum/viewtopic.php?t=3233&postdays=0&postorder=asc&highlight=sparse*&start=80

Eigentlich hat Colourless SA's 8x sparse Idee verfolgt und hat ein bisschen mit der sample Platzierung fuer 8xRGSS der V5 6k herumgespielt (da die originale Platzierung eher unoptimal war). Leider sind die screenshots nicht mehr verfuegbar.

8x sparse ergibt bei optimaler Platzierung 8*8, wobei man fuer den gleichen EER theoretisch zumindest mit ordered grid 64x sample (x=8, y=8) brauchen wuerde.

Kommt ganz drauf an wie man jeglichen Artikel auch verstehen will.

<snip>

Multisampling wird aktuell nur bis 6x geboten. Matrox hat der Parhelia ein Multisampling-ähnliches Verfahren spendiert, welches allerdings nur Polygon-Außenkanten glättet und nur bis zu einer gewissen Anzahl an geglätteten Pixeln funktioniert. Mit erstaunlichen 16 Subpixeln zwar, die leider aber nur in einem 4x4-Raster angeordnet sind. EER-technisch wird eine Überabtastung von lediglich 4x4 geboten.

ATIs 6x bringt bei den Kanten, die Glättung besonders nötig haben, sogar bessere Qualität als Matrox' 16x FAA. Allerdings bringt ATIs 6x MSAA gegenüber 4x MSAA aus gleichem Hause keinen sehr großen Qualitäts-Sprung. Je besser die Grundqualität, desto stärker steigt der Aufwand, um noch eine weitere deutliche Verbesserung zu erreichen. Es wäre schon 8x notwendig, um gegenüber dem bereits gutem 4x RG-Modus von ATI eine merkliche Steigerung zu bieten.

Aus aths' Artikel bitteschoen.

aths
2004-01-13, 05:42:36
Original geschrieben von robbitop
richtig getippt AiL ..ich habe diesen und andere Tech Artikel bei 3dc verschlungen.

Daraus resultiert für mich dass Sparse ab 8 Samples OG immer näher kommt, auch wenn das EER unverändert steigt.Na das 8x-Grid, was wie OG aussieht, würde ich gerne sehen. OG kann nur mit X*X, also X² Samples gemacht werden. 8 ist keine Quadratzahl. 9 und 16 wären welche. Würde man 9x bzw. 16x als "sparsed rotated grid" realisieren, dann käme man der OG-Variante damit immer näher. Aber man kann auch ganz andere sparsed Masken suchen, die nicht mal entfernt an ein rotated oder ordered grid erinnern.

zeckensack
2004-01-13, 07:23:42
Original geschrieben von aths
Na das 8x-Grid, was wie OG aussieht, würde ich gerne sehen. OG kann nur mit X*X, also X² Samples gemacht werden. 8 ist keine Quadratzahl. 9 und 16 wären welche.Warum sollte es unmöglich sein, ein 2x4-OG zu implementieren? ?(
(sinnvoll wäre es IMO nicht, aber gehen würde es)

Quasar
2004-01-13, 07:36:40
Wie sollte sonst auch das 6xAA der R200/RV250 entstehen?

ow@work
2004-01-13, 12:06:38
Original geschrieben von Quasar
Wie sollte sonst auch das 6xAA der R200/RV250 entstehen?

Das ist ein RG und kein OG.

Ailuros
2004-01-13, 12:09:19
Original geschrieben von ow@work
Das ist ein RG und kein OG.

Wie waere es mit "moechtegernRG" um genauer zu sein? :D

ow@work
2004-01-13, 14:01:40
Original geschrieben von Ailuros
Wie waere es mit "moechtegernRG" um genauer zu sein? :D

Hast du mehr Infos dazu?
Oder was meinst du jetzt mit genauer und "moechtegern"??

Ailuros
2004-01-14, 04:37:36
Original geschrieben von ow@work
Hast du mehr Infos dazu?
Oder was meinst du jetzt mit genauer und "moechtegern"??

RG + fog = OG

aths
2004-01-14, 05:12:16
Original geschrieben von zeckensack
Warum sollte es unmöglich sein, ein 2x4-OG zu implementieren? ?(
(sinnvoll wäre es IMO nicht, aber gehen würde es) Ich ging einfach mal von einer X*X-Maske aus. Ein 4x2-OG gab's von NV ja tatsächlich :freak:

Ailuros
2004-01-14, 06:04:24
Uraltes demo:

http://www.beyond3d.com/articles/v5_5500_IQ/FSAA-demo.zip

Vielleicht motiviert es jemand etwas aehnliches in groesserem Format und mehr RG Optionen zu entwickeln :D

ow@work
2004-01-14, 07:55:12
Original geschrieben von Ailuros
RG + fog = OG

Es kommt ja aber nicht ueberall fogging zum Einsatz.:)

robbitop
2004-01-14, 11:08:39
naja 8xSparse war vieleicht etw untertrieben ok. Aber eben der Nutzen/Kostenfaktor sinkt ab 8xSparse immer mehr. Somit sehen noch höhere Grade OG immer ähnlicher

@AiL
thx für die Links (normalerweise lese auch ich ganze threats..von vorn nach hinten :D )

Quasar
2004-01-14, 13:09:09
Original geschrieben von ow@work
Es kommt ja aber nicht ueberall fogging zum Einsatz.:)

Trotzdem zeigt das Beispiel das, worauf ich hinaus wollte.

;Q

Ailuros
2004-01-14, 15:56:02
Original geschrieben von ow@work
Es kommt ja aber nicht ueberall fogging zum Einsatz.:)

Stimmt. Ich nehme mir gerade Mac-SSAA/9800 shots unter die Lupe, aber das Zeug ist definitiv nur OGSS, limitiert bis 4x auf 1024 und 2x auf 1280....errrr *yuck* :D

ow@work
2004-01-14, 16:02:07
Original geschrieben von Ailuros
Stimmt. Ich nehme mir gerade Mac-SSAA/9800 shots unter die Lupe, aber das Zeug ist definitiv nur OGSS, limitiert bis 4x auf 1024 und 2x auf 1280....errrr *yuck* :D


Mit oder ohne fog, oder sowohl als auch??

StefanV
2004-01-14, 16:04:24
Original geschrieben von ow@work
Mit oder ohne fog, oder sowohl als auch??

Vermutlich sowohl als auch :|

Quasar
2004-01-14, 16:06:11
Original geschrieben von Ailuros
Stimmt. Ich nehme mir gerade Mac-SSAA/9800 shots unter die Lupe, aber das Zeug ist definitiv nur OGSS, limitiert bis 4x auf 1024 und 2x auf 1280....errrr *yuck* :D

Wenn das ohne Fog ist und mit Fogging RGSS verwandt wird, kommen mir diese Limitierungen verdächtig bekannt vor.

Laß' mich raten: 6xSSAA geht nur bis 800x600 :naughty:

Exxtreme
2004-01-14, 16:09:12
Original geschrieben von Quasar
Laß' mich raten: 6xSSAA geht nur bis 800x600 :naughty:
AFAIK bieten die Mac-Treiber 6x AA gar nicht erst an.

Ailuros
2004-01-14, 16:11:58
Original geschrieben von robbitop
naja 8xSparse war vieleicht etw untertrieben ok. Aber eben der Nutzen/Kostenfaktor sinkt ab 8xSparse immer mehr. Somit sehen noch höhere Grade OG immer ähnlicher

@AiL
thx für die Links (normalerweise lese auch ich ganze threats..von vorn nach hinten :D )

Mach einen screenshot ohne AA von einer Stelle wo man Differenzen von AA gut sehen kann, am besten mit hohen Kontrasten und spiel mal ein bisschen mit dem alten demo oben rum.

Was fuer ein Nutzen/Kostenfaktor? Je mehr samples desto besser solange fuer N samples ein N*N grid eingehalten wird, da gibt es nicht viele aber. Der Leistungsverlust mit Multisampling eingeschaltet wird weiterhin sinken und die Anzahl der samples in aehnlicher Analogie sich steigern.

Beispiel:

V5 5500 in 2000 Q3a 1024*768*32:

2xRGSS = ~50+ fps
4xRGSS = ~25+ fps

Radeon9800 in 2003 Q3a 1024*768*32:

2xOGSS = 153 fps
4xOGSS = 80 fps
4xRGMS = 170 fps
6xRGMS = 143 fps

Nochmal 3 Jahre den Bach runter und wir werden ueber 4x und 6x samples nur noch lachen.

Wenn wir dann endlich die 16x sample Barriere brechen werden in der Zwischenzeit, wird dann entschieden welche der moeglichen Methoden die besten Resultate bringt. Was moire alleine betrifft scheint schon 16x jittered grid sehr gute Resultate zu zeigen, aber das ist bei weitem noch nicht alles.

Ailuros
2004-01-14, 16:14:27
Original geschrieben von Quasar
Wenn das ohne Fog ist und mit Fogging RGSS verwandt wird, kommen mir diese Limitierungen verdächtig bekannt vor.

Laß' mich raten: 6xSSAA geht nur bis 800x600 :naughty:

Exxtreme hat recht. Nur 2x/4x OGSS.

ow
2004-01-14, 17:41:17
.

Exxtreme
2004-01-14, 17:47:54
Original geschrieben von ow
Das ist aber übel. RG sollten die R3xx doch können, oder nicht?

Die Frage ist halt ob der R3xx den Accumulation-Buffer auch beim SSAA nutzen kann um RGAA zu machen. Bisher hat das keiner beantworten können/wollen. Auf dem Mac hat ATi schnödes OG implementiert wenn SSAA aktiviert ist.

Demirug
2004-01-14, 17:49:24
Original geschrieben von ow
Das ist aber übel. RG sollten die R3xx doch können, oder nicht?

Aber nur in Verbindung mit MSAA. Scheinbar kann der Rasterisierer kein RGSSAA berechnen. Sowas muss man nämlich einbauen.

aths
2004-01-14, 19:12:34
Original geschrieben von Demirug
Aber nur in Verbindung mit MSAA. Scheinbar kann der Rasterisierer kein RGSSAA berechnen. Sowas muss man nämlich einbauen. Das erzähle ich schon die ganze Zeit, dass man RGSSAA auf R3xx knicken kann...

Mr. Lolman
2004-01-14, 19:15:00
Das mittlere Bild ist doch 2x RGSSAA...

Demirug
2004-01-14, 19:15:42
Original geschrieben von aths
Das erzähle ich schon die ganze Zeit, dass man RGSSAA auf R3xx knicken kann...

Es würde zumindestens der Arbeitsweise von ATI entsprechen.

Keinen Transitor zuviel benutzten.

MadManniMan
2004-01-15, 00:21:28
Original geschrieben von Mr. Lolman
Das mittlere Bild ist doch 2x RGSSAA...

Jup, ohne Fog geht das auch ohne Problemchen.

Ein anderes Problemchen habe allerdings ICH, wenn ich das Bild ganz rechts anschau. Horizontal ne EER von 4, vertikal nur 2 - oder ist ein shice Winkel und die beiden nicht weiter erwähnenswerten Zwischenstüfchen von einem Pixel stärke sind raihnäs Pech? Oder gar 4xS? Nur mit 2*(2*RGSS)?

:grübel:

Ailuros
2004-01-15, 03:09:50
Original geschrieben von Exxtreme
Die Frage ist halt ob der R3xx den Accumulation-Buffer auch beim SSAA nutzen kann um RGAA zu machen. Bisher hat das keiner beantworten können/wollen. Auf dem Mac hat ATi schnödes OG implementiert wenn SSAA aktiviert ist.

Von dem Zeug das ich momentan zum sehen bekomme (ohne bis jetzt 100% sicher zu sein), sieht die Wirkung auf Texturen nicht besser aus als stink-normales trilinear. Ich hab so einige Verdaechte darueber, aber ich warte erstmal ab bis ich sicherer darueber sein kann.

Wenn aber diese Verdaechte stimmen sollten, dann bin ich eigentlich froh dass R3xx keine PC/SSAA Unterstuetzung haben, da es wohl im Grunde dann wenig Zweck dafuer gibt.

Exxtreme
2004-01-15, 11:18:11
Original geschrieben von Mr. Lolman
Das mittlere Bild ist doch 2x RGSSAA...
Ja, ein R200 kann das ja auch. Die Frage ist jetzt ob es ein R300 auch kann.

ow
2004-01-15, 17:03:29
.

ow
2004-01-15, 17:05:53
.

MadManniMan
2004-01-15, 17:35:52
Die ganze Sache wird immer verworrener. Das 4* des R200/RV2*0 ist also ohne Fog ein um 90* gedrehtes 4xS, aber mit Oversampling+SparsedSS anstelle von Oversampling+SparsedMS. Aber das mit der Schrift ist jetzt noch ne Spur mysteriöser :grübel: