PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : CSAA des G8X - was, wie und warum.


MadManniMan
2006-11-09, 18:48:52
...würde ich Euch natürlich gern sagen, aber ich beschränke mich lieber auf die fragende... nein, initiierende Rolle - ich habe keine Ahnung, möchte aber alles darüber wissen.

Wohlan denn, der Reigen sei eröffnet!

Gast
2006-11-09, 19:21:37
Wie wäre es denn damit, wenn du postest, was du darüber schon weißt?

Kladderadatsch
2006-11-09, 19:24:00
Wie wäre es denn damit, wenn du postest, was du darüber schon weißt?
wie wäre es, wenn du dazu einfach eines der zig reviews liest und dann wieder hier herein schaust, wenn es ans eingemachte geht?;)

MadManniMan
2006-11-09, 19:41:34
Wie wäre es denn damit, wenn du postest, was du darüber schon weißt?

Danke insane - ist aber nicht nötig, da ich der Bitte gern nachkommen möchte. Ehrlich gesagt habe ich nämlich geflunkert, da ich lieber duschen gehen wollte, als mein schon erlangtes Wissen festzuhalten ... verzeiht! Aber als Waldarbeiter tut das ab und an Not ;)


Also:

Im Gegensatz zum üblichen Multisampling verzichtet CSAA auf ein ermitteln von mehr als 4 (8*AA/16*AA) bzw. 8 (16*QAA) Stencil-/Z-Werten, verwendet aber 8 (8*AA) bzw. 16 (16*AA/16*QAA) "Coverage-Samples" - und das ist der eigentliche Knackpunkt, denn ich kann ab hier nur raten...
Es wird also nur gespeichert, ob ein jeweiliges Polygon den Samplepunkt bedeckt oder nicht - so stellte ich mir das jedoch auch schon für normales MSAA, also mit "vollen" Stencil-/Z-Samples vor... inwiefern wird das Nichtspeichern der Z-Werte Probleme macht (Stencil ist klar).

Die Abtastmaske wird bei den CSAA-Varianten nicht über ein eigenes Muster, sondern über simples Verschieben der Originalmaske erreicht, was freilich ein Qualitätsdefizit mit sich bringt.


Soweit richtig?

Gast
2006-11-09, 19:57:06
ob ich das jetzt komplett verstanden habe, weiß ich auch nicht so genau, aber noch ist ja nicht aller tage abend.

msaa speichert (verlustfrei komprimiert vermutlich) z- und c-infos zu allen subpixeln - als komplette 32-bit-werte. coverage mask aa dagegen speichert, wie du richtig sagtest, max. 8 samples komplett und für die restlichen subsamples lediglich einen boolschen wahr/falsch-wert. der dürfte deutlich platzsparender sein, als bsw eine komplette 32-bit-tiefeninfo. das ganze wird dann noch komprimiert - aber hier verläßts mich aktuell auch noch.

Raff
2006-11-09, 20:03:29
Was ich mich frage: Warum kein 4x CSAA, das es dann fast "for free" bzw. zu 2x-AA-Kosten gibt?

MfG,
Raff

Banshee18
2006-11-09, 20:07:23
Ich könnte mir gut vorstellen, dass aths dazu bald einen Artikel bringt, ich steige da nämlich auch noch nicht so richtig durch.
Vielleicht hilft das ein wenig:
http://www.beyond3d.com/forum/showpo...&postcount=142

Gast
2006-11-09, 20:37:51
Also in den beiden Artikeln wird doch quasi alles erläutert wüste nich was da noch an Frage offenbleibt.

http://www.3declipse.com//content/view/34/9
http://www.anandtech.com/video/showdoc.aspx?i=2870&p=9

Der Anandtech Artikel klärt auch das man weiterhin TMSAA und TSSAA auswählen kann. Das Sample Pattern sieht man auch.

Außer der Frage nach Hybrid bzw. reinen SSAA Modi ist doch alles geklärt oder?

aths
2006-11-09, 20:55:55
Was ich mich frage: Warum kein 4x CSAA, das es dann fast "for free" bzw. zu 2x-AA-Kosten gibt?Weils blöd aussähe. Bei nur zwei Z-Werten pro Pixel.

Gast
2006-11-09, 22:01:31
und weils völlig sinnlos wäre, da die rops über 4aa samples in single cycle fähig sind. 2xaa ist momentan sogar deutlich langsamer, als 4xaa - auch wenn das nicht sein dürfte.

Spasstiger
2006-11-10, 00:56:45
http://www.anandtech.com/video/showdoc.aspx?i=2870&p=9
Guter Artikel, wenn man ihn gelesen und verstanden hat, weiß man auch wie MSAA und SSAA genau funktionieren.

Gast
2006-11-10, 08:44:48
Hi;

vielleicht findet ihr ja im Internet noch was zum Z3 Antialiasing. Das ist eigentlich das gleiche wie CSAA aber eben mit max. 3 Z-Samples pro Pixel anstelle von 4 bzw. 8 wie bei CSAA. Das PDF zum Z3 Antialiasing erklärt sehr gut wie das ganze funktioniert bzw. funktionieren könnte da Nvidia das ganze bestimmt etwas anders implementiert hat.


Manfred

Ailuros
2006-11-10, 10:37:16
Herr Jouppi wurde afaik nach dem einreichen des Z3 Patents fuer Compaq von NVIDIA eingestellt ;)

aths
2006-11-10, 10:41:06
Hi;

vielleicht findet ihr ja im Internet noch was zum Z3 Antialiasing. Das ist eigentlich das gleiche wie CSAA aber eben mit max. 3 Z-Samples pro Pixel anstelle von 4 bzw. 8 wie bei CSAA. Das PDF zum Z3 Antialiasing erklärt sehr gut wie das ganze funktioniert bzw. funktionieren könnte da Nvidia das ganze bestimmt etwas anders implementiert hat.CSAA würde ich nicht unbedingt Z3-AA nennen.

robbitop
2006-11-10, 10:53:56
und weils völlig sinnlos wäre, da die rops über 4aa samples in single cycle fähig sind. 2xaa ist momentan sogar deutlich langsamer, als 4xaa - auch wenn das nicht sein dürfte.
Was wir (http://www.forum-3dcenter.org/vbulletin/showthread.php?t=330426) bezweifeln.
Das ist eine urban legend die im B3D Forum aufgebrodelt ist und immer und immer wieder aufgeschnappt und nachgeplappert wird.

2xAA ist sehr wohl schneller auf einer G80 als 4x (http://www.computerbase.de/artikel/hardware/grafikkarten/2006/test_nvidia_geforce_8800_gtx/8/#abschnitt_aa_und_af_skalierung)

Die ROPs können alles in einem Takt erledigen. Die bremsen in den seltensten Fällen (Singletexturing X-D). Bandbreite, latenzen, Caches, gute Z/Colorkompression, effizientere Algoritmen ect können die Performance deutlich verbessern.




vielleicht findet ihr ja im Internet noch was zum Z3 Antialiasing. Das ist eigentlich das gleiche wie CSAA aber eben mit max. 3 Z-Samples pro Pixel anstelle von 4 bzw. 8 wie bei CSAA.
Z3 != CSAA ;)

Ailuros
2006-11-10, 11:18:40
Bei den FEAR Resultaten stimmt sowieso etwas nicht. Eine R580+ bricht mit 4xAA weniger ein als eine G80 und das nur in 1600*1200?

Zwar 1280*960, aber der Abstand zu 1600 ist auch nicht gerade gigantisch:

http://www.3declipse.com//content/view/33/9/

1xAA-->4xAA = 16%
1xAA-->8xAA = 44% (8x MSAA)

MadManniMan
2006-11-10, 11:33:14
Nachdem ich inzwischen viele Screens vom reinen MSAA wie auch vom CSAA in Augenschein nehmen konnte muß ich konstatieren, daß die CS zwar tatsächlich Kanten glatter machen, aber die mangelhafte Z-Info die Kanten andererseits zusätzlich aufrauht!

Ergo konträre Wirkung ... bisher gefallen mit die CSAA-Shots nicht - glaubt ihr nicht? Nun, bitte schaut euch mal die Stromleitung im Anand-Test an. Mit CSAA --> Lücken.

robbitop@work
2006-11-10, 15:21:16
Bei den FEAR Resultaten stimmt sowieso etwas nicht. Eine R580+ bricht mit 4xAA weniger ein als eine G80 und das nur in 1600*1200?

CoD2 verliert bei kaum einer Karte mit MSAA Performance. Ich vermute ein CPU Limit liegt vor.

Spasstiger
2006-11-10, 15:26:19
Ein vollwertiges 16xMSAA gibts beim G80 nicht, oder?
Und 8xQ-CSAA sollte ja vollwertigem 8xMSAA entsprechen.

MadManniMan
2006-11-10, 16:04:45
Ein vollwertiges 16xMSAA gibts beim G80 nicht, oder?
Und 8xQ-CSAA sollte ja vollwertigem 8xMSAA entsprechen.

1) Nein.

2) nV nennt alle Modi "CSAA" - was natürlich absurd erscheint ... aber hey, sollnse machen. Und ja, Du hast Recht.

Grestorn
2006-11-10, 17:07:56
Ein vollwertiges 16xMSAA gibts beim G80 nicht, oder?
Und 8xQ-CSAA sollte ja vollwertigem 8xMSAA entsprechen.

Vollwertig, im Sinne von 16 color/z samples, nein, gibt es nicht.

8xQ ist kein CSAA Modus, sondern ganz normales 8x Multisampling.

8x (ohne Q) ist der CSAA Modus, 4 color/z samples und 8 coverage samples.

2) nV nennt alle Modi "CSAA" - was natürlich absurd erscheint ... aber hey, sollnse machen. Und ja, Du hast Recht.
Wo steht, dass nV alle Modi CSAA nennt?

Gast
2006-11-10, 17:47:02
Ergo konträre Wirkung ... bisher gefallen mit die CSAA-Shots nicht - glaubt ihr nicht? Nun, bitte schaut euch mal die Stromleitung im Anand-Test an. Mit CSAA --> Lücken.

Heh? Ich habe bei CoD2 keine "Lücken" in der Stromleitung grade entdecken können (8xQ und 16Q), allerdings nutze ich auch nicht das Gamma AA, womit der "Wischiwaschi" Effekt flach fällt.

Screenshots von CoD2 kommen in kürze.

Ailuros
2006-11-10, 18:20:03
CoD2 verliert bei kaum einer Karte mit MSAA Performance. Ich vermute ein CPU Limit liegt vor.

Ich hab auf FEAR Resultate gelinkt; was soll's in ein paar Tagen werde ich selber weiser ;)

MadManniMan
2006-11-10, 21:06:27
Heh? Ich habe bei CoD2 keine "Lücken" in der Stromleitung grade entdecken können (8xQ und 16Q), allerdings nutze ich auch nicht das Gamma AA, womit der "Wischiwaschi" Effekt flach fällt.

Screenshots von CoD2 kommen in kürze.

Schau mal den Vergleichsscreen zwischen 8* und 8*Q - dort wird ein Pixel seltsamerweise hell (unterer Rand Stromleitung - etwa in der Mitte) und das möchte ich auf eventuell zu wenig Z-Samples zurückführen.

Gast
2006-11-15, 19:06:53
Was wir (http://www.forum-3dcenter.org/vbulletin/showthread.php?t=330426) bezweifeln.
Das ist eine urban legend die im B3D Forum aufgebrodelt ist und immer und immer wieder aufgeschnappt und nachgeplappert wird.

2xAA ist sehr wohl schneller auf einer G80 als 4x (http://www.computerbase.de/artikel/hardware/grafikkarten/2006/test_nvidia_geforce_8800_gtx/8/#abschnitt_aa_und_af_skalierung)

Bench es halt selbst nach. Die Ergebnisse sind reproduzierbar und deuten eindeutig in diese Richtung.

Außerdem ist es nicht im B3D-Forum aufgebrodelt, sondern aus den Papern von Nvidia - und direkt lügen werden sie darin nicht, höchstens Dinge schreiben, die man erst noch interpretieren muss.