PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : AMD/ATI - Ein paar Überlegungen zum MSAA-Problem des R600


Nakai
2007-09-27, 18:06:59
Wie wir alle wissen bricht der R600 bei nahezuallen Qualitätseinstellungen unheimlich ein.

Mehr dazu hier:
http://www.forum-3dcenter.org/vbulletin/showthread.php?t=382321


Nun eigentlich zu meiner Überlegung.
Wieso nimmt man statt MSAA nicht SSAA?

SSAA ist ja nichts anderes als mehrere Pixel, oder des Samples von mehren Pixeln, in einem Pixel unterzubringen.
So wäre 4xSSAA bei einer Auflösung von 1280x1024 sogar eine theoretische Auflösung von 2560x2048 Pixel(am gängisten ist 2560x1920).
Nun hab ich mir alle möglichen Benches betrachten und stellte fest, dass eine Auflösung 2560x1920 teilweise weniger Einbruche hat als AA und AF bei 1280x1024 hat.
(Anno1701, CoD2, HL2:LC, TES4, SS2...; Ja ich weiß, das das nicht überall so ist, jedoch muss man sich die Vorteile von SSAA anschaun)
Ergo könnte man 4xSSAA aktivieren bei einer Auflösung von 1280x1024 und man hätte wohl eine bessere AA-Qualität als bei 4xMSAA mit weniger Einbrüchen.
(Ebenso würde man dem AF auch noch zugute kommen)

Achja, würde der R600 ebenso einbrechen wenn man SSAA verwendet, wie als würde man MSAA verwenden?


Vll, sind diese Überlegungen auch nur kompletter Stumpfsinn, dennoch würde ich mich über ein paar andere Meinungen freuen.


mfg Nakai

Gast
2007-09-27, 18:14:01
Warum startest du gleich einen neuen Thread? ;(
Das kommt drauf an, was du als unguenstig bezeichnest. 4x MS Samples braeuchten halt einen extra Takt. 2xSS hingegen braeuchte, je nach Game, mal eben hundert Takte mehr.
So stark duerften die ROPs nicht limitieren, sonst wuerde R600 bei 4xMS immerhin noch 8 Pixel pro Takt in Spielen raushauen. Und das tut keine GPU bisher.


Ob jetzt die 16 TMUs einen Flaschenhals darstellen, sei dahin gestellt. Ein expliziter Test mit DXTweaker wäre aber interessant (ist die einzige Möglichkeit, eine Radeon zum Spersampling zu zwingen).

Gast
2007-09-27, 18:15:55
Ein lieber Mod könnte eine eckige Klammer setzen, damit man das Zitat als solches sehen kann.

Gast
2007-09-27, 18:22:03
Ein lieber Mod könnte eine eckige Klammer setzen, damit man das Zitat als solches sehen kann.

Aber nicht ohne Smiley: :)

Nakai
2007-09-27, 18:25:49
Ich kenn das Zitat von Robbitop und ich kenn die Problematik des Themas, vll hätte ich es nicht eröffnen sollen.

2xSS hingegen braeuchte, je nach Game, mal eben hundert Takte mehr.

Tja, weil man die Samples der Pixel auch berechnen muss. Ergo seh ich keinen Nachteil, warum man das nicht tun soll. Man hat ergo auch eine ziemlich gute BQ, kein Flimmern, kaum Kanten, verbessertes AF usw. Warum macht man es nicht?
Weil es zuviel kostet? Die FPS sind denen von 4xMSAA und niedrigerere Auflösung meistens ebenbürtig.


mfg Nakai

Coda
2007-09-28, 01:21:41
Das Problem ist, dass die geordnete Sampleanordnung bei Supersampling per runterskalieren verdammt beschissen und deshalb der Glättungseffekt nicht sehr gut ist.

Außerdem würde ATI damit ja indirekt zugeben, dass sie bei R600 Scheiße gebaut haben ;)

robbitop
2007-09-28, 09:44:35
Ich kann mir nicht vorstellen (selbst beim R600 nicht) dass 4xSS guenstiger sein soll als 4xMS.
4xSS haut mal eben die Gesamtperformance der GPU auf 1/4.

Nakai
2007-09-28, 10:06:45
4xSS haut mal eben die Gesamtperformance der GPU auf 1/4.

Naja einige Anwendungen verlieren mehr Performance durch 4xMSAA und 8xAF als mit 4xSSAA.
Bei 4xSSAA wird theoretisch die Auflösung vervierfacht.


Das Problem ist, dass die geordnete Sampleanordnung bei Supersampling per runterskalieren verdammt beschissen und deshalb der Glättungseffekt nicht sehr gut ist.

Kann man die Samples nicht rotieren?

Außerdem würde ATI damit ja indirekt zugeben, dass sie bei R600 Scheiße gebaut haben

Denken das nicht sowieso die meisten?;)

Aber anscheinend, ist das Thema gegessen wie es scheint.


mfg Nakai

robbitop
2007-09-28, 11:52:05
Naja einige Anwendungen verlieren mehr Performance durch 4xMSAA und 8xAF als mit 4xSSAA.
Bei 4xSSAA wird theoretisch die Auflösung vervierfacht.
Hast du mal fix ein paar Benchmarkgrafen fuer mich? :)




Kann man die Samples nicht rotieren?
Doch na klar. Seit dem R300. (AST-AAA wuerde ja sonst nicht funktionieren)

ATI wird R600 wohl sehr schnell ersetzen (kurzfristig durch die RV670 und mittelfristig durch R700). Ich glaub kaum, dass die jetzt noch gross an dem Ding rumdoktern.

Gast
2007-09-28, 12:13:31
Hast du mal fix ein paar Benchmarkgrafen fuer mich? :)


http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_ati_radeon_hd_2900_xt/8/#abschnitt_aa_und_af_skalierung

Von 1024x768 auf 2048x1536 verliert die 2900XT zwischen 1/2 und 1/3 der Leistung.
Ich bezweifel, dass Leute nur in 1024*768 und AA spielen wollen.

Nakai
2007-09-28, 12:16:23
Das Problem ist nur, dass die wenigstens Seiten mit einer sehr hohen Auflösung arbeiten mit der man 4xSSAA bei 1280x1024 vergleichen kann.

http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_ati_radeon_hd_2900_xt/14/#abschnitt_anno_1701

http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_ati_radeon_hd_2900_xt/15/#abschnitt_call_of_duty_2

http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_ati_radeon_hd_2900_xt/22/#abschnitt_oblivion

http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_ati_radeon_hd_2900_xt/26/#abschnitt_serious_sam_2

Sind nur CB-Tests, welche von manchen nicht gerade als realistisch gesehen werden.
Ich schau nach weiteren Tests mal.


mfg Nakai

Gast
2007-09-28, 12:18:26
Tja, in diesem Test wird AAA mit einem Supersampling Anteil verwendet. Es stell dir mal vor, es käme reines 4xSSAA zum Einsatz. Die Leistung wäre noch weiter im Keller.

Gast
2007-09-28, 12:21:41
Tja, in diesem Test wird AAA mit einem Supersampling Anteil verwendet. Es stell dir mal vor, es käme reines 4xSSAA zum Einsatz. Die Leistung wäre noch weiter im Keller.
Da wird auch MSAA verwendet.

Spasstiger
2007-09-28, 12:28:14
Der Bandbreitenbedarf müsste bei 2x2 SSAA eigentlich höher sein als bei der vierfachen Auflösung, weil beim SSAA ja noch das Downsampling anfällt.
Außerdem werden Polygonkanten mit 2x2 OGSSAA schlechter geglättet als mit 4xRGMSAA.

robbitop
2007-09-28, 12:30:43
Naja bei einer Aufloesungsvervierfachung muss auch die Leistung auf 1/4 einsinken. (es sei denn, die CPU limitiert)

LovesuckZ
2007-09-28, 12:31:26
Da wird auch MSAA verwendet.

Ist aber nicht der entscheidenen Faktor. Man sieht doch sehr schön, wo die 2900XT liegt, wenn AAA mit SuperSampling verwendet wird. Wieso sollte die Leistung also bei reinem SuperSampling plötzlich nach oben gehen?

Gast
2007-09-28, 12:37:34
Ist aber nicht der entscheidenen Faktor. Man sieht doch sehr schön, wo die 2900XT liegt, wenn AAA mit SuperSampling verwendet wird. Wieso sollte die Leistung also bei reinem SuperSampling plätzlich nach oben gehen?
Der Topic:
Ein paar Überlegungen zum MSAA-Problem des R600.
Adaptives AA enthält Kantenglättung und Supersampling für transparente Texturen. Es geht aber um reines Supersampling. Und keiner ssagt, dass beim reinen SSAA irgendwelche Wunder zu erwarten sind, sondern ob die Leistung im zu erwartenden Masse abfällt.

Nakai
2007-09-28, 12:38:50
Naja bei einer Aufloesungsvervierfachung muss auch die Leistung auf 1/4 einsinken.

Das ist aber bei den gewählten Beispielen nicht der Fall.

mfg Nakai

€:
Der Bandbreitenbedarf müsste bei 2x2 SSAA eigentlich höher sein als bei der vierfachen Auflösung, weil beim SSAA ja noch das Downsampling anfällt.

:| Bandbreite sollte der R600 genug haben...

Spasstiger
2007-09-28, 12:47:54
Gibts eigentlich irgendwo Benchmarks, wo die 2900 XT in einer niedrigeren Auflösung mit 4xMSAA und einer viermal so hohen Auflösung ohne AA bei gleichem AF-Level gemessen wurde?
Ich finde auf die Schnelle nichts.

Gast
2007-09-28, 12:49:20
Das ist aber bei den gewählten Beispielen nicht der Fall.

mfg Nakai
Was meinst du genau: Vergleich zB 1280*1024 und 2560*1600 oder 1280*1024 vs. 1280*1024+4*AAA+16*AF?
Die Vergleiche zu AAA sind absolut unsinnig, das Zeug heißt ja nicht umsonst adaptives AA. Dazu kommt noch, dass 16*AF aktiv ist.
Besseres Beispiel wäre:
http://www.ixbt.com/video/itogi-video/0907/itogi-video-st-wxp-pcie.html
http://www.ixbt.com/video/itogi-video/0907/itogi-video-sc2-wxp-pcie.html
http://www.ixbt.com/video/itogi-video/0907/itogi-video-cj-wxp-pcie.html
http://www.ixbt.com/video/itogi-video/0907/itogi-video-pr-wxp-pcie.html
http://www.ixbt.com/video/itogi-video/0907/itogi-video-ch-wxp-pcie.html
http://www.ixbt.com/video/itogi-video/0907/itogi-video-ss2-wxp-pcie.html

AnarchX
2007-09-28, 12:49:47
Gibts eigentlich irgendwo Benchmarks, wo die 2900 XT in einer niedrigeren Auflösung mit 4xMSAA und einer viermal so hohen Auflösung ohne AA bei gleichem AF-Level gemessen wurde?
Ich finde auf die Schnelle nichts.

Hier ist alles dabei: AA, AF, Auflösung:
http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_ati_radeon_hd_2900_xt/8/#abschnitt_aa_und_af_skalierung

Spasstiger
2007-09-28, 13:02:32
Hier ist alles dabei: AA, AF, Auflösung:
http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_ati_radeon_hd_2900_xt/8/#abschnitt_aa_und_af_skalierung
Ah, thx.
Wenn ich mir jetzt 1024x768 vs. 2048x1536 anschaue, sehe ich durchschnittlich einen Performanceeinbruch auf 40%. Allerdings wird in 1024x768 wohl ständig eine CPU-Limitierung vorgelegen haben. Mit geringerer CPU-Limitierung dürfte der Einbruch wohl noch größer ausfallen, im theoretischen Fall halt auf 25%.
Zudem ist SSAA wegen dem Downsampling wohl noch einen Tick teurer als nur die vierfache Auflösung.

In 1600x1200 bricht die Performance mit 4xMSAA gegenüber noAA im Mittel auf 58% ein. Und in 1600x1200 liegt wohl nur noch eine geringe CPU-Limitierung vor.

4xMSAA kostet also deutlich weniger Leistung als ein potentielles 2x2 SSAA, auch bei einer HD2900 XT.
Im Vergleich zu einer GeForce 8800 GTS dürfte der Performanceeinbruch bei Nutzung von 2x2 SSAA statt 4xMSAA aber "erfreulich" gering ausfallen und angesichts dessen, dass eine HD2900 Pro/XT im Mittel mit 4xMSAA vergleichbar schnell ist wie eine 8800 GTS 320/640 MB, scheint die HD2900 Pro/XT in der Preisklasse die klar bessere Karte für reines SSAA zu sein (nur wer spielt schon mit reinem SSAA und ohne AF?).

LovesuckZ
2007-09-28, 13:20:55
Warum sollte ein 2x2 OGSSAA auf einer 2900XT wesentlich weniger Leistung kosten als auf einer 8800GTS?

Spasstiger
2007-09-28, 13:23:53
Warum sollte ein 2x2 OGSSAA auf einer 2900XT wesentlich weniger Leistung kosten als auf einer 8800GTS?
Das tut es sicher nicht. Wir reden hier stets in Relation zu 4xMSAA. Und bei noAA/noAF ist die HD2900 XT schneller als die 8800 GTS.

Coda
2007-09-28, 19:22:39
Kann man die Samples nicht rotieren?
Nicht wenn keine spezielle Logik für Supersampling vorhanden ist.

Nakai
2007-09-28, 19:39:00
Und das hat der R600 nicht?

mfg Nakai

horn 12
2007-09-28, 20:00:59
Aber es werden wohl noch gar einige gar Positive Steigerungen mit aktivem AA
kommen beim Cat 6.10 / 8.0 oder wird dies einfach schon alles gewesen sein, da nun bald der RV 670 ins Haus steht und dieser dies mit der AA Performance richten muss/ bzw. RICHTEN MUSS.
Wenn dem auch noch nicht so ist, wird es wirklich ärgerlich und vielleicht doch noch ein Treiberproblem oder Anbindungsproblem an das 512 Bit Speicherinterface.
PS: Nur ATI weis was und ob was wirklich faul ist am R600 Design.
Das etwas immer noch nicht richtig rund läuft ist ja jedem klar,- nur müssten langsam mal die Früchte tragen, bei 3-4 Treiberupdates!

robbitop
2007-09-28, 20:15:54
Und das hat der R600 nicht?

mfg Nakai
Bei allen ATI GPUs seit dem R300 ist die vorhanden. Sonst wuerde AST-AA nicht funktionieren.

Nakai
2007-09-28, 20:18:36
Bei allen ATI GPUs seit dem R300 ist die vorhanden. Sonst wuerde AST-AA nicht funktionieren.

Dem war mir auch so, jedoch war Codas Antwort etwas irritierend.

Naja trotzdem danke.

mfg Nakai

Coda
2007-09-28, 20:25:59
Bei allen ATI GPUs seit dem R300 ist die vorhanden. Sonst wuerde AST-AA nicht funktionieren.
Da ist gar nichts vorhanden. Das ist ein reines Softwareding bei dem pro Sample die Geometrie nochmal durch den Chip muss, deshalb ist das auch viel langsamer als normales Supersampling.

robbitop
2007-09-28, 21:29:32
Das ist mir klar, aber dennoch ging es darum, ob's funktioniert. Auch dafuer braucht's sicher entsprechende Logik. Und soo extrem schlecht ist's auch nicht.

_DrillSarge]I[
2007-09-28, 21:39:46
Da ist gar nichts vorhanden. Das ist ein reines Softwareding bei dem pro Sample die Geometrie nochmal durch den Chip muss, deshalb ist das auch viel langsamer als normales Supersampling.
langsamer als (f)ssaa? glaub ich nicht, da es nur partiell angewendet wird.

robbitop
2007-09-29, 00:46:44
Er meint natuerlich langsamer pro verwendetem Pixel.

Gast
2007-09-29, 01:50:46
Nicht wenn keine spezielle Logik für Supersampling vorhanden ist.Selbst in dem Fall sollte noch RGSSAA nach der S3-Methode drin sein oder per Multipass sogar beliebige Samplemuster und Samplemengen, so lange der Speicher ausreicht. Bei Multipass-SSAA sollte es eigentlich sogar möglich sein, mit weniger Speicher auszukommen und adaptiv so lange mehr Samples zu berechnen, bis der nächste Vsync (oder ein Teiler davon, wenn man z.B. mit 30 FPS bei 60 Hz bereits mit der Flüssigkeit zufrieden wäre) anfällt. Alles natürlich IMHLO.

Exxtreme
2007-09-29, 12:44:31
Wie wir alle wissen bricht der R600 bei nahezuallen Qualitätseinstellungen unheimlich ein.

Mehr dazu hier:
http://www.forum-3dcenter.org/vbulletin/showthread.php?t=382321


Nun eigentlich zu meiner Überlegung.
Wieso nimmt man statt MSAA nicht SSAA?

SSAA ist ja nichts anderes als mehrere Pixel, oder des Samples von mehren Pixeln, in einem Pixel unterzubringen.
So wäre 4xSSAA bei einer Auflösung von 1280x1024 sogar eine theoretische Auflösung von 2560x2048 Pixel(am gängisten ist 2560x1920).
Nun hab ich mir alle möglichen Benches betrachten und stellte fest, dass eine Auflösung 2560x1920 teilweise weniger Einbruche hat als AA und AF bei 1280x1024 hat.
Das Problem ist, der R600 hat ene AF-Schwäche. Bei 4x SSAA hast du zwar 2x AF schon nebenbei eingebaut, müsstest aber noch weiter 8x AF zuschalten um auf den gleichen Effekt zu kommen.

Weiterhin funktioniert Color Compression mit SSAA nicht was wiederum Bandbreite spart. Doch sollte der R600 wirklich genug davon haben bei dem Interface.

Ansonsten ist das eine interessante Überlegung. =)