PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Warum nur frißt 4xS soviel Performance?


resonatorman
2004-04-26, 20:28:19
Das 4xS Antialiasing war ja so ziemlich das einzige, was nVidia gegenüber Ati noch auf der Habenseite hatte...deshalb wird es jetzt wohl auch abgeschafft (Losers never win?).
Ich finde die BQ in diesem Modus wirklich schön, den Performanceeinbruch aber nicht. Kann mir vielleicht mal jemand erklären, warum der so gravierend ist? Ich weiß schon, daß das S für den Supersamling-Anteil steht, aber wie hoch ist dieser, und macht das soviel aus (leistungsmäßig)?
Danke schon mal an alle, die sich diesen uninteressanten Thread zu Gemüte führen...

ow
2004-04-26, 20:36:12
.

Raff
2004-04-26, 20:37:15
AFAIK wird durch den SuperSamling-Anteil die Füllrate halbiert (oder geviertelt, sicher bin ich nicht mehr). Was für ne Auswirkung das auf die Leistung hat, hast du ja schon selbst gemerkt. Dennoch: 4xS ist IMHO top, da es praktischerweise auch die Texturen mitglättet.

€dit: Genau. :D

MfG,
Raff

resonatorman
2004-04-26, 20:48:14
Wow, 8 bzw. 9 Minuten...
Ist es denn wirklich so, daß durch 4xS die Füllrate und die Bandbreite halbiert werden oder nur durch reines SS? In letzterem Fall wäre es wirklich mal interessant zu wissen, wie hoch der SS-Anteil bei 4xS wirklich ist.

Jo, 4xS ist wirklich geil, wenigstens etwas, was nVidia Ati voraushat...

Tesseract
2004-04-26, 20:55:02
Original geschrieben von resonatorman
Ist es denn wirklich so, daß durch 4xS die Füllrate und die Bandbreite halbiert werden oder nur durch reines SS? In letzterem Fall wäre es wirklich mal interessant zu wissen, wie hoch der SS-Anteil bei 4xS wirklich ist.

bei 4xS wird füllrate halbiert,
bei komplettem SS wird die füllrate geviertelt (bei doppelter auflösung beider achsen)

Quasar
2004-04-26, 20:59:05
Es wird bei 4xS auf einer Achse 2xSupersampling betrieben, wie ow schon sagt, da hast du deinen Supersampling-Anteil.

Ansonsten mal einen Blick in Leo's Reviews werfen, da werden die AA-Modi immer genau aufgeschlüsselt.


Ich für meinen Teil bin gayspannt auf 4x4-Supersampling.

Für welche Games ein 1x1-Chip mit 2,2GB/s Bandbreite wohl so heute noch langt und wie die dann ausschauen? X-D

Tesseract
2004-04-26, 21:03:48
Original geschrieben von Quasar
Ich für meinen Teil bin gayspannt auf 4x4-Supersampling.


was soll schon tolles sein, ruckelt wie sau und sieht geil aus ;)

ich bin eher gespannt was aus dem 8xS mit dem 2x1 SS anteil wird

das sollte eigendlich recht schnell sein für die quallität und könnte eine echte alternative werden im mehr-als-4xRG-bereich - zumindest in der theorie ;)

BlackArchon
2004-04-26, 21:04:51
Gibts auch 2x2 SS? Habe gerade keine Nvidia-Karte in Reichweite...

ow
2004-04-26, 21:09:41
.

BlackArchon
2004-04-26, 21:30:39
Ja, beim aTuner hab ich mal die Option gesehen, dachte ich zumindest.

Bei 2x2 SSAA bleibt dann bei einer FX 5900XT also noch 1x2 (=800 MTexel/s?) und ~5,5 GB/s Bandbreite übrig? Na das wäre ja nicht so toll. :(

resonatorman
2004-04-27, 00:36:41
Also : der atuner bietet bei D3D wirklich 2x2 Supersampling an, und wie zu erwarten war ist es voll der Leistungskiller...

Mr. Lolman
2004-04-27, 00:44:30
Original geschrieben von Quasar
Ich für meinen Teil bin gayspannt auf 4x4-Supersampling.

Für welche Games ein 1x1-Chip mit 2,2GB/s Bandbreite wohl so heute noch langt und wie die dann ausschauen? X-D

Hm, ist 4x langsamer als 3dfxsches 4xRGSAA und sieht im Vergleich dazu ungefähr so gut aus wie 4xOGMSAA vgl mit 4xRGMSAA.

MadManniMan
2004-04-27, 00:44:56
resonatorman,

bei 4xS - den ich sehr gern benutzt habe mit meiner GF3 - kommt der Durst nach Bandbreite auch noch durch den Chiptyp Zustande.
Zusätzlich zum vertikalen Oversampling (wie gesagt 1x2) kommt ja noch der RGMS-Anteil. Beim GF3 schluckt 2*Multisampling zB in bandbreitenlimitierten Szenen tatsächlich die hälfte der Bandbreite. Mit dem NV25 hat sich das gebessert(siehe Framebufferdownsampling bei 2*MS) und ab dem NV30 kommt die Farbkompression hinzu -> der Bandbreitenbedarf sinkt.
Der Füllratenbedarf liegt bei 4xS bei allen Chips ab NV20 irgendwo über 200% - 200% erstmal duch das Supersampling, vielleicht nochmal 5-15% durch das Multisampling ... je nach Anteil an Polygon- und Schnittkanten der Szene.
Der Bandbreitenbedarf liegt bei etwas über 200 bis tatsächlich auch 400% - je älter der Chip, desto größer der Hunger ... was sich noch dadurch verstärkt, da die tatsächlich vorhandene Bandbreite bei den älteren Chips auch noch am geringsten ist ;)

MadManniMan
2004-04-27, 00:48:18
Original geschrieben von Mr. Lolman
Hm, ist 4x langsamer als 3dfxsches 4xRGSAA und sieht im Vergleich dazu ungefähr so gut aus wie 4xOGMSAA vgl mit 4xRGMSAA.

Du bringst da glaub ich was durcheinander - es geht AFAIK ( :freak: ) um einen Modus mit 4*4 = 16 Samples. Ergo dieselbe EER wie wie 4*RGSS. Aber da beim Supersampling die pure Sampleanzahl stärker positiv auf die Gesamtquali wirkt als eben bei Multisampling, wird das Bild verdammt exzellent!

Dazu noch - per Treiber endlich freigeschaltetes ;) - nicht winkeladaptives 16Sample AF ... *RRRRRRRR* :liplick: -> "64*AF" ;D

Quasar
2004-04-27, 08:22:18
Original geschrieben von Mr. Lolman
Hm, ist 4x langsamer als 3dfxsches 4xRGSAA und sieht im Vergleich dazu ungefähr so gut aus wie 4xOGMSAA vgl mit 4xRGMSAA.

Siehe MMMs Kommentar dazu. Und viermal langsamer als das von 3dfx mit der V5 5500 wird es sicher nicht, da hier ein etwas anderer Chip mit etwas anderer Speicherbandbreite zum Zuge kommt.

3dfx (mit 4xRGAA):
83MPix/s* | 166MTex/s | ~1,3GB/s | EER 4*4 | 4 Samples | keine Kompressionstechniken, EarlyZ etc.

nV40u (mit 16xOGAA):
400MPix/s | 400MTex/s | ~2,2GB/s | EER 4*4 | 16 Samples | Kompressionstechniken, EarlyZ etc.

Bin gayspannt, wie gesagt. Vor allem, da laut Aussage vieler 3dfx-Besitzer 4xAA durchaus noch in einigen Games nutzbar war. Denn mit den reinen Rohleistungsdaten dürfte das bei der 6800U noch um einiges Besser „aussschauen”.

edit:
* sind natürlich weiterhin 166MPix/s. Thx an Mr.Lolman für den Hinweis!

resonatorman
2004-04-27, 12:20:23
Ok...so wie es aussieht, schluckt 4xS dank des Supersamplinganteils also mindestens die doppelte Füllrate und die doppelte Bandbreite, das erklärt natürlich einiges. Ist also nur eine Option für nicht mehr ganz aktuelle Spiele, bei denen sich die Grafikkarte langweilt.
Danke an alle.
Super Forum, abends gefragt, morgens gewußt!

Mr. Lolman
2004-04-27, 12:24:20
Warum sind dann die Hybridmodi so grauslich langsam?

4xAA war in 1024x768 auf der Voodoo5 5500PCI nur bei manchen Glidegames nutzbar. (UT, Undying)

Ausserdem meinte ich nicht den VSA100 im Vergleich zum NV40, sondern die Technik ansich. Bei einem 4x4 EER müsste man bei OG Supersampling 16x das Bild rechnen, bei RG nur 4x. Und die AF Geilheit ´kann ich auch nicht nachvollziehen, da selbst Atis 16xAF schon ausreicht, um die Texturen in der entfernung sichtbar zu kacheln. Da hab ich ein bisschen unschärfe schon lieber. Und ob der SS Anteil noch wirklich soviel bringt oberhalb 4xRG.. Ja das Bild wär schön glatt, aber das wars auch auf meiner V5, und zwar so sehr, dass man das LOD problemlos auf -1.5 schrauben konnte, was AF schon fast wieder überflüssig macht. Insgesamt ist 4x4OGSSAA im Verhältnis Aufwand vs. Qualität wohl einer der unbrauchbarsten Modi. Wenn schon SSAA, dann wenigstens RG...

Undying mit 4xRGSSAA:
http://www.forum-3dcenter.de/vbulletin/showthread.php?postid=1722902#post1722902

MadManniMan
2004-04-27, 12:35:17
Wie bereits gesagt: du darfst nicht vergessen, daß bei Supersampling die pure Samplezahl ein wesentlich gewichtigerer Faktor für die tatsächliche Endquali ist, als es bei MS zu beobachten ist - hier bin ich gar dazu geneigt die EER bei bestmöglicher Subpixelverteilung ( Q hat uns da mal ein schönes Extrembeispiel gezeigt) als mit Anstand wichtigstes Kennmerkmal beim Multisampling zu sehen.

Ergo ... bei MS lieber 6 Samples mit 6*6 als 16 Samples mit 4*4.

Bei Supersampling wäre das anders, mal sehen ;)

MadManniMan
2004-04-27, 12:37:00
Schön, daß du nochmal deinen Pic verlinkt hast - ich tu das jetzt auch mal :D

http://img32.photobucket.com/albums/v95/franz/Shot0001.jpg

Vor allem die NICHT nährungsweise rechtwinkligen Kanten würde nochmal recht deutlich von den 12 Subpixeln mehr profitieren.

Mr. Lolman
2004-04-27, 12:37:55
Original geschrieben von Quasar
Siehe MMMs Kommentar dazu. Und viermal langsamer als das von 3dfx mit der V5 5500 wird es sicher nicht, da hier ein etwas anderer Chip mit etwas anderer Speicherbandbreite zum Zuge kommt.

3dfx (mit 4xRGAA):
83MPix/s | 166MTex/s | ~1,3GB/s | EER 4*4 | 4 Samples | keine Kompressionstechniken, EarlyZ etc.

nV40u (mit 16xOGAA):
400MPix/s | 400MTex/s | ~2,2GB/s | EER 4*4 | 16 Samples | Kompressionstechniken, EarlyZ etc.

Bin gayspannt, wie gesagt. Vor allem, da laut Aussage vieler 3dfx-Besitzer 4xAA durchaus noch in einigen Games nutzbar war. Denn mit den reinen Rohleistungsdaten dürfte das bei der 6800U noch um einiges Besser „aussschauen”.


Sry, aber meine V5 hat bei 4xAA immerhin noch eine Füllrate von 166Mpix/s und auch Texturkompressionsmechanismen à la FXT1, was mittels WickedGL zumindest für jedes OpenGL Spiel aktivierbar war. Dann der 22bit Postfilter, der bei vielen Spielen 32bit überflüssig machte.

Und dann hätt ja noch die V5 6000 rauskommen sollen. 333MPix/s bei 4xAA. Klar der NV40 hätt mehr Samples und immernoch 66Mpix mehr, aber die Spiele sind ja auch etwas aufwändiger geworden...

Mr. Lolman
2004-04-27, 12:40:14
Original geschrieben von MadManniMan
Vor allem die NICHT nährungsweise rechtwinkligen Kanten würde nochmal recht deutlich von den 12 Subpixeln mehr profitieren.

Das würden sie aber auch bei MSAA. ;)

Quasar
2004-04-27, 12:43:05
Original geschrieben von Mr. Lolman
Sry, aber meine V5 hat bei 4xAA immerhin noch eine Füllrate von 166Mpix/s [...]

Hast recht, ich habe mich vertan.

Texturkompressionen meinte ich allerdings nicht. :|

MadManniMan
2004-04-27, 12:44:52
Original geschrieben von Mr. Lolman
Das würden sie aber auch bei MSAA. ;)

Womit du auch wiederum Recht hast :D

Aber ich meinte beim SS-Vorteil eigentlich eben jener "4*AF" und die unheimliche Ruhe bei Alphatestbäumen. Ich würde nur zu gern Gothic2 und FarCry damit sehen =)

Leonidas
2004-04-30, 20:54:27
Original geschrieben von resonatorman
Das 4xS Antialiasing war ja so ziemlich das einzige, was nVidia gegenüber Ati noch auf der Habenseite hatte...deshalb wird es jetzt wohl auch abgeschafft (Losers never win?).




Ist bei der 6800er nach wie vor inoffiziell im Treiber drin, siehe hier:
http://www.3dcenter.org/artikel/nv40_benchmarks/index6.php
(reg13/14)

resonatorman
2004-04-30, 22:40:37
Ja super! Wenn dann demnächst im atuner die entsprechende Option verfügbar sein wird, ist das ein echter Kaufgrund (jedenfalls für mich). Vielleicht wird ja auch noch der Fix für das winkelabhängige AF gefunden...

r@h
2004-05-01, 21:24:25
Original geschrieben von resonatorman
Ja super! Wenn dann demnächst im atuner die entsprechende Option verfügbar sein wird, ist das ein echter Kaufgrund (jedenfalls für mich). Vielleicht wird ja auch noch der Fix für das winkelabhängige AF gefunden... ...ist ja vermutlich ein Bug im Treiber (bin da nicht ganz auf neuestem Stand ;-). I.e. gibt es dort keinen Unterschied zwischen den Performance-Einstellungen "quality" und "high quality". So wird denn vermutet, dass die Einstellung "high quality" nicht mehr ganz so winkelabhängig ist und somit die alte (neue ;-) AF-/Filter-Quali möglich wird (mit Option auch den 'brilinear'-Filter abzustellen).

Bin ja echt mal gespannt, wie sich das in dieser Hinsicht entwickeln wird !

Razor

resonatorman
2004-05-01, 23:12:05
Das heißt also...man darf noch hoffen?