PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Mieses AA bei Nvidia?


Gast
2005-12-21, 17:47:56
Hallo,
wie ich das so mitbekomme wechseln viele zu ATI weil Nvidia schlechtes AA hat.
Das war bei der GF4 z.B. noch ganz anders.

Ich frage mich, wenn es den Leuten doch nicht um 1-3fps geht und die Quali viel wichtiger ist, warum optimieren sie die Qualität nicht mal wieder?

Coda
2005-12-21, 17:50:23
Du meinst sicherlich AF. Das 4xAA ist seit der GeForce 6 rotated grid und um längen besser als das der GeForce 4.

Gast
2005-12-21, 17:51:46
Du meinst sicherlich AF. Das 4xAA ist seit der GeForce 6 rotated grid und um längen besser als das der GeForce 4.

warum meckern dann alle über die Quali?
Selbst wenn es um längen besser ist, warum macht mans nicht noch besser?

Coda
2005-12-21, 17:53:05
Das 4xAA ist so gut wie das von ATI (auf G70 mit Gammakorrektur), es gibt nur kein 6xAA.

Gast
2005-12-21, 17:53:39
Das 4xAA ist so gut wie das von ATI, es gibt nur kein 6xAA.

Fein, dann sag das mal denen im GPU Forum, das die die "Klappe halten" :D

Coda
2005-12-21, 17:54:10
Du verwechselst AF mit AA.

Gast
2005-12-21, 17:55:08
Du verwechselst AF mit AA.

hm....sorry ;)
ja gut dann frag ichso..warum machen sie das AF nicht besser?

StefanV
2005-12-21, 17:55:48
warum meckern dann alle über die Quali?
Selbst wenn es um längen besser ist, warum macht mans nicht noch besser?
Weil dann der Balken kürzer wird und _DAS_ geht nun wirklich nicht ;)

Coda
2005-12-21, 17:55:59
Weil es Transistoren kosten würde und etwas Leistung.

Gast
2005-12-21, 17:59:09
Weil es Transistoren kosten würde und etwas Leistung.
ja aber was nützt die Leistung?
HighEnd User sind doch informiert...da macht es doch nichts aus...was nützt es wenn der Balken da ist und die Kunden weg?

Coda
2005-12-21, 22:16:22
Die meisten Kunden interessiert sowas leider nicht. Auf HQ ist das AF aber auch ganz brauchbar.

Winter[Raven]
2005-12-21, 22:29:24
Weil dann der Balken kürzer wird und _DAS_ geht nun wirklich nicht ;)

Immer wieder schön mitanzusehen, wie sich einige Personen sich alles so zurecht legen wie sie es gern hätten ... :|

Gast
2005-12-21, 22:34:35
hm....sorry ;)
ja gut dann frag ichso..warum machen sie das AF nicht besser?

hat ATI doch gerade gemacht, bis zur x1xxx-serie war das AF bei ATI auch nicht besser.

und vor allem kostet es leistung, und der großteil der käufer schaut leider eher auf balkenlängen als auf bildqualität.

Banshee18
2005-12-21, 22:51:38
Die meisten Kunden interessiert sowas leider nicht. Auf HQ ist das AF aber auch ganz brauchbar.
Wenn ich das winkelunabhängige AF des R5x0 mit dem winkelabhängigen des Nv4x/G70 vergleiche, muss ich dir da eindeutig widersprechen.

Coda
2005-12-21, 22:54:32
"ganz brauchbar" ist es.

Nicht überragend aber ok. Soviel bringt die Winkelunabängigkeit nun auch nicht.

Banshee18
2005-12-21, 23:05:12
"ganz brauchbar" ist es.

Nicht überragend aber ok. Soviel bringt die Winkelunabängigkeit nun auch nicht.
Je nach Spiel hat mich die Winkelabhängigkeit weitaus mehr gestört als das Flimmern auf Q. Das hängt aber stark vom Spiel bzw. dessen Levelgeometrie ab, oft fällt es wirklich nicht störend auf. Ist auch immer ein wenig Geschmackfrage und ob man ein Auge dafür hat. Ich habe gegen Ende leider schon zwanghaft darauf geachtet :( und möchte meinen R520 nicht mehr missen. Je nach Blickwinkel kann man es als brauchbar betrachten.

selbi-elbi
2005-12-26, 17:38:02
Habe wegen dem FLimmern (auch leicht unter HQ, aber die Average FPS unter HQ...oje oje), und des nach wie vor schlechteren AA, meine 7800GTX verkauft, und mir als Übergangslösung, eine flimmerfreie und lautlose X800GTO² @X850XL (16Pipes/400/500MHz) geholt. X850XL deswegen, könnte die zwar locker auf X850XT PE betreiben, aber dann wirds von der Geräuschkulisse unangenehm.
In Rennspielen ist die ATI deutlich besser als die 7800GTX, und das kuriose: bei NFS Most Wanted hatte ich mit der GTX kurze Hänger, mit der ATI GTO läufts Butterweich ohne Aussetzer. Na gut, hatte mit der 7800GTX unter HQ NFS MW gespielt.
Meine Nächste: X1900XL

Gast
2005-12-26, 18:12:10
des nach wie vor schlechteren AA, Was meinst du mit schlechterem AA?

Coda
2005-12-26, 18:28:31
Es gibt keinen 6x Modus, das wars dann aber auch schon.

StefanV
2005-12-26, 18:38:52
']Immer wieder schön mitanzusehen, wie sich einige Personen sich alles so zurecht legen wie sie es gern hätten ... :|
Wie wärs mal, wenn du mal mit Argumenten kommen würdest anstatt mit persönlichen Angriffen?! :|

Was ist so schwer dran, sich um eine Sachliche Ebene zu bemühen?

selbi-elbi
2005-12-26, 18:55:33
Was meinst du mit schlechterem AA?
Der 4AA Modus ist zwar erheblich besser, als der Vorgänger NV30 4AA Modus, dem ATI 4AA Modus ist dieser nach wie vor unterlegen, allerdings nur leicht unterlegen. Dem 6AA Modus hat NV schlicht gar nichts mehr entgegen zu setzen. Gerade bei Rennspielen ist das ATI AA nun mal besser.

Was mir bei meiner 7800GTX weniger gefallen hat waren die Average FPS unter HQ ! Leute, da is nichts mit 3-4% weniger Leistung unter HQ, sondern deutlich mehr, besonder die Average FPS unter HQ sind ein schlechter Witz. Ich musste bei meiner GTX ständig zwischen HQ und Q hin und her schalten.

reunion
2005-12-26, 19:04:07
Der 4AA Modus ist zwar erheblich besser, als der Vorgänger NV30 4AA Modus, dem ATI 4AA Modus ist dieser nach wie vor unterlegen, allerdings nur leicht unterlegen.

Die beiden Modi sind gleichwertig, die Muster sind nur gespiegelt.

Gast
2005-12-26, 19:18:25
Der 4AA Modus ist zwar erheblich besser, als der Vorgänger NV30 4AA Modus, dem ATI 4AA Modus ist dieser nach wie vor unterlegen, allerdings nur leicht unterlegen. Dem 6AA Modus hat NV schlicht gar nichts mehr entgegen zu setzen. Gerade bei Rennspielen ist das ATI AA nun mal besser.
Wie reunion schon sagte, nehmen sich die Modi bis 4x überhaupt nichts. Ati hat halt noch 6xMS, allerdings gibts dafür bei NV die Hybridmodi, die ich persönlich bevorzuge, vor allem bei älteren Spielen.

Komisch, dass meine GTX unter HQ kaum einbricht...

selbi-elbi
2005-12-26, 19:21:43
Wie reunion schon sagte, nehmen sich die Modi bis 4x überhaupt nichts. Ati hat halt noch 6xMS, allerdings gibts dafür bei NV die Hybridmodi, die ich persönlich bevorzuge, vor allem bei älteren Spielen.

Komisch, dass meine GTX unter HQ kaum einbricht...

Finde ich auch komisch das deine GTX keine schlechten Average FPS unter HQ hat. Andere sagen, sie hätten unter HQ bei bestimmten Szenen ne Diashow, die sie unter Q nicht haben. Kann das bestätigen. Aber egal, die GTX ist nicht schlecht.

Fetza
2006-01-03, 13:15:39
Die beiden Modi sind gleichwertig, die Muster sind nur gespiegelt.

Wie meinst du das? nv30 hatte doch 4xog und nv40 4xrg, soweit ich weiss.
Unabhängig davon kann ich als ehemaliger r300 user und jetzt nv40 user ganz klar sagen, das das nv40 aa sehr entäuscht. 4x aa ist sowohl qualitätiv als auch performance technisch ein witz gegen das was die r3xx/r4xx bieten.

Greetz

Fetza

Mr. Lolman
2006-01-03, 13:24:11
Finde ich auch komisch das deine GTX keine schlechten Average FPS unter HQ hat. Andere sagen, sie hätten unter HQ bei bestimmten Szenen ne Diashow, die sie unter Q nicht haben. Kann das bestätigen. Aber egal, die GTX ist nicht schlecht.

Naja bei GTL, Riddick, Quake4 und Serious Sam2 soll der Einbruch tw. doch recht heftig sein.

Gast
2006-01-03, 13:30:55
Naja bei GTL, Riddick, Quake4 und Serious Sam2 soll der Einbruch tw. doch recht heftig sein.

zumindest in Q4 und riddick bricht bei mir selbst die 6800GT in HQ kaum ein, ich glaube nicht dass die 7800er generation sich da schlechter verhält.

Mr. Lolman
2006-01-03, 13:33:49
zumindest in Q4 und riddick bricht bei mir selbst die 6800GT in HQ kaum ein, ich glaube nicht dass die 7800er generation sich da schlechter verhält.

Gerade bei Q4 ist der Einbruch bei G70 Chips relativ heftig - AFAIK. (Ok mit meiner 6800GT habs ichs noch nicht getestet, aber vll. limitiert da ohnehin was anderes)

Fetza
2006-01-03, 13:38:04
zumindest in Q4 und riddick bricht bei mir selbst die 6800GT in HQ kaum ein, ich glaube nicht dass die 7800er generation sich da schlechter verhält.

nee, aber die doom engine is ja die stärke der nv40/g70 karten. Hab mir die 6800gt damals extra nur für doom3 gekauft, und dafür war sie auch genial. Aber die performance einbrüche bei 4xaa sind einfach gewaltig, vom af fang ich jetzt mal nicht an zu sprechen.

Hätte ich damals gewusst, wie ati noch in doom3 mit dem r420 aufholt und das ps/vs30 noch so wenig genutzt würde, hätte ich wieder zu ner ati gegriffen. Damit will ich jetzt nicht sagen, das ich den nv40 für schlecht halte, aber da ich doch sehr auf grafikqualität wert lege, sind die aktuellen nv karten einfach nix für mich.

Spiel mal ein spiel wie daoc oder gothic2 mit beiden karten, jeweils 8xaf und 4xaa, dann wirst du sehen, was ich meine.

Gast
2006-01-03, 13:39:06
Mir geht dieses ganze AA-Gequatsche eh schon seit langem auf die Klöten.

Frisst unheimlich viel Grafikspeicher und man braucht eh ne Lupe um einen sichtbaren Unterschied zwischen 2x, 4x oder 6x AA ab einer 1024er Auflösung ausmachen zu können, besonders während man mitten im Spiel ist...

Anstatt so viel Leistung in AA zu verpulvern wäre es mir tausendmal lieber, sie würden den Speicher in ordentliche Texturen stecken, die endlich mal der Bezeichnung photorealistisch annähernd gerecht werden. Das Potential ist schließlich da, aber stattdessen wird alles in astronomische Auflösungen und xy-fachem AA gesteckt, die Texturen sind mit den letzten Jahren hingegen kaum besser geworden.

Wohlgemerkt ist die Software am PC gemeint, wie es richtig geht hat die Xbox 360 unter Beweis gestellt. Klar nerven dort noch zu Anfang das fehlende AA und AF bei den meisten Spielen. Der Launch eben...
Aber das kriegen die Devs dank dem eDRAM schnell in den Griff und photorealistische Texturen zaubern dagegen Spiele wie Perfect Dark Zero und Kameo heute schon auf den Bildschirm, und das auch in "nur" 720p!

Sollte den PC-Spieleschmieden mit ihrer vermeintlich stärkeren Entwicklungsplattform mal zu denken geben...

cR@b
2006-01-03, 13:39:14
Wenn ich die Graka meines Freundes (x800xtpe) mit meiner jetzigen bzw. mit der vorherigen (68Ultra) vergleiche, dann ist 2xAA auf meiner wesentlich schlechter als auf seiner!! AF sowieso der Witz schlecht hin bei nVidia auch mit HQ hab ich nach wie vor Flimmern bzw. bei Q4 schieb ich so ne Bugwelle vor mir her :(
Die einzigsten Gründe warum ich noch nicht zur anderen Seite gewechselt bin ist a) Digital Vibrance (farbenprächtiger geht es nicht!) b) SLI wesentlich ausgereifter als Crossfire bisher mir fehlt nur noch die zweite Karte ;)
Naja auf kurz oder lang wird nVidia mich aber dennoch verlieren mit ihrer miesen Bildquali.... nur nen Geldscheisser hab ich leider auch nicht :(

cR@b
2006-01-03, 13:41:40
Mir geht dieses ganze AA-Gequatsche eh schon seit langem auf die Klöten.

Frisst unheimlich viel Grafikspeicher und man braucht eh ne Lupe um einen sichtbaren Unterschied zwischen 2x, 4x oder 6x AA ab einer 1024er Auflösung ausmachen zu können, besonders während man mitten im Spiel ist...

Anstatt so viel Leistung in AA zu verpulvern wäre es mir tausendmal lieber, sie würden den Speicher in ordentliche Texturen stecken, die endlich mal der Bezeichnung photorealistisch annähernd gerecht werden. Das Potential ist schließlich da, aber stattdessen wird alles in astronomische Auflösungen und xy-fachem AA gesteckt, die Texturen sind mit den letzten Jahren hingegen kaum besser geworden.

Wohlgemerkt ist die Software am PC gemeint, wie es richtig geht hat die Xbox 360 unter Beweis gestellt. Klar nerven dort noch zu Anfang das fehlende AA und AF bei den meisten Spielen. Der Launch eben...
Aber das kriegen die Devs dank dem eDRAM schnell in den Griff und photorealistische Texturen zaubern dagegen Spiele wie Perfect Dark Zero und Kameo heute schon auf den Bildschirm, und das auch in "nur" 720p!

Sollte den PC-Spieleschmieden mit ihrer vermeintlich stärkeren Entwicklungsplattform mal zu denken geben...

Da muss ich ebenso zustimmen!

Mr. Lolman
2006-01-03, 13:43:45
Wenn ich die Graka meines Freundes (x800xtpe) mit meiner jetzigen bzw. mit der vorherigen (68Ultra) vergleiche, dann ist 2xAA auf meiner wesentlich schlechter als auf seiner!! AF sowieso der Witz schlecht hin bei nVidia auch mit HQ hab ich nach wie vor Flimmern bzw. bei Q4 schieb ich so ne Bugwelle vor mir her :(
Die einzigsten Gründe warum ich noch nicht zur anderen Seite gewechselt bin ist a) Digital Vibrance (farbenprächtiger geht es nicht!) b) SLI wesentlich ausgereifter als Crossfire bisher mir fehlt nur noch die zweite Karte ;)
Naja auf kurz oder lang wird nVidia mich aber dennoch verlieren mit ihrer miesen Bildquali.... nur nen Geldscheisser hab ich leider auch nicht :(

vll. sind noch ein paar Optimierungen aktiv (ja das kann auch bei HQ passieren -> freut euch auf einen 3DC Artikel zu dieser Problematik)....

Bestmögliche BQ bekommt man so (Reihenfolge ist wichtig):

1. AA/AF einstellen
2. Alle Optimierungen deaktivieren
3. HQ einschalten

Gast
2006-01-03, 13:55:28
Wenn ich die Graka meines Freundes (x800xtpe) mit meiner jetzigen bzw. mit der vorherigen (68Ultra) vergleiche, dann ist 2xAA auf meiner wesentlich schlechter als auf seiner!!

das kann man nicht generell sagen.

die einzigen unterschiede sind das gespiegelte muster (kanten die besonders schlecht erwischt werden sind dann logischerweise auch gespiegelt) und die gamma-anpassung.

gerade letzteres kann aber fluch oder segen sein. denn ob diese etwas bringt hängt vor allem vom monitor und dessen einstellungen ab. bei meinem monitor wirkt das FSAA mit gamma-anpassung schlechter als jenes ohne.
wobei die unterschiede allerdings in jedem fall kaum der rede wert sind.

cR@b
2006-01-03, 14:14:32
vll. sind noch ein paar Optimierungen aktiv (ja das kann auch bei HQ passieren -> freut euch auf einen 3DC Artikel zu dieser Problematik)....

Bestmögliche BQ bekommt man so (Reihenfolge ist wichtig):

1. AA/AF einstellen
2. Alle Optimierungen deaktivieren
3. HQ einschalten

Hmm so geh ich aber doch schon seit eh und je vor!
Wenn ich eine upload Möglichkeit hätte, würde ich mir sogar die Mühe eines kleinen Filmchens machen.

nino
2006-01-03, 14:16:16
Mir geht dieses ganze AA-Gequatsche eh schon seit langem auf die Klöten.

Frisst unheimlich viel Grafikspeicher und man braucht eh ne Lupe um einen sichtbaren Unterschied zwischen 2x, 4x oder 6x AA ab einer 1024er Auflösung ausmachen zu können, besonders während man mitten im Spiel ist...


sorry, aber das ist ziemlich wurst. ich zocke möglichst in 1280x1024 oder 1280x960 und da geht mir das pixelgeflimmere ohne AA ziemlich auf die eier. deutlich fällts z.b. in nfs mw auf, ok wenn diese mysteriöse bewegungsunschärfe einsetzt hat man sowieso nur matsch aber fahr einfach mal ein wenig durch die stadt mit und ohne AA und sag mir dass du keinen unterschied siehst :|

cR@b
2006-01-03, 14:19:00
das kann man nicht generell sagen.

die einzigen unterschiede sind das gespiegelte muster (kanten die besonders schlecht erwischt werden sind dann logischerweise auch gespiegelt) und die gamma-anpassung.

gerade letzteres kann aber fluch oder segen sein. denn ob diese etwas bringt hängt vor allem vom monitor und dessen einstellungen ab. bei meinem monitor wirkt das FSAA mit gamma-anpassung schlechter als jenes ohne.
wobei die unterschiede allerdings in jedem fall kaum der rede wert sind.

Gammekorrektur saugt doch auch an den fps oder? HQ sowieso und naja wie auch immer ich find den Unterschied dennoch enorm.

Gast
2006-01-03, 14:28:57
HQ sowieso und naja wie auch immer ich find den Unterschied dennoch enorm.

beim NV40 ja, bei G7x und R300+ nicht.

Mr. Lolman
2006-01-03, 14:55:57
Hmm so geh ich aber doch schon seit eh und je vor!
Wenn ich eine upload Möglichkeit hätte, würde ich mir sogar die Mühe eines kleinen Filmchens machen.

www.filecabi.net
www.keepmyfile.com
www.rapidshare.de

r00t
2006-01-03, 15:55:05
Habe wegen dem FLimmern (auch leicht unter HQ, aber die Average FPS unter HQ...oje oje), und des nach wie vor schlechteren AA, meine 7800GTX verkauft, und mir als Übergangslösung, eine flimmerfreie und lautlose X800GTO² @X850XL (16Pipes/400/500MHz) geholt. X850XL deswegen, könnte die zwar locker auf X850XT PE betreiben, aber dann wirds von der Geräuschkulisse unangenehm.
In Rennspielen ist die ATI deutlich besser als die 7800GTX, und das kuriose: bei NFS Most Wanted hatte ich mit der GTX kurze Hänger, mit der ATI GTO läufts Butterweich ohne Aussetzer. Na gut, hatte mit der 7800GTX unter HQ NFS MW gespielt.
Meine Nächste: X1900XL


solche hänger kann ich mit meiner 7800GT nicht nachvollziehen ich würd einfach mal behaupten das war ein treiber problem!

AnarchX
2006-01-03, 16:03:24
Nvidia hat mit ihren Bildqualitätsfeatures imho den Zug der Zeit verpasst. Früher konnte man sich noch auf den Mixmodes mit SS ausruhen, aber das wurde mitlerweile durch das AAA von ATI überboten, was weit weniger Performance verbraucht.(alles mehr bezogen auf NV4X)

Aber mal sehen was passiert, wenn die neuen Engines ala Unreal 3 Engine erscheinen. Epic hat ja gemeint das AA ihre Engine massiv einbrechen lassen würde - sprich nicht verwendbar sei...

Coda
2006-01-03, 16:06:21
6xAA bringt ggü. 4xAA nicht soviel, dass es ein großer Vorteil seitens ATi wäre. Beim AF hast wohl recht.

Gast
2006-01-03, 16:08:00
Epic hat ja gemeint das AA ihre Engine massiv einbrechen lassen würde - sprich nicht verwendbar sei...Das gilt wohl nur für heutige Hardware. Bis UT2007 raus ist, werden wir auch noch deutlich leistungsstärkere Grakas haben.

Blaire
2006-01-03, 16:36:10
Richtig , ich vermute schon jetzt das UT2007 der Launchtitel für den G80 wird.

aths
2006-01-03, 17:34:32
"ganz brauchbar" ist es.

Nicht überragend aber ok. Soviel bringt die Winkelunabängigkeit nun auch nicht.In WoW schon.

Fetza
2006-01-03, 17:55:47
6xAA bringt ggü. 4xAA nicht soviel, dass es ein großer Vorteil seitens ATi wäre. Beim AF hast wohl recht.

also die kantenglättung ist schon deutlich besser, auch gerade wenn man es unter qualitäts/performance relation sieht.

Coda
2006-01-03, 18:37:40
Nicht wirklich. Abnehmender Ertrag. Um wirklich sichtbar besseres AA zu bieten müsste man schon 8x nehmen.

Gouvernator
2006-01-03, 19:51:16
Ich sage euch aus eigener Erfahrung das ATI besser ist und war. Mit AAA wurde es fast perfekt. Ich hatte im letztem Jahr : X800pro-->GF6800GT--->X800XT PE. Das 6xAA bei ATI ist ein riesen Vorteil.

Coda
2006-01-03, 20:29:10
Ist es nicht. Der Vorteil kommt vor allem durch das Gamma"korrekte" Downfiltering das G70 auch kann.

Ronny145
2006-01-03, 21:15:50
Ist es nicht. Der Vorteil kommt vor allem durch das Gamma"korrekte" Downfiltering das G70 auch kann.


Hattest du beide Karten schon selber getestet?

Coda
2006-01-03, 21:16:57
Jo. Beim G70 sieht man keinen Unterschied mehr bei 4xAA zu ner Radeon und 6xAA ist eh auch bei ATi nicht viel besser.

Zumindest hab ich es auf meiner 9700 damals nie verwendet, weil es einfach für den Leistungsverlust fast nichts brachte.

Gast
2006-01-03, 21:41:55
sorry, aber das ist ziemlich wurst. ich zocke möglichst in 1280x1024 oder 1280x960 und da geht mir das pixelgeflimmere ohne AA ziemlich auf die eier. deutlich fällts z.b. in nfs mw auf, ok wenn diese mysteriöse bewegungsunschärfe einsetzt hat man sowieso nur matsch aber fahr einfach mal ein wenig durch die stadt mit und ohne AA und sag mir dass du keinen unterschied siehst :|

Natürlich brauchts AA, sonst verkommt das Ganze zu einem ziemlichen Pixelbrei.^^

Nur würde 2x aus meiner Sicht auch schon reichen, mehr ist einfach der "Mühe" nicht wert. Oder besser gesagt bringen sie ein zu großes Opfer für Texturen dar, als dass von release an spielbare 4x oder gar 6x AA sich lohnen würden.

Anstatt das immer so zu regeln, dass der Kunde auf seiner HighEnd-Karte bereits zum Kauf des Spieles trotz max. Settings in hoher Auflösung und 6xAA vernünftig zocken kann, sollten Entwickler das so handhaben, dass bei Ultrahighres-Einstellungen für Texturen (und ich spreche jetzt nicht von deaktivierter Kompression :wink: ) nicht mehr als 1024*768 und 2xAA für ein spielbares Ergebnis drin ist. Im Laufe der Zeit mit stärkeren GPUs kann man beim erneuten Rauspacken und Anspielen dieses Games dann auch höher gehen bei der Bildqualität.

Mit der derzeit gängigen Methode jedoch bleiben die Texturen so matschig, einzige grafikverbessernde Option wäre für später dann 2048*1536 + 8xAA...
Aber ob's noch gegenüber den zu Beginn schon spielbaren Settings von 1280*1024 mit 4xAA derartig viel bringt ist eine andere Frage. :rolleyes:

mboeller
2006-01-04, 08:58:37
IMHO;

hat Nvidia deshalb eine so schlechte AF-Qualität weil sie eine etwas verkorkste Pipeline benutzen.

Da die Pipelines der NV4x/G7x Chips in Reihe geschaltet sind und sie die erste ALU auch noch als TMU benutzen stalled sehr wahrscheinlich die ganze Pixel-Shader-Pipeline wenn die TMU mehr Samples berechnen muss als bei bi, also bei Tri und AF.

Solange die Pipeline der Nvidia-Chips also so aussieht wie sie aussieht ( Pixelshader ALUs in Reihe, 1. PS-ALU = TMU ) bleibt Nvidia gar nichts anderes übrig als für AF mit so wenigen Samples wie nur irgend möglich auszukommen da ansonsten die gesamte Performance in den Keller geht.

Fetza
2006-01-04, 10:34:23
Jo. Beim G70 sieht man keinen Unterschied mehr bei 4xAA zu ner Radeon und 6xAA ist eh auch bei ATi nicht viel besser.

Zumindest hab ich es auf meiner 9700 damals nie verwendet, weil es einfach für den Leistungsverlust fast nichts brachte.

du magst es nicht benutzt haben, weil es in der tat auf der 9700 schon etwas zu langsam war, aber es ist trotzdem eindeutig besses. Ati hat diesen 6x modus handoptimiert, irgendwie gabs dazu hier auch mal nen diagramm. Und nebenbei gemerkt, war der 6xaa modus auf meiner 9800er wesentlich frame stabiler, als der 4xs modus auf meiner jetzigen 6800gt. ;)

Gast
2006-01-04, 12:11:14
IMHO;

hat Nvidia deshalb eine so schlechte AF-Qualität weil sie eine etwas verkorkste Pipeline benutzen.

Da die Pipelines der NV4x/G7x Chips in Reihe geschaltet sind und sie die erste ALU auch noch als TMU benutzen stalled sehr wahrscheinlich die ganze Pixel-Shader-Pipeline wenn die TMU mehr Samples berechnen muss als bei bi, also bei Tri und AF.

Solange die Pipeline der Nvidia-Chips also so aussieht wie sie aussieht ( Pixelshader ALUs in Reihe, 1. PS-ALU = TMU ) bleibt Nvidia gar nichts anderes übrig als für AF mit so wenigen Samples wie nur irgend möglich auszukommen da ansonsten die gesamte Performance in den Keller geht.


Und wie erklärst du dir die noch schlechetere AF Qualität bei ATI bis einschliesslich zum R4x0? Wie du siehst ist deine Theorie wohl kaum haltbar.

Gast
2006-01-04, 13:41:42
IMHO;

hat Nvidia deshalb eine so schlechte AF-Qualität weil sie eine etwas verkorkste Pipeline benutzen.

Da die Pipelines der NV4x/G7x Chips in Reihe geschaltet sind und sie die erste ALU auch noch als TMU benutzen stalled sehr wahrscheinlich die ganze Pixel-Shader-Pipeline wenn die TMU mehr Samples berechnen muss als bei bi, also bei Tri und AF.

Solange die Pipeline der Nvidia-Chips also so aussieht wie sie aussieht ( Pixelshader ALUs in Reihe, 1. PS-ALU = TMU ) bleibt Nvidia gar nichts anderes übrig als für AF mit so wenigen Samples wie nur irgend möglich auszukommen da ansonsten die gesamte Performance in den Keller geht.

imo ist die erste ALU nicht während des ganzen textursamplings blockiert, also nicht die vollen 32 takte die ein 16x-tri-AF-gefilterter pixel braucht.

genauere informationen weiß da wohl außer nvidia selbst keiner.

auf jeden fall kann das design nicht sooo verkorkst sein, wenn man für 2 quads mehr sogar weniger transistoren braucht ;)

außerdem hat man im schlimmsten fall (TMU blockiert erste ALU) gerade mal gleichstand mit ATI was die rechenleistung/pipe angeht (1 TMU+1 ALU auf beiden seiten, dieverse mini-ALUs auf beiden seiten nicht mitgerechnet), hat im besten fall aber die doppelte arithmetische leistung im vergleich zu ATI (pro pipe).

man kann zwar die einzelnen recheneinheiten nicht so gut auslasten wie ATI, aber dafür hat man ja auch deutlich mehr.

Mr. Lolman
2006-01-04, 13:46:16
Und wie erklärst du dir die noch schlechetere AF Qualität bei ATI bis einschliesslich zum R4x0? Wie du siehst ist deine Theorie wohl kaum haltbar.

Ähm, selbst NV40/G70 HQ ist im Durchschnitt schlechter als R3x0/4x0 AI default...

Gast
2006-01-04, 14:43:55
Ähm, selbst NV40/G70 HQ ist im Durchschnitt schlechter als R3x0/4x0 AI default...

Aber nur in deinen Träumen.

(del)
2006-01-04, 14:58:44
Ähm, selbst NV40/G70 HQ ist im Durchschnitt schlechter als R3x0/4x0 AI default...
Ja den hab ich auch nicht gecheckt. Auf und ab bei 3DC unterwegs und die AF bei NV loben :crazy2:

p.s.:Ausgeloggte Trolle sind zum Kotzen :mad:

Gast
2006-01-04, 15:08:16
p.s.:Ausgeloggte Trolle sind zum Kotzen :mad:Eingeloggte ebenso...

(del)
2006-01-04, 15:12:02
Eingeloggte ebenso...
Kann hinhauen. Dafür sind sie dann ggbf. nur dumme Schweine und nicht gleich dumme feige Schweine. Bis dann mal.

Ailuros
2006-01-04, 15:29:48
IMHO;

hat Nvidia deshalb eine so schlechte AF-Qualität weil sie eine etwas verkorkste Pipeline benutzen.

Nein. Die hoehere Winkelabhaengigkeit seit NV4x war eine reine Transistoren-Sparmassnahme und die Filterungs-relativen Optimierungen im Treiber sind ein verkorkster Versuch die Optimierungen der Konkurrenz 1:1 "nachzubauen". Durch das ziemlich verschiedene MIPmapping gibt es dann die jeweiligen Unterschiede.

2xAF ist seit NV4x fast komplett winkelunabhaengig und die Mehrzahl der verwendeten Samples pro Textur (da die Algorithmen eben verdammt adaptiv sind) liegt nicht arg viel hoeher als bei 2x samples. Das Maximum liegt bei 6x samples.

Da die Pipelines der NV4x/G7x Chips in Reihe geschaltet sind und sie die erste ALU auch noch als TMU benutzen stalled sehr wahrscheinlich die ganze Pixel-Shader-Pipeline wenn die TMU mehr Samples berechnen muss als bei bi, also bei Tri und AF.

Erklaert mir aber nicht warum zwischen einfachem bilinear und tri/16xAF in den meisten Faellen (stets ohne AA) nicht in den Keller purzelt. Zwischen bi und 16xAF in FEAR sind es jeweils 58 und 52 fps im eingebauten timedemo und ergo ~10% Verlust.

Solange die Pipeline der Nvidia-Chips also so aussieht wie sie aussieht ( Pixelshader ALUs in Reihe, 1. PS-ALU = TMU ) bleibt Nvidia gar nichts anderes übrig als für AF mit so wenigen Samples wie nur irgend möglich auszukommen da ansonsten die gesamte Performance in den Keller geht.

Au weia, das ist so weit aus dem Fenster gelehnt dass ich schon Deine Fuesse sehen kann ;)

Ailuros
2006-01-04, 15:35:27
Ähm, selbst NV40/G70 HQ ist im Durchschnitt schlechter als R3x0/4x0 AI default...

Da der gesamte Thread sowieso unter dem normalem Nivaeu des Technologie-Forums steht, kann dieser Kommentar ruhig so stehenbleiben.

Wer optimalere Filterungs-Qualitaet haben moechte, sollte auf beiden den bloeden Optimierungs-Mist gefaelligst abschalten. Noch besser wer eine X1k-wasauchimmer besitzt, dann gleich HQ 16xAF.

StefanV
2006-01-04, 15:39:53
Aber nur in deinen Träumen.
Hast du dazu auch irgendwelche belege oder widersprichst du Lolman einfach nur weils Lolman ist?! :|

reunion
2006-01-04, 16:57:11
IMHO;

hat Nvidia deshalb eine so schlechte AF-Qualität weil sie eine etwas verkorkste Pipeline benutzen.

Da die Pipelines der NV4x/G7x Chips in Reihe geschaltet sind und sie die erste ALU auch noch als TMU benutzen stalled sehr wahrscheinlich die ganze Pixel-Shader-Pipeline wenn die TMU mehr Samples berechnen muss als bei bi, also bei Tri und AF.

Solange die Pipeline der Nvidia-Chips also so aussieht wie sie aussieht ( Pixelshader ALUs in Reihe, 1. PS-ALU = TMU ) bleibt Nvidia gar nichts anderes übrig als für AF mit so wenigen Samples wie nur irgend möglich auszukommen da ansonsten die gesamte Performance in den Keller geht.


ACK. nV wäre schön blöd, die AF-Qualität auf ATi-Niveau anzuheben, da man sich dadurch in eine wesentlich schlechtere Ausgangsposition bringen würde, als jetzt, wo mit winkelabhängigem AF verglichen wird.

Gast
2006-01-04, 17:03:17
Ähm, selbst NV40/G70 HQ ist im Durchschnitt schlechter als R3x0/4x0 AI default...
Wie bildest du "den Durchschnitt" und was veranlasst dich zu dieser Behauptung?

Coda
2006-01-04, 17:07:00
du magst es nicht benutzt haben, weil es in der tat auf der 9700 schon etwas zu langsam war, aber es ist trotzdem eindeutig besses. Ati hat diesen 6x modus handoptimiert, irgendwie gabs dazu hier auch mal nen diagramm. Und nebenbei gemerkt, war der 6xaa modus auf meiner 9800er wesentlich frame stabiler, als der 4xs modus auf meiner jetzigen 6800gt. ;)Ja es ist ein gutes Muster mit 6x, aber der Gewinn wiegt die benötigte Leistung bei weitem nicht auf.

Was interessiert in dem Zusammenhang jetzt überhaupt der 4xS Modus? Den auf nem NV40 zu benützen ist eh idiotisch.

Coda
2006-01-04, 17:08:16
ACK. nV wäre schön blöd, die AF-Qualität auf ATi-Niveau anzuheben, da man sich dadurch in eine wesentlich schlechtere Ausgangsposition bringen würde, als jetzt, wo mit winkelabhängigem AF verglichen wird.Der durchschnittliche Pixelshader verbrät bei 16xAF ungefähr (nachgemessen) 20% der Zeit mit warten auf TMU-Lookups. Vergiss es.

mapel110
2006-01-04, 17:19:46
Kann hinhauen. Dafür sind sie dann ggbf. nur dumme Schweine und nicht gleich dumme feige Schweine. Bis dann mal.
Solche Kommentare bitte unterlassen, und das gilt auch für den Gast. Danke.

Ailuros
2006-01-04, 17:22:20
Der durchschnittliche Pixelshader verbrät bei 16xAF ungefähr (nachgemessen) 20% der Zeit mit warten auf TMU-Lookups. Vergiss es.

Maximal oder? Wer moechte es auf einem NV3x nochmal ausprobieren um zu sehen wie es da aussieht?

Ailuros
2006-01-04, 17:30:42
Hast du dazu auch irgendwelche belege oder widersprichst du Lolman einfach nur weils Lolman ist?! :|

Ich hab zwar nichts mit dem Gast zu tun (und will auch nichts mit dem Herrn zu tun haben LOL), aber die Uebertreibung in Lolman's Aussage ist schon da. Zumindest fuer mich und meinen eigenen Erfahrungen mit etlichen Radeons der letzten Jahre seit R300.

Es gibt genug Faelle wo ATI's Optimierungen auch Seiteneffekte zeigen und mehr als genug sogar; entweder man ist dann ehrlich genug und steht diese ein oder versucht eben mit Absicht es so schoenzureden wie es gerade passt.

Coda
2006-01-04, 17:33:11
Maximal oder?Nein, wenn natürlich nur gesampled wird sind es 100%, aber das ist dann auch logisch und bei ATi nicht anders ;)
Deshalb schrieb ich auch "durchschnittlicher Shader". Es ist auf jedenfall lang nicht so schlimm wie manche denken.

Wer moechte es auf einem NV3x nochmal ausprobieren um zu sehen wie es da aussieht?Gib mir einen ;)

Ailuros
2006-01-04, 17:35:28
Gib mir einen ;)

Un momento senior; ich denke ich hab eine Idee falls das FEAR timedemo reichen sollte.

Coda
2006-01-04, 17:43:34
Nein man braucht den Instrumented Driver, NVPerfKit und das DX9 SDK X-D

Mr. Lolman
2006-01-04, 17:47:58
Ich hab zwar nichts mit dem Gast zu tun (und will auch nichts mit dem Herrn zu tun haben LOL), aber die Uebertreibung in Lolman's Aussage ist schon da. Zumindest fuer mich und meinen eigenen Erfahrungen mit etlichen Radeons der letzten Jahre seit R300.

Es gibt genug Faelle wo ATI's Optimierungen auch Seiteneffekte zeigen und mehr als genug sogar; entweder man ist dann ehrlich genug und steht diese ein oder versucht eben mit Absicht es so schoenzureden wie es gerade passt.


Bitte werde konkret und bring Beispiele (+ Screenshots). Ich kenn bisher keine und mag nicht schuld an einem "falschen" 3DC Artikel sein.

Ailuros
2006-01-04, 17:49:28
Nein man braucht den Instrumented Driver, NVPerfKit und das DX9 SDK X-D

Na dann werden wohl Fear Resultate reichen muessen, denn ich hab momentan nicht genug Zeit den ganzen Schnickschnack runterzuladen und zu installieren.

Ailuros
2006-01-04, 17:55:49
Bitte werde konkret und bring Beispiele (+ Screenshots). Ich kenn bisher keine und mag nicht schuld an einem "falschen" 3DC Artikel sein.

Ich hab schon so oft Beispiele von meinen eigenen Erfahrung erwaehnt dass es so langsam laecherlich wird diese konstant zu wiederholen. Nochmal und zum letzten Mal wenn eine Applikation trilinear verlangt, dann sollte sie auch trilinear bekommen; alles darunter fuehrt stellenweise zu Nebeneffekten die leider auch nicht immer auf screenshots zu sehen sind.

Du kannst Dir ja selber einreden dass half-assed brilinear, texturing stage relevante Optimierungen und LOD der mit AF samples ausgetauscht wird besser sein soll als volles trilinear auf allen texturing stages, aber in Echtzeit kann man die paar schwarze Flecken schon sehen; wenn man erstmal dazu Lust hat.

Mr. Lolman
2006-01-04, 18:03:53
Sry, ich hab noch nie einen konkreten Screenshot gesehen, oder ein Savegame zu so einer Szene.

Ich kenn nur die Aion vs Aioff 3DC Videos. und da sieht man keinen Unterschied. Z.b. Farcry - Hier (http://www.forum-3dcenter.de/vbulletin/showpost.php?p=3213366&postcount=5) hab ich ne sehr grenzwertige Szene verlinkt. Wenn du bitte 2 Screenshots einer R4x0/5x0 machen könntest (AIon/off) wäre ich dir schon sehr verbunden.

Noch mehr würde es mich natürlich freuen wenn du nach meiner (noch zu schreibenden) Anleitung 2 Videos von XMas Filtertest erstellen könntest. Die würd ich dann auch für den Artikel verwenden.

/edit:
Ich hab schon so oft Beispiele von meinen eigenen Erfahrung erwaehnt dass es so langsam laecherlich wird diese konstant zu wiederholen. Nochmal und zum letzten Mal wenn eine Applikation trilinear verlangt, dann sollte sie auch trilinear bekommen; alles darunter fuehrt stellenweise zu Nebeneffekten die leider auch nicht immer auf screenshots zu sehen sind.

Du kannst Dir ja selber einreden dass half-assed brilinear, texturing stage relevante Optimierungen und LOD der mit AF samples ausgetauscht wird besser sein soll als volles trilinear auf allen texturing stages, aber in Echtzeit kann man die paar schwarze Flecken schon sehen; wenn man erstmal dazu Lust hat.

Zwar hast du einerseits recht, aber andererseits weisst du mittlerweile hoffentlich auch, dass selbst reines bilineares A-Filtering bei absolut grenzwertigen FlimmerTexturen eine nicht von Lehrbuchmässigen triAF unterscheidbare BQ erreichen kann. Es kommt nur auf die Sampleanzahl drauf an.

Ailuros
2006-01-04, 18:12:06
Sry, ich hab noch nie einen konkreten Screenshot gesehen, oder ein Savegame zu so einer Szene.

Ich kenn nur die Aion vs Aioff 3DC Videos. und da sieht man keinen Unterschied. Z.b. Farcry - Hier (http://www.forum-3dcenter.de/vbulletin/showpost.php?p=3213366&postcount=5) hab ich ne sehr grenzwertige Szene verlinkt. Wenn du bitte 2 Screenshots einer R4x0/5x0 machen könntest (AIon/off) wäre ich dir schon sehr verbunden.

Noch mehr würde es mich natürlich freuen wenn du nach meiner (noch zu schreibenden) Anleitung 2 Videos von XMas Filtertest erstellen könntest. Die würd ich dann auch für den Artikel verwenden.

Wenn ich die versprochene R520 schon in der Hand haette gerne.

Zwar hast du einerseits recht, aber andererseits weisst du mittlerweile hoffentlich auch, dass selbst reines bilineares A-Filtering bei absolut grenzwertigen FlimmerTexturen eine nicht von Lehrbuchmässigen triAF unterscheidbare BQ erreichen kann. Es kommt nur auf die Sampleanzahl drauf an.

Generell heisst Unterfilterung auch maessigere Qualitaet; es reicht mir persoenlich wenn ein paar Faelle Nebeneffekte zeigen. Wuerde es mich nicht stoeren wuerde ich auch viel weniger fuer GPUs ausgeben.

Ailuros
2006-01-04, 18:16:18
Zurueck zum vorigen.....man braucht schon starke Nerven und Geduld Spiele wie Fear auf Scheiss-NV3x HW auszuprobieren. Die 5700 stoent hier um einiges LOL (simply pathetic).

1024*768 mit den vorgeschlagegen vom Spiel minimalen settings (DX9.0 aber komischerweise) und dabei ist bilinear noAF (***edit ) bei 10 fps und 8xAF/tri bei 9 fps ("high quality" im CP). Ich kann zwar die Resultate bei den settings nicht besonders ernst nehmen aber es sind rein zufaellig auch 10% weniger wie bei G70 zwischen bilinear und 16xAF.

(del)
2006-01-04, 18:16:24
Ich hab schon so oft Beispiele von meinen eigenen Erfahrung erwaehnt dass es so langsam laecherlich wird diese konstant zu wiederholen. Nochmal und zum letzten Mal wenn eine Applikation trilinear verlangt, dann sollte sie auch trilinear bekommen; alles darunter fuehrt stellenweise zu Nebeneffekten die leider auch nicht immer auf screenshots zu sehen sind.

Du kannst Dir ja selber einreden dass half-assed brilinear, texturing stage relevante Optimierungen und LOD der mit AF samples ausgetauscht wird besser sein soll als volles trilinear auf allen texturing stages, aber in Echtzeit kann man die paar schwarze Flecken schon sehen; wenn man erstmal dazu Lust hat.
Also das war jetzt irgendwie nicht diese sachlich formulierte Entgegnung die ich von Dir gewohnt bin. Was denn los? Kann man das nur wiederlegen oder nicht? Denn Loli macht sich wenigstens die Arbeit und scheut auch keine Mühe, wenns drauf ankommt. Und Du hast schon so oft Beispiele Deiner eigenen Erfahrungen erwähnt... hmm...

@Mappel
versprochen. sorry :frown:

Gast
2006-01-04, 18:19:04
Zwar hast du einerseits recht, aber andererseits weisst du mittlerweile hoffentlich auch, dass selbst reines bilineares A-Filtering bei absolut grenzwertigen FlimmerTexturen eine nicht von Lehrbuchmässigen triAF unterscheidbare BQ erreichen kann. Es kommt nur auf die Sampleanzahl drauf an.
Wie eliminiert "reines bilineares A-Filtering" denn das Mip-Banding? Oder sprichst du von Fällen, wo kein Mip-Mapping genutzt wird? Da wäre dann auch der Vergleich bi vs. tri ziemlich sinnlos.

Mr. Lolman
2006-01-04, 18:19:35
Wenn ich die versprochene R520 schon in der Hand haette gerne.

Und mit nem R420?


Generell heisst Unterfilterung auch maessigere Qualitaet; es reicht mir persoenlich wenn ein paar Faelle Nebeneffekte zeigen. Wuerde es mich nicht stoeren wuerde ich auch viel weniger fuer GPUs ausgeben.

Unterfilterung und Überfilterung scheinen sich im Idealfall so ziemlich aufzuheben, (was auch Ati geringere Flimmerneigung bei biAF erklärt).

Wenn man (zB) einfach doppelt soviel Samples verrechnet, kann man entweder das LODBias um 1 senken oder, nur um 0.5 und sich dabei den trilinearen Filter sparen. Bei Ati passiert das tatsächlich natürlich im weitaus geringeren Rahmen - LODbiasverschiebung um (afaik) ca 0.05 - der Effekt ist aber dennoch erkennbar...

Ailuros
2006-01-04, 18:31:30
Also das war jetzt irgendwie nicht diese sachlich formulierte Entgegnung die ich von Dir gewohnt bin. Was denn los? Kann man das nur wiederlegen oder nicht? Denn Loli macht sich wenigstens die Arbeit und scheut auch keine Mühe, wenns drauf ankommt. Und Du hast schon so oft Beispiele Deiner eigenen Erfahrungen erwähnt... hmm...

@Mappel
versprochen. sorry :frown:

Die Debatte ist schon so alt dass es tatsaechlich laecherlich geworden ist. Ich hab auch eine Reihe von Beispielen in der Vergangenheit angegeben und bis zum geht nicht mehr darueber diskuttiert. Ich hab aber allen ernstes nicht jetzt den Bock mir extra HW zu kaufen um das zu beweisen was ich schon mehr als oefters auf Radeons sehen konnte und kann. Wenn ich eine bekomme dann gerne, aber es wird noch etwas dauern.

Eben weil ich normalerweise generell der Dokumentation nicht ausweiche sollte ausnahmsweise mal das was ich sehen konnte/kann genug sein und nein screenshots zeigen meistens nicht alles wenn ueberhaupt etwas. Man braeuchte high quality videos dafuer und da reicht FRAPS auch nicht aus.

Gast
2006-01-04, 18:35:43
Wenn man (zB) einfach doppelt soviel Samples verrechnet, kann man entweder das LODBias um 1 senken oder, nur um 0.5 und sich dabei den trilinearen Filter sparen.
Wie genau soll das funktionieren? Mir ist nicht klar, wie du mit "mehr" Samples "andere" (!) Samples ersetzen willst?

Gast
2006-01-04, 18:38:07
Die Debatte ist schon so alt dass es tatsaechlich laecherlich geworden ist. Ich hab auch eine Reihe von Beispielen in der Vergangenheit angegeben und bis zum geht nicht mehr darueber diskuttiert. Ich hab aber allen ernstes nicht jetzt den Bock mir extra HW zu kaufen um das zu beweisen was ich schon mehr als oefters auf Radeons sehen konnte und kann. Wenn ich eine bekomme dann gerne, aber es wird noch etwas dauern.

Eben weil ich normalerweise generell der Dokumentation nicht ausweiche sollte ausnahmsweise mal das was ich sehen konnte/kann genug sein und nein screenshots zeigen meistens nicht alles wenn ueberhaupt etwas. Man braeuchte high quality videos dafuer und da reicht FRAPS auch nicht aus.
Das kann Loli ja "in entgegensetzter Richtung" mit dem gleichen Text entgegnen. Bis da also mal was handfestes auftaucht sollte man ihmo den anderen nicht so anpinkeln. Schliesslich tut er ja auch etwas für seine Aussagen. Jou ne? Bis nachher.

BH abgemeldet

Ailuros
2006-01-04, 18:38:09
Und mit nem R420?

Auch Pech. Ich bekomme von einer IHV-unabhaengigen Quelle fuer Tests und eine begrenzte Zeit eine R520. Bis dahin muss ich leider warten oder 400€ fuer eine XL blechen als Alternative wozu ich nicht unbedingt momentan Lust habe.

Unterfilterung und Überfilterung scheinen sich im Idealfall so ziemlich aufzuheben, (was auch Ati geringere Flimmerneigung bei biAF erklärt).

Aber nicht MIPmap banding wo immer biAF nicht mehr ausreicht und das ist schon eine der Faelle wo es mir schon zu bunt wird.

Wenn man (zB) einfach doppelt soviel Samples verrechnet, kann man entweder das LODBias um 1 senken oder, nur um 0.5 und sich dabei den trilinearen Filter sparen. Bei Ati passiert das tatsächlich natürlich im weitaus geringeren Rahmen - LODbiasverschiebung um (afaik) ca 0.05 - der Effekt ist aber dennoch erkennbar...

Mit "quality" LOD hab ich auch ausschliessliche auf meinen vorigen R300/350 gespielt; und natuerlich auch durch rTool die texturing stage Optimierungen abgeschaltet. Den Trick koennte ich auch auf einer GF anwenden und einfach das eine Auge zudruecken.

Fetza
2006-01-04, 18:41:07
Ja es ist ein gutes Muster mit 6x, aber der Gewinn wiegt die benötigte Leistung bei weitem nicht auf.

Was interessiert in dem Zusammenhang jetzt überhaupt der 4xS Modus? Den auf nem NV40 zu benützen ist eh idiotisch.

Es gibt aber auf dem nv40 nichts vergleichbares hinsichtlich performance/qualitäts relation. Zumindest habe ich bisher noch keinen modus gefunden, und ich hab eigentlich alle getestet, von daher finde ich den 6x modus von ati schon durchaus brauchbar.

Schon war, nur würde ich den performance drop zwischen den 6x modus von ati und eben dem 4xs von nv als ungefähr gleich ansehen, deshalb habe ich den erwähnt.

Ailuros
2006-01-04, 18:41:33
Das kann Loli ja "in entgegensetzter Richtung" mit dem gleichen Text entgegnen. Bis da also mal was handfestes auftaucht sollte man ihmo den anderen nicht so anpinkeln. Schliesslich tut er ja auch etwas für seine Aussagen. Jou ne? Bis nachher.

BH abgemeldet

Ich rede direkt mit Ihm und ja zugegeben in aller Oeffentlichkeit und nicht mit einem namenslosen "Jemand". Dass ich seine Meinung und Aussagen respektiere weiss er schon seit langem; genauso wie es Ihm bewusst ist wie allergisch ich bin gegen uebertriebene Generalisierungen.

Es geht hier nicht darueber ob Loesung A in 90% der Faelle problemlos laeuft sondern um die 10% die Seiteneffekte zeigen koennten. Ich zumindest steig nicht in der Mitte eines Spiels aus und aendere Filterungs-settings weil ploetzlich in map X es zu bescheuert aussieht.

Laeuft jetzt bei Loesung B nur bei 80% der Faelle alles problemlos dann geht es lediglich um die idiotische Haarspalterei in wie vielen Faellen und wie stark der Unterschied zu den fast optimalen 100% sein koennte. Und nochmal fuer die die es verpasst haben, wer Spiele wie BF2 mit Filterungs-Optimierungen spielt auf jeglicher HW sollte sich von solchen Debatten fernhalten.

Fetza
2006-01-04, 18:48:15
Da der gesamte Thread sowieso unter dem normalem Nivaeu des Technologie-Forums steht, kann dieser Kommentar ruhig so stehenbleiben.

Wer optimalere Filterungs-Qualitaet haben moechte, sollte auf beiden den bloeden Optimierungs-Mist gefaelligst abschalten. Noch besser wer eine X1k-wasauchimmer besitzt, dann gleich HQ 16xAF.

naja, aber wenn man schon von niveau spricht, sollte man sich solche sätze auch sparen....

Vielleicht kann nicht jeder hier (mich eingeschlossen) die technischen vorgänge die bei solchen dingen wie aa und af ablaufen haar klein nachvollziehen, dies ist aber auch vollkommen unötig, da das sichtbare ergebnis entscheidend ist. Und was lolman da sagt ist zumindest jetzt quantitativ ( jetzt in bezug auf spielsituation ) gesehen richtig. Soweit ich weiss, hat er nicht behauptet, das die af modelle des r3xx/r4xx in jeder hinsicht beste qualität bringen, aber man muss schon was an den augen haben, um sagen zu wollen hier wären beide chips gleich.... Ausserdem ist möglichst optimale filterungs-qualität auch ansichtssache.... wenn ich mit vernünftigen optimierungen 30% mehr performance erkaufen kann finde ich das besser, als ein nv25 af, was praktisch unbraubar ist, aufgrund des performance drops

Mr. Lolman
2006-01-04, 18:49:13
Wie eliminiert "reines bilineares A-Filtering" denn das Mip-Banding? Oder sprichst du von Fällen, wo kein Mip-Mapping genutzt wird? Da wäre dann auch der Vergleich bi vs. tri ziemlich sinnlos.

Das wäre z.B. eine Möglichkeit - Skizze:

/---------------\
/xxxxxxxxxxxxxxxxx\
/xxx xxx xxx xxx xxx\
Mip1 /xx xx xx xx xx xx xx \
/x x x x x x x x x x x x\
/-------------------------\
/xxxxxxxxxxxxxxxxxxxxxxxxxxx\
Mip0 /xxx xxx xxx xxx xxx xxx xxx x\
/xx xx xx xx xx xx xx xx xx xx x\
/x x x x x x x x x x x x x x x x x\
/-----------------------------------\

x = Textursamples

Ailuros
2006-01-04, 18:50:50
Es gibt aber auf dem nv40 nichts vergleichbares hinsichtlich performance/qualitäts relation. Zumindest habe ich bisher noch keinen modus gefunden, und ich hab eigentlich alle getestet, von daher finde ich den 6x modus von ati schon durchaus brauchbar.

Schon war, nur würde ich den performance drop zwischen den 6x modus von ati und eben dem 4xs von nv als ungefähr gleich ansehen, deshalb habe ich den erwähnt.

Unter Umstaenden ist 6x sparse um einiges schneller als 4xS. Ich hab zwar die AA relevante Debatte nicht verfolgt aber rein vom EER her wuerde ich 4xS (2*4 EER) mit 6x sparse (6*6 EER) erstmal gar nicht vergleichen.

Wenn dann unter Bedingungen (wo man auch klarmacht dass der SSAA Anteil so und so auf Texturen auswirkt blahblah) 6x sparsed gegen 8xS (4*8 EER); wobei natuerlich rein was die Poly-Kanten betrifft 6x sparsed auf der einen Achse besser glaettet, und 8xS dann auf der anderen (6*6 vs. 4*8).

Ich verstehe ATI eigentlich nicht mit dem 512MB Framebuffer auf den X1800XTs haetten sie locker 8x sparsed zuschalten koennen, egal was es an Leistung kostet; langsamer als 8xS waere es auf jeden Fall nicht.

Mr. Lolman
2006-01-04, 18:54:37
. Man braeuchte high quality videos dafuer und da reicht FRAPS auch nicht aus.

:confused: Was macht fraps falsch?

@all: Falls tatsächlich immernoch so großes Interesse an den imo eher minimalen BQ Unterschieden zw. NV HQ und ATi AIon besteht verfass ich eine Anleitung, wie man mit XMas Filtertest und Fraps 1:1 vergleichbare Videos anfertigen kann und bau eure Videos auch in den Artikel ein (der usprünglich bloß von den Eigenheiten des NV Controlpanels handeln sollte;))

Gast
2006-01-04, 18:55:18
Das wäre z.B. eine Möglichkeit - Skizze:

/---------------\
/xxxxxxxxxxxxxxxxx\
/xxx xxx xxx xxx xxx\
Mip1 /xx xx xx xx xx xx xx \
/x x x x x x x x x x x x\
/-------------------------\
/xxxxxxxxxxxxxxxxxxxxxxxxxxx\
Mip0 /xxx xxx xxx xxx xxx xxx xxx x\
/xx xx xx xx xx xx xx xx xx xx x\
/x x x x x x x x x x x x x x x x x\
/-----------------------------------\

x = Textursamples
Dann hättest du an der Grenze von Mip0 und Mip1 (sowie dann Mip1 und Mip2 usw.) zwar sehr viele Samples von der jeweils höher aufgelösten Mip, aber trotzdem wären die beiden Mip-Level völlig unabhängig voneinander, da keine Verrechnung von Samples aus zwei verschiedenen Mips stattfindet.

Oder meintest du was anderes?

Ailuros
2006-01-04, 18:57:20
naja, aber wenn man schon von niveau spricht, sollte man sich solche sätze auch sparen....

Vielleicht kann nicht jeder hier (mich eingeschlossen) die technischen vorgänge die bei solchen dingen wie aa und af ablaufen haar klein nachvollziehen, dies ist aber auch vollkommen unötig, da das sichtbare ergebnis entscheidend ist. Und was lolman da sagt ist zumindest jetzt quantitativ ( jetzt in bezug auf spielsituation ) gesehen richtig. Soweit ich weiss, hat er nicht behauptet, das die af modelle des r3xx/r4xx in jeder hinsicht beste qualität bringen, aber man muss schon was an den augen haben, um sagen zu wollen hier wären beide chips gleich.... Ausserdem ist möglichst optimale filterungs-qualität auch ansichtssache.... wenn ich mit vernünftigen optimierungen 30% mehr performance erkaufen kann finde ich das besser, als ein nv25 af, was praktisch unbraubar ist, aufgrund des performance drops


Auf dem winkelabhaengigerem AF Algorithmus von R4xx/R5xx kann man folgendes finden bei Treiber default:

1.) "Brilinear"
2.) Texturing stage Optimierungen wo stage "0" mit (1) eingeschaltet "brilinear" abbekommt, stages "1-7" weiss der Geier was immer auch unterhalb trilinear.
3.) Weitere Texturing-stage Optimierungen wobei aggressiverer negativer LOD mit AF samples ausgetauscht wird.

So viel anders ist es bei GeForces auch nicht, mit der Ausnahme das nach den Filterungs-Testern bei (2) von stages 1-7 nur noch bilinear gefiltert wird.

Diesen Mischmasch oben aber equivalent zu vollem trilinear auf allen texturing stages zu behaupten ist in der Theorie als auch in der Praxis eine Zumutung.

Ailuros
2006-01-04, 19:01:56
:confused: Was macht fraps falsch?

Die Genauigkeit und Aufloesung ist mir zu gering.

Und uebrigens handelt es sich bei den 3DC videos im Flimmer-Artikel um Treiber vor dem 78.03.

Gast
2006-01-04, 19:04:06
Die Genauigkeit und Aufloesung ist mir zu gering.

Und uebrigens handelt es sich bei den 3DC videos im Flimmer-Artikel um Treiber vor dem 78.03.
Die Vollversion von FRAPS frapst bis 1152x864 mit, soweit ich mich erinnere und produziert auch recht anständige Resultate.

Mr. Lolman
2006-01-04, 19:10:11
Dann hättest du an der Grenze von Mip0 und Mip1 (sowie dann Mip1 und Mip2 usw.) zwar sehr viele Samples von der jeweils höher aufgelösten Mip, aber trotzdem wären die beiden Mip-Level völlig unabhängig voneinander, da keine Verrechnung von Samples aus zwei verschiedenen Mips stattfindet.


1. Natürlich gibts mit ATi biAF auch Mipbanding. Ich beschreib hier lediglich den Idealfall
2. Die Skizze ist sehr ungenau
3. 1 Texel der Mip1 entsteht (im Normalfall) aus dem Mittelwert von 4 Texel der Mip0
4. verrechnet man pro Pixel nun 4 Texel der höher aufgelösten Mip entspricht das genau 1 Texel der nächst niedriger aufgelösten Mip.

Noch ne Skizze:

/zz zz zz zz zz \
/z z z z z z z z z\
/yyyyyyyyyyyyyyyyyyy\
/yyy yyy yyy yyy yyy y\
/yy yy yy yy yy yy yy yy\
/y y y y y y y y y y y y \
/xxxxxxxxxxxxxxxxxxxxxxxxxxx\
Mip0 /xxx xxx xxx xxx xxx xxx xxx x\
/xx xx xx xx xx xx xx xx xx xx x\
/x x x x x x x x x x x x x x x x x\
/-----------------------------------\

x = Textursamples
y= 2x (korrekt wäre 4x, aber dann stimmt die Skizze noch weniger)
z= 2y (bzw 4y)

Ailuros
2006-01-04, 19:11:54
Die Vollversion von FRAPS frapst bis 1152x864 mit, soweit ich mich erinnere und produziert auch recht anständige Resultate.

Zu wenig fuer high end Vergleiche.

Gast
2006-01-04, 19:21:39
1. Natürlich gibts mit ATi biAF auch Mipbanding. Ich beschreib hier lediglich den Idealfall
2. Die Skizze ist sehr ungenau
3. 1 Texel der Mip1 entsteht (im Normalfall) aus dem Mittelwert von 4 Texel der Mip0
4. verrechnet man pro Pixel nun 4 Texel der höher aufgelösten Mip entspricht das genau 1 Texel der nächst niedriger aufgelösten Mip.

Noch ne Skizze:

/zz zz zz zz zz \
/z z z z z z z z z\
/yyyyyyyyyyyyyyyyyyy\
/yyy yyy yyy yyy yyy y\
/yy yy yy yy yy yy yy yy\
/y y y y y y y y y y y y \
/xxxxxxxxxxxxxxxxxxxxxxxxxxx\
Mip0 /xxx xxx xxx xxx xxx xxx xxx x\
/xx xx xx xx xx xx xx xx xx xx x\
/x x x x x x x x x x x x x x x x x\
/-----------------------------------\

x = Textursamples
y= 2x (korrekt wäre 4x, aber dann stimmt die Skizze noch weniger)
z= 2y (bzw 4y)

Verstehe ich leider immer noch nicht. Willst du komplett nur aus einem Mip-Level samplen?? Was meinst du mit Idealfall??

Für den Übergang musst du ja mindestens (aus dem fett hervorgehobenen) (2x+2y):4 haben. Sonst gibt es immer Mip-Banding.

Mr. Lolman
2006-01-04, 19:22:03
Auf dem winkelabhaengigerem AF Algorithmus von R4xx/R5xx kann man folgendes finden bei Treiber default:

1.) "Brilinear"

Siehe dazu meine Ausführungen zum reinen biAF. Weniger texel + mehr Interpolation können genauso reichen. Warum beschwert sich niemand über eine Bugwelle bei zwangsbrilinearem ATiAF. Alle blind?


2.) Texturing stage Optimierungen wo stage "0" mit (1) eingeschaltet "brilinear" abbekommt, stages "1-7" weiss der Geier was immer auch unterhalb trilinear.

Gibts den Mist tatsächlich immernoch? Immerhin ist (im Ggs zu NV) AppAF davon nicht betroffen.


3.) Weitere Texturing-stage Optimierungen wobei aggressiverer negativer LOD mit AF samples ausgetauscht wird.Was imo nich weiter schlimm ist, im Ggt, sogar ein vorteil darstellen kann, wie die überlegene ATi BQ bei div Rennspielen (LFS, F1 2001, GTR/GTL) zeigt.


So viel anders ist es bei GeForces auch nicht, mit der Ausnahme das nach den Filterungs-Testern bei (2) von stages 1-7 nur noch bilinear gefiltert wird.Wobei biAF bei NV ungleich schlimmer wirkt als bei ATis.


Diesen Mischmasch oben aber equivalent zu vollem trilinear auf allen texturing stages zu behaupten ist in der Theorie als auch in der Praxis eine Zumutung.Bietet ja NV bei HQ genausowenig (brilinear bei TS>0, nachgewiesenermassen zumindest bei UT2004) Falsche Einstellungen können auch bilinear über alle TS@HQ bringen. Und zwar:

1. Restore
2. AF einstellen
3. HQ einstellen
4. OpenGL Spiel spielen

Mr. Lolman
2006-01-04, 19:24:45
Zu wenig fuer high end Vergleiche.

Zuviel für den durchschnittrechner der das unkomprimiert mit am Besten noch min 30fps abspielen soll.

Gast
2006-01-04, 19:27:15
Zu wenig fuer high end Vergleiche.
Schlechte Texturen sieht man bei niedrigen Auflösungen aber besser.

Mr. Lolman
2006-01-04, 19:38:50
Verstehe ich leider immer noch nicht. Willst du komplett nur aus einem Mip-Level samplen??

Ich nicht, aber fehlende Mipmaps (z.B. GTA SA) führen zu einer noch größeren Unterfilterung als bilineares Filtering. Erhöht man Richtung Z kontinuierlich die Sampleanzahl,flimmert trotz fehlenden Mips nix. (Natürlich kann man statt "x x x" gleich "zzzz" nehmen -> das ergäbe aber eine größtenteils unnötige Überfilterung)


Was meinst du mit Idealfall??Mit "Idealfall" ist idF der notwendige Grad an Überfilterung gemeint, um Mipmapbanding bei biAF komplett zu vermeiden.


Für den Übergang musst du ja mindestens (aus dem fett hervorgehobenen) (2x+2y):4 haben. Sonst gibt es immer Mip-Banding.Ja sicher bräuchte man kurz vorn übergang min 4 Texel (hab ich eh in klammer unter die Skizze geschrieben;)). Meine Skizzen zeigen aber nur 2 Texel => hab für ne genauere keinen Nerv gehabt => wie sie korrekt aussehen müsste geht aus meinen Ausführungen hervor :)

Gast
2006-01-04, 20:02:39
Ich nicht, aber fehlende Mipmaps (z.B. GTA SA) führen zu einer noch größeren Unterfilterung als bilineares Filtering. Erhöht man Richtung Z kontinuierlich die Sampleanzahl,flimmert trotz fehlenden Mips nix. (Natürlich kann man statt "x x x" gleich "zzzz" nehmen -> das ergäbe aber eine größtenteils unnötige Überfilterung)
Bilineare Filterung unterfiltert nicht per se. Fehlendes Mip-Mapping resultiert immer in Mip-Banding. Deine Aussage (kein Mip-Mapping) und deine Skizze (doch Mip-Mapping) passen nicht zueinander. Deshalb habe ich Schwierigkeiten gehabt, den Sinn dahinter zu sehen.

Mit "Idealfall" ist idF der notwendige Grad an Überfilterung gemeint, um Mipmapbanding bei biAF komplett zu vermeiden.
Wenn du Mip-Mapping hast, wirst du auch Mip-Banding haben, denn wie sehr du auch überfilterst (in deiner Skizze nur horizontal!) – es werden niemals Texturinformationen aus zwei verschiedenen Mipmaps verrechnet, was allein gegen Banding helfen könnte.

Gast
2006-01-04, 20:04:09
Ich nicht, aber fehlende Mipmaps (z.B. GTA SA) führen zu einer noch größeren Unterfilterung als bilineares Filtering. Erhöht man Richtung Z kontinuierlich die Sampleanzahl,flimmert trotz fehlenden Mips nix. (Natürlich kann man statt "x x x" gleich "zzzz" nehmen -> das ergäbe aber eine größtenteils unnötige Überfilterung)
Bilineare Filterung unterfiltert nicht per se. Deine Aussage (kein Mip-Mapping) und deine Skizze (doch Mip-Mapping) passen nicht zueinander. Deshalb habe ich Schwierigkeiten gehabt, den Sinn dahinter zu sehen.

Mit "Idealfall" ist idF der notwendige Grad an Überfilterung gemeint, um Mipmapbanding bei biAF komplett zu vermeiden.
Wenn du Mip-Mapping hast, wirst du auch Mip-Banding haben, denn wie sehr du auch überfilterst (in deiner Skizze nur horizontal!) – es werden niemals Texturinformationen aus zwei verschiedenen Mipmaps verrechnet, was allein gegen Banding helfen könnte.

Gast
2006-01-04, 20:06:35
Bilineare Filterung unterfiltert nicht per se. Fehlendes Mip-Mapping resultiert immer in Mip-Banding. Deine Aussage (kein Mip-Mapping) und deine Skizze (doch Mip-Mapping) passen nicht zueinander. Deshalb habe ich Schwierigkeiten gehabt, den Sinn dahinter zu sehen.


Wenn du Mip-Mapping hast, wirst du auch Mip-Banding haben, denn wie sehr du auch überfilterst (in deiner Skizze nur horizontal!) – es werden niemals Texturinformationen aus zwei verschiedenen Mipmaps verrechnet, was allein gegen Banding helfen könnte.
Den hier bitte ignorieren - "Fehlendes Mip-Mapping resultiert immer in Mip-Banding." ist natürlich Blödsinn. Editieren kann ich nicht.

Ailuros
2006-01-04, 20:09:31
Siehe dazu meine Ausführungen zum reinen biAF. Weniger texel + mehr Interpolation können genauso reichen. Warum beschwert sich niemand über eine Bugwelle bei zwangsbrilinearem ATiAF. Alle blind?

Es gibt genug Faelle wo nur reines trilinear hilft.

Gibts den Mist tatsächlich immernoch? Immerhin ist (im Ggs zu NV) AppAF davon nicht betroffen.

Filterungs-Tester zeigen auf jeden Fall kein bilinear an afaik. Nach ATI's Behauptungen ist es auch kein bilinear aber es wurde auch nicht genau beantwortet um was es sich handelt.

Was imo nich weiter schlimm ist, im Ggt, sogar ein vorteil darstellen kann, wie die überlegene ATi BQ bei div Rennspielen (LFS, F1 2001, GTR/GTL) zeigt.

Negativerer LOD anstatt fuer AF samples. Und da wir schon bei F1 2001 oder 2002 sind (wobei die gleiche engine verwendet wird) wenn Du wirklich kein MIPmap banding auf den Seitenplanken der Tracks sehen kannst, dann konzentrierst Du Dich wohl nur auf Strasse selber. Generell beschissenes MIPmapping und unendliches Texturen-aliasing dass leider nur mit sehr hohen Aufloesungen + hybriden modi oder SSAA beseitigen laesst.

Noch darauf <0.0 LOD (normalerweise im -0.5 Bereich) wenn weder F1 2001 noch 2002 selbst mit +0.5 bei mir akzeptabel aussah ist eine Zumutung. Das soll die bessere Bildqualitaet sein? Und sag mir jetzt bloss nicht dass Du F1 2k1 auf der NV40 nicht mit zumindest 4xS + HQ AF spielen kannst.

Ich hab jetzt keine Lust F1 2001 nochmal zu installieren aber wie toll sieht denn das Ding aus mit -0.5 als Beispiel?

Wobei biAF bei NV ungleich schlimmer wirkt als bei ATis.

Etwas beschissener als beschissen eben. Wie ich schon sagte es handelt sich hier lediglich nur um die gleiche endlose Haarspalterei um eine Situation schoenzureden. Und das was mich eben am meisten stoert an der Affaere ist dass ein Qualitaetsbewusster User wie Du Zeit und Energie verschwendet Optimierungen quasi zu gerechtfertigen, wenn ich im Gegensatz erwarten wuerde dass man sich streng und generell dagegenstellt. Gibt es wirklich Grund auf einer R520 wegen den laecherlichen 5-10% Unterschied zwischen HQ und R3xx/4xx AF nicht den ersten zu bevorzugen? Diese "gut genug" Masche sollte ein Ende nehmen damit dieser Mist auch endlich verschwindet und das unabhaengig von IHVs.

Bietet ja NV bei HQ genausowenig (brilinear bei TS>0, nachgewiesenermassen zumindest bei UT2004) Falsche Einstellungen können auch bilinear über alle TS@HQ bringen. Und zwar:

1. Restore
2. AF einstellen
3. HQ einstellen
4. OpenGL Spiel spielen

Die Sequenz hab ich auch an NV selber verschickt damit sie den Mist auch zurechtstellen (obwohl ich auch keine Antwort erwarte heh); das heisst aber wiederrum nicht dass man HQ nicht einstellen kann. Man muss eben die obrige oede Sequenz einfach vermeiden. Der CP hat noch ein paar weitere kleine bugs und es nicht so dass in allen Treibern alles wie nach Wunsch laeuft.

reunion
2006-01-04, 20:16:46
Nein. Die hoehere Winkelabhaengigkeit seit NV4x war eine reine Transistoren-Sparmassnahme und die Filterungs-relativen Optimierungen im Treiber sind ein verkorkster Versuch die Optimierungen der Konkurrenz 1:1 "nachzubauen". Durch das ziemlich verschiedene MIPmapping gibt es dann die jeweiligen Unterschiede.

2xAF ist seit NV4x fast komplett winkelunabhaengig und die Mehrzahl der verwendeten Samples pro Textur (da die Algorithmen eben verdammt adaptiv sind) liegt nicht arg viel hoeher als bei 2x samples. Das Maximum liegt bei 6x samples.



Erklaert mir aber nicht warum zwischen einfachem bilinear und tri/16xAF in den meisten Faellen (stets ohne AA) nicht in den Keller purzelt. Zwischen bi und 16xAF in FEAR sind es jeweils 58 und 52 fps im eingebauten timedemo und ergo ~10% Verlust.



Au weia, das ist so weit aus dem Fenster gelehnt dass ich schon Deine Fuesse sehen kann ;)


Es ist aber nunmal Tatsache, dass ATi beim AF seit R300 weniger Leistung verliert, als nV. Und das ist selbst beim R520 so, welcher ja mit deutlich weniger Füllrate auskommen muss, als die nV-Konkurrenzprodukte. Erklärung für diesen Umstand?

Ailuros
2006-01-04, 20:22:21
Schlechte Texturen sieht man bei niedrigen Auflösungen aber besser.

Und hoehere Aufloesungen eliminieren bis zu einem Grad solche Nebeneffekte. 1152 oder 1024 ist heutzutage nur noch relevant fuer mainstream und value GPUs. Bei den Preisen die diese verkauft werden sind die Ansprueche auch nicht so hoch; ganz im Gegenteil wenn ich jedesmal ueber 500€ auf den Ladentisch lege.

Ich sehe auch ein dass sich dieses ziemlich arrogant anhoert aber selbst wenn eine Applikation 1600*1200 schaffen wuerde, waeren die resultierenden videos so gigantisch dass es zu umstaendlich waere fuer einen ausfuehrlichen Vergleich. Selbst 1152 ist schon hier ziemlich hoch.

Bildqualitaet ist nicht nur hoechstens subjektiv sondern haengt auch von einigen Faktoren ab wie z.B. zu einem sehr grossen Grad den Bildschirm, dessen Technologie bzw. Zustand/Alter und der verwendeten Aufloesung. Auf einem 7-jaehrigen CRT als extremes Beispiel der am krepieren liegt bekommt man antialiasing und flimmerfreie Grafik in sehr relativem Sinn sogar 'for free'; wenn nicht gleich eine ultra-schmier-ClearType Version ;)

reunion
2006-01-04, 20:24:16
Der durchschnittliche Pixelshader verbrät bei 16xAF ungefähr (nachgemessen) 20% der Zeit mit warten auf TMU-Lookups. Vergiss es.

Ein fünftel der Rechenzeit auf die TMUs warten zu müssen, hört sich nicht gerade nach wenig an. Und wenn man jetzt auch noch auf winkelunabhängiges AF umschwenken würde, würde diese Zeit logischerweise nicht unerheblich steigen.

Natürlich kann man jetzt darüber Streiten, ob das ins Gewicht fällt, aber Tatsache ist nunmal, dass nV umso besser dran ist, je weniger arbeit die TMUs zu erledigen haben.

Ailuros
2006-01-04, 20:25:51
Es ist aber nunmal Tatsache, dass ATi beim AF seit R300 weniger Leistung verliert, als nV. Und das ist selbst beim R520 so, welcher ja mit deutlich weniger Füllrate auskommen muss, als die nV-Konkurrenzprodukte. Erklärung für diesen Umstand?

Dann zeig es mir doch wo und wieso Radeons weniger Leistung mit AF ausschliesslich verlieren. Falls bei Dir jetzt R420/NV40 im Hinterkopf mitspielen sollten, schau Dir nochmal genau die Fuellraten von X800XT PE und 6800U an.

Was genau soll ich Dir erklaeren? Dass die X800PRO und 6800GT sowie die 7800GT und X1800XL etwa auf gleichem Niveau liegen weil eben die Fuellraten dort verdammt vergleichbar sind?

Gast
2006-01-04, 20:26:55
Es ist aber nunmal Tatsache, dass ATi beim AF seit R300 weniger Leistung verliert, als nV. Und das ist selbst beim R520 so, welcher ja mit deutlich weniger Füllrate auskommen muss, als die nV-Konkurrenzprodukte. Erklärung für diesen Umstand?
Nebenläufige TMUs.

Ailuros
2006-01-04, 20:27:43
Ein fünftel der Rechenzeit auf die TMUs warten zu müssen, hört sich nicht gerade nach wenig an. Und wenn man jetzt auch noch auf winkelunabhängiges AF umschwenken würde, würde diese Zeit logischerweise nicht unerheblich steigen.

Natürlich kann man jetzt darüber Streiten, ob das ins Gewicht fällt, aber Tatsache ist nunmal, dass nV umso besser dran ist, je weniger arbeit die TMUs zu erledigen haben.

Und wie lange warten Radeons? ;)

Gast
2006-01-04, 20:29:28
Und hoehere Aufloesungen eliminieren bis zu einem Grad solche Nebeneffekte. 1152 oder 1024 ist heutzutage nur noch relevant fuer mainstream und value GPUs. Bei den Preisen die diese verkauft werden sind die Ansprueche auch nicht so hoch; ganz im Gegenteil wenn ich jedesmal ueber 500€ auf den Ladentisch lege.

Ich sehe auch ein dass sich dieses ziemlich arrogant anhoert aber selbst wenn eine Applikation 1600*1200 schaffen wuerde, waeren die resultierenden videos so gigantisch dass es zu umstaendlich waere fuer einen ausfuehrlichen Vergleich. Selbst 1152 ist schon hier ziemlich hoch.

Bildqualitaet ist nicht nur hoechstens subjektiv sondern haengt auch von einigen Faktoren ab wie z.B. zu einem sehr grossen Grad den Bildschirm, dessen Technologie bzw. Zustand/Alter und der verwendeten Aufloesung. Auf einem 7-jaehrigen CRT als extremes Beispiel der am krepieren liegt bekommt man antialiasing und flimmerfreie Grafik in sehr relativem Sinn sogar 'for free'; wenn nicht gleich eine ultra-schmier-ClearType Version ;)
Alles richtig, ich stimme dir zu. Nur sind solche Bildqualitäts-Videos Anschauungsmaterial und da sollte IMO ruhig absichtlich der Unterschied herausgestellt werden und sei es nur durch die Wahl einer niedrigeren Auflösung, als man für's reale Zocken wählen würde.

Besser so herum und den Leuten sagen: Schaut her, das kann passieren, aber wenn ihr in höheren Auflösungen spielt, wird es weniger auffallen, als abstrakt versuchen zu beschreiben, was und wo Flimmern genau ist.

Ailuros
2006-01-04, 20:32:40
Alles richtig, ich stimme dir zu. Nur sind solche Bildqualitäts-Videos Anschauungsmaterial und da sollte IMO ruhig absichtlich der Unterschied herausgestellt werden und sei es nur durch die Wahl einer niedrigeren Auflösung, als man für's reale Zocken wählen würde.

Besser so herum und den Leuten sagen: Schaut her, das kann passieren, aber wenn ihr in höheren Auflösungen spielt, wird es weniger auffallen, als abstrakt versuchen zu beschreiben, was und wo Flimmern genau ist.

Abstrakt ist dann nach der Logik ein gutes Buch ohne bunte Bilder oder?

Gast
2006-01-04, 20:39:13
Abstrakt ist dann nach der Logik ein gutes Buch ohne bunte Bilder oder?
Das ist zu einfach. Nein, abstrakt ist ein gutes Buch ohne bunte Bilder, die aber sehr hilfreich wären, dem Leser den Sachverhalt rüber zu bringen.

Mr. Lolman
2006-01-04, 20:44:25
Bilineare Filterung unterfiltert nicht per se. Deine Aussage (kein Mip-Mapping) und deine Skizze (doch Mip-Mapping) passen nicht zueinander. Deshalb habe ich Schwierigkeiten gehabt, den Sinn dahinter zu sehen.Die "y" waren keine Mipsamples>0 sondern Ersatz für "xx". (für die in meiner Skizze zuwenig Platz gewesen wären) Das gleiche mit den "z". Außerdem musst du die Samples quadrieren, damit die Anzahl stimmt (auch ein zugeständnis wegen Platzproblemen) => Die Skizze ist ungenau und sollte nur zur optischen Illustration dienen.



Wenn du Mip-Mapping hast, wirst du auch Mip-Banding haben, denn wie sehr du auch überfilterst (in deiner Skizze nur horizontal!) – es werden niemals Texturinformationen aus zwei verschiedenen Mipmaps verrechnet, was allein gegen Banding helfen könnte.Sofern die Mipmaps keinen besonderen Content aufweisen (z.B. Blautönung) ist das egal. Glaubs mir einfach. Es macht keinen optischen Unterschied ob man 4 Texel der Mip0 verrechnet oder 1 der Mip1. Das Ergebnis ist das gleiche.

reunion
2006-01-04, 20:47:00
Dann zeig es mir doch wo und wieso Radeons weniger Leistung mit AF ausschliesslich verlieren.


Es ist schwer, da jetzt ein Beispiel zu finden; alles, was ich auf die schnelle finden konnte, war das (http://www.computerbase.de/artikel/hardware/grafikkarten/2005/test_ati_radeon_x1800_x1600_x1300/9/) (etwas runterscrollen).

Wieso? - Die TMUs sind nebenläufig.



Falls bei Dir jetzt R420/NV40 im Hinterkopf mitspielen sollten, schau Dir nochmal genau die Fuellraten von X800XT PE und 6800U an.

Was genau soll ich Dir erklaeren? Dass die X800PRO und 6800GT sowie die 7800GT und X1800XL etwa auf gleichem Niveau liegen weil eben die Fuellraten dort verdammt vergleichbar sind?


Ich habe Tests mit gleicher Füllrate und Speicherbandbreite auf NV40 und R420 gemacht, und das Ergenis war bei jedem Spiel das gleiche, R420 verliert deutlich weniger durch den AF - R520 zeigt dasselbe Verhalten. Also entweder optimiert ATi deutlich besser, oder was viel warscheindlicher ist, es liegt an den nebenläufigen TMUs, die die Pipeline im Gegensatz zur nV-Lösung nicht blockieren. Lies dich hier (http://www.forum-3dcenter.de/vbulletin/showthread.php?t=252710&page=17&pp=10&highlight=Rampage) mal durch.

reunion
2006-01-04, 20:47:22
Und wie lange warten Radeons? ;)

Gar nicht.

Mr. Lolman
2006-01-04, 21:10:32
Es gibt genug Faelle wo nur reines trilinear hilft.

In der momentanen Praxis ja. Theoretisch kann man alles sogar ganz ohne Mipmaps flimmerfrei filtern.


Filterungs-Tester zeigen auf jeden Fall kein bilinear an afaik. Nichtmal, wenn die Unterschiede innerhalb der Mips minimal sind?


Negativerer LOD anstatt fuer AF samples. Und da wir schon bei F1 2001 oder 2002 sind (wobei die gleiche engine verwendet wird) wenn Du wirklich kein MIPmap banding auf den Seitenplanken der Tracks sehen kannst, dann konzentrierst Du Dich wohl nur auf Strasse selber.Mipmapbanding setzt einen bilinearen Filter vorraus. Also gibts doch noch ATi TS Optimierung?

Außerdem verwendet ATi anscheinend eher mehr AF Samples um Dinge wie negatives LOD oder brilineares AF auszugleichen. Sonst würd das ja in jedem Spiel allerübelst flimmern - und nicht trotz negativem LOD und briAF ähnlich flimmerfrei wie NV-HQ sein.


Generell beschissenes MIPmapping und unendliches Texturen-aliasing dass leider nur mit sehr hohen Aufloesungen + hybriden modi oder SSAA beseitigen laesst. Generell beschissenes Mipmapping gibts nur dann, wenns der IHV verbockt hat. Das mit SSAA ausgleichen halt ich für Blasphemie.
Außerdem baut man schon seit Jahren jedes noch so Kackfeature in GraKas ein nur damit die Contentdesigner keine Spagate ausführen müssen und plötzlich sollen sie sich wegen unzureichendem Filtering mit der Texturschärfe zurückhalten?


Noch darauf <0.0 LOD (normalerweise im -0.5 Bereich) wenn weder F1 2001 noch 2002 selbst mit +0.5 bei mir akzeptabel aussah ist eine Zumutung. Das soll die bessere Bildqualitaet sein? Und sag mir jetzt bloss nicht dass Du F1 2k1 auf der NV40 nicht mit zumindest 4xS + HQ AF spielen kannst.

Was hast du mit dem negativem LOD. Das ist bei ATi (von mir) nachgewiesenermassen gerademal im 0.05er Bereich. Und NV tut negatives LOD garnicht gut. Und dass NV bei vielen Rennspielen mit deaktiviertem LOD Clamp flimmert liegt nicht daran, dass die alle Designer frecherweise negatives LOD verwenden, sondern dass LOD Clamp anscheinend den Filterkernel ändert (mit dem nachteil einer tw. erkauften Unschärfe)


Ich hab jetzt keine Lust F1 2001 nochmal zu installieren aber wie toll sieht denn das Ding aus mit -0.5 als Beispiel?Wieso -0.5?

[quote=Ailuros]
Etwas beschissener als beschissen eben. Wie ich schon sagte es handelt sich hier lediglich nur um die gleiche endlose Haarspalterei um eine Situation schoenzureden. Und das was mich eben am meisten stoert an der Affaere ist dass ein Qualitaetsbewusster User wie Du Zeit und Energie verschwendet Optimierungen quasi zu gerechtfertigen, wenn ich im Gegensatz erwarten wuerde dass man sich streng und generell dagegenstellt. Gibt es wirklich Grund auf einer R520 wegen den laecherlichen 5-10% Unterschied zwischen HQ und R3xx/4xx AF nicht den ersten zu bevorzugen? Diese "gut genug" Masche sollte ein Ende nehmen damit dieser Mist auch endlich verschwindet und das unabhaengig von IHVs.

x) Sag das bitte den Reviewern!!! *heul* Sollen sie doch so benchen wenns nur 10% ausmacht.

x) Vll ist ja jemand so nett und macht in dem Thread Pics mit R520 Ailow und off: http://www.forum-3dcenter.org/vbulletin/showthread.php?p=3845388#post3845388

x) die ganze Energie die du verschwendest mich von meiner Überzeugung abzubringen hättest du schon leicht für Bildbelege nutzen können (Wir diskutieren übern den sh1ce ja schon seit Ewigkeiten. Irgendwann hattest du sicher ne R420)

Die Sequenz hab ich auch an NV selber verschickt damit sie den Mist auch zurechtstellen (obwohl ich auch keine Antwort erwarte heh); das heisst aber wiederrum nicht dass man HQ nicht einstellen kann. Man muss eben die obrige oede Sequenz einfach vermeiden. Der CP hat noch ein paar weitere kleine bugs und es nicht so dass in allen Treibern alles wie nach Wunsch laeuft.Jaja und am besten vermeidet man Rennspiele auch gleich. Dann ärgert man sich auch nicht über den fehlden Komprimiss zw. defaultrendering (Aliasing bei Streckenbegrenzungslinien und der in der Ferne entstehenden Unschärfe derselbigen @LOD Clamp. Und auch wenn man bei F1 2001 4xS zuschalten kann (hab ich schonmal gesagt was ich von OGSSAA halte?) so ist ein G70 lt mancher aussagen bei GTL tw. wieder schon zu langsam für 4xAA/16xHQ AF @ 1280x1024. Was macht man dann da?

(Meine Antworten wären weniger patzig wenn du konkrete Beispiele bringen würdest ;))

/edit: Ich mach gleich ein paar F1 2001 Screenshots mit dem R300.

Gast
2006-01-04, 21:12:06
Die "y" waren keine Mipsamples>0 sondern Ersatz für "xx". (für die in meiner Skizze zuwenig Platz gewesen wären) Das gleiche mit den "z". Außerdem musst du die Samples quadrieren, damit die Anzahl stimmt (auch ein zugeständnis wegen Platzproblemen) => Die Skizze ist ungenau und sollte nur zur optischen Illustration dienen.
Sprichst du jetzt immer noch von Mip-Map-losen Szenarien? Das ist so ein krasser Sonderfall, dafür wäre mir meine Zeit zu schade, mich damit großartig zu beschäftigen.
Außerdem ist da der Vergleich biAF vs. triAF besonders witzlos.

Sofern die Mipmaps keinen besonderen Content aufweisen (z.B. Blautönung) ist das egal. Glaubs mir einfach. Es macht keinen optischen Unterschied ob man 4 Texel der Mip0 verrechnet oder 1 der Mip1. Das Ergebnis ist das gleiche.
Was denn jetzt? Auf einmal doch wieder mit Mip-Mapping?

Es wäre toll, wenn du deine Aussagen etwas klarer formulieren würdest - zumindest für mich. Vielleicht könnte ich dich dann besser verstehen.

Redest du hier jetzt, wie in deinem ersten von mir gequoteten Posting von biAF vs. triAF mit Mip-Mapping? Oder wie später bei dem GTA:SA-Beispiel von Ideal- bzw. Extremfällen??

Sorry, momentan bin ich leider nur verwirrt.

Gast
2006-01-04, 21:14:22
Mipmapbanding setzt einen bilinearen Filter vorraus.
Mip-Map-Banding setzt zuerst mal Mip-Mapping voraus. Banding kann dabei bei Point-Sampling (egal wie sinnlos das mit Mip-Mapping ist), bilinearem oder reduziert-trilinearem Filter (hier je nach Aggressivität der Tri-Band-Reduktion) auftreten.

Mr. Lolman
2006-01-04, 21:15:16
Sorry, momentan bin ich leider nur verwirrt.

Ich bin auch verwirrt. Was ist dir momentan unklar? Wies funktioniert ohne Mipmaps flimmerfreie Grafik zu haben? Oder wie flimmerfreie Grafik mit biAF möglich sein soll?

Mr. Lolman
2006-01-04, 21:16:14
Mip-Map-Banding setzt zuerst mal Mip-Mapping voraus. Banding kann dabei bei Point-Sampling (egal wie sinnlos das mit Mip-Mapping ist), bilinearem oder reduziert-trilinearem Filter (hier je nach Aggressivität der Tri-Band-Reduktion) auftreten.

Ja stimmt :uhammer:

/edit: Natürlich meinte ich mit bilinearem Filtering "linear_mipmap_nearest" - quasi als gegenstück zu trilinearem Filtering (linear_mipmap_linear). (Meine Aussagen sind zum Verständnis oft kontextabhängig- und zugegebenermassen manchmal etwas flappsig formuliert. Das spart Zeit, trotzdem sry fürs Missverständnis ;))

Gast
2006-01-04, 21:16:35
Es ist schwer, da jetzt ein Beispiel zu finden; alles, was ich auf die schnelle finden konnte, war das (http://www.computerbase.de/artikel/hardware/grafikkarten/2005/test_ati_radeon_x1800_x1600_x1300/9/) (etwas runterscrollen).
Sind die TMUs der X850 XT-PE dann etwas weniger nebenläufig als die der X1800XT oder 7800 GTX? Immerhin verliert sie am stärksten durch 16xAF.

Gast
2006-01-04, 21:24:07
Ich bin auch verwirrt. Was ist dir momentan unklar? Wies funktioniert ohne Mipmaps flimmerfreie Grafik zu haben? Oder wie flimmerfreie Grafik mit biAF möglich sein soll?
Mir ist unklar, wieso du erst biAF vs. triAF vergleichst, beim Nachfragen dann einen Idealfall konstruierst wo kein Mip-Mapping stattfindet (Bsp. GTA:SA) und somit bi vs tri eh keine Rolle spielen kann.

Schließlich ist mir auch nicht klar, wie du durch überfiltern gleichzeitig Mip-Banding vermeiden und dabei schneller als tri- oder reduziert-trilineares Filtern sein möchtest?
Für ein Sample der Mip1 bräuchtest du vier aus der Mip0, die du erst berechnen müsstest, anstatt sie vorab per Box-Filter schon fertig verrechnet im Graka-Speicher abgelegt zu haben. Davon bräuchtest du wieder zwei, um sie mit zwei Samples aus der Mip0 zu einem Misch-Sample für den Übergang zu verrechnen. Ich kann nicht glauben, dass da "brilinear" nicht deutlich flotter sein soll.

Gast
2006-01-04, 21:32:06
Zu wenig fuer high end Vergleiche.
Bitte? Was entgeht "mir" den bei dieser Auflösung?

Mr. Lolman
2006-01-04, 21:40:12
Mir ist unklar, wieso du erst biAF vs. triAF vergleichst, beim Nachfragen dann einen Idealfall konstruierst wo kein Mip-Mapping stattfindet (Bsp. GTA:SA) und somit bi vs tri eh keine Rolle spielen kann.

Schließlich ist mir auch nicht klar, wie du durch überfiltern gleichzeitig Mip-Banding vermeiden und dabei schneller als tri- oder reduziert-trilineares Filtern sein möchtest?
Für ein Sample der Mip1 bräuchtest du vier aus der Mip0, die du erst berechnen müsstest, anstatt sie vorab per Box-Filter schon fertig verrechnet im Graka-Speicher abgelegt zu haben. Davon bräuchtest du wieder zwei, um sie mit zwei Samples aus der Mip0 zu einem Misch-Sample für den Übergang zu verrechnen. Ich kann nicht glauben, dass da "brilinear" nicht deutlich flotter sein soll.

Niemand hier weiss was ATi bei ihrem Filter genau drehen. Das sind Mutmassungen in welche Richtung die Optimierungen gehen können. Dass es tatsächlich etwas anders funktioniert ist klar.

Klar ist aber auch, dass ATi bei

x) rein bilinearem AF (+Mipmaps)
x) reduziert trilinerem AF
x) rein bilinearem AF (ohne Mipmaps)

deutlich bessere BQ bietet als NV. Jetzt zeigen Tests dass aktives LOD Clamp die NV filtering an die ATi Filterung anpasst ohne in der Entfernung dessen schärfe zu erreichen.

Diese Umstände lassen den Schluss zu, dass ATi sowohl überfiltert (minimal mehr Samples als notwendig) als auch unterfiltert (minimal negatives LOD) Die LOD-Sache wurde durch div. Tests von mir bestätigt. Die Samplesache bleibt, für die Schlüssigkeit der Theorie notwendige, Spekulation.

Meine Beispiele zeigten also nur, dass es sehr wohl möglich sei, dass biAF nicht zwangläuft zu Mipbanding führen muss (unabhängig vom Texturcontent) - was ja zT vehement bestritten wurde.

Nirgendwo hab ich behauptet, dass sich ATi 1:1 dieser Methodik bedient -meine Extrembeispiele waren nur eine Illustration für den Ansatz den man wählen muss, um das BiBand zu reduzieren, ohne zw. den einzelnen Mipmaps zu interpolieren...

Mr. Lolman
2006-01-04, 21:45:33
Bilineare Filterung unterfiltert nicht per se

Solang die Sampleanzahl innerhalb der Mips Richtung Z gleich bleibt, gibts entweder Überfilterung oder Unterfilterung.

Gast
2006-01-04, 21:58:29
Niemand hier weiss was ATi bei ihrem Filter genau drehen. Das sind Mutmassungen in welche Richtung die Optimierungen gehen können. Dass es tatsächlich etwas anders funktioniert ist klar.

Klar ist aber auch, dass ATi bei

x) rein bilinearem AF (+Mipmaps)
x) reduziert trilinerem AF
x) rein bilinearem AF (ohne Mipmaps)

deutlich bessere BQ bietet als NV. Jetzt zeigen Tests dass aktives LOD Clamp die NV filtering an die ATi Filterung anpasst ohne in der Entfernung dessen schärfe zu erreichen.

Diese Umstände lassen den Schluss zu, dass ATi sowohl überfiltert (minimal mehr Samples als notwendig) als auch unterfiltert (minimal negatives LOD) Die LOD-Sache wurde durch div. Tests von mir bestätigt. Die Samplesache bleibt, für die Schlüssigkeit der Theorie notwendige, Spekulation.

Meine Beispiele zeigten also nur, dass es sehr wohl möglich sei, dass biAF nicht zwangläuft zu Mipbanding führen muss (unabhängig vom Texturcontent) - was ja zT vehement bestritten wurde.

Nirgendwo hab ich behauptet, dass sich ATi 1:1 dieser Methodik bedient -meine Extrembeispiele waren nur eine Illustration für den Ansatz den man wählen muss, um das BiBand zu reduzieren, ohne zw. den einzelnen Mipmaps zu interpolieren...
Ich bin jetzt schon etwa müde. Vielleicht komme ich morgen mal dazu, ausführlicher hierauf einzugehen.

Zwei Dinge aber noch:
a) bilineares Mip-Mapping resultiert in Mip-Banding. Immer.
b) Dass Ati am LOD schraubt wurde schon vor beinahe zwei Jahren bei der Computerbase gezeigt.

Gast
2006-01-04, 22:04:45
In der momentanen Praxis ja. Theoretisch kann man alles sogar ganz ohne Mipmaps flimmerfrei filtern.



kann man, aber es wäre immer langsamer als mip-mapping (mit tri-filter)

mip-mapping übernimmt ja nur einen teil der filterung quasi offline, damit man es nicht mehr in echtzeit machen muss.

wenn du mip-mapping ohne trilinearen filter verwendest kann es immer zu mip-banding kommen (es sei denn du verwendest eine derart geringe texturauflösung, dass es nie zum einsatz der mipmap kommt)

du könntest natürlich solange überfiltern dass nie der einsatz einer mip-map notwendig wird, das wäre dann aber extrem langsam. wird die mipmap aber verwendet kann es unweigerlich zu banding-effekten kommen, egal wie lange du vorher überfilterst, es verschiebt sich lediglich der übergang.

Gast
2006-01-04, 22:05:42
Solang die Sampleanzahl innerhalb der Mips Richtung Z gleich bleibt, gibts entweder Überfilterung oder Unterfilterung.

bilineare filterung sollte nie unterfiltern sondern immer nur überfiltern (gleich wie trilineare)

Mr. Lolman
2006-01-04, 22:15:54
kann man,...
Das widerspricht imo dieser Aussage:


wenn du mip-mapping ohne trilinearen filter verwendest kann es immer zu mip-banding kommen

Mr. Lolman
2006-01-04, 22:30:34
bilineare filterung sollte nie unterfiltern sondern immer nur überfiltern (gleich wie trilineare)

Erst bei nem TextureLODBias von +0.5.

Ailuros
2006-01-04, 22:34:14
In der momentanen Praxis ja. Theoretisch kann man alles sogar ganz ohne Mipmaps flimmerfrei filtern.

Sonderfaelle != die Regel

Mipmapbanding setzt einen bilinearen Filter vorraus. Also gibts doch noch ATi TS Optimierung?

Außerdem verwendet ATi anscheinend eher mehr AF Samples um Dinge wie negatives LOD oder brilineares AF auszugleichen. Sonst würd das ja in jedem Spiel allerübelst flimmern - und nicht trotz negativem LOD und briAF ähnlich flimmerfrei wie NV-HQ sein.

Inwiefern "mehr" AF samples?

Generell beschissenes Mipmapping gibts nur dann, wenns der IHV verbockt hat. Das mit SSAA ausgleichen halt ich für Blasphemie.

ISV wolltest Du wohl sagen oder? Also wenn Dir nicht das beschissene MIPmapping in F1 2001 oder das endlose flimmern auffaellt dann weiss ich auch nicht mehr weiter. Ja F1 2001 und ueberhaupt alle Spiele die auf dieser engine basieren gehoeren zu der Kategorie wo die Entwickler wirklich absoluten Mist geleistet haben. Das heisst aber trotzdem nicht dass das spezifische Spiel auf Radeons besser aussieht; ganz im Gegenteil wenn man es zu hybriden modi vergleicht.

4xS laeuft in dem Spiel garantiert auf Deiner NV40 selbst in 1600*1200.

Außerdem baut man schon seit Jahren jedes noch so Kackfeature in GraKas ein nur damit die Contentdesigner keine Spagate ausführen müssen und plötzlich sollen sie sich wegen unzureichendem Filtering mit der Texturschärfe zurückhalten?

Was hast du mit dem negativem LOD. Das ist bei ATi (von mir) nachgewiesenermassen gerademal im 0.05er Bereich. Und NV tut negatives LOD garnicht gut. Und dass NV bei vielen Rennspielen mit deaktiviertem LOD Clamp flimmert liegt nicht daran, dass die alle Designer frecherweise negatives LOD verwenden, sondern dass LOD Clamp anscheinend den Filterkernel ändert (mit dem nachteil einer tw. erkauften Unschärfe)

Wenn ein AF Algorithmus wie im obrigen krankhaften Fall von F1 2001 auch noch negativen LOD dazuschiebt na dann gute Nacht. In F1 2002 wurde das miserable MIPmapping etwas verbessert und es kamen noch alpha blends anstatt alpha tests dazu (wenn ich mich jetzt nicht total irre).



x) die ganze Energie die du verschwendest mich von meiner Überzeugung abzubringen hättest du schon leicht für Bildbelege nutzen können (Wir diskutieren übern den sh1ce ja schon seit Ewigkeiten. Irgendwann hattest du sicher ne R420)

Nein. Die R420 hab ich total uebersprungen, obwohl ich sie hier und da mal bei Freunden benutzt hatte. Mich juckten schon die Finger vor den Weihnachten fuer eine X1800XL aber mir rennen die Moneten auch nicht gerade aus den Hosentaschen.

Jaja und am besten vermeidet man Rennspiele auch gleich. Dann ärgert man sich auch nicht über den fehlden Komprimiss zw. defaultrendering (Aliasing bei Streckenbegrenzungslinien und der in der Ferne entstehenden Unschärfe derselbigen @LOD Clamp. Und auch wenn man bei F1 2001 4xS zuschalten kann (hab ich schonmal gesagt was ich von OGSSAA halte?) so ist ein G70 lt mancher aussagen bei GTL tw. wieder schon zu langsam für 4xAA/16xHQ AF @ 1280x1024. Was macht man dann da?

Ich bin ein racing sim Fan nur spiel ich meistens die neuesten Spiele durch.

Was soll eine G70 mit 4xS zu langsam sein? Hier hat jemand entweder ne Macke oder er braucht >200 fps damit es fuer ihn spielbar ist.

6800nonU mit sehr fruehen Treibern mit MSAA:

http://www.mitrax.de/?cont=artikel&aid=24&page=5

und ja es ist F1 2002 das um einiges anspruchsvoller ist als F1 2001 und hier dann mit 4xS:

http://www.mitrax.de/?cont=artikel&aid=24&page=11

NFS Underground1 + 4xS:

http://www.mitrax.de/?cont=artikel&aid=24&page=8

(Meine Antworten wären weniger patzig wenn du konkrete Beispiele bringen würdest ;))

/edit: Ich mach gleich ein paar F1 2001 Screenshots mit dem R300.

Och mach soviele screenshots wie Du willst; das unendliche Flimmern auf den Seiten kann man in screenshots sowieso nicht sehen. Sei froh dass ich in F1 2001 nicht hoeher als 1600*1200 gehen kann mit der G70.

Gast
2006-01-04, 22:35:38
Das widerspricht imo dieser Aussage:
Nö, tut's nicht.

Man kann ohne Mip-Mapping flimmerfrei filtern, ja (dein erster Quote). Aber wenn du Mip-Mapping benutzt und kein trilineares Filtering, dann kann es immer zu Mip-Banding kommen (dein zweiter Quote).

Gast
2006-01-04, 22:35:43
Das widerspricht imo dieser Aussage:

nö widerspricht sich nicht.

du kannst theoretisch immer aus der standard-textur samplen, du bräuchtest nur eine hardware die theoretisch so hoch anisotrop filtern kann dass alle texel der originaltextur in die filterung miteinbezogen werden können.

aber wenn du mipmaps verwendest kann ohne lineare mip-interpolation banding auftreten, welches je nach texturcontent mehr oder weniger auffällt.

mipbanding kannst du nur verhindern indem du entweder keine mip-maps verwendest (soll es dabei flimmerfrei bleiben muss die TMU bei extremer verkleinerung ALLE texel der ausgangstextur für den filtervorgang berücksichtigen) oder eben durch trilineare filterung.

Ailuros
2006-01-04, 22:36:58
Bitte? Was entgeht "mir" den bei dieser Auflösung?

1152*864 mag fuer Dich eine hohe Aufloesung sein. Fuer mich war sie es noch vor 4 Jahren.

Gast
2006-01-04, 23:46:25
Abstrakt ist dann nach der Logik ein gutes Buch ohne bunte Bilder oder?
Ich hab noch keine Lehrbücher oder Schukungsunterlagen ohne wenigstens Zeichnungen gesehen. Wogegen ich sowas bei Romanen eher nicht für notwenig halte. hmm...

Gast
2006-01-04, 23:49:39
1152*864 mag fuer Dich eine hohe Aufloesung sein. Fuer mich war sie es noch vor 4 Jahren.
Ich fragte was mir dabei entgeht, wenn man FRAPS "themabezogen" drauf loslässt und nicht welche Auflösung Du für hoch, niedrig oder ausreichend hälst. Das hat mit dem Thema genau wieviel zu tun? Eben.

Ailuros
2006-01-05, 00:07:26
F1 2001
4xS, 16xAF "high quality"
LOD clamp off
2048*1536*32 = 64MTris/s

http://users.otenet.gr/~ailuros/F1-2001.jpg

Ailuros
2006-01-05, 00:39:04
Es ist schwer, da jetzt ein Beispiel zu finden; alles, was ich auf die schnelle finden konnte, war das (http://www.computerbase.de/artikel/hardware/grafikkarten/2005/test_ati_radeon_x1800_x1600_x1300/9/) (etwas runterscrollen).

Wieso? - Die TMUs sind nebenläufig.

Und was soll ich da tolles sehen? X850 = 65%, 6800U = 66%.

7800GTX = 77%, X1800GTX = 82% (wobei ich aber leider zu Deinem Pech die Bandbreite der letzteren auch nicht uebersehen werde).

Und wenn es doch nicht die TMUs sein sollten sondern die texture address Prozessoren? Das Bonbon dass ATI's PR Maschine herausgeworfen hat, ist zwar gut zum nachlutschen aber man sollte das Zeug wenigstens bis zu einem Grad auch verstehen koennen.

Zweitens ein weiterer Versuch hilft vielleicht, denn dieser war wieder ein Schuss ins Leere. Ich sehe keinen einzigen Beweis dass ATI mit gleicher Fuellrate wie auf konkurrierenden Produkten bessere AF Leistung hatte oder hat; und nein einen Widerspruch gibt es hierbei oben auch nicht denn die Fuellraten zu Bandbreite Relation spielt hier auch ihre Rolle mit.

Ich habe Tests mit gleicher Füllrate und Speicherbandbreite auf NV40 und R420 gemacht, und das Ergenis war bei jedem Spiel das gleiche, R420 verliert deutlich weniger durch den AF - R520 zeigt dasselbe Verhalten.

Diese R420 war wohl auf keinen Fall auf 400MHz getaktet oder? War es 16*500 oder 16*520 gegen 16*400 (6800Ultra) dass Du immer noch nicht einsehen willst dass die R420 in diesem Fall eben eine hoehere Fuellrate hat und dementsprechend auch bessere AF Leistung haben wird. Nochmal wie gross war der Unterschied zwischen X800PRO und 6800GT und warum? Koennte es vielleicht rein zufaellig sein dass beide vorerwaehnte GPUs etwa die gleiche Fuellrate haben?

Also entweder optimiert ATi deutlich besser, oder was viel warscheindlicher ist, es liegt an den nebenläufigen TMUs, die die Pipeline im Gegensatz zur nV-Lösung nicht blockieren. Lies dich hier (http://www.forum-3dcenter.de/vbulletin/showthread.php?t=252710&page=17&pp=10&highlight=Rampage) mal durch.

Was soll ich mir besonderes durchlesen das mir nicht schon bekannt ist?

Aus dem Jahr 2004:

We asked Emmett if this was the case with NV40 and he replied that "some in the NV4x range would feature this as it has benefits and drawbacks".

http://www.beyond3d.com/previews/nvidia/nv40/index.php?p=9

....und jetzt mal was anderes das vom anderen Bankufer kommt:

....which can sometimes mean that the more time taken away by texture filtering can remove time from shading, which is why our method of having a separate tex address processor can be beneficial (although that leaves us with other issues)....

Was davor oder danach steht behalt ich momentan immer noch fuer mich, da ich selbst das obrige eigentlich nicht oeffentlich erwaehnen sollte.

Gast
2006-01-05, 08:55:15
Und wenn es doch nicht die TMUs sein sollten sondern die texture address Prozessoren?
Ist das nicht das selbe in unserem Diskussionszusammenhang?

"Nebenläufige TMUs" hat sich eingebürgert, weil ATi halt separate Texture Adress Prozessoren hat (haben muss?), während bei Nvidia diese Aufgabe von einer der beiden Shader Units übernommen wird. Für "höheres" AF muss ich die Texture Coordinaten ja nun irgendwie in die TMU reinpumpen, und so lange ich da keinen ausreichenden FiFO habe, der so groß ist, dass er quasi die TMU Latenz komplett überbrücken kann, werde ich früher oder später die Pipeline stallen.

Alles in allem wundert es mich sowieso, wie die Geforce-Karten beim AF noch so gut mithalten können, selbst auf HQ.

Ailuros
2006-01-05, 09:21:50
Alles in allem wundert es mich sowieso, wie die Geforce-Karten beim AF noch so gut mithalten können, selbst auf HQ.

Womoeglich weil die durchschnittliche Anzahl von AF samples pro Textur immer noch relativ klein ist, weil der arithmetische Stress noch nicht so hoch ist dass es wirklich problematisch werden koennte und weil eben die Entwickler womoeglich bis jetzt an die Vorschriften von NV gehalten haben dass nicht das Ganze ploetzlich daneben geht in einem X-beliebigen Spiel.

Viel anders duerfte der Leistungsverlust mit AF gar nicht sein auf NV3x GPUs mit HQ und geringerer Winkelabhaengigkeit (zwischen bilinear und tri-AF stets und fuer heutige Situationen; dass die Dinger zu lahmarschig fuer alles DX9.0 sind muss man ja nicht noch extra betonen).

Selbst wenn man bei einem G70 heute die Haelfte der ALUs voll beschaeftigen wuerde fuer texture OPs (also "voll" bezweifle ich erstmal), bleibt immer noch genauso viel floating point Power uebrig wie die einer R520.
165 GFLOPs@430MHz gegen 83GFLOPs@625MHz.

Wenn Entwickler wirklich darauf Lust haetten, waere es nicht besonders schwer die eine oder andere Architektur in den "roten" Bereich zu bringen. Ich greife mal ein gigantisches Stueck weiter und wage mich noch mehr OT: dass ich kein AA in etlichen XBox360 Launch-Titeln sehen kann ist verstaendlich (wegen dem fehlenden "tiling"); dass es aber auch an AF fehlt kann ich wiederrum nicht verstehen. Xenos hat afaik keine Optimierungen von den PC-GPUs geerbt, aber ob dieses Grund genug ist bei AF zu sparen? Schaetzungsweise 192GFLOPs@550MHz und 16bi TMUs; ja USC aber so steril nach Zahlen koennte ich es auch eventuell mit einem R580@550MHz vergleichen.

aths
2006-01-05, 10:28:36
Mipmapbanding setzt einen bilinearen Filter vorraus.MIP-Banding setzt lediglich MIP-Mapping voraus. Das Banding kann auch beim Pointsampling auftreten.

aths
2006-01-05, 10:30:26
Ist das nicht das selbe in unserem Diskussionszusammenhang?

"Nebenläufige TMUs" hat sich eingebürgert, weil ATi halt separate Texture Adress Prozessoren hat (haben muss?), während bei Nvidia diese Aufgabe von einer der beiden Shader Units übernommen wird. Das stimmt so nicht. Auch die NV-Pipes haben extra Tex-Units. Die Daten dorthin werden allerdings durch eine Shading-Unit geleitet.

Für "höheres" AF muss ich die Texture Coordinaten ja nun irgendwie in die TMU reinpumpen, und so lange ich da keinen ausreichenden FiFO habe, der so groß ist, dass er quasi die TMU Latenz komplett überbrücken kann, werde ich früher oder später die Pipeline stallen.

Alles in allem wundert es mich sowieso, wie die Geforce-Karten beim AF noch so gut mithalten können, selbst auf HQ.Offensichtlich sind auch die GF-TMUs nebenläufig*. Stalls können trotzdem auftreten, bei nichtnebenläufigen TMUS müssten sie aber in jedem Fall auftreten (sofern man besser als bilinear filtert.)

* Demirug widerspricht hier ja.

Mr. Lolman
2006-01-05, 10:33:56
MIP-Banding setzt lediglich MIP-Mapping voraus. Das Banding kann auch beim Pointsampling auftreten.

Wenn das dein einziger Einwand bezügl meiner ganzen getätigten Aussagen (ab Post #75) ist, bin ich beruhigt :)

(Denn wie ich den Satz gemeint hab, hab ich schon an der Stelle erklärt: http://www.forum-3dcenter.de/vbulletin/showpost.php?p=3845734&postcount=125)

aths
2006-01-05, 10:50:58
Wenn das dein einziger Einwand bezügl meiner ganzen getätigten Aussagen (ab Post #75) ist, bin ich beruhigt :)Den Rest hab ich nicht gelesen, aber das mit dem Banding ist mir so ins Auge gesprungen.

Bezüglich der AF-Realisierung bei der Radeon im Vergleich zur GeForce gibts eine Menge an (teilweise begründeten) Annahmen, aber wenig gesichertes Wissen. Klar ist, dass AF ersten scharfe Texturen erzeugen soll – und zwar überall und nicht winkelabhängig – dabei aber unter keinen Umständen zusätzliches Flimmern erzeugen darf.

Gast
2006-01-05, 12:16:29
Das stimmt so nicht. Auch die NV-Pipes haben extra Tex-Units. Die Daten dorthin werden allerdings durch eine Shading-Unit geleitet.
Ja, weil der TAP nicht unabhängig arbeiten kann. Im Grunde läuft es also auf's selbe hinaus. Wortklaubereien bringen uns hier nicht weiter.

Offensichtlich sind auch die GF-TMUs nebenläufig*. Stalls können trotzdem auftreten, bei nichtnebenläufigen TMUS müssten sie aber in jedem Fall auftreten (sofern man besser als bilinear filtert.)
* Demirug widerspricht hier ja.
Und wenn Demi begründet widerspricht, wieso ist die TMU dann "offensichtlich" doch nebenläufig?

Gast
2006-01-05, 12:18:31
Den Rest hab ich nicht gelesen […]
Solltest du vielleicht aber mal machen. Dann sind solche Wiederholungen, die auch nicht gerade zur Übersichtlichkeit beitragen, vermeidbar.

SKYNET
2006-01-05, 13:08:15
Der 4AA Modus ist zwar erheblich besser, als der Vorgänger NV30 4AA Modus, dem ATI 4AA Modus ist dieser nach wie vor unterlegen, allerdings nur leicht unterlegen. Dem 6AA Modus hat NV schlicht gar nichts mehr entgegen zu setzen. Gerade bei Rennspielen ist das ATI AA nun mal besser.

Was mir bei meiner 7800GTX weniger gefallen hat waren die Average FPS unter HQ ! Leute, da is nichts mit 3-4% weniger Leistung unter HQ, sondern deutlich mehr, besonder die Average FPS unter HQ sind ein schlechter Witz. Ich musste bei meiner GTX ständig zwischen HQ und Q hin und her schalten.


dir ist schon aufgefallen das man die minimum frames misst? und die liegen nunmal nur 3-4% unter denen im Q modus! :P

SKYNET
2006-01-05, 13:17:13
also die kantenglättung ist schon deutlich besser, auch gerade wenn man es unter qualitäts/performance relation sieht.


also ab 1600*1200 ist es wurscht, ob du 4x oder 6x AA hast, da fällt nur noch auf wenn du SS zupackst!

Gast
2006-01-05, 13:37:55
Alles in allem wundert es mich sowieso, wie die Geforce-Karten beim AF noch so gut mithalten können, selbst auf HQ.


selbst wenn beim G70 die erste ALU immer blockiert ist, ist die arithmetische leistung immer noch höher als bei ATI.

außerdem muss die shader-ALU auch bei ATI öfters auf den output der TMU warten, dir bleibt nichts anderes übrig wenn eine arithmetik-anweisung von der vorhergehenden texturanweisung abhängt. du kannst zwar vielleicht die befehle umsortieren und unabhängige befehle dazwischenschieben, dennoch werden öfter mal einige leertakte für die ALU übrigbleiben.

Ailuros
2006-01-05, 13:44:13
dir ist schon aufgefallen das man die minimum frames misst? und die liegen nunmal nur 3-4% unter denen im Q modus! :P

Das ist mir genauso zu stark generalisiert, genauso wie die sture Fixierung auf nur durchschnittliche Frameraten. Generell haengt Leistung von viel zu vielen Faktoren ab, wie z.B. das Spiel selber dessen genre und wie es sich unter gewissen Situationen verhaelt (high & low peaks), Speicherverbrauch mit X oder Y settings usw.

Die Frage ist eher ob wenn man die Optimierungen abschaltet die Spielbarkeit verliert; wenn man alle Spiele gerade am Rand der Spielbarkeit mit "quality" spielen wuerde, dann verliert man im relativen Sinn die Spielbarkeit wenn man HQ einschaltet. Misst man aber wirklich die "Spielbarkeit" durch einen Benchmark oder in Echtzeit? Kann es dass einen Qualitaetsbewussten Spieler auch "tearing" stoeren koennte und ergo man doch vielleicht mit vsync + triple buffering spielen sollte, womit man sowieso wieder etwas an Leistung verliert und es sich hier dann eben um einen anderen "Rand der Spielbarkeit" handelt....

Wer ausschliesslich nur die Filterungs-Unterschiede analysieren moechte, muesste sich mal ueber eine R520 im Vergleich zu einer G70 setzen und Tests ausfuehren zwischen 1x und 16xAF, zwischen 16xAF + Optimierungen und 16xAF ohne Optimierungen und zu guter letzt ATI's HQ modus individuell aber auch mit AI an und aus und das am liebsten in nicht CPU-limitierten Situationen. 3-4% werden es in beiden der Faelle auf jeden Fall nicht sein im Durchschnitt, eher irgendwo =/>15%. Es ist aber auch quasi verschwendete Zeit IHMO denn fuer mich ist es mehr als deutlich dass die R520 einen gesunden Batzen an AA-Leistung durch den neuen Speichercontroller gewinnen und auf high end GPUs wuerde ich auch gar nichts anderes als =/>1280 + 4xAA/16xAF erwarten.

Mich wuerde es uebrigens auch interessieren wieviele heutige X1800/7800 Besitzer einen Bildschirm besitzen der mehr als 1280*1024 schafft. Bei der Aufloesung sehe ich nicht ein wieso auf der einen oder anderen es die Spielbarkeit beinflussen sollte wenn man Optimierungen ganz abschaltet.

aths
2006-01-05, 15:02:23
Ja, weil der TAP nicht unabhängig arbeiten kann. Im Grunde läuft es also auf's selbe hinaus. Wortklaubereien bringen uns hier nicht weiter.Es läuft nicht ganz auf dasselbe hinaus. In gewissen Situationen kann die ALU durchaus (zumindest in Teilen) genutzt werden.

Und wenn Demi begründet widerspricht, wieso ist die TMU dann "offensichtlich" doch nebenläufig?Weil die AF-Leistung beim Pixelshading ansonsten ziemlich absacken müsste. Ich habe bislang keine Beweise in die eine oder andere Richtung selbst gesehen. Dave Kirk behauptet, dass die TMU nebenläufig sei, Demirug meint, dass die TMU grundsätzlich die Pipeline stallt, wenn das Filtern länger als einen Takt braucht. Tridam hat selbst noch keine Tests gefahren, nimmt aber an, dass Demirug sich irrt. Nun ist Demirug dafür bekannt, sich praktisch nie zu irren. Andererseits wären NV40 und G70 bei nichtnebenläufigen TMUs als Fehlkonstruktion zu bezeichnen.

Coda
2006-01-05, 15:38:02
Es gibt zumindest oft Fälle in der sie stallen, ansonsten würde der Instrumented Treiber wohl kamm "% shader_waits_for_tmus" messen können.

Es muss diese aber auch bei ATi geben (Resourcenlimits), aber wohl lange nicht so häufig.

Ailuros
2006-01-05, 16:02:53
Es gibt zumindest oft Fälle in der sie stallen, ansonsten würde der Instrumented Treiber wohl kamm "% shader_waits_for_tmus" messen können.

Es muss diese aber auch bei ATi geben (Resourcenlimits), aber wohl lange nicht so häufig.

Und jegliche theoretische "Wartezeit" ist unabhaengig von der Anzahl jeweiliger Einheiten? Es ist wieder womoeglich ne bloede Frage, aber sonst lern ich auch nicht dazu.

Coda
2006-01-05, 16:22:12
Ich verstehe die Frage nicht, kannst du die vielleicht anders formulieren?

Gast
2006-01-05, 17:32:41
en.

Weil die AF-Leistung beim Pixelshading ansonsten ziemlich absacken müsste. Ich habe bislang keine Beweise in die eine oder andere Richtung selbst gesehen.

zumindest in fear sieht es so aus als würden TMU und ALU parallel arbeiten können. angeblich werden ja recht aufwendige shader verwendet, AF kostet aber recht wenig leistung und filteroptimierungen bringen praktisch nix.

Gast
2006-01-05, 19:26:17
zumindest in fear sieht es so aus als würden TMU und ALU parallel arbeiten können. angeblich werden ja recht aufwendige shader verwendet, AF kostet aber recht wenig leistung und filteroptimierungen bringen praktisch nix.
Das ist logisch, stützt aber eher die gegenteilige These. Je länger die Shader, desto weniger fallen die paar zusätzlichen Takte für die TMUs/TAP-Blockierung ins Gewicht.

Beispiel:
Meine GPU soll einen Shader rechnen, den die Recheneinheiten in fünf Takten schaffen können (4*ADD-Instruktion und ein TexLoad bsw.). Da fällt jeder Takt, den ich, um es mal aths-kompatibel zu sagen, aufgrund der Texturadressierung und des Textursampling nicht rechnen kann, mit +20% zur ursprünglichen Rechenzeit ins Gewicht.

Wenn ich aber einen Shader habe, der 293 Instruktionen umfasst und die TMU-Latenz für ein bilinear gefiltertes Sample angenommene 50 Takte beträgt (trilinear und AF entsprechend mehr), dann fällt der eine Takt, den meine ALU durch das Absenden das Texture-Adress-Commandos zum TAP/TMU beschäftigt ist, prozentual kaum noch ins Gewicht (~0,3%). Selbst wenn es für trilineares AF dann mal 30 Takte oder so wären, würden das noch immer "nur" 10% der Gesamtrechenzeit ausmachen.

Je shaderlastiger (hier: rechenlastiger) eine Anwendung ist, desto eher gibt es AA und AF für umsonst. Nicht umsonst ist der Einbruch mit aktiviertem AF bei gleichzeitig deaktivierten Texturoptimierungen bei UT200x, welches viele Texturschichten und -operationen nutzt, aber nur sehr wenig arithmetische Shaderlast verursacht, höher, als beinahe überall sonst.

Ailuros
2006-01-05, 19:58:18
Ich verstehe die Frage nicht, kannst du die vielleicht anders formulieren?

In einem theoretischen Fall hab ich 48 ALUs (oder 16 * 36 FLOPs) mit 16 TMUs und im anderen 64 ALUs (oder 32 * 16 FLOPs) mit 32 TMUs. Spielt die Anzahl der TMUs hier ueberhaupt eine Rolle oder ist es nur eine bloede Schnapsidee?

Gast
2006-01-05, 20:04:36
Je shaderlastiger (hier: rechenlastiger) eine Anwendung ist, desto eher gibt es AA und AF für umsonst. Nicht umsonst ist der Einbruch mit aktiviertem AF bei gleichzeitig deaktivierten Texturoptimierungen bei UT200x, welches viele Texturschichten und -operationen nutzt, aber nur sehr wenig arithmetische Shaderlast verursacht, höher, als beinahe überall sonst.

das ist klar, und bei jeder karte der fall. je texturlastiger die shader desto mehr leistung kostet AF (schließlich müssen die ALUs auf einen input, also fertig gefilterte pixel, warten auch wenn sie unabhängig voneinander arbeiten)

bei arithmetiklastigen shadern allerdings ist AF fast for free, es sei denn die TMU blockiert die ALU zu lange.

Ailuros
2006-01-05, 20:04:59
Das ist logisch, stützt aber eher die gegenteilige These. Je länger die Shader, desto weniger fallen die paar zusätzlichen Takte für die TMUs/TAP-Blockierung ins Gewicht.

Beispiel:
Meine GPU soll einen Shader rechnen, den die Recheneinheiten in fünf Takten schaffen können (4*ADD-Instruktion und ein TexLoad bsw.). Da fällt jeder Takt, den ich, um es mal aths-kompatibel zu sagen, aufgrund der Texturadressierung und des Textursampling nicht rechnen kann, mit +20% zur ursprünglichen Rechenzeit ins Gewicht.

Wenn ich aber einen Shader habe, der 293 Instruktionen umfasst und die TMU-Latenz für ein bilinear gefiltertes Sample angenommene 50 Takte beträgt (trilinear und AF entsprechend mehr), dann fällt der eine Takt, den meine ALU durch das Absenden das Texture-Adress-Commandos zum TAP/TMU beschäftigt ist, prozentual kaum noch ins Gewicht (~0,3%). Selbst wenn es für trilineares AF dann mal 30 Takte oder so wären, würden das noch immer "nur" 10% der Gesamtrechenzeit ausmachen.

Je shaderlastiger (hier: rechenlastiger) eine Anwendung ist, desto eher gibt es AA und AF für umsonst. Nicht umsonst ist der Einbruch mit aktiviertem AF bei gleichzeitig deaktivierten Texturoptimierungen bei UT200x, welches viele Texturschichten und -operationen nutzt, aber nur sehr wenig arithmetische Shaderlast verursacht, höher, als beinahe überall sonst.


Ausgezeichnet illustriert.

AA gibt es uebrigens nicht umsonst in Fear als Beispiel (womoeglich wegen den Schatten?), aber der Leistungseinbruch von bilinear auf 16xAF ist minimal und natuerlich ebenso Filterungs-Optimierungen an und aus.

UT2k4 gab mir tatsaechlich in einem etwas verkorkst hergestellten Extremfall zwischen quality und high quality >25% Verlust.

OT: warum registrieren sich Gaeste eigentlich nicht? Ausser die Anonymitaet ist Absicht natuerlich.

Ailuros
2006-01-05, 20:06:50
das ist klar, und bei jeder karte der fall. je texturlastiger die shader desto mehr leistung kostet AF (schließlich müssen die ALUs auf einen input, also fertig gefilterte pixel, warten auch wenn sie unabhängig voneinander arbeiten)

bei arithmetiklastigen shadern allerdings ist AF fast for free, es sei denn die TMU blockiert die ALU zu lange.

Ja aber wenn die TMU die ALU zu lange blockieren sollte, habe ich eher das Gefuehl dass es genauso problematisch auf allen GPUs sein koennte.

Gast
2006-01-05, 20:19:17
OT: warum registrieren sich Gaeste eigentlich nicht?Ich bin doch registriert. ;)

Gast
2006-01-05, 20:21:27
OT: warum registrieren sich Gaeste eigentlich nicht? Ausser die Anonymitaet ist Absicht natuerlich.
Ich hab 'nen Account, nutze den z.Zt. aber bewußt nicht. FYI: Ich bin zwischen deinen MSN-Kontakten. ;)

Mr. Lolman
2006-01-05, 20:24:51
UT2k4 gab mir tatsaechlich in einem etwas verkorkst hergestellten Extremfall zwischen quality und high quality >25% Verlust.


Ach komm, schon bei Quake4 erreicht man mit ner 7800GTX @ 1280x1024 4xAA/16xAF ~30%. (man muss halt darauf achten, dass die Optimierungen auch alle deaktiviert wurden)

Gast
2006-01-05, 20:28:55
bei arithmetiklastigen shadern allerdings ist AF fast for free, es sei denn die TMU blockiert die ALU zu lange.
Genau. Und je länger die Arithmetik-lastigen Shader, desto weniger fällt prozentual diese Blockade, die ja pro Textur nur eine konstante, d.h. begrenzte Zeit dauern kann, ins Gewicht.

Wie gesagt, 1 von 5 ist (prozentual) mehr als 50 von 300 und (prozentual) weit mehr als 300 von 5000. Und je länger die rechenlastigen Shader werden, desto mehr kann die CineFX-Architektur die durch die Einsparungen u.A. am komplett unabhängigen TMU/TAP durch die dadurch ermöglichten stärkeren Recheneinheiten ins Spiel bringen.

ATi wird da erst mit dem R580 gegenhalten können und ich vermute, dass dieser Chip ein ziemlicher Knaller wird. Bei nahezu gleicher Bandbreite ist die X1600 XT meist deutlich schneller, als die X1300 Pro. Eine ähnliche Steigerung werden wir auch beim R580 ggü. dem R520 sehen, sofern CPU-Limitierung ausgeschlossen wird und ähnliche Taktraten vorliegen – wovon ich ausgehe.

Gast
2006-01-05, 20:29:55
30%? Meinst du nicht, dass du da ein wenig übertreibst, lolman? ;)

Wäre ich jetzt nicht so faul, würde ich es grade mal testen, GTX u. Q4 habe ich beides da. Allerdings siegt dann doch die Faulheit...

Demirug
2006-01-05, 20:37:07
ATI profitiert weniger von mehr Rechenleistung in AF Situationen als nVidia.

Was die Blockade des gesamten Prozessor durch die TMU angeht so sollen Kirk und Tridam bitte einen Beweiß dafür erbringen das sie es nicht tut. Ich habe bisher keinen Fall gefunden in dem es zu keiner blockade kommt.

Die letzte GPUs mit dennen das funktioniert hat waren die NV3X Chips. Aber auch nur unter bestimmten Vorraussetzungen.

Gast
2006-01-05, 20:43:39
Hatten Tridam und du euer Mißverständnis nicht ausgeräumt?

Mr. Lolman
2006-01-05, 20:51:10
30%? Meinst du nicht, dass du da ein wenig übertreibst, lolman? ;)

Wäre ich jetzt nicht so faul, würde ich es grade mal testen, GTX u. Q4 habe ich beides da. Allerdings siegt dann doch die Faulheit...

http://www.forum-3dcenter.de/vbulletin/showthread.php?t=270374

Gast
2006-01-05, 21:06:15
http://www.forum-3dcenter.de/vbulletin/showthread.php?t=270374Nur weil ein einziger solche Einbrüche hat bei Q4 mit einer GTX, soll das zwangsläufig auch für alle anderen gelten? Ich glaubs nicht, aber werde es trotzdem mal testen bei Gelegenheit und dann hier berichten. Vielleicht hast du ja Recht...

Gast
2006-01-05, 21:17:13
Wie gesagt, 1 von 5 ist (prozentual) mehr als 50 von 300 und (prozentual) weit mehr als 300 von 5000. Und je länger die rechenlastigen Shader werden, desto mehr kann die CineFX-Architektur die durch die Einsparungen u.A. am komplett unabhängigen TMU/TAP durch die dadurch ermöglichten stärkeren Recheneinheiten ins Spiel bringen.



klar, und für texturlastige shader reicht eine ALU sowieso aus (ati hat schließlich immer nur 1 ALU)

Coda
2006-01-05, 22:43:58
RV530 hat schon 3 pro TMU, und R580 ebenso.

Ailuros
2006-01-05, 23:01:29
Ach komm, schon bei Quake4 erreicht man mit ner 7800GTX @ 1280x1024 4xAA/16xAF ~30%. (man muss halt darauf achten, dass die Optimierungen auch alle deaktiviert wurden)

Nein ich gehe lieber und zwar in eine Ecke wo Du mal ausnahmsweise wenigstens versuchen wuerdest etwas objektiver zu sein. Dementsprechend wieviele Prozent verliert eine Radeon als erstes und zweitens wer zum Henker sagt dass eine G70 in Q4 selbst in 1600 mit HQ und 4xAA unspielbar ist. Genauso wie F1 2001 oder wie?

Ailuros
2006-01-05, 23:05:55
Nur weil ein einziger solche Einbrüche hat bei Q4 mit einer GTX, soll das zwangsläufig auch für alle anderen gelten? Ich glaubs nicht, aber werde es trotzdem mal testen bei Gelegenheit und dann hier berichten. Vielleicht hast du ja Recht...

Q4 scheint keinen Schimmer an System-speicher zu benutzen uebrigens.

***edit: in dem spezifischen demo das hier auf 3DC benutzt wird schon.

http://users.otenet.gr/~ailuros/q4.png

demo001 (~20MB large demo) = -31%
HEXUS_demo2 (~117MB large demo) = -14%

Gast
2006-01-05, 23:10:04
Das ja echt voll krazz mit dem miesen AA bei nvidia! Schlimmer hätte ich allerdings mieses Pipi gefunden ;D

Mieses AA deutet auf eine schlechte Verdauung hin, kann also durch entsprechendes Futter (Treibaz oder RegHaxors) ohne Probs bei nvidia zu gutem festen Stuhlgang (MSAA / RGSSAA / Mixed AA etc. ) führen. ;)

p.s.: Bei Pipi sähe das anders aus... ;D

Ailuros
2006-01-05, 23:20:46
Na mal sehen wie lange der Post so stehen bleibt :biggrin: