PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : 3dfx Rampage und V5 (Split aus GF 8800 Review Thread)


The_Invisible
2006-11-13, 22:49:57
Nicht überzeugend? Ich sehe den GeForce 256 als Meilenstein.

ja, wenns nv statt 3dfx erwischt hätte gäbe es immer noch keine shader dafür aber 256xRGSSAA :ugly:

mfg

Raff
2006-11-13, 23:02:19
ja, wenns nv statt 3dfx erwischt hätte gäbe es immer noch keine shader dafür aber 256xRGSSAA :ugly:

mfg

Klar, deswegen hätte Rampage ja auch (leider, IMO) auf RGMSAA und SM1.0 gesetzt ... ;)

MfG,
Raff

Gast
2006-11-13, 23:02:24
ja, wenns nv statt 3dfx erwischt hätte gäbe es immer noch keine shader dafür aber 256xRGSSAA :ugly:

mfg

Ist das als 3dfx Flame anzusehen? 3dfx war auf dem richtigen Weg, mit Rampage hätten sie wieder komplett aufgeschlossen, sogar vorbeiziehen hätten sie können!

Ailuros
2006-11-14, 04:28:10
Klar, deswegen hätte Rampage ja auch (leider, IMO) auf RGMSAA und SM1.0 gesetzt ... ;)

MfG,
Raff

Zwar mal wieder verdammt OT, aber wer sagt Dir dass der M-buffer nicht auch ueber "T" faehig war?

Raff
2006-11-14, 06:40:59
Zwar mal wieder verdammt OT, aber wer sagt Dir dass der M-buffer nicht auch ueber "T" faehig war?

Niemand. Aber ich warte ja noch immer auf Demis Artikel zu der Architektur. ;)

MfG,
Raff

P.S: Ohoh, ich höre deekey schon schreien ... bin ja schon still.

Mr. Lolman
2006-11-14, 12:50:50
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=4984229&postcount=49

Hab ja immer gesagt, dass es bisher die Hybridmodi nur deswegen gibt/gab, weil die Chips zuwenig Multisamples prouzieren konnten. Jetzt gibts halt 16xMSAA, dafür aber keine Hybridmodi mehr. (Wobei OGSS ohnehin ne Verschwendung war)

Nein. ;)

Naja, SGMSAA, SM 1.0 und ne höhere Pixelfüllrate als ne GF4 Ti4200 hätte da schon was reissen können. (sofern ers zu GF3-Zeiten auf den Markt geschafft hätte)

robbitop@work
2006-11-14, 13:33:09
Naja, SGMSAA, SM 1.0 und ne höhere Pixelfüllrate als ne GF4 Ti4200 hätte da schon was reissen können. (sofern ers zu GF3-Zeiten auf den Markt geschafft hätte)
Das Ding hatte arge Limitierungen was MSAA anging. Die Füllrate war mit einem DualChipdesign sicher nicht soo schlecht. Aber höher als die GF4 nicht. Ein Rampage hatte ein 4x1 Setup.

Mr. Lolman
2006-11-14, 13:34:58
Die Füllrate war mit einem DualChipdesign sicher nicht soo schlecht. Aber höher als die GF4 nicht.

Die Pixelfüllrate und die Texelfüllrate beim Singletexturing war AFAIK schon mit einem Singlechipdesign besser. BTW.: Was für Limitierungen?

Ailuros
2006-11-14, 13:50:57
Die Pixelfüllrate und die Texelfüllrate beim Singletexturing war AFAIK schon mit einem Singlechipdesign besser. BTW.: Was für Limitierungen?

Bei 200MHz? Fear waere dann erst mit 250MHz und VS1.1 gelandet.

Mr. Lolman
2006-11-14, 14:05:05
Man kann auch den LOD ueberhaupt nicht versetzen oder einfacher weniger versetzen und somit sogar Leistung sparen. Unter normalen Bedingungen sollte man Supersampling schon fuer jede 2x SSAA samples um -0.5 versetzen. Als Voodoo-Meister weisst Du ja wohl selber dass man Supersampling auch mit 0.0 vermarkten kann und dann spaeter einen LOD slider einbaut :P

Das Voodoo5 LOD dürfte ohnehin nach einem Sonderfall funktionieren. Denn so wies nach meinen letzten Tests aussieht, dürfte das anscheinend erst im T-Buffer appliziert werden.

Das hat den Vorteil, dass man mit 4xSGSSAA und bilinearem Filtering eine quasi Trilinearität erzeugen kann, die auch nicht komplett verloren geht, wenn man den LOD Bias ins Negative schiebt. Und das kann eben erst dann möglich sein, wenn die AA Samples schon zusammengerechnet werden, bevor das LOD appliziert wird. Der Effekt davon ist, dass man mit einer simplen Verschiebung des LOD Sliders, eine Art AF erzeugen kann (vom Flimmerverhalten ca. wie NV40 Quality, mit ähnlicher Schärfe (http://666kb.com/i/aj8ne5gs19yzaqoty.jpg)) Zu dem Schluss bin ich übrigens deswegen gekommen, weil ich auf der Voodoo5 6000 gesehen hab, wie es aussieht, wenn der Spass nicht korrekt übern T-Buffer abgewickelt wird.

BTW: OGSSAA hat 'outofthebox' prinzipbedingt schärfere Texturen als SGSSAA, da beim OGSSAA ja das LOD einer höheren Auflösung zum Einsatz kommt, während beim SGSSAA das LOD ja durch eine minimale Verschiebung von mehreren gleich 'niedrig' aufgelösten Bildern entsteht. Deswegen müsste NV ein positives LOD applizieren, um die automatisch entstehende, höhere Schärfe, auszugleichen. Das funktioniert aber nicht so gut, da dann auch beim Mag. Filter automatisch aus den interpolierten Werten von Mip0+1 gesampelt würd und so zumindest Teile des Bildes unschärfer wären, als ganz ohne AA.

Bei 200MHz? Fear waere dann erst mit 250MHz und VS1.1 gelandet.

Hoppla. Nö, erst mit 250MHz ;)

AMC
2006-11-14, 15:59:49
ja, wenns nv statt 3dfx erwischt hätte gäbe es immer noch keine shader dafür aber 256xRGSSAA :ugly:

mfg

...und 16-20 chips auf einem PCB, damit man die Leistung der Konkurrenz zumindest erreichen kann. ;D

AMC

Mr. Lolman
2006-11-14, 16:02:18
...und 16-20 chips auf einem PCB, damit man die Leistung der Konkurrenz zumindest erreichen kann. ;D

AMC

Dann schau mal ob ne GF2 GTS fähig ist, folgende BQ zu leisten: http://666kb.com/i/aj8ne5gs19yzaqoty.jpg :wink:

LovesuckZ
2006-11-14, 16:07:44
Dann schau mal ob ne GF2 GTS fähig ist, folgende BQ zu leisten: http://666kb.com/i/aj8ne5gs19yzaqoty.jpg :wink:

Spielbar?

Die gelbe Eule
2006-11-14, 16:09:19
Geht es hier noch um Reviews oder wieder um Filtergebashe? Wird bald langweilig in jedem Thread die gleichen Phrasen zu finden ...

Mr. Lolman
2006-11-14, 16:17:34
Spielbar?

30-35fps auf ner Voodoo5 5500 PCI;)

Geht es hier noch um Reviews oder wieder um Filtergebashe? Wird bald langweilig in jedem Thread die gleichen Phrasen zu finden ...

Welche Phrasen?

IVN
2006-11-14, 16:20:02
30-35fps ;)

Also, fuer Q3 nicht genug. (40 und mehr sollten es sein)

robbitop@work
2006-11-14, 16:25:36
Die Pixelfüllrate und die Texelfüllrate beim Singletexturing war AFAIK schon mit einem Singlechipdesign besser. BTW.: Was für Limitierungen?
Wen interessiert die ST Füllrate? Dann hätte das gute Stück >250 MHz getaktet sein müssen bei Singlechip. Und das bezweifle ich.

Limitierung: MSAA reduziert die ROP-Leistung drastisch. Details wollte Demirug nicht rausrücken.

Vertigo
2006-11-14, 16:28:21
Ich krieg die Tür nicht zu - im Geforce 8800-Review-Thread wird über Voodoo5 und GeForce2 gefachsimpelt ... :rolleyes:

Sonyfreak
2006-11-14, 16:30:30
30-35fps auf ner Voodoo5 5500 PCI;)Für die folgende Aussage deuten mir hier sicherlich manche Leute den Vogel, aber Quake 3 ist erst ab ca. 150fps wirklich perfekt spielbar. Ich könnte das Spiel auf keinen Fall mit 30-35fps spielen, aber jetzt wieder zurück zum Thema. :)

mfg.

Sonyfreak

EDIT: Ich krieg die Tür nicht zu - im Geforce 8800-Review-Thread wird über Voodoo5 und GeForce2 gefachsimpelt ... :rolleyes:Tut mir leid. Ich ärgere mich normalerweise auch über solche Dinge, aber ich konnte nicht widerstehen. :redface:

Die gelbe Eule
2006-11-14, 16:32:15
30-35fps auf ner Voodoo5 5500 PCI;)

Welche Phrasen?

Was hat die GF2 oder Voodoo5 hier zu suchen? Gibt es da etwa Reviews im Vergleich zum 8800?

Gast
2006-11-14, 16:33:01
Dann schau mal ob ne GF2 GTS fähig ist, folgende BQ zu leisten: http://666kb.com/i/aj8ne5gs19yzaqoty.jpg :wink:


LOL? Da ist ja nicht einmal richtig trilinear gefiltert auf dem Screenshot. Die BQ einer GF2 ist klar besser (trilinear + 2xAF).

Mr. Lolman
2006-11-14, 17:11:14
Also, fuer Q3 nicht genug. (40 und mehr sollten es sein)

Man konnte ja ne Auflösungsstufe runtergehen, oder einfach 2xAA nehmen: http://666kb.com/i/aj8p00mz24rot6q0m.jpg

Für die folgende Aussage deuten mir hier sicherlich manche Leute den Vogel, aber Quake 3 ist erst ab ca. 150fps wirklich perfekt spielbar. Ich könnte das Spiel auf keinen Fall mit 30-35fps spielen, aber jetzt wieder zurück zum Thema. :)


Die Speed ist ja in anderen Spielen ähnlich. Und in vielen SP-Spielen reichen auch 30-35fps.

Was hat die GF2 oder Voodoo5 hier zu suchen? Gibt es da etwa Reviews im Vergleich zum 8800?

Irgendwie liegen die Themen garnichtmal so weit entfernt, wenn man sich über fehlende Hybridmodi beim G80 mokiert wobei gleichzeitig die Frage der Sinnhafitgkeit derselbigen beantwortet wird und dabei auch gleichzeitig über AA Samplepositionierungen diskutiert wird.

Das ist alles Ontopic. Deswegen gleich mit der OT Keule zu kommen, wenn mal ein 3dfx Screenshot ein paar andere Techniken zeigt, ist imo nur ein Zeichen dafür, dass einem das BQ Thema prinzipiell nicht interessiert. IdF behaltet man das aber besser für sich, denn es gibt genug andere Foren in denen HW nur oberflächlich diskutiert wird...

LOL? Da ist ja nicht einmal richtig trilinear gefiltert auf dem Screenshot. Die BQ einer GF2 ist klar besser (trilinear + 2xAF).

Lol du kennst diese Szene anscheinend nicht. Selbst 4xAF ist stw. unschärfer. Kannst dir ja mal ansehen, was ein NV40@ default da produziert (http://www.forum-3dcenter.org/vbulletin/showthread.php?p=3282807#post3282807)


Also ich weiss nicht, wie Du das so geil hinbekommst...ich habe das alte NVidia Problem, entweder verwaschene Linien oder fieses Flimmern an den Randsteinen, Streckenrändern.

8800 GTS, 16AF, 8Q AA

Gruss Nils

LOD-Clamp ausschalten und auf HQ stellen nutzt auch nix?

Blaire
2006-11-14, 17:13:26
Könnt ihr eure Voodoogeschichten bitte woanders austragen es nervt langsam. :rolleyes:

Mr. Lolman
2006-11-14, 17:15:26
Könnt ihr eure Voodoogeschichten bitte woanders austragen es nervt langsam. :rolleyes:

Solche Kommentare nerven imo noch viel mehr. Wer glaubt moderieren zu müssen, kann sich ja als Mod bewerben! :rolleyes:

Blaire
2006-11-14, 17:17:45
Solche Kommentare nerven imo noch viel mehr. Wer glaubt moderieren zu müssen, kann sich ja als Mod bewerben! :rolleyes:

Du musst in jeden Nvidia Thread deine komischen Quake3 Bilder posten. Hallllooooo langsam wissen wirs, irgendwann muss auch mal wieder gut sein. Was ist daran so schwer zu verstehn? :confused:

Mr. Lolman
2006-11-14, 17:28:11
Du musst in jeden Nvidia Thread deine komischen Quake3 Bilder posten. Hallllooooo langsam wissen wirs, irgendwann muss auch mal wieder gut sein. Was ist daran so schwer zu verstehn? :confused:

Meine komischen Quake3 Bilder sind nicht komischer als irgenwelche komischen Filtertestpics mit Schachbretttexturen. Solang die Szene sich dafür eignet die Filterqualität zu beurteilen ists schnurz wohers stammt.

Egal. Hoffentlich gibts bald (von Raff und mir) ein Review, welches auch mit alten Vorurteilen aufräumt, dass ich mich nicht jedesmal aufs neue genötigt seh, Q3a anzuwerfen und Bilder anzufertigen nur um in illustrierender Weise so mancher Falschaussage entgegnen zu können.

Bei manchen Flames (eh Kritiken) ggü. meinen Posts hats ja gar den Anschein, als würde der betreffende Verfasser nichteinmal den Text lesen, sondern nur bestimmten, Wörtern/Bildern plötzlich rot sehen, und sich in seinem Recht einen Hypethread der sich ausschliesslich auf den G80 bezieht, zu lesen, eingeschränkt zu sehen...


BTW: Die Bilder kannst du übrigend noch garnicht gesehen haben, weil die nagelneu sind.

Coda
2006-11-14, 19:21:45
Das Voodoo5 LOD dürfte ohnehin nach einem Sonderfall funktionieren. Denn so wies nach meinen letzten Tests aussieht, dürfte das anscheinend erst im T-Buffer appliziert werden.

Das ist unmöglich bei einem IMR.

Ich glaub du raffst immer noch nicht was das VSA100-AA überhaupt erzeugt. Es sind einfach nur n (für n-fach AA) leicht versetzte Bilder die am Ende kombiniert werden.

Raff
2006-11-14, 19:55:00
Wirklich erschreckend. Erschreckend, wie lernresistent so Mancher hier ist. Erschreckend, dass bestimmte Vorurteile noch immer existieren. Manchmal frage ich mich, ob ein Artikel zu dem Thema überhaupt etwas brächte. Die festgefahrenen "GeForce rockt, Voodoo stockt"-Leute werden ihn entweder ignorieren, selektiv lesen oder uns Parteilichkeit vorwerfen. Letztere kann man gerade Voodoo5-6000-Nutzern zweifellos vorwerfen ;), aber es gibt nun mal unumstößliche Fakten, die manche nicht wahr haben wollen. Die letzten Pro-Voodoos würden den Artikel aufsaugen und diese "letzte Ehrung" feiern. Das hilft aber wenig, wenn erstere - ähnlich wie damals - auf Durchzug schalten. Macht keinen Spaß, das Thema hier durchzukauen ...

MfG,
Raff

Ailuros
2006-11-14, 20:01:26
Hoppla. Nö, erst mit 250MHz ;)

Nein es waren 200MHz projeziert und Fear erst mit 250MHz (Fusion rannte auch schon in der fab). 250MHz waren fuer Rampage zu optimistisch eingeschaetzt.

Mr. Lolman
2006-11-14, 20:01:48
Das ist unmöglich bei einem IMR.

Ich glaub du raffst immer noch nicht was das VSA100-AA überhaupt erzeugt. Es sind einfach nur n (für n-fach AA) leicht versetzte Bilder die am Ende kombiniert werden.

Doch ich habs schon gerafft. Ich bin einem Modtreibr auf dem Leim gegangen der doppelt soviele Mipmaps erzeugt wie der letzte offizielle Treiber. Damit sieht das Ganze beim 4xAA tatsächlich wie Trilinear aus. Die war dann der Auslöser für meine konfuse Theorie, da ich mir zunächst nicht erklären konnte warum bei gleicher Schärfe plötzlich kein Mipbanding mehr zu sehen war. Sry, für Quatsch da oben, nach näherer Betrachtung war mir auch klar, dass das so nicht funktionieren konnte. :wink:

Gast
2006-11-16, 14:23:02
Für die folgende Aussage deuten mir hier sicherlich manche Leute den Vogel, aber Quake 3 ist erst ab ca. 150fps wirklich perfekt spielbar. Ich könnte das Spiel auf keinen Fall mit 30-35fps spielen, aber jetzt wieder zurück zum Thema. :)



das ist unmöglich, auf einem "normalen" monitor bekommst du 150+fps niemals zu gesicht.

Raff
2006-11-16, 17:50:07
Nur so am Rande: Wenn die V5 5500 da 30-35 Fps hat, dann kommt die V5 6000 dort auf ~70 Fps. Das halte ich für sehr spielbar.

MfG,
Raff

robbitop@work
2006-11-17, 11:24:01
Wirklich erschreckend. Erschreckend, wie lernresistent so Mancher hier ist. Erschreckend, dass bestimmte Vorurteile noch immer existieren. Manchmal frage ich mich, ob ein Artikel zu dem Thema überhaupt etwas brächte. Die festgefahrenen "GeForce rockt, Voodoo stockt"-Leute werden ihn entweder ignorieren, selektiv lesen oder uns Parteilichkeit vorwerfen.

Ich frage mich nur, wie ernst man euch nehmen kann.

Ihr glorifiziert 3dfx und stellt sie anders dar als sie waren/sind. Reine Rosinenpickerei. Ok ich kann verstehen, dass man bei einer solchen Monster-HW begeistert ist ;)

-es rennen nie veröffentlichte/ verkaufte Karten auf Untersätzen die mal eben ~5 Jahre neuer als die Grafikkarten sind
-es werden unterschiedliche APIs miteinander verglichen
-16bbp (entschuldige 22 bbp) wird mit 32 bbp verglichen und das auch noch als "legitim" hingestellt -> spätestens mit alphablending kann man den postfilter vergessen
-da wird am LOD, je nach Spiel verschieden, herumgedreht
-da wird AF als unnötig hingestellt
-es werden natürlich Rosinen herausgepickt
-SG-SSAA wird gepusht (ok das ist wirklich nice, aber eben ineffizient)
-technologische Schwächen werden unter den Teppich gekehrt
-GPUs die mehrfach vorhanden sein müssen, um mit der Konkurrenz mithalten zu können wird als "gut" dargestellt

und so könnte man immer weiter aufzählen..

Damals waren eben nur die 5500er verfügbar, keine Modtreiber, kein AthlonXP @2,5 GHz. Das Teil war out-of-the box unterlegen. Jetzt wird getweakt was das Zeug hällt und als der heilige Graal verkauft? Das kann's doch nicht wirklich sein oder?
Klar lief damals einiges in den Medien schief. Aber 3dfx hatte selbst Schuld, nicht für den Markt sondern für sich selbst zu entwickeln. Bzw die Entwicklung verpennt zu haben und immer wieder nur aufgebohrt hat. Sowas muss mittelfristig einfach untergehen. Die Ingenieure sind Top Leute, die auch heute immer noch gute Sachen entwicklen.

Meiner Meinung nach liegt die Wahrheit irgendwo in der Mitte.

Mr. Lolman
2006-11-17, 13:14:52
Ich frage mich nur, wie ernst man euch nehmen kann.

Ihr glorifiziert 3dfx und stellt sie anders dar als sie waren/sind. Reine Rosinenpickerei. Ok ich kann verstehen, dass man bei einer solchen Monster-HW begeistert ist ;)

-es rennen nie veröffentlichte/ verkaufte Karten auf Untersätzen die mal eben ~5 Jahre neuer als die Grafikkarten sind
-es werden unterschiedliche APIs miteinander verglichen
-16bbp (entschuldige 22 bbp) wird mit 32 bbp verglichen und das auch noch als "legitim" hingestellt -> spätestens mit alphablending kann man den postfilter vergessen

Das stimmt so nicht. Der Postfilter funktioniert auch mit Alphablending. Allerdings weden die 16bit Rundungsfehler bei massivem Multipassing immer weiter vergrößert, weswegen das Dithering irgendwann so stark ist, dass es der Postfilter nicht mehr wegglättet. Außerdem gibts keinen Grund 32bit Qualität zu verwenden, wenn mit 16bit die BQ auch in Ordnung ist:
http://666kb.com/i/aj8ne5gs19yzaqoty.jpg



-da wird am LOD, je nach Spiel verschieden, herumgedreht
-da wird AF als unnötig hingestellt

Gute Einstellungen sind LOD -3 für 2xAA und LOD -6 für 4xAA (-7 mit Modtreiber). Wo ist das Problem? Bei heutigen GraKas verwendet man auch je nach Spiel unterschiedliche AA/AF Einstellungen. Und das 2xAF der GF2 hatte man auch mit SGSSAA und negativem LOD...


-es werden natürlich Rosinen herausgepickt

Hm? Werde konkreter.


-SG-SSAA wird gepusht (ok das ist wirklich nice, aber eben ineffizient)

Effizienter als TSAA/AAA , da es überall funktoniert. Und aktiviert man bei ATi im 3dmark01 Nature ASBT wird der ganze Spass langsamer als er mit SGSSAA wäre.-..


-technologische Schwächen werden unter den Teppich gekehrt

Natürlich hatte die Voodoo5 technologische Schwächen. Aber diese waren zu Lebzeiten der GraKa nie relevant. Das einzige womit die Voodoo5 featureseitig punkten konnte, war der T-Buffer. Aber der war dafür auch in jedemSpiel in Form von SGSSAA verfügbar.



-GPUs die mehrfach vorhanden sein müssen, um mit der Konkurrenz mithalten zu können wird als "gut" dargestellt

Die GPU ist insofern gut, dass sie wunderbar skaliert, und für die damalige Zeit feine BQ erlaubt hat. (Im SingleChip Modus halt nur bis 2xAA)



Damals waren eben nur die 5500er verfügbar, keine Modtreiber, kein AthlonXP @2,5 GHz. Das Teil war out-of-the box unterlegen. Jetzt wird getweakt was das Zeug hällt und als der heilige Graal verkauft? Das kann's doch nicht wirklich sein oder?
Klar lief damals einiges in den Medien schief. Aber 3dfx hatte selbst Schuld, nicht für den Markt sondern für sich selbst zu entwickeln. Bzw die Entwicklung verpennt zu haben und immer wieder nur aufgebohrt hat. Sowas muss mittelfristig einfach untergehen. Die Ingenieure sind Top Leute, die auch heute immer noch gute Sachen entwicklen.

Meiner Meinung nach liegt die Wahrheit irgendwo in der Mitte.

Das Teil war out-of-the Box unterlegen, wenn man geil auf 3dmarkscores war und eine GraKa haben wollte, die bei Q3a fastest, mit tollen fps protzte. Klar sinds immerwieder die gleichen Argumente, aber gute BQ (mit AA ;)) erreicht man nur mit ner Voodoo5.

Selbst wenn das Ding 10% langsamer war als die GF2 GTS, hatte man keinen S3TC Bug, mit WickedGL (was kaum jemand in den Reviews benchte) hohe OpenGL Performance (was zumindest in jedem damaligen Spiel 1024x768x22 2xAA spielbar machte), Glide Support, SGSSAA und 16bit Postiltering.

Damit war die Voodoo5 auch durchaus ohne Leistungskrone ein erstzunehmender Gegner.

Gast
2006-11-17, 13:27:07
Selbst wenn das Ding 10% langsamer war als die GF2 GTS, hatte man keinen S3TC Bug,

Unter 16 Bit hast du IMMER den S3TC-"Bug", weil dieser "Bug" nichts anderes als die 16 Bit Implementierung von DXT1 darstellt. Das sieht also auch auf einer Voodoo nicht anders aus als auf einer Geforce.

Mr. Lolman
2006-11-17, 13:54:42
Unter 16 Bit hast du IMMER den S3TC-"Bug", weil dieser "Bug" nichts anderes als die 16 Bit Implementierung von DXT1 darstellt. Das sieht also auch auf einer Voodoo nicht anders aus als auf einer Geforce.

Nö. GF2s haben ein Problem mit DXT1. Anscheinend ist die Logik dafür HW-seitig kaputt. Erst wenn man DXT1 nach DXT3 wrappt schauts halbwegs passabel aus: http://www.3dcenter.org/artikel/2000/10-26c.php
3dfx Karten konnten neben fehlerfreiem S3TC/DXT auch noch FXT1, was zT gar besser aussah: http://www.forum-3dcenter.de/vbulletin/showthread.php?p=2579970#post2579970

robbitop@work
2006-11-17, 13:57:18
Das stimmt so nicht. Der Postfilter funktioniert auch mit Alphablending. Allerdings weden die 16bit Rundungsfehler bei massivem Multipassing immer weiter vergrößert, weswegen das Dithering irgendwann so stark ist, dass es der Postfilter nicht mehr wegglättet. Außerdem gibts keinen Grund 32bit Qualität zu verwenden, wenn mit 16bit die BQ auch in Ordnung ist:
http://666kb.com/i/aj8ne5gs19yzaqoty.jpg
- Äpfel vs. Birne
- du sagst es ja selbst 22 bit kann zu Rundungsfehlern kommen
- wenn schon dann ein gleicher Vergleich


Gute Einstellungen sind LOD -3 für 2xAA und LOD -6 für 4xAA (-7 mit Modtreiber). Wo ist das Problem? Bei heutigen GraKas verwendet man auch je nach Spiel unterschiedliche AA/AF Einstellungen. Und das 2xAF der GF2 hatte man auch mit SGSSAA und negativem LOD...
Tweaks und Basteleien mit der menschlichen Wahrnehmungsschwelle.
Das hat wenig mit AA/AF zu tun.
Aths, Xmas und Zecki haben das oft genug ausgeführt.


Hm? Werde konkreter.
WickedGL vs OGL ; 16bbp vs 32 bbp ; AF vs LOD ; einen heutigen Prozessor einzusetzen ; Herraussuchen von extrem hohen Settings, die damals nicht praxisrelevant waren, nur damit die CPU bei den Voodoos nicht limitiert (was nützt einem das, wenn man damals keinen Barton 2,5 GHz hatte?)



Effizienter als TSAA/AAA , da es überall funktoniert. Und aktiviert man bei ATi im 3dmark01 Nature ASBT wird der ganze Spass langsamer als er mit SGSSAA wäre.-..
Was ich von ASBT halte, weißt du ja. ;)
3DMark...wie praxisrelevant.
Fakt ist, MSAA+TSAA ist effektiver.


Natürlich hatte die Voodoo5 technologische Schwächen. Aber diese waren zu Lebzeiten der GraKa nie relevant. Das einzige womit die Voodoo5 featureseitig punkten konnte, war der T-Buffer. Aber der war dafür auch in jedemSpiel in Form von SGSSAA verfügbar.
UT03/04 sind auf einer GTS und einem damaligen Prozessor heute dank TnL spielbar. MaxPayne 1/2 fallen mir noch ein, Mafia ectpp. Laß deine V5 5500 mal mit einem damaligen Prozessor diese Spiele spielen... ;)
IMO ist TnL zu Lebzeiten nützlich gewesen (in OGL sowieso per Default).
DP3 BM kam zur Lebenszeit tatsächlich nie zum Einsatz. Aber alle technischen Features einfach als "unwichtig" unter den Teppich zu kehren ist nicht ok.
Rein technisch gesehen, ist die Umsetzung des T-Buffers und dem SGSAA äußerst einfach (ein paar Register und ein Speicherbereich im VRAM allokieren). Praktisch ist's allerdings ohne ende! Technisch rangiert VSA100 eher auf NV5 Niveau. Praktisch jedoch nicht.

(Eine verdoppelte NV25 8x2/256 Bit/ >300 MHz/FB Compress hätte damals R300 auch gezeigt wo der Hammer hängt und die Features wären zu Lebzeiten kaum wichtig gewesen (mangelndes SM2)...Technik ist immer irgendwie wichtig IMO)




Die GPU ist insofern gut, dass sie wunderbar skaliert, und für die damalige Zeit feine BQ erlaubt hat. (Im SingleChip Modus halt nur bis 2xAA)
100%ige Effizienz ist, wenn man in einem einzigen Bild arbeitet kein Wunder.
Schwach ist es, dass es 2-4x VSA100 braucht, um mit einem NV15 mithalten zu können.
-> Teppich ;)


Das Teil war out-of-the Box unterlegen, wenn man geil auf 3dmarkscores war und eine GraKa haben wollte, die bei Q3a fastest, mit tollen fps protzte. Klar sinds immerwieder die gleichen Argumente, aber gute BQ (mit AA ;)) erreicht man nur mit ner Voodoo5.
Polemik ahoi! X-D (auch wenn Wahrheit enthalten ist)
Ich bin übrigens von Raff's Ergebnissen überrascht, dass man tatsächlich mit einer V5 5500 zu Lebzeiten sich >= 2xRGSS leisten konnte.
Mit meiner GF3 hatte ich oftmals schon Probleme 2xMS/8xAF 1280x1024x32bpp immer flüssig zu bekommen (RCTW).


Selbst wenn das Ding 10% langsamer war als die GF2 GTS, hatte man keinen S3TC Bug, mit WickedGL (was kaum jemand in den Reviews benchte) hohe OpenGL Performance (was zumindest in jedem damaligen Spiel 1024x768x22 2xAA spielbar machte), Glide Support, SGSSAA und 16bit Postiltering.
-S3TC Bug war durch einen klick fixbar (atuner)
-WickedGL != out-of-the-box (warum haben die 3dfx Jungs damals nicht enger mit Metabyte zusammengearbeitet?)
->SGSSAA/Postfilter: nice :up:


Damit war die Voodoo5 auch durchaus ohne Leistungskrone ein erstzunehmender Gegner.
Ack!


Lolman bevor du jetzt anfängst, rot zu sehen: ich finde es gut, dass ihr euch zusammentut und 3dfx nocheinmal leben lasst. Nicht, dass ich die gleiche Sichtweise hätte wie die damaligen Medien oder gar gegen euren Artikel wäre (im Gegenteil). Nur seid ihr beiden etwas zu gelb (??) um einen wirklich objektiven Artikel daraus zu machen (IMO). Aber vieleicht muss er das auch nicht 100%ig sein. Ich persönlich bin was S3 angeht ja auch ein wenig so eingestellt (auch wenn's keine brauchbare S3 Community gibt) ;)
Also nicht's für ungut.

Als V5 6000 Besitzer hat man genügend technisches Verständnis, um das letzte bisschen aus dem Kärtchen kitzeln zu können und es ist auch für mich völlig überraschend gewesen, wie stark das Baby sein kann.
Aber zu glauben oder gar zu implizieren, dass die Medien Schuld an 3dfx Untergang waren, halte ich für vermessen. Schuld war einzig und allein das Management.

Gast
2006-11-17, 14:33:17
Nö. GF2s haben ein Problem mit DXT1. Anscheinend ist die Logik dafür HW-seitig kaputt.


Nö. Da ist nichts kaputt. DXT1 sieht in 16Bit genau so aus, wie die Geforce es darstellt. Es sieht also auch auf der Voodoo so aus. Schau dir Quake3 in 16Bit an und du wirst es sehen.

Gast
2006-11-17, 14:38:07
Ich picke mir mal diesen Punkt heraus, weil es mir ziemlich auf die Nerven geht, wie da andauernd zwei unterschiedliche Begriffe verwechselt werden, noch dazu von Leuten, die den Unterschied zwischen beiden definitiv kennen:
Fakt ist, MSAA+TSAA ist effektiver.
MSAA+TSAA ist bestenfalls gleich effektiv wie SGSSAA, aber meist effizienter. Bei zwei gleichermaßen effektiven Techniken ist diejenige effizienter, die weniger Leistung braucht. Ist die angeblich effizientere Technik nicht ganz so effektiv, so kann man seitenweise darüber streiten, ob sie tatsächlich effizienter ist.

Raff
2006-11-17, 14:49:28
Ich frage mich nur, wie ernst man euch nehmen kann.

Ihr glorifiziert 3dfx und stellt sie anders dar als sie waren/sind. Reine Rosinenpickerei. Ok ich kann verstehen, dass man bei einer solchen Monster-HW begeistert ist ;)

Es ist keine Rosinenpickerei, wenn man überlegene BQ und zudem 32-Bit-Power demonstriert. Das war damals auch nicht anders. Die Schwächen sind bekannt und werden von der dickeren CPU vorwiegend in niedrigen Auflösungen entschärft.

-es werden unterschiedliche APIs miteinander verglichen

Und? Nutzt du bei einem Multi-API-Spiel etwa Direct3D, wenn OpenGL schöner und schneller ist?

- Äpfel vs. Birne
- du sagst es ja selbst 22 bit kann zu Rundungsfehlern kommen
- wenn schon dann ein gleicher Vergleich

Bei Benchmarks wird natürlich 16 vs. 16 und 32 vs. 32 Bit verglichen. Und dabei darauf hingewiesen, dass man 32 Bit auf der Voodoo oft nicht benötigt. Die Ironie dabei: Die Voodoo5 6000 ist die schnellste 32-Bit-Karte bis zur GeForce3. Denkbar sind auch 22-vs.-32-Bit-Benches samt Bildern, warum das so gemacht wurde. :naughty:

Tweaks und Basteleien mit der menschlichen Wahrnehmungsschwelle.
Das hat wenig mit AA/AF zu tun.
Aths, Xmas und Zecki haben das oft genug ausgeführt.

Es ist egal, wer wo was ausgeführt hat – was zählt, sind die praktischen Fakten. Und da steht die V5 sehr gut da.

WickedGL vs OGL ; 16bbp vs 32 bbp ; AF vs LOD ; einen heutigen Prozessor einzusetzen ; Herraussuchen von extrem hohen Settings, die damals nicht praxisrelevant waren, nur damit die CPU bei den Voodoos nicht limitiert (was nützt einem das, wenn man damals keinen Barton 2,5 GHz hatte?)

Was ist am WickedGL auszusetzen? Würdest du für deine X1900 etwa keinen speziellen Treiber nutzen, wenn dir dieser mal eben 50% mehr Fps brächte? 3dfx-Nutzer griffen darauf zurück (noch immer), weil es nur Vorteile gibt. Nur hat das damals fast jeder ignoriert.

Übrigens ist die V5 6000 auch mit 1 GHz schnell – in 1600x1200x32. In 1024x768 führen aber meist die GeForces. Um die Unterschiede zu klären, wird's auch Benches Marke 1 GHz vs. 2,6 GHz geben. Wer wo als Sieger dasteht und wer besser skaliert, sollte schon jetzt klar sein.

UT03/04 sind auf einer GTS und einem damaligen Prozessor heute dank TnL spielbar. MaxPayne 1/2 fallen mir noch ein, Mafia ectpp. Laß deine V5 5500 mal mit einem damaligen Prozessor diese Spiele spielen... ;)

Die genannten Spiele rennen auch mit 1 GHz ok. Du scheinst zu vergessen, dass T&L nur etwas bringt, wenn Füllrate und vor allem Bandbreite nicht limitieren. Nun, letzteres ist bei der GF2-Serie durchgehend der Fall. Die Konsequenz: In relevanten Auflösungen und/oder 32 Bit kaum noch schneller als eine V5.

100%ige Effizienz ist, wenn man in einem einzigen Bild arbeitet kein Wunder.
Schwach ist es, dass es 2-4x VSA100 braucht, um mit einem NV15 mithalten zu können.
-> Teppich ;)

Was ist das denn für ein Argument? Was für den Nutzer am Ende herauskommt ist das, was zählt. Ok, die Länge ist bei 4 GPUs vielleicht problematisch, dafür gibt's aber geile Optik.

Polemik ahoi! X-D (auch wenn Wahrheit enthalten ist)
Ich bin übrigens von Raff's Ergebnissen überrascht, dass man tatsächlich mit einer V5 5500 zu Lebzeiten sich >= 2xRGSS leisten konnte.
Mit meiner GF3 hatte ich oftmals schon Probleme 2xMS/8xAF 1280x1024x32bpp immer flüssig zu bekommen (RCTW).

Und wo die 5500 2x AA packt, schafft die 6000 4x AA ... oder eben 1-2 Auflösungen mehr.

-S3TC Bug war durch einen klick fixbar (atuner)
-WickedGL != out-of-the-box (warum haben die 3dfx Jungs damals nicht enger mit Metabyte zusammengearbeitet?)

Wieder so ein komisches "Argument". Wenn man sich mit seiner Hardware auseinander setzt, dann kennt man Dinge, die einen profitieren lassen. Die Ati Tray Tools oder Omega-Treiber kommen auch nicht von Ati/AMD. ;)

Lolman bevor du jetzt anfängst, rot zu sehen: ich finde es gut, dass ihr euch zusammentut und 3dfx nocheinmal leben lasst. Nicht, dass ich die gleiche Sichtweise hätte wie die damaligen Medien oder gar gegen euren Artikel wäre (im Gegenteil). Nur seid ihr beiden etwas zu gelb (??) um einen wirklich objektiven Artikel daraus zu machen (IMO). Aber vieleicht muss er das auch nicht 100%ig sein. Ich persönlich bin was S3 angeht ja auch ein wenig so eingestellt (auch wenn's keine brauchbare S3 Community gibt) ;)
Also nicht's für ungut.

100%-ige Objektivität gibt es nicht, solange Subjekte die Artikel schreiben. ;) Ich kann allerdings versichern, dass es fair zugehen wird. Lolli wird das auch so sehen. Klar sollte aber auch sein, dass wir die Vorzüge in Sachen BQ veranschaulichen werden.

Als V5 6000 Besitzer hat man genügend technisches Verständnis, um das letzte bisschen aus dem Kärtchen kitzeln zu können und es ist auch für mich völlig überraschend gewesen, wie stark das Baby sein kann.

Warum? Man nehme eine V5 5500, verdoppele sie und takte sie zudem 10% höher – fertig ist das Biest. Klar, wenn man auf die Konkurrenz schaut, die von GTS auf Ultra "nur" 25% GPU-Takt zulegt, könnte man zur Annahme kommen, die V5 6000 wäre auch nur eine übertaktete 5500.

MfG,
Raff

robbitop@work
2006-11-17, 15:07:14
Es ist egal, wer wo was ausgeführt hat – was zählt, sind die praktischen Fakten. Und da steht die V5 sehr gut da.
Praktisch ja aber von der Wahrnehmung stark abhängig aber nicht technisch akkurat. Außerdem nicht out-of-the-box, da ja in jedem Spiel ein anderes LOD eingestellt werden muss, damit es scharf ist und gerade so nicht flimmert.


Was ist am WickedGL auszusetzen? Würdest du für deine X1900 etwa keinen speziellen Treiber nutzen, wenn dir dieser mal eben 50% mehr Fps brächte? 3dfx-Nutzer griffen darauf zurück (noch immer), weil es nur Vorteile gibt. Nur hat das damals fast jeder ignoriert.
Es ist nicht out-of-the-box
Und ich möchte mal behaupten, dass ein Großteil der Käufer es nicht genutzt hat. Aus Unwissen eben.


Übrigens ist die V5 6000 auch mit 1 GHz schnell – in 1600x1200x32. In 1024x768 führen aber meist die GeForces.
Aha! Praxis Anno 2000 sage ich nur. 1600x1200 Röhren, ohne die Maske zu überfahren hatte damals niemand.



Die genannten Spiele rennen auch mit 1 GHz ok. Du scheinst zu vergessen, dass T&L nur etwas bringt, wenn Füllrate und vor allem Bandbreite nicht limitieren. Nun, letzteres ist bei der GF2-Serie durchgehend der Fall. Die Konsequenz: In relevanten Auflösungen und/oder 32 Bit kaum noch schneller als eine V5.
Das will ich sehen. UT2004 eine GF2GTS vs eine V5 5500. Und bitte keine Flyby sondern praxis!! Und das auf einem >= 1GHz Athlon, der damals High End war.
Ergebnis kann ich vorwegnehmen: ohne TnL steht die V5 ziemlich dumm da.
In damaligen Settings (1024) siehts in den anderen TnL Spielen ebenfalls so aus.



Was ist das denn für ein Argument? Was für den Nutzer am Ende herauskommt ist das, was zählt. Ok, die Länge ist bei 4 GPUs vielleicht problematisch, dafür gibt's aber geile Optik.
Das Teil ist groß und heiß für damalige Verhältnis. Und es ist ein technisches Armutszeugnis. Für den User mit dem passenden Case (damals) ist es aber irrelevant, ja.



Und wo die 5500 2x AA packt, schafft die 6000 4x AA ... oder eben 1-2 Auflösungen mehr.v
Ist mir klar, nur dass die V5 6k nie veröffentlicht wurde. ;)



Wieder so ein komisches "Argument". Wenn man sich mit seiner Hardware auseinander setzt, dann kennt man Dinge, die einen profitieren lassen. Die Ati Tray Tools oder Omega-Treiber kommen auch nicht von Ati/AMD. ;)
Du sprichst von dir und Leuten aus dem Freakforum. Der Normalkäufer hat die Treiber installiert, die auf der CD oder Herstellerseite waren und fertig. So ist das bei >90% der Leute nunmal.



100%-ige Objektivität gibt es nicht, solange Subjekte die Artikel schreiben. ;) Ich kann allerdings versichern, dass es fair zugehen wird. Lolli wird das auch so sehen. Klar sollte aber auch sein, dass wir die Vorzüge in Sachen BQ veranschaulichen werden.
Ich wollte nur kundtun, dass ihr einige Sachen unter den Teppich kehrt und Rosinen pickt. ;) (sieht man ja an deinen obigen Ausführungen, in Setting X ist aber....)



Warum? Man nehme eine V5 5500, verdoppele sie und takte sie zudem 10% höher – fertig ist das Biest. Klar, wenn man auf die Konkurrenz schaut, die von GTS auf Ultra "nur" 25% GPU-Takt zulegt, könnte man zur Annahme kommen, die V5 6000 wäre auch nur eine übertaktete 5500.

Wohl wahr, nur dass es sie nie gab ;) (für den Markt)

Xmas
2006-11-17, 17:51:40
Das Voodoo5 LOD dürfte ohnehin nach einem Sonderfall funktionieren. Denn so wies nach meinen letzten Tests aussieht, dürfte das anscheinend erst im T-Buffer appliziert werden.

Das hat den Vorteil, dass man mit 4xSGSSAA und bilinearem Filtering eine quasi Trilinearität erzeugen kann, die auch nicht komplett verloren geht, wenn man den LOD Bias ins Negative schiebt. Und das kann eben erst dann möglich sein, wenn die AA Samples schon zusammengerechnet werden, bevor das LOD appliziert wird. Der Effekt davon ist, dass man mit einer simplen Verschiebung des LOD Sliders, eine Art AF erzeugen kann (vom Flimmerverhalten ca. wie NV40 Quality, mit ähnlicher Schärfe (http://666kb.com/i/aj8ne5gs19yzaqoty.jpg)) Zu dem Schluss bin ich übrigens deswegen gekommen, weil ich auf der Voodoo5 6000 gesehen hab, wie es aussieht, wenn der Spass nicht korrekt übern T-Buffer abgewickelt wird.
Doch ich habs schon gerafft. Ich bin einem Modtreibr auf dem Leim gegangen der doppelt soviele Mipmaps erzeugt wie der letzte offizielle Treiber.
Ohne dir zu nahe treten zu wollen, es wäre vielleicht besser wenn du dich mit solchen technischen Spekulationen zurückhälst. ;)
Weder nachträglich den LOD zu applizieren noch doppelt so viele Mipmaps zu erzeugen ergibt irgendeinen Sinn in Hinblick auf die übliche Renderpipeline. Und der T-Buffer ist nichts anderes als mehrere verschiedene Bilder die am Ende zu gleichen Teilen zusammengemischt werden.

Ich bin mir nicht sicher welche "Quasi-Trilinearität" du meinst, aber das könnte möglicherweise von Trilinear Dithering in Kombination mit dem Downsampling kommen.

BTW: OGSSAA hat 'outofthebox' prinzipbedingt schärfere Texturen als SGSSAA, da beim OGSSAA ja das LOD einer höheren Auflösung zum Einsatz kommt, während beim SGSSAA das LOD ja durch eine minimale Verschiebung von mehreren gleich 'niedrig' aufgelösten Bildern entsteht. Deswegen müsste NV ein positives LOD applizieren, um die automatisch entstehende, höhere Schärfe, auszugleichen. Das funktioniert aber nicht so gut, da dann auch beim Mag. Filter automatisch aus den interpolierten Werten von Mip0+1 gesampelt würd und so zumindest Teile des Bildes unschärfer wären, als ganz ohne AA.
Der LOD bei OGSSAA ist korrekt, warum sollte man das "ausgleichen" wollen?

Nö. Da ist nichts kaputt. DXT1 sieht in 16Bit genau so aus, wie die Geforce es darstellt. Es sieht also auch auf der Voodoo so aus. Schau dir Quake3 in 16Bit an und du wirst es sehen.
16 Bit Framebuffertiefe hat nichts damit zu tun dass DXT1-Texturen mit 16 Bit pro Texel verarbeitet werden. Es müsste auf jeder anderen Karte besser aussehen.

Raff
2006-11-17, 18:21:04
Praktisch ja aber von der Wahrnehmung stark abhängig aber nicht technisch akkurat. Außerdem nicht out-of-the-box, da ja in jedem Spiel ein anderes LOD eingestellt werden muss, damit es scharf ist und gerade so nicht flimmert.

Man muss es ja nicht. Man muss auch kein AA und AF nutzen. Will sagen: Wer kann, der probiert.

Es ist nicht out-of-the-box
Und ich möchte mal behaupten, dass ein Großteil der Käufer es nicht genutzt hat. Aus Unwissen eben.

Damit magst du Recht haben. Hätten mehr Tests den WGL integriert, dann wäre das Thema besser verbreitet. Ich habe beispielsweise in der PCGH darüber gelesen und war hin und weg. Meine V3 dankte. =)

Aha! Praxis Anno 2000 sage ich nur. 1600x1200 Röhren, ohne die Maske zu überfahren hatte damals niemand.

Also mein 17"-er hatte keine Probleme mit 1600x1200. Und AA 4 free ist doch nett. ;D Ich hätte z.B. niemals unter 1600x1200 gespielt, wenn ich damals eine GF2U oder V5 6000 gehabt hätte. Gerade letztere hat das Problem, mit dem aktuell auch die 8800 GTX zu kämpfen hat: So schnell, dass man dickste Auflösungen fahren "muss".

Das will ich sehen. UT2004 eine GF2GTS vs eine V5 5500. Und bitte keine Flyby sondern praxis!! Und das auf einem >= 1GHz Athlon, der damals High End war.
Ergebnis kann ich vorwegnehmen: ohne TnL steht die V5 ziemlich dumm da.
In damaligen Settings (1024) siehts in den anderen TnL Spielen ebenfalls so aus.

Kannst du haben. Wir wollten UT2004 eh nach Möglichkeit integrieren. :)

Ich wollte nur kundtun, dass ihr einige Sachen unter den Teppich kehrt und Rosinen pickt. ;) (sieht man ja an deinen obigen Ausführungen, in Setting X ist aber....)

Jede Karte hat Stärken und Schwächen. Die Schwäche ist T&L. Die Stärke das Gebiet einer jeden Grafikkarte (IMO): Hohe Auflösungen!

__

Ohne dir zu nahe treten zu wollen, es wäre vielleicht besser wenn du dich mit solchen technischen Spekulationen zurückhälst. ;)
Weder nachträglich den LOD zu applizieren noch doppelt so viele Mipmaps zu erzeugen ergibt irgendeinen Sinn in Hinblick auf die übliche Renderpipeline. Und der T-Buffer ist nichts anderes als mehrere verschiedene Bilder die am Ende zu gleichen Teilen zusammengemischt werden.

Ich bin mir nicht sicher welche "Quasi-Trilinearität" du meinst, aber das könnte möglicherweise von Trilinear Dithering in Kombination mit dem Downsampling kommen.

Er hat es bereits erkannt. ;)

Wenn mehr Mipmaps zum Einsatz kämen, dann wäre das ti-artigere Bild wohl damit zu erklären, dass das Dithering über kleinere Strecken zum Einsatz käme. Dadurch wird das Bild wohl "weicher", eine Art Bri-Effekt. Hm, interessant.

MfG,
Raff

aths
2006-11-17, 18:44:46
Ich picke mir mal diesen Punkt heraus, weil es mir ziemlich auf die Nerven geht, wie da andauernd zwei unterschiedliche Begriffe verwechselt werden, noch dazu von Leuten, die den Unterschied zwischen beiden definitiv kennen:Wenn etwas effektiv ist, muss es einen Effekt haben. Supersampling hat in vielen Szenen einen geringen Effekt auf die Qualität, kostet aber nach wie vor viel Leistung. Damit ist es dann auch nicht effizient.

Killeralf
2006-11-17, 18:57:21
Ich bin übrigens von Raff's Ergebnissen überrascht, dass man tatsächlich mit einer V5 5500 zu Lebzeiten sich >= 2xRGSS leisten konnte.
Mit meiner GF3 hatte ich oftmals schon Probleme 2xMS/8xAF 1280x1024x32bpp immer flüssig zu bekommen (RCTW).

Wenn ich hier kurz anmerken dürfte: Bei cpu-limitierten spielen war 4xAA auch kein problem. Falcon 4 habe ich in 1024x768x16/22 gespielt, klar, das spiel war zu dem zeitpunkt schon 2 jahre alt und grafisch mit den neuesten egoshootern nicht zu vergleichen, aber wenn man es erst mal mit 4xRGSS gesehen hatte wollte man es nie mehr anders spielen - die BQ wurde drastisch gesteigert, nicht nur durch die kantenglättung sondern vor allem durch das eliminieren des texturflimmerns. Alles was vorher zu einem höchst unruhigem bild beigetragen hatte, war auf einen schlag weg :eek: Pawlows hunde hätten einen schweren stand gehabt.

Operation: Flashpoint war 2001 in der selben auflösung mit 2xRGSS noch sehr gut spielbar und es sah auf keiner anderen karte, die ich seither besaß, besser aus (das könnte auch die rosarote brille der verklärung sein :redface: ). Auch hier gehe ich von cpu-limitierung aus, immerhin kann man mit dem spiel noch heutige cpus ins schwitzen bringen.

Schuld war einzig und allein das Management.

Jo, f*cking suits! :P

Dunkeltier
2006-11-17, 19:20:09
(...)

Also mein 17"-er hatte keine Probleme mit 1600x1200. Und AA 4 free ist doch nett. ;D Ich hätte z.B. niemals unter 1600x1200 gespielt, wenn ich damals eine GF2U oder V5 6000 gehabt hätte. Gerade letztere hat das Problem, mit dem aktuell auch die 8800 GTX zu kämpfen hat: So schnell, dass man dickste Auflösungen fahren "muss".

(...)


Manchmal hat es auch seine Vorteile, vom Ausgabegerät her "limitiert" zu sein. Erstens kann man alle Effekte im Spiel aktivieren, zweitens die "Qualitätsoptionen" bis zum Anschlag aufdrehen. Und trotzdem läuft alles absolut flüssig. Und im Gegensatz zu hohen Auflösungen furzt die CPU auch noch nicht dermaßen quer - womit Sli für mich praktisch belanglos wird.

Mr. Lolman
2006-11-17, 20:42:42
Ohne dir zu nahe treten zu wollen, es wäre vielleicht besser wenn du dich mit solchen technischen Spekulationen zurückhälst. ;)
Weder nachträglich den LOD zu applizieren noch doppelt so viele Mipmaps zu erzeugen ergibt irgendeinen Sinn in Hinblick auf die übliche Renderpipeline. Und der T-Buffer ist nichts anderes als mehrere verschiedene Bilder die am Ende zu gleichen Teilen zusammengemischt werden.

Fakt ist, dass die BQ mit dem Modtreiber besser idt und dass dies zunächst nicht sinnvoll erklärbar ist. Die Theorie mit dem nachträglich applizierten LOD ist zwar stumpfsinnig, schien mir zunächst aber die einzige Erklärung zu sein. Die Mipmapgeschichte hingegen stimmt tatsächlich (@V5 PCI, 4xAA/LOD-8):

offizieller 1.04 : http://666kb.com/i/ajbsxxmpvdg7xrj1y.jpg
NuAngel Modtreiber: http://666kb.com/i/ajb00agcwf6e5rvp2.jpg


Ich bin mir nicht sicher welche "Quasi-Trilinearität" du meinst, aber das könnte möglicherweise von Trilinear Dithering in Kombination mit dem Downsampling kommen.

Bei besagtem Screenshot (http://666kb.com/i/aj8ne5gs19yzaqoty.jpg) war kein trilineares Dithering aktiv. LOD war auf -2, damit ists entsprichts quasi 4xAF, ohne dabei so stark zu Flimmern wie NV40 Quality (ohne Optimierungen) (http://666kb.com/i/ajbtgmub3bx6xkm5y.jpg)

Mit der Quasitrilinearität mein ich eher das Ausgleichen der Unterfilterung beim bilinearem Filtering mit SGSSAA. Wenns nicht gerade Filtertest-Schachbretttexturen sind, sieht man mit 4xAA 'quasi (http://666kb.com/i/aj4tqnky7q0tlyu5y.jpg) (;)) kein Mipbanding mehr.

Der LOD bei OGSSAA ist korrekt, warum sollte man das "ausgleichen" wollen?

Die betreffenden Posts sind noch im G80 Thread: http://www.forum-3dcenter.de/vbulletin/showthread.php?p=4986541#post4986541

Mr. Lolman
2006-11-17, 20:53:22
Nö. Da ist nichts kaputt. DXT1 sieht in 16Bit genau so aus, wie die Geforce es darstellt. Es sieht also auch auf der Voodoo so aus. Schau dir Quake3 in 16Bit an und du wirst es sehen.

Hast du überhaupt auf meine Links geklickt?


- Äpfel vs. Birne
- du sagst es ja selbst 22 bit kann zu Rundungsfehlern kommen
- wenn schon dann ein gleicher Vergleich

Das sowieso. Der Leser soll aber auch die Möglichkeit haben, unterschiedliche Settings miteinander zu vergleichen, ohne das er herumblättern muss ;)


Tweaks und Basteleien mit der menschlichen Wahrnehmungsschwelle.
Das hat wenig mit AA/AF zu tun.
Aths, Xmas und Zecki haben das oft genug ausgeführt.

Was machts für einen Unterschied, ob man jetzt für jedes Spiel, AA/AF anpasst, oder den LOD Slider betätigt?


UT03/04 sind auf einer GTS und einem damaligen Prozessor heute dank TnL spielbar. MaxPayne 1/2 fallen mir noch ein, Mafia ectpp. Laß deine V5 5500 mal mit einem damaligen Prozessor diese Spiele spielen... ;)
IMO ist TnL zu Lebzeiten nützlich gewesen (in OGL sowieso per Default).
DP3 BM kam zur Lebenszeit tatsächlich nie zum Einsatz. Aber alle technischen Features einfach als "unwichtig" unter den Teppich zu kehren ist nicht ok.
Rein technisch gesehen, ist die Umsetzung des T-Buffers und dem SGSAA äußerst einfach (ein paar Register und ein Speicherbereich im VRAM allokieren). Praktisch ist's allerdings ohne ende! Technisch rangiert VSA100 eher auf NV5 Niveau. Praktisch jedoch nicht.

Mafia, Max Payne 1 + 2 liefen alle wunderbar. Durch die CPU Limitation sogar mit 2xAA. UT2003/04 geht auf meinem flotter Rechner ganz gut, auf langsameren System wahrschenilch nicht mehr so. ;)


(Eine verdoppelte NV25 8x2/256 Bit/ >300 MHz/FB Compress hätte damals R300 auch gezeigt wo der Hammer hängt und die Features wären zu Lebzeiten kaum wichtig gewesen (mangelndes SM2)...Technik ist immer irgendwie wichtig IMO)

Imo nicht. Bei Nvidia hatte ich immer das Gefühl für Features zu bezahlen, die mir zu Lebzeiten bloß auch der Karte schlummern werden. Das Konzept des T-Buffer war so simpel wie genial. SGSSAA in jedem Spiel. Ab 4xSGSSAA in 16bit kein Dithering mehr - ganz ohne Postfilter. Motionblur und Depth of Field wurden ja leider nie genutzt...


100%ige Effizienz ist, wenn man in einem einzigen Bild arbeitet kein Wunder.
Schwach ist es, dass es 2-4x VSA100 braucht, um mit einem NV15 mithalten zu können.
-> Teppich ;)

Und was ist dann so schlimm daran, wenn man eine solche GraKa zum Preis einer SingleGPU GraKa von NV verkaufen kann?


Polemik ahoi! X-D (auch wenn Wahrheit enthalten ist)
Ich bin übrigens von Raff's Ergebnissen überrascht, dass man tatsächlich mit einer V5 5500 zu Lebzeiten sich >= 2xRGSS leisten konnte.
Mit meiner GF3 hatte ich oftmals schon Probleme 2xMS/8xAF 1280x1024x32bpp immer flüssig zu bekommen (RCTW).

Tatsächlich lief jedes damalige erhältiche Spiel zumindest mit 2xSGSSAA. Die fps auf den Unreal - Voodoo5 5500 PCI - Screenshots (http://www.forum-3dcenter.org/vbulletin/showpost.php?p=4064460&postcount=83) sprechen ja auch für sich.

-S3TC Bug war durch einen klick fixbar (atuner)
-WickedGL != out-of-the-box (warum haben die 3dfx Jungs damals nicht enger mit Metabyte zusammengearbeitet?)
->SGSSAA/Postfilter: nice :up:

Der S3TC Bug war erst, nachdem er über ein halbes Jahr hohe fps prouduzierte, mit dem atuner (!=out-of-the-box ;)) fixbar. Bis der Fix im Treiber war, verging sogar >3/4 Jahr. Und fps kostete er auch noch.

Xmas
2006-11-17, 23:26:26
Fakt ist, dass die BQ mit dem Modtreiber besser idt und dass dies zunächst nicht sinnvoll erklärbar ist. Die Theorie mit dem nachträglich applizierten LOD ist zwar stumpfsinnig, schien mir zunächst aber die einzige Erklärung zu sein. Die Mipmapgeschichte hingegen stimmt tatsächlich (@V5 PCI, 4xAA/LOD-8):

offizieller 1.04 : http://666kb.com/i/ajbsxxmpvdg7xrj1y.jpg
NuAngel Modtreiber: http://666kb.com/i/ajb00agcwf6e5rvp2.jpg
Lustiger Trick: Ein Chip rendert normal, der andere mit verschobenem LOD. Da die Bilder zusammengemischt werden, kommt dann sowas raus.

Das heißt aber trotzdem nicht dass doppelt so viele Mipmaps erzeugt werden.

Bei besagtem Screenshot (http://666kb.com/i/aj8ne5gs19yzaqoty.jpg) war kein trilineares Dithering aktiv. LOD war auf -2, damit ists entsprichts quasi 4xAF, ohne dabei so stark zu Flimmern wie NV40 Quality (ohne Optimierungen) (http://666kb.com/i/ajbtgmub3bx6xkm5y.jpg)
-2 nach 3dfx-Zählweise entspricht allerdings nicht 4xAF. In der Distanz ist die Textur dann auch nicht mehr scharf. Mit welchen sonstigen Settings/Treibern wurde der Screenshot gemacht?

Mit der Quasitrilinearität mein ich eher das Ausgleichen der Unterfilterung beim bilinearem Filtering mit SGSSAA. Wenns nicht gerade Filtertest-Schachbretttexturen sind, sieht man mit 4xAA 'quasi (http://666kb.com/i/aj4tqnky7q0tlyu5y.jpg) (;)) kein Mipbanding mehr.
Das würde ich dann doch lieber mal in Bewegung sehen wollen.

Die betreffenden Posts sind noch im G80 Thread: http://www.forum-3dcenter.de/vbulletin/showthread.php?p=4986541#post4986541
Ich finde da im verlinkten Beitrag jetzt nichts Relevantes.

Mr. Lolman
2006-11-18, 01:10:03
Lustiger Trick: Ein Chip rendert normal, der andere mit verschobenem LOD. Da die Bilder zusammengemischt werden, kommt dann sowas raus.

Das heißt aber trotzdem nicht dass doppelt so viele Mipmaps erzeugt werden.

Ja tatsächlich nicht, aber optisch entstehen doppelt soviele Übergänge. Eigentlich könnte die Voodoo5 bei 4xAA ja nochmal doppelt soviele Abstufungen anzeigen, oder?



-2 nach 3dfx-Zählweise entspricht allerdings nicht 4xAF. In der Distanz ist die Textur dann auch nicht mehr scharf. Mit welchen sonstigen Settings/Treibern wurde der Screenshot gemacht?

Das war -8 auf 3dfx Zählweise. Der Shot von der 6800GT war mit 16xAF. 4xAF hatte ich leider nicht bei der Hand.. Sonst wars 1024x768, mit 16bit, WicedGL mit FXT1, und max Ingamedetails. FOV100 war glaub ich auch aktiv.


Das würde ich dann doch lieber mal in Bewegung sehen wollen.

Naja doppelt soviel Übergänge gibts und der Spass funktioniert auch schon mit 2xAA. Vll. licht ichs mal ab. Wär interessant obs auch ne Voodoo4 packt.

Ich finde da im verlinkten Beitrag jetzt nichts Relevantes.

Die Antwort direkt darunter ;)

Raff
2006-11-18, 01:14:06
Sollte die V5 6000 folglich nicht noch einmal doppelt so viele Mipmaps bauen?

MfG,
Raff

Xmas
2006-11-18, 01:34:23
Ja tatsächlich nicht, aber optisch entstehen doppelt soviele Übergänge. Eigentlich könnte die Voodoo5 bei 4xAA ja nochmal doppelt soviele Abstufungen anzeigen, oder?
Wahrscheinlich nicht, ich vermute es gibt nur ein LOD-Bias-Register pro Chip.

Hvoralek
2006-11-19, 12:01:54
Mafia, Max Payne 1 + 2 liefen alle wunderbar. Durch die CPU Limitation sogar mit 2xAA.Gerade dann müsste sich TnL bemerbar machen. Auf was für einem Prozessor denn?

Gast
2006-11-19, 15:48:56
Mit der Quasitrilinearität mein ich eher das Ausgleichen der Unterfilterung beim bilinearem Filtering mit SGSSAA. Wenns nicht gerade Filtertest-Schachbretttexturen sind, sieht man mit 4xAA 'quasi (http://666kb.com/i/aj4tqnky7q0tlyu5y.jpg) (;)) kein Mipbanding mehr.


also ich seh das mip-banding hier schon extrem, obwohl es sich lediglich um einen screenshot handelt, in bewegung dürfte es sehr deutlich werden.

Mr. Lolman
2006-11-19, 16:09:19
also ich seh das mip-banding hier schon extrem, obwohl es sich lediglich um einen screenshot handelt, in bewegung dürfte es sehr deutlich werden.

Extrem sieht man die Mipmaps bei bilinearem Filtering ohne SSAA (http://666kb.com/i/ajdqcncgl1zp6qhpy.jpg) oder NV40 Pseudo HQ .
Zum Vergleich: trilineares (?) Filtering beim R580 (http://666kb.com/i/ajdqpmp39vcvoszee.jpg)

Also, wollen wir mal nicht übertreiben, denn sowas fiel auch fast 2 Jahre lang niemandem auf (ok bei Pseudo HQ war ja af auch noch aktiv, aber die Mipmapübergänge sah man trotzdem überdeutlich (http://666kb.com/i/ajdqep8a38q2novue.jpg)) Tatsächlich sieht wahrscheinlich sogar so mancher brilinearer Filter übler aus, als besagtes 3dfx Pic...

Gerade dann müsste sich TnL bemerbar machen. Auf was für einem Prozessor denn?

PII/416. Tnl macht sich bei schwachen CPUs natürlich bemerkbar. Allerdings ist bei einer CPU Limitierung der Einbruch mit SSAA geringer (da die noAA fps niedriger sind, während SSAA ohnehin durch die GraKa limitiert wird) und deswegen einfacher zu verschmerzen. Bei div. Spielen war 2xSSAA sogar 4free. Eine GF2 hatte (neben der schlechteren Darstellungsqualität) dann bei hoher GraKalast in Form von SSAA auch kaum mehr einen Vorteil durch HW TnL. D.h. während man ne GF2 wunderbar nutzen konnte um ordentlich hohe fps zu produzieren (imo nur relevant als 125fps Q3a Spieler, der gleichzeitig noch möglichst hohe Ingamedetails fahren wollte), hatten Voodoos bei der BQ eindeutig die Nase vorn...

Gast
2006-11-19, 18:21:36
Extrem sieht man die Mipmaps bei NV40 Pseudo HQ/bilinearem Filtering ohne SSAA: Klick (http://666kb.com/i/ajdqcncgl1zp6qhpy.jpg)




viel schlechter sieht das auch nicht aus, vor allem sind die unterschiede zwischen den mips und auch die eventuelle flimmerneigung durch die unterschiedliche beleuchtungsberechnung, die am NV40 deutlich höhere frequenzen erzeugt, bedingt. ich weiß zwar jetzt nicht was "korrekter" ist, aber die hohen frequenzen die das lighting auf dem NV40 erzeugt neigen nun mal eher zum flimmern und zu sichtbarem mip-banding.

aber egal, es geht ja nicht darum zu sagen dass auch mit heutiger hardware bilineare filterung möglich ist, sondern darum dass dieses von dir als "quasi-trilinear" bezeichnete nicht mal ansatzweise mit echtem trilinear mithalten kann und höchstens eine minimale verbesserung zu "normalem" trilinear darstellt, wobei ich mir hier in bewegung garnicht mal mehr so sicher bin.
sicherlich sind die mip-übergänge hier geringer und weniger sichtbar, dafür gibt es aber auch deutlich mehr davon die in bewegung umso störender ins auge fallen können.

Mr. Lolman
2006-11-19, 19:26:44
aber egal, es geht ja nicht darum zu sagen dass auch mit heutiger hardware bilineare filterung möglich ist, sondern darum dass dieses von dir als "quasi-trilinear" bezeichnete nicht mal ansatzweise mit echtem trilinear mithalten kann und höchstens eine minimale verbesserung zu "normalem" trilinear darstellt, wobei ich mir hier in bewegung garnicht mal mehr so sicher bin.
sicherlich sind die mip-übergänge hier geringer und weniger sichtbar, dafür gibt es aber auch deutlich mehr davon die in bewegung umso störender ins auge fallen können.

Aber geh. Ins Auge fällt v.A. der Schärfeunterschied beim Banding. Genauergesagt, entsteht das Banding eben erst durch den Schärfeunterschied der Mipmaps.

Daraus folgt, dass das Banding umso weniger wahrgenommen wird, je geringer der Schärfeunterschied ist. Bei bilinearem Filtering hast du prizipiell einen von 100% (achsenbezogen ;)) zwischen den Mipmaps. Mip 2xSSAA und doppelt soviel Mip-Abstufungen liegt er im Idealfall bei 0%! Durch das SG ist das natürlich nur im Ausnahmefall möglich. Da steht das 4xAA natürlich gleich viel besser da, welches 'dank' dem sparse grid ebenfalls noch nicht ganz bei 0% ist. Aber selbst wenns 10 bis maximal 20% Prozent sind, ist das weitaus besser als 100 ;).

Tatsächlich machen die zusätzlichen Abstufungen selbst mit (SG)SSAA ein dermassen eklatanten Unterschied, der spätestens offensichtlich wird, wenn man negatives LOD fährt (was ja bei SGSSAA eigentlich der Normalfall sein sollte). Durch die Verschiebung der Mipmaps Richtung Horizont werden sie ja praktisch" zusammen" geschoben, da die einzelnen Stufen am Monitor weniger Platz einnehmen. Bei dem von mir favorisierten LOD-7 gibts dann natürlich gerade im Bereich der überblendeten Mipmaps eine Unterfilterung, aber die Bilinearität lässt sich eigentlich dann nur mehr bei eben solchen Ausnahmetexturen wahrnehmen. Und dann erst wenn man weiss wo man hinsehen muss. ;)

Ailuros
2006-11-20, 05:29:03
PII/416. Tnl macht sich bei schwachen CPUs natürlich bemerkbar. Allerdings ist bei einer CPU Limitierung der Einbruch mit SSAA geringer (da die noAA fps niedriger sind, während SSAA ohnehin durch die GraKa limitiert wird) und deswegen einfacher zu verschmerzen. Bei div. Spielen war 2xSSAA sogar 4free. Eine GF2 hatte (neben der schlechteren Darstellungsqualität) dann bei hoher GraKalast in Form von SSAA auch kaum mehr einen Vorteil durch HW TnL. D.h. während man ne GF2 wunderbar nutzen konnte um ordentlich hohe fps zu produzieren (imo nur relevant als 125fps Q3a Spieler, der gleichzeitig noch möglichst hohe Ingamedetails fahren wollte), hatten Voodoos bei der BQ eindeutig die Nase vorn...

http://www.beyond3d.com/articles/nvidia_fsaa/index2.php

Dass NV das OGSS durch die T&L Einheit schleusste ist bekannt.

Erstens brauchte man fuer die paar schaebigen Transformationen in Q3A keine T&L Einheit (hier winkt wohl eher eine KYRO) und zweitens was sagt Dir genau dass wenn NV eine reine SW basierende OGSS benutzt haette, dieses noch langsamer gewesen waere?

Der eigentliche Grund war eher dass sowieso NV damals die T&L Einheiten ausserhalb von OGSS fuer nicht Geometrie-relative calls "missbrauchte"; mit zusaetzlichem SS waren eben diese dann ueberfoerdert, trotzdem aber am Ende schneller als mit einer reinen SW Implementierung.

Selbst das ist nur ein Anteil einer globaleren Erklaerung, fuer mich war damals sowieso Q3A mit SSAA nicht besonders spielbar. Und nein das 50fps mit 22bpp post filtered Argument sagt mir auch nichts in 1024.

aths
2006-11-20, 06:56:28
Aber geh. Ins Auge fällt v.A. der Schärfeunterschied beim Banding. Genauergesagt, entsteht das Banding eben erst durch den Schärfeunterschied der Mipmaps.

Daraus folgt, dass das Banding umso weniger wahrgenommen wird, je geringer der Schärfeunterschied ist. Bei bilinearem Filtering hast du prizipiell einen von 100% (achsenbezogen ;)) zwischen den Mipmaps.Wie definierst du denn Schärfeunterschiede, dass du hier auf 100% kommtst?

Tatsächlich machen die zusätzlichen Abstufungen selbst mit (SG)SSAA ein dermassen eklatanten Unterschied, der spätestens offensichtlich wird, wenn man negatives LOD fährt (was ja bei SGSSAA eigentlich der Normalfall sein sollte). Durch die Verschiebung der Mipmaps Richtung Horizont werden sie ja praktisch" zusammen" geschoben, da die einzelnen Stufen am Monitor weniger Platz einnehmen. Bei dem von mir favorisierten LOD-7 gibts dann natürlich gerade im Bereich der überblendeten Mipmaps eine Unterfilterung, aber die Bilinearität lässt sich eigentlich dann nur mehr bei eben solchen Ausnahmetexturen wahrnehmen. Und dann erst wenn man weiss wo man hinsehen muss. ;)"Dermaßen" bitte mit ß schreiben.

Damit du endlich die MIP-Nutzung verstehst, und merkst dass negatives LOD auch bei Supersampling schädlich ist (ich rechne bei Supersampling die korrekte LOD-Verschiebung in Bezug auf 1x AA mit ein) könntest du mit meinem neuesten Spielzeug, dem Overbright-Blur, rumspielen. Da hat man einen LOD-Slider, kann Filter- und MIP-Map-Nutzung sowie MIP-Interpolation umschalten und so weiter. Wenn dir nach etwas Herumspielerei klar ist, dass LOD-Bias von 0.0 heißt, dass auf einen Pixel ein Texel kommt (und es nicht weniger sein darf); sowie dass MIP-Interpolation wichtig ist und der plötzliche Detailstufenwechsel auch bei Supersampling bleibt, bleiben mir vielleicht mal Bemerkungen wie in diesem Posting von dir erspart.

Ich bitte meinen säuerlichen Tonfall zu entschuldigen.

Eigentlich freue ich mich, dass du zu den Leuten gehörst, die weg von der rein wahrnehmungsbasierten Beurteilung gehen hin zu einem Verständnis der Texturfilter-Technik. Mein Texturfilter-Artikel ist leider etwas umständlich geschrieben. Dann gibt es noch Fälle bei Bildverkleinerungen, wo mir das Ergebnis mit einem LOD-Bias von -1 besser gefällt als beim korrekten LOD-Bias von 0 – obwohl es objektiv schlechter ist. Man kann nun mit etwas Aufwand zeigen, dass ein Standbild mit negativem LOD-Bias durchaus als knackiger und besser empfunden wird.

In Bewegung sind aber alle LOD-Spielereien zu unterlassen, sonst hat man Flimmern – oder zu unscharfe Texturen. Oder ein zu konservativ gesetztes 0-Bias.

Ebenso ist es ziemlich müßig zu diskutieren ob man für Grafikqualität volle Trilinearität braucht oder nicht. Natürlich braucht man die, auch wenn die Nachteile von reduzierter MIP-Map-Interpolation nicht immer auf den ersten Blick zu erkennen sind.

Das ist alles nicht so einfach wie es auf den ersten Blick erscheint. So wird bei NV (und ATI) bei bilinearer Filterung bei Texturverkleinerung in 50% der Texel eigentlich unterfiltert. Das ist aber aus bestimmten Gründen noch im Rahmen des Erträglichen. Bei 3dfx vermute ich ein konservativeres LOD, so dass nie unterfiltert wird. Gerade dann sind diese "Bri"-Spielereien bei der 5500 eine interessante Möglichkeit die ansonsten ziemlich bescheidene Texturqualität im Rahmen des Machbaren zu verbessern. Das stößt jedoch nicht gültige Kriterien für gute Texturfilterung um.

Du siehst auf dem einen Bild doppelt so viele MIP-Bänder und hast zunächst geschlussfolgert, dass doppelt so viele MIP-Texturen erzeugt würden. Das scheint auf den Blick sinnvoll, ist es aber nicht, wenn man weiß, wie Texturfilterung und MIP-Map-Einfärbung funktioniert. Gefärbt werden immer ganze MIP-Texturen. Sieht man da diese Halbstufen, entstehen die aus der Überlagerung zweier unterschiedlicher MIP-Texturen und nicht weil doppelt so viele MIPs erzeugt worden seien. Denn er errechnet nicht etwa die Farbe aus dem LOD, sondern aus dem LOD wird die MIP-Textur und bei eingefärbten MIPs damit die Farbe bestimmt. Es wäre nicht zur ziemlich problematisch, diese Halbstufen als Zusatz-MIPs zu erzeugen, sondern auch noch problematischer, diese zusätzlichen MIPs beim Filtern zu verwenden.

Mr. Lolman
2006-11-20, 14:05:11
http://www.beyond3d.com/articles/nvidia_fsaa/index2.php

Dass NV das OGSS durch die T&L Einheit schleusste ist bekannt.

Erstens brauchte man fuer die paar schaebigen Transformationen in Q3A keine T&L Einheit (hier winkt wohl eher eine KYRO) und zweitens was sagt Dir genau dass wenn NV eine reine SW basierende OGSS benutzt haette, dieses noch langsamer gewesen waere?

Der eigentliche Grund war eher dass sowieso NV damals die T&L Einheiten ausserhalb von OGSS fuer nicht Geometrie-relative calls "missbrauchte"; mit zusaetzlichem SS waren eben diese dann ueberfoerdert, trotzdem aber am Ende schneller als mit einer reinen SW Implementierung.

Selbst das ist nur ein Anteil einer globaleren Erklaerung, fuer mich war damals sowieso Q3A mit SSAA nicht besonders spielbar. Und nein das 50fps mit 22bpp post filtered Argument sagt mir auch nichts in 1024.

Klar war damals Q3a mit SSAA kaum spielbar in 1024. Spätestens dann, wenn man sich des fps abhängigen Movements bewusst wurde. ;)

Aber es gab nunmal genug Spiele, die keine 50 (oder gar 125) fps brauchten um spielbar zu sein. Und da bei SSAA nunmal eher die GraKa der limitierende Faktor ist, machts auch nix aus, wenn das CPU limit durch HW TnL umgangen hätte werden können, da bei SSAA eben eher die CPU auf die GraKa warten muss, als umgekehrt. Ist das SSAA hingegen wirklich fast völlig 4free, kann man davon ausgehen, dass selbst mit SSAA die GraKa limitiert und mit ner auch stärkeren CPU die fps nicht höher wären. Das war auf meinem PII von Spiel zu Spiel unterschiedlich. Ich hab die Voodoo5 später auch noch im XP1500+ System gehabt (bis sie einer Radeon 8500 weichen musste), und da gabs dann natürlich diverse Fälle wo auch mit SSAA die fps höher wurden. In solchen Fällen hätte die GF2 wahrscheinlich noch nen Vorteil durch HW TnL gehabt, der dann aber, wie auch deine Aussage impliziert, durch die zT ohnehin schon recht stark ausgelasteten Einheiten, geringer ausgefallen wäre, als ohne SSAA.

Xmas
2006-11-20, 16:07:37
http://www.beyond3d.com/articles/nvidia_fsaa/index2.php

Dass NV das OGSS durch die T&L Einheit schleusste ist bekannt.

Erstens brauchte man fuer die paar schaebigen Transformationen in Q3A keine T&L Einheit (hier winkt wohl eher eine KYRO) und zweitens was sagt Dir genau dass wenn NV eine reine SW basierende OGSS benutzt haette, dieses noch langsamer gewesen waere?

Der eigentliche Grund war eher dass sowieso NV damals die T&L Einheiten ausserhalb von OGSS fuer nicht Geometrie-relative calls "missbrauchte"; mit zusaetzlichem SS waren eben diese dann ueberfoerdert, trotzdem aber am Ende schneller als mit einer reinen SW Implementierung.
Ich würde gerne verstehen was du hiermit eigentlich sagen willst.

Mr. Lolman
2006-11-20, 22:03:11
Wie definierst du denn Schärfeunterschiede, dass du hier auf 100% kommtst?

Ich hab einfach den maximal möglichen (eben der, bei den, durch bilineares Filtering bedingten, Abstufungen enstehende) mit 100% definiert. ;)


"Dermaßen" bitte mit ß schreiben.

Ok.


Damit du endlich die MIP-Nutzung verstehst, und merkst dass negatives LOD auch bei Supersampling schädlich ist (ich rechne bei Supersampling die korrekte LOD-Verschiebung in Bezug auf 1x AA mit ein) könntest du mit meinem neuesten Spielzeug, dem Overbright-Blur, rumspielen. Da hat man einen LOD-Slider, kann Filter- und MIP-Map-Nutzung sowie MIP-Interpolation umschalten und so weiter. Wenn dir nach etwas Herumspielerei klar ist, dass LOD-Bias von 0.0 heißt, dass auf einen Pixel ein Texel kommt (und es nicht weniger sein darf); sowie dass MIP-Interpolation wichtig ist und der plötzliche Detailstufenwechsel auch bei Supersampling bleibt, bleiben mir vielleicht mal Bemerkungen wie in diesem Posting von dir erspart.

Ich bitte meinen säuerlichen Tonfall zu entschuldigen.

Eigentlich freue ich mich, dass du zu den Leuten gehörst, die weg von der rein wahrnehmungsbasierten Beurteilung gehen hin zu einem Verständnis der Texturfilter-Technik. Mein Texturfilter-Artikel ist leider etwas umständlich geschrieben. Dann gibt es noch Fälle bei Bildverkleinerungen, wo mir das Ergebnis mit einem LOD-Bias von -1 besser gefällt als beim korrekten LOD-Bias von 0 – obwohl es objektiv schlechter ist. Man kann nun mit etwas Aufwand zeigen, dass ein Standbild mit negativem LOD-Bias durchaus als knackiger und besser empfunden wird.

In Bewegung sind aber alle LOD-Spielereien zu unterlassen, sonst hat man Flimmern – oder zu unscharfe Texturen. Oder ein zu konservativ gesetztes 0-Bias.

Bei normalen SGSSAA (ohne 'bri') hast du nur in unterfilternden Bereichen eine automatische LOD Verbesserung. Dementsprechend sind die Mipmaps beim bilinearen Filtering mit 4xAA auch noch kaum sichtbar, während die Texturen insgesamt keine zusätzliche Schärfung geniessen.

Ebenso ist es ziemlich müßig zu diskutieren ob man für Grafikqualität volle Trilinearität braucht oder nicht. Natürlich braucht man die, auch wenn die Nachteile von reduzierter MIP-Map-Interpolation nicht immer auf den ersten Blick zu erkennen sind.

Wer definiert was 'man' braucht? Volle Trilinearität ist natürlich nie verkehrt, trotzdem ist sind Ati und NV selbst bei ihren aktuellen Topmodellen der Meinung dass man sie nicht braucht.


Das ist alles nicht so einfach wie es auf den ersten Blick erscheint. So wird bei NV (und ATI) bei bilinearer Filterung bei Texturverkleinerung in 50% der Texel eigentlich unterfiltert. Das ist aber aus bestimmten Gründen noch im Rahmen des Erträglichen. Bei 3dfx vermute ich ein konservativeres LOD, so dass nie unterfiltert wird. Gerade dann sind diese "Bri"-Spielereien bei der 5500 eine interessante Möglichkeit die ansonsten ziemlich bescheidene Texturqualität im Rahmen des Machbaren zu verbessern. Das stößt jedoch nicht gültige Kriterien für gute Texturfilterung um.

Es wird genauso auch um 50% überfiltert. Dadurch treffen die Texel der verschiedenen Mips im Verhältnis 54:1 aufeinander. (nämlich 2.25 1.78 Texel/Pixel auf 0.444 Texel/Pixel) So gibts beim bilinearer Filterung neben überscharfen Bereichen auf genauso viele zu zu unscharf sind. Bei 3dfx' brilinearem Filtering, gibts am 2. Chip ne LOD Verschiebung um -0.5. Damit wird der Grad der Unterfilterung fast verdoppelt und es treffen schon 4 Texel auf ein Pixel, also 4:1. Das ist schon weniger schlimm als 5:1 dafür neigen die die Texturen neigen dennoch ~78% stärker zum Flimmern. Dadurch, dass mit dem Modtreiber schon beim 2xSGSSAA der Unterfilterte mit dem überfilterten Teil überblendet wird, reduziert sich diese negative Auswirkung um einen gewissen Grad.

Der Clou an der Sache ist ja, dass der störende überfilterte Teil im Bild dadurch komplett eliminiert wird, weswegen die Sichtbarkeit des Bandings deutlich verringert wird - was ja der Hauptstörfaktor vom bilinearem Filtering ist (und zwar so sehr, dass so mancher Spielehersteller inder der Vegangenheit ein auch schon ohne AA default LOD von -0.5 für seine Spiele verwendet hat, um den Krampf der Undersamplings zu entgehen...).

Der Übergang zum ersten Band (@ LOD -0.5) ist dabei kaum feststellbar, da die 2.25 1.78 Texel mit den 0.44 Texel aus der nächsten Mip überblendet werden. Die Überblendung endet mitten in der nächsten Mip wo 4 Texel mit einem überblendet werden. (Dies klingt zunächst schlimmer als es ist, wenn man bedenkt, dass diese Texel ohnehin bilinear gefiltert sind.) Und dann fängt das Spiel von vorne an. Aufgrund der durch bilineares Filtern bedingten Unterfilterung, nähert sich das Texel/Pixel Verhältnis wieder 2.25 1.78 an (geglättet durch 2 SGSSAA Samples) um an dann wieder überblendet zu werden.

Somit hat man anstatt 50% Überfilterung (bis zu 0.44 Texel/Pixel) und 50% Unterfilterung (bis zu 2.25 1.78 Texel/Pixel) mit 2xSGSSAA und partieller LOD Verschiebung einen 50% igen Bereich der praktisch korrekt gefiltert wird (von 1 Texel/2 AA-Samples bis 2.25 1.78/2 AA-Samples) und einen 50% igen Bereich der die 2.25 1.78 Texel/Pixel - 4 Texel/Pixel des einen Chips mit 0.44 Texel/Pixel - 1 Texel/Pixel des Chips überblendet.

Zum 4xSGSAA: Rechnet man nun noch mal 2xAA Samples dazu (=4xAA) und verringert dabei das LOD dabei nochmal um -1 treffen auf ~50% der Texel min. 4 Texel auf 4 AA Samples bis maximal 9 ~7.1 Texel auf 4 AA Samples. Dies entspricht ca. dem Grad der Unterfilterung der bei reinem bilinearer Filterung ohne (SGSS)AA und LOD Verschiebung (oder AF ;)) vorhanden ist (1 Pixel/Texel-2.25 1.78 Pixel/Texel). Auf die restlichen 50% kommt dann die brilineare Map zum Einsatz, wo 9 ~7.1-16 Texel mit 1-4 Texel und 2 AA Samples überblendet werden.

Nochmal zusammengefasst bedeutet das, dass mit dem Modtreiber bei 4xAA und LOD -1 50% genausostark flimmern, wie mit reinem bilinearem Filtering und die restlichen 50% nicht mehr überfiltert sind, sondern zu ~50% (;)) unterfiltert, und zum Rest mit 1-4 Texel/2x AA Samples überblendet wurden, mit eben dem großen Nebeneffekt, dass die Schärfeunterschiede zw. den Abstufungen insgesamt deutlich verringert wurden, was in einer homogeneren BQ resultiert (so ne Binsenweisheit ;))

Je nach Spiel kann man wie, üben schon erklärt das LOD nochmal um 0.5 -0.75 ins Negative setzen, ohne dass das zur Flimmerorgie ausartet -oder hat sich bei irgendeinem Unrealenginespiel irgendjemand mal über Texturflimmern beschwert? (AF Pfuschereien ausgenommen)

Und schon wären wir bei den 4xSGSSAA und LOD -1.5 bis -1.75 (= LOD -6 bis -7) angelangt, mit der Mipmapüberblendung bei -2 bis -2.25 (LOD -8 bis '-9'), was dann von der Schärfe her insgesamt in ~4xAF resultiert.


Ich hoffe damit nun endgültig alle Klarheiten beseitigt zu haben. X-D

aths
2006-11-21, 07:06:45
Ich hab einfach den maximal möglichen (eben der, bei den, durch bilineares Filtering bedingten, Abstufungen enstehende) mit 100% definiert. ;)Komische Definition.

Bei normalen SGSSAA (ohne 'bri') hast du nur in unterfilternden Bereichen eine automatische LOD Verbesserung. Dementsprechend sind die Mipmaps beim bilinearen Filtering mit 4xAA auch noch kaum sichtbar, während die Texturen insgesamt keine zusätzliche Schärfung geniessen. Auch "genießen" bitte mit ß. Nach einem langen Vokal (und ein Diphthong zählt immer als lang) wird aus ss ß.

Bei verzerrten Texturen hat man mit SSAA (bei korrektem LOD) gegenüber fehlendem SSAA auch bei überfilterten Bereichen eine Verbesserung.

Wer definiert was 'man' braucht? Volle Trilinearität ist natürlich nie verkehrt, trotzdem ist sind Ati und NV selbst bei ihren aktuellen Topmodellen der Meinung dass man sie nicht braucht.

Es wird genauso auch um 50% überfiltert.Genau deshalb braucht man volle Trilinearität, weil damit immer mit korrektem LOD gefiltert wird. Egal was ATI oder Nvidia meinen. Die meinen ja auch, dass es beim AF schon mal bisschen flimmern dürfte.

Dadurch treffen die Texel der verschiedenen Mips im Verhältnis 5:1 aufeinander. (nämlich 2.25 Texel/Pixel auf 0.444 Texel/Pixel)Das verstehe ich nicht. Beim MIP-Band gibt es natürlich kein 5:1-Verhältnis.

So gibts beim bilinearer Filterung neben überscharfen Bereichen auf genauso viele zu zu unscharf sind. Bei 3dfx' brilinearem Filtering, gibts am 2. Chip ne LOD Verschiebung um -0.5. Damit wird der Grad der Unterfilterung fast verdoppelt und es treffen schon 4 Texel auf ein Pixel, also 4:1. Das ist schon weniger schlimm als 5:1 dafür neigen die die Texturen neigen dennoch ~78% stärker zum Flimmern. Dadurch, dass mit dem Modtreiber schon beim 2xSGSSAA der Unterfilterte mit dem überfilterten Teil überblendet wird, reduziert sich diese negative Auswirkung um einen gewissen Grad. Weder deinen Rechnungen noch deinen Schlussfolgerungen kann ich folgen.

Der Clou an der Sache ist ja, dass der störende überfilterte Teil im Bild dadurch komplett eliminiert wird, weswegen die Sichtbarkeit des Bandings deutlich verringert wird - was ja der Hauptstörfaktor vom bilinearem Filtering ist (und zwar so sehr, dass so mancher Spielehersteller inder der Vegangenheit ein auch schon ohne AA default LOD von -0.5 für seine Spiele verwendet hat, um den Krampf der Undersamplings zu entgehen...).?? Mit -0.5-er LOD wird das Undersampling nur verstärkt.

Der Übergang zum ersten Band (@ LOD -0.5) ist dabei kaum feststellbar, da die 2.25 Texel mit den 0.44 Texel aus der nächsten Mip überblendet werden. Die Überblendung endet mitten in der nächsten Mip wo 4 Texel mit einem überblendet werden. (Dies klingt zunächst schlimmer als es ist, wenn man bedenkt, dass diese Texel ohnehin bilinear gefiltert sind.) Und dann fängt das Spiel von vorne an. Aufgrund der durch bilineares Filtern bedingten Unterfilterung, nähert sich das Texel/Pixel Verhältnis wieder 2.25 an (geglättet durch 2 SGSSAA Samples) um an dann wieder überblendet zu werden. Wie gesagt kann ich deiner Rechnung nicht folgen.

Somit hat man anstatt 50% Überfilterung (bis zu 0.44 Texel/Pixel) und 50% Unterfilterung (bis zu 2.25 Texel/Pixel) mit 2xSGSSAA und partieller LOD Verschiebung einen 50% igen Bereich der praktisch korrekt gefiltert wird (von 1 Texel/2 AA-Samples bis 2.25 Texel/2 AA Samples) und einen 50% igen Bereich der die 2.25 Texel/Pixel - 4 Texel/Pixel des einen Chips mit 0.44 Texel/Pixel - 1 Texel/Pixel des Chips überblendet. Noch immer verstehe ich nicht, wie du das meinst.

Zum 4xSGSAA: Rechnet man nun noch mal 2xAA Samples dazu (=4xAA) und verringert dabei das LOD dabei nochmal um -1 treffen auf ~50% der Texel min. 4 Texel auf 4 AA Samples bis maximal 9 Texel auf 4 AA Samples. Dies entspricht ca. dem Grad der Unterfilterung der bei reinem bilinearer Filterung ohne (SGSS)AA und LOD Verschiebung (oder AF ;)) vorhanden ist (1 Pixel/Texel-2.25 Pixel/Texel). Auf die restlichen 50% kommt dann die brilineare Map zum Einsatz, wo 9-16 Texel mit 1-4 Texel und 2 AA Samples überblendet werden.

Nochmal zusammengefasst bedeutet das, dass mit dem Modtreiber bei 4xAA und LOD -1 50% genausostark flimmern, wie mit reinem bilinearem Filtering und die restlichen 50% nicht mehr überfiltert sind, sondern zu ~50% (;)) unterfiltert, und zum Rest mit 1-4 Texel/2x AA Samples überblendet wurden, mit eben dem großen Nebeneffekt, dass die Schärfeunterschiede zw. den Abstufungen insgesamt deutlich verringert wurden, was in einer homogeneren BQ resultiert (so ne Binsenweisheit ;))

Je nach Spiel kann man wie, üben schon erklärt das LOD nochmal um 0.5 -0.75 ins Negative setzen, ohne dass das zur Flimmerorgie ausartet -oder hat sich bei irgendeinem Unrealenginespiel irgendjemand mal über Texturflimmern beschwert? (AF Pfuschereien ausgenommen)Das liegt bei UT dann an den Texturen.

Und schon wären wir bei den 4xSGSSAA und LOD -1.5 bis -1.75 (= LOD -6 bis -7) angelangt, mit der Mipmapüberblendung bei -2 bis -2.25 (LOD -8 bis '-9'), was dann von der Schärfe her insgesamt in ~4xAF resultiert.

Ich hoffe damit nun endgültig alle Klarheiten beseitigt zu haben. X-DDeine obigeren Rechnungen kann ich wie gesagt nicht nachvollziehen. Was ich aber mit Sicherheit sagen kann ist, dass man mit 2 Samples pro Achse keine 4x-AF-Schärfe ohne Flimmern hinbekommt.

Mr. Lolman
2006-11-21, 12:23:49
Das verstehe ich nicht. Beim MIP-Band gibt es natürlich kein 5:1-Verhältnis.

Hast recht. Weil bei 50% Unterfilterung nicht 2.25 sondern 1.78 Texel auf ein Pixel treffen. :redface:

Bei LOD -1 wärens 4 Pixel/Texel - d.h. beide Seiten des Pixels wären um 50% zu lang für 1 Texel. Bei LOD -0.5 ist ja per default der bilineare Mipübergang, d.h. Bis LOD -0.5 kommt die größere Mip zum Einsatz die an der Höhe von LOD -0.5 schon auf Pixel trifft , die um jew. 25% zu lang/zu breit sind. Ok, die Pixel sind ja alle genau gleich groß, die Texel sind zu klein, und zwar um 25% je seite. (=0.75² = 0.5625 => 1/0.5625 =~1.78 Texel/Pixel)



Weder deinen Rechnungen noch deinen Schlussfolgerungen kann ich folgen.

?? Mit -0.5-er LOD wird das Undersampling nur verstärkt.

Pixelundersampling. Ich meinte Texelundersampling. Sry, fürs Missverständnis, ich hab deswegen nicht Oversampling geschrieben, weil dieses ja prinzipiell nicht schlecht ist, im Fall von bilinearen Filtering jedoch dafür verantworltich ist, dass sich im dem 50%igen Bereich, in dem überfiltert wird, tw. eben nur 0.44 Texel auf ein Pixel trefffen da (im überfilterten Bereich) ein Texel bis zu jew. um 50% zu lang ist und um 50% zu breit ist. D.h. ein Texel trifft schlimmsten falls eben nur auf 0.667² (=0.44) Pixel


Wie gesagt kann ich deiner Rechnung nicht folgen:

Habs nochmal gequotet, diesmal mit den richtigen Zahlen:

Der Übergang zum ersten Band (@ LOD -0.5) ist dabei kaum feststellbar, da die 1.78 Texel mit den 0.44 Texel aus der nächsten Mip überblendet werden. Die Überblendung endet mitten in der nächsten Mip wo 4 Texel mit einem überblendet werden. (Dies klingt zunächst schlimmer als es ist, wenn man bedenkt, dass diese Texel ohnehin bilinear gefiltert sind.) Und dann fängt das Spiel von vorne an. Aufgrund der durch bilineares Filtern bedingten Unterfilterung, nähert sich das Texel/Pixel Verhältnis wieder 1.78 an (geglättet durch 2 SGSSAA Samples) um an dann wieder überblendet zu werden.


Noch immer verstehe ich nicht, wie du das meinst.

Noch ein Quote. Vll. haben dich ja wirklich nur die falschen Zahlen verwirrt:

Somit hat man anstatt 50% Überfilterung (bis zu 0.44 Texel/Pixel) und 50% Unterfilterung (bis zu 1.78 Texel/Pixel) mit 2xSGSSAA und partieller LOD Verschiebung einen 50% igen Bereich der praktisch korrekt gefiltert wird (von 1 Texel/2 AA-Samples bis 1.78 Texel/2 AA Samples) und einen 50% igen Bereich der die 1.78 Texel/Pixel - 4 Texel/Pixel des einen Chips mit 0.44 Texel/Pixel - 1 Texel/Pixel des Chips überblendet.


Deine obigeren Rechnungen kann ich wie gesagt nicht nachvollziehen. Was ich aber mit Sicherheit sagen kann ist, dass man mit 2 Samples pro Achse keine 4x-AF-Schärfe ohne Flimmern hinbekommt.

Und ich wollte dir erklären, dass es eben doch möglich ist. Bei 2 Samples pro Achse, kann man das LOD schon mal bedenkenlos um -1 absenken. (=2xAF)
Das LOD des geblendeten Mipmapübergangs ist dabei noch zusätzlich um 0.5 verschoben. So gibts eben, wie gesagt, div. Spiele (eigentlich fast jedes damalige), wo man das LOD von Haus aus noch um 0.5 absenken konnte, ohne Flimmerorgie. Die Unrealengine ist ein Beispiel, weil es in den .ini Dateien der sehr einfach nachvollziehbar ist, ob das LOD verändert wurde. Dabei bezieht sich das gesagte nicht nur auf UT, sondern auf jedes Unrealengine Spiel (mir ist noch keins untergekommen, wo man das default LOD auf 0.0 gelassen hätt)

Jedenfalls ist durch die abermals zusätzliche (tw. vom Spiel bedingte) LOD Verschiebung das 4xAF möglich. LOD -1 haben wir ja schon (dank der 4 AA Samples). Der Bri-Überblendung ist bei LOD -1.5 - also durch eine zusätzliche spielbedingte Verschiebung von 0.5, bei -2. (=4xAF)

Coda
2006-11-21, 14:59:05
http://www.beyond3d.com/articles/nvidia_fsaa/index2.php

Dass NV das OGSS durch die T&L Einheit schleusste ist bekannt.

Wat? Das Bild wird einfach größer berechnet und später runterskaliert. Da geht nix "durch die T&L-Einheit".

robbitop@work
2006-11-21, 15:06:47
Wat? Das Bild wird einfach größer berechnet und später runterskaliert. Da geht nix "durch die T&L-Einheit".

Ich kann's mir auch nicht vorstellen aber schau mal auf den Autor. Kirstof Beets. Der arbeitetet AFAIK bei PVR im Engineering. Wenn er soetwas in einem Tech Artikel behauptet, muss es einen Grund dafür geben.

Gast
2006-11-21, 15:07:23
Wenn etwas effektiv ist, muss es einen Effekt haben. Supersampling hat in vielen Szenen einen geringen Effekt auf die Qualität, kostet aber nach wie vor viel Leistung. Damit ist es dann auch nicht effizient.Wie ich bereits schrieb:
MSAA+TSAA ist bestenfalls gleich effektiv wie SGSSAA, aber meist effizienter. Bei zwei gleichermaßen effektiven Techniken ist diejenige effizienter, die weniger Leistung braucht. Ist die angeblich effizientere Technik nicht ganz so effektiv, so kann man seitenweise darüber streiten, ob sie tatsächlich effizienter ist.Ich sehe MSAA+TSAA in unkritischen Spielen als gleich effektiv wie SGSSAA an, in diesem Fall ist MSAA+TSAA effizienter als SGSSAA, wenn es (wie meistens) schneller ist. In kritischen Spielen ist MSAA+TSAA weniger effektiv als SGSSAA, daher würde ich es in diesen Fällen nicht als effizienter erachten. Doch wie bereits gesagt, darüber kann man seitenweise streiten, denn beide Seiten haben treffende Argumente, nämlich kritischen und unkritischen Content.

Ich hoffe, der Artikel über die Downfilter kommt gut voran. In der Sektion über die Natur des Pixels an sich solltest du die Unterschiede der Bilddarstellungsgeräte nicht unberücksichtigt lassen, ein CRT-Pixel(Streifenmaske) ist was anderes als ein CRT-Pixel(Lochmaske) oder TFT-Pixel. Nur bei Beamern/Rückpros mit Farbrad oder 3 LCDs kommt die Darstellung als eine Fläche halbwegs hin.

Coda
2006-11-21, 15:08:37
Ich kann's mir auch nicht vorstellen aber schau mal auf den Autor. Kirstof Beets. Der arbeitetet AFAIK bei PVR im Engineering. Wenn er soetwas in einem Tech Artikel behauptet, muss es einen Grund dafür geben.

Es ist und bleibt Unsinn. Was er meint ist wohl TSSAA.

Das OGSS ist einfach nur größer gerendert und runterskaliert. Das ist doch wohl trivial. Da must noch nicht mal am LOD rumpfuschen weil das automatisch stimmt ;)

Xmas
2006-11-21, 15:38:15
Wat? Das Bild wird einfach größer berechnet und später runterskaliert. Da geht nix "durch die T&L-Einheit".
Man kann auch noch die Viewport-Transformation als Teil der "T&L-Einheit" betrachten.

Coda
2006-11-21, 15:40:06
*blink*

Ja, aber das macht man doch unabhängig von der Viewport-Größe immer mit gleichem Aufwand X-D

robbitop@work
2006-11-21, 16:12:39
Es ist und bleibt Unsinn. Was er meint ist wohl TSSAA.
Schau mal auf's Erscheinungsdatum. ;) Er meint nicht TSAA
Lies dir mal den Link durch.


Das OGSS ist einfach nur größer gerendert und runterskaliert. Das ist doch wohl trivial. Da must noch nicht mal am LOD rumpfuschen weil das automatisch stimmt ;)
Wie gesagt, ich kann's mir auch nicht vorstellen.

Xmas
2006-11-21, 16:13:11
Ja natürlich, der Aufwand ist Null, aber der Artikel geht ja auch gar nicht auf den Aufwand ein.

Ailuros
2006-11-21, 18:57:25
Wat? Das Bild wird einfach größer berechnet und später runterskaliert. Da geht nix "durch die T&L-Einheit".

Die Debatte hatten wir schon mal und auch Demirug hat bestaetigt dass es so ist. Aus dem B3D Artikel oben:

This, through NVIDIA's implementation, is done through the onboard T&L unit. Up-sampling by a factor of two increases the screen resolution of our example to 20-by-20 (10 multiplied by 2 in both the horizontal and vertical dimension). Our vertex positions will be up-sampled to (10,10), (20,20) and (20,0). Notice that the vertices and thus the triangle remain at the same relative position in screen-space.

http://www.beyond3d.com/articles/nvidia_fsaa/index2.php

Ailuros
2006-11-21, 19:00:58
Ich würde gerne verstehen was du hiermit eigentlich sagen willst.

Dass NV damals die T&L Einheit generell fuer alles andere als Geometrie missbrauchte, da sie sonst sowieso viel zu oft dumm heruckgehockt haette.

Xmas
2006-11-21, 19:40:49
Dass NV damals die T&L Einheit generell fuer alles andere als Geometrie missbrauchte, da sie sonst sowieso viel zu oft dumm heruckgehockt haette.
Für was denn bitte?

Coda
2006-11-21, 22:29:40
Die Debatte hatten wir schon mal und auch Demirug hat bestaetigt dass es so ist. Aus dem B3D Artikel oben:

Das ist aber die normale Viewport-Transformation. Das "T&L-Unit" zu nennen is bissel arg weit hergeholt.

Zumindest ist der Aufwand mit oder ohne OGSS genau der gleiche.

Mr.Soapdown
2006-11-21, 22:50:09
Eine GF2 hatte (neben der schlechteren Darstellungsqualität) dann bei hoher GraKalast in Form von SSAA auch kaum mehr einen Vorteil durch HW TnL. D.h. während man ne GF2 wunderbar nutzen konnte um ordentlich hohe fps zu produzieren (imo nur relevant als 125fps Q3a Spieler, der gleichzeitig noch möglichst hohe Ingamedetails fahren wollte), hatten Voodoos bei der BQ eindeutig die Nase vorn...

... möchte das nochmal aufgreifen. Als ich damals mit einer V3 UnrealTournament gezockt hab, war ich auch über die FPS einer GF2 erstaunt, aber die Bilder waren immer irgendwie unnatürlich sauber im gegensatz zur V3. Wie war das mit der 2ten CD die beigelegt war für extra Texturen? Bei Voodoo kams richtig gut rüber bei GF eher weniger.

Mr. Lolman
2006-11-21, 23:00:57
... möchte das nochmal aufgreifen. Als ich damals mit einer V3 UnrealTournament gezockt hab, war ich auch über die FPS einer GF2 erstaunt, aber die Bilder waren immer irgendwie unnatürlich sauber im gegensatz zur V3. Wie war das mit der 2ten CD die beigelegt war für extra Texturen? Bei Voodoo kams richtig gut rüber bei GF eher weniger.

UT hatte unter Glide standardmässig eine Art adaptiven Blurfilter aktiviert. Bei geringen Kontrasten gabs damit eine Art Kantenglättung. Die Extratexturen funktionierten anfangs nur mit ner S3 Savage. Später auch mit der Voodoo5 und GF2. Dass UT dennoch besser aussah, kann an den (vgl zu Glide) damals miesen D3D/OpenGL Renderern gelegen haben. Die hatten tw. gehörige Probleme mit dem Detailtexturing (soferns überhaupt dargestellt wurde).

aths
2006-11-22, 04:02:16
Hast recht. Weil bei 50% Unterfilterung nicht 2.25 sondern 1.78 Texel auf ein Pixel treffen. :redface:

Bei LOD -1 wärens 4 Pixel/Texel - d.h. beide Seiten des Pixels wären um 50% zu lang für 1 Texel.Nein, bei LOD -1 sind es 4 Texel pro Pixel. Das heißt, er greift sich (pro Achse) nur jedes zweite Texel heraus (und hat so pro Pixel nur ein Texel, obwohl man eigentlich vier bräuchte. Um das hinzukriegen müsste man auf die nächste MIP wechseln, wo sich ja ein Texel aus vormals 2x2=4 Texeln ergibt.) Wären es vier Pixel pro Texel, hätte man Texturvergrößerung oder einen LOD-Bias von +1.

Ich kann nur empfehlen mit meiner Overbright-Blur-Simulation rumzuspielen weil man da im Extra-Panel den LOD-Slider hat und testen kann, wie sich LOD und MIP-Nutzung etc auf (isotrope) Texturskalierung auswirkt.

Bei LOD -0.5 ist ja per default der bilineare Mipübergang, d.h. Bis LOD -0.5 kommt die größere Mip zum Einsatz die an der Höhe von LOD -0.5 schon auf Pixel trifft , die um jew. 25% zu lang/zu breit sind. Ok, die Pixel sind ja alle genau gleich groß, die Texel sind zu klein, und zwar um 25% je seite. (=0.75² = 0.5625 => 1/0.5625 =~1.78 Texel/Pixel)Ich verstehe noch immer nicht, wie du das rechnest.

Pixelundersampling. Ich meinte Texelundersampling. Sry, fürs Missverständnis, ich hab deswegen nicht Oversampling geschrieben, weil dieses ja prinzipiell nicht schlecht ist, im Fall von bilinearen Filtering jedoch dafür verantworltich ist, dass sich im dem 50%igen Bereich, in dem überfiltert wird, tw. eben nur 0.44 Texel auf ein Pixel trefffen da (im überfilterten Bereich) ein Texel bis zu jew. um 50% zu lang ist und um 50% zu breit ist. D.h. ein Texel trifft schlimmsten falls eben nur auf 0.667² (=0.44) PixelWie kommst du immer auf 0,44 oder 2/3?

In einer der letzten PCGHs hatte ich die LOD-Berechnung erklärt. In Kurzform: Für beide Achsen wird das Texel-Pixel-Verhältnis ausgerechnet, wovon anschließend nur der größere beider Werte betrachtet wird. Der Zweierlogarthmus davon ist das LOD. Für bilineare Filterung wird das LOD auf eine ganze Zahl gerundet (da man nur eine MIP nutzt). Bei trilinearer Filterung wird mit der Nachkommastelle gewichtet interpoliert.

Da bei bilinearer Filterung z. B. 3,45 auf 3 abgerundet wird, findet eigentlich eine Unterfilterung statt. Bei der Voodoo könnte es sein (was man prüfen müsste) dass er das LOD bei bilinearer Filterung immer auf die nächsthöhere Zahl rundet, egal wie klein die Nachkommastelle ist.


Habs nochmal gequotet, diesmal mit den richtigen Zahlen:

Der Übergang zum ersten Band (@ LOD -0.5) ist dabei kaum feststellbar, da die 1.78 Texel mit den 0.44 Texel aus der nächsten Mip überblendet werden. Die Überblendung endet mitten in der nächsten Mip wo 4 Texel mit einem überblendet werden. (Dies klingt zunächst schlimmer als es ist, wenn man bedenkt, dass diese Texel ohnehin bilinear gefiltert sind.) Und dann fängt das Spiel von vorne an. Aufgrund der durch bilineares Filtern bedingten Unterfilterung, nähert sich das Texel/Pixel Verhältnis wieder 1.78 an (geglättet durch 2 SGSSAA Samples) um an dann wieder überblendet zu werden.



Noch ein Quote. Vll. haben dich ja wirklich nur die falschen Zahlen verwirrt:

Somit hat man anstatt 50% Überfilterung (bis zu 0.44 Texel/Pixel) und 50% Unterfilterung (bis zu 1.78 Texel/Pixel) mit 2xSGSSAA und partieller LOD Verschiebung einen 50% igen Bereich der praktisch korrekt gefiltert wird (von 1 Texel/2 AA-Samples bis 1.78 Texel/2 AA Samples) und einen 50% igen Bereich der die 1.78 Texel/Pixel - 4 Texel/Pixel des einen Chips mit 0.44 Texel/Pixel - 1 Texel/Pixel des Chips überblendet.Für mich sind deine Rechnungen ehrlich gesagt Kraut und Rüben.


Und ich wollte dir erklären, dass es eben doch möglich ist. Bei 2 Samples pro Achse, kann man das LOD schon mal bedenkenlos um -1 absenken. (=2xAF)
Das LOD des geblendeten Mipmapübergangs ist dabei noch zusätzlich um 0.5 verschoben. So gibts eben, wie gesagt, div. Spiele (eigentlich fast jedes damalige), wo man das LOD von Haus aus noch um 0.5 absenken konnte, ohne Flimmerorgie. Die Unrealengine ist ein Beispiel, weil es in den .ini Dateien der sehr einfach nachvollziehbar ist, ob das LOD verändert wurde. Dabei bezieht sich das gesagte nicht nur auf UT, sondern auf jedes Unrealengine Spiel (mir ist noch keins untergekommen, wo man das default LOD auf 0.0 gelassen hätt)

Jedenfalls ist durch die abermals zusätzliche (tw. vom Spiel bedingte) LOD Verschiebung das 4xAF möglich. LOD -1 haben wir ja schon (dank der 4 AA Samples). Der Bri-Überblendung ist bei LOD -1.5 - also durch eine zusätzliche spielbedingte Verschiebung von 0.5, bei -2. (=4xAF)Sachte, bitte.

4x sparse Supersampling erlaubt lt. Meister Nyquist kein LOD-Bias von -1, sondern nur von knapp -1. Wenn 3dfx (wie von mir vermutet, was aber ungeprüft ist) um +0.5 verschiebt und man um -0.5 zurückschiebt, gewinnt man im Vergleich mit anderen Karten keine zusätzliche Schärfe. Dass bei Unreal-Spielen das Bias ohnehin verschoben ist, trifft auf andere Karten ebenfalls zu. Das darf man nicht einfach für die Voodoo exklusiv reinrechnen.

Dass es nicht geht, mit 2 Samples pro Achse bis zu 4 Texel pro Achse zu sampeln ohne dabei Unterfilterung zu riskieren, müsste einleuchten.

aths
2006-11-22, 04:11:05
UT hatte unter Glide standardmässig eine Art adaptiven Blurfilter aktiviert. Bei geringen Kontrasten gabs damit eine Art Kantenglättung. Die Extratexturen funktionierten anfangs nur mit ner S3 Savage. Später auch mit der Voodoo5 und GF2. Dass UT dennoch besser aussah, kann an den (vgl zu Glide) damals miesen D3D/OpenGL Renderern gelegen haben. Die hatten tw. gehörige Probleme mit dem Detailtexturing (soferns überhaupt dargestellt wurde).Bitte: Standardmäßig mit ß.

Dass UT besser aussah als in D3D lag vor allem an der Interpretation der Textur- oder Framebufferfarben (was mir nie so ganz klar geworden ist.) Einfach gesagt arbeitet die Voodoo da "gamma-korrekt".

Raff
2006-11-22, 10:27:48
UT hatte unter Glide standardmässig eine Art adaptiven Blurfilter aktiviert. Bei geringen Kontrasten gabs damit eine Art Kantenglättung. Die Extratexturen funktionierten anfangs nur mit ner S3 Savage. Später auch mit der Voodoo5 und GF2. Dass UT dennoch besser aussah, kann an den (vgl zu Glide) damals miesen D3D/OpenGL Renderern gelegen haben. Die hatten tw. gehörige Probleme mit dem Detailtexturing (soferns überhaupt dargestellt wurde).

Unter OGL werden die Detail Textures noch immer nicht dargestellt.

MfG,
Raff

Ailuros
2006-11-22, 10:42:14
Für was denn bitte?

Generic API calls; das uralte e-mail hab ich leider nicht mehr aber es stammte von einem hochrangigen engineer. Das dumme war dann eben dass sobald T&L dann so langsam notwendiger wurde, dass sie das Ganze wieder auf einer Spiel fuer Spiel Basis wieder rueckgaengig machen mussten.

Lolman
2006-11-22, 11:21:55
Nein, bei LOD -1 sind es 4 Texel pro Pixel. Das heißt, er greift sich (pro Achse) nur jedes zweite Texel heraus (und hat so pro Pixel nur ein Texel, obwohl man eigentlich vier bräuchte. Um das hinzukriegen müsste man auf die nächste MIP wechseln, wo sich ja ein Texel aus vormals 2x2=4 Texeln ergibt.) Wären es vier Pixel pro Texel, hätte man Texturvergrößerung oder einen LOD-Bias von +1.

Schreib ich doch!


Ich verstehe noch immer nicht, wie du das rechnest.

Wie kommst du immer auf 0,44 oder 2/3?

Die Mip0 würde an der Stelle von LOD -1 um 100% unterfiltert, also 4 Texel auf ein Pixel. D.h., dass die Texel an jeder Seite um 50% kleiner als die Pixel wären. (so ginge sichs auch aus, dass 4 Texel auf ein Pixel passen). Nun findet beim bilinearen Filtering der Mipwechsel ja schon bei LOD-0.5 statt. D.h., die Mip0, wird maximal 50% unterfiltert. (Texel an jeder um 25% kleiner) Dadurch wird die Mip1 ab der Stelle -0.5 auch um 50% überfiltert, da bei der Mip1 ja erst auf der Höhe von LOD -1 auch ein Texel auf ein Pixel trifft.

Dementsprechend sind die Texel der Mip1 auf der Höhe von LOD -0.5 auch um jew. 50% (an jeder Seite) zu groß. D.h. die Pixel der Mip1 haben an dieser Stelle nur 66.6% der Seitenlänge eines Texel. Und zum Quadrat, kommt da eben 0.4444 raus. Demensprechend ist das Verhältnis der Texel der Mip0 zur denen der Mip1 am bilinearen Übergang auch (logischerweise) genau 4:1 (1.7777/0.4444)


Für mich sind deine Rechnungen ehrlich gesagt Kraut und Rüben.

Nach meiner Erklärung hoffentlich nicht mehr...

Sachte, bitte.

4x sparse Supersampling erlaubt lt. Meister Nyquist kein LOD-Bias von -1, sondern nur von knapp -1. Wenn 3dfx (wie von mir vermutet, was aber ungeprüft ist) um +0.5 verschiebt und man um -0.5 zurückschiebt, gewinnt man im Vergleich mit anderen Karten keine zusätzliche Schärfe. Dass bei Unreal-Spielen das Bias ohnehin verschoben ist, trifft auf andere Karten ebenfalls zu. Das darf man nicht einfach für die Voodoo exklusiv reinrechnen.

Dass es nicht geht, mit 2 Samples pro Achse bis zu 4 Texel pro Achse zu sampeln ohne dabei Unterfilterung zu riskieren, müsste einleuchten.

3dfx verschiebt das LOD garantiert nicht um +0.5, da der bi-Übergang sonst genau bei 0.0 wär, was bedeuten würde, dass 1 Texel der Mip1 4 Pixel benötigen würde. Das LOD ist also bei 0.0 und die Übergänge genau an der gleichen Stelle wie bei ATi und auch NV. (wurde von mir auch überprüft)

Senken wir das LOD nun bei 4xSGSSAA um (knapp ;)) 1 ab, ist die Mipmapüberblendung (brilinear) nun bei -1.5 bis -2. Klar darf man bei Unrealspiele, das LOD nicht exklusiv für die Voodoos reinrechnen. Unreal war ja auch nurein Beispiel dafür, dass selbst beim bilinearen Filtering, das LOD um -0.5 verschoben werden kann, ohne dass das in üble Flimmerei resultiert.

Jedenfalls ists aufgrund meiner Ausführungen im Normalfall kein Problem, beim 4xSGSSAA 4xAF darzustellen...

Hvoralek
2006-11-22, 22:05:12
Bitte: Standardmäßig mit ß.Ist zwar hier OT, aber wäre es nicht sinnvoller, statt dieser ganzen Einzelfälle einmal die Regel dahinter zu erklären? Ist doch ganz simpel: Ein "ß", das auf einen kurzen Vokal folgt, wird zu einem "ss", die "ß" hinter langen Vokalen bleiben.

aths
2006-11-23, 05:29:04
Schreib ich doch!



Die Mip0 würde an der Stelle von LOD -1 um 100% unterfiltert, also 4 Texel auf ein Pixel. D.h., dass die Texel an jeder Seite um 50% kleiner als die Pixel wären. (so ginge sichs auch aus, dass 4 Texel auf ein Pixel passen). Nun findet beim bilinearen Filtering der Mipwechsel ja schon bei LOD-0.5 statt. D.h., die Mip0, wird maximal 50% unterfiltert. (Texel an jeder um 25% kleiner) Dadurch wird die Mip1 ab der Stelle -0.5 auch um 50% überfiltert, da bei der Mip1 ja erst auf der Höhe von LOD -1 auch ein Texel auf ein Pixel trifft.

Dementsprechend sind die Texel der Mip1 auf der Höhe von LOD -0.5 auch um jew. 50% (an jeder Seite) zu groß. D.h. die Pixel der Mip1 haben an dieser Stelle nur 66.6% der Seitenlänge eines Texel. Und zum Quadrat, kommt da eben 0.4444 raus. Demensprechend ist das Verhältnis der Texel der Mip0 zur denen der Mip1 am bilinearen Übergang auch (logischerweise) genau 4:1 (1.7777/0.4444) Ich komm noch immer nicht hinterher. Das 2^LOD gibt an, wie viel Texel (pro Achse) der Basemap auf ein Pixel kommen

Basemap (MIP 0) = 1 Texel pro Pixel
MIP 1 = 2 Texel pro Achse pro Pixel
MIP 2 = 4 Texel pro Achse pro Pixel
MIP 3 = 8 Texel pro Achse pro Pixel
etc...

Nehmen wir nun mal 2,4999 und 2,5. Bei 2,4999 wird auf 2 gerundet, bei 2,5 auf 3. Der Unterschied (hier: 4 Texel vs. 8 Texel pro Achse) beträgt jedenfalls beim Übergang pro Achse immer Faktor 2 (da exakt die nächste MIP genommen wird), in der Fläche Faktor 4. Da komme ich nicht auf 2/3 Texel-Seitenlänge oder so. Der Unterschied beim MIP-Wechsel ist immer Faktor 2 pro Achse, Unterfilterung wechselt sich mit Überfilterung ab.


Nach meiner Erklärung hoffentlich nicht mehr...Nee, ich kann dir nach wie vor nicht folgen.

3dfx verschiebt das LOD garantiert nicht um +0.5, da der bi-Übergang sonst genau bei 0.0 wär, was bedeuten würde, dass 1 Texel der Mip1 4 Pixel benötigen würde. Das LOD ist also bei 0.0 und die Übergänge genau an der gleichen Stelle wie bei ATi und auch NV. (wurde von mir auch überprüft)Gut, das mal zu wissen.

Senken wir das LOD nun bei 4xSGSSAA um (knapp ;)) 1 ab, ist die Mipmapüberblendung (brilinear) nun bei -1.5 bis -2. Klar darf man bei Unrealspiele, das LOD nicht exklusiv für die Voodoos reinrechnen. Unreal war ja auch nurein Beispiel dafür, dass selbst beim bilinearen Filtering, das LOD um -0.5 verschoben werden kann, ohne dass das in üble Flimmerei resultiert.

Jedenfalls ists aufgrund meiner Ausführungen im Normalfall kein Problem, beim 4xSGSSAA 4xAF darzustellen...Deine Ausführungen können das von Nyquist beschriebene Abtasttheorem nicht ungültig machen. Schon mal bei einer GeForce und 2x2-Supersampling das LOD auf -2 gestellt? Obwohl die Maske zum Zwecke der "AF-Emulation" etwas besser geeignet ist, ist die Folge logischerweise Flimmern. Die Voodoo hat keine Zauberschaltkreise, die dann doch irgendwie ein 4x-AF-Äquivalent bei nur zwei Samples pro Achse erlauben würden.

Mr. Lolman
2006-11-23, 08:32:01
Ich komm noch immer nicht hinterher. Das 2^LOD gibt an, wie viel Texel (pro Achse) der Basemap auf ein Pixel kommen

Basemap (MIP 0) = 1 Texel pro Pixel
MIP 1 = 2 Texel pro Achse pro Pixel
MIP 2 = 4 Texel pro Achse pro Pixel
MIP 3 = 8 Texel pro Achse pro Pixel
etc...

Nehmen wir nun mal 2,4999 und 2,5. Bei 2,4999 wird auf 2 gerundet, bei 2,5 auf 3. Der Unterschied (hier: 4 Texel vs. 8 Texel pro Achse) beträgt jedenfalls beim Übergang pro Achse immer Faktor 2 (da exakt die nächste MIP genommen wird), in der Fläche Faktor 4. Da komme ich nicht auf 2/3 Texel-Seitenlänge oder so. Der Unterschied beim MIP-Wechsel ist immer Faktor 2 pro Achse, Unterfilterung wechselt sich mit Überfilterung ab.

Faktor 2 pro Achse ist wie du richtig schreibst ein Flächenfaktor von 4. Und Unterfilterung wechselt sich mit Überfilterung ab. Und zwar werden pro Mipmaip beim bilinearen Filtering ~50% unterfiltert und ~50% überfiltert.

Rechnen wir ein kleines Beispiel. Mip0 hat z.B 4x4 Texel, Mip1 hat demnach 2x2 Texel. Wir wissen ja, dass der 1. bilineare Übergang bei -0.5 ist, und bei -1 aus der Mip1 jew. Texel auf ein Pixel gesampelt wird.

Also haben wir bei 0.0 eine Mipmap mit 4x4 Texel und bei -1 eine mit 2x2. Für wieviel Texel haben wir bei -0.5 Platz? Genau für 3x3, tatsächlich wird aber bis -0.499999999999 (der Einfachheit halber -0.5) ja aus der Mip0 mit 4x4 Texel gesampelt, und ab -0.5 die Mip1 mit 2x2 Texel. D.h. es treffen beim bilinearen Übergang 4x4 Texel auf 3x3 Pixel und 2x2 Texel auf 3x3 Pixel. Also 16/9 : 4/9 = 1.777777777 : 0.444444444 = 4 : 1 = 2: 1 pro Achse......

BTW: Wenn ein Apfel um 50% größer als eine Birne ist, so hat die Birne nur 66% der Größe des Apfels ;)



Deine Ausführungen können das von Nyquist beschriebene Abtasttheorem nicht ungültig machen. Schon mal bei einer GeForce und 2x2-Supersampling das LOD auf -2 gestellt? Obwohl die Maske zum Zwecke der "AF-Emulation" etwas besser geeignet ist, ist die Folge logischerweise Flimmern. Die Voodoo hat keine Zauberschaltkreise, die dann doch irgendwie ein 4x-AF-Äquivalent bei nur zwei Samples pro Achse erlauben würden.

Verarschen kann ich mich alleine, von wegen Zauberschaltkreise und so. Nochmal:

x) 4xSGSSAA erlaubt ~ LOD -1
x) Der bilineare Übergang ist (ohne Modtreiber und brilinearen Überblendungsgeschichten) bei -0.5
D.h. mit 4xSGSSAA und Treiber LOD von -1 ist der bilineare Übergang schon
bei -1.5

Kommt nun ein Spiel wie Unreal daher und verschiebt das LOD um -0.5 wäre wir bei -2 für bilinearen Übergang. Ohne dass es mehr flimmert (SG mal ignoriert) als noAA mit bilinearem Filtering und Game LOD -0.5. (wo ja der bilineare Übergang auch schon bei -1 ist, also 4 Texel auf 1 Pixel treffen, also Hr. Nyquist dabei eigentlich kotzen hätte müssen)

Wahrscheinlich ist die menschliche Wahrnehmung im Durchschnitt nur halb so gut wie von Nyquist angenommen, denn sonst hätten die Leute nicht alle mit Begeisterung Unreal gespielt, und es als Grafikreferenz angesehen.

Tatsächlich vergisst du imo aber eher, dass die Spiele nicht alle aus schwarz weißen Schachbretttexturen bestehen, und selbst bei meiner geliebten Extrem-Q3a-Textur Unterfilterung eigentlich erst seeehr spät sichtbar ist und ein bilineares Bild mit nem LOD von -0.5 automatisch homogener ist, als eins mit LOD 0.0. Und zwar ganz einfach weil keine Überfilterung mehr stattfindet, welche u.A. eben dafür verantwortlich ist, dass sich überscharfe mit zu unscharfen Bereichen abwechseln.

Xmas
2006-11-23, 11:26:09
Also haben wir bei 0.0 eine Mipmap mit 4x4 Texel und bei -1 eine mit 2x2. Für wieviel Texel haben wir bei -0.5 Platz? Genau für 3x3
Nein, weil der LOD logarithmisch verläuft. Eine 4x4-Textur auf ein 3x3-Pixel-Quadrat gemappt ergibt einen LOD von 0,415. Einen LOD von 0.5 hätte man bei einem Quadrat der Kantenlänge sqrt(8) ~= 2,828.

Verarschen kann ich mich alleine, von wegen Zauberschaltkreise und so. Nochmal:

x) 4xSGSSAA erlaubt ~ LOD -1
x) Der bilineare Übergang ist (ohne Modtreiber und brilinearen Überblendungsgeschichten) bei -0.5
D.h. mit 4xSGSSAA und Treiber LOD von -1 ist der bilineare Übergang schon
bei -1.5

Kommt nun ein Spiel wie Unreal daher und verschiebt das LOD um -0.5 wäre wir bei -2 für bilinearen Übergang. Ohne dass es mehr flimmert (SG mal ignoriert) als noAA mit bilinearem Filtering und Game LOD -0.5. (wo ja der bilineare Übergang auch schon bei -1 ist, also 4 Texel auf 1 Pixel treffen, also Hr. Nyquist dabei eigentlich kotzen hätte müssen)
Das ist aber noch lange nicht in der Nähe von 4xAF.

aths
2006-11-23, 13:09:31
Verarschen kann ich mich alleine, von wegen Zauberschaltkreise und so. Nochmal:

x) 4xSGSSAA erlaubt ~ LOD -1
x) Der bilineare Übergang ist (ohne Modtreiber und brilinearen Überblendungsgeschichten) bei -0.5
D.h. mit 4xSGSSAA und Treiber LOD von -1 ist der bilineare Übergang schon
bei -1.5

Kommt nun ein Spiel wie Unreal daher und verschiebt das LOD um -0.5 wäre wir bei -2 für bilinearen Übergang. Ohne dass es mehr flimmert (SG mal ignoriert) als noAA mit bilinearem Filtering und Game LOD -0.5. (wo ja der bilineare Übergang auch schon bei -1 ist, also 4 Texel auf 1 Pixel treffen, also Hr. Nyquist dabei eigentlich kotzen hätte müssen)Das würde er (und nicht nur er) bei Point Sampling tun. Bei bilinearer Filterung kann man das mit der LOD-Rundung durchaus machen, auch wenn dabei teilweise unterfiltert wird.

Wahrscheinlich ist die menschliche Wahrnehmung im Durchschnitt nur halb so gut wie von Nyquist angenommen, denn sonst hätten die Leute nicht alle mit Begeisterung Unreal gespielt, und es als Grafikreferenz angesehen.

Tatsächlich vergisst du imo aber eher, dass die Spiele nicht alle aus schwarz weißen Schachbretttexturen bestehen, und selbst bei meiner geliebten Extrem-Q3a-Textur Unterfilterung eigentlich erst seeehr spät sichtbar ist und ein bilineares Bild mit nem LOD von -0.5 automatisch homogener ist, als eins mit LOD 0.0. Und zwar ganz einfach weil keine Überfilterung mehr stattfindet, welche u.A. eben dafür verantwortlich ist, dass sich überscharfe mit zu unscharfen Bereichen abwechseln.Das SSAA erlaubt einen LOD von ca. -1. Alles was je nach Spiel zusätzlich geht, geht bei anderen Karten – bei denen man z. B. 4x AF aktivieren könnte – auch. Mit 2x2-Supersampling bekommt man ohne Flimmerei ein 2x-AF-Äquivalent hin, mehr nicht.

Mr. Lolman
2006-11-23, 17:05:35
Nein, weil der LOD logarithmisch verläuft. Eine 4x4-Textur auf ein 3x3-Pixel-Quadrat gemappt ergibt einen LOD von 0,415. Einen LOD von 0.5 hätte man bei einem Quadrat der Kantenlänge sqrt(8) ~= 2,828.

Arg. Gibts dazu weiterführende Literatur?


Das ist aber noch lange nicht in der Nähe von 4xAF.

Das LOD um -2 verschieben entspricht 4xAF. Zumindest zeigt mir dein Texturfilterproggi das an.

Das SSAA erlaubt einen LOD von ca. -1. Alles was je nach Spiel zusätzlich geht, geht bei anderen Karten – bei denen man z. B. 4x AF aktivieren könnte – auch. Mit 2x2-Supersampling bekommt man ohne Flimmerei ein 2x-AF-Äquivalent hin, mehr nicht.

Natürlich geht das auch bei anderen Karten. UT dürfte auf ner GF mit bilinearem Filtering und 4xOGSSAA auch die Schärfe von ~4xAF haben.

Das Praktische an der 3dfx Modtreibergeschichte ist, dass durch die Überblendung die überfilterterten 50% weggeglättet werden, ohne dabei die restlichen unterfilterten 50% der Mipmap zusätzlich in Mitleidenschaft zu ziehen (also noch stärker zu Unterfiltern, wie es bei eine generellen LOD Verschiebung z.B. der Fall wäre)

Xmas
2006-11-23, 17:24:02
Das LOD um -2 verschieben entspricht 4xAF. Zumindest zeigt mir dein Texturfilterproggi das an.
AF kommt allerdings zusätzlich zu dem LOD-Bias und dem Mip-Übergang bei der Halbstufe. Mit 4xAF statt SSAA wärst du bei -3 mit deiner Zählweise.

Mr. Lolman
2006-11-23, 17:36:39
AF kommt allerdings zusätzlich zu dem LOD-Bias und dem Mip-Übergang bei der Halbstufe. Mit 4xAF statt SSAA wärst du bei -3 mit deiner Zählweise.

Was ja dann schon ~8xAF entspräche....

aths
2006-11-24, 06:03:00
Natürlich geht das auch bei anderen Karten. UT dürfte auf ner GF mit bilinearem Filtering und 4xOGSSAA auch die Schärfe von ~4xAF haben.

Das Praktische an der 3dfx Modtreibergeschichte ist, dass durch die Überblendung die überfilterterten 50% weggeglättet werden, ohne dabei die restlichen unterfilterten 50% der Mipmap zusätzlich in Mitleidenschaft zu ziehen (also noch stärker zu Unterfiltern, wie es bei eine generellen LOD Verschiebung z.B. der Fall wäre)Das praktische bei der GeForce- und Radeon-Serie ist, dass sie gleich trilinear filtern was eine deutlich bessere Lösung als diese Halbstufen-Geschichte bei der Voodoo ist.

Nur weil UT (leider) unscharfe Texturen und LOD-Biasing nutzt heißt das nicht, dass man deswegen 4x AF bei 2x2 Supersampling bekommt. Würde man 4x-AF-Schärfe auf diesem Wege durch zwei Samples pro Achse erhalten, könnte man absichtlich mit unscharfen Texturen und LOD-Biasing arbeiten. Macht man aber nicht.

Auch bei 1024x (und trilinearem) AF hat man nur bestenfalls ein Texel pro Pixel, solange es nicht flimmern soll. Unscharfe Texturen mit dem Bias zurückzuschieben sorgt nicht für wundersame 4x-AF-Schärfe.

Was ja dann schon ~8xAF entspräche....... und flimmert.

Lange Rede, kurzer Sinn. 4x AF kostet schlimmstenfalls so viel wie 4x Supersampling (für den Rest gönnen wir uns Multisampling), und bringt 4x-AF-Texturen. Supersampling bringt nur 2x-AF-Texturen. Immerhin bringt die Voodoo 5 5500 4x sparse grid AA inkl. vollem Transparency-AA und (sogut wie) 2x AF. Für damals keine schlechte BQ. 4x-AF-Texturqualität bietet sie natürlich nicht.

Mr. Lolman
2006-11-24, 07:43:35
Das praktische bei der GeForce- und Radeon-Serie ist, dass sie gleich trilinear filtern was eine deutlich bessere Lösung als diese Halbstufen-Geschichte bei der Voodoo ist.

...auch deutlich teurer. Denn bei der Voodoo zahlst du nur die LOD Verschiebung.


Nur weil UT (leider) unscharfe Texturen und LOD-Biasing nutzt heißt das nicht, dass man deswegen 4x AF bei 2x2 Supersampling bekommt. Würde man 4x-AF-Schärfe auf diesem Wege durch zwei Samples pro Achse erhalten, könnte man absichtlich mit unscharfen Texturen und LOD-Biasing arbeiten. Macht man aber nicht.

Auch bei 1024x (und trilinearem) AF hat man nur bestenfalls ein Texel pro Pixel, solange es nicht flimmern soll. Unscharfe Texturen mit dem Bias zurückzuschieben sorgt nicht für wundersame 4x-AF-Schärfe.

... und flimmert.

Lange Rede, kurzer Sinn. 4x AF kostet schlimmstenfalls so viel wie 4x Supersampling (für den Rest gönnen wir uns Multisampling), und bringt 4x-AF-Texturen. Supersampling bringt nur 2x-AF-Texturen. Immerhin bringt die Voodoo 5 5500 4x sparse grid AA inkl. vollem Transparency-AA und (sogut wie) 2x AF. Für damals keine schlechte BQ. 4x-AF-Texturqualität bietet sie natürlich nicht.

UT2003/04 haben tw. zu unscharfe Texturen. Bei UT99 waren sie korrekt scharf (genauso wie bei Rune, Undying, Wheel of Time, Splinter Cell usw...). Mehr sag ich dazu nicht mehr. Denn die AF Schärfe entsteht automatisch schon beim noAA durch Bias zurückschieben. Die BQ ist dann nicht so toll wie mit SSAA oder gar echtem AF, die Schärfe jedoch ist gleich.

Und ein Mipmapübergang @ -2 flimmert mit 4xSGSSAA sicher nicht mehr als @ -1 ohne AA. Letzteres hatte man bei jedem UE Spiel, sofern bilineares Filtering aktiv war. Du schreibst ja auch selbst, dass sich dein Ausführungen nur auf Point Sampling beziehen...

aths
2006-11-24, 07:58:13
...auch deutlich teurer. Denn bei der Voodoo zahlst du nur die LOD Verschiebung.Zwei mal bilinear (Supersampling) ist nicht billiger als einmal trilinear (ohne Supersampling.) Trilineare Filterung ist logischerweise besser als diese Halbstufen-Sache bei der Voodoo. Trilineare Filterung ist in Bezug auf die LOD-Verteilung das beste, was man machen kann. Wenn du plötzlich mit den Kosten (Leistung) ankommst, dürftest du nicht mit Supersampling spielen, was teurer als (T-) MSAA +AF ist.

UT2003/04 haben tw. zu unscharfe Texturen. Bei UT99 waren sie korrekt scharf (genauso wie bei Rune, Undying, Wheel of Time, Splinter Cell usw...). Mehr sag ich dazu nicht mehr. Denn die AF Schärfe entsteht automatisch schon beim noAA durch Bias zurückschieben. Die BQ ist dann nicht so toll wie mit SSAA oder gar echtem AF, die Schärfe jedoch ist gleich.

Und ein Mipmapübergang @ -2 flimmert mit 4xSGSSAA sicher nicht mehr als @ -1 ohne AA. Letzteres hatte man bei jedem UE Spiel, sofern bilineares Filtering aktiv war. Du schreibst ja auch selbst, dass sich dein Ausführungen nur auf Point Sampling beziehen...Nur dass es bei der genutzten LOD-Rundung flimmern würde bezieht sich auf Point Sampling.

Man kann nicht straffrei -1 LOD-Bias (ohne Supersampling) einstellen ohne dass es flimmert. Wenn es aufgrund unscharfer Texturen doch nicht flimmert, hat man noch lange keine 2x-AF-Schärfe.

Soweit ich weiß, nutzt UT selbst einen negativen LOD-Bias. Noch mehr Biasing führte zum flimmern und wenn nicht, sind die Texturen zu unscharf als dass man eine 4x-AF-Schärfe erhielte. Außerdem wäre es sinnlos, mit einem Spiel zu vergleichen was auf allen Karten negatives LOD-Biasing vertragen würde, um der Voodoo 5 eine Filterqualitiät äquivalent zu 4x AF anzdichten.

Selbst die Voodoo 5 6000 bietet mit 8x sparse Supersampling nur ca. 3x AF.

Mr. Lolman
2006-11-25, 00:06:10
Zwei mal bilinear (Supersampling) ist nicht billiger als einmal trilinear (ohne Supersampling.) Trilineare Filterung ist logischerweise besser als diese Halbstufen-Sache bei der Voodoo. Trilineare Filterung ist in Bezug auf die LOD-Verteilung das beste, was man machen kann. Wenn du plötzlich mit den Kosten (Leistung) ankommst, dürftest du nicht mit Supersampling spielen, was teurer als (T-) MSAA +AF ist.


Dafür hat man zusätzlich ein schönes SGSSAA mit einem 2x2EER.


Man kann nicht straffrei -1 LOD-Bias (ohne Supersampling) einstellen ohne dass es flimmert. Wenn es aufgrund unscharfer Texturen doch nicht flimmert, hat man noch lange keine 2x-AF-Schärfe.

Man kann aber oft genug straffrei ein LOD-Bias von -0.5 (ohne Supersampling) einstellen, ohne das es flimmert. (dabei ist der Mipübergang mit bilinearem Filtering bei -1). Eine 2xAF Schärfe hat man tw. (deswegen nur tw. da ja stw. auch überfiltert wird) dabei aber trotzdem, da dem AF ja egal ist, wie scharf die Texturen sind.


Soweit ich weiß, nutzt UT selbst einen negativen LOD-Bias. Noch mehr Biasing führte zum flimmern und wenn nicht, sind die Texturen zu unscharf als dass man eine 4x-AF-Schärfe erhielte. Außerdem wäre es sinnlos, mit einem Spiel zu vergleichen was auf allen Karten negatives LOD-Biasing vertragen würde, um der Voodoo 5 eine Filterqualitiät äquivalent zu 4x AF anzdichten.

Naja, wenn man 4xSSAA dazuschaltet, kann man ja den LOD-Bias noch um -1 absenken. Dann ists also insgesamt bei -1,5. D.h. der bilineare Mipmapübergang ist bei -2, ohne, dass es mehr flimmert als ohne AA und ohne geändertem Treiberlod.


Selbst die Voodoo 5 6000 bietet mit 8x sparse Supersampling nur ca. 3x AF.

Im schlimmsten Fall. Bei hochfrequenten überscharfen Flimmertexturen, ja.

aths
2006-11-25, 08:09:43
Dafür hat man zusätzlich ein schönes SGSSAA mit einem 2x2EER. Was mit MSAA billiger zu bekommen ist.

Man kann aber oft genug straffrei ein LOD-Bias von -0.5 (ohne Supersampling) einstellen, ohne das es flimmert. (dabei ist der Mipübergang mit bilinearem Filtering bei -1). Eine 2xAF Schärfe hat man tw. (deswegen nur tw. da ja stw. auch überfiltert wird) dabei aber trotzdem, da dem AF ja egal ist, wie scharf die Texturen sind.

Naja, wenn man 4xSSAA dazuschaltet, kann man ja den LOD-Bias noch um -1 absenken. Dann ists also insgesamt bei -1,5. D.h. der bilineare Mipmapübergang ist bei -2, ohne, dass es mehr flimmert als ohne AA und ohne geändertem Treiberlod.

Im schlimmsten Fall. Bei hochfrequenten überscharfen Flimmertexturen, ja.Wenn ich -0,5 einstelle, wird es sehr schnell sehr hässlich flimmerig. In Max Payne (1 und 2), WoW oder WC3 kann ich das jedenfalls nicht tun, ohne Flimmern zu bekommen.

Deine Rechnung stimmt vorne und hinten nicht. Wenn du LOD-Bias -0,5 einstellst, hättest du kurz vor der Bilinearen MIP-Kante -1. Du kannst aber nicht diese ein Pixel dicke texturierte Zeile nutzen, um daraus irgendwie mit -1 = 2x-AF-Äquivalent abzuleiten. Zumal -0,5 generelles LOD bei bilinearer Filterung in der Regel scho flimmert. Mit 4x Supersampling hättest bei dieser einen Pixel breiten Linie zwar -2, durch das Supersampling aber "effektiv" nur -1, und logischerweise Flimmern (wenn wahrscheinlich auch etwas weniger als ohne Supersampling und ohne zusätzlicher -0,5-Verschiebung.) Wenn es aufgrund unscharfer Texturen doch nicht flimmert, und bei ohne Supersampling aber mit 4x AF auch am LOD drehen könnte, kommst du mit Supersampling wiederum nicht an die 4x-AF-Schärfe ran. Mit 4x sparsegrid-Supersampling hast du ein 2x-AF-Äquivalent, nicht mehr und nicht weniger.

Bei bilinearer Filterung das LOD bis 0,5 abzurunden ist das Maximum an Bildschärfe, das sinnvoll möglich ist. Wie gesagt bietet sich hier mein Overbright-Tool zum Rumspielen an. Du kannst ohne Supersampling nicht straffrei das LOD um 0,5 senken und schon gar nicht um 1,0, was aber für ein 2x-AF-Äquivalent notwendig wäre.

Mit 4x sg-MSAA (TAA) und 4x AF erreicht man bei gleicher Rohleistung mehr BQ (und das zumeist bei höherer Geschwindigkeit) als mit 4x sg-Supersampling. 4x sg-Supersampling bietet ein Bild was etwa 4x sg-MSAA (TAA) und 2x AF vergleichbar ist, aber immer die Füllrate auf 25% drückt. MSAA kostet fast gar keine Füllrate, 4x AF kostet nur selten mehr als 50% Füllrate. Bei der Voodoo kann man Supersampling noch nicht mal zur Vermeidung von Shader-Aliasing einsetzen – weil sie keine Shader hat.

Mr. Lolman
2006-11-25, 11:30:07
Was mit MSAA billiger zu bekommen ist.

Nicht aufs gesamte Bild ;)


Wenn ich -0,5 einstelle, wird es sehr schnell sehr hässlich flimmerig. In Max Payne (1 und 2), WoW oder WC3 kann ich das jedenfalls nicht tun, ohne Flimmern zu bekommen.

Max Payne seh ich mir gerne noch einmal an, WOW hab ich nicht.


Deine Rechnung stimmt vorne und hinten nicht. Wenn du LOD-Bias -0,5 einstellst, hättest du kurz vor der Bilinearen MIP-Kante -1. Du kannst aber nicht diese ein Pixel dicke texturierte Zeile nutzen, um daraus irgendwie mit -1 = 2x-AF-Äquivalent abzuleiten.

Naja, idf hat man bis -1 eine zumindest gleich hohe Schärfe (höher != besser, da AF optimale Schärfe bietet), wie 2xAF. Die Mip1 ist erst auf der Höhe von -1.5 gleich scharf wie beim 2xAF. Da aber die Mip1 (im Falle einer Verschiebung von -0.5) von -1 bis -1.5 mit der Mip Überblendet wird, ist die Schärfe gleich viel homogener, und eher mit AF zu verlgiechen.

Auf jeden Fall, ist damit bei 4xSGSSAA, UT und LOD -1 der bilineare Übergang von Mip 0 zu Mip 1 bei -2 und die Überblendung auf -2.5. Eine point gesampelte Schachbretttextur würde ekelhaft flimmern. Ich hingegen werf einmal schnell Unreal an (mit den schärferen S3TC Texturen) und mach nen Screenshot.


Zumal -0,5 generelles LOD bei bilinearer Filterung in der Regel scho flimmert.

Würd ich nicht sagen. In der Regel flimmert kein UE Spiel, aber LOD von -0.5 verwenden sie trotzdem


Mit 4x Supersampling hättest bei dieser einen Pixel breiten Linie zwar -2, durch das Supersampling aber "effektiv" nur -1, und logischerweise Flimmern (wenn wahrscheinlich auch etwas weniger als ohne Supersampling und ohne zusätzlicher -0,5-Verschiebung.) Wenn es aufgrund unscharfer Texturen doch nicht flimmert, und bei ohne Supersampling aber mit 4x AF auch am LOD drehen könnte, kommst du mit Supersampling wiederum nicht an die 4x-AF-Schärfe ran. Mit 4x sparsegrid-Supersampling hast du ein 2x-AF-Äquivalent, nicht mehr und nicht weniger.

Klar könnte man auf Chips, die AF beherrschen auch ne LOD Verschiebung machen. Wir lassen sie trotzdem mit 2xAF filtern. Jeder so wie er kann. Bei 3dfx gibts mit 4xSGSSAA dafür ein 4x4EER während die Konkurrenz nur 2x2EER kann. Mal abgesehen, dass es bei NV im Treiber AFAIK nie vorgesehen war, am LOD herumzuspielen. (weil auch kein Grund dazu)

Wir werden auch 3dfx' 22bit mit NVs 16bit vergleichen, aber auch genügend direkt vergleichbare Benchmarks anbieten. Am Besten dürfts sein, alle Settings wild durcheinander zu würfeln, die Ergebnisse nach den erreichten fps zu ordnen, und dazu eine kleine Vergleichsmöglichkeit einbauen, dass wenn man z.B. auf nen Balken klickt, sich ein Fenster öffnet mit nem Screenshot von dem jew. Spiel, den man dann wunderbar mit Screenshots von anderen GraKas/Einstellungen vergleichen kann.

Warum wird das machen? Weil nunmal Tatsache ist, dass jeder Voodoo5 Besitzer, mit aktivem AA, das LOD bis zur Schmerzgrenze abgesenkt hat, und wir eben diese Settings leistungs- und BQ mässig genauer untersuchen wollen.


Bei bilinearer Filterung das LOD bis 0,5 abzurunden ist das Maximum an Bildschärfe, das sinnvoll möglich ist. Wie gesagt bietet sich hier mein Overbright-Tool zum Rumspielen an. Du kannst ohne Supersampling nicht straffrei das LOD um 0,5 senken und schon gar nicht um 1,0, was aber für ein 2x-AF-Äquivalent notwendig wäre.

Anscheinend doch. Ignorier den UT Aspekt nicht.


Mit 4x sg-MSAA (TAA) und 4x AF erreicht man bei gleicher Rohleistung mehr BQ (und das zumeist bei höherer Geschwindigkeit) als mit 4x sg-Supersampling. 4x sg-Supersampling bietet ein Bild was etwa 4x sg-MSAA (TAA) und 2x AF vergleichbar ist, aber immer die Füllrate auf 25% drückt. MSAA kostet fast gar keine Füllrate, 4x AF kostet nur selten mehr als 50% Füllrate. Bei der Voodoo kann man Supersampling noch nicht mal zur Vermeidung von Shader-Aliasing einsetzen – weil sie keine Shader hat.

TAA/AAA kann seehr teuer sein - und glättet dann noch nichtmal alles. 6xASBT drückt meine X1900XTX im Nature01 auf ~ein Zehntel der Leistung von noAA. Bei 6xSGSSAA wärs immerhin ein Sechstel. :|


/edit: Hab grad nachgesehen. Unreal Tournament verwendet unter Glide ein default LOD-Bias von -1.5000000!! :hammer:

Xmas
2006-11-25, 17:10:45
TAA/AAA kann seehr teuer sein - und glättet dann noch nichtmal alles. 6xASBT drückt meine X1900XTX im Nature01 auf ~ein Zehntel der Leistung von noAA. Bei 6xSGSSAA wärs immerhin ein Sechstel. :|
Aber auch nur weil es ineffizient implementiert ist. Würde man effizientes SGSSAA vorsehen, könnte man mit derselben Hardware wohl auch TAA mit deutlich weniger Verlust nutzen.

Raff
2006-11-25, 17:13:23
/edit: Hab grad nachgesehen. Unreal Tournament verwendet unter Glide ein default LOD-Bias von -1.5000000!! :hammer:

Und ganz ehrlich: Das sieht man auch. Ohne AA flimmert das.

Aber auch nur weil es ineffizient implementiert ist. Würde man effizientes SGSSAA vorsehen, könnte man mit derselben Hardware wohl auch TAA mit deutlich weniger Verlust nutzen.

Guter Punkt. Könntest du das "ineffizient" etwas erläutern? ASBT ist nämlich ein gutes Argument pro FSSSAA und contra AAA. Vielleicht sollte man das mal Ati sagen, da die das nicht zu wissen scheinen. Man baut lieber Dinge in den Treiber ein, die bei weniger Qualität mehr Leistung ziehen ... ;)

MfG,
Raff

Mr. Lolman
2006-11-25, 19:01:17
Und ganz ehrlich: Das sieht man auch. Ohne AA flimmert das.


Was imo nicht weiter verwunderlich ist. Der erste Mipübergang ist bei -2. D.h. die Mipmaps werden bis zu 16 Texel/Pixel unterfiltert. Das kann dann natürlich auch kein bilinearer Filter mehr reparieren.

/edit: Das bedeutet aber andererseits auch, dass die Voodoos unter UT immer viel mehr ackern mussten. :|

Gast
2006-11-25, 22:33:30
/edit: Das bedeutet aber andererseits auch, dass die Voodoos unter UT immer viel mehr ackern mussten. :|

nö, die karte ackert nicht mehr bei einem negativem LOD, es werden (bei bilinearem filter) weiterhin 4texel/pixel verwendet.
würde die karte mehr ackern, also mehr texel in die berechnung einfließen könnte man ja das LOD verschieben ohne dass es flimmern würde.

das einzige was sich mit dem LOD ändert ist die trefferrate im texturcache, wobei diese sich bei negativem LOD auch kaum verändert und sich lediglich bei stark positivem LOD merklich verbessert.

insgesamt sind die unterschiede aber verdammt gering.

Raff
2006-11-25, 22:36:40
Natürlich ackert die Karte mehr, wenn man das LOD negativiert. Und das merkt man auch deutlich an den Fps.

MfG,
Raff

Gast
2006-11-25, 23:24:42
Natürlich ackert die Karte mehr, wenn man das LOD negativiert. Und das merkt man auch deutlich an den Fps.



dann sag mir was sie mehr macht.

bei bilinearer filterung ändert sich rein garnichts, es werden pro gerenderten pixel 4 texel zusammengerechnet, es sind lediglich andere texel die gefiltert werden.

kommt trilineare filterung zum einsatz verschiebt man damit die MIP0 nach hinten und damit den bereich in dem die trilineare interpolation anfängt nach hinten, die trilineare interpolation kommt also sogar bei deutlich weniger pixeln zum einsatz.

aths
2006-11-26, 11:07:04
Nicht aufs gesamte Bild ;)Die relevanten Stellen jedoch. So eine Skybox gewinnt durch 4x sparse Supersampling beispielsweise praktisch gar nicht, aber die Kosten sind natürlich da.


Naja, idf hat man bis -1 eine zumindest gleich hohe Schärfe (höher != besser, da AF optimale Schärfe bietet), wie 2xAF. Die Mip1 ist erst auf der Höhe von -1.5 gleich scharf wie beim 2xAF. Da aber die Mip1 (im Falle einer Verschiebung von -0.5) von -1 bis -1.5 mit der Mip Überblendet wird, ist die Schärfe gleich viel homogener, und eher mit AF zu verlgiechen.Die ganze Umherrechnerei verstehe ich nicht. Was du da so toll homogen findest, ist deutlich inhomogener als trilineare Filterung.

Klar könnte man auf Chips, die AF beherrschen auch ne LOD Verschiebung machen. Wir lassen sie trotzdem mit 2xAF filtern. Jeder so wie er kann. Bei 3dfx gibts mit 4xSGSSAA dafür ein 4x4EER während die Konkurrenz nur 2x2EER kann. Mal abgesehen, dass es bei NV im Treiber AFAIK nie vorgesehen war, am LOD herumzuspielen. (weil auch kein Grund dazu)Mit dem aTuner gehts schon lange, mit dem Rivatuner noch länger.

Wir werden auch 3dfx' 22bit mit NVs 16bit vergleichen, aber auch genügend direkt vergleichbare Benchmarks anbieten. Am Besten dürfts sein, alle Settings wild durcheinander zu würfeln, die Ergebnisse nach den erreichten fps zu ordnen, und dazu eine kleine Vergleichsmöglichkeit einbauen, dass wenn man z.B. auf nen Balken klickt, sich ein Fenster öffnet mit nem Screenshot von dem jew. Spiel, den man dann wunderbar mit Screenshots von anderen GraKas/Einstellungen vergleichen kann.

Warum wird das machen? Weil nunmal Tatsache ist, dass jeder Voodoo5 Besitzer, mit aktivem AA, das LOD bis zur Schmerzgrenze abgesenkt hat, und wir eben diese Settings leistungs- und BQ mässig genauer untersuchen wollen. "Mäßig" bitte mit ß.

Anscheinend doch. Ignorier den UT Aspekt nicht. So wie es in UT ist, ist es lange nicht überall, und eine LOD-Verschiebung in UT macht die Texturen nicht schärfer als hätte man gleich vernünftige Texturen genommen. Du kannst nicht sagen: Auf Voodoo nehmen wir 4x SSAA und ein LOD-Bias von -2 (durch SSAA -1) in dem einen Spiel, weil man das da wegen seiner unscharfen Texturen machen kann und auf der anderen Karte nehmen wir kein SAA und ein LOD-Bias von 0 und voila haben wir auf der Voodoo eine Schärfe die 4x AF entspricht. Du kannst gerne noch zehn mal von UT sprechen oder diese Halbton-Methode bei den MIPs als homogen loben (wobei sie inhomogener als trilineare Filterung ist) – deshalb lässt sich noch immer nicht mit zwei Samples pro Achse ein 4x-AF-Äquivalent erreichen.

/edit: Hab grad nachgesehen. Unreal Tournament verwendet unter Glide ein default LOD-Bias von -1.5000000!! :hammer:... woran man sieht, dass die Leute dort wenig Ahnung von vernünftiger Texturfilterung haben.

Coda
2006-11-26, 11:13:52
dann sag mir was sie mehr macht.

bei bilinearer filterung ändert sich rein garnichts, es werden pro gerenderten pixel 4 texel zusammengerechnet, es sind lediglich andere texel die gefiltert werden.

kommt trilineare filterung zum einsatz verschiebt man damit die MIP0 nach hinten und damit den bereich in dem die trilineare interpolation anfängt nach hinten, die trilineare interpolation kommt also sogar bei deutlich weniger pixeln zum einsatz.

Das Problem ist dass der Texturcache öfters getrasht wird. Das hat durchaus Auswirkungen auf die Performance.

Gast
2006-11-26, 12:12:42
Das Problem ist dass der Texturcache öfters getrasht wird. Das hat durchaus Auswirkungen auf die Performance.

hab ich doch geschrieben, dass sich die trefferrate im texturcache verschlechtert, gerechnet wird trotzdem nicht mehr.

btw: ich hab mal einen kurzen testdurchlauf mit aquamark gemacht:

LOD -3: 74fps
LOD -1,5: 76fps
LOD 0: 77fps
LOD +3: 77fps

wie man sieht sind die unterschiede selbst bei einem LOD von -3 mit 4% extrem gering, bei LOD -1,5 ist der unterschied schon fast mit messungenauigkeit gleichzusetzen.

Gast
2006-11-26, 12:52:51
hab ich doch geschrieben, dass sich die trefferrate im texturcache verschlechtert, gerechnet wird trotzdem nicht mehr.

btw: ich hab mal einen kurzen testdurchlauf mit aquamark gemacht:

LOD -3: 74fps
LOD -1,5: 76fps
LOD 0: 77fps
LOD +3: 77fps

wie man sieht sind die unterschiede selbst bei einem LOD von -3 mit 4% extrem gering, bei LOD -1,5 ist der unterschied schon fast mit messungenauigkeit gleichzusetzen.

Welche GraKa? Wenn die CPU limitiert (was bei AM ziemlich schnell der Fall ist), macht das natürlich keine grossen Unterschiede...

Gast
2006-11-26, 14:01:00
Welche GraKa? Wenn die CPU limitiert (was bei AM ziemlich schnell der Fall ist), macht das natürlich keine grossen Unterschiede...

6800GT@ultra, mit pentium m @200x12.

ich hab extra aquamark gewählt, da jener recht texturlastig ist, bei shaderlastigen szenarien ist der unterschied sicher noch geringer.

Gast
2006-11-26, 14:32:52
Welche GraKa? Wenn die CPU limitiert (was bei AM ziemlich schnell der Fall ist), macht das natürlich keine grossen Unterschiede...

um eine cpu-limitierung auszuschließen das ganze mal mit einem einzigen NV40-quad@400MHz:

LOD +3: 45fps
LOD 0: 44fps
LOD -1: 44fps
LOD -1,5: 44fps
LOD -2: 43fps
LOD -3: 41fps

einen wirklich erwähnenswerten einbruch gibt es also erst mit einem LOD von -3, bis -2 kann man das ganze fast noch der messungenauigkeit zuordnen.

Mr. Lolman
2006-11-26, 17:05:37
Voodoos (und höchstwahrscheinlich alle Karten der damaligen Generation) brechen jedenfalls ordentlich ein (Voodooo5 5500 PCI),:

Ultima IX, LOD 0.0: 56 fps
Ultima IX, LOD -2 (3dfx -8): 38 fps

Gast
2006-11-26, 22:22:27
Voodoos (und höchstwahrscheinlich alle Karten der damaligen Generation) brechen jedenfalls ordentlich ein (Voodooo5 5500 PCI),:

Ultima IX, LOD 0.0: 56 fps
Ultima IX, LOD -2 (3dfx -8): 38 fps

theoretisch sollten die damaligen geforce-karten stärker einbrechen, da das füllraten/bandbreiten-verhältnis bei den voodoos wesentlich ausgewogener war.

die frage ist auch ob dein test mit damals offiziellen teibern oder mit irgendwelchen post3dfx-treibern entstanden ist. könnte nämlich durchaus sein, dass die offiziellen treiber damals den texturcache für LOD-änderungen entsprechend umkonfiguriert haben, die heutigen mod-treiber dieses aber nicht tun.