Razor
2001-10-30, 12:49:54
Keine Angst, hier wird es nicht um ein neues ATI vs. nVidia gehen, sondern lediglich über den Sinn oder Unsinn von höheren Takten bei einer gf3 (egal, ob gf3/Ti200/Ti500), bezogen auf die Performance von Games (hier bei Quake 3).
Auch werde ich im Anhang dieses Posts dann auch mal einen 3D-Qualitätsvergleich mitgeben, welcher dokumentieren soll, wie sich FSAA und anisotrope Filter auf die Darstellung auswirken...
Nun aber los !
;-)
Allen gezeigten Bench-Vergleichen liegt folgendes System zugrunde:
ABit BXR2 mit PIII700@900
256MB PC133@129 SDRAM Infinion CL
ELSA Gladiac 920 (i.e. ur-gf3)
Win98SE (DX8.0a) mit Deto 21.88
Quake 3 V1.17 1024x768x32 HQ++ (TC aus)
************************************************************
Performance-Gewinne durch höheren Takt von Chip und Speicher
************************************************************
Zuerst möchte ich einmal dokumentieren, daß ein höherer Takt bei der GraKa nur in bestimmten Situation wirklich Sinn macht. So bringt ein höherer Takt bei Standard-Auflösungen herzlich wenig, da der Performance-Gewinn hier nur minimal ist. Wenn aber FSAA und anisotrope Filter ins Spiel kommen, wendet sich das Blatt. Was bedeutet, daß ein Unterschied zwischen Ti200 und Ti500 sehr wohl zum Tragen kommt (natürlich auch das Übertakten jeder gf3 dann Sinn macht), wenn man auf Qualität wert legt...
Habe hier ein OC von Chip+10% und Speicher+15% zugrunde gelegt, was einen Performance-Gewinn von real 12% bringen sollte.
kein FSAA und kein aniso
Bench-Demo: 200/460 -> 220/530 = Perf.Gewinn
Demo001...: 116,2 -> 119,2 = + 2,58 %
Quaver.....: 104,8 -> 106,2 = + 1,34 %
Crusher....: 060,5 -> 061,3 = + 1,32 %
Annihilator: 039,4 -> 039,4 = + 0,00 %
Fazit: Wie erwartet, denn keine wesentlichen Performance-Verbesserungen zu vermelden, bringt also recht wenig (und im Falle von Annihilator sogar schlicht Nichts ;-).
2xQFSAA und 32-tap anisorope Filterung
Bench-Demo: 200/460 -> 220/530 = Perf.Gewinn
Demo001...: 54,2 -> 60,7 = + 11,99 %
Quaver.....: 49,4 -> 55,4 = + 12,15 %
Crusher....: 33,1 -> 36,9 = + 11,48 %
Annihilator: 39,4 -> 39,4 = + 10,49 %
Fazit: Das Blatt hat sich gewendet. Plötzlich sind selbst bei dieser Auflösung die prognostizierten 12% Performace-Gewinne erreichbar. Sowwohl der erhöhte Chip-, als auch Speichertakt hat also einen direkten Einfluß auf die reale Leistung.
Und hier noch mal ein kleines Smankerl auf Basis der maximalen Leistung meiner GraKa (die der der nicht-übertakteten Ti500 sehr nahe kommen dürfte, bzw. diese vermutlich sogar schlägt):
2xQFSAA und 32-tap anisorope Filterung
Bench-Demo: 200/460 -> 245/540 = Perf.Gewinn
Quaver: 49,4 -> 59,6 = + 20,65 %
Nen Hammer, was ?
Das maximale OC meiner GraKa hat's also geschafft, mit Erhöhung von Chip- (+22,5%) und Speicher-Takt (+17,5%) 'reale' 20,65% heraus zu holen, was dann wieder zu den 'spielbaren' 60fps führt...
-
Das ganze sollte jetzt NICHT zeigen, wie toll meine gf3 ist, sondern es sollte verdeutlichen, daß ein höherer Takt bei einer gf3 (alle verfügbaren) nur dann 'richtig' was bringt, wenn man auch Qualität im Sinne von FSAA und anisotropen Filtern anfordert. Wer also auf diese zusätzlichen Freatuers verzichten möchte, braucht sich wirklich kaum Gedenken über das Übertakten seiner GraKa zu machen, da selbst hier das untere Glied (die Ti200) völlig ausreichend für alles ist und dann auch eine Ti500 überhaupt keinen Sinn macht.
Wenn man sich aber nun vor Augen führt, wie sich alleine schon die unterscheidliche Standard-Taktung beider GraKa's bei FSAA und anisoFiltern auswirkt, dann macht eine Ti500 sogar richtig Sinn:
Theoretische Darstellung:
gf3 Ti200 (175/400) = 46fps
gf3 Ti500 (240/500) = 60fps
Der erhöhte Takt (Chip+37%/Speicher+25%) kann bei entsprechender Qualität also ca. 30% Performancezuwachs bringen.
Natürlich gibt's sowohl bei der Ti200, als auch bei der Ti500 besseren Speicher und antürlich auch die Möglichkeit die GPU zu übertakten, welches dann noch weit mehr Potential frei setzt. So habe ich schon Ti200'er gesehen (im Netz ;-), die locker 230/500 machen und Ti500'er die dann sogar auf 270/570 gehen...
*************************************************************
Performance-Verluste der Features: FSAA und anisotrope Filter
*************************************************************
Hier möchte ich noch mal generell auf den Verlust von Performance bei der Kombination der unterschiedlichen Features eingehen, der zeigen soll, wie hoch der Verlust sein kann, wenn man sogar optimalste Qualität erhalten will (was jeder sicher sehr unterschiedlich definiert).
HRAA meint FullScreen-Antialiasing (High-Resolution multisampling)
QSAA meine FullScreen-Antialiasing (High-Resolution 'Quincunx')
Demo: Quaver
Modus..: 00-tap -> 32-tap -> 64-tap | 00-tap -> 32-tap -> 64-tap
------------------------------------------------------------------
NoFSAA: 104,80 -> 090,20 -> 082,50 | 00,00% -> 13,93% -> 21,28%
2xHRAA: 080,60 -> 055,80 -> 049,40 | 00,00% -> 30,77% -> 38,71%
2xQSAA: 068,40 -> 049,40 -> 044,30 | 00,00% -> 28,78% -> 35,23%
4xHRAA: 057,80 -> 045,10 -> 040,80 | 00,00% -> 21,97% -> 29,41%
--------------------------------------------------------------------
NoFSAA: 00,00% -> 00,00% -> 00,00% | 00,00% -> 13,93% -> 21,28%
2xHRAA: 23,09% -> 38,14% -> 40,12% | 23,09% -> 46,76% -> 52,86%
2xQSAA: 34,73% -> 45,23% -> 46,30% | 34,73% -> 52,86% -> 57,73%
4xHRAA: 44,85% -> 50,00% -> 50,55% | 44,85% -> 56,97% -> 61,07%
----------------------------------------------------------------------
Sehr interessant nicht wahr ?
Maximal sind also satte 60% Verlust drin (4xHRAA & 64-tap anisoFilter) !
Also auch hier noch mal erwähnt: jede noch so kleine Takterhöhung kann helfen...
Diese Features bringen zwar Qualität aber kosten heftig Performance. Während das reine ansiotrope Filtern noch realtive 'günstig' ist, schlägt es bei aktivertem FSAA richtig zu. Interessant ist auch , daß der Verlust bei höheren FSAA-Stufen immer geringer wird. Wie das wohl zu erklären ist ? Und die 64-tap anisoFilter gibt's für konstante 8% zusätzlichen Leistungsverlust. Auch das ist ein Punkt den ich als sehr Diskussionswürdig ansehen würde...
******************************************************************
3D-Bildqualitäts-Gewninn/Verlust(?) durch Aktivierung der Features
******************************************************************
Hier jetzt noch mal der versprochene Bildqualitäts-Vergleich der auch den Sinn oder Unsinn von QFSAA und/oder 64-tap anisotroper Filterung verdeutlichen soll...
Ich persönlich finde QFSAA am hübschesten, da dieser FSAA-Modus für mich die optimale Bildqualität liefert (natürlich mit 32-tap aniso ;-). Man beachte den Glimmstängel im Mundwinkel, der nur hier einen 'weichen' Eindruck macht. Aber ich kann auch gut verstehen, daß einige dies als verwaschen empfinden...
Für mich ergibt sich kein Unterschied zwischen 32-tap und 64-tap, auch bei Betrachtung der orginalen TGA-Shots !
(was aber auch an Q3 liegen mag ;-)
Schaut's euch einfach mal an !
;-)
Und bitte bedenken, daß den Shot's folgende Einschränkungen zugrunde liegen (Forum läßt nur maximal 200kB zu):
(ich hoffe, daß man trotzdem erkennt, wo die Unterschiede sind ;-)
-Farbtiefe von 32-Bit auf 24-Bit (da TGA-Screenshot)
-Bildausschnitte wurden auf 200% vergrößert
-JPEG Qualiät von 100 auf 90 reduziert
Den Bildausschnitt habe ich gewählt, weil hier beide Effekte paralell in Augenschein genommen werden können:
-An dem Gesicht kann man sehr gut den AA-Effekt beurteilen, gerade weil das so eine verkümmerte Textur ist.
(der anisoFilter bringt dort natürlich nichts, denn wo Nichts ist, kann auch nichts schärfer gemacht werden ;-)
-Die hintere Bodentextur vedeutlicht den anisoFilter-Effekt
(Shot oben links ist recht verwaschen, während es weiter rechts an schärfe zunimmt)
Auch kann man das 'verwaschen' der Texturen durch das FSAA ganz gut beurteilen, auch, wie der anisoFilter in der lage ist, das (zuminest fast ;-) wieder auszugleichen...
Die Beurteilung dessen möchte ich hiermit zur Diskussion stellen !
;-)
***
Ich hoffe, nun etwas Licht in's Dunkel gebracht zu haben, wie sich dieses mit den Features und den dafür benötigten Resourcen verhält. Mich persönlich würde die zusätzliche Leistung einer Ti500 nicht dazu bringen, nun meine gf3 zu tauschen...
Wem aber das Geld locker in der Tasche sitzt, könnte durchaus Interesse dafür aufbringen, ein 'paar' Mark mehr für das zusätzliche Qualitäts-Potential einer Ti500 auszugeben !
Auch ich würde mir wünschen, daß bald Mechanismen entwickelt werden, die weit weniger Performance schlucken, als es derzeitige Lösungen tun. ATI's Implementierung der anisotropen Filter (leider nur bilinear) und Smoothvision (bin sehr auf diesbezügliche Tests gespannt !) könnten schon ein Schritt in diese Richtung sein...
Anmerkungen und Kritik, aber auch generelle Gedanken zu diesem Thema sind sehr erwünscht !
In diesem Sinne
Razor
P.S.: Die Reihenfolge der Bildchen entspricht den zuvor gannten Benches:
NoFSAA 0-tap - NoFSAA & 32-tap - NoFSAA & 64-tap
2xHRAA 0-tap - 2xHRAA & 32-tap - 2xHRAA & 64-tap
2xQSAA 0-tap - 2xQSAA & 32-tap - 2xQSAA & 64-tap
4xHRAA 0-tap - 4xHRAA & 32-tap - 4xHRAA & 64-tap
Auch werde ich im Anhang dieses Posts dann auch mal einen 3D-Qualitätsvergleich mitgeben, welcher dokumentieren soll, wie sich FSAA und anisotrope Filter auf die Darstellung auswirken...
Nun aber los !
;-)
Allen gezeigten Bench-Vergleichen liegt folgendes System zugrunde:
ABit BXR2 mit PIII700@900
256MB PC133@129 SDRAM Infinion CL
ELSA Gladiac 920 (i.e. ur-gf3)
Win98SE (DX8.0a) mit Deto 21.88
Quake 3 V1.17 1024x768x32 HQ++ (TC aus)
************************************************************
Performance-Gewinne durch höheren Takt von Chip und Speicher
************************************************************
Zuerst möchte ich einmal dokumentieren, daß ein höherer Takt bei der GraKa nur in bestimmten Situation wirklich Sinn macht. So bringt ein höherer Takt bei Standard-Auflösungen herzlich wenig, da der Performance-Gewinn hier nur minimal ist. Wenn aber FSAA und anisotrope Filter ins Spiel kommen, wendet sich das Blatt. Was bedeutet, daß ein Unterschied zwischen Ti200 und Ti500 sehr wohl zum Tragen kommt (natürlich auch das Übertakten jeder gf3 dann Sinn macht), wenn man auf Qualität wert legt...
Habe hier ein OC von Chip+10% und Speicher+15% zugrunde gelegt, was einen Performance-Gewinn von real 12% bringen sollte.
kein FSAA und kein aniso
Bench-Demo: 200/460 -> 220/530 = Perf.Gewinn
Demo001...: 116,2 -> 119,2 = + 2,58 %
Quaver.....: 104,8 -> 106,2 = + 1,34 %
Crusher....: 060,5 -> 061,3 = + 1,32 %
Annihilator: 039,4 -> 039,4 = + 0,00 %
Fazit: Wie erwartet, denn keine wesentlichen Performance-Verbesserungen zu vermelden, bringt also recht wenig (und im Falle von Annihilator sogar schlicht Nichts ;-).
2xQFSAA und 32-tap anisorope Filterung
Bench-Demo: 200/460 -> 220/530 = Perf.Gewinn
Demo001...: 54,2 -> 60,7 = + 11,99 %
Quaver.....: 49,4 -> 55,4 = + 12,15 %
Crusher....: 33,1 -> 36,9 = + 11,48 %
Annihilator: 39,4 -> 39,4 = + 10,49 %
Fazit: Das Blatt hat sich gewendet. Plötzlich sind selbst bei dieser Auflösung die prognostizierten 12% Performace-Gewinne erreichbar. Sowwohl der erhöhte Chip-, als auch Speichertakt hat also einen direkten Einfluß auf die reale Leistung.
Und hier noch mal ein kleines Smankerl auf Basis der maximalen Leistung meiner GraKa (die der der nicht-übertakteten Ti500 sehr nahe kommen dürfte, bzw. diese vermutlich sogar schlägt):
2xQFSAA und 32-tap anisorope Filterung
Bench-Demo: 200/460 -> 245/540 = Perf.Gewinn
Quaver: 49,4 -> 59,6 = + 20,65 %
Nen Hammer, was ?
Das maximale OC meiner GraKa hat's also geschafft, mit Erhöhung von Chip- (+22,5%) und Speicher-Takt (+17,5%) 'reale' 20,65% heraus zu holen, was dann wieder zu den 'spielbaren' 60fps führt...
-
Das ganze sollte jetzt NICHT zeigen, wie toll meine gf3 ist, sondern es sollte verdeutlichen, daß ein höherer Takt bei einer gf3 (alle verfügbaren) nur dann 'richtig' was bringt, wenn man auch Qualität im Sinne von FSAA und anisotropen Filtern anfordert. Wer also auf diese zusätzlichen Freatuers verzichten möchte, braucht sich wirklich kaum Gedenken über das Übertakten seiner GraKa zu machen, da selbst hier das untere Glied (die Ti200) völlig ausreichend für alles ist und dann auch eine Ti500 überhaupt keinen Sinn macht.
Wenn man sich aber nun vor Augen führt, wie sich alleine schon die unterscheidliche Standard-Taktung beider GraKa's bei FSAA und anisoFiltern auswirkt, dann macht eine Ti500 sogar richtig Sinn:
Theoretische Darstellung:
gf3 Ti200 (175/400) = 46fps
gf3 Ti500 (240/500) = 60fps
Der erhöhte Takt (Chip+37%/Speicher+25%) kann bei entsprechender Qualität also ca. 30% Performancezuwachs bringen.
Natürlich gibt's sowohl bei der Ti200, als auch bei der Ti500 besseren Speicher und antürlich auch die Möglichkeit die GPU zu übertakten, welches dann noch weit mehr Potential frei setzt. So habe ich schon Ti200'er gesehen (im Netz ;-), die locker 230/500 machen und Ti500'er die dann sogar auf 270/570 gehen...
*************************************************************
Performance-Verluste der Features: FSAA und anisotrope Filter
*************************************************************
Hier möchte ich noch mal generell auf den Verlust von Performance bei der Kombination der unterschiedlichen Features eingehen, der zeigen soll, wie hoch der Verlust sein kann, wenn man sogar optimalste Qualität erhalten will (was jeder sicher sehr unterschiedlich definiert).
HRAA meint FullScreen-Antialiasing (High-Resolution multisampling)
QSAA meine FullScreen-Antialiasing (High-Resolution 'Quincunx')
Demo: Quaver
Modus..: 00-tap -> 32-tap -> 64-tap | 00-tap -> 32-tap -> 64-tap
------------------------------------------------------------------
NoFSAA: 104,80 -> 090,20 -> 082,50 | 00,00% -> 13,93% -> 21,28%
2xHRAA: 080,60 -> 055,80 -> 049,40 | 00,00% -> 30,77% -> 38,71%
2xQSAA: 068,40 -> 049,40 -> 044,30 | 00,00% -> 28,78% -> 35,23%
4xHRAA: 057,80 -> 045,10 -> 040,80 | 00,00% -> 21,97% -> 29,41%
--------------------------------------------------------------------
NoFSAA: 00,00% -> 00,00% -> 00,00% | 00,00% -> 13,93% -> 21,28%
2xHRAA: 23,09% -> 38,14% -> 40,12% | 23,09% -> 46,76% -> 52,86%
2xQSAA: 34,73% -> 45,23% -> 46,30% | 34,73% -> 52,86% -> 57,73%
4xHRAA: 44,85% -> 50,00% -> 50,55% | 44,85% -> 56,97% -> 61,07%
----------------------------------------------------------------------
Sehr interessant nicht wahr ?
Maximal sind also satte 60% Verlust drin (4xHRAA & 64-tap anisoFilter) !
Also auch hier noch mal erwähnt: jede noch so kleine Takterhöhung kann helfen...
Diese Features bringen zwar Qualität aber kosten heftig Performance. Während das reine ansiotrope Filtern noch realtive 'günstig' ist, schlägt es bei aktivertem FSAA richtig zu. Interessant ist auch , daß der Verlust bei höheren FSAA-Stufen immer geringer wird. Wie das wohl zu erklären ist ? Und die 64-tap anisoFilter gibt's für konstante 8% zusätzlichen Leistungsverlust. Auch das ist ein Punkt den ich als sehr Diskussionswürdig ansehen würde...
******************************************************************
3D-Bildqualitäts-Gewninn/Verlust(?) durch Aktivierung der Features
******************************************************************
Hier jetzt noch mal der versprochene Bildqualitäts-Vergleich der auch den Sinn oder Unsinn von QFSAA und/oder 64-tap anisotroper Filterung verdeutlichen soll...
Ich persönlich finde QFSAA am hübschesten, da dieser FSAA-Modus für mich die optimale Bildqualität liefert (natürlich mit 32-tap aniso ;-). Man beachte den Glimmstängel im Mundwinkel, der nur hier einen 'weichen' Eindruck macht. Aber ich kann auch gut verstehen, daß einige dies als verwaschen empfinden...
Für mich ergibt sich kein Unterschied zwischen 32-tap und 64-tap, auch bei Betrachtung der orginalen TGA-Shots !
(was aber auch an Q3 liegen mag ;-)
Schaut's euch einfach mal an !
;-)
Und bitte bedenken, daß den Shot's folgende Einschränkungen zugrunde liegen (Forum läßt nur maximal 200kB zu):
(ich hoffe, daß man trotzdem erkennt, wo die Unterschiede sind ;-)
-Farbtiefe von 32-Bit auf 24-Bit (da TGA-Screenshot)
-Bildausschnitte wurden auf 200% vergrößert
-JPEG Qualiät von 100 auf 90 reduziert
Den Bildausschnitt habe ich gewählt, weil hier beide Effekte paralell in Augenschein genommen werden können:
-An dem Gesicht kann man sehr gut den AA-Effekt beurteilen, gerade weil das so eine verkümmerte Textur ist.
(der anisoFilter bringt dort natürlich nichts, denn wo Nichts ist, kann auch nichts schärfer gemacht werden ;-)
-Die hintere Bodentextur vedeutlicht den anisoFilter-Effekt
(Shot oben links ist recht verwaschen, während es weiter rechts an schärfe zunimmt)
Auch kann man das 'verwaschen' der Texturen durch das FSAA ganz gut beurteilen, auch, wie der anisoFilter in der lage ist, das (zuminest fast ;-) wieder auszugleichen...
Die Beurteilung dessen möchte ich hiermit zur Diskussion stellen !
;-)
***
Ich hoffe, nun etwas Licht in's Dunkel gebracht zu haben, wie sich dieses mit den Features und den dafür benötigten Resourcen verhält. Mich persönlich würde die zusätzliche Leistung einer Ti500 nicht dazu bringen, nun meine gf3 zu tauschen...
Wem aber das Geld locker in der Tasche sitzt, könnte durchaus Interesse dafür aufbringen, ein 'paar' Mark mehr für das zusätzliche Qualitäts-Potential einer Ti500 auszugeben !
Auch ich würde mir wünschen, daß bald Mechanismen entwickelt werden, die weit weniger Performance schlucken, als es derzeitige Lösungen tun. ATI's Implementierung der anisotropen Filter (leider nur bilinear) und Smoothvision (bin sehr auf diesbezügliche Tests gespannt !) könnten schon ein Schritt in diese Richtung sein...
Anmerkungen und Kritik, aber auch generelle Gedanken zu diesem Thema sind sehr erwünscht !
In diesem Sinne
Razor
P.S.: Die Reihenfolge der Bildchen entspricht den zuvor gannten Benches:
NoFSAA 0-tap - NoFSAA & 32-tap - NoFSAA & 64-tap
2xHRAA 0-tap - 2xHRAA & 32-tap - 2xHRAA & 64-tap
2xQSAA 0-tap - 2xQSAA & 32-tap - 2xQSAA & 64-tap
4xHRAA 0-tap - 4xHRAA & 32-tap - 4xHRAA & 64-tap