PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Radeon9500 und SeSam SE's Multitexturing


Quasar
2002-12-06, 02:15:33
Das Nine-Seven-Pro Review von Tommti-Systems hatte IMO einen sehr erwähnenswerten Punkt: Die Unterschiede in der Performance, wenn man der SeSam-Engine eine unterschiedliche Anzahl an Texturen pro Pass gestattet.

http://www.tommti-systems.com/main-Dateien/reviews/radeon9700/ss2_gl_2.gif
Tommti-Systems führte dies auf die erhöhte Effektivität in der Nutzung von early-Z rejection bei Single-Texturing zurück und schlussfolgerte, dass die Texelfüllrate effektiver genutzt werden könnte.
Theoretisch klingt das durchaus plausibel und ich dachte mir, da die R300-Karten in SeSam SE ja nicht so gut abschneiden, wie in der Mehrzahl der Games, ich probiere es einmal auf der deutlich füllratenschwächeren Radeon9500 einmal aus.
Ich nahm hierfür das Grand-Cathedral Demo und benchte mit den Scripts von 3D-Center (32Bit-HQ++) in 1024, um die Bandbreite ein wenig aus dem Spiel zu nehmen.
Obwohl die R9500 aufgrund ihrer weniger als halb so hohen Füllrate mindestens ebenso deutlich davon profitieren sollte, trat bei mir genau das Gegenteil auf, im Gegensatz zur normalen "Quad"-Einstellung (60,8fps) verlor die Karte auf den Settings "none"(60,2), "dual"(59,6) und "triple"(59,7) wenn auch nur mäßig an Geschwindigkeit, im Gegensatz zu den recht starken Performance-Gewinnen, die Tommti-Systems ermittelte.

Irgendetwas scheint da noch zu bremsen....

nagus
2002-12-06, 08:06:24
hoch interessant! muß ich am wochenende ausprobieren....

Unreal Soldier
2002-12-06, 09:52:54
Na das ist mal was neues.

Demirug
2002-12-06, 09:58:14
Was für einen 9500 hast du den benutzt? Eine Pro oder die normale und wie war die Karte vom Speicher her bestückt (64 oder 128)?

nagus
2002-12-06, 10:24:24
es liegt mir fern die ATI treiber schlecht zu reden, aber kann es sein, dass es sich hier um einen bug handelt?

Quasar
2002-12-06, 11:12:29
@Demirug:
9500 (ohne pro) mit 64MB....genau den "Problemfall", den wir schon wegen des 2x64 Interfaces, des möglichen unveränderten R9700pro-BIOS etc. pp. hatten....

@nagus:
Gut möglich, aber der Bug müsste schon recht spezifisch sein, wenn er eine R9700pro nicht betrifft.

nagus
2002-12-06, 11:44:32
Originally posted by Quasar
@Demirug:
9500 (ohne pro) mit 64MB....genau den "Problemfall", den wir schon wegen des 2x64 Interfaces, des möglichen unveränderten R9700pro-BIOS etc. pp. hatten....

@nagus:
Gut möglich, aber der Bug müsste schon recht spezifisch sein, wenn er eine R9700pro nicht betrifft.

bist du dir sicher, dass die 9700 serie nicht davon betriffen ist?

Quasar
2002-12-06, 11:46:20
Nein, nicht first-hand. Aber mit so einer hat Thomas von Tommti-Systems hat getestet, weswegen mit der eigentlich ein Anstieg der Frameraten drin sein sollte. Den Benchmark wird er sicherlich bedienen können, so kompetent, wie er sonst rüberkommt.

Demirug
2002-12-06, 12:05:24
Ich würde darauf tippen das das Memoryinterface den early-Z Vorteil wieder aufhebt. Den für die Pixel die ja trotzdem berechnet werden müssen steigt die Belastung an. Die 9700 hat wohl noch genügend Bandbreite übrig um die freiwerdende Füllrate zu nutzen. Bei der 9500 wird wohl zwar auch Füllrate frei aber die Bandbreite läst wohl nicht zu das man sie nutzt.

Da jetzt sicher gleich der einspruch kommt das die 9500 ja die halbe Füllrate und die halbe Bandbreite hat und das verhalten deshalb ähnlich sein müsste noch folgendes zur Ergänzung.

Auf dem Papier ist die Bandbreite halbiert. In der Praxsis ist aber die wirklich nutzbare bandbreite prozentual gesehen auf der 9500 kleiner als auf der 9700. Dafür ist die unterschiedliche Anzahl von Kanälen verantwortlich.

Edit: Man müsste das ganze mal auf einer 128 MB 9500 testen die ja mit an sicherheit grenzende Wahrscheinlichkeit noch das 256 bit interface hat.

Quasar
2002-12-06, 12:12:33
Trotzdem ich dir in fast allen Punkten zustimme, denke ich, dass die R9500 (64MB, ohne pro) kaum in ihrer Bandbreite limitiert wird, da 2x und 4xFSAA, wo es denn möglich ist, mit erstaunlich wenig Einbruch in der Framerate ausgeführt werden können.

Bandbreitenlimitiert ist die R9500 ziemlich sicher nicht, dafür ist ihre Füllrate einfach zu niedrig.

Demirug
2002-12-06, 12:29:51
Originally posted by Quasar
Trotzdem ich dir in fast allen Punkten zustimme, denke ich, dass die R9500 (64MB, ohne pro) kaum in ihrer Bandbreite limitiert wird, da 2x und 4xFSAA, wo es denn möglich ist, mit erstaunlich wenig Einbruch in der Framerate ausgeführt werden können.

Bandbreitenlimitiert ist die R9500 ziemlich sicher nicht, dafür ist ihre Füllrate einfach zu niedrig.

Denkaufgabe:

http://www.digit-life.com/articles2/radeon/sapphire-r9500-128.html

Bitte die ST-Tests der 9500 mit 64 und 128 MB vergleichen.

Die 128 MB Version erreicht jedesmal erheblich mehr. Das ist definitive ein Bandbreiten Problem. Ich denke das die Bandbreite der 64MB Version eigentlich auch reichen müsste sie aber aus irgendeinem Grund nicht genutzt werden kann. Ob das ganze nun eine Sache ist die man mit den Treiber in den Griff bekommen kann vermag ich allerdings nicht zu sagen. NVIDIA hat ja scheinbar im laufe der Zeit ja noch eine ganze menge aus der Crossbar herausgeholt. Möglicherweise sind die ATI Treiber im Moment nur für die 4*64 optimiert und an der 2*64 Crossbar Performancen muss erst noch gearbeitet werden.

Quasar
2002-12-06, 12:45:19
Ok, gesehen und für gut befunden. :)

[Wilde Spekulation]
Treiber und BIOS erwarten eigentlich noch 128MB und versuchen entsprechend, diese zu adressieren und anzusprechen. AFAIK sind doch bei BGA-RAM die Signalleitungen on-chip terminiert, so dass, wenn man einfach die Hälfte der Chips weglässt, es zu wilden Signalreflexionen kommen kann, oder?
Wenn das beides so zutreffen sollte (stimmt bestimmt nicht ;)), aber halt "wenn", dann könnte der Leistungsunterschied doch sicher auch durch die 50% Fehladressierungen zustande kommen, oder?
[/Wilde Spekulation]

BTW, ihr dürft ruhig lachen. :D

Demirug
2002-12-06, 13:03:10
On-Chip Terminierung gibt es AFAIK erst mit DDR-II. Die Bilder die ich habe sind aber leider nicht gut genug um mit sicherheit zu sagen ob die Leitungen welche zu den freien Speicherchip plätzen führen terminiert sind.

Wilden Signalreflexionen sollte es sowieso nicht geben. IMO sollte der Memorycontroller spätestens beim Versuch den Speicher zu initialiseren merken das da nichts ist und sich dementsprechend abschalten.

Der Bios fehler könnte durchaus einen Einfluss haben wobei er sich AFAIK ja bisher eher durch bildanomalien bei Programmen mit hohem Grafikspeicher verbrauch bemerkbar gemacht hat. Und die Fillrate tests ja nicht so speicherhungrig.

EDIT: Was mir gerade noch einfällt. Warum tritt das ganze nur beim ST Test auf? wenn es aufgrund von Addressierungsfehler entstehen würde müsste man es auch beim MT merken aber dort gibt es kaum einen unterschied.

egdusp
2002-12-06, 18:22:29
@ Demirug

Du schreibst beim R9500 Pro, dass er wahrscheoinlich ein 256 bit Interface benutzt. Ich vermute du meinst den CBMC.
ICh bi nnicht sicher ob ich dich richtig verstehe, aber hat der Radeon 9500 Pro einen (interne) 4x CMBC und der Radeon 9500 (ohne Pro) nur einen 2X ???

Also kann der Radeon 9500 Pro mit 128 MB Speicher (oder die ohne Pro mit 128 MB) den 4x64 CBMC zu einem 4x32 CBMC ummodeln?

mfg
egdusp

Quasar
2002-12-06, 18:26:16
Eigentlich hat die R9500pro auch nur einen 128Bit-Memory Bus, nur sind offenbar einige Vorseriensamples, die ja dasselbe Boarddesign wie die R9700pro benutzen und noch mit 128MB bestückt waren, quasi aus Versehen mit nicht abgeschaltetem halben Speicherinterface in den Markt gekommen (und somit waren's eigentlich eher R9700 "ohne pro").

Seriensamples sollten sowohl bei der R9500 als auch bei der R9500pro mit 128Bit laufen.

Demirug
2002-12-06, 18:38:57
@egdusp: Ich meine nicht die 9500 Pro die hat ja extra ein neues PCB bekommen. Ich meine die 9500 (ohne pro) mit 128 MB. Da bei der 9500 das 9700 PCB benutzt wird hat die 128 MB Version das 256 Bit (4*64)Interface.

AFAIK sieht das ganze im Moment so aus:
9700 Pro = 4*64 Bit = 256
9700 = 4*64 Bit = 256
9500 Pro = 2*64 Bit = 128
9500 (64MB) = 2*64 Bit = 128
9500 (128MB) = 4*64 Bit = 256

tb
2002-12-09, 07:23:26
http://www.tommti-systems.de/temp/r300_4vs1.gif

Vielleicht hilft das weiter. Bis 1024x768 ohne AF scheint eine CPU Limitierung vorzuliegen. Ab 1600x1200 steigt die Bandbreitenlimitierung an und hebt den Texelfüllratenvorteil auf.

Thomas