PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : R3xx & NV3x - Bremst die Speicheranbindung?


Gaestle
2004-02-04, 14:41:27
Hallo,

ich würde gern mal das Augenmerk der weisen Gemeinde auf die Speicheranbindung und die Speichercontroller der Kandidaten FX59xx und R3xx richten.

Der Grund besteht darin:

aus den heutigen News

Damals brachte das der nVidia-Karte bei einer Übertaktung von 26 bzw. 16 Prozent (Chip/Speicher) ein Leistungsplus von 18 Prozent unter 1024x768 mit 4x Anti-Aliasing und 8x anisotropen Filter, während hingegen die ATi-Karte bei einer etwas geringeren relativen Übertaktung von 21 bzw. 10 Prozent nach diesen Messungen nur runde 10 Prozent Leistungszuwachs hinlegen kann.

Ist nicht auffallend, dass die prozentuale Leistungssteigerung (bei 4xAA und 8xAF) durch Übertakten der beiden Kandidaten ziemlich genau in dem Bereich liegt, in dem der Speichertakt angehoben wurde?

Wenn also AA und AF in den Aufgabenbereich der Karten fallen (und erst diese Kartengenerationen haben diese Funktionen ja breit nutzbar gemacht), sollte man dann nicht NOCH MEHR Bandbreite spendieren?

Grüße

mapel110
2004-02-04, 14:45:54
Naja, wenn ich mir Benchmarks von 9500 Pro und 9700 angucke und Vergleiche, dann denke ich, dass das bisherige 256bit Interface einfach noch sehr ineffektiv ist.

ow
2004-02-04, 15:10:48
.

Gast
2004-02-04, 15:42:27
wenn man sich die tests genau ansieht kann man deutlich erkennen das eine Radeon 445/790 Übertaktet bei 1600x1200 mit 4 FSAA fast genau so schnell ist wie eine auf 500/800 übertaktete 9800xt. Dagegen ist die 5950 Ultra 600/1010 gegenüber ner 515/1000 bei dieser Auflösung doch um einiges Schneller. Hier kann man deutlich sehen das ne 5950 weit aus besser als ne radeon 9800 xt vom gpu übertakten profitiert. Muss sie leider auch da sie selbst mit 600/1010 zum Teil nicht mit 9800xt stadarttakt mithalten kann.

Aquaschaf
2004-02-04, 15:49:13
Original geschrieben von Gast
wenn man sich die tests genau ansieht kann man deutlich erkennen das eine Radeon 445/790 Übertaktet bei 1600x1200 mit 4 FSAA fast genau so schnell ist wie eine auf 500/800 übertaktete 9800xt. Dagegen ist die 5950 Ultra 600/1010 gegenüber ner 515/1000 bei dieser Auflösung doch um einiges Schneller. Hier kann man deutlich sehen das ne 5950 weit aus besser als ne radeon 9800 xt vom gpu übertakten profitiert. Muss sie leider auch da sie selbst mit 600/1010 zum Teil nicht mit 9800xt stadarttakt mithalten kann.

So etwas zeigt einfach, dass die 9800XT mit 500/800MHZ CPU-limitiert ist.

Xmas
2004-02-04, 16:03:58
Original geschrieben von ow
Also erstens wirkt AF ueberhaupt nicht auf die Bandbreite und zweitens laesst sich zumindest AF auf allen Karten nutzen, die das unterstuetzen.
Selbstverständlich wirkt sich AF auf die Bandbreitennutzung aus, schließlich werden mehr Texel pro Pixel verwendet. Da AF allerdings nur in Ausnahmefällen Single-Cycle ist, steigen bei AF viel eher die Anforderungen an Füllrate denn an Bandbreite.

ow
2004-02-04, 16:10:44
.

ow
2004-02-04, 16:13:32
.

MadManniMan
2004-02-04, 16:30:38
Original geschrieben von ow
Wie kommst du darauf? Ich kann nicht erkennen, dass der Gast irgendeine Systemkonfiguration geschweige denn einen konkreten Bench genannt hat.

Es geht wohl um den aktuellen Extrem-9800XT-Übertaktungskram, wenn sich also konkrete Fragen ergeben, einfach mal da vorbeisurfen.

Es ist bei dem "Review" durchaus so, daß zwischen 445/390 und 500/400 MHz beim ATi kaum ein Unterschied besteht, die 595U aber durchaus noch profitiert. Nix CPU-Limitierung.

Zudem sind die kaum wahrnehmbaren "Vorteile" der 500/400 MHz auch ohne HQ-Features zu erkennen. Alles in allem scheinen die 8Pipes bei immerhin 8ArithmetikOps*500Mio/s und heftigen 4GPixel/s irgendwie beim 400MHz 256bit DDR langsam auszuhungern, die pure Rechenpower kommt nurmehr selten durch.

...Loci ahoi, da braucht die Bandbreite nen ordentlichen Vorschub!

Xmas
2004-02-04, 16:47:23
Original geschrieben von ow
Ich bin mal davon ausgegangen, dass sich die zu verarbeitenden Texel alle schon im Texturcache des Grafikchip befinden.
Und wie kommen sie da hin? ;)

ow
2004-02-04, 16:51:28
.

Xmas
2004-02-04, 17:14:22
Original geschrieben von ow
Macht es denn beim Einlesen der Textur(teile) aus dem RAM in den Cache einen Unterschied, wieviele Texel ich spaeter zu einem Textursample verrechne?
Ja, weil deswegen größere Mipmaps verwendet werden, also insgesamt mehr Daten.

Aquaschaf
2004-02-04, 17:20:57
Original geschrieben von ow
Wie kommst du darauf? Ich kann nicht erkennen, dass der Gast irgendeine Systemkonfiguration geschweige denn einen konkreten Bench genannt hat.

Wenn eine höhere Taktung der 5900 noch eine Leistungssteigerung bringt, die der 9800 aber nicht wird doch wohl die CPU limitieren, oder?

mapel110
2004-02-04, 17:25:50
Original geschrieben von Aquaschaf
Wenn eine höhere Taktung der 5900 noch eine Leistungssteigerung bringt, die der 9800 aber nicht wird doch wohl die CPU limitieren, oder?

Ich glaube eher, dass die 9800er zu sehr intern optimiert auf ihre taktraten ist, jedenfalls mehr als die 5900er.

Was auch sein kann, ist, dass der Catalyst immernoch CPU-lastiger ist als der Forceware-treiber.

Aquaschaf
2004-02-04, 17:28:30
Wie soll denn ein Chip auf eine bestimmte Taktrate optimiert sein?

Mr. Lolman
2004-02-04, 17:28:33
Original geschrieben von mapel110
Was auch sein kann, ist, dass der Catalyst immernoch CPU-lastiger ist als der Forceware-treiber.


Waren die Forcewaretreiber (auf den FXen) nicht immer CPUlastiger als die Catalysts? Auf GF4s erzeugen NV Treiber AFAIK weniger CPUlast als auf Fxen.

Gast
2004-02-04, 18:14:59
Ja, und diese wiederum weniger als die Radeons.

ow
2004-02-04, 19:28:43
.

ice cool69
2004-02-04, 19:48:15
was cpu-limitierung betrifft sind die FXen soweit ich weiß ähnlich den radeons, die gf4ti hat weniger cpu-power "gefressen".

ich glaube aber auch dass der speicher momentan besonders limitierend ist, eher die GPU...

LordDeath
2004-02-04, 20:24:38
also die nv35 karten haben ja fast doppelt soviel bandbreite als die radeon9800 karten und sind dennoch auf dem gleichen performance-niveu. daher denke ich schonmal, dass die neusten nvidia karten cpu limitiert sind. obs jetzt an der füllrate oder an der shaderleistung mangelt, ist ne andere sache :D
hat einer ne ahnung wie es bei den radeons aussieht? ein gesundes mittelmaß?

BlackArchon
2004-02-04, 21:08:47
Original geschrieben von LordDeath
also die nv35 karten haben ja fast doppelt soviel bandbreite als die radeon9800 karten und sind dennoch auf dem gleichen performance-niveu.
...FX 5900/Ultra: 27,2 GB/s
Radeon 9800 Pro: 21,8 GB/s

Das Doppelte ist das nicht...

LordDeath
2004-02-04, 21:35:03
Original geschrieben von BlackArchon
FX 5900/Ultra: 27,2 GB/s
Radeon 9800 Pro: 21,8 GB/s

Das Doppelte ist das nicht...

ja, aber so teilweise! ich merk mir doch nicht diese ganzen zahlen ;)

also dennoch ist es doch so, dass im die nv35 schneller sein müsste, wenn sie nicht gpu limitert wär, oder?

Sumpfmolch
2004-02-04, 21:39:26
hat die latenz der speicherchips eigentlich großen einfluss auf die performance der rams ?

Quasar
2004-02-04, 21:48:07
Nicht sooo großen. Erstens ist die absolute Zeit aufgrund der hohen Takte eh enorm kurz und zweitens wird eh fast nur in Bursts geschrieben/gelesen, was Dank aktuellster Memory-Controller-Technik sehr gut geeignet ist, Latenzen zu verstecken.

Quasar
2004-02-04, 21:48:44
Original geschrieben von Gast
Ja, und diese wiederum weniger als die Radeons.

That was me.

DrumDub
2004-02-04, 22:16:03
eigentlich hat der r3xx die höhere bandbreite bei der anwendung von fsaa wegen der stärkeren kompression.

mapel110
2004-02-05, 00:04:08
Original geschrieben von Aquaschaf
Wie soll denn ein Chip auf eine bestimmte Taktrate optimiert sein?

Naja, es gibt ja wohl noch eine ganze Reihe von internen Caches, die bestimmt auf eine Gewisse Datenmenge(Takte/Taktverhältnisse Ram/GPU) hin optimiert sind.

Ailuros
2004-02-05, 04:37:22
Original geschrieben von LordDeath
ja, aber so teilweise! ich merk mir doch nicht diese ganzen zahlen ;)

also dennoch ist es doch so, dass im die nv35 schneller sein müsste, wenn sie nicht gpu limitert wär, oder?

Laengere Pipelines = hoehere Latenzen

robbitop
2004-02-06, 00:04:28
ich glaube nicht, daß ATi's Kompression besser arbeitet.
Ihr voteil: sie haben Hirarchial Z.
vA haben sie mehr Rechenwerke durch die 8 Pipes und weniger Pixel Verschnitt...ich denke die RawPower/Takt ist bei der R300 einfach daran schuld ;)

theoeretisch müsste eine FX in Bandbreitenlastigen Szenen besser aussehen, durch die höhere Bandbreite. Geht es um Rohpower muss die FX durch hohe Takte ausgleichen (ATis verlieren nicht soviel Leistung bei AF da stärker winkelabhängig). Und auch bei 16x12 ist einfach viel Pixelfüllrate gefragt, die eben durch den verschnitt größer ist als bei den FXen.

Exxtreme
2004-02-06, 09:30:40
Original geschrieben von DrumDub
eigentlich hat der r3xx die höhere bandbreite bei der anwendung von fsaa wegen der stärkeren kompression.
Jein. AFAIK sind die Kompressionsmethoden bei beiden Kontrahenten weitgehend gleich. ATi hat aber in vielen Fällen mehr Füllrate da die 8x1-Architektur flexibler ist als 4x2. Bei einer ungeraden Anzahl von Texturen dreht die GFFX eine Extra-Runde.

Demirug
2004-02-06, 09:39:31
Original geschrieben von Exxtreme
Jein. AFAIK sind die Kompressionsmethoden bei beiden Kontrahenten weitgehend gleich. ATi hat aber in vielen Fällen mehr Füllrate da die 8x1-Architektur flexibler ist als 4x2. Bei einer ungeraden Anzahl von Texturen dreht die GFFX eine Extra-Runde.

Ich würde eine andere formulierung vorziehen:

Bei einer ungeraden Anzahl von Bi gefilterten Texturen schaffen die FXen weniger Pixel pro Takt als die Radeons.


Texturen(bi) NV35 R350
1 4 8
2 4 4
3 2 2,66
4 2 2
5 1,33 1,66
6 1,33 1,33
7 1 1,14
8 1 1
...

Ailuros
2004-02-06, 10:46:07
Original geschrieben von robbitop
ich glaube nicht, daß ATi's Kompression besser arbeitet.
Ihr voteil: sie haben Hirarchial Z.
vA haben sie mehr Rechenwerke durch die 8 Pipes und weniger Pixel Verschnitt...ich denke die RawPower/Takt ist bei der R300 einfach daran schuld ;)

theoeretisch müsste eine FX in Bandbreitenlastigen Szenen besser aussehen, durch die höhere Bandbreite. Geht es um Rohpower muss die FX durch hohe Takte ausgleichen (ATis verlieren nicht soviel Leistung bei AF da stärker winkelabhängig). Und auch bei 16x12 ist einfach viel Pixelfüllrate gefragt, die eben durch den verschnitt größer ist als bei den FXen.

Hierarchical Z von alleine hilft da auch nicht viel; es ist eher eine Kombination von mehr als nur einer Faktoren.

Takt fuer Takt haben Radeons den Vorteil (und ja zweifellos auch dank der verschiedenen AF Implementierung), was genauso fuer Core und Speicher gilt, mit Ausnahme stencil Fuellrate limitierten Faellen, mit >2xAA kombiniert. ***edit: siehe unten...


Was sehr hohe Aufloesungen wie 16x12 betrifft, beiden geht in der Mehrzahl von Anwendungen die Puste aus, wenn man 4xAA/8xAF einschaltet; da ist es bei beiden wohl logischer auf 2xAA zu reduzieren.

Leider werden FX und Radeons aeusserst selten in 16*12 mit 2xAA/2xAF getestet, was die Unterschiede was Implementierungen betrifft minimalisiert.

***edit:

hab's schon im B3D Forum gepostet. Ich hab einen Freund mit einer 5900 und einer XT Fablemark durchlaufen lassen; beide Karten auf 400MHz getaktet:

1024*768*32

5900@400MHz

noAA: 62.0 fps
2xAA: 42.6 fps
4xAA: 36.7 fps

9800@400MHz

noAA: 76.0 fps
2xAA: 64.9 fps
4xAA: 38.3 fps
6xAA: 23.9 fps

***editNR.2: wir hatten in der Vergangenheit auch hier mit Fablemark getestet; nur machten wir wohl den Fehler dass wir Fablemark mit default 16bpp getestet hatten.

robbitop
2004-02-06, 11:07:30
hm in Fablemark kommt es doch hauptsächlich auf die Z/Stencil Leistung an...wieso ist die R3xx dort soviel schneller bei gleichem Takt?

DrumDub
2004-02-06, 11:22:54
Original geschrieben von Exxtreme
Jein. AFAIK sind die Kompressionsmethoden bei beiden Kontrahenten weitgehend gleich. ATi hat aber in vielen Fällen mehr Füllrate da die 8x1-Architektur flexibler ist als 4x2. Bei einer ungeraden Anzahl von Texturen dreht die GFFX eine Extra-Runde.

stimmt. hab mich durch die theoretisch maximale 24:1 kompression bei 6xmsaa auf dem r3xx verwirren lassen. da die fx ja kein 6xmsaa kann, ist dieser wert als vergleichswert natürlich unsinnig.

LovesuckZ
2004-02-06, 11:35:52
Original geschrieben von Ailuros
1024*768*32
5900@400MHz
noAA: 62.0 fps
2xAA: 42.6 fps
4xAA: 36.7 fps


Nun, auf meiner 5800 macht es keinen Unterschied, ob ich 2AA (26.3) oder 4AA (25.6) verwende...

Ailuros
2004-02-06, 11:41:58
Original geschrieben von robbitop
hm in Fablemark kommt es doch hauptsächlich auf die Z/Stencil Leistung an...wieso ist die R3xx dort soviel schneller bei gleichem Takt?

Gute Frage. Wavey hat hier wohl mit 16bpp getestet:

http://www.beyond3d.com/reviews/ati/9800xt_r360/index.php?p=19

Denn meine 16bpp Resultate auf der 9k7PRO sind sehr nahe an seinen.

Hier 5900Ultra und 5800U:

http://www.beyond3d.com//previews/nvidia/nv35/index.php?p=22#stencil

Ailuros
2004-02-06, 11:43:55
Original geschrieben von LovesuckZ
Nun, auf meiner 5800 macht es keinen Unterschied, ob ich 2AA (26.3) oder 4AA (25.6) verwende...

Vom 5900Ultra Preview Link/B3D oben:

Here we can see that the 5900 Ultra actually has a small performance advantage over the 5800 Ultra. It's said that the 5800 had issues with Z-Culling whilst stencil rendering and this may be fixed with the 5900 Ultra. Note that this will not be due to UltraShadow since this would require developer support, this can't occur for FableMark since its been around longer than the 5900, and UltraShadow is not exposed through DirectX, which FableMark operates on.


***edit: wenn man Fablemark mit MSAA testen will, dann sollte man fuer alle Karten auf 32bpp schalten.

Quasar
2004-02-06, 12:01:40
Beim FableMark ist das alles schon i.O. so.
16Bit bringt ggü. 32Bit nur häßliches Dithering (und 2-3% mehr Leistung, wenn überhaupt).
Und die 5900 U ist da auch nicht so viel besser.

Ich denke mal, da hier ja auch texturiert wird, daß die Radeons hier wieder aufholen.

edit:
Warum weiß ich nicht, aber Pixelfüllrate ist beim FableMark genausowichtig, wie Texelfüllrate.
FX5200, GF3Ti200 und GF4MX440 liegen alle drei bei 16,x fps und kurioserweise ist die FX5200u schneller als die 5600u rev1.0, trotz niedrigerer Takte.

Schreibe grade an meinem Kommentar zu den FM- ERgebnissen...

Ailuros
2004-02-06, 12:13:05
Warum weiß ich nicht, aber Pixelfüllrate ist beim FableMark genausowichtig, wie Texelfüllrate.
FX5200, GF3Ti200 und GF4MX440 liegen alle drei bei 16,x fps und kurioserweise ist die FX5200u schneller als die 5600u rev1.0, trotz niedrigerer Takte.

Wieso Pixel- oder Texelfuellrate und nicht Stencil-Fuellrate und unter Umstaenden wie diese mit Pixel/Texel-Fuellraten relativiert ist?

KYRO2 hat 350MPixel/Texels/sec aber eine Stencil-Fuellrate von 5600MPixels/sec (32z * 175MHz) und bringt ~34 fps.

Quasar
2004-02-06, 12:25:24
Ja, Kyro. Das ist aber eine ziemliche Ausnahme, oder?
Im Normalfall ist die Pixelfüllrate irgendwie zusammenhängend mit der Stencilfill.

Aber ich korrigiere es gern, wenn du möchtest. ;)

Soweit mir bekannt, sind die einzigen Karten (außer der Kyro), die aktuell im Gamersegment angeboten werden, mit einer höheren Stencil- als Pixelfüllrate die FX5800 und höher, oder?

Bei GF4MX, GFFX5200 und GF3Ti200 sollte die Stencilfüllrate nicht höher als die Pixelfüllrate sein.

MX440 und Ti200 haben Early-Z, das macht hier offenbar etwas aus, denn beide können mit der FX5200 mithalten (oder die Stencil-Passes werden irgendwie beim FM mit dem Texturing-Pass verquickt, so daß die FX5200 auch als 2x2 antreten muss).
Warum die FX5200u aber schneller als die mit je 25MHz bei GPU und Speicher höher getaktete FX5600u ist, läßt sich nur dadurch erklären, daß in der FX5600 noch mehr kaputt war/ist, als allgemein angenommen. (Speku)

Bandbreite hat hier auf einen netten Einfluss, da z.B. die FX5800U mehr als die eigentlich möglichen 20% schneller als die FX5800 ist und auch von der FX5900u abgehängt wird.
edit: ist ja auch logisch. Wie soll man ein 8*x denn auch mit 128Bit DDR ordentlich versorgen?

Ailuros
2004-02-06, 13:35:31
Keine Korrigierung notwendig:

Im Normalfall ist die Pixelfüllrate irgendwie zusammenhängend mit der Stencilfill.

Meinte ich ja auch. Ich wollte nur sagen dass das eine nicht unbedingt unabhaengig vom anderen sein muss.

Soweit mir bekannt, sind die einzigen Karten (außer der Kyro), die aktuell im Gamersegment angeboten werden, mit einer höheren Stencil- als Pixelfüllrate die FX5800 und höher, oder?

Yep.

Warum die FX5200u aber schneller als die mit je 25MHz bei GPU und Speicher höher getaktete FX5600u ist, läßt sich nur dadurch erklären, daß in der FX5600 noch mehr kaputt war/ist, als allgemein angenommen.

Kann sein.

***edit:

oder auch nicht:

http://www.beyond3d.com/previews/nvidia/nv36/index.php?p=11

With FableMark, which makes use of plenty of stencil operations, the performance difference from the 5700 Ultra to the 5600 Ultra is about 12%-13%, which is a little below their theoretical fill-rate differences.

The difference to the Ti4200 is very different to the VillageMark test though, and we can see slightly over a 100% performance difference from the 5700 Ultra to the Ti4200. Stencil rendering does not require any texturing, hence in this situation it is able to utilise the entire 4 pipelines, which coupled with the high clock rate gives a very high stencil rendering performance. Stencil rendering can also be quite vertex processor intensive and it's likely that the high performance vertex shader in the 5700 Ultra is helping out here as well.

Quasar
2004-02-06, 13:52:18
Original geschrieben von Ailuros
Kann sein.

***edit:

oder auch nicht:
"With FableMark, which makes use of plenty of stencil operations, the performance difference from the 5700 Ultra to the 5600 Ultra is about 12%-13%, which is a little below their theoretical fill-rate differences.

The difference to the Ti4200 is very different to the VillageMark test though, and we can see slightly over a 100% performance difference from the 5700 Ultra to the Ti4200. Stencil rendering does not require any texturing, hence in this situation it is able to utilise the entire 4 pipelines, which coupled with the high clock rate gives a very high stencil rendering performance. Stencil rendering can also be quite vertex processor intensive and it's likely that the high performance vertex shader in the 5700 Ultra is helping out here as well."
http://www.beyond3d.com/previews/nvidia/nv36/index.php?p=11
A little below fillrate differences would be ok, IMO. But what i experienced was, that even though the 5600u has a fillrate advantage of about 7,5%, its' performance was noticeably slower.

As you can see on the little Preview below, bandwidth matters (evident in FX5900u vs. FX5800u, more so in FX5900 vs. 5900XT vs. 5800), vertex power matters (as evident by Ti4800 vs. FX5600u and Ti4200 vs. Fx5600), Z-Compression seems to matter (Fx5200 vs. Ti200 not sure 'bout MX440) and memory management does play a role (MX440 vs. GF2u).

The one and only thing i can surely constitute is, that GF2MX sucks in this test on all accounts. ;)

Ailuros
2004-02-06, 17:15:43
The one and only thing i can surely constitute is, that GF2MX sucks in this test on all accounts.

Blah, es ist normal im Vergleich zu dem was die GF2 Ultra liefert.

ow
2004-02-06, 19:56:47
.

kmf
2004-02-06, 20:27:41
Original geschrieben von Quasar
A little below fillrate differences would be ok, IMO. But what i experienced was, that even though the 5600u has a fillrate advantage of about 7,5%, its' performance was noticeably slower.

As you can see on the little Preview below, bandwidth matters (evident in FX5900u vs. FX5800u, more so in FX5900 vs. 5900XT vs. 5800), vertex power matters (as evident by Ti4800 vs. FX5600u and Ti4200 vs. Fx5600), Z-Compression seems to matter (Fx5200 vs. Ti200 not sure 'bout MX440) and memory management does play a role (MX440 vs. GF2u).

The one and only thing i can surely constitute is, that GF2MX sucks in this test on all accounts. ;)

Quasar, da ich seit kurzem Besitzer einer GF4 Ti4600 bin, würde es mich interessieren, wo die einzuordnen wäre.

StefanV
2004-02-06, 21:56:29
Original geschrieben von kmf
Quasar, da ich seit kurzem Besitzer einer GF4 Ti4600 bin, würde es mich interessieren, wo die einzuordnen wäre.

TI4600 = TI4800

Quasar
2004-02-06, 22:02:13
Jub, genau dasselbe, nur AGP8X-fähig. Und durch Redesign wohl etwas genügsamer, was Saft und PCB angeht.

Aber vorsicht vor der 4800SE - das ist von den Taktraten her nur eine Ti4400.