PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : AMD/ATI - Wieviel R600 steckt in einer RV770?


Lawmachine79
2008-09-13, 23:11:38
Ja, da ich ja nun Besitzer einer 4850 bin und mit der Hardware an sich (die schrecklichen Catalysttreiber berücksichtige ich mal nicht) sehr zufrieden. Jetzt frage ich mich, nachdem der R600 ja ein absolutes Desaster war, wieviel Desaster in meinem RV770 noch drin ist ;). Besonders interessiert mich:
1) Wie hat ATI das AA-Problem (den massiven Performancehit) in den Griff bekommen?
2) Wie hat ATI das AF-Problem (auch den Performancehit) in den Griff bekommen?
3) Ist der AF der gleiche wie im R600, also der, der minimal schlechter als G80 und später ist?

deekey777
2008-09-13, 23:31:08
Was die ROPs angeht:
http://www.hexus.net/content/item.php?item=13972&page=3

We've come right down to the raster back-ends, or ROPs. Keeping with the theme of smaller is better, the new ROPs were designed by the team behind the X1900 series.
Der R600 und auch der RV670 suckten unter MSAA wegen mehrerer Faktoren:
Einmal waren die ROPs im Arsch. Die ROPs wollten bei dem hohen Takt nicht mitmachen, was zur Folge hatte, dass - anders als bei GF8-Serie - nur 2xMSAA pro Cycle möglich war. Zwei Zixels pro Takt konnte schon der RV530, man hat aber 4 Zixels erwartet. Das weitere Problem war, dass das Resolve ("Zurückauflösen" auf die Zielauflösung) in manchen Fällen nicht in FF-Hardware ausgeführt werden konnte, sondern diese Aufgabe mussten dann die Shader übernehmen. Und da beide (R600 und der RV670) nur vier Shader-Cluster hatte, kostete das Rechenleistung. Wenn noch die Custom-Filter-Modi hinzukommen, wird der R600 richtig in die Knie gezwungen.
All das wurde beim RV770 gefixt: Seine ROPs können 4xMSAA pro Cycle, die Z-Rate verdoppelte sich, Resolve wird von den ROPs durchgeführt; auch die CFAA-Performance verbesserte sich, weil die Anzahl der Shadercluster enorm stieg.

Aber ein AF-Problem ist mir nicht bekannt, der RV770 hat ja bloß die 2,5-fache Anzahl an TMUs.

ShadowXX
2008-09-13, 23:34:24
Ja, da ich ja nun Besitzer einer 4850 bin und mit der Hardware an sich (die schrecklichen Catalysttreiber berücksichtige ich mal nicht) sehr zufrieden. Jetzt frage ich mich, nachdem der R600 ja ein absolutes Desaster war, wieviel Desaster in meinem RV770 noch drin ist ;). Besonders interessiert mich:
1) Wie hat ATI das AA-Problem (den massiven Performancehit) in den Griff bekommen?

Das resolve wird nicht mehr in den Shadern sondern wie früher (und wie bei nV) wieder in (dedizierter) Hardware gerechnet.
Allerdings nur der Box-Filter. Alle anderen laufen weiterhin über die Shader.
Dazu kommt noch das jetzt 4xMSAA/Cycle funktioniert und die Z-Rate sich erhöht hat.

2) Wie hat ATI das AF-Problem (auch den Performancehit) in den Griff bekommen?

Mehr TMUs (40 vs 16)....das war der größte Bottleneck vor dem RV770.

3) Ist der AF der gleiche wie im R600, also der, der minimal schlechter als G80 und später ist?
Ja, aber es ist nicht nur "minimal" schlechter, sondern deutlich. Speziell da AI OFF unbrauchbar ist (und das sage ich als 4870 Besitzer).

Gast
2008-09-13, 23:57:29
Soll denn AI Off nicht fast die gleiche Qualität bringen, wie nVs HQ ohne Optimierungen? Bis auf die Winkelabhängigkeit ist doch dann alles deaktiviert.

Lawmachine79
2008-09-14, 00:09:38
Soll denn AI Off nicht fast die gleiche Qualität bringen, wie nVs HQ ohne Optimierungen? Bis auf die Winkelabhängigkeit ist doch dann alles deaktiviert.
Das Problem ist dann, daß spielspezifische Optimierungen nicht greifen. Was NV über dedizierte Profile in jedem Spiel löst, löst ATI über "A.I.". Es gibt also zwei Möglichkeiten:
1) A.I. Off: sämtliche Filteroptimierungen sind deaktiviert - "gute", spielspezifische Optimierungen, die man auch wirklich als "Optimierungen" bezeichnen kann, sind aber auch aus.

2) A.I. On: "gute" und "schlechte" Optimierungen sind aktiviert.

Das ist ein absolutes Unding, ich verstehe nicht, warum ATI das nicht endlich behebt, es ist a) Betrug und b) kann man die Karten der Hersteller nur noch schwer miteinander vergleichen.



Aber ein AF-Problem ist mir nicht bekannt, der RV770 hat ja bloß die 2,5-fache Anzahl an TMUs.
Kann Dir ja nicht bekannt sein, denn wenn sich die TMU-Anzahl verzweieinhalbfacht hat, gibt es kein Problem mehr :D. Wußte nicht, daß nur die lausige Texturfüllrate das Problem bei R6xx war, weswegen die Performance mit AF so droppte, dachte, da wäre noch was anderes im Spiel.

Coda
2008-09-14, 02:18:25
Soll denn AI Off nicht fast die gleiche Qualität bringen, wie nVs HQ ohne Optimierungen? Bis auf die Winkelabhängigkeit ist doch dann alles deaktiviert.
Es ist leider nicht alles deaktiviert. Die maximale Filterqualität von G80 ist immer noch besser.

Mehr TMUs (40 vs 16)....das war der größte Bottleneck vor dem RV770.
Man sollte aber bedenken, dass sich das Verhältnis ALU:Tex nicht verschoben hat. Die TMUs sind sogar schwächer als die alten wenn sie FP16 oder FP32 filtern müssen - ist praktisch aber nicht relevant wie ich oft genug gesagt habe ;)

Das RV770 mit AF nicht so sehr einbricht dürfte daran liegen dass sich die Bottlenecks in andere Chipteile verschieben.

Banshee18
2008-09-14, 13:01:05
Das RV770 mit AF nicht so sehr einbricht dürfte daran liegen dass sich die Bottlenecks in andere Chipteile verschieben.
Wo sind sie jetzt?

Raff
2008-09-14, 14:48:58
Das wüsste ich auch gerne, da ja alles "Relevante" ver-2,5-facht wurde (TMUs und ALUs). Die Filter-Restriktionen außen vor.

Man sollte aber bedenken, dass sich das Verhältnis ALU:Tex nicht verschoben hat.

Klar. Aber die geringe Texelpower glich offenbar dem berühmten Minimumfaktor. Viele ALUs konnten die Leistung nicht hochziehen, weil die TMUs den Anforderungen der Spiele nicht genügten. Jetzt wurde die Texturierungsleistung mehr als verdoppelt, womit die Fps-Rate deutlich steigt.

Mich würde ja mal interessieren, wie eine Radeon mit 40 TMUs und 320 ALUs abschneidet.

Das ist ein absolutes Unding, ich verstehe nicht, warum ATI das nicht endlich behebt, es ist a) Betrug und b) kann man die Karten der Hersteller nur noch schwer miteinander vergleichen.

Mit dem Treiberstandard ist die BQ gut vergleichbar. Es gibt "nur" keinen Zustand, um beide mit höherer, d.h. flimmerfreier Texturqualität zu vergleichen.

MfG,
Raff

Gast
2008-09-14, 14:52:09
Wo sind sie jetzt?
Interpolatoren, Bandbreite.

Gast
2008-09-14, 14:53:38
Interpolatoren, Bandbreite.
P.S.: Was aber eher vernachlässigbar ist. Der RV770 ist schon ein ziemlich gutes Gesamtpaket.

_DrillSarge]I[
2008-09-14, 14:53:51
Bandbreite.
glaub ich nicht. gerade bei der 4870. zudem war der rv670 auch nicht unbedingt langsamer als ein r600.

Lawmachine79
2008-09-14, 15:10:07
I[;6782814']glaub ich nicht. gerade bei der 4870. zudem war der rv670 auch nicht unbedingt langsamer als ein r600.
Zu den Zeiten von RV670 und R600 gab es ja andere Flaschenhälse, da hat sich die Reduzierung des SI von 512 --> 256 Bit nicht ausgewirkt, Bandbreite war das kleinste Problem, was R(V)6xx hatte.

Und die 4870 ist ja der Beweis dafür, daß Bandbreite im Moment limitiert. Der Leistungsvorsprung von der 4870 zur 4850 kommt hauptsächlich durch die höhere Bandbreite, die Taktsteigerung des Chips ist nicht hoch genugm, um die Steigerung der Gesamtleistung zu erklären.

Gast
2008-09-14, 18:17:53
Das RV770 mit AF nicht so sehr einbricht dürfte daran liegen dass


es selbst mit AI off keine anständig gefilterten Texturen mehr gibt!

reunion
2008-09-14, 18:44:50
Klar. Aber die geringe Texelpower glich offenbar dem berühmten Minimumfaktor. Viele ALUs konnten die Leistung nicht hochziehen, weil die TMUs den Anforderungen der Spiele nicht genügten. Jetzt wurde die Texturierungsleistung mehr als verdoppelt, womit die Fps-Rate deutlich steigt.


Es gibt keinen "berühmten Minimumfaktor". RV770 ist genau so viel/wenig TMU- oder Shader-limitiert, wie dies auch RV670 war/ist.


Mich würde ja mal interessieren, wie eine Radeon mit 40 TMUs und 320 ALUs abschneidet.

RV730 hat 320ALUs und 32 TMUs, das Ergebnis ist evident. Die doppelte TMU-Anzahl bringt so gut wie nichts.

Gast
2008-09-14, 19:06:41
RV730 hat 320ALUs und 32 TMUs, das Ergebnis ist evident. Die doppelte TMU-Anzahl bringt so gut wie nichts.

Schwer zu sagen, weil das Teil nur 128 bit Speicherinterface hat!

Gast
2008-09-14, 19:09:56
...und daher auch nur 8 ROPs!

Gast
2008-09-14, 19:20:16
RV730 hat 320ALUs und 32 TMUs, das Ergebnis ist evident. Die doppelte TMU-Anzahl bringt so gut wie nichts.

Kannst du das näher ausführen? Deine Logik erschließt sich mir leider nicht im geringsten.

Coda
2008-09-14, 19:30:38
es selbst mit AI off keine anständig gefilterten Texturen mehr gibt!
Nicht so sehr im Vergleich zu R600. Der hat die exakt gleiche Filterqualität.

reunion
2008-09-14, 19:40:57
Schwer zu sagen, weil das Teil nur 128 bit Speicherinterface hat!

Klar hat RV730 nur ein 128-bit SI. Und trotzdem, würde RV670/R600 wie oft propagiert so sehr an der Texelfüllrate hängen, dann müsste gerade mit AF die doppelte Füllrate viel stärker durchschlagen.

...und daher auch nur 8 ROPs!

Es sind gleich viele Z-Werte wie bei R600/RV670. Dazu Single-Cycle 4xMSAA.

Kannst du das näher ausführen? Deine Logik erschließt sich mir leider nicht im geringsten.

Dann sage was dir nicht logisch erscheint. Ich wüsste nicht was man an dieser simplen Logik näher ausführen könnte.

Gast
2008-09-14, 21:08:31
Dann sage was dir nicht logisch erscheint. Ich wüsste nicht was man an dieser simplen Logik näher ausführen könnte.
Womit vergleichst du die RV730 - das wäre schonmal ein guter Anhaltspunkt. :) M.W. gibt es keinen Chip, der exakt dem RV730 entspricht, dabei aber nur 16 TMUs hat - somit wäre ein Vergleich zumindest schonmal erschwert.

deekey777
2008-09-14, 21:21:28
RV730 hat 320ALUs und 32 TMUs, das Ergebnis ist evident. Die doppelte TMU-Anzahl bringt so gut wie nichts.
Der RV730 hat nur 16 Interpolatoren, siehe Carstens Thread bei B3DF.
Aber die doppelte Anzahl der TMUs bringt schon was: http://www.ixbt.com/video3/rv730-part2.shtml#p5
Ein Blick auf Rightmark-Ergebnisse in Fur sowie SPM zeigen sehr deutlich, was die 32 TMUs bringen können.

vinacis_vivids
2008-09-14, 21:24:02
Zu den Zeiten von RV670 und R600 gab es ja andere Flaschenhälse, da hat sich die Reduzierung des SI von 512 --> 256 Bit nicht ausgewirkt, Bandbreite war das kleinste Problem, was R(V)6xx hatte.

Und die 4870 ist ja der Beweis dafür, daß Bandbreite im Moment limitiert. Der Leistungsvorsprung von der 4870 zur 4850 kommt hauptsächlich durch die höhere Bandbreite, die Taktsteigerung des Chips ist nicht hoch genugm, um die Steigerung der Gesamtleistung zu erklären.

Allein der Speicher machts nicht, der Kern setzt im Zusammenhang mit der Bandbreite viel Leistung frei.

http://www.computerbase.de/artikel/hardware/grafikkarten/2008/bericht_was_gddr5_radeon_hd_4870/6/#abschnitt_performancerating

Chris2CB
2008-09-14, 22:26:21
Womit vergleichst du die RV730 - das wäre schonmal ein guter Anhaltspunkt. :) M.W. gibt es keinen Chip, der exakt dem RV730 entspricht, dabei aber nur 16 TMUs hat - somit wäre ein Vergleich zumindest schonmal erschwert.


Er schreibt doch weiter oben das er den RV730(32xTMU, 8xROP) mit dem RV670(16xTMU, 16xROP ) vergleicht, was auch Sinnig ist.

Raff
2008-09-14, 23:23:52
Klar hat RV730 nur ein 128-bit SI. Und trotzdem, würde RV670/R600 wie oft propagiert so sehr an der Texelfüllrate hängen, dann müsste gerade mit AF die doppelte Füllrate viel stärker durchschlagen.

Sie schlägt durch – in füllratenlastigen Spielen. Abgesehen davon würden sich die TMUs eher bemerkbar machen, wenn der Filter nicht voll mit Sparmaßnahmen wäre. A.I. Off Marke R5x0 würde auf 'ner HD4870 sicher 3x so schnell laufen wie auf einer X1900. Ok, das ist Spekulatius.

MfG,
Raff

Lawmachine79
2008-09-14, 23:40:06
Allein der Speicher machts nicht, der Kern setzt im Zusammenhang mit der Bandbreite viel Leistung frei.

http://www.computerbase.de/artikel/hardware/grafikkarten/2008/bericht_was_gddr5_radeon_hd_4870/6/#abschnitt_performancerating
Ja, genau das ist ja das Problem, wenn der Speicher limitiert, weder Füllrate noch Arithmetikleistung werden ausgeschöpft, weil die Bandbreite limitiert. Der Speicher selbst "leistet" in dem Sinne ja nichts, er kann nicht "malen", nicht texturieren, nicht filtern und nicht rechnen, er kann nix, er ist "nur" Infrastruktur.