PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Warum ist die Radeon 48xx-serie so "langsam"?


Gast
2008-06-29, 12:43:52
Wir haben nun die vorstellung der neuen GPU-generationen beider hersteller gesehen, mit wohl einigen überraschungen.

Auf der einen seite haben wir NV, die trotz großer investition an transistoren verhältnismäßig wenig rohleistung bringen.
Je nachdem wie gut nun die effizienzsteigerungen wirken verhalten sich die karten meistens im zu erwartenden rahmen.

Auf der anderen seite bringt ATI eine extreme steigerung an rohleistung mit erstaunlich geringem transistoraufwand.
Da haben wir nun die 2,5-fache rohleistung/takt, nur scheint sie diese kaum in leistung umsetzen zu können.

Taktbereinigt sollte man in etwa 2-fache leistung der 3870 erwarten können.
Real haben wir aber meistens nur ~50% mehrleistung, selbst die 3870 X2 liegt in den meisten fällen knapp vorne, trotz CrossFire.

Die frage ist nun warum die steigerung so überraschend gering ausfällt.

Ich bin mal gespannt auf eure ideen.

mapel110
2008-06-29, 12:59:35
3870 hat 666 Mio Transistoren, 4850/70 965 Mio Transistoren.

Das sind 45 % mehr Transistoren, und dafür ist eben die Leistungssteierung entsprechend, sogar etwas besser als man erwarten könnte.

Bei nvidia ists wie Coda auch schon mal meinte, wohl wirklich die Shaderdomain, die man nicht so hoch takten konnte, wie man es ursprünglich vor hatte. Mit ein paar hundert Mhz mehr hätte man doch deutlich besser dagestanden.

Spasstiger
2008-06-29, 13:07:26
In der für mich relevanten Auflösung (1920x1200) sehe ich oft genug einen Faktor 2 (HD4850 vs. HD3850 bzw. HD4870 vs. HD3870) und das ist sehr beachtlich. Im Computerbase-Rating erreicht die Radeon HD4850 @1600x1200 mit 4xAA und 16:1 AF im Schnitt einen Faktor 2,09 gegenüber der HD3850 und das bei nahezu identischer Speicherbandbreite.
Man bedenke, dass ATI nur 45% mehr Transistoren als beim RV670 braucht und den RV770 auf 140€-Grafikkarten anbieten kann.

Man hat beim RV770 auch nicht alles verbreitert oder aufgebohrt.
Die TMUs wurden beispielsweise in ihrem Funktionsumfang beschnitten, sie können jetzt fp16-Textursamples nicht mehr in einem Takt filtern. Außerdem wurde die Zahl an Textursampler pro Texturcluster um 1/5 verringert und die Zahl an Adressierungseinheiten pro Cluster wurde sogar halbiert.
Die einzelnen Texturcluster sind also deutlich schmaler als noch beim RV670, nur deren Anzahl hat man von 4 auf 10 erhöht.

(del)
2008-06-29, 13:10:17
Taktbereinigt sollte man in etwa 2-fache leistung der 3870 erwarten können.
Real haben wir aber meistens nur ~50% mehrleistung, selbst die 3870 X2 liegt in den meisten fällen knapp vorne, trotz CrossFire.Der Thread hätte einen Sinn, wenn das stimmen würde. Da wir aber wissen, es stimmt nicht, wäre ich dafür diesen primitiven "Nährboden" (warum werden solche Threads immer von den Gästen gestartet?) nicht zu schliessen, sondern gleich zu löschen =)

Danke.

Gast
2008-06-29, 13:30:21
(warum werden solche Threads immer von den Gästen gestartet?)

Weil sie es sich mit ihren registrieren Accounts nicht trauen:tongue:

Ich weiß nicht was der gast erwartet, aber 2,5fache Leistung gegenüber einer 2900XT die vor kurzem noch das beste war, was von ATi zu kriegen war, ist doch schon mehr als beeindruckend. zumal der preis nur halb so hoch ist.
Ich habe nicht damit gerechnet.

Gast
2008-06-29, 13:34:26
Das liegt daran das die Medien verbreiten R700 vs GX280, nur haben die nicht beachtet das die R700 im Moment effizienz ist als die GX 280 Serie im vergleich zur Die Größe und dem verbrauch und der Stromverbrauch ist auch besser.

Schlammsa im Urlaub
2008-06-29, 13:55:36
Ist es nicht genau umgekehrt?
Nahezu alle (auch ich) hätten eine Verdoppelung der Leistung durch den GT200 erwartet. Was dann aber ziemlich klar nicht eingetroffen ist.
Ich weiss nicht, was dieser Thread soll. Er müsste eigentlich "Warum ist die GTX2xx Serie so langsam heissen! :)

Spasstiger
2008-06-29, 14:28:43
Der GT200 hält imo die Erwartungen, mit SSAA in hohen Auflösungen ist er ca. doppelt so schnell wie der G80.
Der RV770 überrascht sogar eher mit einer herausragenden Schnelligkeit, dafür dass nur 45% mehr Transistoren verbaut wurden. Anfangs ging man ja auch nur von 480 SPs und damit nur etwa 50% mehr Leistung aus angesichts der Transistorzahl. Nun liefert der RV770 aber tatsächlich 100% mehr als der RV670.

Gast
2008-06-29, 14:38:59
In der für mich relevanten Auflösung (1920x1200) sehe ich oft genug einen Faktor 2 (HD4850 vs. HD3850 bzw. HD4870 vs. HD3870) und das ist sehr beachtlich. Im Computerbase-Rating erreicht die Radeon HD4850 @1600x1200 mit 4xAA und 16:1 AF im Schnitt einen Faktor 2,09 gegenüber der HD3850 und das bei nahezu identischer Speicherbandbreite.

welchen test meinst du, bei dem den ich kenne liegt zwischen 3870 und 4850 der faktor 1,55 und zwischen 3850 und 4850 der faktor 1,8.
erwarten könnte man aufgrund der rohleistung allerdings schon zwischen 3870 und 4850 annähernd den faktor 2, mindestens aber 1,8.


Man hat beim RV770 auch nicht alles verbreitert oder aufgebohrt.
Die TMUs wurden beispielsweise in ihrem Funktionsumfang beschnitten, sie können jetzt fp16-Textursamples nicht mehr in einem Takt filtern. Außerdem wurde die Zahl an Textursampler pro Texturcluster um 1/5 verringert und die Zahl an Adressierungseinheiten pro Cluster wurde sogar halbiert.
Die einzelnen Texturcluster sind also deutlich schmaler als noch beim RV670, nur deren Anzahl hat man von 4 auf 10 erhöht.

all diese dinge sind beim G80 allerdings ähnlich und haben diesem auch nicht geschadet.

Gast
2008-06-29, 14:40:40
Das sind 45 % mehr Transistoren, und dafür ist eben die Leistungssteierung entsprechend, sogar etwas besser als man erwarten könnte.


die leistungssteigerung im bezug auf die transistorenzahl ist ansprechend richtig, aber nicht im bezug auf die gesteigerte rohleistung.

Spasstiger
2008-06-29, 14:44:20
Man schaue sich einfach mal diese Ratings an: http://www.computerbase.de/artikel/hardware/grafikkarten/2008/test_ati_radeon_hd_4850_cf_hd_4870/26/#abschnitt_performancerating_qualitaet

Die HD4850 ist mit 8xAA mehr als dreimal so schnell wie die HD3850. Bei adaptivem AA kommt dieser Vorteil auch zum Tragen. Man schaue sich dazu diese Skalierungsmessungen an:
http://www.computerbase.de/artikel/hardware/grafikkarten/2008/test_ati_radeon_hd_4850_cf_hd_4870/5/#abschnitt_aa_und_afskalierung

Wenn du nur einen Vorteil von 50% für den neuen Chip siehst, dann achtest du auf die falschen Benchmarks (mit nur 4xAA ohne AAA).

Gast
2008-06-29, 14:59:33
Man schaue sich einfach mal diese Ratings an: http://www.computerbase.de/artikel/hardware/grafikkarten/2008/test_ati_radeon_hd_4850_cf_hd_4870/26/#abschnitt_performancerating_qualitaet

selbst bei 8xAA sind es gerade mal 62% zwischen 3870 und 4850 (bei 1600x1200)

für die rohleistung interessanter sind aber benches in hoher auflösung ohne AA, da macht es auch keinen unterschied mehr, dass AA-resolve wieder in den ROPs gemacht wird.

bei 2560x1600 sind es gar nur 38% die die 4850 gegenüber der 3870 gewinnt, mit 4xAA immerhin 58%.

Xmas
2008-06-29, 15:16:34
die leistungssteigerung im bezug auf die transistorenzahl ist ansprechend richtig, aber nicht im bezug auf die gesteigerte rohleistung.
Welche Rohleistung meinst du genau, und warum soll diese ein sinnvolles Maß sein?

Savay
2008-06-29, 15:20:52
sehr verschrobene perspektive...die "rohleistung" anhand von sowas festmachen zu wollen ist ja etwas praxisfern findest du nicht? ;)

die pixelfüllrate ist nahezu gleich...die bandbreite bei der 50er auch! wo soll sich da ohne AA und AF bitte der rv770 absetzen können... o.O

solang sich die doppelte Texelleistung, die höhere bandbreite bei der 4870er und die arithmetische leistung (die wohl als aller letztes limitiert!) auch nirgends auszahlen ist es doch kein wunder das der abstand geringer ist? zumal der rv770 nicht an ALLEN stellen nen "verdoppelter" rv670 ist

dieser thread ist grandios sinnlos... :|

Lu-Tze
2008-06-29, 15:21:08
Tja, dasselbe habe ich mich auch schon gefragt... Wenn die Shaders ver2,5facht wurde, und die ROPs auch, warum gibt es dann nur grob die doppelte Leistung (oder sogar weniger)? Auch taktbereinigt lässt sich das nicht wirklich erklären... und an der Speicherbandbreite scheint es ja auch nicht zu liegen, sonst wäre die 4870 wesentlich schneller (was ich eigentlich erwartet hätte...)

Ich habe zwei Vermutungen (aber es wäre schön, wenn noch jemand posten würde, der wirklich Ahnung hat):
- Es gibt einfach noch andere Komponenten, die limitieren, die wir nicht kennen (ich frag mich allerdings, welche?)
- Vielleicht lassen sich 800 shader Prozessoren gleichzeitig einfach nicht so gut auslasten wie 320 - eventuell wird das noch durch ein Treiberupdate verbessert.

In jedem Fall stimme ich Dir zu, die Radeon 48x0 Karten sind irgendwie langsamer als sie nach den Spezifikationen sein sollten.


Was die GTX 280 angeht: Die entspricht genau den Erwartungen, denn die Performance entspricht genau dem Produkt aus dem Verhältnis der Shaderprozessoren mit dem Verhältnis der Taktfrequenzen, relativ zur letzten Generation.

Spasstiger
2008-06-29, 15:21:33
Wahrscheinlich kommt jetzt nach dem Megahertz-Mythos der Gigaflops-Mythos.
Früher hieß es, je mehr Megahertz, desto schneller, heute je mehr Gigaflops, desto schneller. Es sollte sich doch langsam rumsprechen, dass theoretische Daten und Zahlen nix über die Leistungsfähigkeit einer CPU/GPU bei Real-World-Anwendungen aussagen.

Und der RV770 hat bei hohen AA-Stufen deutliche Vorteile gegenüber dem RV670. Wer gerne adaptives AA nutzt und dazu vielleicht noch den Edge-Detect-Modus verwenden möchte, wird schon mit einer HD4850 doppelt so schnell wie mit einer HD3870 unterwegs sein. Die HD4870 gibt da als Bonus nochmal 30-40% höhere Frameraten drauf.
Wer kein AA braucht, braucht auch keine Performance-Grafikkarte, sondern kann genauso gut zu einer GeForce 8800 GT für knapp über 100€ greifen, evtl. sogar zu einer GeForce 9600 GSO für 70€.

Der RV770 ist um etwa 45% breiter als der RV670 (Transistorzahl!) und dafür ist die Mehrleistung doch sehr beachtlich.

Btw. der RV770 hat 10 unabhängige Shaderprozessoren, keine 800.

Odal
2008-06-29, 15:31:56
man darf auch nicht vernachlässigen das der RV670 mit einer höheren taktfrequenz daher kommt

Savay
2008-06-29, 15:36:54
Ich habe zwei Vermutungen (aber es wäre schön, wenn noch jemand posten würde, der wirklich Ahnung hat):
- Es gibt einfach noch andere Komponenten, die limitieren, die wir nicht kennen (ich frag mich allerdings, welche?)
- Vielleicht lassen sich 800 shader Prozessoren gleichzeitig einfach nicht so gut auslasten wie 320 - eventuell wird das noch durch ein Treiberupdate verbessert.

In jedem Fall stimme ich Dir zu, die Radeon 48x0 Karten sind irgendwie langsamer als sie nach den Spezifikationen sein sollten.


welch blödsinn...sry. die limits sind jedem bekannt der sich auch nur ein wenig mit den rohdaten auseinandersetzt...


4850:
Pixelfüllrate: 10GPix/s
Texelfüllrate: 25GPix/s (ACHTUNG: ohne AF erreichen die TMUs nicht ihr theoretisches maximum!)
Bandbreite: 63,5GB/s
Arithmetische Leistung: 1000GFlop peak

3870:
Pixelfüllrate: 12,4GPix/s
Texelfüllrate: 12,4GPix/s
Bandbreite: 70GB/s
Arithmetische Leistung: 496GFlop peak

wo zum geier seht ihr da eigentlich eine durchgängige verdoppelung? :rolleyes:


a) limitieren ohne AA die ROPs der 3870 nicht...wogegen die des rv770 auch mit 4x AA noch nicht limitieren!
b) limitieren ohne AF die TMUs der 3870 nicht...wogegen die des rv770 nicht vollkommen ausgelastet werden können und ihren größten durchsatz erst bei verwendung von AF erreichen!
c) spielt die arithmetische leistung bei den meisten heutigen spielen immernoch nicht die hauptrolle...zumal diese wohl auch stark durch die texelleistung limitiert wird.

GeneralHanno
2008-06-29, 15:37:57
was hat sich geändert: die anzahl der ausführungseinheiten (SP+TMUs) hat sich ver 2,5-facht, die ROP-leistung (z&blend&MS) verdoppelt. dafür sind die taktraten konservativer. das ganze passt in 45% mehr transistoren. in hohen settings schlägt der RV770 den RV670 taktbereiningt um den faktor 2-3x (je nach einstellung)

Spasstiger
2008-06-29, 15:41:30
Das Problem mancher hier ist, dass sie glauben, dass alleine die Anzahl von ALUs und TMUs für die Performance einer Grafikkarte relevant sei, auch wenn diese nur 40-50% der Transistoren ausmachen.

Gast
2008-06-29, 16:01:16
in hohen settings schlägt der RV770 den RV670 taktbereiningt um den faktor 2-3x (je nach einstellung)

wo bitte? und bitte keine tests mit dem blurr-AA, das war ja vorher dermaßen grauenhaft langsam, logisch dass man dort viel gewinnen kann.

Spasstiger
2008-06-29, 16:06:38
wo bitte? und bitte keine tests mit dem blurr-AA, das war ja vorher dermaßen grauenhaft langsam, logisch dass man dort viel gewinnen kann.
Edge Detect ist kein "Blur-AA", sondern nur eine alternative Form des Downsamplings, welches für sauberere Kanten sorgt, ohne das Bild unscharf werden zu lassen. Wer maximale Bildqualität will, verwendet adaptives AA + 8xMSAA + edge detect. Und damit rennt die HD4850 der HD3870 trotz geringerer Pixelfüllrate und geringerer Speicherbandbreite davon.

Coda
2008-06-29, 16:08:36
Das Edge-Detect auf den 4870 schneller ist ist klar wegen der geringeren branching Granularität

Gast
2008-06-29, 17:27:44
Das Edge-Detect auf den 4870 schneller ist ist klar wegen der geringeren branching Granularität

die branching-granularität ist beim RV770 geringer? das ist mir allerdings neu.

Gast
2008-06-29, 17:29:18
Früher hieß es, je mehr Megahertz, desto schneller, heute je mehr Gigaflops, desto schneller. Es sollte sich doch langsam rumsprechen, dass theoretische Daten und Zahlen nix über die Leistungsfähigkeit einer CPU/GPU bei Real-World-Anwendungen aussagen.

nunja, RV670 GFlop sollte man eigentlich schon mit RV770 GFLop vergleichen können, und wenn nicht stellt sich die frage warum.

Gast
2008-06-29, 17:36:43
a) limitieren ohne AA die ROPs der 3870 nicht...wogegen die des rv770 auch mit 4x AA noch nicht limitieren!

sehr schön, dann sind wir uns also einig, dass die nicht gestiegene pixelfüllrate keine rolle spielt.


b) limitieren ohne AF die TMUs der 3870 nicht...wogegen die des rv770 nicht vollkommen ausgelastet werden können und ihren größten durchsatz erst bei verwendung von AF erreichen!

was limitiert dann?


c) spielt die arithmetische leistung bei den meisten heutigen spielen immernoch nicht die hauptrolle...zumal diese wohl auch stark durch die texelleistung limitiert wird.

von deren der RV770 die 2,5-fache hat, taktbereinigt immer noch 2x.
trotzdem sind es auch mit AA/AF gerade mal 50-60% mehrperformance, obwohl die angeblich limitierende komponente doppelt so stark ist.


denkbar wäre natürlich, dass die bandbreite eine rolle spielt, wenn man allerdings sieht, dass die 4870 sich kaum mehr als den taktvorteil vom core absetzen kann, sollte das eigentlich nicht der fall sein.

Coda
2008-06-29, 19:07:58
die branching-granularität ist beim RV770 geringer? das ist mir allerdings neu.
Angeblich ist es so. Ich war auch erstaunt.

Savay
2008-06-29, 22:10:02
sehr schön, dann sind wir uns also einig, dass die nicht gestiegene pixelfüllrate keine rolle spielt.

sie limitiert den rv670 durchaus...aber erst unter einsatz von FSAA wo sich die neuen ROPs des rv770 beginnen auszuzahlen! heutzutage noch mit szenarien zu argumentieren die kein FSAA beinhalten ist doch albern...

da kannst ja gleich mit pointsampling benchen weil das ja dann die rohleistung erst wirklich wiederspiegelt ;D



was limitiert dann?

mit AF limitieren die TMUs des RV670 stärker als die des RV770. dazu kommt noch das die TMUs des RV770 mit trilinearem filter überhaupt garnicht ihr theoretischen durchsatz erreichen können!!!



von deren der RV770 die 2,5-fache hat, taktbereinigt immer noch 2x.
trotzdem sind es auch mit AA/AF gerade mal 50-60% mehrperformance, obwohl die angeblich limitierende komponente doppelt so stark ist.

die arithmetische leistung limitiert ausser vielleicht in crysis (wenn überhaupt!) nichtmal den rv670 oder irgendwelchen techdemos vielleicht mal sogar den rv770...das ist einmal fakt! ohne entsprechende texelleistung wird das theoretische maximum eh in den seltensten fällen zu erreichen sein...und dort KANN sich der rv770 einfach nicht absetzen weil das ALU:TEX verhältniss immernoch 4:1 ist.



denkbar wäre natürlich, dass die bandbreite eine rolle spielt, wenn man allerdings sieht, dass die 4870 sich kaum mehr als den taktvorteil vom core absetzen kann, sollte das eigentlich nicht der fall sein.

im schnitt liegt die 4870 25% in extremfällen sogar 30% vor der 4850er...der rv770pro ist definitiv auch bandbreiten limitiert da der taktvorteil nur um 20% beträgt!

was den RV770 aber am ehesten limitieren dürfte ist und bleibt die texturierleistung...zumindest in heutigen spielen.

Gast
2008-06-29, 22:39:45
was den RV770 aber am ehesten limitieren dürfte ist und bleibt die texturierleistung...zumindest in heutigen spielen.


ebendiese ist doppelt so hoch und trotzdem gibt es mit AF nur 50-60% mehrleistung.

deekey777
2008-06-30, 00:03:26
Wir haben nun die vorstellung der neuen GPU-generationen beider hersteller gesehen, mit wohl einigen überraschungen.

Auf der einen seite haben wir NV, die trotz großer investition an transistoren verhältnismäßig wenig rohleistung bringen.
Je nachdem wie gut nun die effizienzsteigerungen wirken verhalten sich die karten meistens im zu erwartenden rahmen.

Auf der anderen seite bringt ATI eine extreme steigerung an rohleistung mit erstaunlich geringem transistoraufwand.
Da haben wir nun die 2,5-fache rohleistung/takt, nur scheint sie diese kaum in leistung umsetzen zu können.

Taktbereinigt sollte man in etwa 2-fache leistung der 3870 erwarten können.
Real haben wir aber meistens nur ~50% mehrleistung, selbst die 3870 X2 liegt in den meisten fällen knapp vorne, trotz CrossFire.

Die frage ist nun warum die steigerung so überraschend gering ausfällt.

Ich bin mal gespannt auf eure ideen.
http://www.ixbt.com/video3/rv770-part2.shtml
In der "Synthetik" schlug sich die HD4850 gegen eine HD3870 und HD3870 (625) mehr als gut.

Gast
2008-06-30, 00:31:10
Bitte auch beachten das die karten brandneu sind - sprich da sind locker noch +20 Prozent bei einigen Games drinnen wenn die Treiber mal optimiert sind...


MasterElwood

(del)
2008-06-30, 00:55:50
a) limitieren ohne AA die ROPs der 3870 nicht...wogegen die des rv770 auch mit 4x AA noch nicht limitieren!
b) limitieren ohne AF die TMUs der 3870 nicht...wogegen die des rv770 nicht vollkommen ausgelastet werden können und ihren größten durchsatz erst bei verwendung von AF erreichen!Sorry aber irgendwie ist das Musik in meinen Ohren :D

Mit der übermässigen arythmetischen Leistung hält sich ATI imho schon seit der 9800pro übers Wasser. Sie scheint da halbwegs zu helfen wo man mit dem Rest hinter NV herhinkt.

robbitop@work
2008-06-30, 14:19:38
Der GT200 hält imo die Erwartungen, mit SSAA in hohen Auflösungen ist er ca. doppelt so schnell wie der G80.

Ja, durch VRAM-Limitierungen. :uclap:
Ohne VRAM-Limitierung ist der GT200 nur rund 1,5-1,6x so schnell wie eine 8800Ultra.

robbitop@work
2008-06-30, 14:27:02
Das Edge-Detect auf den 4870 schneller ist ist klar wegen der geringeren branching Granularität
Schau dir mal den Test von Damien Troliet (!!) auf HW.fr an. Der hingegen spricht nichtmehr von einer verbesserten Branchgranularität.
Eine erhöter ALU-Output sollte allerdings so oder so förderlich für edge detect sein, da jeder batch (ob nun verworfen oder nicht) schneller durchgerechnet werden kann. Oder übersehe ich hier gerade etwas Wesentliches?

del_4901
2008-06-30, 14:40:41
Oder übersehe ich hier gerade etwas Wesentliches?
Ja, denn eine geringere Branchgranuarität ist besser.

robbitop@work
2008-06-30, 14:44:17
Ja, denn eine geringere Branchgranuarität ist besser.
Das ist mir rechnerisch schon klar. Mir ging es auch nicht darum, was "besser" ist.