PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : ATI braucht dringend mehr als 16 Pipes!!!


lipp
2006-01-25, 15:46:45
hi leute,

die leistung der X1800 und X1900 Serie ist ja trotz 16 pipes immens, aber wenn nv bald mit 32 pipes kommt, siehts natürlich ziemlich dunkel für das rote lager aus ...

aber wenn ati zu ihrer aktuellen leistung noch 8 pipes mehr drauf packen, sind sie wieder vorn, aber warum passiert da nichts in der richtung???

hoffe ihr wisst da mehr!?

Nerothos
2006-01-25, 15:48:51
Weiter 8 Pipes sind einfach nicht im Transistorbudget drin, so einfach ist das.

Juice
2006-01-25, 15:53:30
So wie ich das sehe, ich bin da leider kein Experte hier, hat ATi mal eben die Shaderleistung verdreifacht ohne auch nur eine einzige zusätzliche Pipeline.
Außerdem hört man des öfteren hier im Forum, dass der Begriff Pipeline bei kommenden Grafikchips keine Indiz für die wirkliche Leistung ist. Siehe z.B. Xenos

Simon Moon
2006-01-25, 17:26:40
Lies dir die anderen Threads mit ähnlichem Thema durch, dann erübrigt sich die Frage.
Klassische Füllrate wie bei den DX7 Chips (praktisch auch DX8, theoretisch jedoch schon ab da, gäbe es DX8Spiele die massiv auf Shader setzen), also angaben in MegaPixel, haben heute immer weniger wert. Aktuelle Karten haben da ja werte von um die 15 - 20 Gigapixel. Während die GF2 Ultra gerade mal 1GigaPixel hatte...

gisbern
2006-01-25, 19:42:49
und wenn du dir noch mehr threads durchlesen wirst, dann steht da auch noch was von fehlender Bandbreite für zusäzliche Pipelines. Das RAM Interface is zu mager dafür....

dye
2006-01-25, 19:49:51
Warum die Textur-Pipes "unwichtiger" werden ist hier auf heise beschrieben.
http://www.heise.de/newsticker/meldung/68762
Damit folgen die kanadischen 3D-Spezialisten dem Trend zu immer komplexeren Shader-Programmen, die nicht mehr Texturdaten, sondern mehr Arithmetikleistung benötigen, um Oberflächen realistischer darzustellen und eine größere Zahl von dynamischen Lichtquellen zu berechnen. Bei F.E.A.R. sollen beispielsweise auf jede Texturoperation sieben Arithmetikoperationen kommen. Die geballte Shader-Power ermöglicht es prinzipiell auch, Texturen erst dann, wenn Sie gebraucht werden, zu errechnen (prozedurale Texturen, zum Beispiel Perlin Noise).

Coda
2006-01-25, 20:31:03
Aktuelle Karten haben da ja werte von um die 15 - 20 Gigapixel. Während die GF2 Ultra gerade mal 1GigaPixel hatte...Öh also ne GTX 512 hat 8,8Gigapixel/s und ne X1900XTX hat 10,4Gigapixel/s.

Gast
2006-01-25, 20:50:05
Wobei die Pixelfüllrate eh kaum interessiert. Und die Texelfüllrate der GTX512 ist schon verdammt nah an seinen 15 Gigapixel dran. ;)

Gast
2006-01-25, 20:50:33
errm, gigatexel natürlich...

paul.muad.dib
2006-01-25, 23:21:14
In aktuellen Spielen und selbst im Shadermark bringt der r580 seine Shaderleistung kaum auf die Straße. In zukunft mag das anders aussehen, aber momentan wären mehr TMUs imo schon hilfreich.

deekey777
2006-01-25, 23:26:05
In aktuellen Spielen und selbst im Shadermark bringt der r580 seine Shaderleistung kaum auf die Straße. In zukunft mag das anders aussehen, aber momentan wären mehr TMUs imo schon hilfreich.

Nenn dann bitte einen sinnvollen Grund, warum die R580 zu diesem Zeitpunkt mehr TMUs braucht.

paul.muad.dib
2006-01-25, 23:37:36
Trotz Dreifacher Shader-Power nur 20-30% schneller als r520.

Kurgan
2006-01-25, 23:43:59
Trotz Dreifacher Shader-Power nur 20-30% schneller als r520.
nur? sag mir mal was anderes was in nur einer generation um 30% schneller wurde ...

paul.muad.dib
2006-01-25, 23:47:28
Für einen refresh bzw. einen Zeitruam von einem halben Jahr ist das gut, aber angesichts dem, was 'reingesteckt wurde, ist es wenig. Außerdem kommt ja auch noch der G71.

deekey777
2006-01-25, 23:49:15
Trotz Dreifacher Shader-Power nur 20-30% schneller als r520.
Du hast meine Frage aber nicht beantwortet.

Kurgan
2006-01-26, 00:06:56
Du hast meine Frage aber nicht beantwortet.
meine auch nicht. ausserdem: ati hat atm die schnellste karte, was also soll das geflenne nach mehr piepen?

paul.muad.dib
2006-01-26, 00:11:47
In wie fern ist das keine Antwort? Der Grund ist, dass die Shader Power z.Zt. wg. anderer Limitierungen nicht auf die Straße gebracht werden kann. Bei mehr TMUs sähe das (vermutlich) anders aus.

deekey777
2006-01-26, 00:27:10
In wie fern ist das keine Antwort? Der Grund ist, dass die Shader Power z.Zt. wg. anderer Limitierungen nicht auf die Straße gebracht werden kann. Bei mehr TMUs sähe das (vermutlich) anders aus.

Nur so als Beispiel: http://www.digit-life.com/articles2/video/r580-part3.html
Siehst du irgendwo, daß die TMUs limitieren?

mapel110
2006-01-26, 00:32:00
Nur so als Beispiel: http://www.digit-life.com/articles2/video/r580-part3.html
Siehst du irgendwo, daß die TMUs limitieren?
brrrr, die Prozentzahlen ...

http://www.computerbase.de/artikel/hardware/grafikkarten/2006/test_ati_radeon_x1900_xtx_x1900_cf-edition/9/#abschnitt_chipeffizienz_part_1
(nächste Seite dort auch noch)
geht auch einfacher. :)

Man könnte wohl schon mehr Power rausholen mit mehr TMUs, aber imo ist der R580 der "ausgewogenere Chip" gegenüber R520.

deekey777
2006-01-26, 00:33:43
brrrr, die Prozentzahlen ...

http://www.computerbase.de/artikel/hardware/grafikkarten/2006/test_ati_radeon_x1900_xtx_x1900_cf-edition/9/#abschnitt_chipeffizienz_part_1
(nächste Seite dort auch noch)
geht auch einfacher. :)

Man könnte wohl schon mehr Power rausholen mit mehr TMUs, aber imo ist der R580 der "ausgewogenere Chip" gegenüber R520.

Klar hätten mehr TMUs der X1900 gut getan, aber die Topic-Frage ist, daß ATi mehr TMUs braucht. Einen vernünftigen Grund hat aber noch keiner genannt.

paul.muad.dib
2006-01-26, 00:34:40
Nur so als Beispiel: http://www.digit-life.com/articles2/video/r580-part3.html
Siehst du irgendwo, daß die TMUs limitieren?

Ich glaube, ich bin zu blöd für den Artikel. Ich verstehe diese Tabellen nicht. Einmal 44% Unterschied und einmal 3 Prozent Unterschied beim gleichen Vergleich im gleichen Spiel und gleichen Setting? kannst du mir auf die Sprünge helfen?

josefYY
2006-01-26, 00:59:23
Die Antwort auf die Eingangsfrage wird in diesem (recht guten) ATI-Interview sehr gut erklärt.
http://www.beyond3d.com/reviews/ati/r580/int/
Im Prinzip das was alle anderen hier bereits erklärt haben nur halt ein bisschen ausführlicher und genauer.

LordDeath
2006-01-26, 01:57:35
Klar hätten mehr TMUs der X1900 gut getan, aber die Topic-Frage ist, daß ATi mehr TMUs braucht. Einen vernünftigen Grund hat aber noch keiner genannt.

wenn die jetzt riesige ALU leistung nicht ausgeschöpft wird, heißt es doch, dass hier die TMUs limitieren...

Odal
2006-01-26, 02:13:38
nein es könnte genauso gut die bandbreite limitieren.

TMUs sind wichtig (den mangel sieht man ja an der x1600) aber 16 TMU und 16ROP scheinen auszureichen, da die x1900 ja in jedem spiel brauchbare frameraten liefert. Und in Zukunft verschiebt sich das Verhältniss noch deutlich mehr richtung ALU power. Von der Sache her ist, zumindest bei der x1900, das Design recht clever. Stellt sich nur die Frage ob 48ALU zu 16TMU in zukunft ausreichen oder das Verhältniss gar noch weiter richtung ALU gehen müsste.
Weitere ALUs verbrauchen eben bei weitem nicht soviel Transistorcount wie weitere komplette pipelines, daher auch dieses Vorgehen.

paul.muad.dib
2006-01-26, 02:15:07
Im Interview wird gesagt, dass mehr TMUs nicht mehr versorgt werden könnten, weil die Bandbreite fehlt. Soweit kann ich dem zustimmen, aber sind jetzt nicht vlt. zu viele ALUs da, die jetzt nicht ausgelastet sind. Selbst der Schadermark kommt maximal zu eine Verrdopplung, nicht aber Verdreifachung.

Odal
2006-01-26, 02:30:49
ALUs sind aber kaum bandbreitenabhängig

und shaderbedarf wird weiter stark steigen. Und ob man in aktuellen games 80 oder nur 70FPS hat macht keinen allzugrossen unterschied ob man in späteren spielen aber 30 statt 20FPS hat dagegen schon eher. Jedenfalls aus der Brauchbarkeitsperspektive. Das auf dem Papier hohe Leistung zum Erscheinen einer Karte natürlich erstmal besser aussieht und benchmarks für viele das Kaufkriterium darstellen ist klar.

OBrian
2006-01-26, 02:39:20
Das ist auf jeden Fall mal ein gutes Forschungsthema für den kommenden 3DC-Artikel. Man könnte mal mit den Taktraten rumspielen und schauen, ob es mehr bringt, den RAM-Takt zu verändern als den Chiptakt. Oder spezielle 3D-Szenarien testen, wo nur bestimmte Chipteile ausgelastet sind.

Ich weiß nicht, inwiefern das möglich ist, aber ich fände es interessanter als z.B. die üblichen Doom3/Farcry/FEAR/UT-Durchläufe.

paul.muad.dib
2006-01-26, 03:01:52
Das ist auf jeden Fall mal ein gutes Forschungsthema für den kommenden 3DC-Artikel. Man könnte mal mit den Taktraten rumspielen und schauen, ob es mehr bringt, den RAM-Takt zu verändern als den Chiptakt. Oder spezielle 3D-Szenarien testen, wo nur bestimmte Chipteile ausgelastet sind.

Ich weiß nicht, inwiefern das möglich ist, aber ich fände es interessanter als z.B. die üblichen Doom3/Farcry/FEAR/UT-Durchläufe.

ack

BH abgemeldet
2006-01-26, 04:00:49
Für einen refresh bzw. einen Zeitruam von einem halben Jahr ist das gut, aber angesichts dem, was 'reingesteckt wurde, ist es wenig. Außerdem kommt ja auch noch der G71.
Die Frage ist doch, was wieder bei 32 Pipes "limitierend wirken wird". Und ob man damit HDR+AA bzw. +TranspAA hinbekommt. Und wie es mit der Winkunab. aussieht und was dann IN DEM FALL hinten an FPS rauskommt.

Inwiefern der G71 den R580 in die Tasche stecken wird lässt sich imho noch nicht klar sagen. Weil, ob 67 oder nur 58fps in LostCoast und 1600x1200 spielt nur noch eine zweite Geige. Bei der Auflösung kann man sich keine "Darstellungspatzer" mehr leisten. Und das wird NV garantiert Leistung kosten.

ShadowXX
2006-01-26, 07:43:22
Im Interview wird gesagt, dass mehr TMUs nicht mehr versorgt werden könnten, weil die Bandbreite fehlt. Soweit kann ich dem zustimmen, aber sind jetzt nicht vlt. zu viele ALUs da, die jetzt nicht ausgelastet sind. Selbst der Schadermark kommt maximal zu eine Verrdopplung, nicht aber Verdreifachung.

Das theoretische Maximum holt man sowieso nie raus.....

Spiele wie Splinter Cell 3 oder Fear habn ein Arithmetik - Textur Verhältnis von 5-8 : 1.

D.h. auf 5-8 ALU Anweisungen kommt eine Texturanweisung......was willst du da mit mehr TMUs? (Das Verhältnis beim r580 ist jetzt 3:1, bei nV (G70) 2:1).

Du müsstest also um das (gute) Verhältnis zu wahren nicht nur TMUs ranflanschen, sondern auch noch weitere ALUs.....

Veranschiedet euch schon mal vom Gedanken, das die Anzahl an TMUs was über die absolute Leistungsfähigkeit des Chips aussagt.

svenw
2006-01-26, 07:54:21
MAl ne dumme Frage: wieviel Geld habt ihr?

Mehr TMUs bedeuten mehr Die FLäche, mehr Ausschuß und Probleme einen hohen Takt zu erreichen. für die XTX Variante würde man dann eben nicht 699 € sondern 1000€. Die Mainstream Varianten würden 500+ kosten. Damit hätte ATI die schnellsten KArten und würde Nvidia um 80% verblasen, leider könnten sie ihre Karten nicht mehr verkaufen und würden pleite machen.

Eine KArte ist eine Mischung aus Ksoten und technischen Möglichkeiten. Vernachlässigt man das eine oder das andere amcht man Verlust und hat kein Geld um die nächste Generation zu entwickeln!

Ailuros
2006-01-26, 10:29:36
MAl ne dumme Frage: wieviel Geld habt ihr?

Mehr TMUs bedeuten mehr Die FLäche, mehr Ausschuß und Probleme einen hohen Takt zu erreichen. für die XTX Variante würde man dann eben nicht 699 € sondern 1000€. Die Mainstream Varianten würden 500+ kosten. Damit hätte ATI die schnellsten KArten und würde Nvidia um 80% verblasen, leider könnten sie ihre Karten nicht mehr verkaufen und würden pleite machen.

Eine KArte ist eine Mischung aus Ksoten und technischen Möglichkeiten. Vernachlässigt man das eine oder das andere amcht man Verlust und hat kein Geld um die nächste Generation zu entwickeln!


Haette R5x0 mehr SIMD Kanaele bzw. mehr TMUs, waere sie auch von Anfang an anders ausgelegt.

Diese "was waere wenn..." Thesen sind mir zu gefaehrlich. Was hinten raus kommt ist mir wichtiger und zum Thread-titel moechte ich gerne erstmal handhafte Beweise lesen wo genau in heutigen Spielen die Anzahl der quads - so wie sie ausgelegt sind - zu kurz kommt.

Coda
2006-01-26, 10:31:14
Was ich sehr interessant finde ist das AoE3 doch anscheinend sehr Shaderlimitiert ist.

Ailuros
2006-01-26, 10:42:24
Was ich sehr interessant finde ist das AoE3 doch anscheinend sehr Shaderlimitiert ist.

http://www.xbitlabs.com/articles/video/display/radeon-x1900xtx_31.html

Das Ding hat doch auch HDR oder?

http://www.xbitlabs.com/articles/video/display/radeon-x1900xtx_19.html

Coda
2006-01-26, 10:46:43
Wieso sollte die X1900XT bei HDRR schneller sein als eine X1800XT?

deekey777
2006-01-26, 10:48:37
http://www.xbitlabs.com/articles/video/display/radeon-x1900xtx_31.html

Das Ding hat doch auch HDR oder?


"INT10" HDR+MSAA. Den nVidia-Grafikkarten wird beim angeschalteten FP16-HDRR SSAA aufgezwungen: http://www.computerbase.de/artikel/hardware/grafikkarten/2006/test_ati_radeon_x1900_xtx_x1900_cf-edition/15/#abschnitt_age_of_empires_3

Odal
2006-01-26, 11:34:52
Was ich sehr interessant finde ist das AoE3 doch anscheinend sehr Shaderlimitiert ist.


das merkst du doch schon wenn du mal Shaderdetail=Verry High auf Shaderdetail=High runterstellst....

nicht sellten verdoppeln sich da die FPS

Ailuros
2006-01-26, 11:45:10
Wieso sollte die X1900XT bei HDRR schneller sein als eine X1800XT?

Keine Ahnung; wie erklaerst Du aber die FC HDR Leistung zwischen R520/R580 oben?

Coda
2006-01-26, 11:47:36
Gute Frage.

In AoE3 wird aber anscheinend nur ein 32bit Rendertarget verwendet (10-10-10-2), deshalb kann man das nicht vergleichen.

Ailuros
2006-01-26, 11:53:06
"INT10" HDR+MSAA. Den nVidia-Grafikkarten wird beim angeschalteten FP16-HDRR SSAA aufgezwungen: http://www.computerbase.de/artikel/hardware/grafikkarten/2006/test_ati_radeon_x1900_xtx_x1900_cf-edition/15/#abschnitt_age_of_empires_3


CΒ behauptet vergleichbare IQ im Spiel, was ich bei bestem Willen nicht verstehen kann (4x sparse MSAA vs. 1*1.5 OGSS oder wie soll ich das jetzt verstehen?)....

Was und wie jetzt xbit labs getestet hat ist dann auch noch die Frage. Mit 4xMSAA war auf den GF's mit Sicherheit mal kein HDR im Laufen :|

Coda
2006-01-26, 12:26:16
CΒ behauptet vergleichbare IQ im Spiel, was ich bei bestem Willen nicht verstehen kann (4x sparse MSAA vs. 1*1.5 OGSS oder wie soll ich das jetzt verstehen?)....Das hab ich mich auch gefragt X-D

Vor allem auch noch ungerades Supersampling. Das würde ja nur noch Matsch sein...

Ailuros
2006-01-26, 12:30:31
Das hab ich mich auch gefragt X-D

Vor allem auch noch ungerades Supersampling. Das würde ja nur noch Matsch sein...

Wieso Matsch? Ich sehe zwar keine Nutzbarkeit bei dem oeden modus, aber koennte man nicht ein vertikales Dingsda mit einem -0.25 LOD offset benutzen? Matschig - wenn aber nur ganz wenig - wird eben der Hud und jeglicher Text....

deekey777
2006-01-26, 13:26:44
CΒ behauptet vergleichbare IQ im Spiel, was ich bei bestem Willen nicht verstehen kann (4x sparse MSAA vs. 1*1.5 OGSS oder wie soll ich das jetzt verstehen?)....


Das HDR hat sie geblendet. X-D
Hieß es nicht, daß die Radeon ab R300 auch 1010102 (ohne MSAA) unterstützen?

Was und wie jetzt xbit labs getestet hat ist dann auch noch die Frage. Mit 4xMSAA war auf den GFs mit Sicherheit mal kein HDR im Laufen :|
Nicht gut genug recherchiert?

Coda
2006-01-26, 13:42:22
Wieso Matsch? Ich sehe zwar keine Nutzbarkeit bei dem oeden modus, aber koennte man nicht ein vertikales Dingsda mit einem -0.25 LOD offset benutzen? Matschig - wenn aber nur ganz wenig - wird eben der Hud und jeglicher Text....Ungerade Supersampling-Anteile geben überall Matsch.

Ailuros
2006-01-26, 13:43:28
Das HDR hat sie geblendet. X-D
Hieß es nicht, daß die Radeon ab R300 auch 1010102 (ohne MSAA) unterstützen?

Was fuer ein Format verwendet wird ist mir weniger wichtig als das Resultat; float HDR im Vergleich zu stinknormalem bloom Effekten ist in Serious Sam2 auch nicht der Rede Wert. Ich hab AoE3 nicht, denn mir bekommt das genre erstmal gar nicht.

Ailuros
2006-01-26, 13:45:18
Ungerade Supersampling-Anteile geben überall Matsch.

Wusste ich nicht; und die Schnapsidee dieser Implementierung stammt von den Entwicklern oder NV?

Coda
2006-01-26, 13:47:26
Wusste ich nicht; und die Schnapsidee dieser Implementierung stammt von den Entwicklern oder NV?Ich glaub gar nicht dran irgendwie.

Demirug
2006-01-26, 13:52:42
Ich glaub gar nicht dran irgendwie.

Glaube es ruhig. Carsten hat es mit etwas Unterstützung von mir für die PCGH getestet.

MechWOLLIer
2006-01-26, 17:23:55
CΒ behauptet vergleichbare IQ im Spiel, was ich bei bestem Willen nicht verstehen kann (4x sparse MSAA vs. 1*1.5 OGSS oder wie soll ich das jetzt verstehen?)....

Was und wie jetzt xbit labs getestet hat ist dann auch noch die Frage. Mit 4xMSAA war auf den GF's mit Sicherheit mal kein HDR im Laufen :|

Hast du es dir denn schonmal in beiden Konfigurationen angeguckt?

Solange man in dem Spiel irgendwelche Introsequenzen anguckt, gebe ich dir recht. Dort sieht das 4xMSAA logischerweise deutlich besser aus asls 1,5xSSAA.

Aber in der "Von-Oben-Sicht" gibt es wirklich kaum noch Unterschiede. Unglaublich, aber wahr;)

Gast
2006-01-26, 17:25:38
Aber beim HDR-Rendering sollte doch durchaus ein Unterschied zu sehen sein zwischen NVs FP16 und ATIs Int10...

Ailuros
2006-01-26, 17:28:49
Glaube es ruhig. Carsten hat es mit etwas Unterstützung von mir für die PCGH getestet.

Matschig oder nicht? Ich war gerade froh dass ich angeblich was dazugelernt habe....

deekey777
2006-01-26, 17:50:46
Was fuer ein Format verwendet wird ist mir weniger wichtig als das Resultat; float HDR im Vergleich zu stinknormalem bloom Effekten ist in Serious Sam2 auch nicht der Rede Wert. Ich hab AoE3 nicht, denn mir bekommt das genre erstmal gar nicht.

Eigentlich meinte ich es so, warum dieses INT10 HDR nicht auf den Radeon ab R300 zu sehen ist. :)

Aber beim HDR-Rendering sollte doch durchaus ein Unterschied zu sehen sein zwischen NVs FP16 und ATIs Int10...
Das ist malwieder so eine Streitfrage: Man würde einen Unterschied sehen, wenn das INT10 HDR im Vergleich zum FP16 HDR in AoE3 nicht ausreicht.

Gast
2006-01-26, 21:10:00
Das theoretische Maximum holt man sowieso nie raus.....

Spiele wie Splinter Cell 3 oder Fear habn ein Arithmetik - Textur Verhältnis von 5-8 : 1.

D.h. auf 5-8 ALU Anweisungen kommt eine Texturanweisung......was willst du da mit mehr TMUs? (Das Verhältnis beim r580 ist jetzt 3:1, bei nV (G70) 2:1).

Du müsstest also um das (gute) Verhältnis zu wahren nicht nur TMUs ranflanschen, sondern auch noch weitere ALUs.....

Veranschiedet euch schon mal vom Gedanken, das die Anzahl an TMUs was über die absolute Leistungsfähigkeit des Chips aussagt.

dabei darfst du aber nicht vergessen texturanweisungen wegen der filterung in der regel mehrere takte braucht, aber oft mehrere ALU-anweisungen in einem takt ausgeführt werden können.

Pirx
2006-01-26, 21:34:40
Sind das eigentlich immer noch bilineare TMUs, die für trilinear 2 Takte brauchen? Wenn ja, wieso ist es eigentlich günstiger die TMUs zu vervielfachen, als trilineare TMUs zu realisieren, wo doch eh immer trilinear gefiltert wird äh werden sollte?

Gast
2006-01-26, 21:36:49
Ja, es sind bilineare TMUs, d.h. tri braucht zwei Takte, AF entsprechend mehr.

Demirug
2006-01-26, 21:45:29
Matschig oder nicht? Ich war gerade froh dass ich angeblich was dazugelernt habe....

Auf den Shots sah es eigentlich nicht matschig aus aber da must du eher Carsten fragen weil ich nur die Tools geliefert habe.

BTW: Es ist nicht 1*1.5 OGSS sondern 1,5*1,5 OGSS.

ShadowXX
2006-01-26, 21:48:46
dabei darfst du aber nicht vergessen texturanweisungen wegen der filterung in der regel mehrere takte braucht, aber oft mehrere ALU-anweisungen in einem takt ausgeführt werden können.

Das stimmt schon, aber das Verhältnis ALU : Textur wird sich in Zukunft wohl noch weiter in Richtung Arithmetik verschieben.

Das man in zukünftigen GPUs mehr TMUs benötigen wird ist klar (auch mehr ROPs), alleine schon deshalb, weil die Auflösungen immer höher werden in denen gespielt wird.
Aber zum jetzigen Zeitpunkt sind 16TMUs/Rops schon OK.

Ich gehe allerdings aus, das die D3D10-GPUs mehr TMUs/ROPs, aber dann natürlich auch mehr ALUs haben werden (128/32 fand ich als Schätzung eigentlich schon ganz gut, wobei ich nicht sicher bin, ob das die ersten D3D10-GPUs schon bieten werden)

ShadowXX
2006-01-26, 21:50:16
Sind das eigentlich immer noch bilineare TMUs, die für trilinear 2 Takte brauchen? Wenn ja, wieso ist es eigentlich günstiger die TMUs zu vervielfachen, als trilineare TMUs zu realisieren, wo doch eh immer trilinear gefiltert wird äh werden sollte?

BiTMUs sind flexibler....zumindest habe ich das so öfter mal rausgehört.

Gast
2006-01-26, 21:57:49
Sind das eigentlich immer noch bilineare TMUs, die für trilinear 2 Takte brauchen? Wenn ja, wieso ist es eigentlich günstiger die TMUs zu vervielfachen, als trilineare TMUs zu realisieren, wo doch eh immer trilinear gefiltert wird äh werden sollte?

wenn du eine tri-tmu baust kannst du zu sehr geringen mehrkosten (was transistoren angeht) 2 bi-tmus daraus machen, und bist dabei wesentlich flexibler.

allerdings hat sich offensichtlich die 1TMU/pipe durchgesetzt.

Coda
2006-01-26, 22:19:18
Es ist doch so das man nur begrenzte Speicherbandbreite hat. Und an diese passt man eben die Anzahl der bilinaren TMUs an, weil diese braucht man als Basisoperation für alle Filtertypen.

Tri-TMUs machen also in mehrer Hinsicht keinen Sinn. Wenn überhaipt dann in Verbindung mit großeren Filterkerneln.

Ailuros
2006-01-27, 09:17:11
Auf den Shots sah es eigentlich nicht matschig aus aber da must du eher Carsten fragen weil ich nur die Tools geliefert habe.

BTW: Es ist nicht 1*1.5 OGSS sondern 1,5*1,5 OGSS.

Damien T. hat es mir bei B3D auch klargemacht. Danke.

Ailuros
2006-01-27, 09:20:50
Das stimmt schon, aber das Verhältnis ALU : Textur wird sich in Zukunft wohl noch weiter in Richtung Arithmetik verschieben.

Das man in zukünftigen GPUs mehr TMUs benötigen wird ist klar (auch mehr ROPs), alleine schon deshalb, weil die Auflösungen immer höher werden in denen gespielt wird.
Aber zum jetzigen Zeitpunkt sind 16TMUs/Rops schon OK.

Ich gehe allerdings aus, das die D3D10-GPUs mehr TMUs/ROPs, aber dann natürlich auch mehr ALUs haben werden (128/32 fand ich als Schätzung eigentlich schon ganz gut, wobei ich nicht sicher bin, ob das die ersten D3D10-GPUs schon bieten werden)


NVIDIA von ihrer Seite besteht darauf (ist auch verstaendlich was ihre momentane Architekturen betrifft) dass der Unterschied zwischen ALU<->TEX nicht so gross sein sollte. Was jetzt stimmt und was nicht wird die Zukunft schon zeigen; man dreht eben stets seine Vermarktung zurecht mit dem was man gerade hat.

Ailuros
2006-01-27, 09:39:35
Es ist doch so das man nur begrenzte Speicherbandbreite hat. Und an diese passt man eben die Anzahl der bilinaren TMUs an, weil diese braucht man als Basisoperation für alle Filtertypen.

Tri-TMUs machen also in mehrer Hinsicht keinen Sinn. Wenn überhaipt dann in Verbindung mit großeren Filterkerneln.

Im Fall von R5x0 wuerde die Bandbreite fuer 16 tri-TMUs wieso nicht genau ausreichen? Geht denn die Bandbreite nicht schon bei 16 bilinearen Texels pro Takt aus?

In diesem Fall wuerde es eher mehr Transistoren kosten, was dann in so einem Fall gegen eine solche Design-Entscheidung spricht.

Ich hab zwar keine Ahnung wieviele Texturen in einer heutigen durchschnittlichen Szene bilinear und wieviel trilinear brauchen, aber ich koennte mir gut vorstellen dass bilinear prozentuell ueberwiegt. Ueberwiegt nun dieses Prozentual weil man tatsaechlich nicht mehr braucht, oder weil man sich eher den verfuegbaren Architekturen anpasst?

***edit: ist eine ehrliche Frage ^