Pixel- und Texel-Leistung [Archiv]

=Floi=

2006-08-29, 05:36:11

Hallo
geht es mit der pixel und texel leistung langsam dem ende zu
irgendwie pendelt es sich aktuell bei ca 10000Mio ein

stagnieren wird es sicherlich nicht aber so schnell wird sich da nicht mehr so viel tun finde ich

wird nicht mehr mehr benötigt?

AnarchX

2006-08-29, 10:32:49

geht es mit der pixel und texel leistung langsam dem ende zu
irgendwie pendelt es sich aktuell bei ca 10000Mio ein

Da hast du dir wohl eher nur ATI betrachtet bei denen sich seit 2004 nicht viel an der Pixel- und Texelleistung gesteigert hat (8000 auf 10400 MTex/MPix /s)

Bei Nvidia hingegen doch schon:
7900GTX 15600 MTex/s
7950GX2 2x 12000 MTex/s

G80 wird mit hoher Wahrscheinlichkeit auch mit 32 Pixelpipelines kommen, wodurch wenn er nicht gerade sehr niedrig getaktet werden muss, wiederrum einiges an Texelleistung zulegt.
R600 täte es wirklich gut wenn er mehr als die spekulierten 16 ROPs(16TMUs?) hätte.

wird nicht mehr mehr benötigt?
Auch wenn in den nächsten Jahren der Bedarf an arithmetischer Leistung stark steigen wird, so steigt aber auch weiterhin der Bedarf an Pixel- und Texelleistung, wenn auch nicht mehr so stark wie in der Vergangenheit.

Gast

2006-08-29, 11:52:09

pixelfüllrate wird tatsächlich kaum mehr gebraucht, 8000 MPix/s reichen in 2048x1536 theoretisch für ~2500fps.

selbst wenn man einen viel zu hohen overdraw von 10 annimmt bleiben immer noch über 250fps übrig.

die texelfüllrate sollte für durchgehendes HQ-AF ohne jetztiger fragwürdiger optimierungen aber durchaus noch ansteigen, wobei das verhältnis zwischen ALU und TEX-leistung immer stärker in richtung ALU wandern wird.

deekey777

2006-08-29, 12:52:21

Bei nVidia ist sie (Texelfüllrate) deswegen so hoch, weil die TMUs und die Pixelshader miteinander verknüpft wird (4*(Tex->ALU->ALU)), auch der nächste Chip wird diese Architektur noch haben, selbst wenn sie diese nicht brauchen*. Nur braucht man die Texelfüllrate, wir kriegen nicht genug davon (siehe SS2). Auch die nächste und übernächste Generation hohe Texelfüllrate haben, die TMUs an sich werden einfacher.
Die Pixelfüllrate "stagniert" seit zwei Generationen, weil 16 ROPs&650 MHz sind bei heutiger verfügbarer Speicherbandbreite (FB-Bandbreite) nahezu overkill. Mehr geht nicht, ohne dass die Speicherbandbreite deutlich erhöht wird.
Hier wäre der Xenos/C1 mit seinem eDRAM ein interessantes Beispiel: Bei der verfügbaren Framebuffer-Bandbreite von 256 GB/s verlieren die ROPs selbst bei 4xMSAA nichts an der Pixelfüllrate.

*Siehe R580 oder RV530: Es wurde auf 4 bzw. 8 TMUs zugungsten der arithmetischen Leistung (PS-ALUs) verzichtet, bei nVidia geht das nicht.

Neomi

2006-08-29, 13:34:45

pixelfüllrate wird tatsächlich kaum mehr gebraucht, 8000 MPix/s reichen in 2048x1536 theoretisch für ~2500fps.

selbst wenn man einen viel zu hohen overdraw von 10 annimmt bleiben immer noch über 250fps übrig.

So simpel kann man das schon lange nicht mehr umrechnen, es gibt nämlich weit mehr zu berechnen als nur das eigentliche Bild. Umgebungsreflektionen in eine Cubemap, Entfernungen in eine Shadowmap, diverse andere Render-to-Texture-Effekte, alles benötigt ebenfalls Füllrate. Und wenn noch Postprocessing zum Einsatz kommt, kann man auch da einiges an Füllrate verbraten.

AnarchX

2006-08-29, 13:55:33

*Siehe R580 oder RV530: Es wurde auf 4 bzw. 8 TMUs zugungsten der arithmetischen Leistung (PS-ALUs) verzichtet, bei nVidia geht das nicht.

Vor allem beim RV530 stellt sich die Frage, ob dies wirklich sinnvoll war...
Generell zeigen die aktuellen und kommenden ATI-Produkte die Tendenz: Arithmetische Leistung -Hui! Texelleistung -Pfui!

Gast

2006-08-29, 15:07:16

pixelfüllrate wird tatsächlich kaum mehr gebraucht, 8000 MPix/s reichen in 2048x1536 theoretisch für ~2500fps.

selbst wenn man einen viel zu hohen overdraw von 10 annimmt bleiben immer noch über 250fps übrig.

Blödsinn. Moderne Pixelshader laufen schonmal 100 Cycles, dazu kommt noch der angesprochene Overhead und die ineffiziente Rasterisierung von kleine Dreiecken.

Da bist eher bei nem Faktor von 500-1000, deshalb sinds eben auch nur sau wenig FPS in der Auflösung.

Gast

2006-08-29, 15:08:05

Generell zeigen die aktuellen und kommenden ATI-Produkte die Tendenz: Arithmetische Leistung -Hui! Texelleistung -Pfui!

Pfui ist da gar nichts, sondern einfach angemessen für die vorhandenen Bandbreite.

Gast

2006-08-29, 16:14:44

Deswegen wird der R600 wohl kaum mehr Texelleistung wie der R580 haben...32 TMUs wären wünschenswert und eine hohe Shaderleistung ist pflicht.

Umso länger ich darüber nachdenke, desto eher denke ich das der R600 ein Flop wird, ATI hat sich zu früh zu USCs gewendet...

Gast

2006-08-29, 16:26:20

Blödsinn. Moderne Pixelshader laufen schonmal 100 Cycles, dazu kommt noch der angesprochene Overhead und die ineffiziente Rasterisierung von kleine Dreiecken.

na und? je mehr cycles im shader verbraucht werden, desto weniger pixelfüllrate brauche ich (verhältnismäßig) um diese auch rauszuschreiben.

Gast

2006-08-29, 16:28:29

So simpel kann man das schon lange nicht mehr umrechnen, es gibt nämlich weit mehr zu berechnen als nur das eigentliche Bild. Umgebungsreflektionen in eine Cubemap, Entfernungen in eine Shadowmap, diverse andere Render-to-Texture-Effekte, alles benötigt ebenfalls Füllrate. Und wenn noch Postprocessing zum Einsatz kommt, kann man auch da einiges an Füllrate verbraten.

mir ist schon klar dass diese sachen auch noch einiges an füllrate brauchen.

ich wollte damit nur verdeutlichen dass wir eigentlich im moment pixelfüllrate im überfluss haben, oder glaubst du wirklich dass in einer realen situation irgendwo die ROPs limitieren?

Gast

2006-08-29, 16:30:19

na und? je mehr cycles im shader verbraucht werden, desto weniger pixelfüllrate brauche ich (verhältnismäßig) um diese auch rauszuschreiben.

Ach du meinst die ROP-Pixelfüllrate. Ja gut, die ist schon lange unwichtig - einverstanden.

Spasstiger

2006-08-29, 17:42:12

ich wollte damit nur verdeutlichen dass wir eigentlich im moment pixelfüllrate im überfluss haben, oder glaubst du wirklich dass in einer realen situation irgendwo die ROPs limitieren?
Sieht man ja auch an den ersten 7800-GS-Karten, die nur mit 8 aktiven ROPs daherkamen. Trotzdem hat man das Fehlen von 8 ROPs nicht wirklich gemerkt.
Die Texelfüllrate ist aber auf jeden Fall noch wichtig. Sieht man ja auch gut an der X1600 Pro. Trotz hoher arithmetischer Leistung ist die Karte im Vergleich zur Konkurrenz von NV viel zu langsam (eine GeForce 6800 NU hat z.B. eine geringere arithmetische Leistung und ist trotzdem durchgehend schneller bis deutlich schneller).
Deshalb hoffe ich auch, dass der R600 mit 24 bis 32 TMUs kommen wird.

Gast

2006-08-29, 19:38:40

[QUOTE=Spasstiger...

(eine GeForce 6800 NU hat z.B. eine geringere arithmetische Leistung und ist trotzdem durchgehend schneller bis deutlich schneller).
Deshalb hoffe ich auch, dass der R600 mit 24 bis 32 TMUs kommen wird.[/QUOTE]

Wie viele Transistoren und Bandbreite hat eine 6800NU? Wieviel eine x1600Pro? Aha.

Banshee18

2006-08-29, 19:57:49

Deshalb hoffe ich auch, dass der R600 mit 24 bis 32 TMUs kommen wird.
Imho muss das sein. Durch noch mehr ALUs lässt sich die Leistung bestimmt nicht mehr stark steigern, oder? Der R580 dürfte schon mehr als genug arithmetische Power haben.
Speicherbandbreite ist dank GDDR4 genug da, die Effizienz stimmt bei ATI, der Chiptakt wird wahrscheinlich auch nicht so viel höher sein.

Ein R580+ mit 24 oder mehr TMUs wäre bestimmt geil.;)

Gast

2006-08-29, 20:21:39

Ach du meinst die ROP-Pixelfüllrate. Ja gut, die ist schon lange unwichtig - einverstanden.
Ja die ist ja auch so super unwichtig bei den immer mehr zunehmenden Depth-Passes....
Einmal Z-First, dutzende von Shadowmaps und dahinter einen USA der nicht mehr durch getrennte Vertexshader limiert. Da wird schon so einiges durchgejagt.

Spasstiger

2006-08-29, 21:40:51

Wie viele Transistoren und Bandbreite hat eine 6800NU? Wieviel eine x1600Pro? Aha.
Ok, dann vergleicht man eben mit der 6600 GT, welche auch in den meisten Fällen schneller ist als die X1600 Pro, obwohl die 6600 GT deutlich weniger Shaderpower hat (aber immer noch ca. soviel wie eine GeForce 6800 NU).
Und die Anzahl der Transistoren ist ganz sicher kein Maß für die Leistung eines Grafikchips.

Wäre es bei einer US-Architektur eigentlich möglich, eine beliebige Anzahl an TMUs zu verbauen? Bisher hat man ja immer eine oder zwei TMUs je Pipeline, bei einer USA sollte aber der Begriff der Pipeline wegfallen. Wäre es dann bei einer USA nicht möglich, auch z.B. 25 TMUs zu verbauen?

AnarchX

2006-08-29, 21:50:42

Ok, dann vergleicht man eben mit der 6600 GT, welche auch in den meisten Fällen schneller ist als die X1600 Pro, obwohl die 6600 GT deutlich weniger Shaderpower hat (aber immer noch ca. soviel wie eine GeForce 6800 NU).
Und die Anzahl der Transistoren ist ganz sicher kein Maß für die Leistung eines Grafikchips.

Besser noch ist die 7600GS, gerade mal 21Mio Transistoren mehr als der RV530 und nimmt es trotz unterlegener Bandbreite locker mit der X1600XT auf ohne dabei an die Taktgrenzen des Prozesses zu fahren.
Da sieht man doch wie wichtig Texelleistung ist und das RV530 doch ein ziemlicher Schuss in den Ofen war.

Wäre es bei einer US-Architektur eigentlich möglich, eine beliebige Anzahl an TMUs zu verbauen? Bisher hat man ja immer eine oder zwei TMUs je Pipeline, bei einer USA sollte aber der Begriff der Pipeline wegfallen. Wäre es dann bei einer USA nicht möglich, auch z.B. 25 TMUs zu verbauen?

Das ist bei ATI jetzt schon möglich, da ALUs und TMUs entkoppelt sind

Spasstiger

2006-08-29, 21:58:08

Besser noch ist die 7600GS, gerade mal 21Mio Transistoren mehr als der RV530 und nimmt es trotz unterlegener Bandbreite locker mit der X1600XT auf ohne dabei an die Taktgrenzen des Prozesses zu fahren.
Da sieht man doch wie wichtig Texelleistung ist und das RV530 doch ein ziemlicher Schuss in den Ofen war.
Auch ein guter Vergleich. Wobei die 7600 GS bei MADD eine höhere arithmetische Leistung als die X1600 Pro hat (oder muss man da noch irgendwelche Mini-ALU-Geschichten bei ATI bedenken?).

Gast

2006-08-29, 22:01:57

Das ist bei ATI jetzt schon möglich, da ALUs und TMUs entkoppelt sind

Ne isses nich. Zumindest nicht mit erheblichen Aufwand. Es sind immer noch ganze Funktionsblöcke entweder 3:1 oder 1:1.

Es ist zwar funktional entkoppelt aber nicht im Design.

Gasthaus

2006-08-29, 23:28:34

Es wird ja immer behauptet die Max.Poly-Anzahl ist schon lange nicht mehr limitierend.Trotzdem ruckelt es bekantlich gerade dann in Spielen wenn die Geometrie sprunghaft ansteigt.

Liegt es nun daran das die Texelleistung schnell an ihre Grenzen gerät da im worst case bei hoher Geometrie auch viele Texturen(Texel) mit allen"Schichten"wie Shadomaps,Specular(zählt Bump/Offset auch dazu?) usw.berechnen muss?

Oder liegt das an der Ineffizienz der Quad-Berechnung bei vielen kleinen Polygonen?
Sie sind ja gerade bei grossen Flächen effektiv,dumm nur das es schwierig wird wirklich viele grosse Polys darzustellen.

Das Aliasingproblem bei vielen kleinen Dreieken ist dann wieder eine andere Geschichte...wahrscheinlich wäre MSAA in diesem Fall gar nicht mehr soviel billiger als SSAA,oder?

Neomi

2006-08-29, 23:48:50

Imho muss das sein. Durch noch mehr ALUs lässt sich die Leistung bestimmt nicht mehr stark steigern, oder? Der R580 dürfte schon mehr als genug arithmetische Power haben.
Speicherbandbreite ist dank GDDR4 genug da, die Effizienz stimmt bei ATI, der Chiptakt wird wahrscheinlich auch nicht so viel höher sein.

Nur, weil es für jetzige Spiele locker reicht, ist es noch lange nicht genug. Es wird niemals genug Rechenpower oder genug Bandbreite geben.

Banshee18

2006-08-30, 00:20:43

Nur, weil es für jetzige Spiele locker reicht, ist es noch lange nicht genug. Es wird niemals genug Rechenpower oder genug Bandbreite geben.
Klar, aber ist bei der X1950XT nicht die Texelfüllrate der Flaschenhals?

Neomi

2006-08-30, 00:46:55

Klar, aber ist bei der X1950XT nicht die Texelfüllrate der Flaschenhals?

Mal ja, mal nein, abhängig vom jeweiligen Einsatzgebiet. Eine allgemeine Antwort auf so eine Frage gibt es nicht.

Raff

2006-08-30, 01:20:25

Wenn man HQ-AF und Q-AAA (= Einsatzgebiet von High-End) nutzt, ganz sicher. ;)

MfG,
Raff

Banshee18

2006-08-30, 01:53:49

Mal ja, mal nein, abhängig vom jeweiligen Einsatzgebiet. Eine allgemeine Antwort auf so eine Frage gibt es nicht.
Stört dich nur die Verallgemeinerung, oder liege ich wirklich total falsch?
Verglichen mit z.B. der 7900GTX hat die X1950XT eine gigantische Speicherbandbreite und Shaderpower, aber nur sehr wenig Texelfüllrate. Oder geht der G71 wirklich so ineffektiv mit der Füllrate um, dass sich das egalisiert?

"In den meisten Fällen ist die Texelfüllrate bei der X1950XT der limitierende Faktor, aber sicher nicht immer. (Bei aktuellen Spielen und Spielen naher Zukunft)" <- Besser so? €: Und mit Bildqualitätsverbessernden Features.

=Floi=

2006-08-30, 03:50:00

und was limitiert dann bei der 7900GTX von NV O_o ?

der unterschied zwischen der X800XT PE und der X1900XT betragen eben nicht mal 20%
deshalb auch die frage weil pixel und texel leistung bei ATI hier nicht gesteigert haben aber die grafikleistung doch eklatant angestiegen ist

Palpatin

2006-08-30, 04:05:59

Wird zeit für nen 3D Moni sagen wir mal in 1000x1000x1000 damit wir mal merken wie lame die Grakas sind.

Gast

2006-08-30, 11:03:10

Stört dich nur die Verallgemeinerung, oder liege ich wirklich total falsch?
Verglichen mit z.B. der 7900GTX hat die X1950XT eine gigantische Speicherbandbreite und Shaderpower, aber nur sehr wenig Texelfüllrate. Oder geht der G71 wirklich so ineffektiv mit der Füllrate um, dass sich das egalisiert?

"In den meisten Fällen ist die Texelfüllrate bei der X1950XT der limitierende Faktor, aber sicher nicht immer. (Bei aktuellen Spielen und Spielen naher Zukunft)" <- Besser so? €: Und mit Bildqualitätsverbessernden Features.

zu: ja, kann man schon so sehen man sollt aber beachten dass:

zu 2.: es nicht DEN limitierenden Faktor gibt, sondern Einheiten, die abhängig von der zu bewältigenden Aufgabe mal mehr und mal weniger für Verzögerungen sorgen. Das sind aber nicht immer die gleichen Einheiten.

robbitop

2006-08-30, 14:20:18

und was limitiert dann bei der 7900GTX von NV O_o ?

der unterschied zwischen der X800XT PE und der X1900XT betragen eben nicht mal 20%
deshalb auch die frage weil pixel und texel leistung bei ATI hier nicht gesteigert haben aber die grafikleistung doch eklatant angestiegen ist
Bandbreite stieg enorm, die Caches wurden drastisch besser, der Speichercontroller ebenfalls. Dadurch erhöt sich auch die effektive Füllrate. Und klar die Pixelshaderleistung wurde mehr als verdreifacht.

AnarchX

2006-08-30, 15:46:20

Hier mal ein gutes Beispiel für eine Limitierung der Texel-Leistung:
Serious Sam 2
1280x960 4xAA(TR-AA/AAA)/16xAF:
http://img99.imageshack.us/img99/8664/1mf0.png
http://www.computerbase.de/artikel/hardware/grafikkarten/2006/test_ati_radeon_x1950_xtx_x1950_crossfire/18/#abschnitt_serious_sam_2

Zwar limitiert in diesem Setting schon leicht die Bandbreite, aber generell skaliert die Performance doch sehr gut mit der Texelleistung 7900GTX(15600 MTex/s) zu 7950GX2(24000 MTex/s) oder X1300Pro(2400MTex/s) zu X1600Pro(2000MTex/s) .

robbitop

2006-08-30, 15:55:02

Noch mehr mit der Texelleistung würde es skalieren, wenn nur AF anwähre und dafür eine höhere Auflösung. Ansonsten ist UT04 ein Fall von Texellimitierung (wenn die CPU Limitierung überwunden ist).

Gast

2006-08-30, 16:02:05

.....
Zwar limitiert in diesem Setting schon leicht die Bandbreite, aber generell skaliert die Performance doch sehr gut mit der Texelleistung 7900GTX(15600 MTex/s) zu 7950GX2(24000 MTex/s) oder X1300Pro(2400MTex/s) zu X1600Pro(2000MTex/s) .

Also hier ist einfach ales zu spät, man redet mit einer Wand.

AnarchX

2006-08-30, 16:04:13

Also hier ist einfach ales zu spät, man redet mit einer Wand.

:confused:

Raff

2006-08-30, 18:57:25

Noch mehr mit der Texelleistung würde es skalieren, wenn nur AF anwähre und dafür eine höhere Auflösung. Ansonsten ist UT04 ein Fall von Texellimitierung (wenn die CPU Limitierung überwunden ist).

Wenn du es so willst, dann ist jedes ältere Spiel Texel-limitiert. Die Füllrate war ja früher nicht umsonst der wichtigste Faktor zur Messung der Leistung einer Grafikkarte.

MfG,
Raff

deekey777

2006-08-31, 19:21:54

Das ist bei ATI jetzt schon möglich, da ALUs und TMUs entkoppelt sind
Such mal nach "stall".:)
Sie sind nicht entkoppelt, sondern über den Dispatcher* miteinander verknüpft.
Eine "ATi-Pipeline" ist TMU-Quad<->Dispatcher->3xALU-Quads (3:1-Design). Die Entkopplung bedeutet, dass die PS-ALUs und die TMUs voneinander getrennt rechnen können: Während auf der TMU-Ebene ein Quad seine Texturen bekommt, werden andere 3 in den drei PS-ALU-Quads bearbeitet.

Bei nVidia sind TMUs und ALUs Nr. 1 und ALUs Nr. 2 aneinander gekoppelt, sie arbeiten immer nacheinander das einzelne Quad ab.

*R520 und R580 haben 4 Dispatcher mit unterschiedlichen "Thread"-Größen (4x4 bzw. 4x12) mit je 4 TMUs und 4 bzw. 12 PS-ALUs.

G A S T

2011-03-20, 18:53:09

*altenfredausgrab*

Mich treibt seit geraumer Zeit - eigentlich schon seit der 200er-Serie von Nvidia und jüngst wieder angeregt durch diesen Thread (http://www.forum-3dcenter.org/vbulletin/showthread.php?t=501868) und den Launch der 550 Ti - eine relevante Grundsatzfrage um;

Wie wichtig ist heutzutage das Kriterium der Pixel- und vor allem der Texturierleistung bei modernen Grafikchips in Games und Anwendungen?

Kurzübersicht einiger ausgewählter Chips:
8800 Ultra (G80): 39,2 GTexel/s, 14,7 GPixel/s
GTS 250 (G92b): 47,2 GTexel/s, 11,8 GPixel/s
GTX 285 (GT200b): 51,8 GTexel/s, 20,7 GPixel/s
GTX 480 (GF100): 42,0 GTexel/s, 21,0 GPixel/s
GTX 580 (GF110): 49,4 GTexel/s, 24,7 GPixel/s
GTX 550 Ti (GF116): 28,8 GTexel/s, 14,4 GPixel/s

Aus der o. g. Grundsatzfrage ergibt sich natürlich unweigerliche eine ergänzende Fragestellung:

Welche weitere Entwicklung ist hier künftig bei der Texel- und Pixelkapazität zu erwarten bzw. wäre demnach wünschenswert?

Liebe "3DC-Gurus" :wink:, ich bin sehr gespannt auf eure Antworten und aufschlussreiche Diskussionen!

=Floi=

2011-03-20, 19:10:23

solltest die liste auch auf ati karten erweitern. bei denen ging es imho viel linearer nach oben.

G A S T

2011-03-20, 19:32:04

solltest die liste auch auf ati karten erweitern. bei denen ging es imho viel linearer nach oben.

Du hast zwar recht damit, aber dann mach es doch einfach selber. :P
Ich habe übrigens genau aus diesem Grund die GF-Karten genommen.
Die GTS 250 ist beispielsweise ein beachtenswerter Ausreißer bei der Texturierleistung.

Meine Frage ist doch sowieso grundsätzlicher Natur. Ob da nun ATI-Karten mit bei sind oder nicht ist aus meiner Sicht daher völlig Hupe.
Also, wenn du nicht zu faul bist, dann klatsch' ruhig noch ein paar AMD-Karten hier hin. ;)

G A S T

2011-03-21, 18:02:09

Mkay, dieser Thread wird irgendwie nicht so wahrgenommen wie erhofft...

Dann eben doch noch 'n paar Radeons;

Kärtchen |GP/s GT/s
Radeon HD 2900 XT |11,8 11,8
Radeon HD 3870 12,4 12,4
Radeon HD 4890 13,6 34,0
Radeon HD 5870 27,2 68,0
Radeon HD 6970 28,2 84,5

Hier fällt vor allem auf, das AMD die Texelfüllrate massiv gesteigert hat.
Ist das also tatsächlich aktuell ein Schwachpunkt bei NVidia?

PCGH_Carsten

2011-03-21, 23:16:47

Wenn eine TMU-lastige Anwendung läuft, kann das durchaus sein. Aktuelles Beispiel könnte die Ambient-Occlusion-Methode in Dragon Age 2 sein. Da lässt AMD-Hardware Nvidias Geforces ganz schön doof aus der Wäsche gucken.

Blaire

2011-03-21, 23:58:22

Wenn eine TMU-lastige Anwendung läuft, kann das durchaus sein. Aktuelles Beispiel könnte die Ambient-Occlusion-Methode in Dragon Age 2 sein. Da lässt AMD-Hardware Nvidias Geforces ganz schön doof aus der Wäsche gucken.

http://forums.nvidia.com/index.php?showtopic=194951&view=findpost&p=1210890 :wink:

PCGH_Carsten

2011-03-22, 00:04:32

Was hat die schlecht Auslastung bei 3-Wege-SLI damit zu tun?

Blaire

2011-03-22, 00:08:35

Was hat die schlecht Auslastung bei 3-Wege-SLI damit zu tun?

"The next driver release will give better performance with DA2 over 267.59."
Wo liest du da was von 3-Wege SLI? :confused:

PCGH_Carsten

2011-03-22, 00:11:43

Im Thread-Titel „Dragon Age 2 DX11 *TERRIBLE PERFORMANCE ON NVIDIA* 480 3-way SLI”? Eben ist er bei mir außerdem nicht zum markierten Posting gesprungen, sondern oben bei #261 hängengeblieben.

Mal sehen, was Nvidia da noch reißen kann – und vor allem wie…

Coda

2011-03-22, 00:45:28

*altenfredausgrab*

Mich treibt seit geraumer Zeit - eigentlich schon seit der 200er-Serie von Nvidia und jüngst wieder angeregt durch diesen Thread (http://www.forum-3dcenter.org/vbulletin/showthread.php?t=501868) und den Launch der 550 Ti - eine relevante Grundsatzfrage um;

Wie wichtig ist heutzutage das Kriterium der Pixel- und vor allem der Texturierleistung bei modernen Grafikchips in Games und Anwendungen?

Kurzübersicht einiger ausgewählter Chips:
8800 Ultra (G80): 39,2 GTexel/s, 14,7 GPixel/s
GTS 250 (G92b): 47,2 GTexel/s, 11,8 GPixel/s
GTX 285 (GT200b): 51,8 GTexel/s, 20,7 GPixel/s
GTX 480 (GF100): 42,0 GTexel/s, 21,0 GPixel/s
GTX 580 (GF110): 49,4 GTexel/s, 24,7 GPixel/s
GTX 550 Ti (GF116): 28,8 GTexel/s, 14,4 GPixel/s

Aus der o. g. Grundsatzfrage ergibt sich natürlich unweigerliche eine ergänzende Fragestellung:

Welche weitere Entwicklung ist hier künftig bei der Texel- und Pixelkapazität zu erwarten bzw. wäre demnach wünschenswert?

Liebe "3DC-Gurus" :wink:, ich bin sehr gespannt auf eure Antworten und aufschlussreiche Diskussionen!
Die rohen Füllraten-Zahlen spielen direkt überhaupt keine Rolle, soviel kann ich dir schonmal sagen.

G A S T

2011-03-26, 17:43:07

Wenn eine TMU-lastige Anwendung läuft, kann das durchaus sein. Aktuelles Beispiel könnte die Ambient-Occlusion-Methode in Dragon Age 2 sein. Da lässt AMD-Hardware Nvidias Geforces ganz schön doof aus der Wäsche gucken.

Ja, ein gutes Beispiel aber trotzdem keine Antwort.
Anders herum gefragt - wie TMU-lastig sind aktuelle und künftige Titel?
Ist das überhaupt eine allgemein relevante Größe (siehe Coda)?

schonmal sagen

Toll Coda! Es wäre allerdings schön gewesen, wenn du dieses Statement ausgeführt oder gar belegt hättest... ;(

Der Thread verläuft weiterhin sehr unbefriedigend.
Wo bleiben die Fachleute und Kenner?
Ailuros, Spasstiger, anyone??? :uwave:

PCGH_Carsten

2011-03-26, 17:47:47

Ich glaube, was du brauchst ist ein Wahrsager, kein Experte, denn auf die Frage „Anders herum gefragt - wie TMU-lastig sind aktuelle und künftige Titel?” wird dir niemand eine allgemeingültige Antwort geben können. Vielleicht solltest du deine Frage etwas präzisieren – auf spezielle Titel eingrenzen zum Beispiel.

Coda hat mit seiner Aussage allerdings schonmal recht. :freak: Es ist viel wichtiger, wie effizient die vorhandene Rohleistung genutzt werden kann, als die schiere Menge, die man in einen Chip packen kann.

Wäre es anders, müssten die Radeons meilenweit vor jeder Geforce liegen. 50% mehr TMUs im SGPU-Topmodell und 14% mehr Takt.

G A S T

2011-03-26, 18:04:48

Ney. Ich suche garantiert kein Orakel.

Ich will lediglich wissen welche Rolle Pixel- und Texelfüllrate grundsätzlich einnehmen.
Eben nicht eingegrenzt auf einen bestimmten Titel X.
Um dies zu veranschaulichen ist es notwendig die Entwicklung zu betrachten.
Das gilt sowohl für die Hard- als auch für die Software. Die Frage ist also legitim.

Natürlich hat Coda recht. Unbestritten. Dass sich beispielsweise die Texelleistung in der Regel nicht linear auswirkt, war mir bereits bei meinem ersten Post hier klar.

Mein bisheriger Kenntnisstand ist, dass die Pixel-und Texel-Rohdaten zu den Chips für sich genommen eine untergeordnete Rolle bei der Leistungsfähigkeit insgesamt spielen,
andererseits ist es nicht so (und kann ich mir nicht vorstellen), dass sie überhaupt keine Rolle spielen.
Doch genau diesen letztgenannten Einschlag hat - für mich - Codas Post.

PCGH_Carsten

2011-03-26, 18:07:38

Wie gesagt, die theoretischen Maximaldurchsätze sind eher unwichtig – sonst würde Fermi gegen die aktuelle Radeon-Riege total untergehen: Meilenweit hinterher bei der Texelfüllrate, ebenso bei den Pixeln (nein, die 48 ROPs helfen da nicht).

boxleitnerb

2011-08-08, 00:51:55

Wie gesagt, die theoretischen Maximaldurchsätze sind eher unwichtig – sonst würde Fermi gegen die aktuelle Radeon-Riege total untergehen: Meilenweit hinterher bei der Texelfüllrate, ebenso bei den Pixeln (nein, die 48 ROPs helfen da nicht).

*Thread ausgrab*

Und warum nicht?

y33H@

2011-08-08, 11:34:31

Die Pixelfüllrate wird bei den Fermis nicht klassisch durch die ROPs limitiert (erst, wenn viel FP16 oder FP32 berechnet wird, da die ROPs hier zwei bzw. vier Takte benötigen), sondern durch die Anzahl der SMs. Daher erreicht die GTX 580 bei 772 MHz und 48 ROPs "dank" ihrer 16 SMs auch nur 24,7 GPix/s, denn ein SM kann pro Takt nur zwei Pixel verarbeiten (0,772 GHz * 16 SMs * 2 Pixel/Takt). Die "übrigen" ROPs können zB bei Kantenglättung in die Bresche springen, denn bei rechnerischen 37,1 GPix/s haben die noch genug Luft.

boxleitnerb

2011-08-08, 11:53:29

Sehr interessante Info, danke :)

Coda

2011-08-08, 16:33:16

Die "übrigen" ROPs können zB bei Kantenglättung in die Bresche springen, denn bei rechnerischen 37,1 GPix/s haben die noch genug Luft.
Das klingt so, als würdest du glauben, dass die SMs die ROP-Aufgaben direkt übernehmen. Dem ist nicht so.

y33H@

2011-08-08, 16:40:15

Das habe ich nicht geschrieben, ich meinte damit nur, dass eine gewisse Anzahl an ROPs keine Arbeit hat, da eben die Verarbeitung durch SMs limitiert. Die ROPs machen freilich das, was ROPs auch sonst machen. Würden die SMs die Arbeit der ROPs erledigen, bräuchte Fermi ja keine ROPs mehr :ugly:

Hübie

2011-08-12, 02:38:58

bräuchte Fermi ja keine ROPs mehr :ugly:

Klingt ja auch irgendwie einleuchtend.
Coda sollte sich mal angewöhnen diese Einsatz-Posts auszuführen. Aber er wird uns wohl eher dumm sterben lassen ;D
Ich vermute mal das es erst im nächsten/übernächsten Jahr wieder einen signifikanten Sprung geben wird, da momentan beinahe alles auf Basis der Konsolenleistung ausgelegt und entwickelt ist/wird. Für dieses Basis reicht die aktuelle Hardware bis runter ins mittlere Preissegment (BQ-Fetischisten mal aussen vor ;)).

Wenn man sich so einige Videos von der Siggraph 2011 anschaut hat man das Gefühl wir leben in den 80er Jahren.
Bis wirklich fotorealistisches Echtzeitrendering flüssig läuft vergehen vllt. noch 10-20 Jahre, in denen noch fleißig die Texel-/Pixelleistung gesteigert werden kann. Wir Endkunden werden ohne hin nur mit der Salamitaktik abgespeist.

Spätestens wenn die gesamte Erde bekannte Galaxie fotorealistisch simuliert werden kann ist das Maximum erreicht ;D

LG Hübie
...der um ehrlich zu sein nicht versteht welche Antwort du erwartest (vor allem welchen Zeitraum du betrachtest).