PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : FLOP-Leistung der unterschiedlichen Grakas


Gast
2006-12-02, 17:59:28
Ich hab mal eine Frage bezüglich der Shaderleistungen unterschiedlicher Grafikkarten.

Der R520, hat ja 16 Vec3+ Scalar Pixelshader, also sollte jede ALU etwa 12 Flops pro Takt schaffen.

Beim R580 werden die gleichen ALUs eingesetzt.

Nun zum G70/71. Ich könnte mit keiner Rechnung irgendwie erklären wieviel Flops eine ALU des G70/71 schafft. Ich komme immer etwa auf 8 Flops, wenn ich dieses Diagramm hier betrachte:
http://www.computerbase.de/artikel/hardware/grafikkarten/2006/test_nvidia_geforce_8800_gtx/2/#abschnitt_technische_daten

Welche Art von ALU verfügt der G70/G71 denn?
Vec2, Vec3 oder eine Vec4?

Und über welche ALUs verfügt der Xenos in der Xbox?
Wenn ich diese Liste betrachte versteh ich gar nichts mehr?
http://www.pcinlife.com/article_photo/g80/arts/specs_compare.png

Anscheinend ist diese Liste falsch...

Danke im Vorraus

Spasstiger
2006-12-02, 18:37:39
G70 hat 24 VEC4-Alus, die 16 Flops je Takt können, bzw. 48 VEC4-Alus mit 8 Flops je Takt (je nach Ansichtsweise, ich bevorzuge die erste Variante wegen der Special Functions/SFUs, die nicht von beiden Shader-Teil-ALUs gleichermaßen geboten werden).

deekey777
2006-12-02, 20:39:08
Xenos hat Vec4+Scalar-ALUs mit je 9 FLOP.
http://www.beyond3d.com/articles/xenos/index.php?p=07
Zum Aufbau der G70-ALUs im Pixelteil:
Again, like NV40 the ALU's are FP32 precision, with a free FP16 normalise on the first ALU. Each unit is a single vector unit, but can execute two instructions that fit in or below 4 components (i.e. 3+1 components, 2+2, 2+1, 1+2, 1+1). The texture processing units can perform a four sample bilinear filter in a single cycle, operating over multiple cycles for higher filtering operations, which can go up to 16x Anisotropic with either Bilinear or Trilinear filtering. The texture units also have FP16 filtering capabilities which NVIDIA say is single cycle as well and there have been performance improvements for handling larger textures. Although NVIDIA haven't spoken of it directly we have noticed from Far Cry's logs that 3Dc normal map compression was enabled by the engine, suggesting that G70's drivers exposes this FOURCC texture format*.

Gast
2006-12-02, 23:26:09
The texture units also have FP16 filtering capabilities which NVIDIA say is single cycle as well and there have been performance improvements for handling larger textures.

interessant, ich dachte immer dass ein FP16 bi-sample 2 zyklen braucht.

Der Themeneröffner
2006-12-03, 11:16:38
Okay danke für die Infos.