PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : ATI Radeon 9600XT - Hierarchial-Z fehlt - welche Konsequenzen?


Rampage 2
2003-10-06, 18:13:22
Hallo Freunde,

Im Gegensatz zur 9500Pro hat die gesamte 9600 Produktreihe kein Hierarchial-Z. Welche Konsequenzen hat dies auf die Performance - vor allem in NextGen Games wie etwa Doom3 oder HL2?
Ich stelle diese Frage, weil ich vorhabe, mir in den nächsten Monaten eine Grafikkarte zu kaufen, und zwar von ATI. Ich hatte im Kopf mir eine 9500Pro zu kaufen aber die gibt es nicht mehr zu kaufen, und wenn doch, dann in Markennamen die mich nicht interressieren (I werde nur von Sapphire, Hercules und (seit neuem:D) ASUS kaufen). Daher überlege ich mir den Kauf einer 9600XT, welche in wenigen Wochen erscheinen müsste. Da diese Karte Taktraten von 500+/300+ MHz haben wird, glaube ich dass sie vielleicht mit der 9500 Pro mithalten könnte, da ihre Füllrate dann fast genauso hoch ist wie die der 9500Pro - selbiges für den Vertex Shader Output. Das einzige, was mir Kopfzerbrechen bereitet ist dieses Hierarchial-Z welches wohl auch die 9600XT nicht haben wird. Also, welche Konsequenzen für die Performance kann das Fehlen von diesem Feature in Doom3 oder HL2 und in zukünftigen Spielen haben?

Thanks, R2

reunion
2003-10-06, 18:21:32
Original geschrieben von Rampage 2
Hallo Freunde,

Im Gegensatz zur 9500Pro hat die gesamte 9600 Produktreihe kein Hierarchial-Z. Welche Konsequenzen hat dies auf die Performance - vor allem in NextGen Games wie etwa Doom3 oder HL2?
Ich stelle diese Frage, weil ich vorhabe, mir in den nächsten Monaten eine Grafikkarte zu kaufen, und zwar von ATI. Ich hatte im Kopf mir eine 9500Pro zu kaufen aber die gibt es nicht mehr zu kaufen, und wenn doch, dann in Markennamen die mich nicht interressieren (I werde nur von Sapphire, Hercules und (seit neuem:D) ASUS kaufen). Daher überlege ich mir den Kauf einer 9600XT, welche in wenigen Wochen erscheinen müsste. Da diese Karte Taktraten von 500+/300+ MHz haben wird, glaube ich dass sie vielleicht mit der 9500 Pro mithalten könnte, da ihre Füllrate dann fast genauso hoch ist wie die der 9500Pro - selbiges für den Vertex Shader Output. Das einzige, was mir Kopfzerbrechen bereitet ist dieses Hierarchial-Z welches wohl auch die 9600XT nicht haben wird. Also, welche Konsequenzen für die Performance kann das Fehlen von diesem Feature in Doom3 oder HL2 und in zukünftigen Spielen haben?

Thanks, R2

Also ich glaube die 9600XT wird die 9500pro wohl in jeder hinsicht überholen...

Denn du darfst dabei zum einen nicht vergessen das ein Chip mit 4 Pixelpipelines und 550mhz wesentlich effektiver arbeitet als einer mit 8 Pixelpipelines und 275mhz Takt, da bei Dreiecken die kleiner als acht Pixel sind einige Pipelines im Leerlauf sind...

Außerdem dürfte auch die Spechertakt bei mindestens 300mhz liegen und somit über der 9500pro mit 270mhz.

Und da selbst die 9600pro nur max. 10% hinter der 9500 pro liegt und die 9600XT mindestens +25% Chiptakt haben wird schätze ich doch eine Leistungssteigerung von ca. 10%-15% für realistisch....

mfg
reu

ow
2003-10-06, 18:26:22
Original geschrieben von Rampage 2
Hallo Freunde,

Im Gegensatz zur 9500Pro hat die gesamte 9600 Produktreihe kein Hierarchial-Z. Welche Konsequenzen hat dies auf die Performance - vor allem in NextGen Games wie etwa Doom3 oder HL2?
Ich stelle diese Frage, weil ich vorhabe, mir in den nächsten Monaten eine Grafikkarte zu kaufen, und zwar von ATI. Ich hatte im Kopf mir eine 9500Pro zu kaufen aber die gibt es nicht mehr zu kaufen, und wenn doch, dann in Markennamen die mich nicht interressieren (I werde nur von Sapphire, Hercules und (seit neuem:D) ASUS kaufen). Daher überlege ich mir den Kauf einer 9600XT, welche in wenigen Wochen erscheinen müsste. Da diese Karte Taktraten von 500+/300+ MHz haben wird, glaube ich dass sie vielleicht mit der 9500 Pro mithalten könnte, da ihre Füllrate dann fast genauso hoch ist wie die der 9500Pro - selbiges für den Vertex Shader Output. Das einzige, was mir Kopfzerbrechen bereitet ist dieses Hierarchial-Z welches wohl auch die 9600XT nicht haben wird. Also, welche Konsequenzen für die Performance kann das Fehlen von diesem Feature in Doom3 oder HL2 und in zukünftigen Spielen haben?

Thanks, R2

Das Fehlen von HierZ wird nicht viel ausmachen, sonst hätte man das wohl kaum weggelassen.
Für 9500Pro Leistung wird´s wohl auch bei 500Mz Chiptakt nicht ganz reichen denke ich.

Rampage 2
2003-10-06, 18:28:44
Original geschrieben von reunion
Also ich glaube die 9600XT wird die 9500pro wohl in jeder hinsicht überholen...

Denn du darfst dabei zum einen nicht vergessen das ein Chip mit 4 Pixelpipelines und 550mhz wesentlich effektiver arbeitet als einer mit 8 Pixelpipelines und 275mhz Takt, da bei Dreiecken die kleiner als acht Pixel sind einige Pipelines im Leerlauf sind...

Außerdem dürfte auch die Spechertakt bei mindestens 300mhz liegen und somit über der 9500pro mit 270mhz.

Und da selbst die 9600pro nur max. 10% hinter der 9500 pro liegt und die 9600XT mindestens +25% Chiptakt haben wird schätze ich doch eine Leistungssteigerung von ca. 10%-15% für realistisch....

mfg
reu

Ähem, bei Firingsquad und Anandtech war eine normal getaktete 9500Pro 80% (!!!) schneller in UT2003 flyby (1600x1200x32Bit 4xAA+16xAF(tri)) als eine 9600Pro und 35% schneller als eine übertaktete(547/347 MHz) 9600Pro!
Das heißt, obwohl die übertaktete 9600Pro die selbe Füllrate hatte (4x547MHz = 2188 Mpixel/texel zu 2200 Mpixel/texel) und zusätzlich noch 20% höherem Speichertakt lief war die 9500Pro 35% schneller - das ist extrem! - Da kann nur das Fehlen von Hierarchial-Z dran schuld sein, denn etwas anderes fehlt ja nicht.

reunion
2003-10-06, 18:32:34
Original geschrieben von Rampage 2
Ähem, bei Firingsquad und Anandtech war eine normal getaktete 9500Pro 80% (!!!) schneller in UT2003 flyby (1600x1200x32Bit 4xAA+16xAF(tri)) als eine 9600Pro und 35% schneller als eine übertaktete(547/347 MHz) 9600Pro!
Das heißt, obwohl die übertaktete 9600Pro die selbe Füllrate hatte (4x547MHz = 2188 Mpixel/texel zu 2200 Mpixel/texel) und zusätzlich noch 20% höherem Speichertakt lief war die 9500Pro 35% schneller - das ist extrem! - Da kann nur das Fehlen von Hierarchial-Z dran schuld sein, denn etwas anderes fehlt ja nicht.

Jaja die Flybys :D
Ganz davon abgesehen das der Test völlig realitätsfremd ist, glaube ich eher das da die 2 fehlenden Vertexshadereinheiter der 9500pro den Unterschied ausgemacht haben...

ow
2003-10-06, 18:32:41
Original geschrieben von Rampage 2
Da kann nur das Fehlen von Hierarchial-Z dran schuld sein, denn etwas anderes fehlt ja nicht.

35% macht HierZ nicht aus. Höchstens in synthetisch konstruierten Fällen. Ich würde mal tippen, das es so 10-15% Leistung kostet im praktischen Betrieb.

Aquaschaf
2003-10-06, 18:34:06
Es fehlt ja auch die Hälfte der VS Einheiten gegenüber dem R300. Trotzdem, ich fände mal einen RV350 mit 256bit Speicheranbindung interessant :D

ow
2003-10-06, 18:35:18
Original geschrieben von reunion
Jaja die Flybys :D
Ganz davon abgesehen das der Test völlig realitätsfremd ist, glaube ich eher das da die 2 fehlenden Vertexshadereinheiter der 9500pro den Unterschied ausgemacht haben...

Vertexshader in UT2003? Vergiss das lieber. Da ist nicht viel an VS drin.
Ausserdem gibt es eh keine Games, die durch die Geometrieverarbeitung limitiert sind. Da limitiert immer der Rasterizer (Füllrate!).

reunion
2003-10-06, 18:39:15
Original geschrieben von ow
Vertexshader in UT2003? Vergiss das lieber. Da ist nicht viel an VS drin.
Ausserdem gibt es eh keine Games, die durch die Geometrieverarbeitung limitiert sind. Da limitiert immer der Rasterizer (Füllrate!).

An was solls denn sonst liegen ???
Eine auf 550mhz getacktete 9600pro mit 340mhz Speichertakt müsste in einer Auflösung von 1600x1200 mit 4x AA und 16x tri AF (speziell auch wegen der höheren Speicherbandbreite)normalerweise einer 9500pro in jeder hinsicht überlegen sein...

Rampage 2
2003-10-06, 18:41:43
Original geschrieben von reunion
Jaja die Flybys :D
Ganz davon abgesehen das der Test völlig realitätsfremd ist, glaube ich eher das da die 2 fehlenden Vertexshadereinheiter der 9500pro den Unterschied ausgemacht haben...

Die Vertex Engines?

Bei ausreichend hohen Taktraten hat die 9600 Pro dieselbe Vertexpower wie die 9500Pro:

9500Pro: 275MHz x 4 VertexEngines = 275 megavertices/sec.
9600Pro: 400MHz x 2 VertexEngines = 200 megavertices/sec.
9600Pro @550MHz x 2 VertexEngines = 275 megavertices/sec.

Und die übertaktete 9600Pro bei Firingsquad hatte 547MHz Takt, also damit etwa 270 megavertices/sec. - also fast gleich mit der 9500Pro. Also kann es auch nicht am VertexOutput liegen, dass die 9600Pro so schlect gegen die 9500Pro abschneidet. Und UT2003 war ja auch nur ein Beispiel:D

ow
2003-10-06, 18:56:52
Original geschrieben von Rampage 2
Die Vertex Engines?

Bei ausreichend hohen Taktraten hat die 9600 Pro dieselbe Vertexpower wie die 9500Pro:

9500Pro: 275MHz x 4 VertexEngines = 275 megavertices/sec.
9600Pro: 400MHz x 2 VertexEngines = 200 megavertices/sec.
9600Pro @550MHz x 2 VertexEngines = 275 megavertices/sec.

Und die übertaktete 9600Pro bei Firingsquad hatte 547MHz Takt, also damit etwa 270 megavertices/sec. - also fast gleich mit der 9500Pro. Also kann es auch nicht am VertexOutput liegen, dass die 9600Pro so schlect gegen die 9500Pro abschneidet. Und UT2003 war ja auch nur ein Beispiel:D

An VS liegt´s eh nicht, oder denkt hier einer, das Spiel würde sich überhaupt auf HWVS-losen Karten spielen lassen, wenn bei einer R9600 der VS hier limitieren sollte?? Denkt mal nach.
Es sind noch mehr als genug Karten ohne VS oder HWTL im Umlauf.

Rampage 2
2003-10-06, 19:04:09
Original geschrieben von ow
An VS liegt´s eh nicht, oder denkt hier einer, das Spiel würde sich überhaupt auf HWVS-losen Karten spielen lassen, wenn bei einer R9600 der VS hier limitieren sollte?? Denkt mal nach.
Es sind noch mehr als genug Karten ohne VS oder HWTL im Umlauf.

Woran liegt es dann?

ow
2003-10-06, 20:06:35
Original geschrieben von Rampage 2
Woran liegt es dann?

Wenn ich´s wüsste hätte ich dazu was geschrieben. Hab keine Ahnung.

Rampage 2
2003-10-06, 20:08:53
Original geschrieben von ow
Wenn ich´s wüsste hätte ich dazu was geschrieben. Hab keine Ahnung.

Liegt's vielleicht daran, dass 8 pipelines mit 275MHz effektiver sind als 4 pipelines mit 550MHz (also trotz theoretisch gleich hoher Füllrate) ?

Aquaschaf
2003-10-06, 20:31:31
Theoretisch wäre es genau umgekehrt.

reunion
2003-10-06, 20:34:17
Original geschrieben von Rampage 2
Liegt's vielleicht daran, dass 8 pipelines mit 275MHz effektiver sind als 4 pipelines mit 550MHz (also trotz theoretisch gleich hoher Füllrate) ?

Nein, theoretisch müsste 4 pipelines mit 550mhz wesentlich effektiver sein als 8 mit 275mhz...

Riptor
2003-10-06, 20:34:32
Original geschrieben von Aquaschaf
Theoretisch wäre es genau umgekehrt.

Ganz meine Meinung...

Quasar
2003-10-06, 20:36:36
Wenn allein die Füllrate limitiert, kannst du bei aufwendig gestalteten Leveln noch einmal eine Menge Holz durch HierZ sparen...

Meine Werte (R9600p FBE/R9500p):
27 zu 44 (bei 2xAA/4xAF, 16x12x3, CP-AF)
40 zu 52 (bei 4xAA/8xAF, 16x12x3, CP-AF)

Scheint so, als ginge der 4 Pipe-Version mit viel AF schneller die Puste aus.

Gründe:
- HierZ senkt die Belastung der R9500p
- AF erhöht die Füllratenansprüche
- 4xAA braucht 2 Durchläufe durch die AA-Einheiten, wovon die 8 Pipe-Version doppelt soviele hat...

Rampage 2
2003-10-06, 21:52:03
Original geschrieben von Quasar
Wenn allein die Füllrate limitiert, kannst du bei aufwendig gestalteten Leveln noch einmal eine Menge Holz durch HierZ sparen...

Meine Werte (R9600p FBE/R9500p):
27 zu 44 (bei 2xAA/4xAF, 16x12x3, CP-AF)
40 zu 52 (bei 4xAA/8xAF, 16x12x3, CP-AF)

Scheint so, als ginge der 4 Pipe-Version mit viel AF schneller die Puste aus.

Gründe:
- HierZ senkt die Belastung der R9500p
- AF erhöht die Füllratenansprüche
- 4xAA braucht 2 Durchläufe durch die AA-Einheiten, wovon die 8 Pipe-Version doppelt soviele hat...

Und welche Performance kann man von einer 9600XT erwarten wenn sie mit einem Takt von sagen wir... 550/700 MHz
in die Läden kommt? Kann sie mit diesen Taktraten eine 9500Pro besiegen?

LovesuckZ
2003-10-06, 21:54:53
Original geschrieben von Rampage 2
Und welche Performance kann man von einer 9600XT erwarten wenn sie mit einem Takt von sagen wir... 550/700 MHz
in die Läden kommt? Kann sie mit diesen Taktraten eine 9500Pro besiegen?

Die 9600XT hat nen 25% hoeherem Coretakt. Da anscheinend keine Verbesserungen vorgenommen wurden sind, sollte sich das ergebnis leicht errechnen laessen.

Quasar
2003-10-06, 21:55:53
Es wird immer Situationen geben, wo die R9500p besser abschneidet.

Aber im Großen und ganzen würde ich 550/350MHz schon als gleichwertig zur R9500p einschätzen. Ohne Garantie...

aths
2003-10-06, 22:47:36
Original geschrieben von Quasar
- 4xAA braucht 2 Durchläufe durch die AA-Einheiten, wovon die 8 Pipe-Version doppelt soviele hat... Jain, sofern das Multitexturing-Level hoch genug ist, oder auch nur höhere AF-Grade zum Tragen kommen, ist durch die 2 ROPs pro Pipe eigentlich keine Beeinträchtigung der AA-Füllrate zu erwarten.

Quasar
2003-10-06, 23:21:05
Original geschrieben von aths
Jain, sofern das Multitexturing-Level hoch genug ist, oder auch nur höhere AF-Grade zum Tragen kommen, ist durch die 2 ROPs pro Pipe eigentlich keine Beeinträchtigung der AA-Füllrate zu erwarten.

Bessere Erklärung für das beobachtete Phänomen? (P.S.: Beide Karten verfügten natürlich über 128MB lokalen RAM)

BUG
2003-10-07, 01:08:44
..einfach mal ohne AA Benchen, dann sollte die übertaktete 9600 Pro oder 9600XT eigentlich schneller sein als die 9500Pro ohne OC. ;)

cu
BUG