Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zum Artikel "nVidia NV36 Spezifikationen"
Leonidas
2003-07-21, 23:00:49
Na, endlich auch mal wieder ein Artikel bei 3DC ;-). Hier isser. (http://www.3dcenter.org/artikel/2003/07-21.php)
/edit 21.07.2003, 23:26
NV31 und NV36 sind nicht 2x2 (dies ist ein Gedankenfehler), sondern 4x1
Leonidas
2003-07-21, 23:12:08
PS: Einen allgemeinen Diskussionthread zum NV36 gibt es hier:
http://www.forum-3dcenter.org/vbulletin/showthread.php?s=&threadid=83336
Quasar
2003-07-21, 23:12:27
" insofern wird der NV36 wohl wie der NV31 mit 2 Rendering-Pipelines mit je 2 Textureneinheiten antreten, sprich die schon prognostizierte Halbierung zum entsprechenden HighEnd-Chip NV35 erfahren."
Kein 4x1-Design, wie der nV31?
Leonidas
2003-07-21, 23:19:03
NV31 ist doch auch nur 2x2, oder nicht?
Leonidas
2003-07-21, 23:20:05
Ähm, jetzt bin ich mir unsicher.
Leonidas
2003-07-21, 23:28:50
Du hast Recht, NV31 ist 4x1. Und wenn ich NV36 sinnbildlich NV31 gleichstelle, dann sollte auch NV36 4x1 sein.
Quasar
2003-07-21, 23:57:59
So, jetzt hab' ich's zur Gänze gelesen. Schöne Zusammenfassung und auch übersichtlich und gut aufbereitet, Leo!!
Inhaltlich gibt so eine Vorstellung ja leider nur wenig Ruam zu glänzen.
Salvee
2003-07-22, 00:05:26
Nice :)
Kleiner Fehler:
Zudem begünstigt die moderate Transistorenzahl (verglichen mit Radeon 9700/9800 und GeForceFX 5800/5900, welche allesamt über 100 Millionen Transistoren wiegen) einen hohen Chipsatz natürlich auch noch zusätzlich.
don_salieri
2003-07-22, 00:29:04
500 MHz Chiptakt
256 Bit DDR-Speicherinterface
325 MHz Chiptakt
Ich nehme an, es muss 325 MHz Speichertakt heissen, oder ist 325/500 der Unterschied im Chiptakt zwischen Non-Ultra und Ultra? Das käme mir doch etwas happig vor...
In der Liste steht dann 500 MHz Speichertakt...ist das korrekt?
Quasar
2003-07-22, 01:32:10
Die Chiptakte stimmen wohl so.
Die 500MHz kommen ja auch vom FX5700 und nicht von der FX5600, von daher ist der Sprung m.E. gut nachzuvollziehen.
Die 500MHz Speichertakt bei 256Bit Anbindung sind aber sicherlich ein Vertipper.
Leonidas
2003-07-22, 01:32:23
Original geschrieben von Salvee
Nice :)
Kleiner Fehler:
Zudem begünstigt die moderate Transistorenzahl (verglichen mit Radeon 9700/9800 und GeForceFX 5800/5900, welche allesamt über 100 Millionen Transistoren wiegen) einen hohen Chipsatz natürlich auch noch zusätzlich.
Gefixt.
Leonidas
2003-07-22, 01:33:03
Original geschrieben von don_salieri
500 MHz Chiptakt
256 Bit DDR-Speicherinterface
325 MHz Chiptakt
Ich nehme an, es muss 325 MHz Speichertakt heissen, oder ist 325/500 der Unterschied im Chiptakt zwischen Non-Ultra und Ultra? Das käme mir doch etwas happig vor...
In der Liste steht dann 500 MHz Speichertakt...ist das korrekt?
Nö. Gefixt.
robbitop
2003-07-22, 02:39:07
mhh also ich meine gelesen zu haben, dass der NV41 nicht so spät herauskommt (also 2HJ 2004 wäre ca 1 Jahr nach dem NV36).
Ich meine gelesen zu haben 1HJ2004. Immer passend zum High End eben nur ein paar Monate später, denn Sommer 2004 würde der NV45 wenig später der NV46 kommen, oder sehe ich das falsch?
mapel110
2003-07-22, 05:17:05
Original geschrieben von robbitop
mhh also ich meine gelesen zu haben, dass der NV41 nicht so spät herauskommt (also 2HJ 2004 wäre ca 1 Jahr nach dem NV36).
Ich meine gelesen zu haben 1HJ2004. Immer passend zum High End eben nur ein paar Monate später, denn Sommer 2004 würde der NV45 wenig später der NV46 kommen, oder sehe ich das falsch?
zum nv41 hab ich noch garnix gelesen.
hm, wenn sich das im artikel bewahrheiten sollte, haben wir ne neue technologie bremse von nvidia. den nv36 mit den ollen 2.0+ shadern :(
Endorphine
2003-07-22, 09:45:33
Original geschrieben von mapel110
zum nv41 hab ich noch garnix gelesen.
hm, wenn sich das im artikel bewahrheiten sollte, haben wir ne neue technologie bremse von nvidia. den nv36 mit den ollen 2.0+ shadern :( Dafür kann nVidia aber nichts. ATI hat nunmal diesmal den Zuschlag für die DX9 Basis bekommen.
"Technologiebremsen" wirds immer geben, solange in beiden Unternehmen annähernd das gleiche parallel entwickelt wird und Microsoft dann den kleineren Techlevel als D3D-Standard erklärt.
LovesuckZ
2003-07-22, 09:54:34
Original geschrieben von Leonidas
Du hast Recht, NV31 ist 4x1. Und wenn ich NV36 sinnbildlich NV31 gleichstelle, dann sollte auch NV36 4x1 sein.
Nicht ganz:
Xbitlabs.com (http://www.xbitlabs.com/articles/video/display/nv31-nv34_5.html):
However, GeForce FX 5600 Ultra (NV31) stands out here: when there is only one texture laid, this chip shows better results than the theoretical maximum for configurations with two pixel pipelines. Of course, with only one texture processed NV31 uses the mode with 4 pixel “pipelines” and 1 TMU per pipeline. In case there are two or more textures to be processed NV31 resorts to a different internal organization scheme: 2 pixel “pipelines” with two TMUs per pipeline.
/edit:
Alle anderen DirectX9-Chips von nVidia (NV31, NV33 und wohl auch NV36) sind allerdings gewöhnliche 4x1 Architekturen.
1. Fehlt hier der NV34, der nur eine (wenn überhaupt) 2x2 Architektur besitzt und 2. sind wie oben nachzulesen, die DX9 Chips von nvidia keine "gewöhnliche[n] 4x1 Architekturen".
Sonst, sehr gute Sammlung aller bisherigen Informationen!
Demirug
2003-07-22, 09:58:51
Original geschrieben von mapel110
zum nv41 hab ich noch garnix gelesen.
hm, wenn sich das im artikel bewahrheiten sollte, haben wir ne neue technologie bremse von nvidia. den nv36 mit den ollen 2.0+ shadern :(
Warum willst du jetzt den NV36 als Technologie Bremse bezeichnen. Die Bremser sitzen immer im Keller.
Es wird also davon abhängen durch was nvidia die 5200er ersetzt und wie bei ati der ersatz für die DX8 Karten aussehen wird.
Quasar
2003-07-22, 10:54:24
Original geschrieben von LovesuckZ
Nicht ganz:
Xbitlabs.com (http://www.xbitlabs.com/articles/video/display/nv31-nv34_5.html):
However, GeForce FX 5600 Ultra (NV31) stands out here: when there is only one texture laid, this chip shows better results than the theoretical maximum for configurations with two pixel pipelines. Of course, with only one texture processed NV31 uses the mode with 4 pixel “pipelines” and 1 TMU per pipeline. In case there are two or more textures to be processed NV31 resorts to a different internal organization scheme: 2 pixel “pipelines” with two TMUs per pipeline.
[/i]
1. Fehlt hier der NV34, der nur eine (wenn überhaupt) 2x2 Architektur besitzt und 2. sind wie oben nachzulesen, die DX9 Chips von nvidia keine "gewöhnliche[n] 4x1 Architekturen".
Öhm, und was macht eine 4x1-Architektur ggü. einer 2x2-Architektur aus? Richtig, in single-texturing Situationen kriegt man eine doppelt so hohe Füllrate, wie bei der 2x2-Lösung.
Nur, dass der nV31/34 sich nicht durchgängig wie eine 4x1-Architektur verhält, sondern bei Multitexturing auf 2x2 verschaltet wird, was bei einer ungeraden Anzahl Texturschichten von Nachteil ist.
Und wie gesagt, der nV34 macht nichts anderes, auch er ist per se keine 2x2-Architektur.
LovesuckZ
2003-07-22, 11:14:01
Original geschrieben von Quasar
Nur, dass der nV31/34 sich nicht durchgängig wie eine 4x1-Architektur verhält, sondern bei Multitexturing auf 2x2 verschaltet wird, was bei einer ungeraden Anzahl Texturschichten von Nachteil ist.
Man kann dann aber nicht von einer "4x1-Architektur" reden, wenn diese sich in vielen Situationen nur wie eine 2x2 verhaelt. Und erst recht nicht von einer "gewöhnliche[n]".
Und wie gesagt, der nV34 macht nichts anderes, auch er ist per se keine 2x2-Architektur.
Der NV34 hat kein "Hybridmodus" sondern nur eine normale 2x2 Architektur:
NVIDIA GeForce FX 5800 Ultra and GeForce FX 5200 Ultra act very similarly, which proves the supposition about their identical internal architecture, with that only difference that GeForce FX 5200 Ultra feature only 2 pixel “pipelines” with two TMUs on each.
Xbitlabs
Demirug
2003-07-22, 11:27:30
Original geschrieben von LovesuckZ
Der NV34 hat kein "Hybridmodus" sondern nur eine normale 2x2 Architektur:
NVIDIA GeForce FX 5800 Ultra and GeForce FX 5200 Ultra act very similarly, which proves the supposition about their identical internal architecture, with that only difference that GeForce FX 5200 Ultra feature only 2 pixel “pipelines” with two TMUs on each.
Xbitlabs [/SIZE]
Ja wobei noch zu ergänze wäre das beim NV34 nur einen der beiden Pipelines voll PS 2.0 fähig ist. Die andere Pipeline ist IMHO eine NV25 Pipeline. Wobei noch zu testen wären ob man im PS 2.0 Modus die beiden anderen TMUs fürs Trifilter in einem Takt nutzen kann.
Eine reine 2*2 Architektur ist der NV34 aber denoch nicht. Im 0 Texturemodus verhält er sich wie eine 4*0 Architektur.
mapel110
2003-07-22, 11:27:44
Original geschrieben von Demirug
Warum willst du jetzt den NV36 als Technologie Bremse bezeichnen. Die Bremser sitzen immer im Keller.
Es wird also davon abhängen durch was nvidia die 5200er ersetzt und wie bei ati der ersatz für die DX8 Karten aussehen wird.
hm, ja. ich spreche von nvidia. jetzt haben sie es gerade geschafft, dx9 für alle anzubieten, da wollen sie schon wieder mit der nächsten produktpalette die 3.0er shader dem oem markt vorenthalten.
das versteh ich irgendwie nicht.
Quasar
2003-07-22, 11:28:41
Original geschrieben von LovesuckZ
Man kann dann aber nicht von einer "4x1-Architektur" reden, wenn diese sich in vielen Situationen nur wie eine 2x2 verhaelt. Und erst recht nicht von einer "gewöhnliche[n]".
Bei einer geraden Anzahl an Texturschichten verhält sich jedes x*1-Design wie ein (x/2)*2-Design. Beim nV31/34 ist es nur so, das bei Multitexturing die Verschaltung nicht aufgehoben wird (wahrscheinlich aus internen Caching-Gründen).
Willst du nun sagen, ein R300 sei "eigentlich" auch nur ein 4x2, 2x3+2x1 oder gar 2x4-Design?
Original geschrieben von LovesuckZ
Der NV34 hat kein "Hybridmodus" sondern nur eine normale 2x2 Architektur:
NVIDIA GeForce FX 5800 Ultra and GeForce FX 5200 Ultra act very similarly, which proves the supposition about their identical internal architecture, with that only difference that GeForce FX 5200 Ultra feature only 2 pixel “pipelines” with two TMUs on each.
Xbitlabs
Auch falsch, oder wieso sonst zeigt mir jeder Füllraten-Test im Single-Texturing Modus weit über 1000 MTex/s an?
Original geschrieben von Demirug
Ja wobei noch zu ergänze wäre das beim NV34 nur einen der beiden Pipelines voll PS 2.0 fähig ist. Die andere Pipeline ist IMHO eine NV25 Pipeline. Wobei noch zu testen wären ob man im PS 2.0 Modus die beiden anderen TMUs fürs Trifilter in einem Takt nutzen kann.
Eine reine 2*2 Architektur ist der NV34 aber denoch nicht. Im 0 Texturemodus verhält er sich wie eine 4*0 Architektur.
Auch mit einer bilinearen Textur ist er noch im 4x1-Modus. Das böse PDF von ATi war damals gar nicht so schlecht, m.E.
Leonidas
2003-07-22, 11:36:09
Original geschrieben von LovesuckZ
/edit:
Alle anderen DirectX9-Chips von nVidia (NV31, NV33 und wohl auch NV36) sind allerdings gewöhnliche 4x1 Architekturen.
1. Fehlt hier der NV34, der nur eine (wenn überhaupt) 2x2 Architektur besitzt und 2. sind wie oben nachzulesen, die DX9 Chips von nvidia keine "gewöhnliche[n] 4x1 Architekturen".
Bin hier von den Füllraten ausgegangen, wonach NV31 und NV34 klar 4x1 sind.
LovesuckZ
2003-07-22, 11:46:25
Original geschrieben von Quasar
Bei einer geraden Anzahl an Texturschichten verhält sich jedes x*1-Design wie ein (x/2)*2-Design. Beim nV31/34 ist es nur so, das bei Multitexturing die Verschaltung nicht aufgehoben wird (wahrscheinlich aus internen Caching-Gründen).
Das stimmt, aber bei einer ungeraden Anzahl von Texturen (außer 1 texture und kein PS beim NV31) verhalten sie sich wie normale 2x2 Architekturen und haben somit einen Nachteil.
Auch falsch, oder wieso sonst zeigt mir jeder Füllraten-Test im Single-Texturing Modus weit über 1000 MTex/s an?
Ich weiß nicht, welches Programm du verwendet hast, doch Digit - life und xbitlabs kommen auf ein gleiches, anderes Ergebnis:
http://www.ixbt.com/video2/images/nv31-nv34/pf-nv34.png
http://www.xbitlabs.com/images/video/nv31-nv34/fillrate3.gif
Demirug
2003-07-22, 11:49:25
Original geschrieben von Quasar
Auch mit einer bilinearen Textur ist er noch im 4x1-Modus. Das böse PDF von ATi war damals gar nicht so schlecht, m.E.
Dann hat X-Bit-Labs falsch gemessen oder die Treiber konnten das noch nicht. Irgendwas kommt mir da auch wieder in den Sinn das die ersten Treiber den 4*1 Modus noch nicht beherscht haben. Könnte jetzt aber auch eine falsche erinnerung sein.
Auf meiner 5200 macht es ja keinen Sinn das zu messen.
LovesuckZ
2003-07-22, 11:51:48
Original geschrieben von Leonidas
Bin hier von den Füllraten ausgegangen, wonach NV31 und NV33 klar 4x1 sind.
Die Fillrate unterscheidet sich aber beim NV31 von normalen , wenn Pixelshader zum Einsatz kommen, da dann von 4x1 auf 2x2 umgeschaltet wird.
http://www.digit-life.com/articles2/gffx/nv31-nv34.html#p6
Quasar
2003-07-22, 12:00:30
Original geschrieben von LovesuckZ
Ich weiß nicht, welches Programm du verwendet hast, doch Digit - life und xbitlabs kommen auf ein gleiches, anderes Ergebnis:
http://www.ixbt.com/video2/images/nv31-nv34/pf-nv34.png
http://www.xbitlabs.com/images/video/nv31-nv34/fillrate3.gif
Sie benutzen ein Programm, welches den Vertexshader nutzt. Ich weiss nicht, wie sich da die anderen Instrumente zur Füllratenmessung verhalten und mit welchen Treibern (@Demirug) dort gemessen wurde.
Die Füllratentests von zeckis Archmark, 3DMark2001, 3DMark2003, GL_EXT_reme u.a. weisen alle single-texturing Füllraten von deutlich mehr als 700MPix für die nV34u und 500MPix für die nV34 auf.
Da ich diese Programme (zumindest das erste und das letzte) für recht zuverlässig halte, denke ich mal, dass das xBit-Labs Programm evtl. den Multitexturing-Modus auslöst, bzw. wegen der Shader eh nur noch die Zusammenlegung der Pipelines möglich ist.
Demirug
2003-07-22, 12:26:22
Quasar, ich könnte da auch noch ein Programm zum messen der Fillrate zur Verfügung stellen. http://demirug.bei.t-online.de/ZOverdraw.zip
Quasar
2003-07-22, 12:45:43
Demi,
dein Programm zeigt mir ein 2x2-Design für die FX5200 an. Erklärungsversuche?
Original geschrieben von mapel110
hm, ja. ich spreche von nvidia. jetzt haben sie es gerade geschafft, dx9 für alle anzubieten, da wollen sie schon wieder mit der nächsten produktpalette die 3.0er shader dem oem markt vorenthalten.
das versteh ich irgendwie nicht.
???
Was sollten sie denn deiner Meinung nach tun? Wenn der NV40 da ist, gleich alle NV3x aus dem Angebot schmeißen?
Demirug
2003-07-22, 13:07:50
Original geschrieben von Quasar
Demi,
dein Programm zeigt mir ein 2x2-Design für die FX5200 an. Erklärungsversuche?
Mit welchen Einstellungen hast du den gemessen? Für einen Fillratetest sollte der Overdraw >= 100 und natürlich B2F aktiviert sein.
mapel110
2003-07-22, 13:09:54
Original geschrieben von Xmas
???
Was sollten sie denn deiner Meinung nach tun? Wenn der NV40 da ist, gleich alle NV3x aus dem Angebot schmeißen?
machen sie doch derzeit auch. oder gibts irgendwo ne geforceFX mit psvs1.xx ?
Quasar
2003-07-22, 13:23:34
Original geschrieben von Demirug
Mit welchen Einstellungen hast du den gemessen? Für einen Fillratetest sollte der Overdraw >= 100 und natürlich B2F aktiviert sein.
Ich habe 0 Texture, 0 Stages, Front2Back (ok, ziemlich egal bei 0 Texturen) und 1600x1200x32 Fullscreen gemessen.
Aber B2F???
Demirug
2003-07-22, 13:26:58
Original geschrieben von Quasar
Ich habe 0 Texture, 0 Stages, Front2Back (ok, ziemlich egal bei 0 Texturen) und 1600x1200x32 Fullscreen gemessen.
Aber B2F???
Der Test funktioniert etwas anders. Er zeichent mehrer texturierte Lagen übereinader. Das B2F und F2B gibt nun an in welcher Rheienfolge die Lagen sortiert sind. Das ist da Eingebaut weil man mit dem test auch die HSR Einheit testen kann.
Deswegen Overdraw auf einen grossen Wert und B2F damit der Overhead für einen Frame nicht so gross ist und die HSR einheit da nicht fleisig Pixel verwerfen kann.
Quasar
2003-07-22, 13:27:50
Original geschrieben von mapel110
machen sie doch derzeit auch. oder gibts irgendwo ne geforceFX mit psvs1.xx ?
Wo ist denn da der Zusammenhang? Es gibt durchaus noch GeForce4 Ti zu kaufen und jede GFFX hat auch PS/VS1.x.
Quasar
2003-07-22, 13:30:27
Original geschrieben von Demirug
Der Test funktioniert etwas anders. Er zeichent mehrer texturierte Lagen übereinader. Das B2F und F2B gibt nun an in welcher Rheienfolge die Lagen sortiert sind. Das ist da Eingebaut weil man mit dem test auch die HSR Einheit testen kann.
Ok soweit war mir das schon klar...
Original geschrieben von Demirug
Deswegen Overdraw auf einen grossen Wert und B2F damit der Overhead für einen Frame nicht so gross ist und die HSR einheit da nicht fleisig Pixel verwerfen kann.
... aber wenn ich einen niedrigen Overdraw (i.e. "0") und F2B einstelle, kann keine HSR-Einheit der Welt hier etwas verwerfen, oder?
P.S.:
Benutzt du irgendeine Art von Shader? Pure Device hast du ja aktiviert.
Demirug
2003-07-22, 13:37:10
Original geschrieben von mapel110
machen sie doch derzeit auch. oder gibts irgendwo ne geforceFX mit psvs1.xx ?
Eine halbe (NV34).
Die derzeitige Plannung (Stand 12.05.2003) sieht wie folgt aus:
1H04 2H04
Enthusiast NV40 NV45
Performance NV36X NV41
Mainstream NV42
Die Mainstream und Performance chips kommen also zusammen mit dem ersten Refresh der Enthusiast Version der NV4X Technologie auf den Markt. Wir haben also einen Bremseffekt < 12 Monate. Das ist sicherlich eine Kompromisslösung die es aber ermöglicht das man bei den Performance und Mainstream NV4X Chips von den Erfahrungen des NV4X Prototypen (=NV40) profitieren kann allerdings zu dem Preis das die technik etwas langsamer in den Markt gedrückt wird.
Demirug
2003-07-22, 13:40:29
Original geschrieben von Quasar
Ok soweit war mir das schon klar...
... aber wenn ich einen niedrigen Overdraw (i.e. "0") und F2B einstelle, kann keine HSR-Einheit der Welt hier etwas verwerfen, oder?
Ja aber mit einem niedrigen Overdraw wird der Frameoverhead zu gross und verfälscht das Ergebniss.
P.S.:
Benutzt du irgendeine Art von Shader? Pure Device hast du ja aktiviert.
Nein ist alles DX7 Pipeline. Pure-Device wird eben benutzt weil der Runtimeoverhead geringer ist macht aber hier nicht wirklich einen unterschied. Ist einfach die normale Init-Rountine die eben wenn es geht ein Puredevice benutzt.
Quasar
2003-07-22, 14:02:27
BAAAHHH!!!
Ich bin so dumm.... :bonk: :bonk: :bonk:
Auch mit deinem ZOverdraw kommen natürlich 4x1-Werte heraus. Ich habe nur versucht, manuell die 2D- und 3D-Taktraten festzulegen und das hat der FX5200 hier in diesem Rechner leider nicht akzeptiert...
Deswegen kamen immer Füllraten von um die 400MPix heraus (lief halt auf 100MHz im 2D-Modus und hat nicht mehr umgeschaltet...).
Demirug
2003-07-22, 14:04:45
Original geschrieben von Quasar
BAAAHHH!!!
Ich bin so dumm.... :bonk: :bonk: :bonk:
Auch mit deinem ZOverdraw kommen natürlich 4x1-Werte heraus. Ich habe nur versucht, manuell die 2D- und 3D-Taktraten festzulegen und das hat der FX5200 hier in diesem Rechner leider nicht akzeptiert...
Deswegen kamen immer Füllraten von um die 400MPix heraus (lief halt auf 100MHz im 2D-Modus und hat nicht mehr umgeschaltet...).
Benutzt mal mehr als 4 Texturen :D
Leonidas
2003-07-22, 14:35:48
Original geschrieben von Demirug
Die Mainstream und Performance chips kommen also zusammen mit dem ersten Refresh der Enthusiast Version der NV4X Technologie auf den Markt. Wir haben also einen Bremseffekt < 12 Monate. Das ist sicherlich eine Kompromisslösung die es aber ermöglicht das man bei den Performance und Mainstream NV4X Chips von den Erfahrungen des NV4X Prototypen (=NV40) profitieren kann allerdings zu dem Preis das die technik etwas langsamer in den Markt gedrückt wird.
... was ja letztlich auch bei NV35 und NV31/NV34 (fast) so war.
Quasar
2003-07-22, 14:45:33
Original geschrieben von Demirug
Benutzt mal mehr als 4 Texturen :D
Ich glaub' ich grabe mich mal besser ein. Also, meine Revidierung von eben kann ich getrost zurücknehmen.
In deinem Programm verhält sich der nV34 definitiv wie eine 2x2 Architektur, ebenso im Fillrate Test von Rightmark3D.
Sowohl in zecki's Archmark als auch in GL_EXT_reme wird jedoch nach wie vor eindeutig die Füllrate einer 4x1-Architektur mit 250MHz erreicht.
Kann es sein, dass der nV34 aufgrund von dem:
http://home.arcor.de/quasat/3DC-Pics/ATi-Presentation%20nV3x.jpg
Unter D3D nur 2 Pipelines "nutzen" darf, da er sonst aufgrund der (aus dem Bildchen ableitbaren, keine 24Bit-FP (hier aber 32Bit-FP) Mindestgenauigkeit erreicht?
BTW, dazu passt das Verhalten mit mehr als 4 Texturen... ;)
Für mehr als zweifachen Loopback bleibt dann eben nur die eine PS2.0-ALU.
Demirug
2003-07-22, 14:47:20
Original geschrieben von Leonidas
... was ja letztlich auch bei NV35 und NV31/NV34 (fast) so war.
Nicht ganz wenn man der internen Planung von nv folgt.
nv möchte die 2 Jahre 2002/03 dabei gerne so dargestellt wissen.
1H02 2H02 1H03 2H03
Enthusiast NV30 NV35
Performance NV25 NV28 NV31 NV36
Mainstream NV17 NV18 NV34
Demirug
2003-07-22, 14:57:54
Original geschrieben von Quasar
Ich glaub' ich grabe mich mal besser ein. Also, meine Revidierung von eben kann ich getrost zurücknehmen.
In deinem Programm verhält sich der nV34 definitiv wie eine 2x2 Architektur, ebenso im Fillrate Test von Rightmark3D.
Sowohl in zecki's Archmark als auch in GL_EXT_reme wird jedoch nach wie vor eindeutig die Füllrate einer 4x1-Architektur mit 250MHz erreicht.
Kann es sein, dass der nV34 aufgrund von dem:
http://home.arcor.de/quasat/3DC-Pics/ATi-Presentation%20nV3x.jpg
Unter D3D nur 2 Pipelines "nutzen" darf, da er sonst aufgrund der (aus dem Bildchen ableitbaren, keine 24Bit-FP (hier aber 32Bit-FP) Mindestgenauigkeit erreicht?
BTW, dazu passt das Verhalten mit mehr als 4 Texturen... ;)
Für mehr als zweifachen Loopback bleibt dann eben nur die eine PS2.0-ALU.
Für mehr als 4 texturen brauchen die NV3X Chips eine 2.0 fähige Pipeline darum ist auch bei der 5200 die halbe Fillrate weg. Wie gesagt müsste man noch testen ob dafür die TMUs tri tauglich werden.
Die Bilder kenne ich und halte sie für etwas ... merkwürdig.
Meine Vermutung bezüglich NV34 ist. Das dort eine NV3X Pipeline und eine NV2X Pipeline verbaut ist wobei diese beide noch etwas von der alten GF256 Technik beinhalten. Irgendwie funktioniert dieser Trick aber noch nicht immer mit DX. Mit OpenGL dagegen scheint es ja schon zu funktionieren.
Wenn man die DX7 Pipeline nutzt ist keine FP Genauigkeit erforderlich.
Quasar
2003-07-22, 15:22:53
Original geschrieben von Demirug
Für mehr als 4 texturen brauchen die NV3X Chips eine 2.0 fähige Pipeline darum ist auch bei der 5200 die halbe Fillrate weg. Wie gesagt müsste man noch testen ob dafür die TMUs tri tauglich werden.
Die Bilder kenne ich und halte sie für etwas ... merkwürdig.
Meine Vermutung bezüglich NV34 ist. Das dort eine NV3X Pipeline und eine NV2X Pipeline verbaut ist wobei diese beide noch etwas von der alten GF256 Technik beinhalten. Irgendwie funktioniert dieser Trick aber noch nicht immer mit DX. Mit OpenGL dagegen scheint es ja schon zu funktionieren.
Wenn man die DX7 Pipeline nutzt ist keine FP Genauigkeit erforderlich.
Das mit dem Tri-TMUs probier ich gleich mal aus.
Der Trick zwischen DX und OpenGL ist IMO, dass die aktuellen Treiber in OpenGL immer noch "nur" 4xMT single-pass melden.
In D3D braucht nV 16 Textur-Lookups.
Offenbar kommt sich da intern ein wenig etwas selbst in die Quere, wenn man versucht, mehr als 4 Texturen pro Pass laufen zu lassen und es lässt sich nur noch die PS2.0-Pipe nutzen.
Das würde auch zu deiner Verneinung mit der DX7-Pipe passen. Anstatt realen Multi-Passes geht man auf die PS2.0-Pipe, auch wenn es vielleicht unnötig wäre.
Demirug
2003-07-22, 15:27:27
Original geschrieben von Quasar
Das mit dem Tri-TMUs probier ich gleich mal aus.
Der Trick zwischen DX und OpenGL ist IMO, dass die aktuellen Treiber in OpenGL immer noch "nur" 4xMT single-pass melden.
In D3D braucht nV 16 Textur-Lookups.
Offenbar kommt sich da intern ein wenig etwas selbst in die Quere, wenn man versucht, mehr als 4 Texturen pro Pass laufen zu lassen und es lässt sich nur noch die PS2.0-Pipe nutzen.
Das würde auch zu deiner Verneinung mit der DX7-Pipe passen. Anstatt realen Multi-Passes geht man auf die PS2.0-Pipe, auch wenn es vielleicht unnötig wäre.
Unter D3D meldet der Treiber für DX7 8 Texturen pro Pass. (16 gehen nur in Verbindnung mit PS >= 2.0) Da es aber eigentlich kein Spiel gibt das unter verwendung der DX7 Pipeline wirklich mehr als 4 Texture nutzt (die meisten nutzen nur 2 oder maximal 3) könnte es durchaus sein das man an der DX7 Pipeline noch nicht so viel optimiert hat. Ich werden sobald ich etwas Zeit finde eine möglichkeit einbauen um PS zu benutzten.
Quasar
2003-07-22, 15:44:12
Der FillratenTest von RightMark3D kann das bereits, brauchst dir also nicht die Mühe machen.
Hier mal die Ergebnisse meiner FX5200:
Alle Tests mit 1024x768x32, 4 Lagen einer 256x256 Textur,
ps11 716/576 MTex/s
ps20 171/166 MTex/s
Mit 5 Texturlagen:
ps11 192/181 MTex/s
ps20 137/135 MTex/s
Also: Bei mehr als 5 Texturlagen oder PS2.0: Tree4free ;)
DrumDub
2003-07-22, 16:35:50
Original geschrieben von Quasar
Also: Bei mehr als 5 Texturlagen oder PS2.0: Tree4free ;)
tree? was haben bäume mit filterung zu tun? ;)
Demirug
2003-07-22, 16:41:33
Original geschrieben von Quasar
Der FillratenTest von RightMark3D kann das bereits, brauchst dir also nicht die Mühe machen.
Hier mal die Ergebnisse meiner FX5200:
Alle Tests mit 1024x768x32, 4 Lagen einer 256x256 Textur,
ps11 716/576 MTex/s
ps20 171/166 MTex/s
Mit 5 Texturlagen:
ps11 192/181 MTex/s
ps20 137/135 MTex/s
Also: Bei mehr als 5 Texturlagen oder PS2.0: Tree4free ;)
Schön das man die TMUs nicht nutzloss versauern lässt. Hast du auch mal ausprobiert ob mit PS 1.1 und nur einer Texture der 4 Pixel/Takt Trick funktioniert?
Quasar
2003-07-22, 17:13:43
Ja, aber nein. Es scheint so, als würde sich der Treiber in D3D strikt weigern, mehr als 2 Pixel/Takt herauszulassen.
Dumme Sache das.
BTW, die Sache mit den 5 Texturen scheint bein nV31 aufgrund der ebensowenig vorhandenen zweiten Shader-ALU, ähnlich langsam gelöst zu sein, wie beim nV34...
Quasar
2003-07-23, 16:17:01
Original geschrieben von Quasar
Ich glaub' ich grabe mich mal besser ein. Also, meine Revidierung von eben kann ich getrost zurücknehmen.
In deinem Programm verhält sich der nV34 definitiv wie eine 2x2 Architektur, ebenso im Fillrate Test von Rightmark3D.
Sowohl in zecki's Archmark als auch in GL_EXT_reme wird jedoch nach wie vor eindeutig die Füllrate einer 4x1-Architektur mit 250MHz erreicht.
Kann es sein, dass der nV34 aufgrund von dem:
http://home.arcor.de/quasat/3DC-Pics/ATi-Presentation%20nV3x.jpg
Hm, ich weiß gar nicht, wie ich es sagen soll....
Ich mach's kurz: auf meiner FX5200 skaliert die Füllrate in deinem Z-Overdraw quasi linear mit der Speicherbandbreite.
Offensichtlich sind die OpenGL-Füllratentests nicht so bandbreitenlastig, denn während ich bei konstanten 250MHz Chiptakt und 200MHz Speichertakt noch ~480MPix/s hatte, brachte eine Anhebung des Speichertaktes auf 250MHz (+25%) eine Füllrate von ~600MPix/s.
Mist, dass ich gestern so in Eile war (<- geht das als Entschuldigung durch?)
Original geschrieben von mapel110
hm, ja. ich spreche von nvidia. jetzt haben sie es gerade geschafft, dx9 für alle anzubieten, da wollen sie schon wieder mit der nächsten produktpalette die 3.0er shader dem oem markt vorenthalten.
das versteh ich irgendwie nicht.
Ist doch ziemlich leicht zu verstehen. PS/VS 3.0 kosten wieder mehr Transistoren. Die technologische Basis in der Fertigung wird aber zum Jahreswechsel für NV nicht so schnell sich ändern.
Momentan nehmen sie geringere Margen in kauf. Du kannst aber kaum erwarten, dass sie das zum Jahreswechsel gleich wieder tun.
Logischer Weise folgt jetzt erstmal eine Konsolidierung und man wird sich die Investitionen vom Kunden zurückholen.
Zu verschenken gibt es nichts.
vBulletin®, Copyright ©2000-2025, Jelsoft Enterprises Ltd.