PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : R580 schon Anfang 2006?


Seiten : 1 2 3 [4] 5 6 7

Gast
2006-01-06, 21:29:44
Marketingkram. Aber nicht in der Praxis. Dann ist ein DP4 auch 8 FLOPs wert.
Wenn die Diskussion über Technologie dich stört, dann ignoriere mich bitte.
Marketingkram vs. Meßwerte aus GPUBENCH:

Scalar vs Vector Instruction Issue
--------------------------------------------------------------------------
512 52.4593 ADD 1 40
512 32.8303 ADD 4 40
512 341.0943 SUB 1 40
512 86.5915 SUB 4 40
512 52.4571 MUL 1 40
512 26.2904 MUL 4 40
512 52.4611 MAD 1 40
512 26.2936 MAD 4 40

Den irrealen SUB-Wert (sowohl Skalar, als auch Vec4) bitte ignorieren, da scheint der Treiber mehr Arbeit einzusparen, als er darf.

Schau lieber mal auf ADD, MUL und MADD. ;)

Gast
2006-01-06, 21:33:26
Und wo wir grad dabei sind: Hier die ADD-Alu in Aktion (ebenfalls GPUBENCH):
Instruction Issue
--------------------------------------------------------------------------
512 10.5769 ADD 4 64
512 8.0983 SUB 4 64
512 8.0979 MUL 4 64
512 8.0983 MAD 4 64

Immerhin 30%.

robbitop
2006-01-06, 21:38:37
Und wo wir grad dabei sind: Hier die ADD-Alu in Aktion (ebenfalls GPUBENCH):
Instruction Issue
--------------------------------------------------------------------------
512 10.5769 ADD 4 64
512 8.0983 SUB 4 64
512 8.0979 MUL 4 64
512 8.0983 MAD 4 64

Immerhin 30%.
Ab und an kann die MiniALU ein ADD4 beisteuern aber eben lange nicht immer. Und das schon bei einem hoch synthetischen Test.

Gast
2006-01-06, 21:38:54
Oh, und bevor du in Versuchung gerätst, dass als Eigenheit des Benchmarks abzutun, hier eine NV40:

Scalar vs Vector Instruction Issue
--------------------------------------------------------------------------
512 20.2464 ADD 1 40
512 10.2040 ADD 4 40
512 10.1729 SUB 1 40
512 5.4173 SUB 4 40
512 20.1831 MUL 1 40
512 9.7446 MUL 4 40
512 9.9132 MAD 1 40
512 5.4662 MAD 4 40
Achte wiederum bitte auf das Verhältnis von ADD, MUL und MADD.

Gast
2006-01-06, 21:46:39
Nur als grober Indikator.
Das ganze wird mir etwas zu mühsam, ich habe meine Punkte dargelegt, du kannst ja glauben oder nicht glauben, was du willst. :)

Es ging mir, btw, auch immer nur um einen groben Indikator bei diesen Zahlen. Das ist halt alles, was man ohne echte Hardware machen kann.

Demirug
2006-01-06, 21:54:13
Das ADD der Mini-ALU scheint unter OpenGL nicht genutzt zu werden. Ich habe hier irgendwo Meßwerte meines eigenen "GPGPU Benchs" unter D3D rumliegen die zeigen das der ADD vorhanden ist.

Gast
2006-01-06, 22:00:11
Das ADD der Mini-ALU scheint unter OpenGL nicht genutzt zu werden. Ich habe hier irgendwo Meßwerte meines eigenen "GPGPU Benchs" unter D3D rumliegen die zeigen das der ADD vorhanden ist.
Und wie erklären sich deiner Meinung nach die 30% von weiter oben.

Ailuros
2006-01-06, 22:08:23
Marketingkram. Aber nicht in der Praxis. Dann ist ein DP4 auch 8 FLOPs wert.
Wenn die Diskussion über Technologie dich stört, dann ignoriere mich bitte.

Theoretische maximale Zahlen sind alle Marketingkram, ob GPUs, CPUs oder was auch immer.

Ailuros
2006-01-06, 22:12:04
Das ADD der Mini-ALU scheint unter OpenGL nicht genutzt zu werden. Ich habe hier irgendwo Meßwerte meines eigenen "GPGPU Benchs" unter D3D rumliegen die zeigen das der ADD vorhanden ist.

Endlich eine Bestaetigung. Danke.

Soll ich jetzt also - wie ATI vorzuschlagen scheint - das ADD zum theoretischen Kram dazuzaehlen oder mich nur auf MADDs alleine konzentrieren? Natuerlich stets mit den jeglichen Bedingungen im Hinterkopf.

OT: ich lese gerade das Ding hier nochmal durch:

http://graphics.stanford.edu/papers/clawhmmer/hmmer.pdf

Gibt es davon eine neuere Version die ich dummerweise nicht finden kann?

Demirug
2006-01-06, 22:35:58
Und wie erklären sich deiner Meinung nach die 30% von weiter oben.

Eine Optimierunglücke im Test. Diese 30% gegenüber MUL haben schaffen alle Treiber die einen Shader optimizier haben.

Gast
2006-01-07, 12:02:34
Ausgehend von diesem Zitat (von Ailuros)http://www.beyond3d.com/forum/showthread.php?t=25802&page=20

"FEAR/ 1600*1200

1xAA/1xAF
7800 GTX 512: 64 fps
X1800XT: 51 fps

4xAA/16xAF
7800 GTX 512: 35 fps (-45%)
X1800XT: 39 fps (-24%)

http://www.xbitlabs.com/articles/video/display/games-2005_12.html

Assuming the 49 fps score for R580 is real, I wouldn't be that much surprised if the 1xAA/1xAF score would be in the =/>70 fps ballpark."

stellt sich die Frage, ob bei dieser Auflösung die PS limitieren oder eher andere Faktoren (ev. gibt es hier neben der Bandbreite noch andere Bereiche, die die Performance beeinflussen!). Ein deutliches Zeichen dafür sind die nur 25 Prozent Mehrleistung im Vergleich zur 1800XT (bei dreifacher ALU-Leistung). Ein Vergleichswert in 1600 1xAA/1xAF und Vergleichswerte in 1280er Auflösung wären hier interessant.

robbitop
2006-01-07, 12:13:02
Das ganze wird mir etwas zu mühsam, ich habe meine Punkte dargelegt, du kannst ja glauben oder nicht glauben, was du willst. :)

Tue ich ja auch. Ich habe meine Thesen ja auch immer mit Argumenten belegt. Irgendwie geben zu viele da leicht auf ;)

robbitop
2006-01-07, 12:13:59
Das ADD der Mini-ALU scheint unter OpenGL nicht genutzt zu werden. Ich habe hier irgendwo Meßwerte meines eigenen "GPGPU Benchs" unter D3D rumliegen die zeigen das der ADD vorhanden ist.
Immer? Oder restriktiv?

robbitop
2006-01-07, 12:15:32
Ausgehend von diesem Zitat (von Ailuros)http://www.beyond3d.com/forum/showthread.php?t=25802&page=20

"FEAR/ 1600*1200

1xAA/1xAF
7800 GTX 512: 64 fps
X1800XT: 51 fps

4xAA/16xAF
7800 GTX 512: 35 fps (-45%)
X1800XT: 39 fps (-24%)

http://www.xbitlabs.com/articles/video/display/games-2005_12.html


Hier sieht man sehr schön, dass bei AA/AF andere Dinge limitieren. Nämlich IMO die Bandbreite (und die Cachehitrate) und ich denke das AF bringt die G70 Pipes etwas mehr zum stallen.

mapel110
2006-01-07, 12:27:46
Hier sieht man sehr schön, dass bei AA/AF andere Dinge limitieren. Nämlich IMO die Bandbreite (und die Cachehitrate) und ich denke das AF bringt die G70 Pipes etwas mehr zum stallen.
Wie kommst du darauf, wenn Ailuros von 58 auf 52 fps "einbricht" bei FEAR, wenn er von 1x auf 16 AF stellt?

robbitop
2006-01-07, 12:45:36
Wie kommst du darauf, wenn Ailuros von 58 auf 52 fps "einbricht" bei FEAR, wenn er von 1x auf 16 AF stellt?
Genauer bitte. Ich meinte btw beides .. AA/AF.

Ailuros
2006-01-07, 12:46:05
Hier sieht man sehr schön, dass bei AA/AF andere Dinge limitieren. Nämlich IMO die Bandbreite (und die Cachehitrate) und ich denke das AF bringt die G70 Pipes etwas mehr zum stallen.

Falls die angeblichen 49 fps fuer R580 stimmen sollten und weiterhin 1xAA/1xAF liegt bei =/>70 fps, wie sieht das Bild da dann aus? Wie waere es wenn Du mal an die Anzahl der Fragmente im Vergleich zur Anzahl der Threads denken wuerdest?

Gast
2006-01-07, 12:48:30
Tue ich ja auch. Ich habe meine Thesen ja auch immer mit Argumenten belegt. Irgendwie geben zu viele da leicht auf ;)
Ich habe noch kein Argument von dir gesehen, bsw. zu der These, dass es kein Single-Cycle MADD gibt – was im Widerspruch zu den von mir geposteten GPUBench-Ergebnissen, sowohl und besonders in Relation von G70, R520 und NV40, steht.

Das "Phasenkonzept" wurde mit PS1.4 eingeführt und ist wenn, dann beim R3xx und höher, genauso gültig. Nur stallt dort die Pipeline nicht. Und ich glaube, das sich das so auch nur auf PS1.4-Code bezieht.

robbitop
2006-01-07, 12:52:26
Ich habe noch kein Argument von dir gesehen, bsw. zu der These, dass es kein Single-Cycle MADD gibt – was im Widerspruch zu den von mir geposteten GPUBench-Ergebnissen, sowohl und besonders in Relation von G70, R520 und NV40, steht.

Das "Phasenkonzept" wurde mit PS1.4 eingeführt und ist wenn, dann beim R3xx und höher, genauso gültig. Nur stallt dort die Pipeline nicht. Und ich glaube, das sich das so auch nur auf PS1.4-Code bezieht.
Ich weiß nicht, wie GPU Bench das intern realisiert. Aber IMO nicht mit einem MUL4+ADD4 pro Takt. Vieleicht nutzt man DP4 ... somit nutzt man die ADD und die MUL Fähigkeiten der ALU in einem Takt. Jedoch kommt natürlich nur eine Vec4 Op hinten raus.

Im R300 ist angeblich schon eine Art Threaddingkonzept integriert.

robbitop
2006-01-07, 12:54:42
Falls die angeblichen 49 fps fuer R580 stimmen sollten und weiterhin 1xAA/1xAF liegt bei =/>70 fps, wie sieht das Bild da dann aus? Wie waere es wenn Du mal an die Anzahl der Fragmente im Vergleich zur Anzahl der Threads denken wuerdest?
Naja es könnte auch sein, dass in diesem Setting PS Leistung als auch Bandbreite gleichzeitig limitieren und so eine Besserung auftritt, wenn eines der beiden skaliert wird.

Meinst du, dass R580 die Threads ausgehen könnten? Das wäre gut möglich.

Ailuros
2006-01-07, 13:05:55
Meinst du, dass R580 die Threads ausgehen könnten? Das wäre gut möglich.

Wenn ich die Fragmente zu Thread Relation so ansehe auf R520 und auf die moegliche Steigerung nur der Fragmente auf R580 denke, dann sieht es nach einer guten Moeglichkeit aus ;)

Gast
2006-01-07, 13:12:11
Um mal etwas "Grund reinzubringen:

FEAR/ 1600*1200
noAA/noAF 4xAA/16xAF Einbruch
7800 GT: 45 fps 23 fps -49%
X1800XL: 42 fps 26 fps -38%
--
7800 GT: 45 fps 23 fps -49%
7800 GTX/512: 64 fps 35 fps -45%
--> +42% +52%

X1800 XL: 42 fps 26 fps -38%
X1800 XT: 55 fps 39 fps -29%
--> +31% +59%


7800 GT vs. 7800 GTX/512:
+256 MB VRAM;+65% Shaderfill; +70% Bandbreite; +37,5% ROP-Durchsatz (AA!)

X1800XL vs. X1800XT:
+256 MB VRAM; +25% Shaderfill; +50% Bandbreite; +25% ROP-Durchsatz

http://www.xbitlabs.com/articles/video/display/games-2005_12.html

(ohne Softshadows!!!)

So, jetzt können wir mal ein bißchen mehr rumrechnen. *gg*



*taschenrechnend*
Q

Gast
2006-01-07, 13:15:09
Wenn ich die Fragmente zu Thread Relation so ansehe auf R520 und auf die moegliche Steigerung nur der Fragmente auf R580 denke, dann sieht es nach einer guten Moeglichkeit aus ;)
Das selbe Problem ergibt sich (in kleinerem Maßstab) bei der X1600 vs. X1300. Bei längeren Shadern ist dort (ein aus dem Kopf gebildeter!) durchschnittlicher Faktor 2 in der erreichten Rechenleistung vorhanden.

Kurze PS1.x sind nur bei +/- 0%, manche Shader liegen bei max. +170% (Faktor 2,7).


*grinsend*
Q



P.S.:
Vielleicht hilft es weiter, wenn ich die Thread-Größe beim RV530 erwähne: Hier sind es keine 4*4 Pixel Minimum mehr, sondern 12*4 (oder andersrum...). :)

Ailuros
2006-01-07, 13:22:22
Um mal etwas "Grund reinzubringen:

FEAR/ 1600*1200
noAA/noAF 4xAA/16xAF Einbruch
7800 GT: 45 fps 23 fps -49%
X1800XL: 42 fps 26 fps -38%
--
7800 GT: 45 fps 23 fps -49%
7800 GTX/512: 64 fps 35 fps -45%
--> +42% +52%

X1800 XL: 42 fps 26 fps -38%
X1800 XT: 55 fps 39 fps -29%
--> +31% +59%


7800 GT vs. 7800 GTX/512:
+256 MB VRAM;+65% Shaderfill; +70% Bandbreite; +37,5% ROP-Durchsatz (AA!)

X1800XL vs. X1800XT:
+256 MB VRAM; +25% Shaderfill; +50% Bandbreite; +25% ROP-Durchsatz

http://www.xbitlabs.com/articles/video/display/games-2005_12.html

(ohne Softshadows!!!)

So, jetzt können wir mal ein bißchen mehr rumrechnen. *gg*



*taschenrechnend*
Q


Keine Vergleiche zwischen 512GTX und X1800XT? :P (obwohl die Bandbreite bei der ersten wohl im Ueberfluss liegen koennte).

Ailuros
2006-01-07, 13:24:43
Das selbe Problem ergibt sich (in kleinerem Maßstab) bei der X1600 vs. X1300. Bei längeren Shadern ist dort (ein aus dem Kopf gebildeter!) durchschnittlicher Faktor 2 in der erreichten Rechenleistung vorhanden.

Kurze PS1.x sind nur bei +/- 0%, manche Shader liegen bei max. +170% (Faktor 2,7).


*grinsend*
Q



P.S.:
Vielleicht hilft es weiter, wenn ich die Thread-Größe beim RV530 erwähne: Hier sind es keine 4*4 Pixel Minimum mehr, sondern 12*4 (oder andersrum...). :)


Wenn ich alles aber so ueberdenke und einen Topf werfe, kann es durchaus sein dass ich den R5xx Speichercontroller vielleicht doch zu stark ueberschaetzt habe und dass man zusaetzlich vielleicht die Textur-Latenz bei R580 nicht so gut verstecken kann wie auf R520.

Gast
2006-01-07, 13:30:36
Keine Vergleiche zwischen 512GTX und X1800XT? :P (obwohl die Bandbreite bei der ersten wohl im Ueberfluss liegen koennte).
Der Link steht da und dein OS hat bestimmt einen Taschenrechner integriert. :P Kannste ja hinzufügen, wenn du magst...

Interessant ist aber in dem von dir vorgeschlagenen Vergleich, dass der Abstand zwischen X1800XT und 7800 GTX/512 (was ein blöder Name, da war ultra doch kürzer) mit AA/AF wie folgt ausschaut:

1280: +12,2%
1600: +11,4%

Da die Bandbreitenanforderungen beim Wechsel auf die höhere Auflösung aber gleichmäßig steigen (vom F@S mal abgesehen), scheint ein größerer Teil des R520-Vorsprungs vom AF zu stammen, die 100 MHz höhere Speicherbandbreite der GTX beginnt in 1600 ja bereits zu greifen.


Q

reunion
2006-01-07, 13:39:59
Uhmmm um 40% zu erreichen reichen 575MHz;


Milchmädchenrechung.
Das würde höchstens der Fall sein, wenn bei Fear in diesen Einstellungen zu 100% die Füllrate limitieren würde, was ich nicht glauben. Ich bin gespannt, wie G71 skaliert, bei den heute bekannten Daten scheint der Chip ziemlich an der Bandbreite zu hängen.


die 512GTX hat mehr Bandbreite als sie eigentlich braucht.

nV verbaut doch nicht zum Spaß einen derart teuren VRAM. Der Chip zieht mit Sicherheit einen Vorteil aus dieser Bandbreite - auch kein Wunder, bei einer derartigen Texelfüllrate.

Gast
2006-01-07, 13:40:21
Ein letzter Nachschlag noch, der sehr informativ sein dürfte:
[size=1]
FEAR/ 1280*1024
noAA/noAF 4xAA/16xAF Einbruch
X1300 Pro: 28 fps 19 fps -32%
X1600 XT: 51 fps 34 fps -34%
--> +82% +78%

selber Artikel wie oben
Nun weiß ich leider nicht, was für eine X1300 Pro die XBit-Labs genommen haben. Könnte natürlich auch die Bandbreite eine Rolle spielen, aber es sieht so aus, als könne in FEAR die zusätzliche Shaderleistung sehr gut (und im Rahmen meiner Prognose *gg*) umgesetzt werden.


Q

reunion
2006-01-07, 13:45:34
Wenn ich die Fragmente zu Thread Relation so ansehe auf R520 und auf die moegliche Steigerung nur der Fragmente auf R580 denke, dann sieht es nach einer guten Moeglichkeit aus ;)


Wie kommst du darauf?
Eine verdreifachung der Threadgröße, bei einer verdoppelung der Funktionseinheiten sollte R580 eine Effizienzvorteil verschaffen.

Gast
2006-01-07, 13:57:36
Wenn alles so läuft, wie bei der Rv530, dann werden minimale Thread-Größe und ALUs verdreifacht.

IVN
2006-01-07, 14:02:57
Wie kommst du darauf?
Eine verdreifachung der Threadgröße, bei einer verdoppelung der Funktionseinheiten sollte R580 eine Effizienzvorteil verschaffen.
Was soll das bedeuten?? Die Threads sind bei r580 und r520 4x4 Pixel.

robbitop
2006-01-07, 14:05:21
Was soll das bedeuten?? Die Threads sind bei r580 und r520 4x4 Pixel.
Ich glaube, es geht um die Anzahl der Threads die der Threadprozessor verwalten kann. Beim R520 sind's 512 und im R580 soll das so bleiben.

Gast
2006-01-07, 14:08:04
Ich glaube, es geht um die Anzahl der Threads die der Threadprozessor verwalten kann. Beim R520 sind's 512 und im R580 soll das so bleiben.
Beim RV530 ist die minimale Threadgröße auf 12*4 Pixel angehoben.

Das legt die Vermutung sehr nahe, dass dies auch im R580 geschehen wird. Ich glaube nicht, daß dieser dann 12 Dispatcher bekommt.


Q

robbitop
2006-01-07, 14:11:29
Beim RV530 ist die minimale Threadgröße auf 12*4 Pixel angehoben.

Das legt die Vermutung sehr nahe, dass dies auch im R580 geschehen wird. Ich glaube nicht, daß dieser dann 12 Dispatcher bekommt.


Q
Ah danke für die Info! :)

Ailuros
2006-01-07, 14:14:16
Milchmädchenrechung.
Das würde höchstens der Fall sein, wenn bei Fear in diesen Einstellungen zu 100% die Füllrate limitieren würde, was ich nicht glauben. Ich bin gespannt, wie G71 skaliert, bei den heute bekannten Daten scheint der Chip ziemlich an der Bandbreite zu hängen.

Ich hab zumindest ausfuehrliche Skalierungstests auf G70 ausgefuehrt in Fear dass ich einer jeglicher Spekulation auch naeher kommen kann.

Genauso was diverse Bandbreiten-Faelle betrifft. Soll heissen ich hab Daten zur Hand auf deren Basis ich spekulieren kann.

Wieviel Bandbreite braucht denn G71 um nicht daran zu haengen nach Deiner Glaskugel?


nV verbaut doch nicht zum Spaß einen derart teuren VRAM. Der Chip zieht mit Sicherheit einen Vorteil aus dieser Bandbreite - auch kein Wunder, bei einer derartigen Texelfüllrate.

Zum Spass garantiert nicht; aber je seltener und teurer der Speicher desto besser kann man mangelnde Verfuegbarkeit auch gerechtfertigen.

Eine 256 GTX hat 10.3GTexels mit 38.4 GB/s Bandbreite. Die 512 GTX hat 13.2GTexels (ergo ~30% mehr Fuellrate) und 58GB Bandbreite (ergo ~50% mehr Bandbreite).

Uebertakte ich nur den Speicher auf einer 256 GTX um 15%, bekomm ich =/<5% an extra Leistung; waehrend im Gegenteil wenn ich core und ram um 15% erhoehe, heisst es eine durchschnittliche Erhoehung der Leistung um =/<15%

Mehr dazu:

http://www.3declipse.com//content/view/15/9/

Ailuros
2006-01-07, 14:18:50
Wie kommst du darauf?
Eine verdreifachung der Threadgröße, bei einer verdoppelung der Funktionseinheiten sollte R580 eine Effizienzvorteil verschaffen.

Lies mal was Jawed hier selber zu sich murmelt:

http://www.beyond3d.com/forum/showthread.php?t=25802&page=20

Coda
2006-01-07, 15:04:28
Eine Vergrößerung der Threadgröße führt sicher zu keinem Effizienzvorteil. Je kleiner der Bildausschnitt in dem Branches potentiell für beide Pfade ausgeführt werden müssen desto besser.

Allerdings sollten 3x soviel Shadereinheiten das etwas ausgleichen.

reunion
2006-01-07, 16:05:08
Wenn alles so läuft, wie bei der Rv530, dann werden minimale Thread-Größe und ALUs verdreifacht.

Ja, aber der Dispatch-Prozessor verwaltete ja nicht nur die ALUs, sondern auch die TMUs. Bei R520 sind das pro Quad 4 ALUs und 4 TMUs. Bei R580 12ALUs und ebenfalls 4 TMUs. Ergo werden die Funktionseinheiten, auf welche der Dispatch-Prozessor die Threads verteilen muss verdoppelt, die Threadgröße wurde allerdings verdreifacht.

Blaire
2006-01-07, 16:09:46
http://forums.overclockers.co.uk/showpost.php?p=6225648&postcount=13

X1900 is gonna be fast, BUT 7800 GTX 512MB will hold its own in some games, but in general the X1900 will beat it and be less money. NVIDIA will then release their card...

X1900's are to compete with NVIDIA's 512MB 7800 GTX and pricing will be on a similar level. At the same time NVIDIA 512MB 7800 GTX will be easily available...

X1900 will have more than one model, one no doubt a little quicker than 512MB 7800 GTX for less money and one quite a bit faster for similar money.

However NVIDIA will release G71 in February which supposedly will destroy R580's performance. Then the next major release will be towards end of the summer when the real next gen cards come out.

reunion
2006-01-07, 16:16:26
Eine Vergrößerung der Threadgröße führt sicher zu keinem Effizienzvorteil. Je kleiner der Bildausschnitt in dem Branches potentiell für beide Pfade ausgeführt werden müssen desto besser.

Allerdings sollten 3x soviel Shadereinheiten das etwas ausgleichen.


Schon klar, aber die wahrscheinlichkeit, dass eine Blase erzeugt werden muss, sinkt durch die größeren Threads. Da jetzt drei, anstatt zwei Takte pro Thread zur Verfügung stehen.

reunion
2006-01-07, 16:29:42
Ich hab zumindest ausfuehrliche Skalierungstests auf G70 ausgefuehrt in Fear dass ich einer jeglicher Spekulation auch naeher kommen kann.

Genauso was diverse Bandbreiten-Faelle betrifft. Soll heissen ich hab Daten zur Hand auf deren Basis ich spekulieren kann.

Wieviel Bandbreite braucht denn G71 um nicht daran zu haengen nach Deiner Glaskugel?


Ich habe keine Glaskugel. Und ich weiß auch nicht, wie stark G71 durch die kaum mehr steigerungsfähige Banbreite behindert wird, aber ich weiß, dass eine erhöhung der Füllrate um 40% noch lange keine Leistungssteigerung von 40% bedeutet.


Uebertakte ich nur den Speicher auf einer 256 GTX um 15%, bekomm ich =/<5% an extra Leistung; waehrend im Gegenteil wenn ich core und ram um 15% erhoehe, heisst es eine durchschnittliche Erhoehung der Leistung um =/<15%


Das ist logisch. Wenn du Core- und Speichertakt um 15% erhöhst, muss zwangsläufig eine Leistungssteigerung von ca. 15% eintreten, sofern die CPU nicht limitiert. Ebenso ist es logisch, dass eine erhöhung des Speichertaktes alleine weniger bringt.

Viel intressanter wäre, wenn du ausschließlich den Coretakt erhöhen würdest, denn dadurch könnte man den G71 simulieren, wobei du mit deinem G70 natürlich kaum eine derart hohe Füllrate erreichen wirst.


Mehr dazu:

http://www.3declipse.com//content/view/15/9/

Wow, gratuliere, ist schön geworden. :)

reunion
2006-01-07, 16:42:58
Lies mal was Jawed hier selber zu sich murmelt:

http://www.beyond3d.com/forum/showthread.php?t=25802&page=20

Thx, er spricht hier etwas wichtiges an:


Actually, it's entirely possible that R580 has a lower limit on the number of threads each of its four primary shader units can support. I say this purely because of the implied register file size. If R520 can support 128 threads of 16 fragments per shader unit, R580's tripled per-thread fragment count would require a tripling in register file size.

Die zwei Speicherzellen könnten bei bei RV530/R580 etwas kanpp bemessen sein, und die Threadzahl reduzieren.

Gast
2006-01-07, 18:47:06
http://forums.overclockers.co.uk/showpost.php?p=6225648&postcount=13

X1900 is gonna be fast, BUT 7800 GTX 512MB will hold its own in some games, but in general the X1900 will beat it and be less money. NVIDIA will then release their card...

X1900's are to compete with NVIDIA's 512MB 7800 GTX and pricing will be on a similar level. At the same time NVIDIA 512MB 7800 GTX will be easily available...

X1900 will have more than one model, one no doubt a little quicker than 512MB 7800 GTX for less money and one quite a bit faster for similar money.

However NVIDIA will release G71 in February which supposedly will destroy R580's performance. Then the next major release will be towards end of the summer when the real next gen cards come out.

Mhh gut da ist die Rede von Februar :) Hoffe das stimmt dann hol ich sie mir :)

Fetza
2006-01-07, 18:54:30
http://forums.overclockers.co.uk/showpost.php?p=6225648&postcount=13

X1900 is gonna be fast, BUT 7800 GTX 512MB will hold its own in some games, but in general the X1900 will beat it and be less money. NVIDIA will then release their card...

X1900's are to compete with NVIDIA's 512MB 7800 GTX and pricing will be on a similar level. At the same time NVIDIA 512MB 7800 GTX will be easily available...

X1900 will have more than one model, one no doubt a little quicker than 512MB 7800 GTX for less money and one quite a bit faster for similar money.

However NVIDIA will release G71 in February which supposedly will destroy R580's performance. Then the next major release will be towards end of the summer when the real next gen cards come out.

Hat die aussage dieses typens in irgendeiner form gewicht?

Greetz

Fetza

horn 12
2006-01-07, 20:16:01
denke dies wird ein kopf an kopf rennen !
rechne mit ca. gleichstand / /
JEDOCH bei neueren games mit >1280x 1024 und AA + AF eher ati schneller als NV
bei OPENGL Games wird es umgekehrt sein - zugunsten NV und ATI hinkt hinterher.
ansonsten gleichauf - nur mit AA + AF war immer schona ATI ne Kantenbreite voraus. :biggrin:
Besser wäre es für ATI allemal auch mal recht schnell und lieferbar ne gscheite Middle Karte zu relaisen; und das auf PCI -E + AGP :smile:
denke das wird aber die X1700 XT richten; Anfang März könnte es dann schon soweit sein. :eek:
ZEIT wäre es ALLEMAL !!!

seahawk
2006-01-07, 20:33:03
Ja, habs auch schon gesehen.
http://www.beyond3d.com/forum/showpost.php?p=666810&postcount=471

7800GTX512 ave FPS: 36
X1800XT ave FPS: 39
X1900XTX ave FPS: 49

Das sind immerhin (fast) 40% mehr, als die "GTX 512" erreicht, und das trotz eines geringerem Speichertaktes, welcher bei solchen Einstellungen sicherlich nicht unerheblich ist. Mehr war IMHO nicht zu erwarten. Man muss erstmal abwarten, wie sich G71 verhält, immerhin kann man die Speicherbandbreite kaum noch erhöhen.

Das bedeutet aber dass die dreifache ALU Leistung nur in einen Zugewinn von ca. 25% umschlägt. Gehen wir von einer G70 mit 32 Pipes aus, dann müßte diese ja logischerweise rund 30% gegenüber einer 24 Pipeversion zulegen. Dürfte also auch auf ein ähnliches Niveau kommen. (besonders wenn man die realtiv geringe Bandbreitenempfindlichkeit der 512MB GTX sieht, die weiterhin stärker über eine Erhöhung der GPU Frequenz, als über eine Erhöhung des Speichertaktes gewinnt)

Man muss wohl bedenken, dass die vergleichsweise geringe ALU Leistung der R520 in einiger Hinsciht im Hinblick auf die PErfomance Fluch und Segen zu gleich ist. Textureops werden, wie sage ich das jetzt, besser "versteckt" und limtieren später. Mit dem dreifachen an ALU Power könnte dieser Faktor plötzlich eine viel größere Rolle spielen. Rein theoretisch ist daher die Leistung einer 32Pipe G70 Variante sicherer vorherzusagen, als die eines R580s.

Ailuros
2006-01-08, 00:27:17
Nebenbei FEAR auf einer uebertakteten G70 etwas ausfuehrlicher:

Ailuros
2006-01-08, 01:07:50
Ich habe keine Glaskugel. Und ich weiß auch nicht, wie stark G71 durch die kaum mehr steigerungsfähige Banbreite behindert wird, aber ich weiß, dass eine erhöhung der Füllrate um 40% noch lange keine Leistungssteigerung von 40% bedeutet.

Wie seahawk oben schon erwaehnte, hat die GTX 512 immer noch Luftraum mit hoeheren Taktraten und gleichen Speicherfrequenzen immer noch gesund Leistung dazuzugewinnen, was wohl heisst dass diese mit Bandbreite ueberfuettert ist.

Da es um Fear geht, siehe die Relevanz der "Fuellrate" im Graph oben.

Das ist logisch. Wenn du Core- und Speichertakt um 15% erhöhst, muss zwangsläufig eine Leistungssteigerung von ca. 15% eintreten, sofern die CPU nicht limitiert. Ebenso ist es logisch, dass eine erhöhung des Speichertaktes alleine weniger bringt.

Waere eine GPU sehr Bandbreiten-limitiert, dann wuerde die Erhoehung des Speichertaktes auch mehr bringen als nur die Taktrate. Allein hoehere Taktrate bringt im Durchschnitt gute 10%.

Viel intressanter wäre, wenn du ausschließlich den Coretakt erhöhen würdest, denn dadurch könnte man den G71 simulieren, wobei du mit deinem G70 natürlich kaum eine derart hohe Füllrate erreichen wirst.

Da wir schon bei FEAR sind:

1600/4xAA/16xAF

430/600MHz: 24 fps
490/600MHz: 26 fps
430/685MHz: 26 fps
490/685MHz: 28 fps

reunion
2006-01-08, 11:39:13
http://img321.imageshack.us/img321/3235/e8593141860f7a69148dcb92c9559f.jpg

Wenn ich mir dieses Pic ansehe, stellt sich mir doch gleich mal die Frage, warum trotz einer verdreifachung der ALUs, und höheren Taktraten die Pixelshaderpower laut ATI(!) nicht verdreifacht wird. Die GFLOPs werden gerade einmal verdoppelt.

Gandharva
2006-01-08, 11:44:07
http://img225.imageshack.us/img225/9356/x1900a0sb.th.jpg (http://img225.imageshack.us/my.php?image=x1900a0sb.jpg) http://img202.imageshack.us/img202/6568/x1900b3up.th.jpg (http://img202.imageshack.us/my.php?image=x1900b3up.jpg)

http://img202.imageshack.us/img202/2766/x1900c9fs.th.jpg (http://img202.imageshack.us/my.php?image=x1900c9fs.jpg) http://img202.imageshack.us/img202/6852/x1900d0ez.th.jpg (http://img202.imageshack.us/my.php?image=x1900d0ez.jpg)

Speicher:

K4J52324QC-BJ12
800MHz
1.6Gbps/pin
2.0V± 0.1V
136 Ball FBGA

Gast
2006-01-08, 11:46:09
Vermutlich liegt das an der Art, wie ATi ihre FLOPs definiert.

Vermutung R520:
4*4*Vec4 MADD
4*4*Vec4 ADD
4*4*Vec4 TEX
4*4 Flow-Control
und eventuell rechnen sie auch noch die VS hinzu, das wären nochmal mind.
8*Vec5 jeweils pro Takt.

Beim R580 verdreifacht sich nur Vec4 MADD und Vec4 ADD, der Rest bleibt gleich.



*spekulierend*
Q

reunion
2006-01-08, 12:08:36
Wie seahawk oben schon erwaehnte, hat die GTX 512 immer noch Luftraum mit hoeheren Taktraten und gleichen Speicherfrequenzen immer noch gesund Leistung dazuzugewinnen, was wohl heisst dass diese mit Bandbreite ueberfuettert ist.


Die Frage ist nur, wieviel Luft sie noch hat.


Da es um Fear geht, siehe die Relevanz der "Fuellrate" im Graph oben.


Wenn ich mir deinen Graph dort oben ansehe, deutet eigentlich alles auf eine extreme Bandbreitenlimitierung hin. Oder wie erklärst du dir sonst, dass das Teil bei AF kaum Leistung verliert, während es bei AA zu starken Leistungverlusten kommt?


Da wir schon bei FEAR sind:

1600/4xAA/16xAF

430/600MHz: 24 fps
490/600MHz: 26 fps
430/685MHz: 26 fps
490/685MHz: 28 fps

Hier scheint die Füllrate, und die Bandbreite gleichermaßen zu limitieren, da sowohl eine Erhöhung der Füllrate, als auch der Bandbreite um ca. 15% die jeweils gleiche Performancesteigerung mit sich bringt.

Doch wenn bei G71 die Füllrate um >=50% erhöht wird, während die Bandbreite konstant bleibt, sollte der Chip doch relativ stark durch die Bandbreite behindert werden. Du könntest das eigentlich auch simulieren, indem du ein ähnliches Füllraten-/Bandbreiten-Verhältnis wie bei G71 herstellst.

reunion
2006-01-08, 12:11:30
Speicher:

K4J52324QC-BJ12
800MHz
1.6Gbps/pin
2.0V± 0.1V
136 Ball FBGA

Schade, noch immer der 2V RAM.

Vermutlich liegt das an der Art, wie ATi ihre FLOPs definiert.

Vermutung R520:
4*4*Vec4 MADD
4*4*Vec4 ADD
4*4*Vec4 TEX
4*4 Flow-Control
und eventuell rechnen sie auch noch die VS hinzu, das wären nochmal mind.
8*Vec5 jeweils pro Takt.

Beim R580 verdreifacht sich nur Vec4 MADD und Vec4 ADD, der Rest bleibt gleich.


*spekulierend*
Q

Ja, das wäre eine Erklärung.

Gast
2006-01-08, 12:19:15
Gibt es mittlerweile gesicherte Daten zum Erscheinungstermin? 24. Januar oder doch später?

Wie werden die Preise aussehen? Wenn die X1900 den X1800 ersetzen soll, dann würden die Preise doch ähnlich ausfallen? Zumindest die X1900 XT sollte so um 500 € liegen, die XTX etwas höher, oder?

Gast
2006-01-08, 12:24:58
Ich denke mal, die Preise werden sich daran orientieren, was die Konkurrenz verlangt und wie groß die Lagerbestände des R520 noch sind. Man wird kaum seine eigenen Verkäufe kannibalisieren wollen, das wäre ja auch ziemlich dumm. Schließlich kann man Mehrpreis prima über Mehrleistung rechtfertigen.


Q

Gandharva
2006-01-08, 12:36:43
Gibt es mittlerweile gesicherte Daten zum Erscheinungstermin? 24. Januar oder doch später?

Wie werden die Preise aussehen? Wenn die X1900 den X1800 ersetzen soll, dann würden die Preise doch ähnlich ausfallen? Zumindest die X1900 XT sollte so um 500 € liegen, die XTX etwas höher, oder?- Voraussichtlich Verfügbar: Ende Januar (25.01.06)
- Preis X1900XTX: 699€

Gandharva
2006-01-08, 12:42:36
Schade, noch immer der 2V RAM.GDDR4 wird nicht mehr lange auf sich warten lassen. Aber momentan gibt es einfach nichts anderes in Massenproduktion. Hynix hat GDDR3 1,2ns und Samsung GDDR3 1,1ns in Produktion. Beide mit je 2,0V.

Gast
2006-01-08, 12:50:55
Preis X1900XTX: 699€

Ganz schön teuer...

Die XT Version dürfte abgesehen von den Taktraten keine Unterschiede zur XTX Version aufweisen, oder?

Dann wäre es womöglich günstiger, XT zu kaufen und XTX-Taktraten zu flashen. :)

Gandharva
2006-01-08, 12:57:20
Die XT Version dürfte abgesehen von den Taktraten keine Unterschiede zur XTX Version aufweisen, oder?Beim Speicher (1,2ns) dürfte es sich sogar um den gleichen handeln, wenn die bisherigen Taktspekulationen stimmen.

Gast
2006-01-08, 15:39:09
699Euro....wenn die echt so teuer ist kann ich nur empfehlen auf die 7900 zu warten. Die wird zu 99,999999% schneller sein und auch so um die 700 kosten.... DIE WILL ICH:D

Franzmann-Jan
2006-01-08, 15:45:51
auf die 99,9 % von einem Gast kann man sich bestimmt verlassen :rolleyes: .

andererGast
2006-01-08, 15:48:29
Warum müssen so manche registrierte Nutzer eigentlich immer auf den Gästen rumhauen? Das muss doch nun wirklich nicht sein...

Wenn du seine Aussage anzweifelst (was ich nun wirklich sehr gut verstehen kann ;) ), dann tue dies ohne dabei andere Gäste indirekt anzugreifen.

Gast
2006-01-08, 15:48:47
Bin nur nicht angemeldet....um himmels Willen wer glaubt die X1900 überholt die 7800GTX 512 und die 7900Ultra?

Gast
2006-01-08, 15:49:42
Es wird wie immer so sein, dass manchmal die Geforce und manchmal die Radeon schneller ist....

Gast
2006-01-08, 15:53:17
Ja klar nur eben gehts jetzt erstmal nur um jetzt: Die GTX 512 ist momentan klar die schnellste. Die X1900 kann da bestimmt gut aufholen, aber ne (wahrscheinlich!?) sehr hoch getaktete 7900 wird da bestimmt wieder vorbei ziehn.

deekey777
2006-01-08, 15:55:49
Warum müssen so manche registrierte Nutzer eigentlich immer auf den Gästen rumhauen? Das muss doch nun wirklich nicht sein...

Wenn du seine Aussage anzweifelst (was ich nun wirklich sehr gut verstehen kann ;) ), dann tue dies ohne dabei andere Gäste indirekt anzugreifen.

Wenn du glaubst, daß ein Posting gemeldet werden muß: http://www.forum-3dcenter.org/vbulletin/showthread.php?t=261891 :)

Ja klar nur eben gehts jetzt erstmal nur um jetzt: Die GTX 512 ist momentan klar die schnellste. Die X1900 kann da bestimmt gut aufholen, aber ne (wahrscheinlich!?) sehr hoch getaktete 7900 wird da bestimmt wieder vorbei ziehn.

Zu diesem Zeitpunkt vielleicht, doch die Spiele bewegen sich in Richtung Shaderlastigkeit, es läßt sich nicht mehr so einfach sagen, daß heute Verhältnisse in der Ultrahighend-Klasse auch in sechs Monaten immer noch gelten (auch wenn dieses Klientel die Grafikkarten wie Unterhosen wechselt: alle sechs Monate :D ).

reunion
2006-01-08, 16:00:12
- Preis X1900XTX: 699€


Das ist bestenfalls utopie.
Es gibt bereits mehrere verlässliche Quellen, die unabhängig voneinander von einem Preis deutlich unter der GTX 512 sprechen.

reunion
2006-01-08, 16:01:50
GDDR4 wird nicht mehr lange auf sich warten lassen. Aber momentan gibt es einfach nichts anderes in Massenproduktion. Hynix hat GDDR3 1,2ns und Samsung GDDR3 1,1ns in Produktion. Beide mit je 2,0V.

Richtig, mein Fehler.
Samsung stellt auch noch 1.8V GDDR3 her, aber der geht leider nur bis 700Mhz.

Coda
2006-01-08, 16:16:39
Wenn ich mir dieses Pic ansehe, stellt sich mir doch gleich mal die Frage, warum trotz einer verdreifachung der ALUs, und höheren Taktraten die Pixelshaderpower laut ATI(!) nicht verdreifacht wird. Die GFLOPs werden gerade einmal verdoppelt.Kann ja sein, dass das keine theoretischen sondern praktische Werte sind, oder?

Gandharva
2006-01-08, 21:25:08
Das ist bestenfalls utopie.
Es gibt bereits mehrere verlässliche Quellen, die unabhängig voneinander von einem Preis deutlich unter der GTX 512 sprechen.Gib mal bitte an deine Quelle(n)?!

SAPPHIRE Radeon X1900XT - 512M GDDR3 - PCI-E / Dual DVI /VIVO -> 629.00€ (http://www.grosbill.com/index.php3?id=34640&site=ruehardware)
SAPPHIRE Radeon X1900XTX - 512M GDDR3 - PCI-E / Dual DVI /VIVO -> 719.00€ (http://www.grosbill.com/index.php3?id=34643&site=ruehardware)

Wer sofort haben will muss löhnen. Wie immer. Die XTX ist IMO ein schlechter Witz seitens ATI.

Gast
2006-01-08, 21:25:48
Kann man denn davon ausgehn, dass der R580 sich wieder in Richtung der X800er Reihe bewegt, was den Stromverbrauch angeht? Ich meine hier ein bisschen mehr, beim nächsten Chip noch ein bisschen mehr, das summiert sich auch.

Gandharva
2006-01-08, 21:43:53
Kann man denn davon ausgehn, dass der R580 sich wieder in Richtung der X800er Reihe bewegt, was den Stromverbrauch angeht?Nein. Zumindest deutet nichts darauf hin. Eher das Gegenteil wird der Fall sein.

nagus
2006-01-08, 22:05:58
Originally Posted by T-Spoon (Rage3d.com Board)

I can just quote myself for the moment:

F.E.A.R., A64 4000+ at 1600x1200, 4xAA/8xAF, Max Detail (no softshadows)
7800GTX512 ave FPS: 36
X1800XT ave FPS: 39
X1900XTX ave FPS: 49

GTX512 using Q settings instead of HQ in controlpanel.

VoodooJack
2006-01-08, 22:31:38
Originally Posted by T-Spoon (Rage3d.com Board)

I can just quote myself for the moment:

F.E.A.R., A64 4000+ at 1600x1200, 4xAA/8xAF, Max Detail (no softshadows)
7800GTX512 ave FPS: 36
X1800XT ave FPS: 39
X1900XTX ave FPS: 49

GTX512 using Q settings instead of HQ in controlpanel.

Dann hat ja der Inquirer schamlos untertrieben ;D , als er das hier sagte:

We can tell you for sure that Radeon X19000 XTX is beating GTX 512 from 25 per cent to even more, but figures may vary.

Godmode
2006-01-08, 22:41:18
Dann hat ja der Inquirer schamlos untertrieben ;D , als er das hier sagte:

We can tell you for sure that Radeon X19000 XTX is beating GTX 512 from 25 per cent to even more, but figures may vary.

Naja in FEAR, extrem Shaderlimitiert, aber ich denke auch dass hier selbst ein G71 Probleme haben wird(in FEAR) die X1900 zu überholen, mal abwarten.

Coda
2006-01-08, 22:50:18
Kann man denn davon ausgehn, dass der R580 sich wieder in Richtung der X800er Reihe bewegt, was den Stromverbrauch angeht? Ich meine hier ein bisschen mehr, beim nächsten Chip noch ein bisschen mehr, das summiert sich auch.Eher nochmal 10W mehr. Das Ding hat 30% mehr Transistoren bei gleicher Taktraten und gleichem Prozess.

VoodooJack
2006-01-08, 22:50:50
Naja in FEAR, extrem Shaderlimitiert.

Mal abgesehen davon, dass FEAR ein Schlüsselspiel ist in Bezug auf die Richtung kommender Spiele, hat der Inquirer bei seiner allgemein gehaltenen Aussage offensichtlich an viel mehr Spiele gedacht.

deekey777
2006-01-08, 22:54:43
Eher nochmal 10W mehr. Das Ding hat 30% mehr Transistoren bei gleicher Taktraten und gleichem Prozess.

Dann wird der Chip allein bis zu 60W schlucken, wenn nicht noch etwas mehr.

Gast
2006-01-08, 23:02:44
Mal abgesehen davon, dass FEAR ein Schlüsselspiel ist in Bezug auf die Richtung kommender Spiele, hat der Inquirer bei seiner allgemein gehaltenen Aussage offensichtlich an viel mehr Spiele gedacht.
Mit FSAA stimmt da aber irgendwas nicht so ganz. Da wird aus Shaderlimitiert auf einmal eher ein "Grundlos Limitiert".


*forschend*
Q

Ailuros
2006-01-09, 02:19:00
Die Frage ist nur, wieviel Luft sie noch hat.

Genug dass etwa 10GB/sec im Ueberfluss liegen.

Wenn ich mir deinen Graph dort oben ansehe, deutet eigentlich alles auf eine extreme Bandbreitenlimitierung hin. Oder wie erklärst du dir sonst, dass das Teil bei AF kaum Leistung verliert, während es bei AA zu starken Leistungverlusten kommt?

Schatten u.a. und auch die bis zu 7:1 ALU/TEX Relation in FEAR.

2048*1536 1xAA/1xAF bilinear:

430/600MHz: 34 fps
490/600MHz: 37 fps (+14% fill. = +9% Leistung)
430/685MHz: 35 fps (+14% band. = +3% Leistung)
490/685MHz: 39 fps (+14% fill/band. = + 15% Leistung)
490/550MHz: 36 fps (+14% fill, -8% band. = +6% Leistung)

Hier scheint die Füllrate, und die Bandbreite gleichermaßen zu limitieren, da sowohl eine Erhöhung der Füllrate, als auch der Bandbreite um ca. 15% die jeweils gleiche Performancesteigerung mit sich bringt.

Siehe oben.

Doch wenn bei G71 die Füllrate um >=50% erhöht wird, während die Bandbreite konstant bleibt, sollte der Chip doch relativ stark durch die Bandbreite behindert werden. Du könntest das eigentlich auch simulieren, indem du ein ähnliches Füllraten-/Bandbreiten-Verhältnis wie bei G71 herstellst.

R580 und G71 werden beide Bandbreiten-limitiert sein bis schnellerer Speicher zur Verfuegung steht. Siehe nochmal oben.

***edit: zur Vereinfachung 490/550MHz hat eine ~3:1 Bandbreiten zu Fuellraten Relation wie auch theoretisch 600(*32)/900MHz haben wuerde.

Banshee18
2006-01-09, 05:22:53
Ein paar Dinge sind mir unklar:
R580 wird 3 mal so viele ALUs wie R520 haben, das wars dann auch im Großen und Ganzen. Wie kann der R580 dann so viel schneller sein, wo kaum Spiele shaderlimitiert sind?
Nehmen wir als Beispiel F.E.A.R.
Wenn es wirklich so shaderlimitiert wäre, müsste sich der G70 doch stark absetzen, oder?

Gast
2006-01-09, 08:39:17
7:1 ALU/TEX ist gar nichts. Oder ist damit reale Zeit und nicht Instruktionen gemeint?

Ansonsten haben andere moderne Spiele teilweise >15 ALU-Instr. auf eine TEX.
Wenn ich Zeit habe, poste ich nachher mal die Ergebnisse aus FEAR, die ich gestern dummerweise liegen gelassen habe. Ich habe da mal die Füllrate zurückgenommen und auf den FSAA-Einbruch geschaut.


Q

Gast
2006-01-09, 10:54:46
So, jetzt:

FEAR 1600x1200, alle Details (auch Physik und Sound) an, bis auf Softshadows. Pixel-Doubling und DX8-Shaders natürlich aus. Treiber 81.89, erst alle Optimierungen deaktiviert, Clamp an, Vsync aus, dann auf HQ. Alle Settings in-Game.


bilinear/no AA bilinear/4xAA
GTX-512@ 580 MHz: 68 fps 34 fps
GTX-512@ 500 MHz: 60 fps 31 fps
GTX-512@ 400 MHz: 49 fps 26 fps
GTX-512@ 300 MHz: 37 fps 20 fps

Alles mit der jeweils gleichen Bandbreite von 880 MHz * 256 Bit DDR = 56 GB/s, die mit entsprechend hohem Chiptakt offensichtlich für bis zu 34 FPS gut sind. Allerdings bricht die Leistung trotz hoher Bandbreite durch die Bank um ~50% ein.

Da ist irgendwas anderes los, als knappe Bandbreite. Vielleicht läuft da irgendein Buffer über für Early-Z-Out oder sowas. In 1280x960 sind es ähnliche ~50% Einbruch.


*verwundert*
Q

Ailuros
2006-01-09, 11:23:32
Lass mal den Takt bei default und takte den Speicher auf 750MHz.

Gast
2006-01-09, 12:46:23
Wozu?

Ailuros
2006-01-09, 13:20:11
Wozu?

Um herauszustellen ob die GPU wirklich 56+GB/s braucht.

dildo4u
2006-01-09, 14:10:32
Hier sind auch endlich mal ein Paar Theoretische Tests mit dabei.

http://666kb.com/i/113fr0srdf6rl.jpg

Wäre Interresant wenn mal jemand mit einer X1800XT oder einer 7800GTX auch alle Test durchlaufen lassen könnte.


http://www.pcpop.com/doc/App/125255/000219388.html

Ailuros
2006-01-09, 14:13:06
16% schneller im PS Test als eine 7800 GTX 512.

Sonst ist der complex VS Test wie man ihn erwarten wuerde und der einfache VS Test zeigt eben an dass es hoechstwahrscheinlich 10 VS@650MHz Einheiten sind.

Ronny145
2006-01-09, 14:14:58
Ist die Karte übertaktet gewesen? Rechts oben steht XT. Ob der XT oder XTX Takt genommen wurde wäre interessant zu wissen.

Coda
2006-01-09, 14:16:16
Der Pixel Shader Score ist sehr hoch. Da kommt ne X1800XT nur auf ~250 fps. Fillrate ist wie zu erwarten gleich geblieben.

Sonst ist der complex VS Test wie man ihn erwarten wuerde und der einfache VS Test zeigt eben an dass es hoechstwahrscheinlich 10 VS@650MHz Einheiten sind.Glaube ich irgendwie nicht. ATi ist was die Erweiterung des Vertexshaders angeht vermutlich eher inflexibel. Außerdem hatte auch schon R520 mehr als reichlich Vertexleistung.

Ailuros
2006-01-09, 14:20:41
Ist die Karte übertaktet gewesen? Rechts oben steht XT. Ob der XT oder XTX Takt genommen wurde wäre interessant zu wissen.

Nach den MT Fuellraten sieht es nach 650MHz aus; ich sehe keine Uebertaktung.

dildo4u
2006-01-09, 14:23:16
Glaube ich irgendwie nicht. ATi ist was die Erweiterung des Vertexshaders angeht vermutlich eher inflexibel. Außerdem hatte auch schon R520 mehr als reichlich Vertexleistung.
Jo hier steht auch über all 8 denke mal das damit die VS Einheiten gemeint sind.
http://www.pcpop.com/doc/App/125255/000219571.html

Ailuros
2006-01-09, 14:24:32
Glaube ich irgendwie nicht. ATi ist was die Erweiterung des Vertexshaders angeht vermutlich eher inflexibel. Außerdem hatte auch schon R520 mehr als reichlich Vertexleistung.

Schoen. Dann erklaer mir aber die Unterschiede in den VS Tests hier:

http://www.techreport.com/reviews/2005q4/geforce-7800gtx-512/3dm-vertex-simple-1024.gif

http://www.techreport.com/reviews/2005q4/geforce-7800gtx-512/3dm-vertex-complex-1024.gif

http://www.techreport.com/reviews/2005q4/geforce-7800gtx-512/index.x?pg=11

Nach dem pcpop Zeug oben sind es 143.6 fps im simple VS gegen 88.9 fuer X1800XT, waehrend complex VS bei 61.9 gegen 57.8 fps fuer X1800XT.

Ailuros
2006-01-09, 14:26:17
Jo hier steht auch über all 8 denke mal das damit die VS Einheiten gemeint sind.
http://www.pcpop.com/doc/App/125255/000219571.html


In dem Mist steht aber auch 750MHz fuer G71 drin LOL ;)

dildo4u
2006-01-09, 14:30:07
In dem Mist steht aber auch 750MHz fuer G71 drin LOL ;)
Ja und NV ist mit der G70 in 110nm bis auf fast 600mhz Chip gekommen.(Siehe Xfx 7800GTX512 XXX oder die Evga mit 600mhz)http://www.hardwareluxx.de/story.php?id=3156

Selbst wenn die Karte 32 Pipes hat sollte eine Steigerung um 150mhz drinn sein.

Ronny145
2006-01-09, 14:31:28
Nach den MT Fuellraten sieht es nach 650MHz aus; ich sehe keine Uebertaktung.


Unübertaktet wären 625 Mhz, falls es die XT ist.

Ailuros
2006-01-09, 14:40:38
Unübertaktet wären 625 Mhz, falls es die XT ist.

R520 landet leicht hoeher MT Raten in 3dmark05 als sie theoretisch eigentlich hat (10111 wobei 16*625 = 10000). Falls dieses auch der Fall sein sollte auf R580 koennten es durchaus 625MHz sein; oder dieser chip zeigt dann eine =/>95% Fuellraten Effizienz wie andere chips auch.

Ailuros
2006-01-09, 14:43:31
Ja und NV ist mit der G70 in 110nm bis auf fast 600mhz Chip gekommen.(Siehe Xfx 7800GTX512 XXX oder die Evga mit 600mhz)http://www.hardwareluxx.de/story.php?id=3156

Selbst wenn die Karte 32 Pipes hat sollte eine Steigerung um 150mhz drinn sein.

Ich bin momentan noch nicht so optimistisch denn es handelt sich beim G71 wieder um einiges hoehere Chipkomplexitaet. Unter 380M wenn nicht gleich 400M kann ich mir schwer vorstellen bei 8 quads. Wieso jetzt ploetzlich 700 oder sogar 750MHz ploetzlich ein "Kinderspiel" sein sollte ist mir fremd. Moeglich ist schon beides, aber dann eben mit monstroesen Kuehlungsloesungen und ultra-bekloppter Verfuegbarkeit.

reunion
2006-01-09, 14:59:00
Ja und NV ist mit der G70 in 110nm bis auf fast 600mhz Chip gekommen.(Siehe Xfx 7800GTX512 XXX oder die Evga mit 600mhz)http://www.hardwareluxx.de/story.php?id=3156

Selbst wenn die Karte 32 Pipes hat sollte eine Steigerung um 150mhz drinn sein.

Toller Vergleich. ATi erreichte sogar mit 130nm 540Mhz und das verfügbar, dann müsste ja mit 90nm mindestens 1Ghz drin sein! Wie du siehst, sind solche Vergleiche sinnlos, man sollte sich bei der zu erwartenden ähnlichen Komplexität wie bei R580 auch an dessen Taktraten orientieren IMHO.
Und deine 600Mhz sind ja wohl auch ein schlechter Scherz, selbst die 550Mhz-Version ist wenig bis gar nicht lieferbar.

reunion
2006-01-09, 15:08:10
Kann ja sein, dass das keine theoretischen sondern praktische Werte sind, oder?

Unrealistisch IMHO, bei solchen Marketingdokumenten wird eigentlich immer der Peakwert genommen - oft sogar mehr als das. :D

Gast
2006-01-09, 15:36:58
Schoen. Dann erklaer mir aber die Unterschiede in den VS Tests hier:

http://www.techreport.com/reviews/2005q4/geforce-7800gtx-512/3dm-vertex-simple-1024.gif

http://www.techreport.com/reviews/2005q4/geforce-7800gtx-512/3dm-vertex-complex-1024.gif

http://www.techreport.com/reviews/2005q4/geforce-7800gtx-512/index.x?pg=11

Nach dem pcpop Zeug oben sind es 143.6 fps im simple VS gegen 88.9 fuer X1800XT, waehrend complex VS bei 61.9 gegen 57.8 fps fuer X1800XT.
Schau dir mal die Werte der X1600 XT an. Wenn die stimmen und es weiterhin stimmt, dass der RV530 der Technologieträger für die R580 ist, dann glaube ich weiterhin an acht VS @ ~650 MHz.


Q

seahawk
2006-01-09, 16:06:27
Es ist halt die Frage ob die VS beim R520 wirklich der limtierende Faktor beim 3Mark PS-Test sind.

Man beachte dazu mal die Ergebnisse der X1600XT.

nagus
2006-01-09, 23:01:26
http://img364.imageshack.us/img364/3292/r5805gy.png

...adieu nvidia 7800GTX512 ;)

Blaire
2006-01-09, 23:07:58
http://img364.imageshack.us/img364/3292/r5805gy.png

...adieu nvidia 7800GTX512 ;)

Das ist auch nicht der Gegner, dies wird der G71 :D

deekey777
2006-01-09, 23:13:20
http://img364.imageshack.us/img364/3292/r5805gy.png

...adieu nvidia 7800GTX512 ;)

Spielst du oft 3DMarks?

Godmode
2006-01-09, 23:13:26
http://img364.imageshack.us/img364/3292/r5805gy.png

...adieu nvidia 7800GTX512 ;)

Die PS Leistung wurde um 86,5 % erhöht, jetzt frag ich mich ob das gut oder schlecht ist. Die PS einheiten wurden ja verdreifacht?

Naja die GTX512 wird ja anscheinend im März durch den G71 abgelöst.

Ailuros
2006-01-10, 01:57:18
Schau dir mal die Werte der X1600 XT an. Wenn die stimmen und es weiterhin stimmt, dass der RV530 der Technologieträger für die R580 ist, dann glaube ich weiterhin an acht VS @ ~650 MHz.


Q

Wieviel VS Einheiten hat denn eigentlich RV560 (ehrliche Frage denn zu faul zum suchen *hust*)? Ansonsten hab ich dessen Resultate tatsaechlich uebersehen.

deekey777
2006-01-10, 02:09:41
Wieviel VS Einheiten hat denn eigentlich RV560 (ehrliche Frage denn zu faul zum suchen *hust*)? Ansonsten hab ich dessen Resultate tatsaechlich uebersehen.

Eigentlich 5VS.

Ailuros
2006-01-10, 02:22:29
Eigentlich 5VS.

Dann hat Mr.Q wohl auch recht und es sind nur 8 VS.

Coda
2006-01-10, 02:22:57
Die VS Ergebnisse sind komisch. Das würden ja mindestens 12 VS sein. Wozu ATi?

Ailuros
2006-01-10, 02:32:47
Die VS Ergebnisse sind komisch. Das würden ja mindestens 12 VS sein. Wozu ATi?

Quasar hat aber recht. Ich hab dummerweise selber die X1600 VS Resultate uebersehen. Wenn das Ding mit nur 5 VS etwa 88% einer R520 schafft, wuerde es mich nicht wundern wenn eine R580 doppelt so viel (mit 8 VS) als der RV530 landet.

Banshee18
2006-01-10, 04:45:56
Ein paar Dinge sind mir unklar:
R580 wird 3 mal so viele ALUs wie R520 haben, das wars dann auch im Großen und Ganzen. Wie kann der R580 dann so viel schneller sein, wo kaum Spiele shaderlimitiert sind?
Nehmen wir als Beispiel F.E.A.R.
Wenn es wirklich so shaderlimitiert wäre, müsste sich der G70 doch stark absetzen, oder?
Schön, dass hier so auf Fragen eingegangen wird. :P
Dürfen nur Profis an der Diskussion teilnehmen?

seahawk
2006-01-10, 07:39:02
Die VS Ergebnisse sind komisch. Das würden ja mindestens 12 VS sein. Wozu ATi?

8 RV530 artige VS sollten auch reichen. Momentan beschäftige ich allerdings mit der Warum-Frage. Was haben die VS des RV530 was die des R520 nicht haben.

Gandharva
2006-01-10, 08:39:48
ATi's Rodin Rodeo (or saddle-up and grab yourself some RADEON X1900 benchmarks!) (http://www.hexus.net/content/item.php?item=4346)

Futuremark 3DMark 05

ATi RADEON X1900 XT 512MB CrossFire (625MHz VPU / 1450MHz GDDR-3) (not XTX) (AMD A64 FX-57 2.8GHz)
13,501 3DMarks for $1098 (£622.01)

NVIDIA GeForce 7900 512MB (700MHz GPU / 1800MHz GDDR-3 (not GDDR-3+) (AMD A64 FX-60 2.8GHz)
~13,000 3DMarks (?)

NVIDIA GeForce GTX 512MB SLi (550MHz GPU / 1200MHz GDDR-3) (AMD A64 FX-57 2.8GHz)
12,200 3DMarks for $1,439.61 (£815.58)

ATi RADEON X1800 XT 512MB CrossFire (625MHz VPU / 1500MHz GDDR-3) (MESH Computers TITAN X1800 FIRE - AMD A64 X2 4600+ 2.4GHz)
12,050 3DMarks for $1071.16 (£606.78)

ATi RADEON X1900 XTX 512MB (650MHz VPU / 1550MHz GDDR-3) (AMD A64 FX-57 2.8GHz)
11,149 3DMarks for $649 (£367.67)

NVIDIA GeForce GTX 512MB (580MHz VPU / 1703MHz GDDR-3) (ARMARI Pantheon-FX-2.8GHz)
10,062 3DMarks

ATi RADEON X1900 XT 512MB (625MHz VPU / 1450MHz GDDR-3) (AMD A64 FX-57 2.8GHz)
~10,000 3DMarks for $549 (£311.04)

NVIDIA GeForce GTX 512MB (550MHz GPU / 1700MHz GDDR-3) (AMD A64 FX-57 2.8GHz)
9,608 3DMarks for $719.81 (£407.79)

ATi RADEON X1800 XT 512MB (625MHz VPU / 1500MHz GDDR-3) (AMD A64 FX-57 2.8GHz)
9,271 3DMarks for $535.56 (£303.39)

ATi RADEON X1800 XT 512MB (625MHz VPU / 1500MHz GDDR-3) (MESH Computers TITAN X1800 FIRE - AMD A64 X2 4600+ 2.4GHz)
8,544 3DMarksNVIDIA GeForce 7900 512MB SLi würde dann theoretisch bei 16500 Punkten liegen.

Botcruscher
2006-01-10, 08:53:06
Bei den Preisen giebts doch hoffentlich die CPU mit dazu. :D

Gast
2006-01-10, 10:02:57
Schön, dass hier so auf Fragen eingegangen wird. :P
Dürfen nur Profis an der Diskussion teilnehmen?
Das kommt auf die Art der Shader und das Verhältnis der Rechen- und Texturinformationen an, wie sehr sie sich absetzen kann. In den Demos von FEAR waren es etwa 50%, die sich eine 7800 GTX (256MB, 430MHz) von der X1800XT (512 MB, 625MHz) absetzen konnte, wenn nur die Shader am Ergebnis beteiligt waren.


Aber das stand hier eigentlich schon auf den Seiten zuvor, nur etwas zwischen den Zeilen.


Q

Ailuros
2006-01-10, 11:42:49
8 RV530 artige VS sollten auch reichen. Momentan beschäftige ich allerdings mit der Warum-Frage. Was haben die VS des RV530 was die des R520 nicht haben.

Die VS duerften identisch sein. Irgend was ist intern in der Architektur effizienter, dass einfache VS calls sich besser ihre Beine strecken koennen.

Ailuros
2006-01-10, 11:58:37
Ein paar Dinge sind mir unklar:
R580 wird 3 mal so viele ALUs wie R520 haben, das wars dann auch im Großen und Ganzen. Wie kann der R580 dann so viel schneller sein, wo kaum Spiele shaderlimitiert sind?
Nehmen wir als Beispiel F.E.A.R.
Wenn es wirklich so shaderlimitiert wäre, müsste sich der G70 doch stark absetzen, oder?

Also nachtraeglich obwohl die Frage schon zwischen den Zeilen mehr als einmal beantwortet wurde. Zaehlt man jetzt das meiste in der PS pipeline mit sind es unter Bedingungen etwa 120GFLOPs fuer R520 und genauso unter Bedingungen etwa 165GFLOPs fuer G70@430 (210 fuer 550MHz). Kann jetzt in einem rein theoretischen Fall eine Radeon ihre extra ADDs voll ausnutzen und G70 wird von texture OPs aufgehalten, kommt man in etwa auf die gleiche Rate.

Ohne AA/AF liegt die 512GTX bei 64 fps (1600*1200) gegen 51 fps auf der X1800XT (ergo +25% fuer die 512 GTX); setzt man jetzt AA/AF ein faellt die 512GTX auf 35 fps und die X1800XT auf 39 fps (ergo um 11% schneller).

Nach den Resultaten von R580 die noch nicht sicher sind erreicht diese mit AA/AF in 1600/Fear ganze 49 fps (ohne besonders hoehere Fuellrate oder Bandbreite wie R520), eben durch die erhoehte ALU-Leistung, was sich aber in diesem Fall in 26% mehr Leistung entziffert. Ohne AA/AF duerfte die Leistungssteigerung natuerlich um einiges hoeher sein. Ich wuerde irgendwo in der =/>70 fps Richtung schaetzen, was immerhin schon ca. +40% sind im Vergleich zu R520.

ShadowXX
2006-01-10, 12:04:19
....Ohne AA/AF duerfte die Leistungssteigerung natuerlich um einiges hoeher sein. Ich wuerde irgendwo in der =/>70 fps Richtung schaetzen, was immerhin schon ca. +40% sind im Vergleich zu R520.

Ist das aber nicht relativ wenig, wenn man bedenkt, das die PS verdreifacht wurden?

Anders gesagt: Musste ATI die PS verdreifachen, um überhaupt einen wirklich sichtbaren Gewinn hinzubekommen und wenn Sie nur 2 PS pro Pipe (Wie nV) genommen hätten, wäre dies in Benchmarks kaum aufgefallen?

Gast
2006-01-10, 12:08:57
Soweit ich weiß, sind diese Werte inkl. 4xAA und min. 8:1 AF entstanden. Beides Faktoren, die einer gesteigerten Rechenleistung nicht unbegingt entgegen kommen.

7:1 ist auch kein besonders hohes ALU/TEX Verhältnis. IMO eher leicht überdurchschnittlich für neue Games.



Q

Ailuros
2006-01-10, 12:23:45
Ist das aber nicht relativ wenig, wenn man bedenkt, das die PS verdreifacht wurden?

Nein; denn als erstes fallen jetzt Flaschenhaelse in die Rechnung die durch R520's ALU-Flaschenhals (stets relativ bitte) quasi verdeckt wurden. Ergo schaetze ich dass der Unterschied von 1xAA/1xAF zu 4xAA/16xAF von 24% auf R520 um ein gesundes Prozentual steigen wird. Auf der 512GTX sind es 45%; so hoch wuerde ich es nicht schaetzen fuer R580, aber irgendwo zwischendrin dann schon.

Anders gesagt: Musste ATI die PS verdreifachen, um überhaupt einen wirklich sichtbaren Gewinn hinzubekommen und wenn Sie nur 2 PS pro Pipe (Wie nV) genommen hätten, wäre dies in Benchmarks kaum aufgefallen?

Ich versuche schon seit Monaten den ALU-Wirrwarr selber zu entziffern. Der Vereinfachung zuliebe kann man entweder 16 vs. 24 ALUs mit einer 2-er Aufteilung pro ALU zaehlen oder eben dann 32 vs. 48. Dieser 1.5 ALU Schmarren den ich selbst heute noch fuer R520 lese, ist genauso Bloedsinn wie damals auf der NV40.

Es ist dann eben so dass es zwei ALU per SIMD Kanal auf R5xx/NV4x gibt; wobei die zweite jeweils mit begrenzten Faehigkeiten und bei G70 zwei ALUs die beide ueber 4D MADDs faehig sind, die eine aber immer noch durch texture OPs teilweise aufgehalten wird.

aths
2006-01-10, 13:14:48
Es ist dann eben so dass es zwei ALU per SIMD Kanal auf R5xx/NV4x gibt; wobei die zweite jeweils mit begrenzten Faehigkeiten und bei G70 zwei ALUs die beide ueber 4D MADDs faehig sind, die eine aber immer noch durch texture OPs teilweise aufgehalten wird.Wobei das mit der Tex-Op aus meiner Sicht kein ernstes Problem ist. Wenn man viel texturiert, wird im Verhältnis ohnehin wenig gerechnet, und man hat ja in jedem Fall noch die andere, voll MAD-fähige ALU. Wenn man wenig texturiert, und mal eine der beiden MADs blockiert ist, stört das doch keinen. Wichtiger ist schon, dass die erste SU überhaupt MAD kann, im Gegensatz zum NV40 – wenn die zweite SU gerade mit einer bestimmten special function belegt ist, verbleibt die erste SU für möglicherweise anstehende MAD-Operationen.

Ich versuche schon seit Monaten den ALU-Wirrwarr selber zu entziffern. Der Vereinfachung zuliebe kann man entweder 16 vs. 24 ALUs mit einer 2-er Aufteilung pro ALU zaehlen oder eben dann 32 vs. 48. Dieser 1.5 ALU Schmarren den ich selbst heute noch fuer R520 lese, ist genauso Bloedsinn wie damals auf der NV40.Ich zähle beim G70 48 Vec4-MADs, und beim R520 16 Vec4-MADs pro Takt. Dass man aufgrund von Beschränkungen wie dem Registerfile beim G70 kaum 2 MADs pro Takt schedulen kann, mindert die in der Praxis erreichbare Leistung natürlich.

Der R520 bietet im Takt manchmal noch ein Add, der G70 dafür ein NRM_PP, ... das sind dann so Feinheiten, die bei der ersten, groben Betrachtung noch keine Rolle spielen müssen.

Ailuros
2006-01-10, 13:38:06
Hmmm dabei wundere ich mich ob G71 mehr Registerfiles haben koennte. AFAIK wuerde eine Erhoehung dieser sowohl auf R580 als auch auf G71 Sinn machen.

seahawk
2006-01-10, 14:28:18
Gerade beim G71. 32 Pipes die 2 volle VEC4-MADs relativ konstant bringen können, könnten evtl. eine bessere effektive Umsetzung ihrer Möglichkeiten haben, als die 16x3 Lösung des R580. Zusätzlich wäre es eine relativ einfache Änderung. Besonsers weil NV gewußt haben sollte, dass ATI mit dem R580 seine theoretische ALU Leistung verdreifachen wird.

Banshee18
2006-01-10, 16:49:19
Also nachtraeglich obwohl die Frage schon zwischen den Zeilen mehr als einmal beantwortet wurde. Zaehlt man jetzt das meiste in der PS pipeline mit sind es unter Bedingungen etwa 120GFLOPs fuer R520 und genauso unter Bedingungen etwa 165GFLOPs fuer G70@430 (210 fuer 550MHz). Kann jetzt in einem rein theoretischen Fall eine Radeon ihre extra ADDs voll ausnutzen und G70 wird von texture OPs aufgehalten, kommt man in etwa auf die gleiche Rate.

Ohne AA/AF liegt die 512GTX bei 64 fps (1600*1200) gegen 51 fps auf der X1800XT (ergo +25% fuer die 512 GTX); setzt man jetzt AA/AF ein faellt die 512GTX auf 35 fps und die X1800XT auf 39 fps (ergo um 11% schneller).

Nach den Resultaten von R580 die noch nicht sicher sind erreicht diese mit AA/AF in 1600/Fear ganze 49 fps (ohne besonders hoehere Fuellrate oder Bandbreite wie R520), eben durch die erhoehte ALU-Leistung, was sich aber in diesem Fall in 26% mehr Leistung entziffert. Ohne AA/AF duerfte die Leistungssteigerung natuerlich um einiges hoeher sein. Ich wuerde irgendwo in der =/>70 fps Richtung schaetzen, was immerhin schon ca. +40% sind im Vergleich zu R520.

Limitieren dann also selbst in 1600x1200 mit AA und AF die ALUs und nicht die Füllrate bzw. Speicherbandbreite?

deekey777
2006-01-10, 17:01:33
Limitieren dann also selbst in 1600x1200 mit AA und AF die ALUs und nicht die Füllrate bzw. Speicherbandbreite?

Theorie: Wenn sich das Ergebnis nicht oder fast nicht ändert, schon.

Gast
2006-01-10, 17:06:18
ATi RADEON X1900 XTX 512MB (650MHz VPU / 1550MHz GDDR-3) (AMD A64 FX-57 2.8GHz)
11,149 3DMarks for $649 (£367.67)

ATi RADEON X1900 XT 512MB (625MHz VPU / 1450MHz GDDR-3) (AMD A64 FX-57 2.8GHz)
~10,000 3DMarks for $549 (£311.04)

ATi RADEON X1800 XT 512MB (625MHz VPU / 1500MHz GDDR-3) (AMD A64 FX-57 2.8GHz)
9,271 3DMarks for $535.56 (£303.39)

Die Preise klingen schon deutlich besser, als die zuvor genannten.

Eine X1900 XT wäre demnach ähnlich teuer wie die derzeitigen X1800XT Varianten, die schon für ca. 470 € zu haben sind.
Die XTX Variante etwa 80 € teurer, also ca. 550 € (?)

Wenn man die Preise in Euro umrechnet, müsste man sogar unter 500/600 € kommen.

horn 12
2006-01-10, 18:10:47
kann doch nicht sein
ne X1900 XTX ca. 11.2000 PKT
und eine GTX 7900 satte 13.000 PKT.

das wäre ja ein absolute Hinrichtung für ATI;
und für NV der Himmel.
sind diese information wahr oder gefakt ?

Coda
2006-01-10, 18:14:42
Müsste eigentlich hinkommen. Nur mit mehr Shaderleistung hat man gegen die brachiale Füllrate der 512 eigentlich keine Chance imho.

Das ist aber auch nicht schlimm, weil die eh nicht lieferbar ist ;)

Franzmann-Jan
2006-01-10, 18:16:17
Ich wette mit dir dass es im nächsten Futurmark genau andersherum sein wird. Die Engine die im 05er benutzt ist die der heutigen Spiele unterlegen. Gerade bei sehr shaderlastigen wird die X1900 Punkten.

Gast
2006-01-10, 18:33:22
kann doch nicht sein
ne X1900 XTX ca. 11.2000 PKT
und eine GTX 7900 satte 13.000 PKT.

das wäre ja ein absolute Hinrichtung für ATI;
und für NV der Himmel.
sind diese information wahr oder gefakt ?Spielst du viel 3dMark? Es ist für die Leistung in Spielen vollkommen irrelevant, wie die Punktzahl im 3dMark ausfällt. Sieht man doch auch schön bei den aktuellen Karten.

horn 12
2006-01-10, 19:30:24
NEIN, dies nicht .
mich hat es nur dermassen überrascht da ich dies nicht soo erwartet hatte !
aber in aktuellen games werden sich der G71 + R580 wohl nicht recht viel schenken- denke beide werden ca. 20 - 25 % über den aktuellen High End Modellen liegen, und da wenn alles passt und SM 3.0 optimiert ist !

Tarkin
2006-01-10, 20:36:26
kann doch nicht sein
ne X1900 XTX ca. 11.2000 PKT
und eine GTX 7900 satte 13.000 PKT.

das wäre ja ein absolute Hinrichtung für ATI;
und für NV der Himmel.
sind diese information wahr oder gefakt ?

ist doch klar das solche infos 1 oder 2 wochen vor dem launch der X1900 leaken, oder? von wem glaubst du kommen die infos? nicht von nVidia, oder? MEGALOL!

zeugt eher von panik seitens nvidia als von einem überlegenem produkt.

solcher BS kommt IMMER dann, wenns eng wird für nvidia. in den 2 oder 3 monaten in denen es die x1900 in den läden steht wird es nvidia einfach schwer haben überteuerte und langsamere 512er GTX zu verkaufen ... und so entschließt man sich durch solche infos potentielle X1900 käufer "umzupolen" bzw. vom kauf abzuhalten. (war damals bei launch der 9700er genau so)

meiner einschäztung sind die aktuellen nvidia "rumors" (700 bis 750 mhz takt, 32 pipes und 13.000 3dmarks) mehr wunschdenken als realität. bis solche karten in größeren stückzahlen in den läden stehen wirds min. Mai IMHO (wenn überhaupt).

deekey777
2006-01-10, 21:32:13
http://img225.imageshack.us/img225/8917/super9in.jpg

:| :biggrin: :)

Godmode
2006-01-10, 21:45:02
http://img225.imageshack.us/img225/8917/super9in.jpg

:| :biggrin: :)


Alt, das gabs schon vor ein paar Seiten.

Gast
2006-01-10, 22:46:02
in den 2 oder 3 monaten in denen es die x1900 in den läden steht […]
Meinst du zwei oder drei Monate absoluter Zeit, die sie in den Läden stehen wird oder "in zwei bis drei Monaten…"?

*verwundert*
Q

Sunrise
2006-01-11, 13:00:01
Meinst du zwei oder drei Monate absoluter Zeit, die sie in den Läden stehen wird oder "in zwei bis drei Monaten…"?

*verwundert*
Q
Er meint die R580 stehe bis zur VÖ des G71 bereits 2-3 Monate in den Läden. So lese ich das.

Gast
2006-01-11, 14:00:36
Was mich etwas wundert: Wieso werden die Taktraten fast beibehalten und nicht noch zusätzlich erhöht?

Die Memory-Module werden doch sicherlich eine Zugriffszeit von 1,2ns haben, oder? Damit wären 833 MHz möglich, wieso schöpft man dieses Limit nicht voll aus?

Zudem stellt sich die Frage, wieso jetzt noch die höhergetakteten R1800XT -Modelle auf dem Markt kommen, wenn eh schon feststeht, das in wenigen Wochen der Nachfolger da ist.

Gandharva
2006-01-11, 15:00:40
Was mich etwas wundert: Wieso werden die Taktraten fast beibehalten und nicht noch zusätzlich erhöht?Weil die Transistorzahl durch die Verdreifachung der ALUs enorm gestiegen ist, und somit keine wesentlich höheren Taktraten möglich sind.Die Memory-Module werden doch sicherlich eine Zugriffszeit von 1,2ns haben, oder? Damit wären 833 MHz möglich, wieso schöpft man dieses Limit nicht voll aus?Es wird wahrscheinlich 1,2ns RAM (K4J52324QC-BJ12), der für 800MHz bei 2.0V± 0.1V ausgelegt ist, verbaut. Evtl. eine Art "Sicherheitsabstand".Zudem stellt sich die Frage, wieso jetzt noch die höhergetakteten R1800XT -Modelle auf dem Markt kommen, wenn eh schon feststeht, das in wenigen Wochen der Nachfolger da ist. :| Weil die Chips Produziert wurden und die Hersteller + ATI Gewinn machen wollen!

Gast
2006-01-11, 22:07:26
Die Memory-Module werden doch sicherlich eine Zugriffszeit von 1,2ns haben, oder? Damit wären 833 MHz möglich, wieso schöpft man dieses Limit nicht voll aus?


weil die zugriffszeit genauer gesagt 1,25ns ist ;) und das genau 800MHz entspricht ;)

Gast
2006-01-11, 22:27:55
Samsung sagt 1,26. *klugscheiß*

Gast
2006-01-11, 22:28:05
Er meint die R580 stehe bis zur VÖ des G71 bereits 2-3 Monate in den Läden. So lese ich das.
Ah ja, das könnte natürlich auch sein. Aber spätestens bei "Verfügbarkeit ab Launch" werden dann solche Phantomzahlen, wenn sie denn wirklich von Nvidia gestreut sein sollten und wirklich nicht stimmen, die Leute bestimmt nicht vom Kauf abhalten. Zumindest nicht, wenn sie noch selbständig denken können. :)


BTW, 'vielleicht' bleibt die Thread-Size beim R580 doch auf dem Niveau des R520/RV515, wenn es nicht an der Rate hängt, mit der der Ultra-Dispatch Processor Kommandos absondern kann, sondern an der Register-File-Size.


*anonymentipbekommenhat*
Q

reunion
2006-01-11, 22:47:59
Gib mal bitte an deine Quelle(n)?!


Hier z.B.:

According to market sources, ATI is unlikely to price its R580-based products at unprecedented levels, e.g., the part will not cost $649, a suggested retail price for the GeForce 7800 GTX 512.

http://www.xbitlabs.com/news/video/display/20051226173157.html

Es gibt auch noch zahleiche andere Quellen, allerdings habe ich jetzt wirklich keine Lust, sämtliche ältere Meldungen nochmal durchzugrasen. Du wirst es ja ohnehin bald sehen.


SAPPHIRE Radeon X1900XT - 512M GDDR3 - PCI-E / Dual DVI /VIVO -> 629.00€ (http://www.grosbill.com/index.php3?id=34640&site=ruehardware)
SAPPHIRE Radeon X1900XTX - 512M GDDR3 - PCI-E / Dual DVI /VIVO -> 719.00€ (http://www.grosbill.com/index.php3?id=34643&site=ruehardware)

Wer sofort haben will muss löhnen. Wie immer. Die XTX ist IMO ein schlechter Witz seitens ATI.

Tss, die Karte wurde noch nichtmal vorgestellt, die Angaben sind absolut wertlos.

Coda
2006-01-11, 22:51:53
Wäre auch komisch. Der Speicher bleibt ja der gleiche und der Chip ist zwar etwas größer aber immer noch kleiner als G70.

reunion
2006-01-11, 22:57:27
Genug dass etwa 10GB/sec im Ueberfluss liegen.


Spekulation.


Schatten u.a. und auch die bis zu 7:1 ALU/TEX Relation in FEAR.

2048*1536 1xAA/1xAF bilinear:

430/600MHz: 34 fps
490/600MHz: 37 fps (+14% fill. = +9% Leistung)
430/685MHz: 35 fps (+14% band. = +3% Leistung)
490/685MHz: 39 fps (+14% fill/band. = + 15% Leistung)
490/550MHz: 36 fps (+14% fill, -8% band. = +6% Leistung)


Danke, allerdings wären die Benchs mit MSAA wesentlich intressanter.
Ohne AA scheint die niedriger Bandbreite allerdings wirklich nicht sonderlich zu stören.


R580 und G71 werden beide Bandbreiten-limitiert sein bis schnellerer Speicher zur Verfuegung steht. Siehe nochmal oben.


R580 hat (fast) die selbe Füllrate wie R520, es wurde ja nur die ALU-Anzahl erhöht. G71 sollte mit doppelt sovielen TMUs wie R580 und ähnlichen Taktraten dessen Füllrate verdoppeln, und das bei nur unwesentlich mehr Bandbreite.

***edit: zur Vereinfachung 490/550MHz hat eine ~3:1 Bandbreiten zu Fuellraten Relation wie auch theoretisch 600(*32)/900MHz haben wuerde.

Wobei ja momentan schon mit 700Mhz spekuliert wird.
Und die 900Mhz RAM-Takt stellen auch das absolute Maximum dar.

Gandharva
2006-01-12, 01:57:19
Tss, die Karte wurde noch nichtmal vorgestellt, die Angaben sind absolut wertlos.Genau so wenig oder viel wie die von dir geposteten Spekulationen. Also mach hier keinen auf dicke Hose ;) Das die XTX nach einiger Zeit wesentlich günstiger als 699€ zu haben sein wird ist wohl klar, aber zu Anfangs gehe ich davon aus das sie auf/über GTX 512 Niveau liegen wird.

Ailuros
2006-01-12, 09:18:08
Spekulation.

Eben nicht wenn ich nach spezifischen Resultaten anfragen kann mit verschiedenen Frequenzen auf einer 512.

Danke, allerdings wären die Benchs mit MSAA wesentlich intressanter.
Ohne AA scheint die niedriger Bandbreite allerdings wirklich nicht sonderlich zu stören.

http://www.beyond3d.com/forum/showpost.php?p=669586&postcount=524

R580 hat (fast) die selbe Füllrate wie R520, es wurde ja nur die ALU-Anzahl erhöht. G71 sollte mit doppelt sovielen TMUs wie R580 und ähnlichen Taktraten dessen Füllrate verdoppeln, und das bei nur unwesentlich mehr Bandbreite.

Mich kuemmern kein bisschen heutzutage MT Fuellraten und noch weniger single-texturing aus verstaendlichen Gruenden. Das Du Dich weigerst dieses einzusehen ist mir schon seit langem klar.


Wobei ja momentan schon mit 700Mhz spekuliert wird.
Und die 900Mhz RAM-Takt stellen auch das absolute Maximum dar.

Was wohl fuer NV im gegebenen Fall heissen wuerde dass da wo es wirklich wichtiger ist, es immer noch Platz fuer Leistungssteigerungen mit hoeheren Taktraten gibt als DU eigentlich erwarten wuertest. Kein IHV waere so bloed und wuerde die Margen eines Produkts negativer beeinflussen wenn es keinen Gewinn an Leistung darstellen wuerde.

Waere G71 schon mit 600MHz so verdammt Bandbreiten-limitiert wie Du Dir vorstellst, waeren 700MHz noch eine viel bloedere Schnapsidee oder?

up¦²
2006-01-13, 01:17:41
ASUS X1900XT 512 M3 :whisper:

http://img66.imageshack.us/img66/3949/asusx1900xt512m36nr.th.jpg (http://img66.imageshack.us/my.php?image=asusx1900xt512m36nr.jpg)

deekey777
2006-01-13, 01:23:26
ASUS X1900XT 512 M3 :whisper:

http://img66.imageshack.us/img66/3949/asusx1900xt512m36nr.th.jpg (http://img66.imageshack.us/my.php?image=asusx1900xt512m36nr.jpg)

Sieben? Naja, bei der Anzahl an Transistoren und hohen Taktrate nicht überraschend...


Zu sieben: http://www.xbitlabs.com/news/video/display/20051229212113.html

up¦²
2006-01-13, 01:41:48
BTW...
http://www.khronos.org/devu/locations/amsterdam2005.html :wink:

Gandharva
2006-01-13, 07:35:14
ASUS X1900XT 512 M3 :whisper:

http://img66.imageshack.us/img66/3949/asusx1900xt512m36nr.th.jpg (http://img66.imageshack.us/my.php?image=asusx1900xt512m36nr.jpg)Was willst Du uns damit sagen? Das Asus ne X1900 bringt?

Gandharva
2006-01-13, 07:47:35
Quelle: anandtechActually these are very real prices. I can order one at these prices and it will ship as soon as it is in stock.

I forget I can get MSRP by clicking on the item:

x1900 xt $549
x1900 xtx $649
x1900 crossfire $599Wird man wohl 1:1 umrechnen können für Euroland. In den ersten Tagen/Wochen wird man wohl ~600€ bzw. ~700€ löhnen dürfen. Mich wundert immer noch der Preisunterschied von 100€ zw. XT und XTX bei nur 25MHz mehr core und wohl dem gleichen verbauten Speicher.

P.S. MSRP = Manufacturer's Suggested Retail Price

Tidus
2006-01-13, 08:08:41
Quelle: anandtechWird man wohl 1:1 umrechnen können für Euroland. In den ersten Tagen/Wochen wird man wohl ~600€ bzw. ~700€ löhnen dürfen. Mich wundert immer noch der Preisunterschied von 100€ zw. XT und XTX bei nur 25MHz mehr core und wohl dem gleichen verbauten Speicher.

P.S. MSRP = Manufacturer's Suggested Retail Price
Ist XTX schon wieder ne neue Bezeichnung ? also nochma schneller als XT ?

Ich blick da nimmer durch^^

ShadowXX
2006-01-13, 08:45:28
Ist XTX schon wieder ne neue Bezeichnung ? also nochma schneller als XT ?

Ich blick da nimmer durch^^

Juppss....XTX anstatt XT PE.

Blacksoul
2006-01-13, 14:46:38
Juppss....XTX anstatt XT PE.

Vermutlich, weil man aus dem zusätzlichlichem "X" in XTX, kein "Press Edition", wie bei "PE" machen kann ;D



t.blacksoul.d

deekey777
2006-01-13, 14:50:48
Juppss....XTX anstatt XT PE.

Oder die XTX ist nur ein Schachzug, um später auf die 7900 mit einer X1900XT PE zu reagieren.

up¦²
2006-01-13, 15:08:11
Ati ist nicht "happy" mit der cf-lösung bei xl/xt. Die xl braucht ja eine xt dazu; über den oh so tollen pci-e ging cf aber nicht bei den r580 :wink:
Jetzt scheinen die xl 'gedumped' zu werden, ehm replaced.

r3ptil3
2006-01-13, 16:20:09
Oder die XTX ist nur ein Schachzug, um später auf die 7900 mit einer X1900XT PE zu reagieren.

XTX kommt halt wegen der GTX.
Aber sowieso lächerlich meiner meinung nach.
X1900 X1900 Pro X1900 XT und X1900 XT CF wäre meiner Meinung nach am besten, anstatt XT XTX usw. .

callisto
2006-01-13, 18:21:40
Kurze Zwischenfrage: Was glaubt ihr erscheint die X1900XT auch als Singleslot? Oder wird der Chip noch heißer werden, dass das sogut wie unmöglich ist?

Ich frage nur weil ich mir in nächster Zeit eine Graka für nen Barebone kaufen möchte: http://www.forum-3dcenter.org/vbulletin/showthread.php?t=272307

Gast
2006-01-13, 18:31:32
Soweit ich weiß, kommt die XT und die XTX mit DualSlot-Kühlung.

reunion
2006-01-13, 22:10:19
X1900XT on FX-60 3DMark05 Performance (http://forums.vr-zone.com.sg/showpost.php?p=1366702&postcount=9)

This card clocks pretty well from 625/725MHz to 715/855Mhz and is able to breach 12K easily. It seems 13K is possible on a fully air cooled setup.


//Edit:
http://forums.overclockers.co.uk/showthread.php?t=17520845&page=3&pp=30

ShadowXX
2006-01-13, 22:29:24
X1900XT on FX-60 3DMark05 Performance (http://forums.vr-zone.com.sg/showpost.php?p=1366702&postcount=9)

//Edit:
http://forums.overclockers.co.uk/showthread.php?t=17520845&page=3&pp=30

Ich hoffe mal das das stimmt was Gibbo sagt....dann kann man die x1900xt(x) nämlich tatsächlich gleich am Launch-Tag kaufen.

Und der scheint lt. einem seiner Posts weiter unten tatsächlich demnächst zu sein.


X1900 will go well, stock is arriving in our warehouse next week ready for launch day.

reunion
2006-01-14, 11:26:21
http://www.beyond3d.com/forum/showpost.php?p=669586&postcount=524


Und was soll mir das jetzt sagen?
Wenn ich eine Speicherbandbreitenlimitierung messen will, benötige ich MSAA.


Was wohl fuer NV im gegebenen Fall heissen wuerde dass da wo es wirklich wichtiger ist, es immer noch Platz fuer Leistungssteigerungen mit hoeheren Taktraten gibt als DU eigentlich erwarten wuertest. Kein IHV waere so bloed und wuerde die Margen eines Produkts negativer beeinflussen wenn es keinen Gewinn an Leistung darstellen wuerde.

Waere G71 schon mit 600MHz so verdammt Bandbreiten-limitiert wie Du Dir vorstellst, waeren 700MHz noch eine viel bloedere Schnapsidee oder?

Ich habe nie behauptet, dass G71 so extrem Bandbreitelimitiert ist, dass ein so hoher Chiptakt nichts mehr bringt. Deine ursprüngliche Aussage war diese hier:
Uhmmm um 40% zu erreichen reichen 575MHz.
Und auf das, was ich hinaus will, ist, dass eben keine 575Mhz reichen, da es in diesen Gefielden zu einer ziemlich starken Bandbreitenlimitierung kommen müsste.

Allerdings halte ich die 700Mhz, oder gar 750Mhz ohnehin für unwahrscheinlich.

reunion
2006-01-14, 11:39:18
Der Stromverbrauch scheint auch deutlich zu sinken:

X1800XL - 1.1V core, 1.9V RAM
X1800XT - 1.35V core, 2.1V RAM
X1900XT - 1.2V core, 2.1V RAM

http://www.beyond3d.com/forum/showpost.php?p=673076&postcount=621

Ronny145
2006-01-14, 11:42:28
Der Stromverbrauch scheint auch deutlich zu sinken:

X1800XL - 1.1V core, 1.9V RAM
X1800XT - 1.35V core, 2.1V RAM
X1900XT - 1.2V core, 2.1V RAM

http://www.beyond3d.com/forum/showpost.php?p=673076&postcount=621


Deutlich? Naja, der Speicher liegt ja noch bei 2,1V. Der Chip bei der XTX hat dann bestimmt noch ein bisschen mehr Spannung. Aber trotzdem nicht schlecht.

robbitop
2006-01-14, 11:44:28
Allerdings halte ich die 700Mhz, oder gar 750Mhz ohnehin für unwahrscheinlich.
oder die 8xQuads... ;)

deekey777
2006-01-14, 11:53:33
Der Stromverbrauch scheint auch deutlich zu sinken:

X1800XL - 1.1V core, 1.9V RAM
X1800XT - 1.35V core, 2.1V RAM
X1900XT - 1.2V core, 2.1V RAM

http://www.beyond3d.com/forum/showpost.php?p=673076&postcount=621

Das ist die Spannung, nicht der Strom bzw. die Stromstärke. Der R520 gönnt sich auf der X1800XT bis zu 35A -> bis zu 48W und somit die Hälfte des Gesamtverbrauchs. Selbst wenn der Chip weniger verbrauchen würde, dann schluckt der Rest unverändert weiter relativ viel Saft.

Godmode
2006-01-14, 12:41:59
oder die 8xQuads... ;)

Geil wärs trotzdem. Träum: 32 P @ 750 MHz(bruteforce ;D)

Zum Stromverbrauch des R580 denke ich auch, dass er niedriger sein wird als noch beim R520. Man wird sicherlich weitere Optimierungen getroffen haben.

ShadowXX
2006-01-14, 13:02:16
Geil wärs trotzdem. Träum: 32 P @ 750 MHz(bruteforce ;D)

Zum Stromverbrauch des R580 denke ich auch, dass er niedriger sein wird als noch beim R520. Man wird sicherlich weitere Optimierungen getroffen haben.

8 Quads wird der G71 schon haben....an 700MHz (oder gar 750) glaube ich allerdings auch noch nicht so ganz.

Ailuros
2006-01-14, 13:18:23
Und was soll mir das jetzt sagen?
Wenn ich eine Speicherbandbreitenlimitierung messen will, benötige ich MSAA.

Es war eine Aussage von jemanden der weiss wo es lang geht dass die Archiktur keine schlechte Balance vorzeigt.


Ich habe nie behauptet, dass G71 so extrem Bandbreitelimitiert ist, dass ein so hoher Chiptakt nichts mehr bringt. Deine ursprüngliche Aussage war diese hier:

Und auf das, was ich hinaus will, ist, dass eben keine 575Mhz reichen, da es in diesen Gefielden zu einer ziemlich starken Bandbreitenlimitierung kommen müsste.

Mit welcher Taktrate und Bandbreite bricht eine 512 GTX die 40 fps Grenze in Fear 1600+4xAA?

Allerdings halte ich die 700Mhz, oder gar 750Mhz ohnehin für unwahrscheinlich.

Ich hielt es auch fuer unwahrscheinlich dass sie es schaffen 6 quads in 110nm zu quetschen und dazu noch mit einem single slot Design. Verdammt hoch klingen 700MHz zwar schon, aber sonst sehe ich auch nicht wie die Geruechte ueber die angeblichen 13k Punkte in 3dfart05 enstanden sind. Ausser natuerlich es ist nur absichtlicher Rauch um den R580 Launch etwas zu verderben.

reunion
2006-01-14, 16:07:34
Das ist die Spannung, nicht der Strom bzw. die Stromstärke.

Natürlich.

reunion
2006-01-14, 16:15:45
Mit welcher Taktrate und Bandbreite bricht eine 512 GTX die 40 fps Grenze in Fear 1600+4xAA?


Woher soll ich das wissen?
575Mhz werden jedenfalls kaum reichen, es sei denn, am Chip selbst wurde noch einiges verbessert.

Ailuros
2006-01-14, 17:04:22
Woher soll ich das wissen?
575Mhz werden jedenfalls kaum reichen, es sei denn, am Chip selbst wurde noch einiges verbessert.

620(*24)/900MHz.

***edit: uebrigens da Dir meine Laien-Mathe normalerweise besonders gut gefaellt....

Nach bisherigen Spekulationen:

R580 = (nur MADDs) 250 GFLOPs@650MHz oder MADDs + ADDs = 374 GFLOPs@650MHz

Bandbreite = 49.6 GB/sec

G71 = 358 GFLOPs@700MHz minus texture-OPs

Bandbreite = zwischen 54 und 58 GB/sec.

(sinnloser geht es gar nicht *kicher*)

robbitop
2006-01-14, 22:06:09
8 Quads wird der G71 schon haben....
ich bin mir da nicht so ganz sicher.

Coda
2006-01-14, 22:15:18
Ist aber definitiv möglich. nVIDIA hat offenbar keine großen Probleme die Einheiten zu skalieren. Das Einzige was da hinderlich sein könnte ist dass die Fragment-Crossbars langsam etwas groß sein dürften ;)

mapel110
2006-01-14, 22:31:10
Ist aber definitiv möglich. nVIDIA hat offenbar keine großen Probleme die Einheiten zu skalieren. Das Einzige was da hinderlich sein könnte ist dass die Fragment-Crossbars langsam etwas groß sein dürften ;)
Aber warum sollte man bei einem Refresh die Rohpower so drastisch steigern? Bloß weil es fertigungstechnisch geht?
Bislang waren in den letzten Jahren die "halbjahres-Refreshchips" sehr sehr lauwarme Aufgüsse.

robbitop
2006-01-14, 22:37:28
Ist aber definitiv möglich. nVIDIA hat offenbar keine großen Probleme die Einheiten zu skalieren. Das Einzige was da hinderlich sein könnte ist dass die Fragment-Crossbars langsam etwas groß sein dürften ;)
auf jeden Fall möglich ... nur bin ich mir nicht sicher, ob sie es auch gemacht haben ;)

Gandharva
2006-01-14, 22:41:23
Aber warum sollte man bei einem Refresh die Rohpower so drastisch steigern? Bloß weil es fertigungstechnisch geht?
Bislang waren in den letzten Jahren die "halbjahres-Refreshchips" sehr sehr lauwarme Aufgüsse.Damit der Chip unter hohem AA + AF dem R580 ordendlich gegenhalten kann?!

reunion
2006-01-14, 22:41:35
620(*24)/900MHz.



= 16.53 :confused:


***edit: uebrigens da Dir meine Laien-Mathe normalerweise besonders gut gefaellt....

Nach bisherigen Spekulationen:

R580 = (nur MADDs) 250 GFLOPs@650MHz oder MADDs + ADDs = 374 GFLOPs@650MHz

Bandbreite = 49.6 GB/sec

G71 = 358 GFLOPs@700MHz minus texture-OPs

Bandbreite = zwischen 54 und 58 GB/sec.

(sinnloser geht es gar nicht *kicher*)

Die Shader benötigen nicht viel Bandbreite, entscheidend ist die Texelfüllrate.
Und da sieht es vermutlich so aus:

R580: 650 * 16 = 10400MTexel/s
Bandbreite = 49.6 GB/sec

G71: 600(?) * 32 = 19200MTexel/s
Bandbreite = ~55 GB/sec.

Also doch ein ziemlich eklatanter Unterschied.

Coda
2006-01-14, 22:43:10
auf jeden Fall möglich ... nur bin ich mir nicht sicher, ob sie es auch gemacht haben ;)Ich auch nicht. Es ist für mich nur eine Option, die plausibel ist.

Ailuros
2006-01-15, 06:37:38
Die Shader benötigen nicht viel Bandbreite, entscheidend ist die Texelfüllrate.
Und da sieht es vermutlich so aus:

R580: 650 * 16 = 10400MTexel/s
Bandbreite = 49.6 GB/sec

G71: 600(?) * 32 = 19200MTexel/s
Bandbreite = ~55 GB/sec.

Also doch ein ziemlich eklatanter Unterschied.

*seufz*

http://www.beyond3d.com/forum/showpost.php?p=673906&postcount=642

Ja natuerlich wenn man in einer 2002/DX7.0 Zeischleusse steckengeblieben ist sicher :rolleyes:

Ailuros
2006-01-15, 06:41:57
Ist aber definitiv möglich. nVIDIA hat offenbar keine großen Probleme die Einheiten zu skalieren. Das Einzige was da hinderlich sein könnte ist dass die Fragment-Crossbars langsam etwas groß sein dürften ;)

Was die Fragment Crossbars betrifft hab ich zwar noch keine Ahnung, aber es gab genug kleinere Aenderungen zwischen NV4x und G7x die dem breiten Publikum nicht bekannt sind. Natuerlich mehr im Sinn der "workarounds" um etwas bessere Effizienz zu erreichen wo es gerade noch ging ohne fundamentale zeitfressende Aenderungen.

chrisihamm
2006-01-15, 09:44:55
Mal ne Frage,werden die Texels nicht durch die Rop`s ausgegeben?


mfg

Gast
2006-01-15, 11:16:35
Die Pixel werden von den ROPs in den Framebuffer geschrieben. Die ROP-Anzahl ist aber für die Leistung nicht sonderlich wichtig, da die Pixelshader bei weitem nicht jeden Takt einen Pixel ausgeben.

Demirug
2006-01-15, 12:12:43
*seufz*

http://www.beyond3d.com/forum/showpost.php?p=673906&postcount=642

Ja natuerlich wenn man in einer 2002/DX7.0 Zeischleusse steckengeblieben ist sicher :rolleyes:

CineFX ist aber primär wirklich für eher Situationen ausgelegt in denen nur die Texelfillrate limitiert. Ein Tipp der immer noch in den Guides steht ist das ersetzten von Berechnungen durch Tabellen in Texturen.

Ein Sonderfall stellen dann noch die Shader da die gar keine Texel brauchen.

ShadowXX
2006-01-15, 13:05:00
auf jeden Fall möglich ... nur bin ich mir nicht sicher, ob sie es auch gemacht haben ;)

Siehst du noch eine andere Möglichkeit die Rechenleistung ("ALU-Power") zu steigern, ohne den Takt in irrwizige Regionen zu heben?
(Speziell falls die ca. 13000 3DMurkse stimmen sollten...da würden wir wohl mit 700MHz nicht mehr auskommen).

(nV weiss auch was der r580 für ein Chip ist und gegen den wollen Sie ja auch bestehen).

Für nV ist es IMHO die einfachste Möglichkeit Ihre Rechenleistung nach vorne zu bringen ohne dabei unbedingt darauf angewiesen sein zu müssen extreme Taktfrequenzen zu erreichen.

Mal sehen was für Nebelbomben von nV kommen, nachdem der r580 gelauncht ist....

robbitop
2006-01-15, 13:19:14
Siehst du noch eine andere Möglichkeit die Rechenleistung ("ALU-Power") zu steigern, ohne den Takt in irrwizige Regionen zu heben?
(Speziell falls die ca. 13000 3DMurkse stimmen sollten...da würden wir wohl mit 700MHz nicht mehr auskommen).

(nV weiss auch was der r580 für ein Chip ist und gegen den wollen Sie ja auch bestehen).

Für nV ist es IMHO die einfachste Möglichkeit Ihre Rechenleistung nach vorne zu bringen ohne dabei unbedingt darauf angewiesen sein zu müssen extreme Taktfrequenzen zu erreichen.

Mal sehen was für Nebelbomben von nV kommen, nachdem der r580 gelauncht ist....
Vieleicht reicht ja auch ein 24PP G71 mit 750MHz um den R580 in aktuellen Spielen schlagen zu können. Wären immerhin delta 100MHz Core, mehr Füllrate und eine ähnliche MADD Leistung.
In der Praxis wäre ein R580 in Aritmetik dann aber dennoch schneller.

ShadowXX
2006-01-15, 13:31:33
Vieleicht reicht ja auch ein 24PP G71 mit 750MHz um den R580 in aktuellen Spielen schlagen zu können. Wären immerhin delta 100MHz Core, mehr Füllrate und eine ähnliche MADD Leistung.
In der Praxis wäre ein R580 in Aritmetik dann aber dennoch schneller.

Vom Prinzip hast du da natürlich recht.

Man müsste jetzt wissen, was für die Yields "ungefährlicher" währe:
Hoher Takt mit 24PP oder etwas niedriger Takt mit 32PP.

Ailuros
2006-01-15, 14:28:35
CineFX ist aber primär wirklich für eher Situationen ausgelegt in denen nur die Texelfillrate limitiert. Ein Tipp der immer noch in den Guides steht ist das ersetzten von Berechnungen durch Tabellen in Texturen.

Ein Sonderfall stellen dann noch die Shader da die gar keine Texel brauchen.

Sollte die zugegeben etwas merkwuerdige These der 8 quads mit =/>700MHz stimmen, ist die Texelfuellrate so stark im Ueberfluss dass momentan schwer irgend ein schnellerer Speicher die Situation retten koennte. Wenn dann eher >1GHz GDDR4.

horn 12
2006-01-15, 14:39:00
1st online shop with pics and description of X1900

--------------------------------------------------------------------------------

512MB Onboard Memory / PCI-Express / Combined HDR and anti-aliasing effects / Displays over 1 billion colors

The ATI Radeon X1900 XT Pro Graphics Card prepares you for the onslaught of next-generation games. It has one of the world's fastest consumer 3D graphics processors, employing an ultra-threaded engine to deliver maximum graphical detail at ultra-high frame rates. The state-of-the-art Architecture also features unparalleld shader performance and is CrossFire ready, allowing your greatest multi-GPU fantasies to come true. The Radeon X1900 ups the ante even more, with Avivo Video and display technology; it delivers movies, games and photos with stunning Color and realism. Go beyond the usual graphics with over 1 billion colors and ultra-high-speed processing. 512-bit internal ring Bus for Memory reads
48 Pixel shader processor and lightning-fast memory speeds
90 nanometer technology delivers maximum performance
Combined HDR and anti-aliasing effects
Bring HD images to life with over 1 billion colors
Universal Connectivity drives high-end HD displays and projectors
CrossFire Multi-GPU technology with 4 modes of operation: Alternate Frame Rendering (maximum performance), Supertiling (optimal load-balancing), Scissor (compatibility), Super AA 8x/10x/12x/14x (maximum image quality)
64-bit floating point HDR rendering
32-Bit integer HDR (10:10:10:2) Format supported through pipeline
3:2 pulldown (frame rate conversion)
Accelerated MPEG-2, MPEG-4, DivX, WMV9, VC-1 and H.264 decoding, encoding and transcoding
VGA mode support on all outputs
DXVA support
Compatible with ATI TV/Video encoder products, including Theater 550
Core Memory Speed: 650MHz/1.55GHz
Pixel Shader Processors: 48
Vertex Shaders: 8
Geomtery Transform Rate: 1.3 b vertices/sec
Memory Bandwidth: 49.6 GB/sec
Pixel Fill Rate: 10.4 GP/sec
Link:
http://www.jr.com/JRProductPage.proc....ATI+100435805

Note: I am in no way affilated with the above company. I just noticed a bunch more sites are listing on froogle and this is the first with info.

reunion
2006-01-15, 14:58:16
*seufz*

http://www.beyond3d.com/forum/showpost.php?p=673906&postcount=642

Ja natuerlich wenn man in einer 2002/DX7.0 Zeischleusse steckengeblieben ist sicher :rolleyes:


Ja, seufz.
Und heutige Spiele verwenden keine Texturen mehr?
Warum verliert man überhaupt Leistung durch AF?

Gandharva
2006-01-15, 15:02:31
@horn

Wenn Du schon zitierst solltest Du:

a) den Text als Zitat kenntlich machen
b) darauf achten, einen Link mit Rechtsklick aus einem anderen Forum zu kopieren, weil er sonst nicht funktioniert -> Link der wo geht (http://www.jr.com/JRProductPage.process?Product_Id=4077619&JRSource=google.datafeed.ATI+100435805)

seahawk
2006-01-15, 15:05:10
Siehst du noch eine andere Möglichkeit die Rechenleistung ("ALU-Power") zu steigern, ohne den Takt in irrwizige Regionen zu heben?
(Speziell falls die ca. 13000 3DMurkse stimmen sollten...da würden wir wohl mit 700MHz nicht mehr auskommen).

(nV weiss auch was der r580 für ein Chip ist und gegen den wollen Sie ja auch bestehen).

Für nV ist es IMHO die einfachste Möglichkeit Ihre Rechenleistung nach vorne zu bringen ohne dabei unbedingt darauf angewiesen sein zu müssen extreme Taktfrequenzen zu erreichen.

Mal sehen was für Nebelbomben von nV kommen, nachdem der r580 gelauncht ist....

Ach ein 700+ Mhz 24 Pipe G71 bei dem die gegenwärtige Schwächen besitigt wurden und der mehr Tempregisters hat und durch textureops weniger ausgebremst wird könnte durchaus ausreichen um R580 zu schlagen.

Gandharva
2006-01-15, 15:09:33
Ach ein 700+ Mhz 24 Pipe G71 bei dem die gegenwärtige Schwächen besitigt wurden und der mehr Tempregisters hat und durch textureops weniger ausgebremst wird könnte durchaus ausreichen um R580 zu schlagen.Ich kann mir gut vorstellen das solche Chips (24 Pipes) kommen werden. Nur werden diese IMO die "GT" repräsentieren und nicht die "Ultra" oder "GTX". Wieviel Fläche gewinnt man gleich wieder beim Shrink von 110nm auf 90nm? Wieviel Fläche nimmt ein Quad beim G70 Prozentual gesehen in Anspruch? Da könnte man doch schön rumspekulieren.

Ailuros
2006-01-15, 15:18:56
Ja, seufz.
Und heutige Spiele verwenden keine Texturen mehr?
Warum verliert man überhaupt Leistung durch AF?

Zeig mir mal erst den "gigantischen" Leistungseinbruch mit AF in den neuesten Spielen.

Und da die zweite Frage sowieso bogus ist bei dieser Debatte, frag Dich lieber selber erstmal warum die erste GF2 vergleichsmaessig so wenig Leistung verloren hat mit 2xAF. Wenn eine GPU wirklich verdammt Bandbreiten-limitiert war dann war es diese.

***edit:

LOL ich kann zwar nichts merkwuerdiges was HQ in UT2k4 betrifft sehen, aber es wird hier entweder gemunkelt oder die 81.89 Treiber haben so einiges hier im Vergleich zu 78.03 aufgeholt. Primeval 12bots durch UMark2.0:

robbitop@away
2006-01-15, 17:39:50
Vom Prinzip hast du da natürlich recht.

Man müsste jetzt wissen, was für die Yields "ungefährlicher" währe:
Hoher Takt mit 24PP oder etwas niedriger Takt mit 32PP.
nicht nur für die... F&E spielt da auch mit hinein. Und irgendwo muss noch Luft für den angeblich so frühen G80 bleiben.

robbitop@away
2006-01-15, 17:43:48
Ach ein 700+ Mhz 24 Pipe G71 bei dem die gegenwärtige Schwächen besitigt wurden und der mehr Tempregisters hat und durch textureops weniger ausgebremst wird könnte durchaus ausreichen um R580 zu schlagen.
Das mit den T-Ops ist ein zu tiefgehendes Problem der CineFX Pipeline, um es im G71 zu bessern IMO. Das ist einfach die Domäne und der Kompromiss von CineFX. Dafür passen mehr Pipelines in den Transistorcount.
IMO sollte ein G71 mit 24PP und ~750MHz noch immer aritmetisch in der Praxis dem R580 unterlegen sein ... nicht riesig aber etwas.

Gandharva
2006-01-15, 17:48:36
nicht nur für die... F&E spielt da auch mit hinein. Und irgendwo muss noch Luft für den angeblich so frühen G80 bleiben.R600 & G80 werden wohl mit GDDR-4 kommen und allein das sollte sie schon um einiges von R580/G70 abheben. Das ist dann ein Sprung von 800/900MHz auf >1500MHz. Dann noch das Unified Shader Design, welches von Haus aus effizienter sein sollte gepaart mit verbesserter Fertigung. Ich sehe da keinen Bedarf künstlich Leistung zurück zu halten.

TheGood
2006-01-15, 19:36:25
Wird die Ati Graka schon am 18.01.2006 released???
Kann das sein???

robbitop
2006-01-15, 19:43:29
R600 & G80 werden wohl mit GDDR-4 kommen und allein das sollte sie schon um einiges von R580/G70 abheben. Das ist dann ein Sprung von 800/900MHz auf >1500MHz. Dann noch das Unified Shader Design, welches von Haus aus effizienter sein sollte gepaart mit verbesserter Fertigung. Ich sehe da keinen Bedarf künstlich Leistung zurück zu halten.
Ein US Design ist nicht unbedingt effizienter. NV scheint ja aus diesem Grunde keines zu realisieren. "jack of all and master of none"

Wechselbalg
2006-01-15, 19:50:27
Vielleicht könnte man sagen, dass es insofern effizienter ist, dass man Last zwischen Pixel und Vertexshadern ja quasi 'verschieben' und der Situation anpassen kann. Dies wäre ja schon effizienter, nur die Pipeline an sich wohl vermutlich weniger.

IVN
2006-01-15, 19:52:48
Ein US Design ist nicht unbedingt effizienter. NV scheint ja aus diesem Grunde keines zu realisieren. "jack of all and master of none"
Das schnellste waere z.B 24 (6 Quads) und 8 oder 10 universellen Einheiten,die als VS und PS dienen.

ShadowXX
2006-01-15, 19:55:33
Wird die Ati Graka schon am 18.01.2006 released???
Kann das sein???

Wie kommst du jetzt gerade auf den 18.01.?

Bis jetzt hatte ich ende Januar / Anfang Feburar gehört (was ja auch nicht mehr so weit weg ist).

ShadowXX
2006-01-15, 20:00:49
Vielleicht könnte man sagen, dass es insofern effizienter ist, dass man Last zwischen Pixel und Vertexshadern ja quasi 'verschieben' und der Situation anpassen kann. Dies wäre ja schon effizienter, nur die Pipeline an sich wohl vermutlich weniger.

Nur das wir mehr VS-Power momentan nicht wirklich brauchen (ATI bleibt ja auch beim r580 bei 8VS).

Deshalb wäre es quasi nonsense 48 oder sogar 56 (48+8) US-Einheiten hinzuknallen, die komplexer und damit teurer sind (und wohl auch etwas langsamer als spezialisierte), obwohl wir eigentlich nur viel PS-Power benötigen.

US gehört die fernere Zukunft....das will ich gar nicht abstreiten. Aber für die ersten DX10 Karten wohl noch nicht wirklich notwendig.

dildo4u
2006-01-15, 20:01:38
Hier gibts Fear Benches leider ist da so ein extrem OC am Werk der bencht nur in 1024:rolleyes:

http://forums.vr-zone.com.sg/showpost.php?p=1373986&postcount=54

PingpiN
2006-01-15, 20:06:51
Hier gibts Fear Benches leider ist da so ein extrem OC am Werk der bencht nur in 1024:rolleyes:

http://forums.vr-zone.com.sg/showpost.php?p=1373986&postcount=54
In was für lächerlichen settings bencht der Typ. :rolleyes:
Lieber 1280/1024 4aa-8af ss on das Resultat intressiert mich nicht so eins.

Gandharva
2006-01-15, 20:10:32
Hier gibts Fear Benches leider ist da so ein extrem OC am Werk der bencht nur in 1024:rolleyes:

http://forums.vr-zone.com.sg/showpost.php?p=1373986&postcount=54
Ja, der FX-60 ist besser als der FX-55. ;)

ShadowXX
2006-01-15, 20:13:01
Hier gibts Fear Benches leider ist da so ein extrem OC am Werk der bencht nur in 1024:rolleyes:

http://forums.vr-zone.com.sg/showpost.php?p=1373986&postcount=54

Sooo brüllend finde ich die min. 47FPS in 1024 ohne alles aber auch nicht wirklich .

mapel110
2006-01-15, 20:14:18
Hier gibts Fear Benches leider ist da so ein extrem OC am Werk der bencht nur in 1024:rolleyes:

http://forums.vr-zone.com.sg/showpost.php?p=1373986&postcount=54
Soviel sollte auch eine 512GTX schaffen. 87 fps sind jedenfalls schon bei 1280x1024, HQ im Treiber und Athlon 4000+ (200 Mhz weniger als FX55).

dildo4u
2006-01-15, 20:22:13
Sooo brüllend finde ich die min. 47FPS in 1024 ohne alles aber auch nicht wirklich .
Die scheinen ja CPU Limitiert zu sein wenn er mit den FX 60 auf 54fps min kommt.

Blaire
2006-01-15, 20:22:25
Jo sieht nicht sehr überzeugend aus. Da hab ich doch etwas mehr erwartet , aber vieleicht bencht der auch noch mit höheren Settings da kann das Bild wieder anders aussehn.

ShadowXX
2006-01-15, 20:48:22
Die scheinen ja CPU Limitiert zu sein wenn er mit den FX 60 auf 54fps min kommt.

Aus den Tests von AiL geht eigentlich hervor, das FEAR nur Shaderleistunglimitiert ist.

Die paar FPS die der FX60 da schneller ist, kommen sicher woanders her (ist doch ne DualCore-CPU, vielleicht wurden bei dem Test ATI-Treiber verwendet, die wie die neuen nV-Treiber vorteile aus DC ziehen).

Ich hab langsam das Gefühl, als wenn ATI genau das gleiche Problem wie nV bekommt: Theoretisch hat man sehr viel PS-Leistung, bekommt diese aber (warum auch immer) nicht auf den Boden.

Godmode
2006-01-15, 22:03:06
"jack of all and master of none"

Diese Aussage hat schon was an sich!

Gandharva
2006-01-15, 23:22:47
Aus den Tests von AiL geht eigentlich hervor, das FEAR nur Shaderleistunglimitiert ist.

Die paar FPS die der FX60 da schneller ist, kommen sicher woanders her (ist doch ne DualCore-CPU, vielleicht wurden bei dem Test ATI-Treiber verwendet, die wie die neuen nV-Treiber vorteile aus DC ziehen).Ja, IMO komplett CPU limitiert bei diesen Settings. Der kleine Vorteil kommt wohl nur von den "Dual Core optimierten" ATI Treibern.

Gandharva
2006-01-15, 23:24:45
Diese Aussage hat schon was an sich!Naja, liegt doch dann mehr auf Seite der Software Entwickler das vorhandene Allround Design ordendlich auszureizen.

ShadowXX
2006-01-15, 23:49:06
Naja, liegt doch dann mehr auf Seite der Software Entwickler das vorhandene Allround Design ordendlich auszureizen.

Was gibts da auszureizen? Die US-Alus kannst du auch nur als PS oder VS (bzw. irgendwann auch GS) ausnutzen.

Und die VS stellen momentan keine Limitierung da.

Es wäre wohl eher so, das ein US-48ALU-Design langsamer wäre als ein 48PS+8VS-Design.

Und dann käme noch das oben genannte dazu: Die Allroundeinheiten wäre wohl insgesamt etwas langsamer als ihre spezialisierten Ahnen (zumindest heute noch).

robbitop
2006-01-16, 00:01:19
Und dann käme noch das oben genannte dazu: Die Allroundeinheiten wäre wohl insgesamt etwas langsamer als ihre spezialisierten Ahnen (zumindest heute noch).
Und teurer, wovon du dann wieder mehr von den spezialisierten bauen kannst.

Sunrise
2006-01-16, 00:20:19
Dafür passen mehr Pipelines in den Transistorcount.
IMO sollte ein G71 mit 24PP und ~750MHz noch immer aritmetisch in der Praxis dem R580 unterlegen sein ... nicht riesig aber etwas.
Arithmetisch, ja.

Gandharva
2006-01-16, 00:33:50
Es wäre wohl eher so, das ein US-48ALU-Design langsamer wäre als ein 48PS+8VS-Design.Ich würde da die Vertex Shader mitzählen. Also 48PS+8VS ist langsamer als 56US.
Was das ausreizen angeht habe ich mich an die Aussage von Wechelbalg angelehnt. Liegt ja dann so wie es aussieht im Ermessen des Entwicklers wie er das Design für seine Zwecke nutzt.

ShadowXX
2006-01-16, 07:50:22
Ich würde da die Vertex Shader mitzählen. Also 48PS+8VS ist langsamer als 56US.
Was das ausreizen angeht habe ich mich an die Aussage von Wechelbalg angelehnt. Liegt ja dann so wie es aussieht im Ermessen des Entwicklers wie er das Design für seine Zwecke nutzt.

Selbst darauf würde ich momentan keine wetten annehmen (also das 56US wirklich schneller als 48PS+8VS sind)....

Denk noch mal an das "jack of all and master of none".

Davon abgesehen wären US zum jetzigen Zeitpunkt fast nur Transistorverschwendung mal abgesehen......

Nach den letzten Aussagen von nV würde ich z.B. nicht darauf wetten, das der G80 US hat (und Sie meineserachtens auch nicht unbedingt braucht).

Ailuros
2006-01-16, 07:54:04
Aus den Tests von AiL geht eigentlich hervor, das FEAR nur Shaderleistunglimitiert ist.

Die paar FPS die der FX60 da schneller ist, kommen sicher woanders her (ist doch ne DualCore-CPU, vielleicht wurden bei dem Test ATI-Treiber verwendet, die wie die neuen nV-Treiber vorteile aus DC ziehen).

Ich hab langsam das Gefühl, als wenn ATI genau das gleiche Problem wie nV bekommt: Theoretisch hat man sehr viel PS-Leistung, bekommt diese aber (warum auch immer) nicht auf den Boden.

In 1600 mit 4xAA ist selbst mit einem FX-60 zu dem FX53@2.6GHz hier der Unterschied zwischen 0 und minimal ;)

Ja zum letzten Paragraphen....endlich! ;)

Ailuros
2006-01-16, 08:02:03
Was jetzt NVIDIA und USC betrifft, ich kann mir momentan immer noch nicht sicher sein, weil einige Analysten komischerweise vorgeschlagen haben dass G80 doch ein USC ist.

Entweder sind die Analysten schlecht informiert oder NV's PR Zeug ist mit Absicht momentan quasi gegen USC orientiert aus reinen Marketing-Gruenden.

Wie dem auch sei NVIDIA wird USC langfristig nicht entgehen koennen. Entweder haben sie fuer 2006 keinen effizienten "scheduler" oder ihnen ist ATI's Loesung in Xenos einfach nicht gut genug. Spaetestens "G90" dann koennte die "Wende" kommen, falls G80 ein "non-USC" sein sollte.

Und Shadow unter gewissen Vorraussetzungen braucht NV einen USC schon; man dreht eben die Vermarktung so hin wie es momentan gerade passt und das koennte auch durchaus nur Staub sein im Moment da es immer noch technisch um Xenos gegen RSX gehen koennte ;)

Ailuros
2006-01-16, 08:16:48
Was gibts da auszureizen? Die US-Alus kannst du auch nur als PS oder VS (bzw. irgendwann auch GS) ausnutzen.

GS ist eine Vorraussetzung in D3D10.

Und die VS stellen momentan keine Limitierung da.

Wie steht es aber mit vertex texturing? Heutzutage kann man sich entweder auf einen verrueckt langen PS verlassen, wobei dann die VT Latenz versteckt wird oder man koennte auch extra HW in zukuenftigen GPUs einbauen um diese Latenzen unter den meisten Situationen verstecken zu koennen. Oder man hat einen USC und man hat ueberhaupt keine Kopfschmerzen mehr in welchem Shader man Texturen anwenden will (VS oder GS).

Es wäre wohl eher so, das ein US-48ALU-Design langsamer wäre als ein 48PS+8VS-Design.

Kommt auf den jeweiligen Design an. Xenos ist nur ueber 4 MADDs/clk faehig und hat afaik nicht die extra ADD Faehigkeiten von R520. Bei GeForces waeren es dann aber 8 MADDs/clk per SIMD Kanal (bei getrennten Einheiten).

Und dann käme noch das oben genannte dazu: Die Allroundeinheiten wäre wohl insgesamt etwas langsamer als ihre spezialisierten Ahnen (zumindest heute noch).

Immer noch Design-spezifisch. Von der Leistung mal abgesehen das was ich momentan von den Eindruecken der Entwickler herauslesen kann, ist dass Xenos sehr einfach zum entwickeln ist als Plattform. Und das ist erstmal - ueberhaupt fuer Consolen - ein ziemlich wichtiger Vorteil. Ob dieses nun stimmt oder nicht ueberlasse ich natuerlich den echten Entwicklern die hier schlummern ;)

Und mit Design-spezifisch meine ich lediglich dass man keine Schlussvolgerungen ziehen sollte von dem was momentan verfuegbar ist, oder was gerade jede PR-Abteilung nach aussen laesst egal welche Seite. ATI gibt ja selber zu dass R520 staerker ist als Xenos und so wie sie es meinen stimmt es auch. Im gegebenen Fall muss die Konzentration dann auf R600 vs. G80 fallen.

seahawk
2006-01-16, 08:21:59
Das mit den T-Ops ist ein zu tiefgehendes Problem der CineFX Pipeline, um es im G71 zu bessern IMO. Das ist einfach die Domäne und der Kompromiss von CineFX. Dafür passen mehr Pipelines in den Transistorcount.
IMO sollte ein G71 mit 24PP und ~750MHz noch immer aritmetisch in der Praxis dem R580 unterlegen sein ... nicht riesig aber etwas.

Im theoretischen Maximum ja. Die Frage ist halt, ob ATI seine 3 ALUs heute schpn voll ausnutzen kann. Wenn NV es nun schafft, dass seine 2 ALUs weniger oft stallen, dann könnte man im realen Ergebnis sehr nahe beeinander liegen.

Ailuros
2006-01-16, 08:39:27
Im theoretischen Maximum ja. Die Frage ist halt, ob ATI seine 3 ALUs heute schpn voll ausnutzen kann. Wenn NV es nun schafft, dass seine 2 ALUs weniger oft stallen, dann könnte man im realen Ergebnis sehr nahe beeinander liegen.

Sie liegen auch heute schon ziemlich nahe was die Leistung betrifft. Ich hab auf der einen Seite die extra ADDs die unter Bedingungen mitzaehlen koennen und auf der anderen Seite die texture-OPs die ein Prozentual der arithmetischen Effizienz stehlen.

In den neuesten PR Dokumenten ATI's wird sogar u.a. auch noch dynamisches branching mitgezaehlt um auf verrueckt hohe theoretische GFLOP Zahlen zu kommen.

R580 erhoeht die ALU Leistung um einiges im Vergleich zu R520 und wird wohl Flaschenhaelse zum Vorschein bringen die bisher beim R520 nicht zu sehen waren und G71 baut dann eben auf die bisherige G7x-Masche auf.

Fuer rein theoretisch mehr ALUs auf G7x gab es keine Zeit da es zu kompliziert geworden waere; deshalb schraubte man hoechstwahrscheinlich nochmal 2 quads dazu und schon ein paar kleine absolut notwendige und moegliche (Zeitdruck) "Schoenheits-Korrigierungen" rein.

NV erweiterte auf G70 nicht nur die ALUs um 8 MADDs zu erreichen; das meisste geben sie natuerlich auch nicht in die Oeffentlichkeit. Das soll jetzt nur heissen dass 222M/NV40-->302M/G70 = +2 quads, +erweiterte ALUs + extra Schnickschnack.

ShadowXX
2006-01-16, 09:52:48
GS ist eine Vorraussetzung in D3D10.


Ist klar....am Ende des Post erkläre ich mal kurz warum ich das ganze so geschrieben habe.


Wie steht es aber mit vertex texturing? Heutzutage kann man sich entweder auf einen verrueckt langen PS verlassen, wobei dann die VT Latenz versteckt wird oder man koennte auch extra HW in zukuenftigen GPUs einbauen um diese Latenzen unter den meisten Situationen verstecken zu koennen. Oder man hat einen USC und man hat ueberhaupt keine Kopfschmerzen mehr in welchem Shader man Texturen anwenden will (VS oder GS).


Kommt auf den jeweiligen Design an. Xenos ist nur ueber 4 MADDs/clk faehig und hat afaik nicht die extra ADD Faehigkeiten von R520. Bei GeForces waeren es dann aber 8 MADDs/clk per SIMD Kanal (bei getrennten Einheiten).

Immer noch Design-spezifisch. Von der Leistung mal abgesehen das was ich momentan von den Eindruecken der Entwickler herauslesen kann, ist dass Xenos sehr einfach zum entwickeln ist als Plattform. Und das ist erstmal - ueberhaupt fuer Consolen - ein ziemlich wichtiger Vorteil. Ob dieses nun stimmt oder nicht ueberlasse ich natuerlich den echten Entwicklern die hier schlummern ;)

Und mit Design-spezifisch meine ich lediglich dass man keine Schlussvolgerungen ziehen sollte von dem was momentan verfuegbar ist, oder was gerade jede PR-Abteilung nach aussen laesst egal welche Seite. ATI gibt ja selber zu dass R520 staerker ist als Xenos und so wie sie es meinen stimmt es auch. Im gegebenen Fall muss die Konzentration dann auf R600 vs. G80 fallen.

Du hast in allen Punkten völlig Recht....

Ich wollte das ganze aus dem hier und jetzt betrachten (also unter dem Gesichtspunkt, was man jetzt genau in diesem moment als Architektur eher braucht bzw. was eher benötigt wird um in den jetztigen (und innerhalb des nächsten halben Jahres kommenden) Games benötigt.)

"Mein" imaginärer US-Architektur-Chip (für das oben gepostete) wäre also ein Chip, der nur genau das könnte, was auch ein r580/G71 kann, nur eben als US.

Und unter diesen Vorraussetzungen würde die US-Konstuktion nix bringen ausser eine unmenge Transistoren verschleudern.

Das das ganze in zukünftigen Designs anders aussehen kann und das US über kurz oder lang notwendig wird, steht auf einem anderen Blatt und ist klar.

seahawk
2006-01-16, 10:31:59
Sie liegen auch heute schon ziemlich nahe was die Leistung betrifft. Ich hab auf der einen Seite die extra ADDs die unter Bedingungen mitzaehlen koennen und auf der anderen Seite die texture-OPs die ein Prozentual der arithmetischen Effizienz stehlen.

In den neuesten PR Dokumenten ATI's wird sogar u.a. auch noch dynamisches branching mitgezaehlt um auf verrueckt hohe theoretische GFLOP Zahlen zu kommen.

R580 erhoeht die ALU Leistung um einiges im Vergleich zu R520 und wird wohl Flaschenhaelse zum Vorschein bringen die bisher beim R520 nicht zu sehen waren und G71 baut dann eben auf die bisherige G7x-Masche auf.

Fuer rein theoretisch mehr ALUs auf G7x gab es keine Zeit da es zu kompliziert geworden waere; deshalb schraubte man hoechstwahrscheinlich nochmal 2 quads dazu und schon ein paar kleine absolut notwendige und moegliche (Zeitdruck) "Schoenheits-Korrigierungen" rein.

NV erweiterte auf G70 nicht nur die ALUs um 8 MADDs zu erreichen; das meisste geben sie natuerlich auch nicht in die Oeffentlichkeit. Das soll jetzt nur heissen dass 222M/NV40-->302M/G70 = +2 quads, +erweiterte ALUs + extra Schnickschnack.

Ich wolte auch nur deutlich machen, dass imho auch ein hochtaktender 24Pipe G70, bei dem man die Pipe effizienter getrimmt hat, ohne Einheiten beizufügen, in praktischen Anwendungen möglicherweise durchaus an einen R580 rankommen könnte. Erwarten tue ich allerdings auch etwas Anderes. Gerade R580 muss erstmal beweisen, dass die 200% mehr ALU-Power auch umgesetzt wird.

Ailuros
2006-01-16, 10:37:07
Und unter diesen Vorraussetzungen würde die US-Konstuktion nix bringen ausser eine unmenge Transistoren verschleudern.

Ich bin mir gar nicht so sicher, dass wenn man die Vorteile eines USC auf einem "non-USC" implementiert, dass man im ersten Fall tatsaechlich mehr Transistoren braucht.

Angenommen R600 und G80 haben rein theoretisch vergleichbare Leistung/Effizienz im Durchschnitt bei einer etwa vergleichbaren Chip-Komplexitaet; in dem Fall fliegt die obrige These sofort zum Fenster raus.

Eine moegliche Form von G80 waere ein fuer multi-threading optimierter chip mit starken getrennten Geometrie-Einheiten die VS als auch GS behandeln koennen.

Will man jetzt minimale Textur-Latenz im ersten Fall braucht man auch wieder extra Transistoren, gleiches gilt fuer schnelles dynamisches branching usw. usw. Das klingt mir von meiner Laien-Ecke nicht unbedingt billiger als eine quasi "universal" ALU die PS/VS/GS aufnehmen kann.

Gast
2006-01-16, 10:46:53
In 1600 mit 4xAA ist selbst mit einem FX-60 zu dem FX53@2.6GHz hier der Unterschied zwischen 0 und minimal ;)
Ja, weil da mit dem FSAA sich etwas böse beißt bei Nvidia. Zumindest böser, als bei ATi. Siehe meinen Post von vor einigen Seiten.

Oder sind ~50% FPS Einbruch bei einem Shader-limitierten Spiel beim Zuschalten von FSAA normal?

Q

Ailuros
2006-01-16, 10:51:53
Ich wolte auch nur deutlich machen, dass imho auch ein hochtaktender 24Pipe G70, bei dem man die Pipe effizienter getrimmt hat, ohne Einheiten beizufügen, in praktischen Anwendungen möglicherweise durchaus an einen R580 rankommen könnte. Erwarten tue ich allerdings auch etwas Anderes. Gerade R580 muss erstmal beweisen, dass die 200% mehr ALU-Power auch umgesetzt wird.

IMHO ueberlaeuft der NV4x/G7x Design von Grund auf jeglicher seiner Limitierungen durch die Erhoehung der Anzahl der Einheiten.

Es ist theoretisch zumindest 3x mal die ALU Leistung auf R580; in Echtzeit waere es wohl eher 1.5x mal oder im besten Fall 2x mal im Vergleich zu R520. Eben in etwa wie man es im Vergleich zwischen NV40 und G70 auch sehen konnte.

mapel110
2006-01-16, 10:53:56
Ja, weil da mit dem FSAA sich etwas böse beißt bei Nvidia. Zumindest böser, als bei ATi. Siehe meinen Post von vor einigen Seiten.

Oder sind ~50% FPS Einbruch bei einem Shader-limitierten Spiel beim Zuschalten von FSAA normal?

Q
Dass man beim Wechsel auf AF kaum Performance verliert, kann auch auf enormen Bandbreitenhunger der App hindeuten.

Ailuros
2006-01-16, 10:55:29
Ja, weil da mit dem FSAA sich etwas böse beißt bei Nvidia. Zumindest böser, als bei ATi. Siehe meinen Post von vor einigen Seiten.

Oder sind ~50% FPS Einbruch bei einem Shader-limitierten Spiel beim Zuschalten von FSAA normal?

Q

Ob es normal ist oder nicht kann ich Dir erst beantworten wenn ich ausfuehrliche Resultate mit und ohne AA und mit und ohne AF von R580 in Fear zur Hand habe.

Denn irgendwie hab ich das Gefuehl dass die ~24% Leistungsverlust von 1xAA/1xAF zu 4xAA/16xAF (R520) nicht mehr so optimistisch sein werden auf R580.

Ailuros
2006-01-16, 13:12:56
Da die ersten R580 Resultate so langsam einfliessen, sieht es grau aus fuer 6 quads@750MHz. Mehr man braucht mehr ;)

[dzp]Viper
2006-01-16, 13:19:15
Da die ersten R580 Resultate so langsam einfliessen, sieht es grau aus fuer 6 quads@750MHz. Mehr man braucht mehr ;)

wo wo wo wo? :D

Gib mir Infos

ShadowXX
2006-01-16, 13:20:05
Da die ersten R580 Resultate so langsam einfliessen, sieht es grau aus fuer 6 quads@750MHz. Mehr man braucht mehr ;)

Mehr man braucht mehr ?? (Du meinst sicher einfach nur: "Man braucht mehr".)

Sind die Resultate so gut??

Hast du Links, oder sind das Privatinfos die nicht weitergegeben werden dürfen?

Nazar
2006-01-16, 13:20:32
Da die ersten R580 Resultate so langsam einfliessen, sieht es grau aus fuer 6 quads@750MHz. Mehr man braucht mehr ;)

Worauf beziehst du deine Aussage?
Wäre nett zu wissen, wo man diese Resultate "erforschen" kann ;)

Ailuros
2006-01-16, 13:27:54
Worauf beziehst du deine Aussage?
Wäre nett zu wissen, wo man diese Resultate "erforschen" kann ;)

Bis das NDA auslaeuft, geht das leider nicht. Etwas mehr als eine Woche noch ;)

PingpiN
2006-01-16, 13:28:46
Da die ersten R580 Resultate so langsam einfliessen, sieht es grau aus fuer 6 quads@750MHz. Mehr man braucht mehr ;)

Zahlen Zahlen Werte Werte ich brauch Ergebnisse. ;D :biggrin:

Ailuros
2006-01-16, 13:29:30
Mehr man braucht mehr ?? (Du meinst sicher einfach nur: "Man braucht mehr".)

Sind die Resultate so gut??

Hast du Links, oder sind das Privatinfos die nicht weitergegeben werden dürfen?

Ich meine schlicht und einfach dass 6 quads nicht genug sind. Sie brauchen tatsaechlich 8 quads (was fuer mich sowieso schon seit einiger Zeit garantiert ist aber ich es einfach so nebenher nur andeute).

deekey777
2006-01-16, 13:53:26
Bis das NDA auslaeuft, geht das leider nicht. Etwas mehr als eine Woche noch ;)

Wenn der Launch tatsächlich in Amsterdam stattfindet, dann finden einige der eingeladenen Tester ihren Weg in einen der Coffeeshops und plaudern alles aus. :biggrin:

reunion
2006-01-16, 13:57:28
Aus den Tests von AiL geht eigentlich hervor, das FEAR nur Shaderleistunglimitiert ist.


Aber doch nicht in 1024 ohne AA/AF.


Die paar FPS die der FX60 da schneller ist, kommen sicher woanders her (ist doch ne DualCore-CPU, vielleicht wurden bei dem Test ATI-Treiber verwendet, die wie die neuen nV-Treiber vorteile aus DC ziehen).


Wenn die Garfikkarte limitieren würde, dann würde auch eine DC-Optimierung nichts bringen.

Davon abgesehen wären US zum jetzigen Zeitpunkt fast nur Transistorverschwendung mal abgesehen......


Warum?
Xenos dürfte NV40 leistungsmäßig in Schach halten, und das bei ähnlichen Transistorenverbrauch und höherem tech-Level (jetzt mal vom eDRAM abgesehen).

Ronny145
2006-01-16, 14:01:37
Bis das NDA auslaeuft, geht das leider nicht. Etwas mehr als eine Woche noch ;)


Log dich aus und poste :biggrin:

Sunrise
2006-01-16, 14:04:32
Log dich aus und poste :biggrin:
Das ist keine Sache, die nur er tun könnte. ;)

Die Ergebnisse werden über den ein oder anderen Weg sowieso veröffentlicht werden. Geduld braucht der Mensch, auch wenn es schwerfällt.

reunion
2006-01-16, 14:05:32
Denn irgendwie hab ich das Gefuehl dass die ~24% Leistungsverlust von 1xAA/1xAF zu 4xAA/16xAF (R520) nicht mehr so optimistisch sein werden auf R580.

Ahh, jetzt also doch.

deekey777
2006-01-16, 14:08:26
Das ist keine Sache, die nur er tun könnte. ;)

Die Ergebnisse werden über den ein oder anderen Weg sowieso veröffentlicht werden. Geduld braucht der Mensch, auch wenn es schwerfällt.

Aber HKEPC schreibt in Chinesisch. ;( ;D

Sunrise
2006-01-16, 14:10:38
Aber HKEPC schreibt in Chinesisch. ;( ;D
Der Punkt geht an dich. :wink:

Und ehrlich gesagt, ich bin mir nichtmal sicher, ob sie ihr eigenes Fach-Chinesisch selbst verstehen können. :biggrin:

Gandharva
2006-01-16, 14:27:13
Aber HKEPC schreibt in Chinesisch. ;( ;DBildchen sind zum Glück international:

http://img43.imageshack.us/img43/9492/x19008wi.jpg

http://img43.imageshack.us/img43/690/x190026ob.jpg

PingpiN
2006-01-16, 14:35:01
Das ist keine Sache, die nur er tun könnte. ;)

Die Ergebnisse werden über den ein oder anderen Weg sowieso veröffentlicht werden. Geduld braucht der Mensch, auch wenn es schwerfällt.

Sind die Ergebnisse sehr enttäuschend.?

Coda
2006-01-16, 14:37:12
Bildchen sind zum Glück international:Da ist allerdings nichts neues zu sehen.

Gandharva
2006-01-16, 14:39:56
Da ist allerdings nichts neues zu sehen.Doch, die Bilder sind neu! :sneak: