PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : R600: alles rund um die neue Generation, Teil 9


Seiten : 1 [2] 3 4

Nakai
2007-04-29, 12:16:04
Wieso denn nicht? Beim G80 wars genauso.

http://www.fudzilla.com/index.php?option=com_content&task=view&id=733&Itemid=1

mfg Nakai

reunion
2007-04-29, 12:21:59
€:

Komisch, INQ hat genau dies mal bestätigt.

Soweit ich weiß, sind bei nV die ALUs mit den TMUs noch verbunden. Zumindest zeichnet das nV bei ihren Bilder immer so, und auch B3D macht das so. Und bis jetzt gibt es auch noch keinen Chip, der das wiederlegt. D.h. nV muss bei einer Erhöhung der ALu-Anzahl auch die TMUs im selben Maß mit skalieren lassen, was ja im Prinzip auch Sinn macht. Die ROPs sind hingegen getrennt.

Nakai
2007-04-29, 12:24:05
Joa, jedenfalls war es beim G7x so und es gibt bis jetzt G8x-Modell das nicht mit einer solchen TMU-Verbundenheit aufkommt.

mfg Nakai

Gast
2007-04-29, 12:36:15
Wieso denn nicht? Beim G80 wars genauso.

http://www.fudzilla.com/index.php?option=com_content&task=view&id=733&Itemid=1

mfg Nakai

Ich meinte eher, daß die jetzt bekannten Blockschaltbilder bestimmt nicht mehr "umgezeichnet" werden.

dargo
2007-04-29, 13:29:23
Genau AA/AF war bisher das große Pluspunkt bei ATi.
Die Betonung liegt bei "war". ;)
Mit dem G80 hat sich so Einiges geändert. Sowohl was die AA als auch AF Performance angeht.

Gast
2007-04-29, 13:46:44
Das Ergebnis im 3DMark2006 sind doch rein von der Rechenleistung abhängig. Ansonsten könnte eine 7900GTX kaum mit der X1900XT mithalten.
Das die 2900XT hier so gut abschneidet, ist doch verständlich.
Mal gucken, wie sie in Spielen abschneidet, wenn es mehr auf die Texturleistung ankommt.

dargo
2007-04-29, 14:02:05
Das Ergebnis im 3DMark2006 sind doch rein von der Rechenleistung abhängig. Ansonsten könnte eine 7900GTX kaum mit der X1900XT mithalten.
Das die 2900XT hier so gut abschneidet, ist doch verständlich.
Mal gucken, wie sie in Spielen abschneidet, wenn es mehr auf die Texturleistung ankommt.
Da hast du auch wieder recht. Wenn ich mir hier:
http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_nvidia_geforce_8800_gts_320mb/7/
die X1900XT vs. G7900GTX im 3DMark06 anschaue liegen beide nahezu gleich auf. In diversen Games (zb. NfS: Carbon, Anno 1701, Oblivion) beträgt der Unterschied aber schon ~40%.

Gast
2007-04-29, 14:09:01
Da hast du auch wieder recht. Wenn ich mir hier:
http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_nvidia_geforce_8800_gts_320mb/7/
die X1900XT vs. G7900GTX im 3DMark06 anschaue liegen beide nahezu gleich auf. In diversen Games (zb. NfS: Carbon, Anno 1701, Oblivion) beträgt der Unterschied aber schon ~40%.


Dann schalt mal die A.I. Cheaterei bei ATI ab und auch dir werden die Augen aufgehen, wie "gut" eine X19xx unter Qualitätseinstellungen (AA, AF) noch performt.

http://www.hardtecs4u.de/reviews/2007/msi_nx8600_gts/index5.php
http://www.hardtecs4u.de/reviews/2007/msi_nx8600_gts/index6.php
http://www.hardtecs4u.de/reviews/2007/msi_nx8600_gts/index7.php
http://www.hardtecs4u.de/reviews/2007/msi_nx8600_gts/index8.php
http://www.hardtecs4u.de/reviews/2007/msi_nx8600_gts/index9.php
http://www.hardtecs4u.de/reviews/2007/msi_nx8600_gts/index10.php
http://www.hardtecs4u.de/reviews/2007/msi_nx8600_gts/index11.php

dildo4u
2007-04-29, 14:12:06
Ebend 3Dmark kann man echt vergessen da hier zu 100% bei ATI AI Optemierungen aktiv sind.

dargo
2007-04-29, 14:21:03
Dann schalt mal die A.I. Cheaterei bei ATI ab und auch dir werden die Augen aufgehen, wie "gut" eine X19xx unter Qualitätseinstellungen (AA, AF) noch performt.

Wer redet hier von AA/AF? :|

33% Vorteil für X1900XT bei 16x12
http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_nvidia_geforce_8800_gts_320mb/8/

42% Vorteil für X1900XT bei 16x12
http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_nvidia_geforce_8800_gts_320mb/10/

63% Vorteil für X1900XT bei 16x12
http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_nvidia_geforce_8800_gts_320mb/14/

Soll ich weiter machen? ;)
Und jetzt komm mir nicht damit, dass bri 1xAF deutlich mehr Performance bringt als tri 1xAF. Das sind lächerliche 0-1%.

AnarchX
2007-04-29, 14:23:56
Vielleicht 16 Point-Samples, damit wäre der Unterschied nicht mehr ganz so krass.
Das ist Unsinn...

Nachdem ich es nochmal genauer angeschaut hab, denke ich dort wird eine Quad-TMU dargestellt und diese dann nochmal verfeinert in 16 Point-Sample (also 4 Point-Samples pro TMU). Das entspricht also den TMUs der letzten Jahre.

Mal sehen wie ATi gegen diesen offensichtliche Flaschenhals vorgehen wird.

und wie viele Point Samplers hat der G80 ?

G80 hat AFAIK 8, weshalb man auch von 64 TMUs sprechen kann.

Wieso denn nicht? Beim G80 wars genauso.

http://www.fudzilla.com/index.php?option=com_content&task=view&id=733&Itemid=1


Da hat wohl Fuad noch etwas Nachhilfe im Bezug GPU bekommen. ;)

The_Invisible
2007-04-29, 14:25:11
Wer redet hier von AA/AF? :|

33% Vorteil für X1900XT bei 16x12
http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_nvidia_geforce_8800_gts_320mb/8/

42% Vorteil für X1900XT bei 16x12
http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_nvidia_geforce_8800_gts_320mb/10/

63% Vorteil für X1900XT bei 16x12
http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_nvidia_geforce_8800_gts_320mb/14/

Soll ich weiter machen? ;)
Und jetzt komm mir nicht damit, dass bri 1xAF deutlich mehr Performance bringt als tri 1xAF. Das sind lächerliche 0-1%.

auch ohne aa/af kostet ai off oft massig leistung wenn du die verlinkten balken angesehen hättest

mfg

dildo4u
2007-04-29, 14:25:19
Wer redet hier von AA/AF? :|

Zockst du mit deiner High-End Karte immer ohne AA unf AF? Und gibts deshalb dem 3Dmark Gewicht in diesem Thread um über die Leistungsfähigkeit des R600 zu spekulieren? ;)

dargo
2007-04-29, 14:26:57
auch ohne aa/af kostet ai off oft massig leistung wenn du die verlinkten balken angesehen hättest

Das hat aber nichts mit bri oder tri AF zu tun sondern mit Shaderreplacement zb. in Doom3/Quake4.

Zockst du mit deiner High-End Karte immer ohne AA unf AF? Und gibts deshalb dem 3Dmark Gewicht in diesem Thread um über die Leistungsfähigkeit des R600 zu spekulieren? ;)
Was hat das jetzt damit zu tun wie ich spiele? :|
Ist es denn so schwer zu verstehen?

Ein G71 ist im 3DMark06 auf dem R580 Niveau. In vielen neueren Games (und damit die Diskussion mit A.I nicht wieder anfängt habe ich Settings ohne AF gepostet) kackt diese dramatisch ab gegen den R580. Und deswegen interessieren mich die 3DMark06 Werte vom R600 vs. G80 überhaupt nicht. Wichtig ist nur die Game-Performance.

LovesuckZ
2007-04-29, 14:35:53
Soweit ich weiß, sind bei nV die ALUs mit den TMUs noch verbunden. Zumindest zeichnet das nV bei ihren Bilder immer so, und auch B3D macht das so. Und bis jetzt gibt es auch noch keinen Chip, der das wiederlegt. D.h. nV muss bei einer Erhöhung der ALu-Anzahl auch die TMUs im selben Maß mit skalieren lassen, was ja im Prinzip auch Sinn macht.

Wir wissen nicht, wie flexible nVidia bei der Gestaltung der Cluster vorgehen kann.
Beim G84 haben sie einfach in jedem Cluster vier zusätzliche TAUs eingefügt. Warum sollte dies nicht auch mit Vec8 Einheiten gehen?


Es ist also wie vermutet eine Verschmelzung der beiden Architekturen.

Es sieht für mich nicht nach einer Verschmelzung aus. Eher wurde das Xenos Design als Grundlage genommen und dann dort etwas verändert bzw. hinzugefügt, wo man eine Verbesserung sah. Im Grunde keine schlechte Idee, da die Xbox360 Portierungen eben auf Xenos entwickelt wurden. Und dort herrscht nicht gerade eine hohe Texturleistung. Also werden die Spiele wohl sehr stark von der rechenleistung abhängen.

Ich bin gespannt, wie lange sich die urban legend der grossartigen Limitierung der ROP Leistung noch haellt.

Natürlich spielt die Bandbreite eine Rolle. jedoch sind die ROPs ein limitierender Faktor, wenn es um die Anzahl der Samples geht.
Eine 8800GTS verliert von 2xMSAA auf 4xMSAA deutlich weniger Leistung als eine X1950XTX. Was, wenn nicht die ROPs, ist dafür verantwortlich?
In bestimmten Situation ergibt sich sogar eine Leistungssteigerung von 2xMSAA auf 4xMSAA. Magie? Voodoo? Oder einfach nur die ROPs?

reunion
2007-04-29, 14:36:16
auch ohne aa/af kostet ai off oft massig leistung wenn du die verlinkten balken angesehen hättest

mfg

Als ob ein G71 so perfekt filtern würde. :rolleyes:
Und nur darum ging es jetzt R580 vs. G71.

Gast
2007-04-29, 14:40:20
Als ob ein G71 so perfekt filtern würde. :rolleyes:
Und nur darum ging es jetzt R580 vs. G71.Unter HQ filtert ein G71 deutlich besser als ein R580 mit Standardeinstellungen.

AnarchX
2007-04-29, 14:46:20
Eine 8800GTS verliert von 2xMSAA auf 4xMSAA deutlich weniger Leistung als eine X1950XTX. Was, wenn nicht die ROPs, ist dafür verantwortlich?
In bestimmten Situation ergibt sich sogar eine Leistungssteigerung von 2xMSAA auf 4xMSAA. Magie? Voodoo? Oder einfach nur die ROPs?

G80 macht nunmal auch 4xMSAA in einem Cycle, wofür R580 zwei brauch.
Aber natürlich wird wohl die hohe Zixel-Leistung nicht ganz unbedeutend sein.

reunion
2007-04-29, 14:46:26
Unter HQ filtert ein G71 deutlich besser als ein R580 mit Standardeinstellungen.

Und was willst du mir jetzt damit sagen? Selbst wenn es so wäre (was ich bezweifle, denn nicht umsonst haben viele namhafte Tester genau das verglichen), kann man ja bei R580 durch AI_off oder HQ-AF noch wesentlich bessere Qualität herausholen. Und auch bei G71 ist der Schritt zu HQ natürlich nicht gratis. Aber genug OT.

desert
2007-04-29, 14:56:34
er will damit sagen, das selbst heute noch a.i standard gegen nv hq qualität getestest wird.

Und das die leute so wie hardtecs endlich auch test mit a.i. off testen sollten.
denn so kannst du die ganzen test alle vergessen. Da wird fast perfekte bq gegen cheat getestet, wie z.b. bei computerbase mit ihren blöden immer aktiven aaa gegen tsaa und tri-optimierungen an bei nv, und a.i. bei ati auf standard und mit wa-af bei g80 test´s. Das verzehrt doch etwas den blickwinkel.

Gast
2007-04-29, 15:05:14
Das verzehrt doch etwas den blickwinkel.

Du meinst sicher "verzerrt" ;)

reunion
2007-04-29, 15:07:50
er will damit sagen, das selbst heute noch a.i standard gegen nv hq qualität getestest wird.

Und das die leute so wie hardtecs endlich auch test mit a.i. off testen sollten.
denn so kannst du die ganzen test alle vergessen. Da wird fast perfekte bq gegen cheat getestet, wie z.b. bei computerbase mit ihren blöden immer aktiven aaa gegen tsaa und tri-optimierungen an bei nv, und a.i. bei ati auf standard und mit wa-af bei g80 test´s. Das verzehrt doch etwas den blickwinkel.

Bei R600 vs. G80 wäre das natürlich nicht akzeptabel. Aber dazu muss man erstmal abwarten, wie das bei R600 jetzt konkret aussieht. Dass es bei vergleichen von unterschiedlichen Architekturen immer wieder zu Unglücklichen Situationen kommen kann und wird, sollte klar sein. Das Problem bei CB ist nunmal, dass ein G80 kein winkelabhängiges AF anbietet, und G71 kein winkelunabhängiges, wodurch man hier zwangsläufig einen unfairen Kompromiss finden muss.

reunion
2007-04-29, 15:24:27
R600 has 4 texturing units (or texturing engines):

* 8x texture addressing units
* 20x FP32 samplers (single-data read/clock)
* 4x FP32 filtering units (1 bilinear 64 bit sample per clock or one 128 bit sample every 2 clocks)
* 256KB L2 cache

http://forum.beyond3d.com/showpost.php?p=978460&postcount=3629

Gast
2007-04-29, 15:27:24
Entweder liegt Jawed's Quelle falsch oder die Folie war eine Lüge.
Ansonsten käme AMD auf 32 "TMUs", da wohl zu jeder Adress Unit auch eine Filterings Unit gehöre.

Nakai
2007-04-29, 15:30:41
Okay jetzt bin ich etwas verwirrt, jedenfalls schauen diese TMUs anders aus.

mfg Nakai

Gast
2007-04-29, 15:31:08
Möglicherweise eine Täuschungsaktion von AMD.
Falsche Folien und Boards die durch Manipulation gebremst wurden?

Gast
2007-04-29, 15:36:00
Möglicherweise eine Täuschungsaktion von AMD.
Falsche Folien und Boards die durch Manipulation gebremst wurden?

Könnte sein weil.
http://www.forumdeluxx.de/forum/showpost.php?p=6004592&postcount=2581

up¦²
2007-04-29, 15:37:01
Will Fuzi (aka Fudo) jetzt abheben oder nur nur Nvidia Boss (NVIDIA’s Chief Executive Officer – Jen Hsun Huang :wink: ) anbaggern... ;D
"FudoJenHsun" (http://www.fudzilla.com/index.php?option=com_content&task=view&id=733&Itemid=34)

reunion
2007-04-29, 15:38:57
Könnte sein weil.
http://www.forumdeluxx.de/forum/showpost.php?p=6004592&postcount=2581

Das hat wombat doch nur aus dem B3D-Forum kopiert, und ich habe das weiter hinten auch schon gepostet.

Gast
2007-04-29, 15:40:10
Beim Xenos Artikel von beyond3d.com wird von "Address Processor" und "Textur Samples" gesprochen. Beide gehören zusammen. Entweder wurden dies ebeiden Bestandteile zusammengerechnet, oder aber es wurden Jawed wirklich nur die Adressierungsprozessoren genannt. Beim zweiten wären es klar 32 "TMUs".

Möglicherweise eine Täuschungsaktion von AMD.
Falsche Folien und Boards die durch Manipulation gebremst wurden?

Das wäre zum jetzigen Zeitpunkt die falsche Taktik.

dildo4u
2007-04-29, 15:44:09
Will Fuzi (aka Fudo) jetzt abheben oder nur nur Nvidia Boss (NVIDIA’s Chief Executive Officer – Jen Hsun Huang :wink: ) anbaggern... ;D
"FudoJenHsun" (http://www.fudzilla.com/index.php?option=com_content&task=view&id=733&Itemid=34)
Nicht wirklich im Herzen bleibt er ein Roter ähm AMD Grüner. *g*

"R6xx GPUs can easily be faster in future games like Crysis or Unreal Tournament 2007. This might only happen if these companies decides to go for the complex Shaders all of the time. So far no one made such a Shader so far"

reunion
2007-04-29, 15:46:46
Jedenfalls scheinen das keine stinknormalen TMUs zu sein. Auch ein L2-Cache von immerhin 256KB pro Block ist nicht gerade ohne.

Gast
2007-04-29, 15:48:03
Auch ein L2-Cache von immerhin 256KB pro Block ist nicht gerade ohne.Kann mir kaum vorstellen, dass ATI derart große Caches verbaut.

Nakai
2007-04-29, 15:50:20
Will Fuzi (aka Fudo) jetzt abheben oder nur nur Nvidia Boss (NVIDIA’s Chief Executive Officer – Jen Hsun Huang :wink: ) anbaggern... ;D
"FudoJenHsun" (http://www.fudzilla.com/index.php?option=com_content&task=view&id=733&Itemid=34)

Lol, das hat Fudo nicht geschrieben...^^;)

Jedenfalls scheinen das keine stinknormalen TMUs zu sein. Auch ein L2-Cache von immerhin 256KB pro Block ist nicht gerade ohne.

Joa, wenn man die Skizze auf dem hierachischem Design näher anschaut, fallen die jeweiligen Bestandteile auf.
Jedoch sind da noch einige Stellen fragwürdig...

Kann mir kaum vorstellen, dass ATI derart große Caches verbaut.

Vll sind sie nicht nur für Texturen gedacht.

mfg Nakai

reunion
2007-04-29, 16:02:49
Kann mir kaum vorstellen, dass ATI derart große Caches verbaut.

Tja, das wäre ein sattes MB L2 Textur-Cache. Auf jeden Fall wäre das ein gewaltiger Unterschied zu anderen GPUs, wenn es stimmt. Jawed (http://forum.beyond3d.com/showpost.php?p=978480&postcount=3635) hat dazu auch ein Patent von Ati für die vertex Daten rausgesucht, die diesen Cache wohl mit den Texturen sharen: http://v3.espacenet.com/textdoc?DB=EPODOC&IDX=US2005251624&F=0

AnarchX
2007-04-29, 16:19:46
Na dann bin ich ja gespannt auf eine Artikel darüber zum Launch. Es klingt jedenfalls schon wieder so verückt, dass es wahr sein könnte, eben wie beim G80.

RV610 scheint in diesem Bezug auch beschnitten zu sein und besitzt nicht 3 Caches wie die anderen R6xx-GPUs sondern nur einen für Vertex/Texturdaten.
Es würde mich nicht wundern, wenn in der Zukunft ohne viele Änderungen so gleich als IGP weiterverwendet wird.

Gast
2007-04-29, 16:20:13
Sieht ja echt aus wie ein Xenos auf Steroiden *g Aber für was die brachiale Vertex/GeometrieLeistung, ohne eine reine D3D10 Engine lässt sich die doch kaum abrufen bzw. limitiert immer was anderes bevor die Leistung zu 3/4 abgerufen werden kann.

reunion
2007-04-29, 16:31:33
Sieht ja echt aus wie ein Xenos auf Steroiden *g Aber für was die brachiale Vertex/GeometrieLeistung, ohne eine reine D3D10 Engine lässt sich die doch kaum abrufen bzw. limitiert immer was anderes bevor die Leistung zu 3/4 abgerufen werden kann.

Du gibt dir die Antwort eh selber. Nicht ohne Grund versucht ATi D3D10 massiv zu pushen.

deLuxX`
2007-04-29, 17:04:17
Nicht ohne Grund versucht ATi D3D10 massiv zu pushen.

Und das ist auch gut so. Bis aber die ersten Titel mit einigen D3D10 Bestandteilen rauskommen wird der R600 Low-End sein. Aber man muss ja irgendwann anfangen. Besser als auf der Stelle treten allemal.

Gast
2007-04-29, 17:21:05
Sinn machts trotzdem nicht, denn mit Geometrieshadern kann jeder DX10 Chip umgehen. Nützt doch nix wenn ich 30% "mehr" in dieser Kategorie an Leistung biete als das Highend der Konkurrenz es aber nie genutzt wird, hätte man da etwas abspecken können oder mit einer Taktdomäne arbeiten können, hätte Stromverbrauch und Temperatur + Transi Budget vieleicht gesenkt. Klar kann ich das nicht beurteilen is aber halt ein Gedankengang warum Feature-Sparbrötchen ATI sovie Geo-Leistung einbaut vieleicht nix bringt im Endeffekt (für heutige Benches schonmal egal, weder Oblivion noch Fear werden da wohl drauf reagieren und ansonsten sehe ich kein anderes Game/Engine von denen man Performance Zukünftiger Spiele ableiten kann).
Crysis wird glaub die erste Meisterprüfung der DX10 Karten, bis dahin entscheidet nur die BQ und ob die Teile im Sommer auch Lauffähig sind ohne Wakü und Ohrstöpsel :D

mapel110
2007-04-29, 17:23:09
Vielleicht ist ja gerade weil ATI nicht mit Taktdomains arbeitet, die Geometrieshaderleistung so gut. Sie haben das Teil ja irgendwie auf 800 Mhz geprügelt, obwohls wohl für weniger ausgelegt war.

Gmax
2007-04-29, 17:34:59
Kann man dieses 1MB Cache mit dem Xenos der Xbox vergleichen?

AnarchX
2007-04-29, 17:40:18
Kann man dieses 1MB Cache mit dem Xenos der Xbox vergleichen?

Wenn du hier den eDRAM meinst: Nein das ist nicht vergleichbar, da dieser bei Xenos als Framebuffer dient und um Welten langsamer als Cache angebunden ist.

Gmax
2007-04-29, 17:44:16
Wenn du hier den eDRAM meinst: Nein das ist nicht vergleichbar, da dieser bei Xenos als Framebuffer dient und um Welten langsamer als Cache angebunden ist.

Ja, eDram meinte ich.
Aber da jener ja viel langsamer angebunden ist, kann man
das mit dem R6oo nur schwer vergleichen.
Interessante Nachricht, auf jeden Fall :smile:

reunion
2007-04-29, 17:45:16
Vielleicht ist ja gerade weil ATI nicht mit Taktdomains arbeitet, die Geometrieshaderleistung so gut. Sie haben das Teil ja irgendwie auf 800 Mhz geprügelt, obwohls wohl für weniger ausgelegt war.

Ich denke das kann man getrost ausschließen. Die ursprünglich geplanten Taktraten waren sogar wesentlich höher als die 740Mhz der XT, die es letztendlich geworden sind. Im übrigen ist R600 ja ein USC, davon würde also nicht nur die GS-Leistung profitieren. Außerdem: Wer sagt denn dass die GS-Performance bei R600 so hoch ist? Vielleicht ist sie einfach nur bei G80 so niedrig. Etwas fraglich sind allerdings die zusätzlichen Features, welche angeblich erst mit D3D11 gefordert werden. Aber abwarten wie es dann konkret aussieht.

AnarchX
2007-04-29, 17:50:44
Etwas fraglich sind allerdings die zusätzlichen Features, welche angeblich erst mit D3D11 gefordert werden. Aber abwarten wie es dann konkret aussieht.

Hatte nicht Xenos nicht auch so einen Tessalator? Wenn ja, dann macht es im Bezug auf zukünftige Xbox360-Ports vielleicht durchaus Sinn.

Nakai
2007-04-29, 18:00:33
Im Allgemeinen sind Unified-Shader mit 5D (4+1) besser für Geomtrie geeignet.
;)
Der G80 kann mit den hohen Taktraten punkten.

Aber da jener ja viel langsamer angebunden ist, kann man
das mit dem R6oo nur schwer vergleichen.

Der Edram ist ein Speicher, der Cache ist nur für die Zwischenspeicherung da. Imho könnte das der Schlüssel zu der niedrigen Texelfüllrate sein.

mfg Nakai

€:
Hatte nicht Xenos nicht auch so einen Tessalator? Wenn ja, dann macht es im Bezug auf zukünftige Xbox360-Ports vielleicht durchaus Sinn.


Nur das der Tesselator im R600 schon besser als DX11 ist. (laut Ail)
Dx11 bietet kein besseres Feature. Ich frage mich, was dieser Tesselator bringt, imho muss ATI den OEMs und Reseller mit Features überzeugen.

AnarchX
2007-04-29, 18:03:32
FEAR 1.08
1280*1024 4AA 8AF soft shadow OFF

HD 2900XT

http://img126.imageshack.us/img126/2613/fearhd2900xtkb7.jpg (http://imageshack.us)
Quelle
(http://www.chiphell.com/viewthread.php?tid=3407&extra=page%3D1&page=15)

8800GTS Niveau (http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_nvidia_geforce_8600_gts_sli_8600_gt/16/#abschnitt_f_e_a_r)im Bezug auf die Avg-FPS.

Ich frage mich, was dieser Tesselator bringt, imho muss ATI den OEMs und Reseller mit Features überzeugen.

Vielleicht ist er ja für den Profimarkt -> FireGL interessant.

Superheld
2007-04-29, 18:13:14
die GTS schafft auch soviel;(

Gast
2007-04-29, 18:15:12
FEAR 1.08
1280*1024 4AA 8AF soft shadow OFF

HD 2900XT

http://img126.imageshack.us/img126/2613/fearhd2900xtkb7.jpg (http://imageshack.us)
Quelle
(http://www.chiphell.com/viewthread.php?tid=3407&extra=page%3D1&page=15)

8800GTS Niveau (http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_nvidia_geforce_8600_gts_sli_8600_gt/16/#abschnitt_f_e_a_r)im Bezug auf die Avg-FPS.



So doll ist das Ergebnis nicht, oder? Meine schon mit meiner overclockten GX2 ein besseres Ergebnis gehabt zu haben - kann mich aber auch irren, ist schon zu lange her. Obwohl FEAR afaik den nV Karten schon immer etwas besser lag als ATi Karten.

dargo
2007-04-29, 18:16:00
FEAR 1.08
1280*1024 4AA 8AF soft shadow OFF

HD 2900XT

http://img126.imageshack.us/img126/2613/fearhd2900xtkb7.jpg (http://imageshack.us)
Quelle
(http://www.chiphell.com/viewthread.php?tid=3407&extra=page%3D1&page=15)

Mit welcher CPU?

up¦²
2007-04-29, 18:17:04
Vielleicht stimmt es doch :tongue:
http://img485.imageshack.us/img485/9279/20070429576f1bac9bb324fgi4.jpg

w0mbat
2007-04-29, 18:17:45
[...]
Nur das der Tesselator im R600 schon besser als DX11 ist. (laut Ail)
Dx11 bietet kein besseres Feature. Ich frage mich, was dieser Tesselator bringt, imho muss ATI den OEMs und Reseller mit Features überzeugen.

Was hat der R600 mit DX11 zu tun :confused:

AnarchX
2007-04-29, 18:18:35
Mit welcher CPU?

Es sollte ein C2D E6600 sein, aber keine Ahnung auf welcher Taktrate er ihn bei diesem Test laufen hatte.

mapel110
2007-04-29, 18:20:51
Vielleicht stimmt es doch :tongue:
http://img485.imageshack.us/img485/9279/20070429576f1bac9bb324fgi4.jpg
Die Leistungsabfall ist zu niedrig von beiden Chips. Es sei denn, die haben auf nem 1 Ghz Athlon gebencht oder so.

dargo
2007-04-29, 18:22:21
Die Leistungsabfall ist zu niedrig von beiden Chips. Es sei denn, die haben auf nem 1 Ghz Athlon gebencht oder so.
Oder die Stelle war extrem cpu-lastig. Bei einer Timedemo aber kaum vorstellbar.

w0mbat
2007-04-29, 18:24:48
Es sollte ein C2D E6600 sein, aber keine Ahnung auf welcher Taktrate er ihn bei diesem Test laufen hatte.

Nichts am System wurde übertaktet, schreibt er.

dargo
2007-04-29, 18:27:51
FEAR 1.08
1280*1024 4AA 8AF soft shadow OFF

HD 2900XT

http://img126.imageshack.us/img126/2613/fearhd2900xtkb7.jpg (http://imageshack.us)
Quelle
(http://www.chiphell.com/viewthread.php?tid=3407&extra=page%3D1&page=15)


System, siehe Sig. (GTS @612/900Mhz)

1280*1024 4AA 8AF soft shadow OFF
min. 45fps
avg. 96fps
max. 236fps

AnarchX
2007-04-29, 18:28:38
Nichts am System wurde übertaktet, schreibt er.

Ja die Karte, aber bei den 06 Scores zwischendrin hatte er die CPU übertaktet.: http://www.chiphell.com/attachments/month_0704/20070429_da39f7c4233fdd9cf0c0pecq13fv8Zhx.jpg

dargo
2007-04-29, 18:32:14
System, siehe Sig. (GTS @612/900Mhz)

1280*1024 4AA 8AF soft shadow OFF
min. 45fps
avg. 96fps
max. 236fps
GTS @standard

min. 38fps
avg. 82fps
max. 196fps

AnarchX
2007-04-29, 18:35:06
Nicht unbedingt rühmlich für die HD 2900XT, aber wenn man sich den Vergleich zu R580 anschaut müsste hier sicherlich noch per Treiber etwas zu bewegen sein.

dargo
2007-04-29, 18:37:15
Nicht unbedingt rühmlich für die HD 2900XT, aber wenn man sich den Vergleich zu R580 anschaut müsste hier sicherlich noch per Treiber etwas zu bewegen sein.
Ja, aber FEAR stellt nun wirklich keine grosse Herausforderung für die High-End Grakas. Viel interessanter wäre ein Game mit HDR+MSAA.

Gast
2007-04-29, 18:43:44
Ja, aber FEAR stellt nun wirklich keine grosse Herausforderung für die High-End Grakas. Viel interessanter wäre ein Game mit HDR+MSAA.

Nein überhaupt nicht, man bist du ein Experte!

AnarchX
2007-04-29, 18:43:49
Ja, aber FEAR stellt nun wirklich keine grosse Herausforderung für die High-End Grakas. Viel interessanter wäre ein Game mit HDR+MSAA.

Wie wäre es mit GRAW?:
Settings (http://www.chiphell.com/attachments/month_0704/20070429_5169a69ed66b501a8d7fniujJ1fC1LuH.jpg)
Stelle a (http://www.chiphell.com/attachments/month_0704/20070429_e86c20b162e57085b7738VWKWTnNc56l.jpg)
Stelle b (http://www.chiphell.com/attachments/month_0704/20070429_76cbafae7a1c2756d1e5QMnbE4wfcVSW.jpg)
Stelle c (http://www.chiphell.com/attachments/month_0704/20070429_3765446966eb72d63a28loCbs1wrpYkM.jpg)

Nakai
2007-04-29, 18:44:00
Was hat der R600 mit DX11 zu tun :confused:

Gar nichts, nur das er wohl ein Feature hat, das erst mit Dx11 kommen könnte...wobei ich keine Ahnung habe ob das stimmt.

mfg Nakai

dargo
2007-04-29, 18:46:01
Wie wäre es mit GRAW?:
Settings (http://www.chiphell.com/attachments/month_0704/20070429_5169a69ed66b501a8d7fniujJ1fC1LuH.jpg)
Stelle a (http://www.chiphell.com/attachments/month_0704/20070429_e86c20b162e57085b7738VWKWTnNc56l.jpg)
Stelle b (http://www.chiphell.com/attachments/month_0704/20070429_76cbafae7a1c2756d1e5QMnbE4wfcVSW.jpg)
Stelle c (http://www.chiphell.com/attachments/month_0704/20070429_3765446966eb72d63a28loCbs1wrpYkM.jpg)
Nee, ebenfalls kein HDR und MSAA.

Edit:
Was ist hier mit den Texturen passiert? Oh Gott, sieht das schrecklich aus. :eek:

AnarchX
2007-04-29, 18:50:41
Edit:
Was ist hier mit den Texturen passiert? Oh Gott, sieht das schrecklich aus. :eek:

Vielleicht ein neues AI Level? X-D
Naja, man sollte wohl doch auf Launchtreiber warten und hoffen, dass diese ordentlich funktionieren.

dargo
2007-04-29, 18:58:58
Vielleicht ein neues AI Level? X-D

:lol: *ultrasuperduperperformance A.I* ;D

Hast du sonst noch irgendwelche Gamebenches?

AnarchX
2007-04-29, 19:02:04
Hast du sonst noch irgendwelche Gamebenches?

WTCC ALL MAX LEVEL 3 AA
http://www.chiphell.com/attachments/month_0704/20070429_b659f8a9d7dfeec2ca00Rupm9Y5HkAc8.jpg
http://www.chiphell.com/attachments/month_0704/20070429_b0dbb9487b6e1e4121d6jDXNQK1kdv5K.jpg

Aber natürlich könnte man ihm auch etwas vorschlagen.

Gast
2007-04-29, 19:02:41
Hmm Graw sieht allgemein so aus.Die Texturen sind auf jeder karte leider so.....

dargo
2007-04-29, 19:05:21
WTCC ALL MAX LEVEL 3 AA
http://www.chiphell.com/attachments/month_0704/20070429_b659f8a9d7dfeec2ca00Rupm9Y5HkAc8.jpg
http://www.chiphell.com/attachments/month_0704/20070429_b0dbb9487b6e1e4121d6jDXNQK1kdv5K.jpg
Ist das nicht die GTR1 Engine? Vollkommen cpu-limitiert. X-D

dildo4u
2007-04-29, 19:06:10
GTR2 um genau zu sein aber auch extrem CPU limitiert.

san.salvador
2007-04-29, 19:33:47
IMHO ists eine weiterentwickelte Version der GTR2 Engine, vorallem an Wasser- und Lichteffekten erkennbar.

Gast
2007-04-29, 19:35:15
IMHO ists eine weiterentwickelte Version der GTR2 Engine, vorallem an Wasser- und Lichteffekten erkennbar.

Richtig informieren, die Engine von RACE ist sogar älter als die von GTR2. Das ist nämlich noch die alte ISI Engine von 2003.

san.salvador
2007-04-29, 19:39:46
Richtig informieren, die Engine von RACE ist sogar älter als die von GTR2. Das ist nämlich noch die alte ISI Engine von 2003.
Quelle bitte. :)

Gast
2007-04-29, 19:42:06
Quelle bitte. :)

Google ist dein Freund!

AnarchX
2007-04-29, 19:43:00
Bald gibt es noch Spiderman 3 Werte... :ugly:
Warum haben immer solch "begabte" Tester erste Samples?

san.salvador
2007-04-29, 19:44:51
Google ist dein Freund!
Heute leider nicht. :ugly:
Ich bitte um einen Link.

Gast
2007-04-29, 19:47:24
Wie wäre es mit GRAW?:
Settings (http://www.chiphell.com/attachments/month_0704/20070429_5169a69ed66b501a8d7fniujJ1fC1LuH.jpg)
Stelle a (http://www.chiphell.com/attachments/month_0704/20070429_e86c20b162e57085b7738VWKWTnNc56l.jpg)
Stelle b (http://www.chiphell.com/attachments/month_0704/20070429_76cbafae7a1c2756d1e5QMnbE4wfcVSW.jpg)
Stelle c (http://www.chiphell.com/attachments/month_0704/20070429_3765446966eb72d63a28loCbs1wrpYkM.jpg)
Habe mal versucht Stelle a in 1152x1864 max. Details; 16AF; mit 7950GX2 und C2D 3000Mhz einzufangen
http://666kb.com/i/anx2fhvitzues5u0s.jpg
Kommt mir schärfer vor, kann sein, dass der ATi Treiber noch Macken hat?

reunion
2007-04-29, 19:54:02
FEAR 1.08
1280*1024 4AA 8AF soft shadow OFF

HD 2900XT

http://img126.imageshack.us/img126/2613/fearhd2900xtkb7.jpg (http://imageshack.us)
Quelle
(http://www.chiphell.com/viewthread.php?tid=3407&extra=page%3D1&page=15)

8800GTS Niveau (http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_nvidia_geforce_8600_gts_sli_8600_gt/16/#abschnitt_f_e_a_r)im Bezug auf die Avg-FPS.


Das ist exakt das, was auch DT herausbekommen hat. Man könnte fast glauben, dass ist der Typ von DT. Jedenfalls schaut es nicht so aus, wie wenn der den Launchtreiber hätte.

dargo
2007-04-29, 19:54:11
Habe mal versucht Stelle a in 1152x1864 max. Details; 16AF; mit 7950GX2 und C2D 3000Mhz einzufangen
http://666kb.com/i/anx2fhvitzues5u0s.jpg
Kommt mir schärfer vor, kann sein, dass der ATi Treiber noch Macken hat?
Bei dir kann man wenigstens was auf dem Plakat erkennen. :D

Gast
2007-04-29, 19:56:33
Habe mal versucht Stelle a in 1152x1864 max. Details; 16AF; mit 7950GX2 und C2D 3000Mhz einzufangen
http://666kb.com/i/anx2fhvitzues5u0s.jpg
Kommt mir schärfer vor, kann sein, dass der ATi Treiber noch Macken hat?
Die korrekte Auflösung lautet natürlich 1152x864.

Gast
2007-04-29, 19:57:21
Heute leider nicht. :ugly:
Ich bitte um einen Link.
http://www.getpole.com/race/race-news/race-the-wtcc-game---demo-verfugbar-69-98.html


btw 5ter oder 6ter hit bei googel

InsaneDruid
2007-04-29, 20:12:15
Da steht nur das RACE "wie schon alle Vorgänger die ISI-Engine als Grundlage" nutzt. Nun gibt es aber verschiedene "Vorgänger" von Race, von GTR über GTL (schon Gmotor2) bis zu GTR2 (auch GMOTOR2, jedoch weiterentwickelt als GTL, und Rfactor, was ebenfalls die Gmotor2 Engine nutzt hat ebenfalls andere Features als GTR2, zwar keinen Regen, kein Animationssystem, dafür Features wie online Fahrerwechsel etc.

Sogesehen kann Race durchaus auf Gmotor2 basieren, vom look ist es jedoch deutlich schlechter als GTR2. CPU limitiert ist es in jedem Fall.

Ronny145
2007-04-29, 20:19:38
http://www.getpole.com/race/race-news/race-the-wtcc-game---demo-verfugbar-69-98.html


btw 5ter oder 6ter hit bei googel


Genauso kann ich den link bringen:

http://www.gamecaptain.de/PC/Artikel/2973/RACE_-_The_WTCC-Game_Test;1;2.html
"Grafisch zeigt sich neben der Fahrphysik am deutlichsten die Verwandtschaft zu GTR 2 aufgrund der gemeinsam benutzten GMotor-2-Engine."

Bei deinem link:

RACE benutzt wie auch schon alle Vorgänger die ISI-Engine als Grundlage.

Das hat nun gar nichts zu sagen.

GTR1= gMotor 1.0/(1.1/1.2)-Engine
GTR2= gMotor 2.0-Engine (2005)

So weit ich weiß nutzt auch WTCC Gmotor2, zumindest für die grafische Darstellung.

san.salvador
2007-04-29, 20:21:57
Danke für den Link, aber wie InsaneDruid schon sagte - nutzlos.

@InsaneDruid
Warum findest du den Look von GTR2 besser als den von Race? Bei mir ists genau umgekehrt. :|

Thunder99
2007-04-29, 21:30:17
Wenn man die Rohdaten vergleichen kann und die ersten Benches einigermaßen zutreffen scheint ja der R600 einer der ineffizientesten Chips zu sein die es gibt.

Allein von den Rohdaten müsste der doch gut ein 1/3 schneller sein als der G80 :confused:

Wenn dies zutrifft und es dadurch ein Debakel gibt wie seines Zeiten mit dem NV30 wird AMD/ATI evt untergehen :( (Beide Geschäftsfelder im Minus + haufen Schulden verkraftet net jeder sehr lange)

Gmax
2007-04-29, 21:33:40
Das mag ja alles sein, der R6oo könnte aber unter DX10 so richtig erst abgehen, falls ATI tatsächlich den Schwerpunkt bei der Entwicklung auf diesen neuen Standard gelegt hat.

Gast
2007-04-29, 21:36:20
Wenn man die Rohdaten vergleichen kann und die ersten Benches einigermaßen zutreffen scheint ja der R600 einer der ineffizientesten Chips zu sein die es gibt.

Allein von den Rohdaten müsste der doch gut ein 1/3 schneller sein als der G80 :confused:


Das solltest du mal ausführlich erklären... da kann ich irgendwie nicht folgen.

sklave_gottes
2007-04-29, 21:57:41
Vorallem was heist den hier Rohdaten?
Ich sehe zur zeit kein verhältnis zwischen g80 und r600. Geschweige denn eins, was ein r600 +30% zu g80 zeigt.

crux2005
2007-04-29, 21:59:32
eher das gegenteil ist die Wahrheit:

http://forum.beyond3d.com/showpost.php?p=978652&postcount=3679

[dzp]Viper
2007-04-29, 22:09:23
Hm auf beyond3d finde ich das ganze noch ganz interessant (k.a. obs hier schon mal stand..):


What did Crysis lead Developer (has the cards) say about the two (G80GTX and R600XT)?

And remember, Crysis is a DX9 game with an additional DirectX 10 codepath which will only help in getting better performance (gains) for the ones with DX10 cards.

28th April:
I'm gonna spit out a very last detail ( before they get me behind the bars for disclosing information )

The 2900XTX is 4fps in front of the 8800GTX ( in average ) in Crysis ( information directly from a developer of the game )

The 2900XTX won't be the G80 killer that everybody was expecting, but it'll be in front in most cases, with little to good margins depending on the game and settings.

nVIDIA did a great job with the G80 this time, and the performance leap over the previous generation is huge and only compared to the R300 launch in the past


That's STOCK clocks guys, it can OC high

http://forum.beyond3d.com/showthread.php?t=39173&page=146

boxleitnerb
2007-04-29, 22:24:06
Einer Aussage, bei der ein Teil falsch ist, traue ich nicht so ganz.
Der D3D10 Pfad bietet auch bessere Optik. Hat der Typ wirklich mit einem Crytek Mitarbeiter geredet oder dieses keine Detail nur vergessen?

(+44)
2007-04-29, 22:24:41
Bestimmt hat er die Taktraten von GPU und Speicher verglichen :redface:

Gast
2007-04-29, 22:27:56
Bestimmt hat er die Taktraten von GPU und Speicher verglichen :redface:

Wie kannst du es nicht einsehen?

(+44)
2007-04-29, 22:35:40
Ääh, wie meinen?

robbitop
2007-04-29, 22:36:15
Soweit ich weiß, sind bei nV die ALUs mit den TMUs noch verbunden. Zumindest zeichnet das nV bei ihren Bilder immer so, und auch B3D macht das so. Und bis jetzt gibt es auch noch keinen Chip, der das wiederlegt. D.h. nV muss bei einer Erhöhung der ALu-Anzahl auch die TMUs im selben Maß mit skalieren lassen, was ja im Prinzip auch Sinn macht. Die ROPs sind hingegen getrennt.
Ja natuerlich sind die TMUs mit den ALUs verbunden. Pixel muessen gefiltert werden und danach z.B. mit dem Lichtwert multipliziert werden. So hundertprozentig unabhaengig kann man diese nicht trennen. ATI/AMD suggeriert in ihren Blockdiagrammen schon seit R520 Dinge, die so nicht stimmen. Z.B. den ach so tollen Ringbus und die "komplett entkoppelten" ALUs in einem Pool. Dabei sind diese natuerlich TMUs zugewiesen und auch in Quadpipes angeordnet. Anders als in Pipelines laesst sich 3D Rasterizing von den Latenzen gar nicht regeln.

Man sollte nicht all zu viel auf irgendwelche Blockdiagramme geben.

robbitop
2007-04-29, 22:38:35
Da hat wohl Fuad noch etwas Nachhilfe im Bezug GPU bekommen. ;)
Eher hat er wieder irgendeinen Kram irgendwo abgeschrieben, ohne es verstanden zu haben. Fuer mich ist das kein Redakteur. Viel eher ein gut informierter Marktschreier.


Natürlich spielt die Bandbreite eine Rolle. jedoch sind die ROPs ein limitierender Faktor, wenn es um die Anzahl der Samples geht.
Eine 8800GTS verliert von 2xMSAA auf 4xMSAA deutlich weniger Leistung als eine X1950XTX. Was, wenn nicht die ROPs, ist dafür verantwortlich?
In bestimmten Situation ergibt sich sogar eine Leistungssteigerung von 2xMSAA auf 4xMSAA. Magie? Voodoo? Oder einfach nur die ROPs?

Das kommt davon, dass viel zu viele nur die schicken einfachen Blockschaltbilder anschauen und meinen, zu verstehen, wie eine GPU funktioniert. ;)
Das ist nur ein grobes ganz einfaches Modell, so wie das Elektronenmodell, was in der Schule gelehrt wird. Im Detail stimmen dann viele Sachen so aber nicht mehr.

Fuer AA und AF muss man eine GPU auslegen. Da braucht es natuerlich externe Bandbreite aber auch interne Bandbreite und entsprechende Caches. (beim G84 z.B limitiert wieder die externe Bandbreite) Das alles kostet Transistoren. Ich als nicht-Chip-Architekt kenne natuerlich auch nicht jeden Flaschenhals. Allerdings spielen hier viele andere Faktoren noch eine Rolle. Du kannst dir ja mal ausrechnen was man im G80 mit 192 Z Werten oder 96 Z+Color alles machen kann pro Sekunde. Eine ROP schaft pro Pixel eine Berechnung in einem Takt. Gegenueber anderen Aufgaben, die pro Pixel in einer GPU anfallen ist das quasi nichts. Die Berechnung eines Pixels kann in die dreistellige Taktzahl fallen. Ob nun ein Takt zum loopen hinzukommt oder nicht, ist als wenn in China ein Sack Reis umfaellt.

Einzig fuer den First-Z Pass koennte das wirklich mal von Nutzen sein.

AnarchX
2007-04-29, 22:46:24
Gleich wird es spannend, für die sich für die Technik interessieren... ;)

reunion
2007-04-29, 22:54:10
ATI/AMD suggeriert in ihren Blockdiagrammen schon seit R520 Dinge, die so nicht stimmen. Z.B. den ach so tollen Ringbus und die "komplett entkoppelten" ALUs in einem Pool. Dabei sind diese natuerlich TMUs zugewiesen und auch in Quadpipes angeordnet. Anders als in Pipelines laesst sich 3D Rasterizing von den Latenzen gar nicht regeln.


R600:
64ALUs
16TMUs

RV630:
24ALUs
8TMUs

RV610:
8ALUs
4TMUs

Ich sehe hier drei Chips einer Generation mit einem jeweils unterschiedlichen ALU/TEX-Verhältnis. Und genau darum ging mir, und um nichts anders. ATi kann bei R6XX völlig unabhängig voneinander die ALU und die TMU Anzahl skalieren, sonst wären diese Chips gar nicht möglich. Ergo kann es nicht so sein, dass bsw. 16 ALUs fix einem TMU-Quad zugeordnet sind, wie du sagts, und wie dies bei nV offensichtlich der Fall ist.

AnarchX
2007-04-29, 22:56:43
http://img251.imageshack.us/img251/6121/superscalar1tg0.jpg
http://img47.imageshack.us/img47/1470/flopsiw6.jpg
http://img258.imageshack.us/img258/1290/ringbusii1fw7.jpg
http://img82.imageshack.us/img82/8557/tmu1xr8.jpg
http://img237.imageshack.us/img237/6893/tmu2jb5.jpg
http://img442.imageshack.us/img442/92/newjp2.jpg
http://img252.imageshack.us/img252/5633/cfaasa5.jpg

:eek:

Ailuros
2007-04-29, 22:59:57
Was hat der R600 mit DX11 zu tun :confused:

Die Tesselations-Einheit auf R600 soll mit dem momentanen drafts fuer "D3D11" identisch sein und ich wurde versichert dass sich dieses im API nicht mehr aendern wird.

Es waere teurer gewesen den zusaetzlichen Mist fuer Tesselation herauszuwerfen als es stehen zu lassen und das ist eine Aussage der ich durchaus glauben kann, denn aehnliches liegt auch im Series5 Design von Imagination vor.

Gmax
2007-04-29, 23:00:36
Klär uns auf, warum staunst du so? :smile:

dargo
2007-04-29, 23:02:29
1. Was kann man sich unter dem CFAA vorstellen?
2. HQ-AF @standard von der X1000 Serie. Meinen die WU-AF oder AF @A.I disabled?

reunion
2007-04-29, 23:03:01
Also das Bild zu den ALUs suggeriert, dass auch R600 skalare ALUs hat. Die TMU Angaben von vorher waren offensichtlich korrekt, also doch 32bi Samples/Takt?

dildo4u
2007-04-29, 23:04:12
Die X2600XT ist leider auch deutlich weniger als ein Halber X2900XT.

AnarchX
2007-04-29, 23:05:37
Klär uns auf, warum staunst du so? :smile:
Bin nur erstaunt, dass die Folien plötzlich so frei verfügbar waren.
Und einige Infos wie die TMUs sind einfach extrem überraschend, dass es nun doch stimmt.

1. Was kann man sich unter dem CFAA vorstellen?


Gibt es gleich auch noch 6 Folien. ;)

Ailuros
2007-04-29, 23:06:37
R600:
64ALUs
16TMUs

RV630:
24ALUs
8TMUs

RV610:
8ALUs
4TMUs

Ich sehe hier drei Chips einer Generation mit einem jeweils unterschiedlichen ALU/TEX-Verhältnis. Und genau darum ging mir, und um nichts anders. ATi kann bei R6XX völlig unabhängig voneinander die ALU und die TMU Anzahl skalieren, sonst wären diese Chips gar nicht möglich. Ergo kann es nicht so sein, dass bsw. 16 ALUs fix einem TMU-Quad zugeordnet sind, wie du sagts, und wie dies bei nV offensichtlich der Fall ist.


Sooooo unterschiedlich ist es nun wirklich nicht; nur die RV630 bricht quasi das Verhaeltnis um etwas.

320 / 32 = 10:1
120 / 16 = 7.5:1
40 / 4 = 10:1

robbitop
2007-04-29, 23:10:00
Ich sehe hier drei Chips einer Generation mit einem jeweils unterschiedlichen ALU/TEX-Verhältnis. Und genau darum ging mir, und um nichts anders. ATi kann bei R6XX völlig unabhängig voneinander die ALU und die TMU Anzahl skalieren, sonst wären diese Chips gar nicht möglich. Ergo kann es nicht so sein, dass bsw. 16 ALUs fix einem TMU-Quad zugeordnet sind, wie du sagts, und wie dies bei nV offensichtlich der Fall ist.
War doch in R5xx auch der Fall. Nur weil NV das Tex ALU Verhaeltnis innerhalb einer Generation nicht auch skaliert, heisst es nicht, dass es nicht geht. Es macht nur bei diesen handgestrickten Schaltungen mehr Arbeit.

reunion
2007-04-29, 23:10:26
Würdest du bitte eine Quelle für diese Folien angeben? Bei mir lassen sich die Dinger kaum laden.

Ailuros
2007-04-29, 23:11:03
Klär uns auf, warum staunst du so? :smile:

Wer staunt hier ueber was? Handelt es sich um fast einen PPP oder sogar einen vollen PPP (programmable primitive processor), kann man einen gesunden Batzen der zusaetzlichen Faehigkeiten nur OGL gebrauchen und es ist so oder so Transistoren-Verschwendung.

Entwickler werden sich mit Sicherheit ueber das Zeug freuen aber der Durchschnitts-Verbraucher kann nichts damit anfangen.

AnarchX
2007-04-29, 23:14:28
Würdest du bitte eine Quelle für diese Folien angeben? Bei mir lassen sich die Dinger kaum laden.

Wie es schon im Wasserzeichen steht, PCinlife. Aber da es Anhänge sind sieht man sie nur als registrierter User.
Vielleicht lade ich sie dann auch nochmal wo anders hoch.

Ailuros
2007-04-29, 23:16:04
Also das Bild zu den ALUs suggeriert, dass auch R600 skalare ALUs hat. Die TMU Angaben von vorher waren offensichtlich korrekt, also doch 32bi Samples/Takt?

TMUs und ROPs liegen zu weit hinter G80. "Superskalar" ist eine sehr generelle Bezeichnung, ergo Vorsicht. Es sind Marketing-slides und ich hab vor dem Humbug schon seit einer Ewigkeit gewarnt.

AnarchX
2007-04-29, 23:16:26
Custom Filter Anti-Aliasing:
http://img252.imageshack.us/img252/6282/82756977ql4.jpg
http://img443.imageshack.us/img443/793/19796780be0.jpg
http://img455.imageshack.us/img455/7395/12842747rr2.jpg
http://img370.imageshack.us/img370/866/83809675nc3.jpg
http://img453.imageshack.us/img453/9275/21422560ju9.jpg
http://img403.imageshack.us/img403/2249/20919688is2.jpg

Gmax
2007-04-29, 23:16:47
Wer staunt hier ueber was? Handelt es sich um fast einen PPP oder sogar einen vollen PPP (programmable primitive processor), kann man einen gesunden Batzen der zusaetzlichen Faehigkeiten nur OGL gebrauchen und es ist so oder so Transistoren-Verschwendung.

Entwickler werden sich mit Sicherheit ueber das Zeug freuen aber der Durchschnitts-Verbraucher kann nichts damit anfangen.

:lol: Du hast es den punkt gebracht.
Da ich mich zu den Durchschnitts-Verbraucher zähle, wundere ich mich über über diese technische Diagramme und frage mich, was sie uns bringen sollen.

Ailuros
2007-04-29, 23:18:58
1. Was kann man sich unter dem CFAA vorstellen?
2. HQ-AF @standard von der X1000 Serie. Meinen die WU-AF oder AF @A.I disabled?

1. Es wurde schon sehr oft gesagt dass wir bessere Filter fuer AA brauchen. Um was es sich genau handelt noch etwas Geduld.

2. Man meint das Winkel-unabhaengigere AF was aber eine Entscheidung war als der G80 auf den Markt kam.

cheATI
2007-04-29, 23:19:20
Custom Filter Anti-Aliasing:
http://img252.imageshack.us/img252/6282/82756977ql4.jpg
http://img443.imageshack.us/img443/793/19796780be0.jpg
http://img455.imageshack.us/img455/7395/12842747rr2.jpg
http://img370.imageshack.us/img370/866/83809675nc3.jpg
http://img453.imageshack.us/img453/9275/21422560ju9.jpg
http://img403.imageshack.us/img403/2249/20919688is2.jpg

Hurra Quincunx ist wieder da. cheATI

Coda
2007-04-29, 23:20:17
Is man mal nen Wochenende weg und natürlich trudeln dann die News ein. Quincunx-Extreme also.

Nicht ganz blöd, aber im Prinzip doch auch nur ne Treibersache? Den Downfilter kann man mit D3D10 ja so auch beliebig per Shader machen.

deekey777
2007-04-29, 23:20:46
Der R600 soll jetzt bis zu siebenmal schneller 64-bit-Texturen bilinear filtern können als der R520. Das ist ja schön.
Gemeint sind 64-bit-Texturen (INT16), nicht FP16. ;)

Da muss man genau lesen, um nicht hereinzufallen. Gibst doch gar nicht.

Coda
2007-04-29, 23:22:02
Der R600 soll jetzt bis zu siebenmal schneller 64-bit-Texturen bilinear filtern können als der R520. Das ist ja schön.
Nein, das kommt daher, dass es R520 gar nicht konnte und man es somit im Shader selbst machen musste ;)

reunion
2007-04-29, 23:25:17
TMUs und ROPs liegen zu weit hinter G80. "Superskalar" ist eine sehr generelle Bezeichnung, ergo Vorsicht. Es sind Marketing-slides und ich hab vor dem Humbug schon seit einer Ewigkeit gewarnt.

Werde doch mal etwas konkreter. :)

Ailuros
2007-04-29, 23:25:42
Is man mal nen Wochenende weg und natürlich trudeln dann die News ein. Quincunx-Extreme also.

Nicht ganz blöd, aber im Prinzip doch auch nur ne Treibersache? Den Downfilter kann man mit D3D10 ja so auch beliebig per Shader machen.

Um einiges besser als Quincunx. Simon/IMG murmelt bei B3D schon seit einiger Zeit ueber relevantes Zeug und da ich den Herren als absoluten Algorithmen-Experte ansehe will ich ihm auch glauben.

Ich hatte eine sehr lange Debatte mit ihm ueber das Zeug und es nervte Ihn erstmal dass ich das Ganze als "Schmierfilter" bezeichnete, was zugegeben auch etwas extrem ist. Auf jeden Fall was mir an solchen Ideen stinkt, ist dass der Filter ueber die ganze Szene und nicht nur auf polygon edges/intersections uebertragen wird CFAA is not limited to polygon edges. Simon seufzte eben danach und sagte einfach dass man nie alle zufriedenstellen kann. Ich bin mir sicher dass er aehnliches sowohl in MBX als auch in die gesamte Eurasia/Serie5 Familie reingeschleusst hat. Box Filter sind natuerlich sub-optimal, aber ob dieses Zeug ein besseres Resultat bringt will ich erstmal sehen.

***edit: ganz nebenbei ist es eine Frechheit bei zusaetzlichen Filtern mehr Samples zu zaehlen; unter dieser Logik waere Quincunx dann gleich 5xAA. Entschuldigt aber dass ist etwas schwer zu verdauen.

Das "edge detection" Zeug im obrigen Slide sehe ich zum ersten Mal; irgend eine Idee was es sein koennte?

Ailuros
2007-04-29, 23:26:09
Werde doch mal etwas konkreter. :)

A LOT of shplitsch :P

reunion
2007-04-29, 23:26:33
Die X2600XT ist leider auch deutlich weniger als ein Halber X2900XT.

Aber deutlich mehr als ein geviertelter. Zusammen mit der höheren Taktrate sollte die Leistung durchaus überzeugen können.

Coda
2007-04-29, 23:26:52
Um einiges besser als Quincunx.
Klar. Ist ja auch kein Geheimnis, dass der Standard-Boxfilter nicht gerade optimal ist.

Auf jeden Fall was mir an solchen Ideen stinkt ist dass der Filter ueber die ganze Szene und nicht nur auf polygon edges/intersections uebertragen wird.
Stimmt. Das is blöd.

Das "edge detection" Zeug im obrigen Slide sehe ich zum ersten Mal; irgend eine Idee was es sein koennte?
Naja. Sehr wahrscheinlich ein Lowpass über das Bild im Shader und dann nur auf die hochfrequenten Stellen CFAA und auf den Rest MSAA.

AnarchX
2007-04-29, 23:31:03
Aber deutlich mehr als ein geviertelter. Zusammen mit der höheren Taktrate sollte die Leistung durchaus überzeugen können.

Was ich noch etwas seltsam finde ist, dass im Slide 16 nur bei TMUs der HD 2900 von diesen "Extreme TMUs" die Rede ist? :|

dildo4u
2007-04-29, 23:31:36
Aber deutlich mehr als ein geviertelter. Zusammen mit der höheren Taktrate sollte die Leistung durchaus überzeugen können.
Naja abwarten der Basis Speed der X2900XT ist ja nicht auf GTX Niveau wenn man den ersten Benches glauben schenken darf.Auch eine 8600GTS hat eine deutlich höhere Taktrate als die High-End Chips höher als im Vergleich X2600XT zu X2900XT.

deekey777
2007-04-29, 23:32:48
Nein, das kommt daher, dass es R520 gar nicht konnte und man es somit im Shader selbst machen musste ;)
7*0=0
http://img237.imageshack.us/img237/6893/tmu2jb5.jpg
64 bit HDR...
Die Auflistung ist falsch bzw. täuschend, richtiger wäre:
64 bit HDR... über "Full Speed FP.." und dann die weiteren (Unter-)Punkte.
Man könnte meinen, dass der R600 in GT3 des 3D2006 schneller ist als der R520/R580, wenn beide die FP-Filterung im Shader machen. Aber wo ist der Sinn, etwas zu hervorheben, was einer der Minuspunkte des R520 war (fehlende FP-Filterung) und der R600 nativ kann?

reunion
2007-04-29, 23:33:14
Was ich noch etwas seltsam finde ist, dass im Slide 16 nur bei TMUs der HD 2900 von diesen "Extreme TMUs" die Rede ist? :|

Hä? Es steht doch ganz unten große und deutlich "HD2600 and HD2400 texture units have identical functionality".

robbitop
2007-04-29, 23:33:22
Juhu aufgebohrtes Quincunx Geblurre wird neu vermarktet :uclap:

dargo
2007-04-29, 23:33:39
Ich kann mir unter dem CFAA immer noch nichts konkretes vorstellen. Soll das das AAA ersetzen/ergänzen mit deutlich weniger Performanceeinbruch?
Zumindest die HL2 Bilder gefallen mir mit 16xCFAA deutlich besser als mit 8xMSAA.

Ailuros
2007-04-29, 23:35:44
Aber deutlich mehr als ein geviertelter. Zusammen mit der höheren Taktrate sollte die Leistung durchaus überzeugen können.

G84 Gleichstand momentan ausser ich hab Infos von aelteren Treibern. Falls die beiden auf etwa gleichem Nivaeu liegen sind es 192 vs. 139 GFLOPs oder?

Ailuros
2007-04-29, 23:37:08
Ich kann mir unter dem CFAA immer noch nichts konkretes vorstellen. Soll das das AAA ersetzen/ergänzen mit deutlich weniger Performanceeinbruch?
Zumindest die HL2 Bilder gefallen mir mit 16xCFAA deutlich besser als mit 8xMSAA.

Es ist eine fortschrittlichere Version vom guten alten Quincunx; dass dumme ist dann eben dass der zusaetzliche Filter (den man teilweise auch als leichten "blur" empfinden kann) sich ueber die gesamte Szene uebertraegt.

reunion
2007-04-29, 23:37:24
Juhu aufgebohrtes Quincunx Geblurre wird neu vermarktet :uclap:

Man sollte doch erwarten können, vorher auf Resultate warten zu können, bevor hier schon wieder die Schlachtrufe losgetreten werden. Nur weil Quincunx scheiße war, muss das ja nicht auch hier zutreffen. Damit sollte man hochfrequente Texturen sehr gut in den Griff bekommen, wenn es richtig umgesetzt wurde.

AnarchX
2007-04-29, 23:37:50
Hä? Es steht doch ganz unten große und deutlich "HD2600 and HD2400 texture units have identical functionality".

Natürlich, hatte es falsch gedeutet....:rolleyes:

Da wird die HD 2600XT ja immer interessanter. =)

Coda
2007-04-29, 23:38:12
7*0=0
Was heißt hier "0". R520 konnte es nur im Shader (und damit quasi auch nur bilinear). Ist einfach so.

Man sollte doch erwarten können, vorher auf Resultate warten zu können, bevor hier schon wieder die Schlachtrufe losgetreten werden. Nur weil Quincunx scheiße war, muss das ja nicht auch hier zutreffen.
Erweiterte Filterkernel sind ja gar nicht so blöd, das Problem ist nur, dass man damit auch auf jeden Fall etwas Texturqualität verlieren wird.

Da wird's wieder herrliche Flamewars drum geben...

InsaneDruid
2007-04-29, 23:38:41
@InsaneDruid
Warum findest du den Look von GTR2 besser als den von Race? Bei mir ists genau umgekehrt. :|

Hierzu mein damals in der VR geschriebener Beitrag (nach dem Free Test Weekend):

Hab mir den Scheiß nun auch mal angetan, obwohl ich eigentlich weder Steam noch Adware je wieder auf meinem Rechner sehen wollte. Meine Güte, ist ja ein Rotz, im 88er Alfa kann man kilometerweit durch die Motorhaube auf die Straße schauen, Oschersleben versinkt im Nebel, ohne echte Himmelstextur, der Drehzahlmesser des Minis ist achteckig, der fov total überzogen (Oschersleben wirkt viel zu langgezogen) Rückleuchten funktionieren nicht, alles schön encryptet und geheim, einzig die GUI ist gut gelungen, schön hochauflösend, das gefällt. FSAA und AF greifen auch nicht wirklich, flimmer flimmer shimmer shimmer.

Ansonsten, gesehen, gelacht, F8. 4 neue Strecken und ein paar mittelmäßge Cars, das hätte man auch als GTR2 Addon rausbringen können.

Definitiv das schlechteste Simbin Game bisher. Da kann man gut sehen das die wirklich guten Leute alle bei Blimey untergekommen sind. Carmodels zb, sieht ja @ max aus wie @low bei GTR2.
....

Oschersleben @ Race: Sitz ganz hinten, mit Fov ausgeglichen um nicht allzu viel unter der Haube durchzuschauen (links und rechts unter dem Wischer kann man es immer noch), alles neblig
http://img99.imageshack.us/img99/930/capture20070119135335th8.th.jpg (http://img99.imageshack.us/my.php?image=capture20070119135335th8.jpg)

Oschersleben @ GTR2:
http://img265.imageshack.us/img265/1964/grab000bw5.th.jpg (http://img265.imageshack.us/my.php?image=grab000bw5.jpg)

Oschersleben @ Race Shot#2, Sitz weiter vorne, man sieht komplett unter der Haube durch, alles neblig
http://img99.imageshack.us/img99/2696/capture20070119135501al4.th.jpg (http://img99.imageshack.us/my.php?image=capture20070119135501al4.jpg)

Oschersleben @ GTR2: #2
http://img265.imageshack.us/img265/4174/grab001kk7.th.jpg (http://img265.imageshack.us/my.php?image=grab001kk7.jpg)

Monza @ Race, wieder im alles beherrschenden Turok-Nebel, kaum Sichtweite, (maxed out ingame)

http://img265.imageshack.us/img265/94/capture20070119135655uu1.th.jpg (http://img265.imageshack.us/my.php?image=capture20070119135655uu1.jpg)

Monza @ GTR2:
http://img99.imageshack.us/img99/2447/grab002cn4.th.jpg (http://img99.imageshack.us/my.php?image=grab002cn4.jpg)

......

InsaneDruid
2007-04-29, 23:39:04
hier mal noch 2 Shots, beide in der Race Session eines Rennnachmittages

zum einen mit Sitz ganz unten und ganz hinten, also der bestmöglichen Einstellung um den Bug nicht zu sehen, man sieht ihn dennoch: (und man clippt schon durch den Fahrerkörper. In der Bewegung sieht man rechts die durchscheinenden Fahrbahnmarkierungen natürlich noch "besser".

http://img256.imageshack.us/img256/5245/1fv1.th.jpg (http://img256.imageshack.us/my.php?image=1fv1.jpg)

zum anderen hier mit Default Settings:

http://img406.imageshack.us/img406/4651/3ne5.th.jpg (http://img406.imageshack.us/my.php?image=3ne5.jpg)

und last but not least die einzige Stellage bei der man nicht unter der Haube durchschaut: die Lenkradbeißerhaltung :)

http://img350.imageshack.us/img350/2271/2qx0.th.jpg (http://img350.imageshack.us/my.php?image=2qx0.jpg)

Man sieht, der Nebel des Grauens ist immer vorhanden, ebenso der Bug mit der Motorhaube, das darf bei einem Vollpreisgame das schon einige Patches gesehen hat eigentlich nicht vorkommen, normalerweise nichtmal mit Sitz nach oben, wenn das als Option angeboten ist, aber auf keinen Fall in der Defaultposition.

EDIT: hier nochmal mit Sichtweite normal

http://img411.imageshack.us/img411/2826/capture20070119150722gn2.th.jpg (http://img411.imageshack.us/my.php?image=capture20070119150722gn2.jpg)

und weit:

http://img411.imageshack.us/img411/5442/capture20070119150842mg6.th.jpg (http://img411.imageshack.us/my.php?image=capture20070119150842mg6.jpg)


Der Neben IM Auto ist zwar weg, die Bäume versinken dennoch im Nebel, was zeigt das die Sichtweite ggü GTR2/GTL extrem eingeschränkt wurde. Schon komisch für ein später erschienenes Game.

robbitop
2007-04-29, 23:39:14
Ich kann mir unter dem CFAA immer noch nichts konkretes vorstellen. Soll das das AAA ersetzen/ergänzen mit deutlich weniger Performanceeinbruch?
Zumindest die HL2 Bilder gefallen mir mit 16xCFAA deutlich besser als mit 8xMSAA.
CFAA nutzt einfach Samples von anderen Pixeln mit und gewichtet sie aber anders. Das erzeugt je nach Gewichtung einen Blur. Natuerlich ist das im Endeffekt besser angepasst, aber immernoch suboptimal. Macht die schoenen Texturen blurrig.

Ailuros
2007-04-29, 23:39:49
Juhu aufgebohrtes Quincunx Geblurre wird neu vermarktet :uclap:

Wenn's richtig gemacht ist, ist es gar keine so schlechte Idee. Es muss eben viel weniger als Quincunx insgesamt "schmieren" und dann hab ich schon mal Grund mich zu freuen.

dargo
2007-04-29, 23:39:52
Es ist eine fortschrittlichere Version vom guten alten Quincunx; dass dumme ist dann eben dass der zusaetzliche Filter (den man teilweise auch als leichten "blur" empfinden kann) sich ueber die gesamte Szene uebertraegt.
Also "das gute alte Quincunx" fand ich zum kotzen. Das ganze Bild war damit nämlich unscharf. Du meinst also, den selben Mist soll jetzt der R600 verwenden? OMG. :eek:

robbitop
2007-04-29, 23:40:06
Man sollte doch erwarten können, vorher auf Resultate warten zu können, bevor hier schon wieder die Schlachtrufe losgetreten werden. Nur weil Quincunx scheiße war, muss das ja nicht auch hier zutreffen. Damit sollte man hochfrequente Texturen sehr gut in den Griff bekommen, wenn es richtig umgesetzt wurde.
Der Grundgedanke des Verfahrens ist der selbe aber anders umgesetzt. Das sieht man doch.

deekey777
2007-04-29, 23:44:33
@InsaneDruid
Warum findest du den Look von GTR2 besser als den von Race? Bei mir ists genau umgekehrt. :|
Hier keine Diskussion zu GTR2 mehr, macht es per PM oder im Spiele-Forum.

Ailuros
2007-04-29, 23:44:53
Man sollte doch erwarten können, vorher auf Resultate warten zu können, bevor hier schon wieder die Schlachtrufe losgetreten werden. Nur weil Quincunx scheiße war, muss das ja nicht auch hier zutreffen. Damit sollte man hochfrequente Texturen sehr gut in den Griff bekommen, wenn es richtig umgesetzt wurde.

Ja und nein. Wenn mir ein Experte wie Simon die leichte Schmiererei ueber die gesamte Szene nicht verleugnet, die Schultern zockt und sagt dass man nicht alle zufrieden stellen kann, dann weiss ich auch schon dass doch etwas wahres dran steckt.

Wie dem auch sei ich kann das Zeug nur in Echtzeit beurteilen; ist der "Blur-effekt" nur dezent und die AA Qualitaet tatsaechlich hoeher, bin ich persoenlich erstmal positiv dagegen eingestellt.

Ganz nebenbei riecht das Ding verdaechtig nach Bitboys ;)

reunion
2007-04-29, 23:45:04
Der Grundgedanke des Verfahrens ist der selbe aber anders umgesetzt. Das sieht man doch.

Natürlich sieht man das. Nur ist der Grundgedanke schlecht? Es wird ja bei B3D bsw. schon länger über die Notwendigkeit von Filter für besseres AA philosophiert.

Gmax
2007-04-29, 23:47:57
Ganz nebenbei riecht das Ding verdaechtig nach Bitboys ;)

Meinst du damit den Filter oder die 1mb Texture Cache?

Superheld
2007-04-29, 23:48:48
kann nochmal jemand auf die TMUs eingehen, sind es wirklich 32:O

Ailuros
2007-04-29, 23:49:08
Also "das gute alte Quincunx" fand ich zum kotzen. Das ganze Bild war damit nämlich unscharf. Du meinst also, den selben Mist soll jetzt der R600 verwenden? OMG. :eek:

Tja ich hoffe dass es nicht zu dem Grad schmiert. Uebrigens war Quincunx im Vergleich zum damaligen 4x/9-tap eigentlich noch halbwegs tolerabel.

Es gab viele damals die schwoerten dass sie bessere Resultate mit Quincunx als mit einfachem 2xRGMS sehen konnnten; ich persoenlich hab die angebliche bessere "Kantenglaettung" nicht sehen koennen, die Schmiererei aber schon.

So ist natuerlich die erste Reaktion, aber wie gesagt ich will es zuerst in Echtzeit sehen bevor ich ein Urteil ueber das CFAA abgebe.

Ailuros
2007-04-29, 23:49:52
Meinst du damit den Filter oder die 1mb Texture Cache?

AA-Filter.

Ailuros
2007-04-29, 23:50:14
kann nochmal jemand auf die TMUs eingehen, sind es wirklich 32:O

Nein es sind 16.

deekey777
2007-04-29, 23:52:04
Zu den neuen Bildqualitätsverbesserungen: http://www.forum-3dcenter.org/vbulletin/showthread.php?t=349363
http://www.pcper.com/article.php?aid=367
The new MSAA adaptive anti-aliasing is scheduled to be put into the May Catalyst release. This feature will bring their AA options on-par or beyond what NVIDIA currently offers on the G80 graphics cards. This feature timeline is a target, and not yet a commitment from AMD at this time.
So schließt sich der Kreis.

reunion
2007-04-29, 23:58:51
Nein es sind 16.


...die allerdings um einiges aufgemotzt wurden und einen fetten Cache haben.

robbitop
2007-04-29, 23:59:33
Es sind 16 bi Samples pro Takt. FP32 so wie auch Int8 (impliziert es zumindest). Dafuer hat man allerdings noch einige ungefilterte zusaetzliche TMU Samples fuer das Vertex Texturing.

...die allerdings um einiges aufgemotzt wurden und einen fetten Cache haben.

Was beim Filtern keine Rolle spielt.

PS Die ALUs sind nicht wirklich skalar, im engen Sinne.

Gast
2007-04-30, 00:03:44
Erstmal schaun was die Schmierfink Modi an Leistung brauchen, bei "24" CFAA gibts den Edge AA Mode, 8xMSAA ist wohl immer an und dann wird ein 8xEdge AA draufgelegt, na da bin ich mal gespannt.

Wie kommen die Slides auf 20x FP32 Texture Samples? (bei 32TA/16TU)

reunion
2007-04-30, 00:04:32
Es sind 16 bi Samples pro Takt. FP32 so wie auch Int8 (impliziert es zumindest). Dafuer hat man allerdings noch einige ungefilterte zusaetzliche TMU Samples fuer das Vertex Texturing.


Was beim Filtern keine Rolle spielt.


Ja, die reine theoretische peak Texelfüllrate ist im Vergleich zu einem G80 unterirdisch. Mal sehen, was der Chip daraus macht.


PS Die ALUs sind nicht wirklich skalar, im engen Sinne.

Könntest du das bitte so ausführen, dass man sich was darunter vorstellen kann? :)
Ich werde aus diesen Marketingdokumenten nicht schlau, es sieht für mich jedenfalls so aus, als ob die ALUs nicht als vec5-Einheiten verbunden sind.

Gast
2007-04-30, 00:06:09
Wenn's richtig gemacht ist, ist es gar keine so schlechte Idee. Es muss eben viel weniger als Quincunx insgesamt "schmieren" und dann hab ich schon mal Grund mich zu freuen.

Begründung, warum es weniger schmieren sollte? Bei Quincunx ist afaik die Sample Gewichtung doch auch angepasst und die "Nachbar"-Samples werden weitaus geringer gewichtet.

robbitop
2007-04-30, 00:07:52
Könntest du das bitte so ausführen, dass man sich was darunter vorstellen kann? :)
Denk an die G80 ALUs (Vec8) und an die ATI R5xx ALUs die jetzt halt offenbar einen 1:1:1:1:1 Split koennen (wenn das ueberhaupt stimmen sollte). Letzteres ist keine skalare Anbindung im eigentlichen Sinne, erhoet aber die Effizienz. Allerdings nicht bis in den G80 Bereich.

deekey777
2007-04-30, 00:10:13
PS Die ALUs sind nicht wirklich skalar, im engen Sinne.
Sie sind SUPERskalar. :biggrin:
Entweder werden diese je nach Fall zusammengeschaltet oder jemand propagandiert seine ALUs auf Kosten des G80 als skalar (was sie beim G80 auch nicht sind).
Denk an die G80 ALUs (Vec8) und an die ATI R5xx ALUs die jetzt halt offenbar einen 1:1:1:1:1 Split koennen (wenn das ueberhaupt stimmen sollte). Letzteres ist keine skalare Anbindung im eigentlichen Sinne, erhoet aber die Effizienz. Allerdings nicht bis in den G80 Bereich.
Das wäre aber schon interessant:
Man hat Vec4-Operationen, die einzelen skalaren ALUs werden zu je vier zusammengeschaltet (16+4). Hirnrissig?

robbitop
2007-04-30, 00:12:01
Sie sind SUPERskalar. :biggrin:
Entweder werden diese je nach Fall zusammengeschaltet oder jemand propagandiert seine ALUs auf Kosten des G80 als skalar (was sie beim G80 auch nicht sind).
Superskalar ist schon eine R300 ALU.
Die G80 ALU-Anbindung ist hingegen skalar. Wie die nun tatsaechlich intern funktioniert spielt fuer den Durchsatz ja keine Rolle.

reunion
2007-04-30, 00:12:20
Denk an die G80 ALUs (Vec8) und an die ATI R5xx ALUs die jetzt halt offenbar einen 1:1:1:1:1 Split koennen (wenn das ueberhaupt stimmen sollte). Letzteres ist keine skalare Anbindung im eigentlichen Sinne, erhoet aber die Effizienz. Allerdings nicht bis in den G80 Bereich.

Danke. Also sind sie im Prinzip skalar, nur immer in Fünferblöcke unterteilt, sodass man zB nicht zwei vec3 ops gleichzeitig durchschleusen kann?

BTW, Kann eigentlich jemand die Folie zum Memorycontroller vollständig herunterladen? Wenn ja, was steht da bei der HD200-Serie? Bei mir weigert sie das Bild weiter als bis zur hälfte gedownloadet zu werden.

robbitop
2007-04-30, 00:13:56
Da steht was von einem nun echten Ringbus.

dildo4u
2007-04-30, 00:14:38
Danke. Also sind sie im Prinzip skalar, nur immer in Fünferblöcke unterteilt, sodass man zB nicht zwei vec3 ops gleichzeitig durchschleusen kann?

BTW, Kann eigentlich jemand die Folie zum Memorycontroller vollständig herunterladen? Wenn ja, was steht da bei der HD200-Serie? Bei mir weigert sie das Bild weiter als bis zur hälfte gedownloadet zu werden.
http://www.directupload.net/images/070429/CFHr6Y9o.jpg

reunion
2007-04-30, 00:16:05
Dankeschön. Ist das jetzt gut oder schlecht? :D

AnarchX
2007-04-30, 00:17:24
Und noch ein paar Folien:
http://img255.imageshack.us/img255/1994/77402089ji6.jpg
http://img267.imageshack.us/img267/2358/59743691qs2.jpg
http://img184.imageshack.us/img184/9927/62566160pq0.jpg
http://img443.imageshack.us/img443/7294/66510766le0.jpg


Ist nun der Launch doch schon übermorgen?:|

robbitop
2007-04-30, 00:18:05
Ich verstehe nicht, wie man einen Ringbus zu hochloben kann. Es ist eine guenstige Moeglichkeit Einheiten zu verbinden (ggue eines Crossbars) aber auf Kosten der Latenz.
Aber in der Folie suggeriet man wieder anderes.

xL|Sonic
2007-04-30, 00:19:27
Lässt sich denn mit diesem "neuen" AA Modus bei der 2900 das Shader Aliasing minimieren? Gerade wenn man sich aktuelle Autorennen anschaut (gut auf dem PC gibts jetzt eigentlich nicht viel beindruckendes) auf den Konsolen anschaut, fällt einem das doch immer wieder extrem stark auf.

DaEmpty
2007-04-30, 00:20:04
Allerdings nicht bis in den G80 Bereich.
Der Hauptunterschied beim Vergleich von 5 Komponenten ist ja, wenn ich das richtig sehe, dass der G80 an 5 verschiedenen Pixel arbeitet und so eigentlich keine Blasen entstehen können. Der R600 muss diese 5 Komponenten mit den Berechnungen für einen Pixel füllen.
Bei entsprechenden Shadern, müsste der R600 also einige Vorteile rausarbeiten können. Riecht für mich nach viel Arbeit für das Shaderreplacement-Team. :biggrin:

robbitop
2007-04-30, 00:22:35
Wer will denn unbedingt Flimmern durch Vernichtung von Informationen beheben? Geht denn das AF Flimmern vom G70 durch Qunicunx weg? ^^

@DaEmpty
die G80 Herangehensweise ist effektiver.

reunion
2007-04-30, 00:24:28
Also der Performancevorsprung, den AMD selbst (wohl aus gutem Grund nicht im Vergleich zu G80) im Vergleich zu R580 ausgewählt hat, ist ja mehr als mau, kaum mal doppelte Leistung.

Gast
2007-04-30, 00:26:41
warum, man sieht doch überall eine verdopplung +

Ailuros
2007-04-30, 00:27:05
Also der Hoehenunterschied bei den Balken in den letzten slides oben ist durchaus gelungen. Sehe ich mir die Fear/SS Leistung so an sieht es nicht danach aus als ob die bisherigen R600/Fear Resultate falsch waren.

AnarchX
2007-04-30, 00:28:09
warum, man sieht doch überall eine verdopplung +

Mal genauer die Achsen anschauen. ;) Wie schon gesagt sollte man diese Marketing-Folien, etwas kritisch beäugen.

robbitop
2007-04-30, 00:28:42
Also der Performancevorsprung, den AMD selbst (wohl aus gutem Grund nicht im Vergleich zu G80) im Vergleich zu R580 ausgewählt hat, ist ja mehr als mau, kaum mal doppelte Leistung.
R600 ist zu sehr zukunftsgewand. FP32 Texturen bedeuten anscheinend keinen Rohleistungsverlust, genug Bandbreite ist auch da. Rechenleistung ist auch ok. Nur fehlt ein wenig Grundfuellratenrohleistung fuer Int8.

Gast
2007-04-30, 00:29:37
ach danke. ich habe die achsenbeschriftung wirklich übersehen.

Ailuros
2007-04-30, 00:29:50
Begründung, warum es weniger schmieren sollte? Bei Quincunx ist afaik die Sample Gewichtung doch auch angepasst und die "Nachbar"-Samples werden weitaus geringer gewichtet.

Tja falls Du Recht haben solltest, will ich mir gar nicht vorstellen was 16xCFAA (ergo wohl 8xMSAA + 8x tap-wasauchimmer) fuer eine Auswirkung auf Texturen haben koennte....

Lässt sich denn mit diesem "neuen" AA Modus bei der 2900 das Shader Aliasing minimieren? Gerade wenn man sich aktuelle Autorennen anschaut (gut auf dem PC gibts jetzt eigentlich nicht viel beindruckendes) auf den Konsolen anschaut, fällt einem das doch immer wieder extrem stark auf.

Stell Deinen Textur-LOD auf +1.0 und beantworte Deine Frage selber ;)

reunion
2007-04-30, 00:38:07
R600 ist zu sehr zukunftsgewand. FP32 Texturen bedeuten anscheinend keinen Rohleistungsverlust, genug Bandbreite ist auch da. Rechenleistung ist auch ok. Nur fehlt ein wenig Grundfuellratenrohleistung fuer Int8.

Tja, bleibt die Frage, ob er das auch mal ausspielen kann. Die GS-Leistung soll ja auch überzeugen können, und Ati versucht jetzt wohl nicht ganz unbegründet in D3D10 Vergleiche zu flüchten.

DaEmpty
2007-04-30, 00:38:22
@DaEmpty
die G80 Herangehensweise ist effektiver.
Kommt drauf an wie man Effizienz definiert. Momentan scheinen sie ja durchschnittlich auf die gleiche Leistung zu kommen. Bei günstigen Shadern ist ATI wohl vorne und bei ungünstigen NV (erinnert leich an Netburst vs. K8. Nur dass man dank Shaderreplacement mehr Einfluss auf die Codequalität hat).

Dafür muss NV wesentlich mehr Transistoren in Register und Scheduler investieren. Da wir wohl nie erfahren werden, wieviel Transistoren in die komplette arithmetische Komponente (ALUs, Scheduler, zugehörige Register, ...) geflossen sind, können wir die Effizienz im Sinne von Performance/Transistoren wohl kaum beurteilen.

robbitop
2007-04-30, 00:39:30
Ich meine Auslastung pro ALU. Also Effektivitaet. Wie gross die Effizienz ist (also Punch pro Flaeche) weiss ich nicht.

Tja, bleibt die Frage, ob er das auch mal ausspielen kann. Die GS-Leistung soll ja auch überzeugen können, und Ati versucht jetzt wohl nicht ganz unbegründet in D3D10 Vergleiche zu flüchten.
Ja Vertextexturing geht damit gut, GS, HDR-R, FP Filterung. Da wuerde der G80 mehr einbrechen.

Allerdings hat der G80 die hoehere Grundleistung in Sachen Fuellrate.

dildo4u
2007-04-30, 00:41:24
Wenn das Ding so Zukunftsweisend ist warum geht die Karte dann bei Oblivion nicht richtig ab?Der G80 kann ja dort auch übermäßig stark punkten im Verlgeich zur "Last-Gen".


http://www.directupload.net/images/070429/lhG7bb7V.jpg


http://www.directupload.net/images/070429/J4vPRb5j.jpg

http://www.computerbase.de/artikel/hardware/grafikkarten/2006/test_nvidia_geforce_8800_gtx/20/#abschnitt_oblivion

reunion
2007-04-30, 00:44:24
Wenn das Ding so Zukunftweisend ist warum geht die Karte dann bei Oblivion nicht richtig aber der G80 kann ja dort auch übermäßig stark punkten im Verlgeich zu "Last-Gen".

Was soll an Oblivion bitte so besonders "zukunftsweisend" sein? Das Spiel ist in Außenarealen ja nichtmal Shaderlimitiert (siehe R520 vs. R580), sondern profitiert vorallem von der hohen Texelfüllrate des G80. Außerdem sehe ich da bei Oblivion laut ATi immerhin eine Gewinn von ~ Faktor 2.

Ailuros
2007-04-30, 00:45:19
Tja, bleibt die Frage, ob er das auch mal ausspielen kann. Die GS-Leistung soll ja auch überzeugen können, und Ati versucht jetzt wohl nicht ganz unbegründet in D3D10 Vergleiche zu flüchten.

Hand aufs Herz: reicht das Gesamt-Paket um wirklich ueberzeugen zu koennen?

reunion
2007-04-30, 00:46:25
Hand aufs Herz: reicht das Gesamt-Paket um wirklich ueberzeugen zu koennen?

Dazu muss ich das Gesamtpaket erstmal kennen. :)

Gast
2007-04-30, 00:47:21
Hand aufs Herz: reicht das Gesamt-Paket um wirklich ueberzeugen zu koennen?

Wenn man Ahnung hat ja

Gast
2007-04-30, 00:48:08
bis jetzt noch nicht, aber ich bin auch nur ein gast der seinen Acc vergessen hat.
Irgendwie wirkt alles ein wenig... hilflos

Ailuros
2007-04-30, 00:51:04
Was soll an Oblivion bitte so besonders "zukunftsweisend" sein? Das Spiel ist in Außenarealen ja nichtmal Shaderlimitiert (siehe R520 vs. R580), sondern profitiert vorallem von der hohen Texelfüllrate des G80.

http://www.techreport.com/reviews/2006q4/geforce-8800/oblivion-hdr-aa.gif

http://www.techreport.com/reviews/2006q4/geforce-8800/index.x?pg=14

8800GTS vs. X1950XTX

Dazu muss ich das Gesamtpaket erstmal kennen. :)

Mit absoluter Nuechternheit seitens AMD $399 wert.

dildo4u
2007-04-30, 00:57:13
Call of Juarez sieht interresant aus siehe X1800XT zu 1900XTX scheint extrem Shader limitiert zu sein das muss mal mit der X2900XT gebencht werden.


http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_ati_radeon_x1950_pro/11/#abschnitt_call_of_juarez

Gast
2007-04-30, 01:02:31
Also der Performancevorsprung, den AMD selbst (wohl aus gutem Grund nicht im Vergleich zu G80) im Vergleich zu R580 ausgewählt hat, ist ja mehr als mau, kaum mal doppelte Leistung.

Was ist denn daran mau? Nur weil der G80 im Vergleich zum G70 so überragend performt (womit nun wirklich niemand rechnete!) ist die R600 Leistung doch nicht schlecht. Das Ausgangsniveau (R580) ist ja auch schon sehr hoch.

Gast
2007-04-30, 01:12:11
Wenn das Ding so Zukunftsweisend ist warum geht die Karte dann bei Oblivion nicht richtig ab?Der G80 kann ja dort auch übermäßig stark punkten im Verlgeich zur "Last-Gen".

Soll ein einziges Spiel jetzt als Indikator dafür dienen, wie zukunftsweisend eine Chiparchitektur ist? Ich verstehe deine Argumentation nicht. Unterschiedliche Chiparchitekturen hatten seit jeher ihre Stärken und Schwächen zumeist in unterschiedlichen Szenarien.

(+44)
2007-04-30, 01:36:06
Hmm, seitenweise neuer Text, any Benchmarks yet?

Gast
2007-04-30, 01:40:55
Hmm, seitenweise neuer Text, any Benchmarks yet?
Nein, aber Infomationen über Architektur und Funktionen!°!

dildo4u
2007-04-30, 01:47:00
Hmm, seitenweise neuer Text, any Benchmarks yet?

Aber Achtung nicht zu sher auf die Balken achten sondern eher auf die Skala links. ;)

http://www.directupload.net/images/070429/lhG7bb7V.jpg


http://www.directupload.net/images/070429/4Mv6EmTP.jpg

(+44)
2007-04-30, 01:48:50
Die hab ich ja gesehn, aber "AMD-interne" Folien sind für mich weniger wert als die Dailytech-Benchmarks :/
(Besonders weil sie ja keine Spielebenchmarks zeigen, sondern nur interne Vergleiche zum R580+).... €: Silly me - Spiele stehn ja unten dran :U

Jedenfalls will ich keine HDR/Stencil-Performance sehn, sondern Spiele in Alltagssituationen, aber die brauchen wir von AMD nicht erwarten, da verlass ich mich auf Reviews.

dr_mordio
2007-04-30, 04:16:55
ist schon seit ein paar tagen bekannt, habs aber hier noch nicht gesehen.

für alle die rätseln was es mit dem HD-Audio auf sich hat:

es ist kein "durchschleifen" sondern eine richtige soundkarte.

http://www.thg.ru/technews/images/r600_4-190307.jpg

MfG
Alex

Gast
2007-04-30, 04:24:17
was die sich beim sound denken hm,physik würde besser ankommen

dr_mordio
2007-04-30, 04:47:31
sound wegen HD.
HD = HighDefinition

es gibt leute die einen großen HD-TV daran anschließen und dann auch mal filme (blueray / HD-DVD) darauf sehen wollen.

MfG
Alex

Gast
2007-04-30, 08:44:08
Es wird hier nur der Sound von HD-DVD und Blueray-Disc durchgeschleift zum HDMI Anschluss, es ist keine Soundkarte, weil weder irgendwelches Soundprocessing, noch eine D/A-Wandlung stattfindet.

deekey777
2007-04-30, 08:56:07
Es wird hier nur der Sound von HD-DVD und Blueray-Disc durchgeschleift zum HDMI Anschluss, es ist keine Soundkarte, weil weder irgendwelches Soundprocessing, noch eine D/A-Wandlung stattfindet.
Ich denke schon, dass dieser Transmitter auch unkomprimierte PCM-Ausgabe beherrscht, wenn die CPU und die passende Software die Dekodierung der neuen Formate übernehmen. Auch ist es denkbar, dass der Ton von DVDs digital von der Grafikkarte ausgegeben werden kann.

Gast
2007-04-30, 09:03:02
Hi,

Ich denke schon, dass dieser Transmitter auch unkomprimierte PCM-Ausgabe beherrscht, wenn die CPU und die passende Software die Dekodierung der neuen Formate übernehmen.


Als Transmitter wird er schon alle digitalen Formate ausgeben können, denke ich, also auch PCM von Audio-CDs beispielsweise.

Auch ist es denkbar, dass der Ton von DVDs digital von der Grafikkarte ausgegeben werden kann.


? Nichts anderes habe ich doch oben geschrieben. Der digitale Sound wird auf dem HDMI Anschluss ausgegeben.

Gast
2007-04-30, 09:20:53
Denk an die G80 ALUs (Vec8) und an die ATI R5xx ALUs die jetzt halt offenbar einen 1:1:1:1:1 Split koennen (wenn das ueberhaupt stimmen sollte). Letzteres ist keine skalare Anbindung im eigentlichen Sinne, erhoet aber die Effizienz. Allerdings nicht bis in den G80 Bereich.

Welchen Sinn macht eine 1:1:1:1:1 Splittung? Ist es wirklich so sinnvoll für 16 Pixel fünfmal einen gleichen Komponenten zu berechnen?
Vermutlich wollten sie wohl nur auf die Marketingschiene aufspringen, da aus dem Blockbild klar ein 4:1 herausgeht.

Gast
2007-04-30, 09:37:04
Ob nun ein Takt zum loopen hinzukommt oder nicht, ist als wenn in China ein Sack Reis umfaellt.


Ich bin kein Experte in diesem Gebiet, sondern interpretiere nur die Ergebnisse.
Es ist nur auffälig, dass selbst eine 8600GT, mit einer deutlich geringeren Bandbreite als die X1950pro, beim Wechsel von 2xMSAA auf 4xMSAA einen geringeren Einbruch erleidet. Für mich als Laie spielen hier die ROPs mit ihrer Optimierung auf 4xMSAA (4C/Z Samples) eine entscheidene Rolle.

LovesuckZ

Gast
2007-04-30, 10:09:08
Wenn man sich das so anschaut scheint sich das Bild wieder zu drehen und es war NV die diese Generation mal wieder auf die Holzhammermethode (in der Gesamtheit der Architektur) gesetzt haben

Gast_1
2007-04-30, 10:17:43
Hä? Was meinst du denn damit (Holzhammermethode)?

Gast
2007-04-30, 10:23:05
Hä? Was meinst du denn damit (Holzhammermethode)?

Na dass auch diese Gereration Texelfillrate über alles geht. Z.B. ein G84 würde ohne seine überproportionale Pixel/Texelleistung eingehen.

robbitop
2007-04-30, 10:23:58
Ich bin kein Experte in diesem Gebiet, sondern interpretiere nur die Ergebnisse.
Es ist nur auffälig, dass selbst eine 8600GT, mit einer deutlich geringeren Bandbreite als die X1950pro, beim Wechsel von 2xMSAA auf 4xMSAA einen geringeren Einbruch erleidet. Für mich als Laie spielen hier die ROPs mit ihrer Optimierung auf 4xMSAA (4C/Z Samples) eine entscheidene Rolle.

LovesuckZ
Weil auch die G84 von der Architektur darauf ausgelegt ist. (interne Datenpfade, Caches ect) Genauer koennte dir das vermutlich nur ein Chip Architekt sagen.

Gast
2007-04-30, 10:24:13
Hä? Was meinst du denn damit (Holzhammermethode)?

Oder sagen wirs so: Von allem was derzeit viel bringt viel.

robbitop
2007-04-30, 10:28:39
Welchen Sinn macht eine 1:1:1:1:1 Splittung? Ist es wirklich so sinnvoll für 16 Pixel fünfmal einen gleichen Komponenten zu berechnen?
Vermutlich wollten sie wohl nur auf die Marketingschiene aufspringen, da aus dem Blockbild klar ein 4:1 herausgeht.
Da steht ganz klar 5 Instruktionen pro Takt. Ich gehe davon aus, dass das auch stimmt. Das bringt schon was.
Fuer 16 Pixel die gleiche Operation auszufuehren ist beim 3D Rendering auch nicht schlimm. Aber oftmals braucht man pro Takt und Pixel viel weniger als 5 Instruktionen. (Pixelshader brauchen meist 3 Komponenten)

reunion
2007-04-30, 10:31:54
Jawed bei B3D hat einige interessante Ergüsse zu R600 abgegeben:

They're five independent ALUs. Each one can execute a different instruction.

They're 16-wide, because there's 16 pixels all running in parallel within the shader unit. So, it's sorta like a sideways G80. Remember the arguments about how G80's ALUs aren't really scalar, because they're 8-wide arrays of ALUs performing sequential instruction execution of the individual components of a vector? 8-pixels are locked together in G80. 16 in R600.

The operand fetch should be moderately exciting in R600. 3 operands have to be fetched for each of 5 ALUs. Need to think about this.


http://forum.beyond3d.com/showpost.php?p=978900&postcount=3772

Zu CFAA:

OK, I'm curious now, why are people expecting CFAA to be a post-process shader?

Is it because D3D10 allows access to the individual samples, anyway? Or is there a more fundamental thing?

In my view, when you look at a render target in memory (or in cache) all those samples are cosying-up next to each other. The resolve hardware can easily stride through that data at whatever rate it feels like. Don't forget the resolve hardware has to be able to cope with both, at the very least, 32-bit and 64-bit per pixel render target formats.

http://forum.beyond3d.com/showpost.php?p=978904&postcount=3774

Gast
2007-04-30, 10:53:49
Da steht ganz klar 5 Instruktionen pro Takt. Ich gehe davon aus, dass das auch stimmt. Das bringt schon was.

Wieviele Anweisungen erlerdigt der G80 pro Takt?
Aus meinem Verständnis bearbeitet eine Vec16 Einheit des G80 für 16 Pixel je eine Komponente. Wie sieht es beim r600 aus, wenn sie 5 Anweisungen schafft?
Im Blockbild ist diese Unterteilung nicht so deutlich - daher tippe ich auf eine Marketingänderung.

robbitop
2007-04-30, 11:48:29
Eine G80 ALU ist im Prinzip eine anders angebundene SIMD ALU.
Wie du schon sagst, wird fuer 4 Quads die gleiche Instruktion ausgefuehrt. Allerdings wird pro Takt immer nur ein Kanal bearbeitet. Das kostet richtig Steuerungslogik und ist richtig effektiv.

Ohne Gewaehr:
Eine R600 ALU ist anscheinend eine herkoemmliche ALU, welche nur einen Pixel gleichzeitig bearbeiten kann. Sie bearbeitet alle Kanaele eines Pixels aber gleichzeitig und anscheinend unabhaengig.
Da 4 Quad ALUs ein Array bilden, fuehren sie die gleiche Operation aus. (beim R580 und Xenos ist das aehnlich)

Klingt aehnlich wie beim G80, ist es aber nicht. Denn fallen pro Pixel und Takt nur bsw 2 oder 3 notwendige Komponenten pro Operation an, werden die restlichen Komponenten verschwendet. Die Kanaele sind ja fix.

R600 macht einen guten Schritt nach vorn bzgl der Auslastung der Einheiten, kommt aber diesbezueglich nicht an die G80 ALU Philosophie heran. Dafuer sind die Einheiten billiger und man kann mehr davon einbauen.

Ich sehe bezueglich der reinen Shaderperformance keinen klaren Sieger.
Der G80 erschlaegt den R600 anscheinend mit einer Rohfuellrate, die offenbar auch er nicht ausnutzen kann.

Das 512 Bit SI beim R600 ist fuer heutige Spiele relativ sinnfrei. Aber sobald HDR-R ins Spiel kommt, bricht er eben kaum ein. Auch fuer GS und Vertex Texturing ist er gewappnet. Er verliert dabei im Gegensatz zum G80 keine Texelfuellrate. Nicht mal bei FP Texturfilterung. Allerdings ist die Grundleistung anscheinend nicht hoch genug. Vieleicht hat ATI zu frueh zu viel gewollt.

zu Jaweds Diagrammen:
Macht euch da nicht all zu viel draus. Da ist nix nachgemessen. Ist also spekulativ und das mit einem recht unoptimierbaren Shader (aufgrund der fixen Reihenfolge).

Coda
2007-04-30, 12:25:35
Ich bin ja mal gespannt, ob man die Tesselation-Engine unter OpenGL nutzen kann, falls es sie wirklich gibt ;)

G8x verarbeitet die Instructions irgendwie vertical statt horizontal durch die Vec8-ALUs, ich hab das auch noch nicht ganz verstanden, aber es reduziert auf jeden Fall die Blasen. Und nein, das was ATI da gebaut hat ist nicht das gleiche.

AnarchX
2007-04-30, 12:26:15
[News]

HD 2400
http://img231.imageshack.us/img231/1443/a6fd5538ae18449d88d8e64gj9.jpg (http://imageshack.us)http://img231.imageshack.us/img231/7775/85e32ce67a02448bba52b14fk1.jpg (http://imageshack.us)

HD 2600 Pro und XT
http://img231.imageshack.us/img231/9691/b620b4d8c34341e69fe14d4yx5.jpg (http://imageshack.us)http://img231.imageshack.us/img231/6508/cde6c4d7f7204560a3de88dwa0.jpg (http://imageshack.us)

Quelle: Hardspell
(http://www.hardspell.com/doc/hardware/36904_page18123.html) Ist übrigens ein Artikel über UVD, mit einigen interessanten Details. ;)

Warum diese sonderbare HD 2400 noch CF-Connectoren hat bleibt wohl auch ein Geheimnis? :|

robbitop
2007-04-30, 12:29:33
Zur Tesslationseinheit wurde in den Folien ja IIRC nichts gesagt. Wenn es was grosses waere, wuerde man ja damit werben. Vieleicht was aehnliches wie der Memexportkram beim Xenos?

Gast
2007-04-30, 12:31:59
optisch wirken die karten sehr passend zum Midrange sektor.

aehmkei
2007-04-30, 12:32:50
Hier noch das Bilder der 2900XT

http://img219.imageshack.us/img219/7199/483e6e55a5d2401298cebbeew2.th.jpg (http://img219.imageshack.us/my.php?image=483e6e55a5d2401298cebbeew2.jpg)

http://www.hardspell.com/doc/hardware/36904_page18181.html

PCGH_Carsten
2007-04-30, 12:35:00
R600 ist zu sehr zukunftsgewand. FP32 Texturen bedeuten anscheinend keinen Rohleistungsverlust, genug Bandbreite ist auch da. Rechenleistung ist auch ok. Nur fehlt ein wenig Grundfuellratenrohleistung fuer Int8.
[Meine Hervorhebung)

Hm? Wie das? In den geleakten Slides steht doch eindeutig, dass FP16 "Full-Speed" sind und FP32 zwei Takte brauchen.

http://img82.imageshack.us/img82/8557/tmu1xr8.jpg
http://img237.imageshack.us/img237/6893/tmu2jb5.jpg


Vieleicht was aehnliches wie der Memexportkram beim Xenos?
Memexport ist doch äquivalent zum Stream-Out in D3D10.

AnarchX
2007-04-30, 12:37:38
Hier noch das Bilder der 2900XT

http://img219.imageshack.us/img219/7199/483e6e55a5d2401298cebbeew2.th.jpg (http://img219.imageshack.us/my.php?image=483e6e55a5d2401298cebbeew2.jpg)

http://www.hardspell.com/doc/hardware/36904_page18181.html

;D Das wurde gerade entfernt, sicherlich wegen der offensichtliche Seriennummer.

Gast
2007-04-30, 12:40:20
Irgendwie wirkt das Kühlgerippe bei der HD2900 ziemlich flach. Hoffentlich ein gutes Zeichen.

aehmkei
2007-04-30, 12:40:41
;D Das wurde gerade entfernt, sicherlich wegen der offensichtliche Seriennummer.

Zum Glück hab ich es gleich auf Imageshack geladen :)

AnarchX
2007-04-30, 12:41:12
Irgendwie wirkt das Kühlgerippe bei der HD2900 ziemlich flach. Hoffentlich ein gutes Zeichen.

Vapor Chamber... ;)

deekey777
2007-04-30, 12:42:26
Hi,



Als Transmitter wird er schon alle digitalen Formate ausgeben können, denke ich, also auch PCM von Audio-CDs beispielsweise.




? Nichts anderes habe ich doch oben geschrieben. Der digitale Sound wird auf dem HDMI Anschluss ausgegeben.
Das war als Ergänzug gedacht. :smile:
Nicht dass der Eindruck entsteht, die Tonausgabe wäre nur auf HD DVD und BD beschränkt.

Gast
2007-04-30, 12:46:23
Hm? Wie das? In den geleakten Slides steht doch eindeutig, dass FP16 "Full-Speed" sind und FP32 zwei Takte brauchen.


Das bedeute, dass nVidia hier ebenfalls die Oberhand hätte.
Immerhin benötigen sie zwei Takte für eine bilineare FP16 Filterung.


FP16 bilinear texture filtering is also performed at 32 pixels per clock (about 5× faster than GeForce 7x GPUs),

robbitop
2007-04-30, 12:50:40
[Meine Hervorhebung)

Hm? Wie das? In den geleakten Slides steht doch eindeutig, dass FP16 "Full-Speed" sind und FP32 zwei Takte brauchen.


Ich meinte natuerlich FP16 Texturfilterung. Mea Culpa.

Coda
2007-04-30, 12:50:44
Zu CFAA:
Es riecht schon sehr danach, dass das im Shader gemacht wird - das ist aber auch nicht schlimm, weil sowas eh verdammt billig ist. Wir reden hier von GPUs mit 150GB/s Speicherbandbreite, der Framebuffer mit den Samples ist im ~100MB-Bereich und die Verarbeitung ist genauso fix.

AnarchX
2007-04-30, 12:56:05
Die 256kB L2-Texture Cache scheinen doch nur für alle Textur-Prozessoren beim R600 zu gelten.

R600 = ALU x 64,Vertexunit x 4,256KB L2,ROPs x 4,thread sheduler x 1,512-bit Ringbus
RV630 = ALU x 24,Vertexunit x 2,128KB L2,ROPs x 1,thread sheduler x 1,128-bit Ringbus
RV610 = ALU x 8,Vertexunit x 1,0KB L2,ROPs x 1,thread sheduler x 1,128-bit Ringbus/Crossbar
edit: ... mal mit Google etwas übersetzt.

Und hier gibt es noch eine Analyse der Architektur(Schaubilder), aber leider auf Chinesisch:

http://directupload.com/files/qmmxzjjmjxmkzzmlwn2u.jpg (http://directupload.com/)
http://directupload.com/files/ozjkjtywjm5wtkytozc2.jpg (http://directupload.com/)
http://directupload.com/files/yzymymj5zmx2tnkmdhrf.jpg (http://directupload.com/)
http://directupload.com/files/o0hzleenmth1ydtgmhyo.jpg (http://directupload.com/)
http://directupload.com/files/yyijk2zw5qmq3mmojdyd.jpg (http://directupload.com/)


Quelle (http://chiphell.com/viewthread.php?tid=3502&extra=page%3D1)

deekey777
2007-04-30, 13:15:19
...
Ohne Gewaehr:
Eine R600 ALU ist anscheinend eine herkoemmliche ALU, welche nur einen Pixel gleichzeitig bearbeiten kann. Sie bearbeitet alle Kanaele eines Pixels aber gleichzeitig und anscheinend unabhaengig.
Da 4 Quad ALUs ein Array bilden, fuehren sie die gleiche Operation aus. (beim R580 und Xenos ist das aehnlich)
...

Wenn der RV630 24 ALUs hat, so tippe ich blind auf 8x8-Architektur beim R600.

Ferengie
2007-04-30, 13:23:00
und wieviel soll dann der RV660/670 bekommen ^-^

deekey777
2007-04-30, 13:28:24
und wieviel soll dann der RV660/670 bekommen ^-^
Möglicherweise 3/4 R600 für den RV670 und von einem RV660 habe ich nichts gehört.

Ferengie
2007-04-30, 13:29:55
ziemlich alt...
http://resources.vr-zone.com//newspics/Oct06/20/RV670.gif

DaEmpty
2007-04-30, 13:32:31
Ich hab mal grad versucht die Unterschiede in der Datenorganisation zu visualisieren. Hoffe das ist alles richtig so. :)

http://www.directupload.net/images/070430/JuZ4UyG4.png
ATi geht Pixelbasiert vor (horiziontale Datenausrichtung).
Vor R600 bietet man nur die Möglichkeit pro Takt mit einem Vektor und einem Skalar zu rechnen mit einer jeweils eigenen Operation.
Jede nicht genutzte Komponente bringt verlorene Rechenleistung mit sich.
R600 kann nun pro Pixel für 5 Skalare je eine eigene Operation ausführen. Blasen treten erst auf sobald durch mathematische Abhängigkeiten nicht mehr genug Skalare zur Verfügung stehen.
http://www.directupload.net/images/070430/okf4Rcb7.png
Der G80 nutzt nun eine vertikale Datenausrichtung. Er berechnet für 16 Pixel immer die selbe Komponente mit exakt der selben Operation.
Für jede Komponente wird daher ein Takt benötigt, wohingegen der R600 pro Takt 5 Kompontenten berechnen kann. Bringt eine bessere Latenz die aber hier ziemlich unnötig ist.
Beim G80 können Blasen eigentlich nur durch Dynamic Branching auftreten.

Gast
2007-04-30, 13:35:01
ist der R600 bereich im vergleich zum G80 nicht ein wenig unterdimensioniert?

robbitop
2007-04-30, 13:36:05
Wenn der RV630 24 ALUs hat, so tippe ich blind auf 8x8-Architektur beim R600.
Meinetwegen, das muesste man noch ausmessen. Am Kerngedanken aendert das allerdings nichts. :)

DrumDub
2007-04-30, 13:36:21
da sieht man den grundlegenden desginunterschied des g80 sehr schön. :up:

Gast
2007-04-30, 13:37:40
at: DaEmpty
Bitte eine kleine Erklärung dazu.

DrumDub
2007-04-30, 13:37:55
ist der R600 bereich im vergleich zum G80 nicht ein wenig unterdimensioniert? nein, denn es wird jeweils eine funktionseinheit gezeigt.

g80: 16fach (x8=128)
r600: 5fach (x64=320)

Gast
2007-04-30, 13:39:13
gut, dann habe ich das bild falsch interpretiert.

robbitop
2007-04-30, 13:42:08
Ich finde das Diagramm besonders beim G80 Verwirrend. Ich haette da die erste Reihe Rot, die zweite Gruen ect gemacht.
Auch ist es nicht selbsterklaerend. Ein paar Saetze dazu waeren nicht schlecht.

Gast
2007-04-30, 13:46:53
Ich finde das Diagramm besonders beim G80 Verwirrend. Ich haette da die erste Reihe Rot, die zweite Gruen ect gemacht.


Das wäre auch richtiger.

DrumDub
2007-04-30, 13:48:33
Ich finde das Diagramm besonders beim G80 Verwirrend. Ich haette da die erste Reihe Rot, die zweite Gruen ect gemacht.
Auch ist es nicht selbsterklaerend. Ein paar Saetze dazu waeren nicht schlecht. man muss halt von horizonztal auf vertikal umdenken.

reunion
2007-04-30, 13:58:09
Zur Tesslationseinheit wurde in den Folien ja IIRC nichts gesagt. Wenn es was grosses waere, wuerde man ja damit werben. Vieleicht was aehnliches wie der Memexportkram beim Xenos?

Naja, wenn man sich die Seitenanzahlen der einzelnen Folien ansieht, dann scheinen da noch einige zu fehlen.

Gast
2007-04-30, 13:59:11
ichbitte um erklärung.

was ist ein Tesslationseinheit und was ist daran besonders.

DaEmpty
2007-04-30, 14:01:56
So...
Kleine Änderung am G80 Bild und kleine Erklärung hinzugefügt...

reunion
2007-04-30, 14:02:01
Die 256kB L2-Texture Cache scheinen doch nur für alle Textur-Prozessoren beim R600 zu gelten.


Und wieder hat RV610 als einziger eine Crossbar, die angeblich schneller sein soll als der Ringbus, das ergibt keinen Sinn. ;)

Gast
2007-04-30, 14:03:36
...
Beim G80 können Blasen eigentlich nur durch Dynamic Branching auftreten.

Oder wenn sich in den Bereichen verschiedene Objekte befinden mit unterschiedlichen Shadern, oder?

Coda
2007-04-30, 14:07:13
Es ist immer nur ein PS/GS/VS aktiv in einem Batch.

Gast
2007-04-30, 14:10:04
ich bitte um erklärung.

was ist ein Tesslationseinheit und was ist daran besonders.

??

Gast
2007-04-30, 14:11:28
Und wieder hat RV610 als einziger eine Crossbar, die angeblich schneller sein soll als der Ringbus, das ergibt keinen Sinn. ;)

Schonmal einen Ring mit einer Station gebildet? ;)
Es ist physikalisch nicht möglich mit einem 64bit Speicherinterface (ich nehme an, dass der Ring beim rv630 auf 32bit statt 64bit geändert wird) als einen Ring darzustellen.

robbitop
2007-04-30, 14:12:09
So...
Kleine Änderung am G80 Bild und kleine Erklärung hinzugefügt...
Jetzt ist es auch schon viel besser :)

Und wieder hat RV610 als einziger eine Crossbar, die angeblich schneller sein soll als der Ringbus, das ergibt keinen Sinn. ;)
Das haengt von der Anzahl an Links bzw Ringstops ab. Ab einer gewissen Anzahl ist ein Crossbar guenstiger. Stell dir vor, du wuerdest sagen wir 8 Recheneinheiten verbinden wollen. Mit einem Crossbar saehe das aus wie ein Stern. Alle Verbindungen treffen sich in der Mitte beim Crossbar. (teuer aber schnell) Wuerdest du diese 8 Einheiten mit einem Ringbus verbinden siehst du ein deutlich weniger komplexes Bild. Allerdings kannst du ja mal nachzaehlen wie viele Zwischenstationen das im Worst Case waeren.

reunion
2007-04-30, 14:14:40
Schonmal einen Ring mit einer Station gebildet? ;)
Es ist physikalisch nicht möglich mit einem 64bit Speicherinterface (ich nehme an, dass der Ring beim rv630 auf 32bit statt 64bit geändert wird) als einen Ring darzustellen.

Okay, das ist ein Argument, sofern RV610 nur ein 64-bit SI haben sollte.

AnarchX
2007-04-30, 14:18:10
Die Folien scheinen noch zu fehlen:
http://directupload.com/files/hzmynwgg5zjdzniufoio.jpg (http://directupload.com/)
http://directupload.com/files/j2rwj2tyjxmcamngnimz.jpeg (http://directupload.com/)
http://directupload.com/files/nizonm4myzznr0ndjlma.jpg (http://directupload.com/)
http://directupload.com/files/myjzmivzgmyw5iwzdgxi.jpg (http://directupload.com/)

Gast
2007-04-30, 14:18:44
Es ist immer nur ein PS/GS/VS aktiv in einem Batch.

Also ja?!