PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : R520 Features (Treiberhacking)


Demirug
2004-12-11, 20:30:58
Ich weiss das wir schon einige R520 Threads haben aber dieser ist anders.

Ich war so frei und habe eines Teil des 4.12 Beta Treibers von ATI durch einen Disambler gejagt (gibt 52 MB Text). In diesem befindet sich bereits Code welcher die Informationsstrukturen welche D3D braucht wahlweise für einen SM3 Chip ausfüllt. Bezüglich der Shader wird dabei folgendens eingetragen:

VS: SM3 mit maximal 1024 Anweisungen und Pointsampling. Ein NV40 gibt sich mit 544 Slots zufrieden.

PS: SM3 mit maximal 512 Anweisungen (minimum). nVidia protzt mit 4096.

Die Geschichte mit dem FP-Formaten ist komplizierter weil diese nur unvollständig im öffentlichen DDK dokumentiert ist. Man bräuchte das vollständige. Allerdings lässt sich auch so einiges feststellen.

Der Treiber ändert soweit ich es erkennen konnte die Eigenschaft von nur einem einzigen Format. Bei der FP16 RGBA Texture wird ein Bit bei den Eigenschaften verändert. Da es getrennte Flags für Alphablending und für Filterung gibt beherscht der R520 scheinbar nur eines von beidem. Da es nur bei der 4 Kanal Textur aber nicht bei der 2 und 1 Kanal Texture verändert wurde spricht das eigentlich für Alphablendig. Ebenso spricht die Bitposition dafür.

mapel110
2004-12-11, 20:33:55
na immerhin ist somit sicher, dass es ein SM3-chip wird.

p.s. mit den Anweisungen für PS3.0 kann das da eng werden mit 512? oder geht eh vorher der Speed aus und nvidia hats masslos übertrieben?

ShadowXX
2004-12-11, 20:36:05
Ich weiss das wir schon einige R520 Threads haben aber dieser ist anders.

Ich war so frei und habe eines Teil des 4.12 Beta Treibers von ATI durch einen Disambler gejagt (gibt 52 MB Text). In diesem befindet sich bereits Code welcher die Informationsstrukturen welche D3D braucht wahlweise für einen SM3 Chip ausfüllt. Bezüglich der Shader wird dabei folgendens eingetragen:

VS: SM3 mit maximal 1024 Anweisungen und Pointsampling. Ein NV40 gibt sich mit 544 Slots zufrieden.

PS: SM3 mit maximal 512 Anweisungen (minimum). nVidia protzt mit 4096.

Die Geschichte mit dem FP-Formaten ist komplizierter weil diese nur unvollständig im öffentlichen DDK dokumentiert ist. Man bräuchte das vollständige. Allerdings lässt sich auch so einiges feststellen.

Der Treiber ändert soweit ich es erkennen konnte die Eigenschaft von nur einem einzigen Format. Bei der FP16 RGBA Texture wird ein Bit bei den Eigenschaften verändert. Da es getrennte Flags für Alphablending und für Filterung gibt beherscht der R520 scheinbar nur eines von beidem. Da es nur bei der 4 Kanal Textur aber nicht bei der 2 und 1 Kanal Texture verändert wurde spricht das eigentlich für Alphablendig. Ebenso spricht die Bitposition dafür.

Also doch mit SM3.0.....das ist schonmal gut.

Jetzt kommt nur noch die Frage der Fragen: Die Art der Implementierung?

Das kann wohl leider nicht aus dem disassemblierten Text erkennen....

q@h
2004-12-11, 20:37:56
Juhu! Endlich kommt ein Chip mit "decent" Performance beim Branching. =)
Und hoffentlich noch ein paar mehr Goodies, als nur FP32...

mapel110
2004-12-11, 20:40:23
Juhu! Endlich kommt ein Chip mit "decent" Performance beim Branching. =)
Und hoffentlich noch ein paar mehr Goodies, als nur FP32...

http://dict.leo.org/?lp=ende&lang=en&searchLoc=0&cmpType=relaxed&relink=on&sectHdr=on&spellToler=std&search=decent
nur die Frage, wie hier descent gemeint ist. bescheiden oder anständig. ;D

StefanV
2004-12-11, 20:44:01
Vermutlich im Sinn von 'angemessen' ;D ;D

Franzbrandwein
2004-12-11, 21:01:12
Ich denke das passt eher " angemessene Entschädigung * :ulol4: Da ja die Geforce 6 schon PS 3.0 hat ! ;)


Dr.Suicide

Quasar
2004-12-11, 21:35:44
http://dict.leo.org/?lp=ende&lang=en&searchLoc=0&cmpType=relaxed&relink=on&sectHdr=on&spellToler=std&search=decent
nur die Frage, wie hier descent gemeint ist. bescheiden oder anständig. ;D

"decent" != "descent".... aths hat das auch schon durcheinanderbekommen.

StefanV
2004-12-11, 21:38:53
Hm, descent macht überhaupt keienen Sinn, garkeinen :|

http://dict.leo.org/?lp=ende&lang=en&searchLoc=0&cmpType=relaxed&relink=on&sectHdr=on&spellToler=std&search=descent

mapel110
2004-12-11, 21:42:15
Hm, descent macht überhaupt keienen Sinn, garkeinen :|

http://dict.leo.org/?lp=ende&lang=en&searchLoc=0&cmpType=relaxed&relink=on&sectHdr=on&spellToler=std&search=descent

ja, hab mich nur im Satz vertippt, bei der dict.leo.org-suche nicht. =)

zeckensack
2004-12-11, 21:56:01
http://dict.leo.org/?lp=ende&lang=en&searchLoc=0&cmpType=relaxed&relink=on&sectHdr=on&spellToler=std&search=decent
nur die Frage, wie hier descent gemeint ist. bescheiden oder anständig. ;D"Decent" bedeutet "bescheiden" nur noch ganz selten, und selbst wenn, dann immer nur im positiven Sinne. "Decency" ist zwar immer noch die Bescheidenheit, decent als adjektiv meint aber zu 99% "brauchbar" bzw "anständig". In der Bedeutung "bescheiden" ist es genauso veraltet wie die Bescheidenheit selbst =)
"Bescheiden" als Verschleifung von "beschissen" ist ein reiner Germanismus =)

Uuund wenn du's etwas weniger positiv oder als understatement ("Willkommen in meiner bescheidenen Hütte") meinst, benutzt du auch nicht "decent", sondern eher "humble" =)

mapel110
2004-12-11, 21:58:10
"Decent" bedeutet "bescheiden" nur noch ganz selten, und selbst wenn, dann immer nur im positiven Sinne. "Decency" ist zwar immer noch die Bescheidenheit, decent als adjektiv meint aber zu 99% "brauchbar" bzw "anständig". In der Bedeutung "bescheiden" ist es genauso veraltet wie die Bescheidenheit selbst =)
"Bescheiden" als Verschleifung von "beschissen" ist ein reiner Germanismus =)

Uuund wenn du's etwas weniger positiv oder als understatement ("Willkommen in meiner bescheidenen Hütte") meinst, benutzt du auch nicht "decent", sondern eher "humble" =)

:uup: mal wieder schlauer. :)
Kannst was zu der Anzahl der Anweisungen sagen? oder ist das zu theoretisch und man kanns nicht wissen?!

seahawk
2004-12-11, 22:08:02
Naja im üblichen Sprachgebrauch nutzt man decent eher wie

ausreichend, brauchbar, befriedigend

LovesuckZ
2004-12-11, 22:22:46
Das ist interessant, mit den (anscheinend) maximal 512 Anweisungen unter dem SM3.0. Protzt doch ATi heute schon, die dreifache Menge mit den PS2.b anzubieten :ugly:
Nun, koennte dies darauf schließen, dass ATi versucht (noch deutlicher als Nvidia) eine "externe" Branchunit einfach an die Pixelshader anzuloeten?

/edit: Das ATi bei den VS nur Pointsampling anbietet, laesst mich zur Ueberzeugung kommen, dass der r520 einfach ein NV40 wird. Ein Duplikat so zusagen.

Aqualon
2004-12-11, 22:56:01
Juhu! Endlich kommt ein Chip mit "decent" Performance beim Branching. =)
Und hoffentlich noch ein paar mehr Goodies, als nur FP32...
Weißt du mehr als wir oder woher nimmst du die Annahme, dass der R520 Branching in besserer Geschwindigkeit wie der NV40 durchführen kann?

Aqua

mapel110
2004-12-11, 22:58:45
Weißt du mehr als wir oder woher nimmst du die Annahme, dass der R520 Branching in besserer Geschwindigkeit wie der NV40 durchführen kann?

Aqua

“Steer people away from flow control in ps3.0 because we expect it to hurt badly. [Also it’s the main extra feature on NV40 vs. R420 so let’s discourage people from using it until R5xx shows up with decent performance...”
http://www.xbitlabs.com/news/video/display/20041030045717.html

ironMonkey
2004-12-11, 22:59:43
Naja im üblichen Sprachgebrauch nutzt man decent eher wie

ausreichend, brauchbar, befriedigend



Das bedeutet bescheiden, zurückhaltend, unaufdringlich, zB. wenn ein Wagen ein zeitloses Design hat, nicht zierlich und nicht protzig............oder jemanden nicht aufdringlich auf etwas hinweisen.......


@LS, das währe doch super, dann zählt nur noch wer schneller ist.

Quasar
2004-12-11, 23:20:50
@mapel110:
Ja, darauf bezog ich das...

@ironmonkey:
Bitte nicht die deutsche Bedeutung "dezent" mit dem englischen "decent" verwechseln.

ironMonkey
2004-12-11, 23:30:26
@Quasar, das hab ich leider gemacht ;(

MadManniMan
2004-12-12, 06:55:17
Gnaaaaa!

Nay, das is nich, was ich gern von ATi gesehen hätte... Gut, der bisher schon immer(beinahe traditionsgemäß!) mächtige(...naja, bisher eben schnelle) VS wird was nich so übles - und der PS bekommt die 3.0 halt drangeflanscht.

Wahrscheinlich geht mir nur das Verständnis für die eigentlich Technik ab, aber Branching mit 512 Anweisungen klingt nach Schmarrn, weils dann schon wieder in den Multipass ginge, hätte man was Längeres?

Axel
2004-12-12, 07:33:44
PS: SM3 mit maximal 512 Anweisungen (minimum).

Wie ist das (minimum) zu verstehen?




/edit: Das ATi bei den VS nur Pointsampling anbietet, laesst mich zur Ueberzeugung kommen, dass der r520 einfach ein NV40 wird. Ein Duplikat so zusagen.
Sicherlich hat ATi den NV40 aufgesägt und kopiert. So sparen sie die Entwicklungskosten. Selbst bringt Ati ja nichts zustande.

tb
2004-12-12, 07:49:48
VS: SM3 mit maximal 1024 Anweisungen und Pointsampling. Ein NV40 gibt sich mit 544 Slots zufrieden.

PS: SM3 mit maximal 512 Anweisungen (minimum). nVidia protzt mit 4096.


Anweisungen sind doch meines Wissens nach ungleich Slots, wegens Flusskontrolle... Sprich:
NV40:
VS: 544 Slots, 65535 Anweisungen
PS: 4096 Slots, 65535 Anweisungen

Die Werte für MaxVShaderInstructionsExecuted / MaxPShaderInstructionsExecuted hast Du nicht zufällig auch noch gefunden?

Thomas

Demirug
2004-12-12, 09:33:32
Anweisungen sind doch meines Wissens nach ungleich Slots, wegens Flusskontrolle... Sprich:
NV40:
VS: 544 Slots, 65535 Anweisungen
PS: 4096 Slots, 65535 Anweisungen

Die Werte für MaxVShaderInstructionsExecuted / MaxPShaderInstructionsExecuted hast Du nicht zufällig auch noch gefunden?

Thomas

Im Prinzip schon. Ich wollte nur nicht noch anfangen zu erklären was Slots sind. In den meisten Fällen entspricht eine Operation ja eh einem Slot. Was die Instructionsangeht so gab es da IIRC schon öfter mal Streit ob da nun auch Slots oder was anderes gezählt wird. Ist aber bei der Menge wohl vorerst sowieso egal.

ATI setzt die beiden max werte auf volle 32 Bit.

Demirug
2004-12-12, 09:34:35
Wie ist das (minimum) zu verstehen?

512 Slots ist das minimum für einen 2.0 Pixelshader. Beherscht die Karte nur 511 darf sie keine PS 3.0 Unterstützung melden.

ShadowXX
2004-12-12, 10:27:35
Was meinst du Demi, wird ATI das ganze per F-Buffer realisieren oder doch anders??? (bezogen auf die PS).

Oder gibt es überhaupt keine indizien, die für das eine oder andere sprechen?

Demirug
2004-12-12, 11:48:27
Was meinst du Demi, wird ATI das ganze per F-Buffer realisieren oder doch anders??? (bezogen auf die PS).

Oder gibt es überhaupt keine indizien, die für das eine oder andere sprechen?

Schwer zu sagen. Das man sich auf 512 Slots begrenzt hat lässt auf eine Lösung ohne F-Buffer schliessen ausser die 512 Slots beim R420 laufen auch schon über diesen.

Ailuros
2004-12-13, 06:58:47
512 Slots ist das minimum für einen 2.0 Pixelshader. Beherscht die Karte nur 511 darf sie keine PS 3.0 Unterstützung melden.

Haette da nicht PS3.0 stehen sollen?

AFAIK PS3.0 = 512-32768 instruction slots

Demirug
2004-12-13, 07:21:38
Haette da nicht PS3.0 stehen sollen?

AFAIK PS3.0 = 512-32768 instruction slots

Ja, das hätte 3.0 sein sollen und der Bereich stimmt so auch wobei es für die Obergrenze keine erkennbaren Grund gibt.

Xmas
2004-12-13, 12:14:47
Vermutlich um die MS-typischen Buffer Overflows zu verhindern...
Bei PS2.0 macht die Obergrenze ja noch Sinn (PS3.0 als Obermenge von PS2.x), bei PS3.0 war ja dagegen schon abzusehen dass das nachfolgende Shader-Modell keine Limits kennt.

Godmode
2004-12-13, 13:45:50
Warum setzt man diese Limits eigentlich so hoch? Im Realtime-Rendering wird man mit den heutigen (NV4xx,R5xx) SM3 Chips niemals so viele Instructions berechnen können, oder doch?

DrumDub
2004-12-13, 13:49:53
Warum setzt man diese Limits eigentlich so hoch? Im Realtime-Rendering wird man mit den heutigen (NV4xx,R5xx) SM3 Chips niemals so viele Instructions berechnen können, oder doch?

denk nicht nur an spiele, sondern auch an den profi-markt. ne gpu ist da immer noch um ein vielfaches schneller als ne cpu. pixar ist dafür sicherlich dankbar. ;)

Godmode
2004-12-13, 14:18:24
Ok, stimmt hab ich nicht beachtet. Aber ich dachte die ganzen Offline-Rendering Sachen werden alle von CPU Clustern berechnet?

DrumDub
2004-12-13, 15:04:23
Ok, stimmt hab ich nicht beachtet. Aber ich dachte die ganzen Offline-Rendering Sachen werden alle von CPU Clustern berechnet?

schon richtig, aber das ändert sich. auf kurz oder lang werden sich gpus für diese aufgabe sicherlich durchsetzen. nvidia arbeitet zumindest daran: http://film.nvidia.com

Ailuros
2004-12-13, 17:00:00
Warum setzt man diese Limits eigentlich so hoch? Im Realtime-Rendering wird man mit den heutigen (NV4xx,R5xx) SM3 Chips niemals so viele Instructions berechnen können, oder doch?

Der Sinn so viele Instruction slots fuer PS3.0 zu erlauben, war ja (wie Demi schon oben erwaehnt) im Grunde das Ganze in Richtung "unbegrenzt" (siehe "SM4.0" so viel wie moeglich so lange Leistung nicht niedriger als bei 640*480@10Hz liegt) treibt.

Ich hatte mal ne aehnliche Frage warum es so schnell aufwaerts geht mit diesen Zahlen und dabei erinnert mich Demi wie radikal sich die minimalen Instruktionen bei vorigen Shader Modelle multipliziert haben (siehe PS1.x-->PS2.x+).

Tesseract
2004-12-13, 17:37:10
ich bin gespannt, ob sich die vorarbeit von nvidia bei SM3.0 nun als vorteil oder nachteil rausstellt. (nur auf die technik bezogen)
entweder haben sie den vorteil der längeren erfahrung oder ati konnte durch nvidias vorarbeit schon einige schwachstellen im vorfeld vermeiden, die vom NV3x zum NV40 vielleicht nicht ganz so gut/schnell lösbar waren.

Coda
2004-12-13, 17:50:42
nVidia hatte aber auch schon vom NV30 einiges an Erfahrung was lange Programme angeht, etc.

Tesseract
2004-12-13, 18:32:47
nVidia hatte aber auch schon vom NV30 einiges an Erfahrung was lange Programme angeht, etc.

den NV3x hab ich mit "vorarbeit" auch gemeint. atis SM3.0 chip ist ja quasi "neuland" was eine derart hohe flexibilität angeht.

Ailuros
2004-12-14, 06:55:55
ich bin gespannt, ob sich die vorarbeit von nvidia bei SM3.0 nun als vorteil oder nachteil rausstellt. (nur auf die technik bezogen)
entweder haben sie den vorteil der längeren erfahrung oder ati konnte durch nvidias vorarbeit schon einige schwachstellen im vorfeld vermeiden, die vom NV3x zum NV40 vielleicht nicht ganz so gut/schnell lösbar waren.

Ich wuerde schaetzen dass die Erfahrung eines veroeffentlichten chips der staendig "entbuggt" werden muss fuer zahlllose Applikationen, wertvoller sein koennte.

ATI hatte IMHO einen ganz anderen Plan fuer SM3.0 generell (wie genau wird sich ja wohl noch herausstellen). Zwischen der Veroeffentlichung des NV40 und der zukuenftigen Veroeffentlichung vom R520, gab es wohl nicht genug Zeit fuer fundamentalere Aenderungen.

Nichtdestotrotz wuerde es mich aber auch nicht wundern wenn R520 sich doch als performanter zeigt unter einigen Situationen (ja selbst taktnormalisiert zu NV40). Duerfte auch kein besonderes Wunder sein fuer einen chip der ~1 Jahr spaeter ankommt und der im Grunde auch quasi den zweiten Versuch intern darstellt (siehe Ur-R400).

Gast
2004-12-14, 08:31:38
Die Vorarbeit von Nvidia besteht nicht aus NV3x/NV40 alleine sondern "SM3 für alle" IMHO. Von ganz oben bis ganz unten. Da muss ATI hinkommen, vom R520 alleine in anzunehmenden Preisregionen von min. 250 Euro aufwärts können sie sich auch nichts kaufen.

Balkenlänge im OEM-Bereich zählt nämlich nicht viel wie man an der FX5200 sieht. PCIE besetzen sie auch nicht mehr alleine und ohne BridgeChip sieht es bei AGP auch mau aus.

q@w
2004-12-14, 08:36:34
Warum setzt man diese Limits eigentlich so hoch? Im Realtime-Rendering wird man mit den heutigen (NV4xx,R5xx) SM3 Chips niemals so viele Instructions berechnen können, oder doch?

IMO hauptsächlich wegen der nun möglichen Verzweigungen - Du weißt ja sicher noch selbst, wie armselig Bäume mit drei oder vier Ästen in den Kindertagen der Computerspiele ausgesehen haben. (Vorsicht, Analogie)

Tigerchen
2004-12-14, 15:23:38
IMO hauptsächlich wegen der nun möglichen Verzweigungen - Du weißt ja sicher noch selbst, wie armselig Bäume mit drei oder vier Ästen in den Kindertagen der Computerspiele ausgesehen haben. (Vorsicht, Analogie)


Genau diese Verzweigungen kosten aber auf nV40 sehr viel. Meine mich zu erinnern daß im "worst-case" die Pixelpipeline 10-14 Takte lang blockiert sein kann. (Bitte nur korrigieren aber nicht erschlagen wenns nicht 100%ig richtig ist. )

ShadowXX
2004-12-14, 15:58:43
Genau diese Verzweigungen kosten aber auf nV40 sehr viel. Meine mich zu erinnern daß im "worst-case" die Pixelpipeline 10-14 Takte lang blockiert sein kann. (Bitte nur korrigieren aber nicht erschlagen wenns nicht 100%ig richtig ist. )


Selbst wenn es wirklich 10-14 Takte sein sollte (wobei ich der Meinung bin, das es weniger waren, ist aber egal), dann ist das immer noch schneller als Softwarerendering....

Es gibt mehr als nur Spiele....

Tigerchen
2004-12-14, 16:18:02
Selbst wenn es wirklich 10-14 Takte sein sollte (wobei ich der Meinung bin, das es weniger waren, ist aber egal), dann ist das immer noch schneller als Softwarerendering....

Es gibt mehr als nur Spiele....


Es ist Softwarerendering. Das ist der Pferdefuß. Programmierbarkeit hat ihren Preis. Man muß schon abwägen wo die momentanen Grenzen für Echtzeitrendering liegen.

DrumDub
2004-12-14, 16:31:28
Es ist Softwarerendering. Das ist der Pferdefuß. Programmierbarkeit hat ihren Preis. Man muß schon abwägen wo die momentanen Grenzen für Echtzeitrendering liegen.


denk mal bitte nicht in der spielerkategorie. wenn ich mit der cpu ne stunde warte und mit ner gpu ein paar minuten, um das ergebnis zu sehen, dann ist das immer noch eine enorme produktivitätssteigerung und somit dem softwarerendering absolut überlegen. echzeit ist in diesem bereich gar nicht notwendig.

xL|Sonic
2004-12-14, 17:13:45
Sind für solche Rendersachen richtige Workstationen Karten von 3DLabs nicht besser geeignet als ein nv40?

q@w
2004-12-14, 17:33:46
Genau diese Verzweigungen kosten aber auf nV40 sehr viel. Meine mich zu erinnern daß im "worst-case" die Pixelpipeline 10-14 Takte lang blockiert sein kann. (Bitte nur korrigieren aber nicht erschlagen wenns nicht 100%ig richtig ist. )

Lustig - in dem anderen Thread beschwerst du dich, Branching würde "ordentliches" AF mit verunmöglichen - hier stellst du selbst der TMU 10-14 Takte (pro Branch!) zur Verfügung, in der sie ungestört hochqualitative AF-Samples samplen könnte. ;)

On-Topic:
Der "Umriß" eines Baumes ist extrem hoch, aber der Weg von der Wurzel bis an die Spitze eines der Zweige nicht.

q@w
2004-12-14, 17:35:14
Sind für solche Rendersachen richtige Workstationen Karten von 3DLabs nicht besser geeignet als ein nv40?
Alldieweil?
Und für welche Renderingsachen genau?
Es gibt für jede Karte sicherlich eng beschränkte Gebiete, auf denen sie besser ist, als die meisten anderen.

DrumDub
2004-12-14, 17:36:21
Sind für solche Rendersachen richtige Workstationen Karten von 3DLabs nicht besser geeignet als ein nv40?

seit wann sind die quadros keine richtigen workstationgrafikkarten? :|

die 3dlabs realizm 800 ist sicherlich der quadro fx 4000 etwas überlegen, nur gibts die realizm 800 nicht zu kaufen.

und was den digital-film-bereich angeht, da bietet nur nvidia bzw. pny als workstationpqartner eine entsprechende lösung an: http://www.pny.com/products/quadro/fx/4000sdifx.asp

Tigerchen
2004-12-14, 18:57:12
denk mal bitte nicht in der spielerkategorie. wenn ich mit der cpu ne stunde warte und mit ner gpu ein paar minuten, um das ergebnis zu sehen, dann ist das immer noch eine enorme produktivitätssteigerung und somit dem softwarerendering absolut überlegen. echzeit ist in diesem bereich gar nicht notwendig.

Bei allem was nicht in Echtzeit gemacht werden muß hast du Recht. Hab ich aber auch schon 100mal erwähnt.

Für den der damit Geld muß verdienen lohnen sich viele Dinge auf die man beim daddeln gut verzichten kann oder sogar kontraproduktiv sind. Das ist klar.

Tigerchen
2004-12-14, 19:09:58
Lustig - in dem anderen Thread beschwerst du dich, Branching würde "ordentliches" AF mit verunmöglichen - hier stellst du selbst der TMU 10-14 Takte (pro Branch!) zur Verfügung, in der sie ungestört hochqualitative AF-Samples samplen könnte. ;)

On-Topic:
Der "Umriß" eines Baumes ist extrem hoch, aber der Weg von der Wurzel bis an die Spitze eines der Zweige nicht.

Wo habe ich geschrieben daß branching ordentliches AF verunmöglichen würde?

Schaun wir mal was die Praxis bringt wenn das erste Spiel erscheint das branching richtig nutzt. Einmal mit und einmal ohne AF laufen lassen. Wenn du Recht hast dürfte AF dann nichts mehr kosten da ja Zeit wäre noch viel,viel mehr AF-Samples zu rendern oder? Ich notier mir das mal und werde das zu gegebener Zeit austesten.:)

Ailuros
2004-12-14, 19:43:34
Je mehr Takte man fuer branching verbraucht, desto mehr Firlefanz koennte man theoretisch in der Zwischenzeit noch hinzufuegen. Woher die merkwuerdige 10-14 Zahl kommt hab ich sowieso keine Ahnung. Bei den ersten unreifen Treibern waren es ca. 8-9 Takte im schlimmsten Fall (falls mich mein Gedaechtnis nicht betruegt). Nur ein Entwickler der mit solchem Zeug experimentiert koennte hier etwas mehr Licht in die Geschichte werfen.

Generell aber war/ist der wichtigste Anteil von SM3.0 IMHO vertex texturing und ich bin auch froh dass so manche diese Meinung auch in anderen Foren anscheinend teilen.

Quasar
2004-12-14, 19:50:06
Wo habe ich geschrieben daß branching ordentliches AF verunmöglichen würde?

Schaun wir mal was die Praxis bringt wenn das erste Spiel erscheint das branching richtig nutzt. Einmal mit und einmal ohne AF laufen lassen. Wenn du Recht hast dürfte AF dann nichts mehr kosten da ja Zeit wäre noch viel,viel mehr AF-Samples zu rendern oder? Ich notier mir das mal und werde das zu gegebener Zeit austesten.:)


Natürlich ist das ganze überzogen und ironisch (zumindest hoffe ich das...).

Aber du musst doch zugeben, das es langsam lächerlich von ATI und nV wird.....als nächstes bekommen wir 24Pipe-Monster (oder vielleicht sogar 32) und um dann anstatt 200FPS zu haben, ziehen Sie nochmals Qualität ab (bzw. lassen beim jetzigen Level) nur um dann 230 bis 250 FPS zu haben....

Und klar....es gibt auch jetzt schon mal Games, wo man nicht in 1600x1200 mit 4xAA / 16xAF spielen kann...aber wäre es wirklich so schlimm diese Titel nicht vielleicht "nur" in 1600x1200 mit 2xAA+"normalen"4-8xAF zu spielen...dafür aber in wesentlich besserer IQ??

Ich für meinen Teil, hätte lieber mehr IQ und würde dafür auch mal einen Auflösungstufe oder auch AA/AF Stufe runtergehen...

Was hast du davon, wenn du in deinem CP 16xAF einstellen kannst, dieses aber schlechter aussieht als "normales" 4xAF??
(Schon alleine wegen der restlichen Optimierungen, die da sonst noch so reingurken...).

Aber eine Sache sollte dabei klar sein....die IHVs sollten erstmal bei den normalen Filterungen anfangen wieder optimale Qualität herzustellen bevor Sie mit besserem AF anfangen....denn was nützt mir gutes "normales" 8xAF, wenn das ganze nur noch mit einem Bi- oder Bri -Filter zusammenarbeitet oder die MipMap-Einstellungen völlig daneben sind etc. etc....


Ich erwarte daß HDR, lange Shader und branching die Leistung schneller auffressen als einem lieb sein kann. Du siehst da Potential welches ich nicht sehe.
Umso eher kann sich die TMU Zeit lassen, ihre 16 anisotropen Samples zu holen und zu verrechnen.... ;)

Zumindest rechtfertigst du winkelabhängiges, ergo Spar-AF, damit, daß die Leistung an anderer Stelle viel eher verheizt würde....

Hier läßt du die ALU für 10-14 Takte blockieren - in dieser Zeit kann man AFAIK prima die TMU beschäftigen - bsw. um eben auf Spar-AF zu verzichten!

edit:
Von "nichts mehr kosten" war nicht die Rede. "Billiger" wird es allerdings schon sein, es sei denn, du liegst mit deinen 10-14 Takten grob daneben. :devil:

edit2:
Oh - und wenn du schon am notieren bist, schreibe bitte auch dazu, nicht gleich zu schreien, sobald irgendwo mal was von branching erwähnt wird. Erst schauen, ob das auch der Flaschenhals ist, gelle? ;)

Jesus
2004-12-14, 20:25:43
Mal ne ganz andere Frage...

wieso baut ATI Teile des R520 Treibers eigentlich jetzt schon ein, wo´s doch überhaupt nichts bringt (ausser den Treiber künstlich zu vergrössern)?

mapel110
2004-12-14, 20:31:34
Mal ne ganz andere Frage...

wieso baut ATI Teile des R520 Treibers eigentlich jetzt schon ein, wo´s doch überhaupt nichts bringt (ausser den Treiber künstlich zu vergrössern)?

weils wohl schon lauffähige samples gibt. =)
p.s. und offenbar rechnet keiner bei ATI damit, dass der Treiber auseinander genommen wird. ;)

Jesus
2004-12-14, 20:37:47
weils wohl schon lauffähige samples gibt. =)
p.s. und offenbar rechnet keiner bei ATI damit, dass der Treiber auseinander genommen wird. ;)

Also ich würde sowas nie machen ;)
Denke eher ATI will das diese Infos gefunden werden...

Gast
2004-12-14, 22:50:37
PS.3.0 schön und gut.Hat mann ja bei Far cry gesehen was ps 3.0 bring, ein kleinen performance schub.

Coda
2004-12-14, 23:07:51
Ohje... Die ATi Propaganda wirkt anscheinend. :rolleyes:

Botcruscher
2004-12-14, 23:43:37
... und die von Nv auch. :rolleyes:

Bis jetzt fehlen schlicht die Spiele die von den neuen Möglichkeiten auch wirklich gebrauch machen. Aber man hoft ja...

Coda
2004-12-14, 23:44:48
Naja aber es ist aus Entwicklerperspektive zumindest recht deutlich das SM3.0 mehr bringt als "nur ein paar Prozent mehr Performance", deshalb bin ich da vorbelastet ;)

MadManniMan
2004-12-15, 01:39:36
Naja aber es ist aus Entwicklerperspektive zumindest recht deutlich das SM3.0 mehr bringt als "nur ein paar Prozent mehr Performance", deshalb bin ich da vorbelastet ;)

Uuuh, aaah! Erwähne blos nich, daß du a) Entwickler bist b) SM3.0 gut findest und c) auch noch, daß der NV40 SM3.0 hat. Ich möcht nich schon wieder diese Diskussion erleben... du erinnerst an die Auseinandersetzung mit Tombman vor ein paar Monaten? ;)

Ailuros
2004-12-15, 06:28:39
Uuuh, aaah! Erwähne blos nich, daß du a) Entwickler bist b) SM3.0 gut findest und c) auch noch, daß der NV40 SM3.0 hat. Ich möcht nich schon wieder diese Diskussion erleben... du erinnerst an die Auseinandersetzung mit Tombman vor ein paar Monaten? ;)

Keine Sorge nach ein paar Monaten wird SM3.0 die tollste Erfindung seit dem Kaugummi sein :D

Wer ist Herr Tombman? *snicker* :|

Gast
2004-12-15, 09:35:16
Naja denn wissen wir ja was wir nächstes Jahr Kaufen :D
R520 :D Wenn Ati dann von der Technick wieder auf denn gleichen stant ist wie NV,werden sich mit sicherheit wieder alle Ati Kaarten kaufen,sind halt Schneller:D

Gast
2004-12-15, 09:36:16
Ich natürlich auch wieder :D

6800 16/6

Coda
2004-12-15, 13:20:04
Naja denn wissen wir ja was wir nächstes Jahr Kaufen
R520 Wenn Ati dann von der Technick wieder auf denn gleichen stant ist wie NV,werden sich mit sicherheit wieder alle Ati Kaarten kaufen,sind halt Schneller
Soso :rolleyes:

Godmode
2004-12-15, 13:24:48
PS.3.0 schön und gut.Hat mann ja bei Far cry gesehen was ps 3.0 bring, ein kleinen performance schub.

FarCry ist ein schlechtes Beispiel, weil es einfach nachträglich reingepflanzt wurde. Ich denke man muss SM3 schon von Anfang bei der Entwicklung einer Engine einplanen!

MechWOLLIer
2004-12-15, 17:26:28
Zumal Far Cry mit dem SM3 imo auch nichts anderes tut, als ein paar Shader zu einem zusammenzufassen, damit diese in einem Pass berechnet werden können.
Aber mit dem Sm3 sollte man noch viel mehr können.

Tigerchen
2004-12-15, 19:01:54
Zumindest rechtfertigst du winkelabhängiges, ergo Spar-AF, damit, daß die Leistung an anderer Stelle viel eher verheizt würde....

Hier läßt du die ALU für 10-14 Takte blockieren - in dieser Zeit kann man AFAIK prima die TMU beschäftigen - bsw. um eben auf Spar-AF zu verzichten!

edit:
Von "nichts mehr kosten" war nicht die Rede. "Billiger" wird es allerdings schon sein, es sei denn, du liegst mit deinen 10-14 Takten grob daneben. :devil:

edit2:
Oh - und wenn du schon am notieren bist, schreibe bitte auch dazu, nicht gleich zu schreien, sobald irgendwo mal was von branching erwähnt wird. Erst schauen, ob das auch der Flaschenhals ist, gelle? ;)


Die 10-14 Takte stammen von der PCGH und ich schrieb ja daß ich mir da nicht so sicher bin obs wirklich so viele sind.

So daß da noch Zeit für viel Firlefanz sein soll ist ja eine Meinung die durchaus stimmen kann aber nicht muß. Theoretische Überlegungen sind immer so eine Sache. Letztlich kann nur die Praxis den Beweis erbringen daß du richtig liegst.

Hat nV eigentlich schon branching für die Entwickler freigeschaltet? Hab da was gehört...

Tigerchen
2004-12-15, 19:05:42
Keine Sorge nach ein paar Monaten wird SM3.0 die tollste Erfindung seit dem Kaugummi sein :D

Wer ist Herr Tombman? *snicker* :|


Wenn die Leistung stimmt!:)
Auf Checklistfeatures steh ich nicht. Egal ob die SM 3.0, motion blur, trueform, bezierkurven oder 3dc heißen. Das sieht Tombman sicher ähnlich.

IVN
2004-12-15, 19:07:56
Die 10-14 Takte stammen von der PCGH und ich schrieb ja daß ich mir da nicht so sicher bin obs wirklich so viele sind.

So daß da noch Zeit für viel Firlefanz sein soll ist ja eine Meinung die durchaus stimmen kann aber nicht muß. Theoretische Überlegungen sind immer so eine Sache. Letztlich kann nur die Praxis den Beweis erbringen daß du richtig liegst.

Hat nV eigentlich schon branching für die Entwickler freigeschaltet? Hab da was gehört...


2 for every instruction.If + else + end if =6

Ailuros
2004-12-16, 07:09:02
Wenn die Leistung stimmt!:)
Auf Checklistfeatures steh ich nicht. Egal ob die SM 3.0, motion blur, trueform, bezierkurven oder 3dc heißen. Das sieht Tombman sicher ähnlich.


So besonders wird branching-Leistung mit SIMD Kanaelen im Grunde nie sein.

Was nun Checklist-Features betrifft davon sind beide IHVs mehr als genug betroffen. Wahres motion blur ist sowieso aus Leistungsgruenden noch nicht moeglich und ich hab immer noch gewisse Zweifel ob es im Zusammenhang mit Interaktivitaet ueberhaupt etwas bringen koennte. Fuer nur 4x "motion blur samples" braucht man auch die vierfache Leistung.

Tigerchen
2004-12-16, 16:00:50
PS.3.0 schön und gut.Hat mann ja bei Far cry gesehen was ps 3.0 bring, ein kleinen performance schub.

Bei Chronicles of riddick geht die Performance in den Keller wenn du Shader höher als 2.0 verwendest.

mapel110
2004-12-16, 16:02:52
Bei Chronicles of riddick geht die Performance in den Keller wenn du Shader höher als 2.0 verwendest.


jo, weil softshadows hinzukommen. :rolleyes:

Tigerchen
2004-12-16, 16:06:35
So besonders wird branching-Leistung mit SIMD Kanaelen im Grunde nie sein.

Was nun Checklist-Features betrifft davon sind beide IHVs mehr als genug betroffen. Wahres motion blur ist sowieso aus Leistungsgruenden noch nicht moeglich und ich hab immer noch gewisse Zweifel ob es im Zusammenhang mit Interaktivitaet ueberhaupt etwas bringen koennte. Fuer nur 4x "motion blur samples" braucht man auch die vierfache Leistung.

Trotzdem wurde eine Riesenhype zum "motion blur" entfacht als 3dfx es mit Hilfe einer Quake 3 map präsentierte. Sollten sich manche andere (du nicht) vielleicht mal vor Augen halten die ständig vom bevorstehenden Durchbruch von branching und HDR reden.

Tigerchen
2004-12-16, 16:22:09
jo, weil softshadows hinzukommen. :rolleyes:

Auf jeden Fall kann man die mit Shader 2.0 nicht haben!

Die neuen Möglichkeiten entpuppen sich somit als höchst zweifelhaft.
HDR und Soft Shadows vernichten AA und fressen ordentlich Performance. Ich zweifel wirklich ob sich das durchsetzt.

Ailuros
2004-12-16, 16:24:42
Trotzdem wurde eine Riesenhype zum "motion blur" entfacht als 3dfx es mit Hilfe einer Quake 3 map präsentierte. Sollten sich manche andere (du nicht) vielleicht mal vor Augen halten die ständig vom bevorstehenden Durchbruch von branching und HDR reden.


Das Problem hier ist dass der T-buffer ueber wahres motion blur (temporal antialiasing) faehig war. Nur war es eben seeeehr langsam.

Dass man hoehere Bildqualitaet staendig will als Verbraucher finde ich aber trotz allem normal. Wieso sehen Pixar's Projekte als Beispiel (siehe Bug's Life, Monster Inc., Finding Nemo) besonders gut aus? 64x sample stochastic antialiasing und motion blur.

Es gibt einen Thread drueben bei B3D ueber "Innovationen" im PC/3D Bereich; eigentliche Innovationen gab es hier im Grunde nie; nur eben so gut wie moegliche Implementationen von einigen Features die schon seit Jahren bei der Filme-Herstellung benutzt werden. Hier sollte es klar sein dass Haeuser wie Pixar mit gigantischen Clusters arbeiten und von 64x sample AA oder anderen Effekten schwer die Rede sein kann fuer die absehbare Zukunft. Jeder IHV wird stets versuchen neue Features vorzustellen und ja da kommt es vor dass manche adoptiert werden und manche eben nicht. Das jetzt mal ganz generell illustriert.

Branching und HDR werden schon an Wichtigkeit hinzugewinnen, ueberhaupt wenn es so wie es aussieht beide grossen IHVs unterstuetzen werden; ergo die Mehrzahl was den PC-gaming-Markt betrifft. Erste Implementationen in HW sind oefters etwas verkorkst und auch das erste Erscheinen gewisser Features. Nur weil HDR in FarCry (meiner Meinung nach) erstmal bekloppt aussieht, heisst das bei weitem nicht dass es nutzlos ist oder das jegliche zukuenftige Implementation genauso oede aussehen wird.

Coda
2004-12-16, 17:09:47
HDR und Soft Shadows vernichten AA und fressen ordentlich Performance. Ich zweifel wirklich ob sich das durchsetzt.
Klar, wir bleiben für immer bei 16-bit und fixed function, sorry, aber AUA.

q@w
2004-12-16, 17:17:55
Auf jeden Fall kann man die mit Shader 2.0 nicht haben!

Die neuen Möglichkeiten entpuppen sich somit als höchst zweifelhaft.
HDR und Soft Shadows vernichten AA und fressen ordentlich Performance. Ich zweifel wirklich ob sich das durchsetzt.

Klar kann man das. Zumindest im 3DMark05 ist das kein Problem... Doof nur, wenn Entwickler ein Feature an das vorhandensein eines anderen koppeln, auch wenn beide nichts miteinander zu tun haben.

Inwiefern vernichten Softshadows AA? Das wäre mir neu - und der Murks05 widerlegt deine Behauptung direkt.

mapel110
2004-12-16, 17:18:54
HDR und Soft Shadows vernichten AA und fressen ordentlich Performance. Ich zweifel wirklich ob sich das durchsetzt.


bei HDR ists nur eine Hardwarelimitierung, die wohl mit der nächsten generation gegessen ist.

Klar, wir bleiben für immer bei 16-bit und fixed function, sorry, aber AUA.

full ack. :)

Demirug
2004-12-16, 17:41:08
bei HDR ists nur eine Hardwarelimitierung, die wohl mit der nächsten generation gegessen ist.

Letzten Endes ist alles eine Hardwarelimitierung aber selbst wenn ein Chip FP16 Werte genauso schnell wie FX8 Werte verarbeitet wird ein HDR Effekt immer zusätzliche Zeit brauchen weil er wei jeder Postfilter zusätzliche durchläufe braucht.

Tigerchen
2004-12-16, 19:06:20
Klar kann man das. Zumindest im 3DMark05 ist das kein Problem... Doof nur, wenn Entwickler ein Feature an das vorhandensein eines anderen koppeln, auch wenn beide nichts miteinander zu tun haben.

Inwiefern vernichten Softshadows AA? Das wäre mir neu - und der Murks05 widerlegt deine Behauptung direkt.

Fakt ist nun mal daß bei "Chronicles of riddick" Softshadows nur ohne AA laufen. Und das auch noch mit bescheidener Performance. Selbst wenn es dir gelingt AA zu aktivieren dürfte daß das Spiel wohl endgültig zur Slideshow machen. Ist schon Klasse wie der nV40 von SM 3.0 profitiert! Die nV Propaganda wirkt wirklich prima.
Aber ich kenn das ja.
Far Cry? Unfähige Entwickler!
Chronickles o.R.? Unfähige Entwickler!

Tigerchen
2004-12-16, 19:09:51
Klar, wir bleiben für immer bei 16-bit und fixed function, sorry, aber AUA.

Du hast ja Recht. The right tool for the job.
Schade daß es das richtige Werkzeug für die tollen neuen Effekte eben nicht gibt. nV40 mit SM 3.0/Softshadows/HDR ist wie als wenn du mit einer Zahnbürste den Flur schrubbst. Das wird jeden Tag deutlicher.

sepperator
2004-12-16, 20:31:32
Frage am Rande: Die Softshadows funktionieren mit einer X800 nicht? Wenn ja, warum nicht?

mapel110
2004-12-16, 20:34:48
Frage am Rande: Die Softshadows funktionieren mit einer X800 nicht? Wenn ja, warum nicht?

funzt nicht, weil sie Feature-technisch veraltet ist. ;(

IVN
2004-12-16, 20:41:08
Du hast ja Recht. The right tool for the job.
Schade daß es das richtige Werkzeug für die tollen neuen Effekte eben nicht gibt. nV40 mit SM 3.0/Softshadows/HDR ist wie als wenn du mit einer Zahnbürste den Flur schrubbst. Das wird jeden Tag deutlicher.


For nv40 it's an option,and for every ATI GPU up to date it is NO GO. :biggrin:

ShadowXX
2004-12-16, 20:51:44
Du hast ja Recht. The right tool for the job.
Schade daß es das richtige Werkzeug für die tollen neuen Effekte eben nicht gibt. nV40 mit SM 3.0/Softshadows/HDR ist wie als wenn du mit einer Zahnbürste den Flur schrubbst. Das wird jeden Tag deutlicher.


Naja....der nv40 hat bei FC durchaus von SM3.0 profitiert...nicht gewaltig aber immerhin.(Auch wenn es nur ausgenutzt wurde, da es mehr Interpolatoren (bin mir momentan nicht sicher, obs der richtige Begriff ist) gab und längere Shader möglich sind...).

Softshadows sind auch auf der ATI möglich....warum die von Riddick dafür SM2.0a haben wollen weiss nur der Geier und die Programmierer...
Aber klar...Softshadows fressen Performance...auch bei ATI.

Und da HDR ist ja auch mehr eine Dreingabe und nicht mal besonders gut in FC implementiert...und nein, ich streite nicht ab, das man HDR wohl kaum für Games momentan verwenden kann (obwohl bei mir FC mit HDR durchaus im Spielbaren bereich (30-40FPS) läuft...bei 1280x1024 mit AF wohlgemerkt).

Man kann es sich zumindest mal angucken.....

Es sind schöne Features, die noch nicht alle optimal vom Speed her laufen....aber Sie tun auch nicht weh, deshalb verstehe ich auch nicht, das du so darüber herziehst.

Ich glaube auch nicht, das der r520 wesentlich besser unter SM3.0 performen wird alls der nv40....und auch das HDR (wenn es denn kommt) von ATI wird ziemlich sicher nicht wesentlich schneller sein....

Klar, das iletztere ist eine annahme meinerseits....aber mich würde alles andere sehr Wundern...falls der r520 aber doch wieder so ein Überchip wird, bin ich der erste der ATI gratuliert....

ShadowXX
2004-12-16, 20:54:01
For nv40 it's an option,and for every ATI GPU up to date it is NO GO. :biggrin:

Jupps....ich wollte es nur nicht so hart formulieren....

Was ich nicht ganz verstehe...

Als 32Bit Renderingkam hat sich keiner darüber aufgeregt, obwohls viel zu langsam war....als T&L kam hat sich keiner Aufgeregt (ausser die 3Dfx-Fans) obwohl es eigentlich nie benutzt wurde....etc. etc.

Warum beschweren sich die Leute, das nV jetzt SM3.0 und HDR bietet.....es ist doch egal...es ist eine Option. Es ist ja nicht so, das der nv40 kein SM2.0 kann.

Mein Gott, dann benutzt es eben kein (bzw. kaum) ein Game...oder es ist nicht gut in Spiel implementiert...ist doch auch egal, ich muss es ja nicht nutzen....

Es ist eine Option.....der nv40 bietet mir wenigstens diese Option.

P.S.
Brother in Arms wird übrigens SM3.0 unterstützen...

"Okay - We're getting a lot of questions about a demo. There WILL be a demo. I don't have a date yet. It's soon. Also - We're getting questions about system specifications on PC. 1ghz, 256mb, 32mb DX8 video card. That's min-spec. The game will scale up. There's PS2.0 stuff and a few PS3.0 features, too (PC only)."

quelle: http://www.planet3dgames.de/index.php?site=news&id=1385

Coda
2004-12-16, 21:00:32
Du hast ja Recht. The right tool for the job.
Schade daß es das richtige Werkzeug für die tollen neuen Effekte eben nicht gibt. nV40 mit SM 3.0/Softshadows/HDR ist wie als wenn du mit einer Zahnbürste den Flur schrubbst. Das wird jeden Tag deutlicher.
Err. Es gibt viele Möglichkeiten Softshadows zu produzieren und einen guten HDR Benchmark gibt's immer noch nicht, also bleib mal aufm Boden.

Jesus
2004-12-16, 21:15:33
Err. Es gibt viele Möglichkeiten Softshadows zu produzieren und einen guten HDR Benchmark gibt's immer noch nicht, also bleib mal aufm Boden.

Jupp, The Project nutzt ebenfalls Softshadows, oder die beiden Ruby demos uvm.

Coda
2004-12-16, 21:21:05
Nein, das sind Shadowmaps, die sind in jeder Entfernung überall "gleich Soft".
Das kann auch nicht Sinn der Sache sein.

Softshadows sind auch auf der ATI möglich....warum die von Riddick dafür SM2.0a haben wollen weiss nur der Geier und die Programmierer...
Aber klar...Softshadows fressen Performance...auch bei ATI.
Wahrscheinlich brauchen sie viele dependant reads dafür.

Quasar
2004-12-16, 21:21:12
Fakt ist nun mal daß bei "Chronicles of riddick" Softshadows nur ohne AA laufen. Und das auch noch mit bescheidener Performance. Selbst wenn es dir gelingt AA zu aktivieren dürfte daß das Spiel wohl endgültig zur Slideshow machen. Ist schon Klasse wie der nV40 von SM 3.0 profitiert! Die nV Propaganda wirkt wirklich prima.
Aber ich kenn das ja.
Far Cry? Unfähige Entwickler!
Chronickles o.R.? Unfähige Entwickler!

Wenn du mir jetzt noch den Zusammenhang zwischen Softshadows und SM3 erklärst....

http://www.pvrdev.com/pub/PC/eg/h/SoftShadow.htm

"blabla.... DX8-Version... blabla".

Quasar
2004-12-16, 21:22:23
funzt nicht, weil sie Feature-technisch veraltet ist. ;(
Quar. Softshadows kannst du ohne Probleme mit DX8 oder vermutlich auch mit DX7-Hardware machen.

Coda
2004-12-16, 21:23:22
Quasar das sind auch "nur" soft-edge Shadows, d.h. auch nicht Entfernungsabhängig.
Dass das teuer ist ist unbestritten, aber das liegt ja überhaupt nicht am Branching und ohne Branching sind die PS des NV40 sowieso sehr schnell.

D.h. wenn der R420 genügend dependant reads erlauben würde wäre er auch nicht schneller bei der Sache.

Quasar
2004-12-16, 21:29:46
Schade - gibt's von Riddick eine Demo? Die Schatten, die ich bisher sah, nutzten die "Soft"ness jedenfalls immer nur am Rande (supersampled Shadowmaps/Buffers und DST).

mapel110
2004-12-16, 21:32:21
Quar. Softshadows kannst du ohne Probleme mit DX8 oder vermutlich auch mit DX7-Hardware machen.

aber offenbar sind softshadows nicht das einzige, was der ps2.0++ pfad bei riddick mitbringt. :)

LovesuckZ
2004-12-16, 21:34:27
aber offenbar sind softshadows nicht das einzige, was der ps2.0++ pfad bei riddick mitbringt. :)

Benutzt Riddick nicht OpenGL?

Gast
2004-12-16, 21:35:18
Softshadows hatte man doch auch in Kotor und da konnte man über Treiber AA erzwingen.

Coda
2004-12-16, 21:37:13
Oh nein, nicht schon wieder das alte Problem...
HDR vs. "HDR" und Softshadows vs. "Softshadows" :rolleyes:

Jesus
2004-12-16, 21:39:04
Benutzt Riddick nicht OpenGL?

yep, OGL 1.5 (min.), lt. Verpackung ;)

ShadowXX
2004-12-16, 21:43:43
aber offenbar sind softshadows nicht das einzige, was der ps2.0++ pfad bei riddick mitbringt. :)

Was kommt den noch dazu?? Ich war bis jetzt zu faul den sm2.0++ pfad auszuprobieren...

tb
2004-12-17, 01:36:58
Du hast ja Recht. The right tool for the job.
Schade daß es das richtige Werkzeug für die tollen neuen Effekte eben nicht gibt. nV40 mit SM 3.0/Softshadows/HDR ist wie als wenn du mit einer Zahnbürste den Flur schrubbst. Das wird jeden Tag deutlicher.


Man kann es als Entwickler nie jedem recht machen. Unterstützt man bestimmte Features nicht, gibt's Kritik. Tut man es doch, dann gibt's auch Kritik. Skalierebare 3D-Engines scheinen also nicht sonderlich beliebt zu sein...

Thomas

Ailuros
2004-12-17, 05:47:39
Man kann es als Entwickler nie jedem recht machen. Unterstützt man bestimmte Features nicht, gibt's Kritik. Tut man es doch, dann gibt's auch Kritik. Skalierebare 3D-Engines scheinen also nicht sonderlich beliebt zu sein...

Thomas

Ich auf jeden Fall stehe voll auf skalierbare Engines. CroTeam hat wohl ihren Zeitplan nicht einhalten koennen, aber ich erwarte von den Kerlen auch wieder was imposantes.

Ailuros
2004-12-17, 06:06:44
Fakt ist nun mal daß bei "Chronicles of riddick" Softshadows nur ohne AA laufen. Und das auch noch mit bescheidener Performance. Selbst wenn es dir gelingt AA zu aktivieren dürfte daß das Spiel wohl endgültig zur Slideshow machen. Ist schon Klasse wie der nV40 von SM 3.0 profitiert! Die nV Propaganda wirkt wirklich prima.
Aber ich kenn das ja.
Far Cry? Unfähige Entwickler!
Chronickles o.R.? Unfähige Entwickler!


Wenn es zu AA generell kommt und gewissen SM3.0 Effekten wuerde ich aber nicht soooo schnell darauf herumtanzen, ueberhaupt in Hinsicht auf zukuenftige moegliche SM3.0 Varianten wo auch noch wiedermal SSAA Unterstuetzung zweifelhaft sein koennte.

Ich hab mal vor Wochen meine Meinung geaeussert dass es sein koennte dass hybride AA modi doch (temporaer?) noch mehr an Wichtigkeit gewinnen koennten.

Dass NV fett mit SM3.0 geworben hat und auch weiterhin wird, war ja schon vor der NV40 Veroeffentlichung klar. Die Frage ist dann eben nur noch wie sich ATI zur Sache stellen wird nach ihrem eigenen SM3.0 chip und was und wie alles moeglich sein wird.

Antialiasing generell wird vielleicht in der absehbaren Zukunft in eine andere Richtung gehen muessen, wenn die ganze Affaere nicht letztendes von den Entwicklern voll aufgenommen wird. Die Liste wo diverse Effekte sich nicht mit MSAA vertragen wird zunehmend laenger und davon ist nicht nur eine Architektur befallen.

Hier ist die Frage ob man MSAA Algorithmen so modifizieren kann dass es in der Mehrzahl der Faelle auch geht, oder ob die Modifizierung das Ganze doch wieder am Ende auf SSAA Leistung wirft.

Selbst Eric Demers ist der Ansicht dass es langfristig besser ist, dass AA von den Entwicklern voll aufgenommen wird. Ob es nun dazu kommt, oder ob IHVs weiterhin sich merkwuerdige Alternativen ausdenken muessen werden wir wohl noch sehen; aber die Chancen sind groesser fuer den zweiten Fall.

MadManniMan
2004-12-17, 06:52:35
Man kann es als Entwickler nie jedem recht machen. Unterstützt man bestimmte Features nicht, gibt's Kritik. Tut man es doch, dann gibt's auch Kritik. Skalierebare 3D-Engines scheinen also nicht sonderlich beliebt zu sein...

Thomas

Hm, die die sie nicht mögen, befassen sich nicht damit, oder verstehen sie nicht. Dieses Contra-Geben halte ich für Profilierungsdrang - es gibt keine objektiven Argumente gegen skalierbare Engines *Schulterzuck*