PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Deferred Renderer und Doom III?


boxleitnerb
2004-08-01, 12:19:45
Ich hab mir mal den X800 und Doom3 Artikel hier auf 3D-Center durchgelesen und hab mir folgendes überlegt:

Wenn es bei Doom3 so wichtig ist, schnell Pixel zu verwerfen, die nicht berechnet werden müssen, könnte dann die Serie 5 von PowerVR (sofern sie irgendwann mal kommt), als deferred renderer Vorteile gegenüber NV40 in Doom3 haben?

Edit: Hab grad die letzte Seite des PowerVR Threads gelesen und da es keine Serie 5 für den PC geben soll, könnte ein Mod diesen Thread bitte löschen?

Aqualon
2004-08-01, 20:01:12
Löschen braucht man den Thread bestimmt nicht. Die theoretische Überlegung, ob ein Deferred Renderer in Doom III Vorteile bzw. Nachteile gegenüber den konventionellen Grafikchips haben könnte, kann durchaus gemacht werden.

Ich passe den Threadtitel mal entsprechend an.

Aqua

Gast
2004-08-01, 20:27:35
Original geschrieben von boxleitnerb
Ich hab mir mal den X800 und Doom3 Artikel hier auf 3D-Center durchgelesen und hab mir folgendes überlegt:

Wenn es bei Doom3 so wichtig ist, schnell Pixel zu verwerfen, die nicht berechnet werden müssen, könnte dann die Serie 5 von PowerVR (sofern sie irgendwann mal kommt), als deferred renderer Vorteile gegenüber NV40 in Doom3 haben?

Edit: Hab grad die letzte Seite des PowerVR Threads gelesen und da es keine Serie 5 für den PC geben soll, könnte ein Mod diesen Thread bitte löschen?

Die PS3 GPU ist auch ein deffered renderer.:up:

][immy
2004-08-01, 20:38:59
also einen vorteil sollten die powervr chips dadurch schon immer gehabt haben, aber ich glaube nicht, das dieser dadurch besser als nvidia oder ati wäre

aber rein theoretisch wäre dieses verfahren wohl besser als alle möglichen kompressionsverfahren die die daten kleinhalten damit die bandbreite besser ausgenutzt werden kann.

aber das ist ja nicht das einzige worauf es ankommt, die restliche geschwindigkeit muss ja auch stimmen. was nützt ein es wenn man pixel zwar schnell verwerfen aber nur langsam berechnen kann.... naja.. da müsste schon eher ein powervr chip in der praxis beweisen was er kann.. aber dazu wird es wohl nicht kommen im pc-markt

StefanV
2004-08-01, 20:50:14
Original geschrieben von boxleitnerb
Ich hab mir mal den X800 und Doom3 Artikel hier auf 3D-Center durchgelesen und hab mir folgendes überlegt:

Wenn es bei Doom3 so wichtig ist, schnell Pixel zu verwerfen, die nicht berechnet werden müssen, könnte dann die Serie 5 von PowerVR (sofern sie irgendwann mal kommt), als deferred renderer Vorteile gegenüber NV40 in Doom3 haben?

Edit: Hab grad die letzte Seite des PowerVR Threads gelesen und da es keine Serie 5 für den PC geben soll, könnte ein Mod diesen Thread bitte löschen?

Hast du 'ne Kyro??

Wenn du eine besitzt und ein Board, in dem sie funzt, dann lass mal den Fablemark laufen, der nutzt allerhand Stencil irgendwas, was dazu führt, das alle anderen Karten außer der Kyro ziemlich dumm im Regen stehen...

Gast
2004-08-01, 20:51:32
Original geschrieben von ][immy
also einen vorteil sollten die powervr chips dadurch schon immer gehabt haben, aber ich glaube nicht, das dieser dadurch besser als nvidia oder ati wäre

aber rein theoretisch wäre dieses verfahren wohl besser als alle möglichen kompressionsverfahren die die daten kleinhalten damit die bandbreite besser ausgenutzt werden kann.

aber das ist ja nicht das einzige worauf es ankommt, die restliche geschwindigkeit muss ja auch stimmen. was nützt ein es wenn man pixel zwar schnell verwerfen aber nur langsam berechnen kann.... naja.. da müsste schon eher ein powervr chip in der praxis beweisen was er kann.. aber dazu wird es wohl nicht kommen im pc-markt
Guckt dir mal die Dreamcast Spiele an,die haben damals
den PC in den Schatten gestellt.

Aqualon
2004-08-01, 21:23:34
Nachdem ja angeblich auch eine GeForce4MX 440 Doom3 halbwegs lauffähig auf den Bildschirm bringen soll, wäre ein Test auf einer Kyro2 eine interessante Sache.

Aqua

Demirug
2004-08-01, 21:30:12
Original geschrieben von Aqualon
Nachdem ja angeblich auch eine GeForce4MX 440 Doom3 halbwegs lauffähig auf den Bildschirm bringen soll, wäre ein Test auf einer Kyro2 eine interessante Sache.

Aqua

Sinnloss. Eine Kyro kann D3 nicht korrekt rendern.

Aqualon
2004-08-01, 21:44:33
Original geschrieben von Demirug
Sinnloss. Eine Kyro kann D3 nicht korrekt rendern.
Ich habe immer gedacht vom Techlevel gesehen wären eine Kyro und die GF4MX beides DirectX 7 Karten. Was sind denn die Unterschiede zwischen den beiden Karten, die verhindern, dass eine Kyro D3 darstellen kann?

Aqua

Demirug
2004-08-01, 22:02:17
Original geschrieben von Aqualon
Ich habe immer gedacht vom Techlevel gesehen wären eine Kyro und die GF4MX beides DirectX 7 Karten. Was sind denn die Unterschiede zwischen den beiden Karten, die verhindern, dass eine Kyro D3 darstellen kann?

Aqua

Eine Kyro gehört eher ins DX6 Lager. Im Falle von D3 fehlt den Kyros aber vorallem der Cubemap Support.

StefanV
2004-08-01, 22:08:40
Original geschrieben von Aqualon
Ich habe immer gedacht vom Techlevel gesehen wären eine Kyro und die GF4MX beides DirectX 7 Karten. Was sind denn die Unterschiede zwischen den beiden Karten, die verhindern, dass eine Kyro D3 darstellen kann?

Aqua
Naja, die Kyro kann kein Cube Mapping, AFAIK.

Ansonsten noch die fehlende HW TnL Einheit...

Ailuros
2004-08-02, 01:11:30
Original geschrieben von ][immy
also einen vorteil sollten die powervr chips dadurch schon immer gehabt haben, aber ich glaube nicht, das dieser dadurch besser als nvidia oder ati wäre

aber rein theoretisch wäre dieses verfahren wohl besser als alle möglichen kompressionsverfahren die die daten kleinhalten damit die bandbreite besser ausgenutzt werden kann.

aber das ist ja nicht das einzige worauf es ankommt, die restliche geschwindigkeit muss ja auch stimmen. was nützt ein es wenn man pixel zwar schnell verwerfen aber nur langsam berechnen kann.... naja.. da müsste schon eher ein powervr chip in der praxis beweisen was er kann.. aber dazu wird es wohl nicht kommen im pc-markt

Nur rein theoretisch haben TBDRs meistens eine hohe Anzahl von Z/stencil Einheiten, was sich wohl in hoehere Stencil Fuellraten uebersetzen laesst. KYRO hatte 32 Z/stencil units.

Bei einer early Z optimierten Applikation wie Doom3 wird sich aber ein TBDR an die early Z Optimierung halten muessen.

Early Z Optimierungen kann man auch als application driven deferred rendering ansehen; hier wird durch die Applikation das rendering verzoegert, waehrend ein TBDR es in allen oder in den meisten Situation im Treiber verzoegert.

Theoretisch wenn ein TBDR beim Doom3 rendering nicht aus anderen Gruenden im Nachteil liegen wird, wird sich der Stencil-Fuellraten Vorteil bis zu einem Grad schon ausspielen. Dieser Vorteil zeigt sich ja auch dank UltraShadow und den doppelt so hohen Z/stencil ROPs auf NV40 im Vergleich zu R420.

ActionNews
2004-08-02, 06:40:43
Original geschrieben von boxleitnerb
(...)

Edit: Hab grad die letzte Seite des PowerVR Threads gelesen und da es keine Serie 5 für den PC geben soll, könnte ein Mod diesen Thread bitte löschen?

Vielleicht ist noch nicht alles verloren ;): http://www.mitrax.net/phpBB2/viewtopic.php?t=3337&start=40

Solange nix offizielles von PowerVR/ImgTec gibt kann man nicht sicher sein ob etwas kommt für PC oder ob nicht.

CU ActionNews

R300
2004-08-02, 07:46:33
Deine Hoffnung stirbt zuletzt ActionNews. ;)

loewe
2004-08-02, 11:41:56
Original geschrieben von Demirug
Eine Kyro gehört eher ins DX6 Lager. Im Falle von D3 fehlt den Kyros aber vorallem der Cubemap Support.

Über DX6 oder DX7 streiten sich die Geister, ist aber jetzt auch schon egal, KYRO ist tot.

Ich hatte die D3 alpha auf KYRO laufen, dazu gibt es irgendwo im Forum von dp einen Shot. Cubemaps lassen sich "emulieren" oder besser der Aufruf abfangen, dafür gibt es im Treiber eine Option.

Sobald ich D3 in Händen halte werde ich es noch einmal rein aus Interesse auf KYRO testen, dann melde ich mich mal zu dem Thema. :)

Aber sicher bleibt, es wird nicht gut aussehen und schnell wird es sicher auch nicht sein. :D

Gast
2004-08-02, 12:00:15
Original geschrieben von loewe
Über DX6 oder DX7 streiten sich die Geister, ist aber jetzt auch schon egal, KYRO ist tot.



Nein, das ist unstrittig.
Kyro = DX6, da kein Cubemap Support (den nunmal alle DX7 Chips besitzen).

ActionNews
2004-08-02, 12:29:53
Ich dachte Nvidia wäre bei den DX7 Karten die einzigen gewesen mit Cubemap-support. Aber anscheinend hatte ich da wohl falsche Infos. Hat die ("Ur-")Radeon denn auch Cubemap-support?

CU ActionNews

Gast
2004-08-02, 12:50:04
Original geschrieben von ActionNews
Ich dachte Nvidia wäre bei den DX7 Karten die einzigen gewesen mit Cubemap-support. Aber anscheinend hatte ich da wohl falsche Infos. Hat die ("Ur-")Radeon denn auch Cubemap-support?

CU ActionNews


Ja, auch die Ur-Radeon kann cube-mapping.

Ailuros
2004-08-02, 15:38:15
Wen kuemmert ueberhaupt 3-4 Jahre altes Material; cube maps und/oder T&L hin und her, low end GPUs von 2000-2001 wuerden und werden es extrem schwer haben mit Spielen wie Doom3.

HardOCP behauptet zwar als Beispiel, dass eine GF4MX immer noch ziemlich anstaendig oder gut in 640*480 aussieht, aber ich wuerde liebend gerne wissen auf was fuer einem Bildschirm getestet wurde oder ob jemand irgend einen Augenschaden bei denen drueben hat; anders kann ich es mir nicht erklaeren.

Von GPUs mit niedrigeren als GF4 MX Spezifikationen, sollte wohl erst gar nicht mehr die Rede sein.

Gast
2004-08-02, 19:05:51
Original geschrieben von Ailuros

Von GPUs mit niedrigeren als GF4 MX Spezifikationen, sollte wohl erst gar nicht mehr die Rede sein.

Wieso? Wenn´s auf der GF4MX läuft, dann kann man es auch auf GF1&2 noch spielen. 640x480 low detail.

Aquaschaf
2004-08-02, 23:59:14
Unterhalb von 64MB Grafikspeicher wird es elendig langsam werden, nehme ich an.

Ailuros
2004-08-03, 05:07:32
Original geschrieben von Gast
Wieso? Wenn´s auf der GF4MX läuft, dann kann man es auch auf GF1&2 noch spielen. 640x480 low detail.

Teufel warum nicht gleich eine TNT2 in 320*240 mit point sampling? :|

loewe
2004-08-03, 08:42:35
Original geschrieben von Ailuros
Teufel warum nicht gleich eine TNT2 in 320*240 mit point sampling? :|

Ja warum eigentlich nicht? :)

Die beste Grafikkarte hier im Hause, ich bin in der Schule, ist eine GF2MX400.
Ich kann mir sehr gut vorstellen und weiß es zum Teil über Bekannte und Verwandte auch, dass auch im privaten Bereich noch viele Rechner auf diesem Grafikniveau liegen. Das sind zwar nicht die Hardcore-Gamer, aber bis eine GF6800 standard sein wird spricht kein Mensch mehr über Doom3. :)


Aber um noch einmal auf das eigentliche Thema zu sprechen zu kommen.

Bekannt ist uns bisher ja nur ein TBDR und allein deferred Rendering bringt sicher keine wesentlichen Vorteile in Doom3.
Ein TBDR muss genauso wie auch die IMRs diesen Z-only Pass durchführen. Für die PowerVR Technologie gilt aber nun einmal, dass die Stencil OPs im Image Synthesis Processor (ISP) abgearbeitet werden und diese Einheit läuft parallel zur Textureinheit. Somit ergibt sich etwa folgendes Szenario, es werden nicht nur viele Stencil OPs parallel abgearbeitet, bei KYRO waren es 32 in neueren Generationen wird es mehr sein (so etwa 64), diese werden auch noch parallel und zusätzlich zum Rest der Pipeline berechnet. Sprich die Stencil Ops spielen bei Füllraten Berechnungen und somit bei Belastung der Pipeline nahezu keine Rolle.

Ein TBDR von PowerVR wäre wenn es denn einen geben würde und die Grundleistung stimmt sicher nicht die schlechteste Karte für Spiel auf Basis der D3 Engine.

seahawk
2004-08-03, 10:03:56
Ist die Debatte nicht sinnlos. Auf einer Kyro wird es höchstwahrscheinlich nicht laufen und außer den Kyros gibt es keine Karten die das entsprechende Renderprinzip benutzen.

aths
2004-08-03, 20:54:15
Original geschrieben von loewe
Aber um noch einmal auf das eigentliche Thema zu sprechen zu kommen.

Bekannt ist uns bisher ja nur ein TBDR und allein deferred Rendering bringt sicher keine wesentlichen Vorteile in Doom3.
Ein TBDR muss genauso wie auch die IMRs diesen Z-only Pass durchführen. Für die PowerVR Technologie gilt aber nun einmal, dass die Stencil OPs im Image Synthesis Processor (ISP) abgearbeitet werden und diese Einheit läuft parallel zur Textureinheit. Somit ergibt sich etwa folgendes Szenario, es werden nicht nur viele Stencil OPs parallel abgearbeitet, bei KYRO waren es 32 in neueren Generationen wird es mehr sein (so etwa 64), diese werden auch noch parallel und zusätzlich zum Rest der Pipeline berechnet. Sprich die Stencil Ops spielen bei Füllraten Berechnungen und somit bei Belastung der Pipeline nahezu keine Rolle.Das wird bei IMRs auch schon aufgeweicht. NV40 cullt Z und Stencil im Rasterizer, was gecullt wird, bekommt die Pipe gar nicht erst zu sehen. Die Z/Stencil-Subpixeltests übernimmt ein ROP-Array, womit unterschiedlich lange Latenzen einzelner Quad-Pipes teilweise kompensiert werden (ROPs werden dort eingesetzt, wo sie gerade gebraucht werden.)

So oder so, das Verhältnis von tatsächlicher ROP-Power per Pipe in Bezug zur benötigten ROP-Power entscheidet. Ob die Pipelines "belastet" werden oder nicht, ist nebensächlich. Die ROPs sind entweder Flaschenhals, oder nicht. Eine ROP-Crossbarlogik wie im NV40 sollte gegenüber der festverdrahteten ROP-Lösung im R420 nicht so gewaltig im Vorteil sein. (Abgesehen von der Skalierbarkeit – die 6800 hat 12 Pixelpipes, aber das volle 16-er ROP-Array.) Wichtiger ist schon, dass das Occlusion Culling losgelöst von den ROPs ist.
Original geschrieben von loewe
Ein TBDR von PowerVR wäre wenn es denn einen geben würde und die Grundleistung stimmt sicher nicht die schlechteste Karte für Spiel auf Basis der D3 Engine. Ehe sowas kommt, woran ich nicht glaube, gäbe es wohl schon NV48 oder NV50 zu kaufen.

loewe
2004-08-03, 21:19:19
@aths
Zum 1. Teil kann ich leider nichts genaueres sagen, ich erinnere mich da nur an eine Aussage, die etwa hieß: Doom3 ist ein Segen für PowerVR.

Aber was du glaubst ist ohne jede Bedeutung, da du wie du schon selbst sagst "glaubst". ;)

Ansonsten habe ich hier sehr vorsichtig vormuliert:

wenn es denn einen geben würde

:)

aths
2004-08-03, 21:27:47
Original geschrieben von loewe
@aths
Zum 1. Teil kann ich leider nichts genaueres sagen, ich erinnere mich da nur an eine Aussage, die etwa hieß: Doom3 ist ein Segen für PowerVR.Von wem ist diese Aussage?
Original geschrieben von loewe
Ansonsten habe ich hier sehr vorsichtig vormuliert:

:) Würde man einen dedizierten Doom3-Beschleuniger bauen, der wäre erst schnell :eyes: Wegen dem EarlyZ-Pass verliert ein TBDR seinen Hauptvorteil: Teure Pixeloperationen einsparen.

Demirug
2004-08-03, 22:20:13
aths, stell dir einen Chip mit 64 oder noch mehr ROPs vor die fast vollständig von den Shadern entkoppelt sind.

stav0815
2004-08-03, 22:32:28
Original geschrieben von Demirug
aths, stell dir einen Chip mit 64 oder noch mehr ROPs vor die fast vollständig von den Shadern entkoppelt sind.

Technisch machbar?
ansonsten könnt ich mir auch einen Athlon 64 mit 4Ghz vorstellen oder einen R500 mit SM4 und 32Pipes

Demirug
2004-08-03, 22:36:16
Original geschrieben von stav0815
Technisch machbar?
ansonsten könnt ich mir auch einen Athlon 64 mit 4Ghz vorstellen oder einen R500 mit SM4 und 32Pipes

Natürlich ist das machbar.

Ailuros
2004-08-04, 00:57:22
Wegen dem EarlyZ-Pass verliert ein TBDR seinen Hauptvorteil: Teure Pixeloperationen einsparen.

Hab ich das auch nicht mit anderen Worten weiter oben schon erwaehnt? Demirug wiederholte aber danach auf das was ich auch schon hindeutete: um einiges hoehere Stencil-fuellrate. Das wuerde sich zwar nicht selbst theoretisch in doppelte Leistung umsetzen, da viele andere Faktoren meistens limitieren, aber dieser isolierte Vorteil besteht.

Würde man einen dedizierten Doom3-Beschleuniger bauen, der wäre erst schnell.

Was heisst dediziert ueberhaupt? Wie wuerde denn bei Dir ein dedizierter D3-Beschleuniger aussehen? NV40 wird des oefteren - und sogar von NVIDIA indirekt selber - als solcher beschrieben und dabei mit "nur" 12.8 GPixels/sec Stencil-Fuellrate.

NV40 brauchte UltraShadowII unbedingt um den Hauptvorteil mit stenciling eines TBDR zu bekommen; daran gibt es nichts zu optimieren auf einem TBDR, da sind die Stencil von den Pixel-Fuellraten von Grund auf entkoppelt.

Im Gegenteil braucht ein TBDR meistens mehr Z/stencil Einheiten als ein heutiger IMR, egal wie stark man beim letzteren auf D3-rendering optimiert hat.

Technisch machbar?
ansonsten könnt ich mir auch einen Athlon 64 mit 4Ghz vorstellen oder einen R500 mit SM4 und 32Pipes.

Obwohl man heutzutage extrem vorsichtig mit dem Transistoren-budget sein muss, waere es auch durchaus moeglich gewesen 256 Z ROPs auf einem high end TBDR zu haben. Aber so verschwenderisch glaube ich muss man mit dem Zeug nicht umgehen und ich bezweifle ernsthaft dass wir die absehbaren Zukunft heftige ROP-Anzahl-Skalierungen sehen werden, und das egal um welche Architektur es sich handelt.

loewe
2004-08-04, 10:12:22
Original geschrieben von aths
Von wem ist diese Aussage?
Das kann ich dir leider nicht sagen, wie ich mich auch nicht genauer zum ISP der nächsten Generation äußern kann ohne massiven Ärger zu verursachen.

Original geschrieben von aths
Würde man einen dedizierten Doom3-Beschleuniger bauen, der wäre erst schnell :eyes: Wegen dem EarlyZ-Pass verliert ein TBDR seinen Hauptvorteil: Teure Pixeloperationen einsparen.
Sehe ich wie Ailuros,
NV40 kann man wohl nahezu als dedizierten Doom3-Beschleuniger ansehen. Das Ergebnis ist ja auch nicht schlecht, aber richtig gut finde ich NV40 deswegen noch lange nicht.

Wir sind immer wieder bei dem Thema TBDR und seine "Hauptvorteile".
PowerVR läßt sich nicht auf Overdraw-Vermeidung reduzieren. Dadurch das der TA, der ISP und der TSP weitgehend völlig getrennt von einander arbeiten und natürlich parallel zu einander und dann auch noch durch TA und ISP/TSP jeweils verschiedene Bilder bearbeitet werden. Zusätzlich kommt auch noch in der einen oder anderen Form weitere noch nicht näher erläuterbare Technologie zum Einsatz, somit bleibt PowerVR schon eine sehr effiziente Architektur. Wenn nicht die Shader der limitierende Faktor sind, sollten für bezüglich der Effizienz ähnliche Raten erwarten wie bei KYRO.
Leider haben wir davon noch nichts zu sehen bekommen, außer in KYRO.

Aber, was nicht ist kann ja noch werden.