PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : 3dlabs p20


Gast
2004-04-19, 17:32:15
http://www.3dlabs.com/whatsnew/pressreleases/pr04/04-04-19-realizmtech.htm

deekey777
2004-04-19, 17:54:44
3Dlabs stellt programmierbaren 3D-Chip vor
Die zu Creative Technologies gehörende 3Dlabs, die sich ganz auf Grafikhardware für professionelle Anwendungen konzentriert, baut ihr Angebot mit dem 3D-Chipsatz Wildcat Realizm aus. Die Minimalkonfiguration besteht aus einer VPU (Visual Processing Unit) mit AGP-8X-Interface und bis zu 256 MByte Speicher. Der Chip mit einer Komplexität von 150 Millionen Transistoren integriert vier 36-Bit-genaue Vertex-Shader und unterstützt bis zu 32 Lichtquellen.

Für die Pixelfarbwerte sind 48 Fragment Shader mit einer Gleitkommagenauigkeit von 32 Bit verantwortlich. Sie besitzen die Leistung von zwölf konventionellen Pixel-Pipelines. Vertex-Programme können maximal 1000 Fragment-Programme bis zu 256.000 Instruktionen umfassen -- wobei auch Subroutinen, Schleifen und bedingte Sprünge erlaubt sind. Insgesamt verwaltet der Chip 256 GByte virtuellen Speicher für Geometrie- sowie Textur-Daten und setzt dabei seinen Grafikkartenspeicher als Level-2-Cache ein.

Die nächst größere Konfiguration entsteht durch Vorschalten eines VSU-Chips (Visual Scalability Unit). Er enthält acht Vertex Shader und verwaltet maximal 128 MByte Burst-Memory, was die Geometrieleistung verdoppelt. Der VSU-Chip verfügt zudem über ein 16x-PCI-Express-Interface, womit Wildcat Realizm auch Anschluss an den von Intel propagierten Schnittstellen-Standard findet. Den VPU-Chip steuert er über ein separates Interface mit einem Durchsatz von 4&nbps;GByte/s an, sodass dessen AGP-Anschluss die PCI-Express-Eigenschaften nicht beeinträchtigt. Maximal kann eine VSU zwei VPUs ansteuern, womit sich dann auch die Pixelfüllrate und die Speicherbandbreite verdoppeln.

Die Treiber unterstützen OpenGL 1.5 inklusive OpenGL Shading Language (OpenGL 2.0 bei Verfügbarkeit) sowie DirectX 9.0b mit der Shader-Spezifikation 2.0. Die Wildcat-Realizm-Karten sind auf 32- wie auch 64-Bit-Plattformen unter den Betriebssystemen Windows und Linux einsetzbar. Erste Modelle sollen zur Jahresmitte zu Preisen von 1500 (eine VPU) und 3000 Euro (zwei VPUs) auf den Markt kommen.

Quelle: heise (http://www.heise.de/newsticker/meldung/46642)

peecee
2004-04-19, 18:14:19
Ich frag mich warum das Ding nur Shader-Spezifikation 2.0 untertützt wenn Subroutinen, Schleifen und bedingte Sprünge erlaubt sind dachte immer das macht im groben 3.0 Shader aus?

Da hat 3DLabs ja wieder mal einen coolen Chip vorgestellt!

HOT
2004-04-19, 18:44:07
Könnte durchaus sein, dass dem Teil die SM3.0 Specs nicht vollständig unterstützt. Der ist auf OpenGL ausgelegt, D3d ist eher 2.rangig und hat sicher keine wesentliche Rolle in der Entwicklung gespielt. Der Chip unterstützt also mehr oder weniger "zufällig" PS/VS 2.0.

peecee
2004-04-19, 19:37:13
Original geschrieben von HOT
Könnte durchaus sein, dass dem Teil die SM3.0 Specs nicht vollständig unterstützt. Der ist auf OpenGL ausgelegt, D3d ist eher 2.rangig und hat sicher keine wesentliche Rolle in der Entwicklung gespielt. Der Chip unterstützt also mehr oder weniger "zufällig" PS/VS 2.0.

Kann es sein das 3DLabs Shader 3.0 per Treiber Update nachpatcht?

Wenn nicht was fehlt dem P20 dann zu Shader 3.0???

Gast
2004-04-19, 19:48:34
Original geschrieben von peecee
Kann es sein das 3DLabs Shader 3.0 per Treiber Update nachpatcht?

Wenn nicht was fehlt dem P20 dann zu Shader 3.0???

Das ist momentan wohl schwer zu sagen. Ich denke auch das sich 3dlabs vorallem auf den prof. markt und opengl konzentriert und nicht so auf games und d3d.

Xmas
2004-04-19, 20:26:56
Es fehlen Texturen im Vertex Shader.

ice cool69
2004-04-19, 21:12:17
IMO für Gamer leider kein interessanter Chip, wirklich schade. :(

StefanV
2004-04-19, 21:25:16
Original geschrieben von ice cool69
IMO für Gamer leider kein interessanter Chip, wirklich schade. :(

Erstmal abwarten, wie lahm das Teil wird ;)
Vielleicht lohnts sich ja ev.

Und mal sehen, ob sich das AF seit dem P10 verbessert hat...

Das AF beim P10 ist das schlechteste, was es gibt, leider...

robbitop
2004-04-19, 22:58:50
man sieht nach kurzem Lesen, dass es ein Proffessioneller Chip ist. Sehr auf Geometrie fixiert. Das ist bei Gamern eher anders ...Pixeloutput fixiert.
Das Teil könnte mit einer VSU im CAD Bereich gut rocken =)

zumal diese recht flexible VPU sehr durch Treiber bestimmt wird. Der P10 wurde bei games sehr durch die Treiber gefangen.

Aqualon
2004-04-20, 00:07:17
Whitepaper: http://www.3dlabs.com/product/technology/wildrealtech.htm

Q&A: http://www.3dlabs.com/product/wildcatrealizm/qa.htm

Definitiv ein sehr interessanter Chip.

Aqua

StefanV
2004-04-20, 00:47:18
Original geschrieben von Aqualon
Whitepaper: http://www.3dlabs.com/product/technology/wildrealtech.htm

Q&A: http://www.3dlabs.com/product/wildcatrealizm/qa.htm

Definitiv ein sehr interessanter Chip.

Aqua

Der Meinung bin ich auch, wenn 3Dlabs besseres AF bietet und die Performance mit den mitbewerbern vergleichbar ist.

Interessant ist vorallendingen, ob 3DLabs es hinbekommen hat, daß man die einzelnen Einheiten dynamisch zuweisen kann, ohne Reboot...

Radeonator
2004-04-20, 01:40:08
Beim P10 war nicht nur das AF schlecht. Selbst unter OGl eine vergleichsweise lahme Krücke (overall).

tb
2004-04-20, 02:49:21
DirectX 9 VS 2.x/PS 3.x

MadManniMan
2004-04-20, 05:59:30
Sehr schade, daß eine derartig programmierbare Bude nichtmal mit 3.0er VS daherkommt - schließlich drängt sich dem geneigten DAU wie mir doch der Gedanke auf, daß das Teil einem unified Shader Teil wie nach SM4.0 recht ähnlich wäre...

Hm... :grübel:

Naja, mal sehen, ob das Ding was für Spieler taugt - das AA war schon beim P10 qualitativ einsame Spitze!

robbitop
2004-04-20, 10:34:56
wird wohl kaum für den Spielemarkt kommen Manni.
Das sieht man schon an der Ausrichtung.
Hätte wohl auch kaum ne Chance.

Aber im CAD Markt wo es vA um Geometrieleistung geht, da wird der Maximalausbau von 2xP20 und einer VSU denke ich mal so ziemlich alles stehenlassen.

LOCHFRASS
2004-04-20, 13:58:54
NV40 Killer? An den R420 glaube ich nicht mehr so recht. Hoffentlich bringt Creative auch billigere Exemplare.

robbitop
2004-04-20, 14:20:54
wieso das?

Aqualon
2004-04-20, 14:21:05
Original geschrieben von LOCHFRASS
NV40 Killer? An den R420 glaube ich nicht mehr so recht. Hoffentlich bringt Creative auch billigere Exemplare.
Bei Profi-3D-Usern wird er wahrscheinlich mit der entsprechenden NV40-Quadro mithalten können und für Entwickler ist die Karte aufgrund ihrer Programmierbarkeit bestimmt sehr interessant.

Aber im Gamer-Segment wird er mit ziemlicher Sicherheit keine Chance gegen R420 und NV40 haben.

Eine Spieleleistung im Bereich einer Radeon 9600 Pro wäre schon mehr als ich persönlich erwarten würde.

Aqua

ow
2004-04-20, 14:28:30
.

robbitop
2004-04-20, 14:55:44
wenn man richtige Gamertreiber schreiben würde und die Taktfrequenz okay wäre würde ich sogar mehr erwarten.
12x1
48 Fragmentshader Prozessoren
4xVS das hört sich nicht sooo verkehrt an.

Die Realität sieht allerdings vermutlich anders aus.
Ich denke mal die 2xP20 +VSU wird im CAD Bereich auch den NV40 in die Schranken weisen. Dazu ist die Geometrieleistung (auf die es dort ankommt) dann doch etwas zu hoch ;)

ow
2004-04-20, 15:10:40
.

Quasar
2004-04-20, 15:32:29
Original geschrieben von robbitop
wenn man richtige Gamertreiber schreiben würde und die Taktfrequenz okay wäre würde ich sogar mehr erwarten.
12x1
48 Fragmentshader Prozessoren
4xVS das hört sich nicht sooo verkehrt an.

Die Realität sieht allerdings vermutlich anders aus.
Ich denke mal die 2xP20 +VSU wird im CAD Bereich auch den NV40 in die Schranken weisen. Dazu ist die Geometrieleistung (auf die es dort ankommt) dann doch etwas zu hoch ;)

Woher hast du die ganzen Informationen? =)

Aqualon
2004-04-20, 15:33:39
Original geschrieben von robbitop
12x1
48 Fragmentshader Prozessoren
4xVS das hört sich nicht sooo verkehrt an.
Wie kommst du denn da auf 12*1 und 4xVS?

http://www.3dlabs.com/product/technology/wcrwpimages/image015.gif

Aqua

Demirug
2004-04-20, 15:41:00
Original geschrieben von Quasar
Woher hast du die ganzen Informationen? =)

Wer lesen kann ist klar im Vorteil. Da gibt es bei der Presseerklärung noch einen Link zum Whitepaper.

http://www.3dlabs.com/product/technology/wildrealtech.htm

Quasar
2004-04-20, 15:44:16
Original geschrieben von Demirug
Wer lesen kann ist klar im Vorteil. Da gibt es bei der Presseerklärung noch einen Link zum Whitepaper.

http://www.3dlabs.com/product/technology/wildrealtech.htm

Das habe ich gelesen (wie du weißt ;) ), aber IMO gibt das weder die 12 Pixelpipes noch die 4 Vertexshader pro VPU her.

robbitop
2004-04-20, 15:52:02
kann mich nicht mehr entsinnen aber etwas Ähnliches wollte ich gerade auch sagen ;)

gegen die 4VS+8VS aus der VSU und die 4VS aus dem 2. Chip
kommt NVs VS Array sicher nicht an. 16xVS Units sind sau viel.

Quasar
2004-04-20, 15:59:43
Wenn ich's recht bedenke, sind Heise.de die einzigen, die sich zu solchen Angaben verstiegen haben....

Klar, aus 16 kann man gut 4 machen und aus 48 mit demselben Teiler eine 12.
Wenn die Annahme stimmt, daß jede der einzelnen Rechenzellen eine Vektor-1 Einheit ist.

Aqualon
2004-04-20, 16:23:09
Das einzige das feststeht ist, dass eine VPU gleichzeitig 16 Vertices im VS und 48 Pixel im FS bearbeiten kann.

Kommt der VSU zum Einsatz, werden die VS der VPU deaktiviert und es können 2*16 Vertices gleichzeitig bearbeitet werden.

Bei 2 VPUs und 1 VSU hat man also maximal 32 Vertices und 96 Pixel simultan in Bearbeitung.

Wie es bei 1x VPU und 1x VSU aussieht, kann man aus den White Papers nicht sagen, weil die Schema-Bilder bei 1x VSU + 1x VPU und 1x VSU + 2x VPU dieselben sind. Wobei das Bild bei 1x VSU + 2x VPU aber stimmen dürfte.

Aqua

Quasar
2004-04-20, 16:25:05
Original geschrieben von Aqualon
Wie es bei 1x VPU und 1x VSU aussieht, kann man aus den White Papers nicht sagen,[...]

Doch. Man hat zweifache Vertex- aber einfache Pixelleistung - so der Text.

Aqualon
2004-04-20, 16:34:55
Original geschrieben von Quasar
Doch. Man hat zweifache Vertex- aber einfache Pixelleistung - so der Text.
Stimmt, hatte ich überlesen.

Optimal wäre natürlich, wenn die Shader in der VPU bereits unified shader wären und die brachliegende Vertex-Abteilung so auch FS-Anweisungen bearbeiten könnten.

Aber so wie ich das verstehe liegen die 32 VS Prozessoren in den beiden VPUs brach, wenn die VSU zum Einsatz kommt.

Immerhin könnte 3DLabs bein den Wildcat Versionen mit VSU die Transistoren für die VS Prozessoren in den VPUs einsparen, aber mangels Menge würde das wohl keine Sinn machen, 2 Sorten von VPUs aufzulegen.

Aqua

Demirug
2004-04-20, 16:37:33
Quasar, es sind Skalarrechner. Das war schon beim P10 so aufgebaut.

Quasar
2004-04-20, 16:39:58
Igitt.... Das muss ich übersehen haben. Danke für den Hinweis, dann kommen wir ja doch mit 4/12 hinne, wenn denn wirklich alle Einheiten aktiv sind.

robbitop
2004-04-20, 16:49:32
nur skalarrechner?
Dann sind die bei Vektoroperationen von der performance aufgeschmissen.

Warum werden die VS deaktiviert, wenn die VSU zum Einsatz kommt?
Ginge das nicht auch ohne Deaktivierung?

Aqualon
2004-04-20, 16:53:51
Original geschrieben von Quasar
Igitt.... Das muss ich übersehen haben. Danke für den Hinweis, dann kommen wir ja doch mit 4/12 hinne, wenn denn wirklich alle Einheiten aktiv sind.
Auf eine VPU bezogen ja, bei 1x VSU + 2x VPU wären wir nach deiner Rechenweise bei 8/24, wobei ein Fragment Shader theoretisch 48 Pixel simultan ausgeben könnte.

Bei 2x VPU hätte man also rein theoretisch 96 Pixel(pipelines) ;)

Aqua

ow
2004-04-20, 17:08:53
.

Quasar
2004-04-20, 17:30:50
Original geschrieben von Aqualon
Auf eine VPU bezogen ja, bei 1x VSU + 2x VPU wären wir nach deiner Rechenweise bei 8/24, wobei ein Fragment Shader theoretisch 48 Pixel simultan ausgeben könnte.

Bei 2x VPU hätte man also rein theoretisch 96 Pixel(pipelines) ;)

Aqua

Jein. Soweit ich das verstanden habe, stimmt das wohl mit 2x12 Pixelpipes, aber 48 Pixel simultan können Skalarrechner eigentlich nicht, da jedes Pixel aus RGB+A besteht, also aus vier Skalaren.


Original geschrieben von robbitop
nur skalarrechner?
Dann sind die bei Vektoroperationen von der performance aufgeschmissen.

Warum werden die VS deaktiviert, wenn die VSU zum Einsatz kommt?
Ginge das nicht auch ohne Deaktivierung?

a) Aufgeschmissen nicht, nur geviertelt.

b) Weil man ansonsten die ganze Geometrie mehrfach machen müsste.
So übernimmt die VSU genausoviel Geometrie, wie BEIDE VPUs und leitet dann die fertig aufbereiteten Daten an die "externen Pixelpipes" weiter.

Aqualon
2004-04-20, 17:39:56
Original geschrieben von Quasar
Jein. Soweit ich das verstanden habe, stimmt das wohl mit 2x12 Pixelpipes, aber 48 Pixel simultan können Skalarrechner eigentlich nicht, da jedes Pixel aus RGB+A besteht, also aus vier Skalaren.
Dann würde aber der Satz "This comprises 48 independent multi-threading processors that can operate with 32-bit floating-point accuracy on 48 pixels simultaneously." wenig Sinn machen. Gleichzeitig an 48 Pixeln arbeiten heisst zumindest für mich, dass theoretisch auch 48 Pixel gleichzeitig ausgegeben werden könnten.

Aqua

Quasar
2004-04-20, 17:42:31
Arbeiten können sie vielleicht an 48 Pixeln gleichzeitig, aber jeweils nur mit einer Skalarop. Und wie die Ausgabe über die ROP läuft, weiß AFAIK niemand, da es dazu (den ROPs) noch keine Infos gibt.

Demirug
2004-04-20, 18:07:20
Original geschrieben von Quasar
Arbeiten können sie vielleicht an 48 Pixeln gleichzeitig, aber jeweils nur mit einer Skalarop. Und wie die Ausgabe über die ROP läuft, weiß AFAIK niemand, da es dazu (den ROPs) noch keine Infos gibt.

3dlabs nennt die ROPs PixelShader.

Quasar
2004-04-20, 18:16:41
Ehrlich?

zeckensack
2004-04-20, 18:22:01
Original geschrieben von Quasar
Ehrlich? Ja natürlich. Steht doch auch in dem lustigen Diagramm. Das ist IMO sogar das coolste an der "VPU". Programmierbares Blending =)

Demirug
2004-04-20, 18:22:28
Original geschrieben von Quasar
Ehrlich?

Ja, und das was bei DX Pixelshader heisst nennt 3dlabs Fragmentshader.

Demirug
2004-04-20, 18:23:31
Original geschrieben von zeckensack
Ja natürlich. Steht doch auch in dem lustigen Diagramm. Das ist IMO sogar das coolste an der "VPU". Programmierbares Blending =)

Das ging doch schon beim P10. AFAIK wurde dafür aber nie eine Extension veröffentlicht.

del_4901
2004-04-20, 18:31:08
Original geschrieben von ow
Sei dir da mal nicht so sicher. Die Geometrieleistung der NV40 ist ebenfalls sehr hoch.
An Leistung uebertroffen im CAD Bereich hat NV jedenfalls schon lange keiner mehr (allerdings ist Leistung in diesem Anwendungsgebieten eher sekundaer, da zaehlt mehr die Qualitaet dessen, was gerendert wird).

Gerendert wird eh Offline.
Auf die Geometrieleistung kommt es schon an, denn wenn du eine RiesenSzene im Viewport darstellen willst, gehen ganz schnell die Graka's in die Knie, so das Arbeiten unmöglich wird.

Ansonnsten stimm ich mit dir überein, das der Quadro NV40 den P20 in die Schranken weisen wird. Seid der Quadro FX hängt sich Nvidia Extrem rein in dieses Segment des Marktes. Es gibt inzwischen viele Plugins für die FXen. Bei der Unterstüzung durch CAD Programme bzw. Funtionsumfang befinden sich beide Firmen etwa auf gleichem Level, welcher Chip aber schneller sein wird sollte klar sein.

Außerdem meinte Carmack schon, das man mit PS3.0 Rendermanshader in HW laufen lassen kann. Sollte ein entsprechendes Plugin auf den markt kommen, (Nvidia arbeitet bestimmt schon fieberhaft daran) dann ist für 3dLabs der Zug abgefahren, denn bis heute versteht der P10 keine Rendermanshader, was eigendl. bei seiner Präsentation damals versprochen wurde.

Quasar
2004-04-20, 18:45:57
Original geschrieben von zeckensack
Ja natürlich. Steht doch auch in dem lustigen Diagramm. Das ist IMO sogar das coolste an der "VPU". Programmierbares Blending =)

Tatwahrhaftig, völlig übersehen....
*Brille_such*

Original geschrieben von Demirug
Ja, und das was bei DX Pixelshader heisst nennt 3dlabs Fragmentshader.

Ja, das war mir aufgefallen. Fragment steht allgemein in OpenGL für Pixel, gell?

Demirug
2004-04-20, 18:48:24
AlphaTier, schau mal dort: http://film.nvidia.com/page/gelato.html

del_4901
2004-04-20, 18:58:59
Original geschrieben von Demirug
AlphaTier, schau mal dort: http://film.nvidia.com/page/gelato.html
der Zug für 3dLabs ist abgefahren! Und zwar gestern schon.

RLZ
2004-04-20, 20:10:24
Original geschrieben von AlphaTier
der Zug für 3dLabs ist abgefahren! Und zwar gestern schon.

Abwarten und Tee trinken.
Die Geschwindigkeit unter DX oder OpenGL sagt nicht unbedingt viel über die Geschwindigkeit bei Offline-Rendering aus.
Dort werden imo irgendwann spezialisiertere Chips durchsetzen...

marco42
2004-04-20, 22:08:18
Original geschrieben von Demirug
Ja, und das was bei DX Pixelshader heisst nennt 3dlabs Fragmentshader.

AFAIK ist das OpenGL Terminologie, DX nennt ein Fragment einfach nur Pixel, was IMHO irrefuehrend ist.

marco42
2004-04-20, 22:17:08
Original geschrieben von AlphaTier
der Zug für 3dLabs ist abgefahren! Und zwar gestern schon.

Wenn 3DLabs hardware noise unterstuetzt, dann sieht das wieder ganz anders aus. Ich habe da jetzt nichts gefunden, ausser ein paar Geruechten. Renderman ohne noise ist einfach sehr eingeschraenkt.