PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zum Artikel "ATi RV250 + R300 und nVidia NV30 Spezifikationen"


Leonidas
2002-07-13, 23:58:36
http://www.3dcenter.org/artikel/2002/07-14_a.php


Eigentlich war ein weiterer Spec-Artikel nicht so schnell geplant, jedoch hatten die bisherigen Artikel aus heutiger Sicht einige Fehler, so daß ich da einfach noch eine korrigierte und aktualisierte Version hinterherschieben mußte.




/edit 14.7., 19:35
Bei den Textureneinheiten der RV250 (2) ein Fragezeichen gesetzt. Es gibt mittlerweile den begründeten Verdacht, daß es nur eine Textureneinheit pro Pipeline ist.

/edit 14.7., 19:55:
Ebenfalls bei R300 und NV30 die Anzahl der Textureneinheiten auf "2" mit Fragezeichen gesetzt, da auch diese Angaben letztlich nicht wirklich sicher sind.

/edit 15.7., 01:30:
Aus 16 Texturen per pass bei R300 und NV30 "8" gemacht. War ein Lesfehler unsererseits. Thx @ Demirug.

/edit 15.7., 20:25:
Bei der Stufe des anisotropen Filters der R300 "16x (?)" anstatt eines reinen Fragezeichens eingesetzt. Quelle: The Inquirer

/edit 18.7.:
Gemäß den Launchdaten von RV250 und R300 aktualisiert. Bei der NV30 das Interface auf "128 oder 256 Bit" gesetzt.

Demirug
2002-07-14, 08:38:09
"16 Texturen per pass (Mindestforderung von DirectX9)"

Würde zu gerne wiesen wer das wieder aufgebracht hat. Korrekt muss das wohl wie folgt lauten.

8 Texturen mit jeweils 2 Zugriffen per pass (Mindestforderung von DirectX9)

Es ist natürlich nicht auszuschliessen das wirklich 16 Texturen pro Pass unterstützt werden da man aber mit DX9 nichts davon hätte dürfte das mit der "Mindestforderung" nicht ale Begründung verwendet werden.

Quasar
2002-07-14, 09:37:07
IMO könnte man sich das nichtssagende "Teile von DX9 bzw. OpenGL 2.0" sparen. Sogar eine TNT1 kann Teile von DX9 und OpenGL 2.0.

Ansonsten ein feiner Überblick, auch wenn ich bezgl. des RV250 ganz und gar nicht mit den derzeit vermuteten Specs übereinstimme (-> Beyond3D)

-keine Erwähnung von Hyper-Z in der geleakedten Spec
-trotz höherer Takte niedrigere Leistung
-deutlich niedrigere TnL-Leistung (nur noch 50MPoly/s)
-höherer Integrationsgrad
-bei sehr hohen Taktraten angeblich noch passiv kühlbar
--------------------------------------------------------

2-Pipe Design, keine separate DX7-TnL-Einheit mehr (nur noch der Shader), kein Hyper-Z mehr (bei 2Pipes und der Speichertaktrate eh Verschwendung), ca. 40-45MTransis.

So zumindest meine Vermutung.

BNO
2002-07-14, 10:06:56
Zum R300 Herstellungsprozess. Es ist inzwischen bekannt, dass die R300 bis November in 0,15µ gefertigt wird und TSMC dann auf den 0,13µ Herstellungsprozess umsteigen wird.

Leonidas
2002-07-14, 12:48:04
Originally posted by Quasar


2-Pipe Design, keine separate DX7-TnL-Einheit mehr (nur noch der Shader), kein Hyper-Z mehr (bei 2Pipes und der Speichertaktrate eh Verschwendung), ca. 40-45MTransis.



Das ist eine absolut logische Annahme, von der ich auch ausgegangen bin. Nur leider definitiv falsch. Es ist *definitiv* ein 4-Pipe-Design.

Leonidas
2002-07-14, 12:48:57
Originally posted by BNO
Zum R300 Herstellungsprozess. Es ist inzwischen bekannt, dass die R300 bis November in 0,15µ gefertigt wird und TSMC dann auf den 0,13µ Herstellungsprozess umsteigen wird.



Information von jemand, der nah an dieser Produktion steht: Setzt mal da nicht zu früh auf einen Wechsel auf 0.13 ...

StefanV
2002-07-14, 13:04:10
Originally posted by Leonidas

Information von jemand, der nah an dieser Produktion steht: Setzt mal da nicht zu früh auf einen Wechsel auf 0.13 ...

Jo, wenn man sieht, wieviel Probleme AMD mit 0,13µ hatte...

Nur ist für AMD 0,13µ erstens wichtiger und 2. dürften sie wohl mit anderen Firmen, die dran arbeiten recht eng zusammenarbeiten.

Ist TMSC nicht auf sich allein gestellt??

egdusp
2002-07-14, 13:04:31
Originally posted by Leonidas




Information von jemand, der nah an dieser Produktion steht: Setzt mal da nicht zu früh auf einen Wechsel auf 0.13 ...

Du beziehst dich hoffentlich nur auf den R300 und nicht den NV13.

Ich glaube, dass der aktuelle VIA Prozessor bei TSMC bereits in .13 gefertigt wird. Spekulation: Die 107 mio Transistoren des R300 sind noch zuviel für diesen Prozeß, der NV30 wird aber 2 Chips á 50-80 mio Transistoren (grobe Schätzung)haben und sich deswegen früher in .13 fertigen lassen.

Demirug
2002-07-14, 13:26:20
Originally posted by egdusp
der NV30 wird aber 2 Chips á 50-80 mio Transistoren (grobe Schätzung)haben und sich deswegen früher in .13 fertigen lassen.

Was habt ihr immer wieder mit dieser 2 Chip Lösung??? IMO ist das sehr unwahrscheinlich. Das ganze würde sich nur dann lohnen wenn man die mehrkosten durch eine bessere ausbeute kompensieren könnte und das glaube ich nicht.

StefanV
2002-07-14, 13:39:49
Originally posted by egdusp
Du beziehst dich hoffentlich nur auf den R300 und nicht den NV13.

Ich glaube, dass der aktuelle VIA Prozessor bei TSMC bereits in .13 gefertigt wird. Spekulation: Die 107 mio Transistoren des R300 sind noch zuviel für diesen Prozeß, der NV30 wird aber 2 Chips á 50-80 mio Transistoren (grobe Schätzung)haben und sich deswegen früher in .13 fertigen lassen.

1. R300 und NV30 werden beide von TMSC gefertigt.
Warum soll das dann nur auf den R300 zutreffen??

2. schön, gibt nur ein 'kleines' Problem:

VIA C3->ca. 9 MIO Transistoren, NV30/R300 'etwas' über 90 MIO Transistoren...

ein 'kleiner' Unterschied, oder?

3. denke ich eher nicht...

Quasar
2002-07-14, 13:46:56
Originally posted by Leonidas
Das ist eine absolut logische Annahme, von der ich auch ausgegangen bin. Nur leider definitiv falsch. Es ist *definitiv* ein 4-Pipe-Design.

Hm, dann will ich dir das mal glauben, auch wenn ich bisher nur immer selbstgemalte Productspecs gesehen habe, die ebenfalls von einem 4Pipe-Design ausgehen.

Schaun mer mal, was ATi stattdessen abgesäbelt hat, um den RV250 ineffektiver als den R200 zu machen.

Exxtreme
2002-07-14, 13:50:18
Originally posted by Quasar
Schaun mer mal, was ATi stattdessen abgesäbelt hat, um den RV250 ineffektiver als den R200 zu machen.
Wer sagt denn, daß der RV250 langsamer/ineffektiver als der R200 ist? Auf die Benches, die im R3D-Forum gepostet wurden, würde ich vorerst nicht viel geben. Am besten man wartet den offiziellen Vorstellungstermin ab, dann dürften nämlich "seriöse" Testberichte zeigen, was Sache ist.

Gruß
Alex

Quasar
2002-07-14, 14:16:28
Momentan sind das aber die einzigen Hinweise, die es auf die Performance gibt, dazu die spekulierte Triangle-Rate von "nur" noch 50Millionen/s und das auffällige Nichterwähnen von Hyper-Z in einigen (von mir zwar als unglaubwürdig erachteten) Specsheets.

Wenn es denn ab 17.7 den RV250 in ausreichenden Mengen zu kaufen gäbe und er mind. genausoschnell wie der R200 wäre, wie sollten die Hersteller dann ihre Restbestände loswerden?

zeckensack
2002-07-14, 14:30:57
Originally posted by Demirug


Was habt ihr immer wieder mit dieser 2 Chip Lösung??? IMO ist das sehr unwahrscheinlich. Das ganze würde sich nur dann lohnen wenn man die mehrkosten durch eine bessere ausbeute kompensieren könnte und das glaube ich nicht. Falls die Informationen auf 3DChipset authentisch waren, dann werden es drei Chips. Ich halte das grundsätzlich auch für doof, es mag unter den Umständen (Produktionslage komplexer Chips) eine sinnvolle Übergangslösung sein.

zeckensack
2002-07-14, 14:33:47
Originally posted by Quasar
Wenn es denn ab 17.7 den RV250 in ausreichenden Mengen zu kaufen gäbe und er mind. genausoschnell wie der R200 wäre, wie sollten die Hersteller dann ihre Restbestände loswerden? Über den Preis natürlich. Seit ca zwei Monaten werden die R200-Karten stetig billiger. Der Abverkauf dieser 'Restbestände' hat längst begonnen.

Man mag das teileweise auf die starke Konkurrenz durch die Ti4200 schieben, aber ein kurz bevorstehender Ersatzchip würde das auch ganz gut erklären.

Leonidas
2002-07-14, 14:39:10
Originally posted by egdusp


Du beziehst dich hoffentlich nur auf den R300 und nicht den NV13.




Bzgl 0.13: Ja.

Demirug
2002-07-14, 14:41:40
Originally posted by zeckensack
Falls die Informationen auf 3DChipset authentisch waren, dann werden es drei Chips. Ich halte das grundsätzlich auch für doof, es mag unter den Umständen (Produktionslage komplexer Chips) eine sinnvolle Übergangslösung sein.

Naja bei 2 Chips wäre ich unter umständen ja noch bereit das zu glauben aber 3? Möglicherweise handelt es sich dabei ja um Zusatzchips um mit einem NV30 eine Multimedia (Sound, Video-IN, usw.)Karte zu bauen. Dann könnte man aus den Erkenntnisse von NForce und XBox noch ein bischen mehr Gewinn schlagen.

Unregistered
2002-07-14, 15:18:57
Die Informationen zu NV18 und NV28 ("reine AGP-8x-Versionen von NV17 und NV25 ohne weitere Änderungen") scheinen so nicht ganz zu stimmen, wenn man dieser Quelle Vertrauen schenkt:

http://www.nvnews.net/#1026494900

Mit jeweils mehr als 80 Millionen Transistoren (gegenüber bisher 29 bzw. 63 Millionen) dürfte sich bei diesen Chips einiges gegenüber den "Vorgängern" getan haben...
Aber was? Darüber läßt sich sicher herrlich spekulieren. ;) Vielleicht will nVidia den mit dem NV17 gemachten Fehler, dem Massenmarkt keine DirectX-8-Funktionen zu gönnen, nicht wiederholen und stattet die neuen Budget- und Midrange-Chips jetzt schon mit DX9-Funktionen aus, wie sie auch der große Bruder NV30 erhält...?

Nur eine von vielen Möglichkeiten... :)

zeckensack
2002-07-14, 16:17:52
@Unreg, die Quelle für diese >80Mio Transistoren dürfte eine etwas schlecht leserliche (weil stark verkleinerte) Serie von Präsentationsfolien sein. Siehe dazu unser Graka-Forum.

@Leo,
Mir ist noch was zum R300 eingefallen. Du schreibst, er wird 8 Pipes haben, was eine bekannte Annahme ist, andererseits daß er nur ein 128 bit Interface hat.

Sorry, aber das halte ich für absolut unglaubwürdig.

8 Pixelpipes produzieren im Idealfall bei 32bit Farbtiefe&Z-Buffer einen Output von 512Bit pro Takt. Dies würde bereits ein gleichgetaktetes 256bit DDR-Interface vollständig auslasten. Dann ziehen wir ein paar Prozent ab, weil bei kleinen Dreiecken nicht immer alle Pipelines gleichzeitig arbeiten und rechnen ein paar (mehr) Prozente wieder drauf, für Lesezugriffe (hauptsächlich Texturen und Z-Traffic).

Die Erkenntnis, die sich einstellen sollte: 8 Pipes mit 128bit-DDR wäre extrem bandbreitenlimitiert und damit unausgewogen, es sei denn, der Speicher ist mindestens doppelt so schnell getaktet wie der Chip, besser zweieinhalb mal so schnell. Das ist IMO noch schwieriger, als die Interfacebreite zu verdoppeln.

Ich glaube nicht, daß der R300 als 16bit-Benchmark-König geplant ist (das wäre er mit 128bit DDR, aber mehr auch nicht). Ich glaube viel eher, daß die Quellenangabe "400MHz RAM-Takt", die du als Begründung gennant hast ähnlich zu verstehen ist wie bei Matrox:
Bei der Chipvorstellung wurden Bandbreitenzahlen bis zu blablabla genannt, die mit ein wenig Rechnerei 325MHz Speichertakt ergeben hätten. Daß dieses Versprechen von den Retailkarten nicht eingehalten wird, ist mittlerweile bekannt, trotzdem kann man Matrox nicht der Lüge beschuldigen, weil es damals um einen Chip und dessen theoretischen Maximaltakt am Speichercontroller ging.

Wenn dir 400MHz bei 256bit DDR zu unwahrscheinlich aussehen, wie wäre es dann mit 275~300MHz? :)

Exxtreme
2002-07-14, 16:41:35
@ zeckensack
Du vergisst eine Sache und zwar das SuperSampling FSAA. Irgendwo im R3D-Forum habe ich gelesen, daß ATi SmoothVision2 als das qualitativ höchstwertige FSAA bewerben wird und das einzig machbare ist z.Zt. SSAA. Und da wirkt der Füllratenüberschuss sehr wohl.

Gruß
Alex

zeckensack
2002-07-14, 16:52:15
Originally posted by Exxtreme
@ zeckensack
Du vergisst eine Sache und zwar das SuperSampling FSAA. Irgendwo im R3D-Forum habe ich gelesen, daß ATi SmoothVision2 als das qualitativ höchstwertige FSAA bewerben wird und das einzig machbare ist z.Zt. SSAA. Und da wirkt der Füllratenüberschuss sehr wohl.

Gruß
Alex Sorry, aber verbrät Supersampling nicht genausoviel Framebuffer (und damit Bandbreite) wie garkein FSAA in höherer Auflösung?

Ich kenne mich zugegeben mit den technischen Details nicht sonderlich aus, schon garnicht mit NVIDIA's Multisampling-Technik, aber bei Supersampling bin ich mir ziemlich sicher, daß man passend zur Füllrate auch die entsprechende Bandbreite braucht, sonst wird das nichts.

Exxtreme
2002-07-14, 16:57:04
Originally posted by zeckensack
Sorry, aber verbrät Supersampling nicht genausoviel Framebuffer (und damit Bandbreite) wie garkein FSAA in höherer Auflösung?

Doch schon, nur das tut MultiSampling auch. MSAA zieht fast genauso viel Bandbreite wie SSAA nur es frisst wenig Füllrate weil die Anzahl der gefilterten Pixel deutlich kleiner ist als beim SSAA da ausschliesslich Kanten geglättet werden und nicht zusätzlich die Texturen.

Gruß
Alex

Demirug
2002-07-14, 17:02:17
Von der Bandbreite für das schreiben des Framebuffers gibt es beim SuperSampling und Multisampling keinen Unterschied.

Der Unterschied liegt darin das beim Supersampling jedes Sample komplett durch die Pipeline läuft. Beim Multisampling dagagen wird für alle Samples nur einmal die Pipeline für den RGBA Wert durchlaufen. Lediglich die Z und Stencilwerte werden pro Sample berechnet. Desweiteren wird natürlich geprüft welche der Samples von dem Dreieck auch wirklich abgedeckt werden.

Ich beschäftige mich gerade theoretisch mit einem neuen AA Verfahren welches die Vorteile von FAA und dem Multisample AA von NVidia vereint.

AlfredENeumann
2002-07-14, 18:23:14
Du gehst in deinem Bericht davon aus, das der RV250 der Nachfolger des R200 werden soll. Das was ich bisher so an gerüchten und Fakten aufgeschnappt habe, läßt aber eher darauf schließen das der RV250 den RV200 ablöst.
Wichtigster Punkt ist: Der RV250 ist PIN-Kompatibel zum RV200, der R200 aber nicht !!!
Zum anderen die verschiedenen Speichervariationen wie man sie vom RV200 kennt, sprich für den Office-Bereich (Besonders die Passivgekühlten RV250-Karten).

zeckensack
2002-07-14, 18:40:32
Originally posted by Exxtreme

Doch schon, nur das tut MultiSampling auch. MSAA zieht fast genauso viel Bandbreite wie SSAA nur es frisst wenig Füllrate weil die Anzahl der gefilterten Pixel deutlich kleiner ist als beim SSAA da ausschliesslich Kanten geglättet werden und nicht zusätzlich die Texturen.

Gruß
Alex Hmmm ...

Aber der Grundgedanke, daß 8 Pipes für ein 128bit DDR-Interface zuviel sind, wird doch von Supersampling nicht beeinflusst ???

Es ist doch dann quasi das gleiche, als würde ich in eine höhere Auflösung rendern. Das Mißverhältnis Bandbreite/Füllrate verschiebt sich dadurch kein Stück.

Und wenn ich das richtig verstanden habe (*hoff*), würde es durch MSAA eher noch schlimmer, weil's im Verhältnis zur verbrauchten Füllrate noch mehr Bandbreite braucht ???

Also weiterhin: Ich glaube das mit dem 128bit-Interface nicht so recht.

AlfredENeumann
2002-07-14, 18:40:52
Hinzu kommt folgende Folie:

Es wird über verbesserungen gegenüber dem RV200 gesprochen, nicht vom R200.

zeckensack
2002-07-14, 19:19:46
Originally posted by zeckensack
Also weiterhin: Ich glaube das mit dem 128bit-Interface nicht so recht. Es gibt IMO zwei vorstellbare Varianten, aus dem R300 ein 'ausgewogenes' Produkt zu machen:

1)der helle Wahnsinn
RAM: 128bit DDR @ 450MHz
Chip @ 200~225MHz

1b)denkbar, gut machbar, aber nicht schnell genug, um überhaupt interessant zu sein
RAM: 128bit DDR @ 350MHz
Chip @ 150~175MHz

2)die entspannte Lösung
RAM: 256bit DDR @ 300MHz
Chip @ 250~300MHz

2b)Bei grösseren Problemen mit den Taktraten
RAM: 256bit DDR @ 250MHz
Chip @ 200MHz

Zur allgemeinen Belustigung hier nochmal die (theoretischen) Dual-Texturing-Füllraten dazu:
Radeon 1 @ 166MHz -> 333MPixel/s
Radeon 7500 @ 270MHz -> 540MPix/s
Radeon 8500 LE @ 250MHz -> 1000MPix/s
Variante 1 -> 1600~1800MPix/s
Variante 1b -> 1200~1400MPix/s
Variante 2 -> 2000~2400MPix/s
Variante 2b -> 1600MPix/s

ATi hat irgendwann mal gesagt, man wolle ähnlich wie beim letzten Versionsprung die Rundum-Leistung verdoppeln. Nachzulesen in einem Interview auf reactorcritical.com.

Comments?

Exxtreme
2002-07-14, 19:27:18
Also ich glaube am ehesten an die Variante 2. Chip & RAM @ 300 MHz mit 256 Bit Speicherinterface. Shit, diesmal kein "little birdie" in der Nähe. :(

Gruß
Alex

Leonidas
2002-07-14, 19:37:55
Originally posted by zeckensack
Ich glaube nicht, daß der R300 als 16bit-Benchmark-König geplant ist (das wäre er mit 128bit DDR, aber mehr auch nicht). Ich glaube viel eher, daß die Quellenangabe "400MHz RAM-Takt", die du als Begründung gennant hast ähnlich zu verstehen ist wie bei Matrox:
Bei der Chipvorstellung wurden Bandbreitenzahlen bis zu blablabla genannt, die mit ein wenig Rechnerei 325MHz Speichertakt ergeben hätten.


Nein. Die 400 MHz errechnen sich nicht, ATi schreibt diese exakt so in seiner Roadmap. Ich glaube dort nicht an Interface-Verdopplung, da ATi nicht einmal DDR-Verdopplung einsetzt. Link zur ATi-Roadmap bei den Quellen.




ATi schreibt in seiner Roadmap 350/400 MHz. Die 350 halten sie fast ein mit 315 MHz Chiptakt, also gehe ich auch davon aus, daß der Speichertakt halbwegs stimmen wird.

D.h. entweder 350-400 MHz mit 256 Bit Interface oder 350-400 MHz mit 128 Bit Interface. Und zwischen diesen beiden ist die logische Wahl das letztere. Natürlich - wenn man 250-300 MHz mit 256 Bit Interface mit zur Wahl "zuläßt", dann wäre diese die logischste Entscheidung. Nur dies steht IMO nicht zur Debatte.

Leonidas
2002-07-14, 19:40:51
Originally posted by AlfredENeumann
Du gehst in deinem Bericht davon aus, das der RV250 der Nachfolger des R200 werden soll. Das was ich bisher so an gerüchten und Fakten aufgeschnappt habe, läßt aber eher darauf schließen das der RV250 den RV200 ablöst.
Wichtigster Punkt ist: Der RV250 ist PIN-Kompatibel zum RV200, der R200 aber nicht !!!
Zum anderen die verschiedenen Speichervariationen wie man sie vom RV200 kennt, sprich für den Office-Bereich (Besonders die Passivgekühlten RV250-Karten).





Ich bin da von der technischen Seite rangegangen und danach ist RV250 fast eine R200. ATi sieht das natürlich aus dem Betrachtungswinkel des Herstellers und da ersetzt der RV250 den RV200 im Mainstream-Markt.

AlfredENeumann
2002-07-14, 19:50:56
Originally posted by Leonidas




Ich bin da von der technischen Seite rangegangen und danach ist RV250 fast eine R200. ATi sieht das natürlich aus dem Betrachtungswinkel des Herstellers und da ersetzt der RV250 den RV200 im Mainstream-Markt.

Da hast du wohl recht.

Leonidas
2002-07-14, 20:29:21
Roadmap vom Juni 2002


http://www.myhard.com/20020617/ati_r300_2-a.jpg

zeckensack
2002-07-14, 20:39:54
Ok, bevor ich mich geschlagen gebe ... ?-)
Originally posted by Leonidas
Nein. Die 400 MHz errechnen sich nicht, ATi schreibt diese exakt so in seiner Roadmap. Ich glaube dort nicht an Interface-Verdopplung, da ATi nicht einmal DDR-Verdopplung einsetzt. Link zur ATi-Roadmap bei den Quellen.Die Angaben in der Roadmap sind halt sehr optimistisch. Standard-Disclaimer: Caution: this presentation may contain forward looking statements blahblah and my be completely wrong and misleading blahblah don't believe a word *eg*

Beim Shrink auf 0,13µ könnte das hinhauen, bis dahin dürften auch die schnellen Speicher massenhaft verfügbar sein. Solange der Shrink auch R300 heißt, hätte ATi nicht nur nicht gelogen (was der übliche Disclaimer sowieso erlaubt), sondern nichtmal übertrieben ;)

Originally posted by Leonidas
ATi schreibt in seiner Roadmap 350/400 MHz. Die 350 halten sie fast ein mit 315 MHz Chiptakt, also gehe ich auch davon aus, daß der Speichertakt halbwegs stimmen wird.

D.h. entweder 350-400 MHz mit 256 Bit Interface oder 350-400 MHz mit 128 Bit Interface. Und zwischen diesen beiden ist die logische Wahl das letztere. Natürlich - wenn man 250-300 MHz mit 256 Bit Interface mit zur Wahl "zuläßt", dann wäre diese die logischste Entscheidung. Nur dies steht IMO nicht zur Debatte. Nun, was ich oben schrieb, waren die Gedankengänge, die ich von den Kartenentwicklern erwarten würde. Die müssen sich im Vorfeld auch darüber im Klaren darüber sein, wie sie ihr Produkt am besten austatten. Was wir 'kleinen Menschen' nur empirisch erarbeiten können, das müssten diese Leute eigentlich im Blut haben und verstehen: der dickste und höchstgetaktete Chip bringt überhaupt nichts, wenn er nicht eine angemessene Bandbreite bekommt.

Nicht nur bei NVIDIA, sondern auch bei aktuellen ATI-Chips gilt generell: höherer Kerntakt bringt überhaupt nichts, wenn man nicht auch am Speichertakt dreht. Overclocking-Wissen :-)
Diese Chips haben 4 Pipes und 128bit breites DDRAM, und sind (wie das OC beweist) bandbreitenmäßig am Limit.

Warum sollte ATi jetzt einen Chip mit 8 Pipes bauen, bei dem die Bandbreite sowieso nur für 4 reicht? Wäre das nicht ein totaler Ingenieurs-Unfall???
Wenn ich als Laie auf solche Ideen komme, sollten die Ingenieure sich nicht das gleiche überlegt haben?

Deine Logik ist doch, daß uns ATi soviel Bandbreite nicht schenken will, weil's ein zu großer Sprung wäre. Nun, ich glaube derzeit auch nicht an die Machbarkeit von 256bit RAM deutlich über 300MHz, kann aber gleichzeitig auch nicht an eine solch starke Schieflage zwischen Bandbreite und Füllrate glauben.

Ich will mit dir nicht groß darüber streiten, wir werden es ja (hoffentlich) in ein paar Tagen ganz genau wissen, aber wenn das Teil mit 128bittigem RAM-Interface daherkommt, dann wäre ich ziemlich enttäuscht und würde ein paar Tage nur noch "Ich hab's doch gleich gesagt, daß das so nichts wird. So hätten die das machen müssen." durch die Gegend brüllen ;)

aths
2002-07-15, 00:58:14
Originally posted by Demirug
"16 Texturen per pass (Mindestforderung von DirectX9)"

Würde zu gerne wiesen wer das wieder aufgebracht hat. Korrekt muss das wohl wie folgt lauten.

8 Texturen mit jeweils 2 Zugriffen per pass (Mindestforderung von DirectX9)(Schäm) Da habe ich wohl das PDF falsch gelesen.

aths
2002-07-15, 01:01:17
zecki,

sowohl SS als auch MS á la NV verbrauchen gleichermaßen viel zusätzlichen RAM für den Framebuffer. (Das ist Anbetrachts des Downfilter-Algos für GF4 zwar nicht ganz korrekt, hier wird ein wenig mehr gebraucht, aber im Prinzip kommt es so hin.) FAA braucht hingegen weniger RAM.


Demirug,

meine Gedanken gingen bisher so weit: Wenn man nicht nur 1 Z-Test pro Pixel, sondern 3 (z.B. links oben, rechts oben, links unten im Pixel) vornimmt, sollte sich FAA mit nV-MSAA-Qualität machen lassen.

Leonidas
2002-07-15, 01:31:45
R300 hat nach neuesten Infos *eventuell* !!! nur eine Textureneinheit.

Demirug
2002-07-15, 07:29:29
Originally posted by aths
Demirug,

meine Gedanken gingen bisher so weit: Wenn man nicht nur 1 Z-Test pro Pixel, sondern 3 (z.B. links oben, rechts oben, links unten im Pixel) vornimmt, sollte sich FAA mit nV-MSAA-Qualität machen lassen.

Das ist bestandteil meiner Idee. Es ist allerdings noch ein bischen arbeit an anderen Stellen notwendig. Ich bin gerade am durchrechnen der verschiedehnen Varianten in wie weit sich dann FAA noch lohnt. Was ich aber noch nicht entgültig geklärt habe ist das AA für den Stencil.

Quasar
2002-07-15, 14:11:11
Originally posted by Leonidas
R300 hat nach neuesten Infos *eventuell* !!! nur eine Textureneinheit.

Skandal! ;) ;)

Wo hast du das her und für wie verläßlich hältst du deine Quelle?
Mit einer TMU könnte es auch bei 8 Pipes und 8xLoopback schwierig werden, einen Blumentopf zu gewinnen, es sei denn, diese Killer-TMU könnte gleich von sich aus in einem Pass anisotrop filtern.

Exxtreme
2002-07-15, 14:17:22
Originally posted by Quasar


Skandal! ;) ;)

Wo hast du das her und für wie verläßlich hältst du deine Quelle?
Mit einer TMU könnte es auch bei 8 Pipes und 8xLoopback schwierig werden, einen Blumentopf zu gewinnen, es sei denn, diese Killer-TMU könnte gleich von sich aus in einem Pass anisotrop filtern.
Hmm, der GC-Flipper hat auch nur eine TMU und die R300 ist vom ehem. ArtX-Team entwickelt worden. Ich denke, daß da Flipper-Technologie drinsteckt. Wenn diese TMU tatsächlich anisotrop filtern kann, dann wäre 8x-Loopback speedmässig kein Problem. Und hoffentlich kann die R300 auch triliner + anisotrop.

Gruß
Alex

Demirug
2002-07-15, 14:30:49
Also 8*1 ist bei gleicher Taktung auf jeden Fall besser als 4*2.

Leonidas
2002-07-15, 15:32:23
Originally posted by Quasar
Skandal! ;) ;)
Wo hast du das her und für wie verläßlich hältst du deine Quelle?


Sorry, no comment.

Exxtreme
2002-07-15, 15:35:54
@ Leo
Bekommst du vielleicht auch eine R300 zum Testen? Könnte ja klappen wie beim Parhelia.

Gruß
Alex

ow
2002-07-15, 16:22:12
Originally posted by Demirug
Also 8*1 ist bei gleicher Taktung auf jeden Fall besser als 4*2.


Aber auch nur, wenn der Memory Controller mitspielt, so dass die Pipes 'ausreichend' parallel arbeiten können.

Demirug
2002-07-15, 17:03:06
Originally posted by ow
Aber auch nur, wenn der Memory Controller mitspielt, so dass die Pipes 'ausreichend' parallel arbeiten können.

ow, selbst wenn du bei einem 8*1 Design den gleichen Controller wie bei 4*2 benutzt ginge die Sache im schlimmsten fall zu 0 aus. Mehr Pipes bedeuten aber eine bessere Pixelfillrate und mehr syncrone Early Z Tests. Wobei ich irgendwie den Verdacht nicht loswerden das bei der GeForce der Early Z nicht ausschliesslich in den Fragnebtpipelines durchgeführt wird. Irgendwie scheint das Trianglesetup da auch schon eine Rolle zu spielen.

Leonidas
2002-07-15, 17:23:57
Originally posted by Exxtreme

Bekommst du vielleicht auch eine R300 zum Testen? Könnte ja klappen wie beim Parhelia.




Ich hoffe es. Aber ich habe nach wie vor keine Beziehung zu ATi & nVidia, die der Größe dieser WebSeite angepasst ist.

Exxtreme
2002-07-16, 09:46:21
Originally posted by Leonidas
Ich hoffe es. Aber ich habe nach wie vor keine Beziehung zu ATi & nVidia, die der Größe dieser WebSeite angepasst ist.
Beantragt ist die Radeon9700 aber hoffentlich, oder? Ansonsten *mithoff*

Gruß
Alex

Leonidas
2002-07-16, 23:13:00
Beantragt ja, genauso wie NV30. Bekommen ist aber eine andere Sache.

Xmas
2002-07-17, 03:27:30
Originally posted by Demirug
Wobei ich irgendwie den Verdacht nicht loswerden das bei der GeForce der Early Z nicht ausschliesslich in den Fragnebtpipelines durchgeführt wird. Irgendwie scheint das Trianglesetup da auch schon eine Rolle zu spielen.
AFAIK wird der Early Z Test überhaupt nicht in der Fragment Pipeline durchgeführt, sondern davor. D.h. das sind relativ unabhängige Vorgänge und Early Z "arbeitet vor", so dass die Pipelines auch dann etwas zu tun haben, wenn in einem Takt mal alle 16 Pixel per Early Z verworfen werden.

Demirug
2002-07-17, 06:05:52
Originally posted by Xmas

AFAIK wird der Early Z Test überhaupt nicht in der Fragment Pipeline durchgeführt, sondern davor. D.h. das sind relativ unabhängige Vorgänge und Early Z "arbeitet vor", so dass die Pipelines auch dann etwas zu tun haben, wenn in einem Takt mal alle 16 Pixel per Early Z verworfen werden.

Ich denke mal das es zwischen dem dem TriSetup und den Fragment-Pipelines noch mal eine Pipeline gib welche aufgrund von EarlyZ einzelne Pixel verwerfen kann. Möglicherweise wird zuertst für 4*4 Blöcke dann für 2*2 und als letzte noch mal einzelne Pixel getestet. Das hätte zur folge das bei den Fragmentpipelines auch nur zum aktuellen Zeitpunkt wirklich sichtbare Pixel ankommen. Die größte Aufgabe dabei dürfte das finden der richtigen größe/lange der einzelen Pipes und caches sein.Leider verät NVIDIA da ja nicht so viel.