NV40 - wie viele "effektiven" Transistoren und wieviel Cache? [Archiv]

PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : NV40 - wie viele "effektiven" Transistoren und wieviel Cache?

huha

2004-04-17, 01:09:28

Morgen!

Ich hab über die Suche auf die Schnelle nichts wirklich brauchbares gefunden, man verzeihe mir, wenn die Frage schonmal gestellt worden ist.

Da ich mich über die doch recht hohe Transistoranzahl des NV40 wundere, wollte ich fragen, ob bekannt ist, wieviele Transistoren von Recheneinheiten und wieviele nur von Cache gestellt werden. Viele Transistoren schön und gut, nur ich vermute, daß der NV40 vor allem eine gigantische Menge Cache hat und die Anzahl der "effektiven" Transistoren (aka Recheneinheiten etc.) gar nicht so viel über denen der vergangenen Generation liegt.

Kann das jemand bestätigen/widerlegen/etc?
Ist wirklich pure Spekulation meinerseits.

-huha

Godmode

2004-04-17, 01:13:41

Also die Anzahl der Trasistoren die für Recheneinheiten nötig sind, sind extrem gestiegen. Alleine schon die Verdoppelung der Pipes. Dann kommen noch die ganzen Shaderoptimierungen...

Also es ist schon mehr Cache drinnen, aber ich denke mal nicht zu vergleichen mit der Größe von L2 Caches in CPUs

drmaniac

2004-04-17, 14:22:35

hmmm

eine GraKa hat doch keinen "Cache" ?

Es wird mal später welche geben mit embedded ram, diese Karten werden dann SAU schnell sein, aber der wird wohl nicht mehr als 512k - 8mb werden am Anfang... das dauert aber noch ein paar Jahre... und diesen Ram... könnte man dann dazu Cache sagen ?

cu

Mehrpack

2004-04-17, 14:32:35

Original geschrieben von drmaniac
hmmm

eine GraKa hat doch keinen "Cache" ?

Es wird mal später welche geben mit embedded ram, diese Karten werden dann SAU schnell sein, aber der wird wohl nicht mehr als 512k - 8mb werden am Anfang... das dauert aber noch ein paar Jahre... und diesen Ram... könnte man dann dazu Cache sagen ?

cu

hi,
natürlich haben die grafikkarten kleine zwischenspeicher, die man durchaus als cache bezeichen kann.
bloss sind diese meistens nicht annähernd so gross wie der L1 cache von den meisten CPU`s und garnicht erst so gross wie der L2 cache der CPU`s.

Mehrpack

Neo69

2004-04-17, 16:04:02

ja also ich glaube der Anteil der Caches an den Transistoren ist sehr gering. Meine was von 8 kib beim NV40 gehört zu haben, das wären ja nur ein paar tausend - aber ich weiß es nicht genau.

Auf jeden Fall nicht zu vergleichen mit CPUs, wo ja teilweise (etwa beim Dothan) schon ein drittel und mehr auf die Caches entfällt.

BlackBirdSR

2004-04-17, 18:23:37

[B]
Auf jeden Fall nicht zu vergleichen mit CPUs, wo ja teilweise (etwa beim Dothan) schon ein drittel und mehr auf die Caches entfällt.

1/3??

Der Cacheverschlingt bei modernen CPUs schon länsgt ein Vielfaches der Transistorzahl des Cores selbst.

MarioK

2004-04-17, 19:16:47

liest hier nimand aths artikel zum NV40?

http://www.3dcenter.org/artikel/nv40_technik/index3.php

"Der NV40 hat ein Two-Level-Cache System. Der L2-Cache kann von jeder Quad-Pipeline genutzt werden. Wir schätzen die Größe des L2-Caches auf 8 kib. Jede Quad-Pipeline hat noch seinen eigenen L1-Cache. Der L2-Cache kann noch komprimierte Texturen speichern, diese werden bei der Übertragung in den L1-Cache dekomprimiert. Der ingesamt recht großen Cache erhöht natürlich die Transistor-Zahl, aber hilft den Einfluss der Speicherbandbreiten-Limitierung zu minimieren."

also aths fragen für fehlende L1-Cache große schätzung und schön hat man ein grobeß wert ...

aths

2004-04-17, 19:21:54

Original geschrieben von huha
Morgen!

Ich hab über die Suche auf die Schnelle nichts wirklich brauchbares gefunden, man verzeihe mir, wenn die Frage schonmal gestellt worden ist.

Da ich mich über die doch recht hohe Transistoranzahl des NV40 wundere, wollte ich fragen, ob bekannt ist, wieviele Transistoren von Recheneinheiten und wieviele nur von Cache gestellt werden. Viele Transistoren schön und gut, nur ich vermute, daß der NV40 vor allem eine gigantische Menge Cache hat und die Anzahl der "effektiven" Transistoren (aka Recheneinheiten etc.) gar nicht so viel über denen der vergangenen Generation liegt. Wo sollte man die ganzen neuen Features unterbringen, von den massiv parallelen Pipes ganz zu schweigen? Auch der NV40 wird, an der Logik gemessen, kaum Cache haben. (Konkrete Zahlen geben die Entwickler wohl eh nicht raus.)

Frank

2004-04-17, 19:30:57

Original geschrieben von drmaniac
Es wird mal später welche geben mit embedded ram, diese Karten werden dann SAU schnell sein, aber der wird wohl nicht mehr als 512k - 8mb werden am Anfang... das dauert aber noch ein paar Jahre... und diesen Ram... könnte man dann dazu Cache sagen ?
Grafikchips mit Embedded Ram gibt es schon eine halbe Ewigkeit. Da hilft ein Blick zu den mobilen Vertretern - speziell Neomagic hat ausschliesslich auf Embedded Speicher gesetzt. Bis zu 6MB und 256bit Speicherinterface - und das '98. :D

Gast

2004-04-17, 21:07:25

Original geschrieben von aths
Wo sollte man die ganzen neuen Features unterbringen, von den massiv parallelen Pipes ganz zu schweigen? Auch der NV40 wird, an der Logik gemessen, kaum Cache haben. (Konkrete Zahlen geben die Entwickler wohl eh nicht raus.)

Hmm, soweit ich mich erinnere...

also beim NV25 war mal auf EETimes von so 12,5Mio Transistoren für Cache die Rede, also so ca. 256KB SRAM ( bei 6Transistoren pro Speicherzelle ). Bei insgesamt 63 Mio ist das schon ein nennenswerter Anteil.

Hochgerechnet auf den NV40 (16/4) wäre das dann 1MB Cache. Ich denke nicht, das der NV40 geanu 1MB hat aber der Anteil an SRAM wird trotzdem nicht viel kleiner sein. 1MB wären so 50Mio Transistoren, bei insgesamt 222Mio also nicht einmal 23%, imho durchaus realistisch.

Sorry, kein Link trotz Suche

aths

2004-04-18, 00:13:08

Original geschrieben von Gast
Hmm, soweit ich mich erinnere...

also beim NV25 war mal auf EETimes von so 12,5Mio Transistoren für Cache die Rede, also so ca. 256KB SRAM ( bei 6Transistoren pro Speicherzelle ). Bei insgesamt 63 Mio ist das schon ein nennenswerter Anteil. Der schematische Floorplan der mir vom NV25 vorliegt, verzeichnet eigentlich gar keinen Cache :| wahrscheinlich, weil der insgesamt zu wenig Fläche beansprucht.

Gast

2004-04-18, 13:04:32

So wenigstens eine sekundäre Quelle vom 17.Juni 2002 von Adrian Lumens (sp?) auf Beyond3D gefunden :

IIRC, Nvidia claims that 78% of the transistors in Geforce4 are logic, presumably leaving the rest for cache/buffer SRAMs. With a total of 63 million transistors, that would be about 13.8 million transistors' worth of SRAM. Assuming 8.5 transistors per bit (a typical number for dual-port SRAM cells + some overhead), we end up at ~200 KBytes of on-chip SRAM. Now, exactly what this SRAM is used for is unknown (and Nvidia presumably won't tell us), so any guesses on what they are must be speculative of nature. Much of it is probably texture cache, which would need to be replicated up in order to feed that many pipelines/texture units; there would likely be vertex and framebuffer caches in the design as well, and probably a bunch of other stuff only known to Nvidia themselves.

Gr... den direkten Link finde ich immer noch nicht. Ich hoffe das reicht.

Gast

2004-04-18, 13:24:08

Endlich....lang genug hat es gedauert :

http://www.eedesign.com/story/OEG20020612S0051

The session began with one of the densest commercial chips produced to date. Chris Malachowski, vice president of engineering at Nvidia, described the GeForce 4, the latest in that company's line of high-end graphics chips. At 63 million transistors and a core clock frequency of 300 MHz, the chip is ambitious by any measure. But considering that 78 per cent of the die is logic places the undertaking in perspective.

und hier ist sogar noch die direkte Bestätigung von Nvidia :

http://vlsicad.ucsd.edu/~abk/TALKS/dac2002_session26_malachowsky.pdf

Seite 3 und 4

Where Did all the Transistors Go ?

x Logic : 78% of die
x Memory : 20% of die
x DACs/PLLs : 2 % of die

MarioK

2004-04-18, 14:14:17

Mann muß zwischen Caches (L1,L2,L3?) und logic/memory/PLL trennen!

memory = Caches + Cache L0 (ja alle register!) + alle buffers (vertex, texture, frame, z, crossbars, stacks, 'slowpath', fastpath, sync ...)

also orginall frage ging um Caches ...

huha

2004-04-18, 15:03:37

Ich persönlich als Laie vermute eben, daß zukünftige Graphikprozessoren einen höheren Cache-Anteil als frühere Graphikprozessoren haben werden.
Ich begtünde das darauf, daß die GPU immer mehr zur Hilfs-CPU mutiert, was ja dank Shadern und dem ganzen Zeug ;) möglich ist. Dafür braucht man weniger fest verdrahtete Algorithmen, sondern flexiblere Einheiten und mehr Cache.
Soweit meine persönliche Annahme/Spekulation/etc., ich muß aber sagen, daß ich mich nicht wirklich damit auskenne.

-huha

aths

2004-04-18, 17:41:11

Original geschrieben von Gast
Endlich....lang genug hat es gedauert :

http://www.eedesign.com/story/OEG20020612S0051

und hier ist sogar noch die direkte Bestätigung von Nvidia :

http://vlsicad.ucsd.edu/~abk/TALKS/dac2002_session26_malachowsky.pdf

Seite 3 und 4 Klingt interessant. Werde das Thema mal mit auf die Liste nehmen, was ich Nvidia noch fragen will :)