PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : nVidia - GF104 - Q2/2010 - und andere GF10x


Seiten : 1 2 [3] 4 5 6 7 8 9 10 11

Botcruscher
2010-05-26, 12:17:44
Der Die-Shot ist nur eine skalierte Version des GF100-Bildes.
Ein "bisschen" gestaucht. In der Realität leider so nicht möglich. Die Grafik können wir auf jeden Fall vergessen.
:freak: :redface:
Mich würde mal die geistige Befindlichkeit des Autors interessieren...

Gast
2010-05-26, 12:21:52
Eine schnellere Version wird es geben, wenn nVidia die GTX465 auslaufen lässt. Denn im Vollausbau ist man locker auf GTX470 Niveau, wenn man entsprechende Taktraten fährt.
Also mit dieser Konfiguration spielt man mehr als nur mit mit Cypress. Ist schon heftig, was sie als GF104 aufbieten...

LOL, selbst GF100 ist nur minimal über Cypress. Vermutlich kann man mal wieder nur Schrott verkaufen wegen verhunzten Design.

AnarchX
2010-05-26, 12:22:07
Ein "bisschen" gestaucht. In der Realität leider so nicht möglich. Die Grafik können wir auf jeden Fall vergessen.
16 SMs soll ein GF104 auch nicht haben.
Entweder sind es 4x1 + 4x1 oder 4x2 + 4x1, je nachdem wie die SMs aufgebaut sind.

Botcruscher
2010-05-26, 12:24:44
336SP im Vollausbau hört sich auf jeden Fall nicht schlecht an.

Spasstiger
2010-05-26, 12:25:41
Ergo ist auf TMU-Seite von 32 TMUs über 48 TMUs hin zu 64 TMUs alles denkbar.

336SP im Vollausbau hört sich auf jeden Fall nicht schlecht an.
Im Vollausbau 384 SPs und ein 256-Bit-SI. Die GTX 460 kommt wohl schon abgespeckt (336 SPs, 192 Bit SI).

/EDIT: Wenn ein SM 48 SPs hat, was ja die Reduzierung von 384 SPs auf 336 SPs bei der GTX 460 nahe legt, dann ist die 48-TMU-Variante eher unwahrscheinlich. Ergo wohl schon 64 TMUs. 32 TMUs wären etwas wenig für 384 SPs.

Vorsichtige Schätzung über die technischen Daten des GF104:
- 2*4 SMs mit je 48 SPs und 8 TMUs = 384 SPs + 64 TMUs insgesamt
- 4 ROP-SI-Partitionen = 256 Bit SI + 32 ROPs insgesamt
- 8 Tessellatoren
- 2 Raster-Engines
Mit 375 mm² ist das auf jeden Fall machbar. Und je nach Taktraten kann man damit auch mit ATIs Cypress bis rauf zur Radeon HD 5870 konkurrieren. Nur von 150 Watt TDP dürfte eine derart starke Variante weit entfernt sein.

LovesuckZ
2010-05-26, 12:26:15
LOL, selbst GF100 ist nur minimal über Cypress. Vermutlich kann man mal wieder nur Schrott verkaufen wegen verhunzten Design.

Ein GF100 ist ca. 28%, eine GTX480 ca. 20% schneller als Cypress. Ein GF104 mit dieser Konfiguration und 700Mhz sollte auf GTX470 Niveau liegen und damit auf 5850 bis 5870 Niveau. Also dort, wo Cypress ist.

Botcruscher
2010-05-26, 12:30:28
Im Vollausbau 384 SPs und ein 256-Bit-SI. Die GTX 460 kommt wohl schon abgespeckt (336 SPs, 192 Bit SI).
/EDIT: Wenn ein SM 48 SPs hat, was ja die Reduzierung von 384 SPs auf 336 SPs bei der GTX 460 nahe legt, dann ist die 48-TMU-Variante eher unwahrscheinlich. Ergo wohl schon 64 TMUs. 32 TMUs wären etwas wenig für 384 SPs.

Wir lassen uns mal überraschen. Fakt ist das man tunlichst die Finger von der 465 und 470 lassen sollte. Wenn der Verbrauch noch minimal besser wurde gehen die bald EOL.

AnarchX
2010-05-26, 12:32:33
/EDIT: Wenn ein SM 48 SPs hat, was ja die Reduzierung von 384 SPs auf 336 SPs bei der GTX 460 nahe legt, dann ist die 48-TMU-Variante eher unwahrscheinlich. Ergo wohl schon 64 TMUs. 32 TMUs wären etwas wenig für 384 SPs.
Die Vantage Füllrate mit 10xx sieht jedenfalls nach 56 TMUs @ 675MHz aus. Eine GTX 470 mit 56 TMUs @600MHz liegt bei ~ 950.

TDP der GTX 460 sollen wohl nur 130W sein.

Gast
2010-05-26, 12:34:16
Wir lassen uns mal überraschen. Fakt ist das man tunlichst die Finger von der 465 und 470 lassen sollte. Wenn der Verbrauch noch minimal besser wurde gehen die bald EOL.

Glaube ich nicht, so müsste ihre Schrottchips ja auch irgendwie an den Mann bringen. Ich sehe auch keinen Sinn in einem so starken GF104. Was will man damit? Da macht man sich nur selbst Konkurrenz. Ich glaube nach wie vor an einen halben GF100.

Sorkalm
2010-05-26, 12:37:36
So langsam wirds aber etwas konfus...

Halten wir mal fest: Die GTX 460 Spezifikationen von der Seite sollten was den Ausbau angeht korrekt sein. Bis auf die Information über den GF104-Chip decken sie sich mit der anderen chinesischen Quelle von gestern. Grade das eher unerwartete Speicherinterface seh ich als Indiez dafür.

Damit sollten 336 SPs, 192 Bit / 768 MiB RAM sowie die erwarteten Freuquenzen von 675/1350/1800MHz stimmen.


Und wenn 336 SPs korrekt sind, kann ein Cluster nicht aus 32 SPs bestehen. 24 oder 48 wären möglich, bei halt 8 oder 16 Clusten...
64 TMUs sehe ich damit auch als sicher an, nur 32 verpasst man dem Ding sicher nicht.


Aber interessante Frage: Welches native Speicherinterface hat der Chip? 192 Bit oder 256 Bit? Ein Vollausbau sollte der Chip mit 336 SPs nicht sein, aber die 256-Bit kommen aus den bisherigen Informationen die wohl nicht passen. Auch wenn ich eher 256 Bit vermute.


PS: Merkwürdig, dass auch GF104 mit (einem?) deaktivierten Shadercluster startet, wie GF100...

AnarchX
2010-05-26, 12:39:55
Aber interessante Frage: Welches native Speicherinterface hat der Chip? 192 Bit oder 256 Bit? Ein Vollausbau sollte der Chip mit 336 SPs nicht sein, aber die 256-Bit kommen aus den bisherigen Informationen die wohl nicht passen. Auch wenn ich eher 256 Bit vermute.

Hier gibt es ein 256-Bit 225W PCB: http://www.forum-3dcenter.org/vbulletin/showthread.php?p=8047453#post8047453

Spasstiger
2010-05-26, 12:42:11
Glaube ich nicht, so müsste ihre Schrottchips ja auch irgendwie an den Mann bringen. Ich sehe auch keinen Sinn in einem so starken GF104. Was will man damit? Da macht man sich nur selbst Konkurrenz. Ich glaube nach wie vor an einen halben GF100.
Man lässt den GF100 fürs Consumer-Segment auslaufen. Der GF104 ist sicherlich gewinnbringender im Consumer-Segment. Für Teslas und Quadros könnte man den GF100 ja weiter in reduzierten Stückzahlen fertigen.

@AnarchX: Jo, nach den Füllratenmessungen sind es 56 TMUs bei der GTX 460. Kombiniert mit 336 SPs. Im Vollausbau passen also 384 SPs und 64 TMUs sehr gut zum GF104.

Gast
2010-05-26, 12:53:18
Man lässt den GF100 fürs Consumer-Segment auslaufen. Der GF104 ist sicherlich gewinnbringender im Consumer-Segment. Für Teslas und Quadros könnte man den GF100 ja weiter in reduzierten Stückzahlen fertigen.

@AnarchX: Jo, nach den Füllratenmessungen sind es 56 TMUs bei der GTX 460. Kombiniert mit 336 SPs. Im Vollausbau passen also 384 SPs und 64 TMUs sehr gut zum GF104.

Eine Chip nur für Tesla/Quadro? Den Luxus kann man sich wohl kaum leisten.

AnarchX
2010-05-26, 12:57:19
Eine Chip nur für Tesla/Quadro? Den Luxus kann man sich wohl kaum leisten.
Momentan wird er ja noch für GeForce verkauft, insofern wäre eben nur in einem bestimmten Zeitraum Profimarkt-only.

aylano
2010-05-26, 12:57:34
Machen wir doch mal eine andere Rechnung: Die HD5970 liegt laut HT4U nur 36% über der HD5870, dabei liegen die Taktraten nur ~17% niedriger. Gleiches bei der GTX470 und wir hätten ~520MHz Core @ <260W (Spiele). Jetzt nehmen wir mal an, man würde für Spiele bis zu 300W zulassen. Damit sollte dann durchaus ein 480-512SP Pärchen @ ~520-530MHz möglich sein.
Die Rechnung kann ich nicht nachvollziehen.

Die Sache ist, Fermi-Single kratzt jetzt schon deutlich an der Stromverbrauchgrenze, was früher mit Single-Cores nicht war.
Dazu dürften sie vielleicht schon an der Spannungsgrenze angelangt sein, wo sie unter Last nur 0,12 Volt über idle sind, was früher auch nicht war
Und wenn die Single schon fast an zwei Physikalischen Grenzen angelangt ist, werden die kaum noch mit so einer Single einen Dual-Fermi sinnvoll rausbringen können.

Mit A-Stepping kann ich mir es bei weitem nicht vorstellen, irgendwas in der nähe vom Sinnvollen rauszubringen.
Das B-Stepping müsste schon ein ziemlich großer Sprung werden.

Es ist schon seit Jahren so, dass Nvidias GPU-Spekulationen viel zu euphorisch sind, wenn die GPUs noch weit weg sind. Und je näher die GPUs anrücken, desto größer wird die Ernüchterung und dann wird man noch (etwas) enttäuscht.
Bei Fermi-512 war ich mit der Untereren 600 Mhz @ 1300 mit 225 Watt-TDP ja auch viel zu optimistisch.
Solange Nvidia jetzt mal nicht eine gute GPU bzw. den Erwartungen entsprochene GPU rausbringt, würde ich Nvidia nicht so optimitisch sehen.
Manche tun ja so, als ob Fermi-512 so nebenbei nicht so gut geworden ist.

deekey777
2010-05-26, 13:11:28
Man lässt den GF100 fürs Consumer-Segment auslaufen. Der GF104 ist sicherlich gewinnbringender im Consumer-Segment. Für Teslas und Quadros könnte man den GF100 ja weiter in reduzierten Stückzahlen fertigen.

@AnarchX: Jo, nach den Füllratenmessungen sind es 56 TMUs bei der GTX 460. Kombiniert mit 336 SPs. Im Vollausbau passen also 384 SPs und 64 TMUs sehr gut zum GF104.
Das hieße:
Vergrößerte SMs mit 3x16 CUDA-Cores und 8 TMUs und einer Polymorph-Engine, insgesamt 8, zuzweit in einem GPC, 4 Raster-Engines?

Dural
2010-05-26, 13:19:52
wenn GF104 jetzt wirklich aus 384SP/64TMUs/32ROPs besteht werden wir ganz sicher keine Dual GF100 Karte sehen!

Sondern viel eher eine GF104 Dual Karte und genau mit solchen Daten würde die Karte Sinn mache! Vorher mit nur 256SP wäre die Karte ein witz und würde rein gar nichts bringen!

Wenn sich die Daten des GF104 bestätigen werden wir wohl oder übel wirklich ein GF100 A3 EOL sehen und der wird nur noch im Quadro/Tesla/GTX480+ und vieleicht irgend ein billig teil (GTX465/470 für den Müll...) bereich erscheinen, die frage bleibt was dann der GF100 Bx bringt, dann dürfte es eine GTX485 mit 512SP und vieleicht 750MHz geben, das wären noch mal ca. 15% mehr als jetzt mit der GTX480...

deekey777
2010-05-26, 13:23:19
Soviele Ausrufezeichen...

Dural
2010-05-26, 13:26:05
wenn es wirklich so kommt, wäre das dass erste mal in der Geshichte wo man vom selben Hersteller eine High-End Single GPU und eine High-End Dual GPU Karte kaufen könnte :freak:

Das einzige auffällige (sehr auffällige!!!) kein voller GF104 auf der GTX460... kann nur zwei gründe haben 1. man will der 465 nicht zu nahe kommen/überholen oder man hat die selben Probleme wie beim grossen bruder GF100 (was ich mir aber kaum vorstellen könnte)

AnarchX
2010-05-26, 13:32:31
Noch ein Leak?

http://img269.imageshack.us/img269/8485/40137611274872502957102.jpg
Auch wieder offline: http://news.mydrivers.com/1/165/165422.htm
http://itbbs.pconline.com.cn/diy/11447684_2.html

Wobei im Text wieder 256SPs mit hohem Takt (1.8GHz) gesprochen wird.
Dagegen bot enet die Taktraten direkt vom Treiber ausgelesen.
Sodass hier die 256SPs@1.8GHz Spekulation wohl eher auf einen GFLOPs-Wert bassiert, denn 256@1.8 ~ 336@1.35.

Spasstiger
2010-05-26, 13:42:27
Die Benchmarks könnten auf beide Varianten zutreffen. Bei der 336-SP-Variante geht man ja von einem nur 192 Bit breiten Speicherinterface aus. Somit wäre die Speicherbandbreite ein ganzes Stück unter der GTX 465, die Rechenleistung dank höherer Taktraten aber 6% größer.
Das spiegeln auch die Benchmarks wieder. 3DMark Vantage Extreme giert z.B. nach purer Rechenleistung, deshalb ist die GTX 460 dort schneller als die GTX 465. In den Spielen dagegen macht sich die im Vergleich zur GTX 465 geringe Speicherbandbreite der GTX 460 bemerkbar.

AnarchX
2010-05-26, 13:47:30
Auf Basis der Specs (336SPs/192-Bit) sind es ja nur ~85% der Bandbreite und ROP-Leistung der GTX 465.
Zudem könnte die Rohleistung von GF104 mit veränderten SMs auch etwas weniger effektiv als bei GF100 sein.

Coda
2010-05-26, 13:54:08
336SPs? Bei PCinlife vermutet man eine SM mit nur 16 aktiven SPs.
Das dürfte gar nicht möglich sein. Wenn dann hat NVIDIA die Double-Fähigkeit entfernt und ist dabei auf 16er SMs gegangen.

Wäre jetzt nicht so überraschend, denn die 32er SMs entstanden nur um Double im Zusammenschluss schnell abarbeiten zu können.

Der Chip hätte dann im im Vollausbau wohl 24 SMs also 384 SPs. 3 SMs/TPC wie bei GT200. Je TPC eine oder zwei Quad-TMUs, also 32 oder 64 TMUs.

AnarchX
2010-05-26, 13:55:39
Das dürfte gar nicht möglich sein.
Alter Stand, mittlerweile sind wir bei 48SPs-SMs. ;)

deekey777
2010-05-26, 13:57:49
Alter Stand, mittlerweile sind wir bei 48SPs-SMs. ;)
Man kommt nicht mit 16 aktiven SPs nicht auf 384 SPs.

Coda
2010-05-26, 13:59:58
Alter Stand, mittlerweile sind wir bei 48SPs-SMs. ;)
Das ist ja noch größerer Blödsinn. Es wird so sein wie ich geschrieben habe. Ein TPC hat 3x16 ALUs.

AnarchX
2010-05-26, 14:02:35
Das ist ja noch größerer Blödsinn. Es wird so sein wie ich geschrieben habe. Ein TPC hat 3x16 ALUs.
TPCs gibt es doch in der GF100-Architektur nicht mehr.
SMs sind der Verbund aus ALUs und TMUs: http://www.computerbase.de/artikel/grafikkarten/2010/bericht_nvidia_gf100_technische_details/4/#abschnitt_streaming_multiprocessor_sm

Coda
2010-05-26, 14:03:30
Nomenklatur-Bla.

Von mir aus sind es auch drei Vec16 pro SM, wenn das jetzt so heißt. Das Resultat ist das gleiche.

Auf jeden Fall ist dann das gemeinsame Dispatch für Double rausgeflogen. Weil das lässt sich auf drei Vec16 nicht mehr abbilden.

Coda
2010-05-26, 14:09:14
Das passt ja auch wunderbar zu den 336 SPs. Dann ist nämlich genau ein SM/TPC deaktiviert. Fragt sich nur noch ob 32 oder 64 TMUs.

Ich würde derzeit auch eher auf 256 Bit SI tippen, außer sie bringen 192 Bit mit höher getaktetetem GDDR5.

AnarchX
2010-05-26, 14:10:55
Das passt ja auch wunderbar zu den 336 SPs. Dann ist nämlich genau ein SM/TPC deaktiviert.

Fragt sich nur noch ob 32 oder 64 TMUs.
Wohl 56 von 64 bei der GTX 460: http://www.forum-3dcenter.org/vbulletin/showpost.php?p=8047837&postcount=508

Ich würde derzeit auch eher auf 256 Bit SI tippen, außer sie bringen mit 192 Bit und höher getaktetes GDDR5.
192-Bit und 3.6Gbps sollen es wohl sein, für die 460 ausreichend und zudem hat man dadurch auch einen gewissen Kostenvorteil beim PCB gegenüber der HD 5830.
Wobei 768MiB für 2010 teilweise schon etwas knapp sein könnten.

Dural
2010-05-26, 14:11:12
das DP raus fliegt war ja schon immer klar?! NV hat schon vor monaten mehr oder weniger bestätigt das die kleineren fermi ableger sehr wahrscheinlich kein DP haben...

Coda
2010-05-26, 14:11:50
Wohl 56 von 64 bei der GTX 460: http://www.forum-3dcenter.org/vbulletin/showpost.php?p=8047837&postcount=508
Passt auch zusammen. Dann sind es 3xVec16 und zwei Quad TMUs pro SM.

Fermi hatte 2xVec16 und eine Quad-TMU pro SM. Eigentlich müsste GF104 so sogar fast so groß wie Fermi werden. Ich geh mal davon aus, dass sie sehr viel Sonstiges entfernt haben (DP, Caches, globale Pointer, etc.)

das DP raus fliegt war ja schon immer klar?! NV hat schon vor monaten mehr oder weniger bestätigt das die kleineren fermi ableger sehr wahrscheinlich kein DP haben...
Ja haben sie.

Dural
2010-05-26, 14:18:15
braucht etwa 700-750MHz um mit den Daten (384SP/64TMU/32ROPs) an die 5870 rann zu kommen, oder irgend welche einwände?

Coda
2010-05-26, 14:25:52
Mit einem deaktivierten SM wohl eher so in Richtung ~850 Mhz. Fraglich ob sie das schaffen - das wären immerhin 1700 Mhz Hot-Clock.

Gast
2010-05-26, 14:39:08
braucht etwa 700-750MHz um mit den Daten (384SP/64TMU/32ROPs) an die 5870 rann zu kommen, oder irgend welche einwände?

Wenn man davon ausgeht das GTX470 etwas langsamer ist als eine 5870 wird das nur sehr schwer machbar. Wenn man ~800Mhz/1600Mhz im Vollausbau erreicht (384SP/64TMU/32ROPs/256-bit) mit auch entsprechend hohem Speichertakt könnte man zumindest knapp gleichziehen. Überholen schafft man sicher nicht. Mal sehen auch wie es mit der Tess-Leistung aussieht.

Coda
2010-05-26, 14:42:53
Das ist kompletter Unsinn. Mit 800 Mhz im Vollausbau hätte man 12% mehr Rechenleistung und 50% (!) mehr Texturleistung als eine GTX 470.

Dural
2010-05-26, 15:23:19
ich sag ja im vollausbau und da düfte ein solcher Chip mit ca. 750MHz es sehr gut mit der 5870 aufnehmen.

Ailuros
2010-05-26, 15:24:31
GF104 core is not the usual square chip, which is rectangular, package size is about 60% of GF100. The core number is GF104-300-KA-A1, A1 step is still, in general, the retail version will be updated to the A2 or A3.

Was mich jetzt total verwirrt hat ist der rechteckige die, denn es ist nicht das erste Mal dass ich darueber hoere. Als ich es das erste Mal las dachte ich dass es ein harmloser Scherz ist, aber im Fall wo es stimmen sollte (halte ich aber trotz allem immer noch fuer extrem unmoeglich) wird es der merkwuerdigste die aller Zeiten sein. Um es noch genauer zu machen ich hoerte vor Monaten von 25*15mm.

Coda
2010-05-26, 15:29:25
Ja, das passt zum PCB das auf Beyond3D gepostet wurde:

http://i45.tinypic.com/10rms8w.jpg

Ach übrigens: 256 Bit SI falls das PCB korrekt ist.

Ailuros
2010-05-26, 15:35:31
Ok und jetzt streng Dich an und gib mir eine logische Erklaerung warum der die rechteckig ist...ok die meisten sind keine perfekte Quadrate aber der Unterschied zwischen Breite und Hoehe sind relativ klein. Falls es jetzt stimmen sollte und das Ding ist wirklich 25*15, muss es doch einen logischen Grund dafuer geben....

Uebrigens:

http://translate.google.com.hk/translate?js=y&prev=_t&hl=en&ie=UTF-8&layout=1&eotf=1&u=http%3A%2F%2Fvga.it168.com%2Fa2010%2F0526%2F919%2F000000919076.shtml&sl=auto&tl=en

http://image20.it168.com/201005_500x375/29/883df46e4bb6e8f3.jpg

Angenommen das Bild ist echt, bin ich blind oder sehe ich tatsaechlich nur 8 SMs rechts?

edit: ergo GTX460 = 7 SMs * 48 SPs, 56 TMUs, 24 ROPs?

907 GFLOPs/s
37.8 GTexels/s
16.2 GPixels/s
86.4 GB/s

Hmmm ich will den vollen 104 sehen :)

Coda
2010-05-26, 15:39:05
Ok und jetzt streng Dich an und gib mir eine logische Erklaerung warum der die rechteckig ist..
Warum nicht? Man kann durch Laufzeiten etc. nicht alles beliebig anordnen.

Die minimal schlechtere Waferauslastung muss man dann halt in Kauf nehmen.

AnarchX
2010-05-26, 15:52:28
http://img204.imageshack.us/img204/6678/40150601274879935821102.jpg

Eine 470 erreicht im Feature-Test 6 Perlin Noise 75 FPS:
http://www.pcper.com/article.php?aid=888&type=expert&pid=12
http://i40.tinypic.com/2qd3olw.png

Das ergibt für die GTX 460 dann aber nur ~800GFLOPs, was bei 1.35GHz ~ 300 SPs entspricht. Entweder sind es nur 6 SMs ~ 288SPs, wozu aber wieder nicht die Füllrate passt oder die umstrukturierten SMs sind wie vermutet nicht ganz so effektiv.

Gast
2010-05-26, 15:55:21
Die minimal schlechtere Waferauslastung muss man dann halt in Kauf nehmen.
Die Waferauslastung wird besser, denn die ist abhängig von der kürzesten Kante eines Die.

Gast
2010-05-26, 16:03:54
http://image20.it168.com/201005_500x375/29/883df46e4bb6e8f3.jpg



Kann das sein das beide Bilder den gleichen Core zeigen und das Bild rechts nur etwas gestaucht ist?

IVN
2010-05-26, 16:19:13
Ok und jetzt streng Dich an und gib mir eine logische Erklaerung warum der die rechteckig ist...ok die meisten sind keine perfekte Quadrate aber der Unterschied zwischen Breite und Hoehe sind relativ klein. Falls es jetzt stimmen sollte und das Ding ist wirklich 25*15, muss es doch einen logischen Grund dafuer geben....

Uebrigens:

http://translate.google.com.hk/translate?js=y&prev=_t&hl=en&ie=UTF-8&layout=1&eotf=1&u=http%3A%2F%2Fvga.it168.com%2Fa2010%2F0526%2F919%2F000000919076.shtml&sl=auto&tl=en

http://image20.it168.com/201005_500x375/29/883df46e4bb6e8f3.jpg

Angenommen das Bild ist echt, bin ich blind oder sehe ich tatsaechlich nur 8 SMs rechts?

edit: ergo GTX460 = 7 SMs * 48 SPs, 56 TMUs, 24 ROPs?

907 GFLOPs/s
37.8 GTexels/s
16.2 GPixels/s
86.4 GB/s

Hmmm ich will den vollen 104 sehen :)
Das Bild ist nicht echt. Man kann die Bearbeitung sehr leicht erkennen. Das linke wurde einfach nur gestretcht (siehe Mitte links).

Dural
2010-05-26, 16:42:58
Es ist eine GF100 DIE der in einer länge geschrupft wurde, sieht man doch auf den ersten blick ;)

Dural
2010-05-26, 16:52:52
aber X6000 ist gar nicht mal so schlecht für 336SP/56TMUs/24ROPs @ 675/1350/800MHz

Da dürfte ein voller GF104 wirklich die GTX470 ersetzten und in direkter Konkurenz zu 5850/5870 drehten! ca. 30% mehr Leistung durch ca. 15% mehr Einheiten und ca. 15% mehr Takt scheint möglich und somit wäre man schon über der GTX470 in Vantage...

AnarchX
2010-05-26, 16:55:38
Vantage Feature Tests

GTX 460 - HD 5830 - GTX 470
http://img191.imageshack.us/img191/1330/unbenannttvn.jpg

IVN
2010-05-26, 16:59:52
Also doch um einiges langsamer.

V2.0
2010-05-26, 17:07:33
5770 Niveau - ärmlich.

Spasstiger
2010-05-26, 17:09:59
Also doch um einiges langsamer.
Ist ja auch nur die GTX 460 und nicht der GF104 im Vollausbau.
Die GTX 460 hat weniger Texelfüllrate, Pixelfüllrate und Speicherbandbreite als nach den alten Spekulationen und die GTX 460 verwendet auch keinen GF104 im Vollausbau. Die Speicherbandbreite ließe sich theoretisch noch um den Faktor 2 steigern (4,8 Gbps GDDR5 @ 256 Bit statt 3,2 Gbps GDDR5 @ 192 Bit), die Pixelfüllrate um 49% (32 ROPs @ 750 MHz statt 24 ROPs @ 675 MHz) und die Texelfüllrate sowie die arithmetische Rechenleistung noch um 27% (384 SPs @ 1500 MHz + 64 TMUs @ 750 MHz statt 336 SPs @ 1350 MHz + 56 TMUs @ 675 MHz).
Eine 40% schnellere Variante als die GTX 460 auf GF104 also gut denkbar. Das reicht, um mit der GTX 470 gleichzuziehen.

5770 Niveau - ärmlich.
Die GTX 460 ist nicht das GF104-Topmodell. Du vergleichst ja auch nicht die Radeon HD 5850 mit der GeForce GTX 480. Zudem dürfte die GeForce GTX 460 abseits von 3DMark Vantage Extreme schneller sein als die Radeon HD 5770.
/EDIT: Die Radeon HD 5770 schafft ja nichtmal 6K in 3DMark Vantage Extreme, sondern nur 4,3K. Dann ist der Vergleich eh völlig fürn Arsch.

Dural
2010-05-26, 17:11:31
eine 5770 hat genau 4300 punkte... da wäre schon die GTX460 "nur" 40% schneller, wo von träumst du nachts?! und eine GTX470 hat übrigens 7300

Ein voller GF104 wird die GTX470 überflüssig machen

zudem könnten sogar die 768MB Speicher (oder hat sie 1,5GB??) der GTX460 im Extreme bremsen, da bin ich mir aber nicht sicher...

so wie es derzeit ausschaut wird der GF104 die direkte Konkurenz GPU zur RV870 sein, die aktuellen Infos müsstens sich aber natürlich noch bewahrheiten...

robbitop
2010-05-26, 17:21:37
Ich hoffe, dass sie auch eine Variante des GF104 im Vollausbau bringen. Dann hätte man eine GTX470 done right (weniger Leistungsaufnahme). Vieleicht ist dann auch etwas mehr Takt drin.

Dural
2010-05-26, 17:26:43
eine 5830 hat übrigens auch um die X6000, somit dürfte die GTX460 schon über der 5830 sein, da die ATI Karten in der Regel in Vantage besser abschneiden als in Real Anwendungen.

LovesuckZ
2010-05-26, 17:30:44
Die Featuretests sind auch kein Gradmesser für Spieleleistung. nVidia ist vorallen in Bereich Geometrie(shader) wesentlich schneller, AMD in Bezug der reinen Pixelberechnungsleistung.

Nakai
2010-05-26, 17:35:07
Huihui, die Karte klingt auf einmal sehr interessant.^^:D

So eine mit Vollausbau wäre verdammt attraktiv.


mfg

AnarchX
2010-05-26, 17:39:46
Hoffentlich auch preislich.
GTX 460 vs HD 5830 bei ~150€ und "GTX 475/470 new" vs HD5870 bei ~ 200€, wären doch Angebote für den Herbst, die man als Kunde erwartet.

Ein GF106 mit 4 neuen SMs, also 32 TMUs und 192SPs + 128-192-Bit, sollte sich mit <200mm² Die-Size wohl auch recht gut gegen Juniper positionieren.

mapel110
2010-05-26, 17:41:47
Ich wollte ja eigentlich eine 470 kaufen. Also wäre das eine Fehlentscheidung und ich sollte auf GF104 warten?! ;(

LovesuckZ
2010-05-26, 17:45:36
Die GTX470 wird wohl mindesten 33% schneller sein als die GTX460 und hat deutlich mehr Ram.

Spasstiger
2010-05-26, 17:46:17
Wenn der GF104 erst im Herbst kommmt, macht die Warterei nicht unbedingt Sinn. Bei der GTX 470 kannst du ja auch selbst Hand anlegen, was Spannung und Kühlung angeht: http://www.computerbase.de/artikel/grafikkarten/2010/bericht_geforce_gtx_470_gtx_480/6/#abschnitt_gtx_400_mit_weniger_spannung.

robbitop
2010-05-26, 17:48:31
Ich dachte GF104 kommt im Juli?

LovesuckZ
2010-05-26, 17:49:08
Dem jetzigen Wetter nach könnte im Juli wirklich schon Herbst sein. :D

AnarchX
2010-05-26, 17:51:47
Ich dachte GF104 kommt im Juli?
Die GTX 460 steht wohl bald vor der Tür und wird schon auf der Computex gezeigt werden. Aber die volle Version kann man wohl später vermuten.
Jedenfalls sollte dann im Herbst der Preiskampf am laufen sein.

LovesuckZ
2010-05-26, 17:55:10
Hm, also das chinesische Kauderfalsch schrieb von Computex. Wobei nVidia am 1. bzw. 2. Juni die GTX465 freigeben wird. Aber anscheinend scheint der Chip schon gut zu laufen, wenn man A1 Samples an die Partner ausgibt.

Spasstiger
2010-05-26, 17:56:55
Man bringt die GTX 465 und die GTX 460 gleichzeitig raus?

Sorkalm
2010-05-26, 18:08:18
Glaub ich nicht. Dann hätte man jetzt auch keinen Mobil-Chip auf GF100-Basis gebracht. Im Juli kommt sicher die GTX 465, aber ich denk mal, GF104 dauert noch etwas.

Gast
2010-05-26, 18:09:22
Das Problem für NV ist ganz einfach dass der Chip viel zu spät kommt. Im Q3 will AMD Southern Island bringen.

AnarchX
2010-05-26, 18:13:31
Wenn AMD ein Gegenangebot mit vernünftiger Tessellationsleistung bietet, ist es doch umso besser für den Kunden.

Vielleicht kommt es gar zu der Situation, dass NV mit Dual-GF104 gegen die größte Southern Island Single-GPU antreten muss. ;D

Eventuell hat die Form von GF104 auch etwas damit zu tun, dass man zwei davon auf ein Package setzt und mit dieser Technologie verbindet: http://www.forum-3dcenter.org/vbulletin/showthread.php?t=474623

Ailuros
2010-05-26, 18:20:22
Es ist eine GF100 DIE der in einer länge geschrupft wurde, sieht man doch auf den ersten blick ;)

Ja leider *tritt sich selber in den Hintern*

Gast
2010-05-26, 18:39:22
Kann jemand kurz zusammenfassen wie jetzt die GPUs in den Varianten zu den GF Namen passen?
Einmal gibt es die GF100 weit abgespeckt die GTX465 benannt werden sollte?
Dann ein Teildeaktivierter GF104 der nun GTX460 sich nennt und "unbekannt" als GTX450/455??

Spasstiger
2010-05-26, 19:01:04
Unterhalb der GTX 460 soll es nur GTS- und GT-Varianten geben. Aber evtl. kommt noch sowas wie eine GTX 475 auf Basis des GF100.

Coda
2010-05-26, 22:18:44
Die Waferauslastung wird besser, denn die ist abhängig von der kürzesten Kante eines Die.
Nein. Für eine bestimmte Fläche ist immer der quadratische Chip am besten.

Falls dein Statement so zutreffen würde, würde ein 2mm x 250mm Chip öfters auf einen Wafer passen als einer mit 22x22mm. Das ist offensichtlich nicht der Fall ;)

Spasstiger
2010-05-26, 22:29:02
Der Juniper von ATI ist auch alles andere als quadratisch:

http://www.abload.de/img/ati-juniper4-6-226950-rogd.jpg

Zum Thema nicht-quadratische Dice hatte ich sogar mal einen Thread gestartet: http://www.forum-3dcenter.org/vbulletin/showthread.php?t=446821.

Rampage 2
2010-05-27, 01:10:26
Nach aktuellen Informationen sieht es für einen vollausgebauten GF104 also wie folgt aus:

- 32ROPs
- 64TMUs
- 384SPs
- 256Bit SI
- 1024MB GDD5-RAM

Takt: max. 750/1500/1800MHz

Ist das soweit richtig?

Wie sicher sind die bisherigen Informationen denn jetzt und wie wahrscheinlich ist es, dass es den GF104 im Vollausbau geben wird?

Thx,

R2

Dural
2010-05-27, 12:24:54
jo, aber noch mit vorsicht zu genissen...

robbitop
2010-05-27, 13:59:27
Naja G92 gab es damals auch erst beschnitten als 8800GT. Unbeschnitten kam sie erst ein paar Monate später als 8800GTS-512 heraus.
Im Vollausbau würde sie der GTX470 die Existenzberechtigung nehmen und NV hätte weniger Marge für Recycling-Fermis.
Herbst kann schon gut hinkommen.

Coda
2010-05-27, 14:31:12
Oder man nimmt die GF104 im Vollausbau für eine GTX490 als Lückenfüller bis Fermi im B-Stepping auftaucht

robbitop
2010-05-27, 14:51:09
Einen einzelnen? Das wird wohl nicht reichen.

Gast
2010-05-27, 14:54:45
Bei ungefähr 150 Watt TDP verbaut man 2*6 Pin. 1*8 Pin ist ganz selten und 1*6 Pin findet man von ~70 Watt bis ~140 Watt TDP. Eine GeForce 9800 GTX+ mit 141 Watt TDP hat schon 2*6 Pin.

+ @Dural

Nej, Nej... so stimmt dat nich.
Zum einen schrieb ich "ungefähr" - was damit auch "etwas unter 150 W"
(und hier reicht nunmal auch der 6-Pin) einschließt und zum anderen mal einfach noch der Fakt dass der PCIe 2.0 selbst mit 75 Watt spezifiziert ist und damals gleichzeitig auch den Weg für den tollen 8-Pin, der eben genau die besagten 150 Watt liefern kann, freigemacht hat. Ergo genügt ein 8-Pin sogar locker für alle Karten mit roundabout 200 W, da er mit dem PCI zusammen insgesamt 225 Watt bereitstellen kann. 2x 6-Pin ist für 150-200 W Karten damit obsolet.

Der 8-Pin fand übrigens schon in großer Zahl Verwendung bei den 9800(+) und 250ern. Ich selbst besaß bis vor kurzem eine GTS 250 mit einem solchen 8-Pin Anschluss...

Ich will wirklich nicht belehren.
Aber auch nicht übergebühr belehrt werden.

Coda
2010-05-27, 15:06:20
Einen einzelnen? Das wird wohl nicht reichen.
Zwei natürlich.

Dural
2010-05-27, 15:37:48
ach 2x 6-Pin und 1x 8-Pin ist exakt das selbe, beides bis max 225Watt

Es ist völlig egal ob man 2x 6-Pin oder 1x 8-Pin verbaut, laut Spezifikationen ist beides bis max 225Watt gut...

Selbst die 9800GTX hat um die 120-140Watt und hatte trotzdem auch 2x 6-Pin

LovesuckZ
2010-05-27, 15:43:06
Oder man nimmt die GF104 im Vollausbau für eine GTX490 als Lückenfüller bis Fermi im B-Stepping auftaucht

Das einzige, was GF100 in B-Stepping wäre, wäre ein größerer GF104. Nur stellt sich dann die Frage, wo nVidia sparen würde.

Coda
2010-05-27, 16:21:11
Das einzige, was GF100 in B-Stepping wäre, wäre ein größerer GF100.
Wie kommst du darauf?

LovesuckZ
2010-05-27, 17:31:36
Es sollte eigentlich GF104 sein, mein Fehler.
Ich kann mir einfach nicht vorstellen, dass nVidia GF100 nochmal überarbeitet, aber keine Einheitenveränderung vornimmt und gleichzeitig ein GF104 entwickelt wird, der anscheinend einige deutliche Unterschiede aufweist.
Ich könnte mir daher vorstellen, dass der GF100 Refresh auf 40nm eben ein größerer GF104 ist.

AnarchX
2010-05-27, 17:42:58
Nur ist die Architektur hinter GF104 wohl für den Profimarkt, vor allem Tesla, nicht so brauchbar, sodass man hier weiter einen GF100 benötigt.

Aber vielleicht gibt es nach der überraschenden Architekturumstellung bei GF104 noch die nächste Überraschung mit einem verbesserten MGPU-Konzept, wofür das Patent 2006 schon eingereicht wurde:
http://www.forum-3dcenter.org/vbulletin/showthread.php?t=474623
Die redundante Geometrieberechnung sollte für auch für GF104 noch kein großes Problem darstellen.

Das erklärt vielleicht auch die Form des Dies und das etwas sonderbare Pinout der Speicherkanäle:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=8048211&postcount=539

LovesuckZ
2010-05-27, 17:47:05
Vielleicht ersetzen sie GF100 auch mit dem GF104 und höhrerer Taktung. Mit 875MHz und entsprechendem Speichertakt läge man auf GTX480 Niveau.

Bucklew
2010-05-27, 17:55:42
Nur ist die Architektur hinter GF104 wohl für den Profimarkt, vor allem Tesla, nicht so brauchbar, sodass man hier weiter einen GF100 benötigt.
Tesla bleibt sicher GF100-only, der wichtige Quadromarkt dagegen wird sicher in den kleineren Karten auch mit GF104 versorgt.

Gast
2010-05-28, 19:45:19
Wie kann die GF104 aka GTX460 schneller sein als die grade erschienene GTX465?

Spasstiger
2010-05-28, 19:49:53
Wie kann die GF104 aka GTX460 schneller sein als die grade erschienene GTX465?
Durch mehr arithmetische Rechenleistung und mehr Texelfüllrate. 336 SPs @ 1350 MHz und 56 TMUs @ 675 MHz liefern halt eine theoretisch größere Rechenleistung als 352 SPs @ 1215 MHz und 44 TMUs @ 607,5 MHz ab. In 3DMark Vantage kann die GTX 460 wohl diesen Vorteil ausspielen.
Meistens dürfte die GTX 460 aber langsamer ausfallen als die GTX 465, weil die GTX 460 deutlich weniger Speicherbandbreite hat.

Gast
2010-05-28, 20:03:42
Im Vollausbau oder in der Ominösen abgespeckten Variante?

Spasstiger
2010-05-28, 20:09:32
Unter GTX 460 verstehe ich:
- 336 SPs
- 56 TMUs
- 192 Bit SI
- 24 ROPs
- 2 Rasterengines
- 8 Tessellatoren
- 675 MHz Chiptakt, 1350 MHz Hot-Clock, 802 MHz Speichertakt (3,2 Gbps)
Also eine abgespeckte GF104-Variante.

Was haltet ihr von diesem Gerücht:

GTX 495 - 2x GF104 - 300 W
GTX 485 - GF102 - 250 W
GTX 475 - GF102 - 225 W
GTX 465 - GF102 - 200 W
GTX 460 - GF104 - 150 W
Bei der GTX 460 sinds anscheinend nur 130 Watt TDP. Und ob NV noch eine GTX 475 auf GF100-Basis nachschiebt, muss sich zeigen. Wenn mit GF102 die Rev.B des GF100 gemeint ist, könnte das vielleicht schon sein. Möglicherweise nutzt man den Namen GTX 470 dann sogar für den GF104 im Vollausbau. Wäre ja nicht das erste Mal, dass man unter gleichem Namen zwei verschiedene GPUs fand (siehe GeForce 9600 GSO).

Gast
2010-05-28, 20:10:14
Was haltet ihr von diesem Gerücht:

GTX 495 - 2x GF104 - 300 W
GTX 485 - GF102 - 250 W
GTX 475 - GF102 - 225 W
GTX 465 - GF102 - 200 W
GTX 460 - GF104 - 150 W

Nightspider
2010-05-28, 20:19:16
Was haltet ihr von diesem Gerücht:

GTX 495 - 2x GF104 - 300 W
GTX 485 - GF102 - 250 W
GTX 475 - GF102 - 225 W
GTX 465 - GF102 - 200 W
GTX 460 - GF104 - 150 W

Quelle?

GTX 485 = 512 SU ?

GTX 475 = 480 SU ?

Termine?

Dimon
2010-05-28, 21:40:15
wie wärs damit?

das ganze wie die GTX285 zur GTX275

GTX495 = 2x512SU, 320 Bit oder 2x480SU (zumindest kein Vollausbau)
GTX485 = 512SU, 380 Bit
GTX475 = 512SU, 320 Bit oder 480SU, 320 Bit

hmm

Gast
2010-05-28, 21:45:14
GTX475 passt nicht, kein Platz für die GF104 Vollausbaustufe. Erinnert ein wenig an die GTX260 mit 216Shader o.o

AnarchX
2010-05-28, 22:00:10
Best Case Spekulation:

GTX 495: 768SPs 128 TMUs 64 ROPs 384-Bit 675/1350/1200MHz neuer Interconnect (http://www.forum-3dcenter.org/vbulletin/showthread.php?t=474623)
GTX 485: 576SPs 96 TMUs 64 ROPs 384-Bit 650/1300/1000MHz neuer Interconnect (http://www.forum-3dcenter.org/vbulletin/showthread.php?t=474623)
GTX 475: 384SPs 64 TMUs 32 ROPs 256-Bit 750/1500/1200MHz
GTX 460: 336SPs 56 TMUs 24 ROPs 192-Bit 675/1350/900MHz

GF100 verschwindet in den Profimarkt.

Nightspider
2010-05-28, 22:06:53
Wie kommst du bei der GTX 485 auf 576SPs?
Von 512 auf 576 SPs ?

AnarchX
2010-05-28, 22:08:47
Wie kommst du bei der GTX 485 auf 576SPs?
Von 512 auf 576 SPs ?
Zwei GF104 mit je 288SPs.

Spasstiger
2010-05-28, 22:12:36
384 Bit SI bedeutet 48 ROPs.
Die GTX 495 dürfte ein effektives 512-Bit-SI und 64 ROPs bekommen (2*GF104 im Vollausbau). Wenn für die TDP nötig, reduziert man halt die Taktraten entsprechend.

AnarchX
2010-05-28, 22:16:39
384 Bit SI bedeutet 48 ROPs.
Kann sein, aber ebenso wäre es denkbar dass man die ROPs erhalten kann, wenn man den angebunden 64-Bit Kanal mit dem anderen Chip verbindet.


Die GTX 495 dürfte ein effektives 512-Bit-SI und 64 ROPs bekommen (2*GF104 im Vollausbau). Wenn für die TDP nötig, reduziert man halt die Taktraten entsprechend.
Wenn es bei AFR bleibt, sind es natürlich 512-Bit, dann aber gibt es wohl auch keine kleinere Dual-GPU-Karte.

Spasstiger
2010-05-28, 22:19:16
Achso, du rechnest 64 Bit pro GPU für den Interconnect an. Dann machen deine Angaben natürlich Sinn.

Gast
2010-05-28, 23:04:05
Am Ende verarscht nV uns wieder, mal warten was zur Computex kommt.

Ailuros
2010-05-29, 08:41:06
Es sollte eigentlich GF104 sein, mein Fehler.
Ich kann mir einfach nicht vorstellen, dass nVidia GF100 nochmal überarbeitet, aber keine Einheitenveränderung vornimmt und gleichzeitig ein GF104 entwickelt wird, der anscheinend einige deutliche Unterschiede aufweist.
Ich könnte mir daher vorstellen, dass der GF100 Refresh auf 40nm eben ein größerer GF104 ist.

Muss aber auch nicht so sein. Ich sehe unter GF100b nichts anderes als eine (endlich) 512SP Variante mit leicht hoeheren Frequenzen als bei der 480 und anstaendigerem Stromverbrauch. Zumindest unter 40G sieht es nicht nach mehr aus.

Fuer "mehr" siehe "Fermi2@28nm=2011".

AnarchX
2010-05-31, 09:38:18
Nach der AMD-Roadmap nun noch eine für NV von 4Gamer:
http://img25.imageshack.us/img25/354/006ra.jpg
http://translate.google.de/translate?u=http%3A%2F%2Fwww.4gamer.net%2Fgames%2F099%2FG009929%2F20100529002%2F&sl=ja&tl=en&hl=&ie=UTF-8

Die SPs Zahlen von GF106-GF10x passen aber wieder gar nicht zu den 48SPs-SMs von GF104, die durch den Vantage-Screen eindeutig nachgewiesen sind.
Oder gibt es neben den 32SPs/4TMUs-SMs und 48SPs/8TMUs-SMs, noch 32SPs/8TMUs-SMs? Kleinere GPUs mit geringerem TMU:ALU-Verhältnis sind ja auch nichts neues.

Dural
2010-05-31, 11:10:16
passt eh hinten und vorne nicht zusammen....

zb. 64SP und 128Bit GDDR5 ja klar...

AnarchX
2010-05-31, 11:14:39
passt eh hinten und vorne nicht zusammen....

zb. 64SP und 128Bit GDDR5 ja klar...
Die 128-Bit GDDR5 für GF108 gab es schonmal in einer anderen Roadmap: http://www.3dcenter.org/artikel/neue-informationen-zu-nvidias-gf104-gf106-und-gf108

Mit 16 TMUs und entsprechendem Takt könnte sich ein solcher GF108 schon fast mit Redwood messen. Vielleicht ist der GDDR5 auch eher als Low-Power-Option für Notebooks gedacht, wie z.B. die GTX 480M mit nur 600MHz GDDR5.

Dural
2010-05-31, 11:21:24
na ich denke eher das ding hat 128SP... würde auch besser rein passen! Ein 64 und 32SP chip macht jetzt nicht so wahnsinig viel sinn finde ich.

Leonidas
2010-05-31, 11:35:18
Ich kann mir die Tabelle nicht vorstellen: GF106 mit 256 SP und der nächstkleinere Chip GF108 mit 64 SP - passt niemals zusammen.


Ich würde ja denken, wenn GF104 wirklich mit 384 SP antritt, dann sieht es folgermaßen aus:

GF104
256SP, 64TMU, 256Bit SI
Preisbereich 200-300 Euro
DualChip-Ausführung möglich, welcher stärker als GF100 im Vollausbau wäre

GF106
128SP, 32TMU, 128Bit SI
Preisbereich 120-180 Euro

GF108
64SP, 16TMU, 128Bit SI
Preisbereich 60-90 Euro

V2.0
2010-05-31, 11:39:35
Das macht jetzt keinen Sinn. Du meinst sicher wenn GF100B mit 384SP antritt, dann...

Spasstiger
2010-05-31, 11:42:41
Ich würde ja denken, wenn GF104 wirklich mit 384 SP antritt, dann sieht es folgermaßen aus:

GF104
256SP, 64TMU, 256Bit SI
Preisbereich 200-300 Euro
DualChip-Ausführung möglich, welcher stärker als GF100 im Vollausbau wäre
Diese Konfiguration ist dann so nicht möglich, weil die 384-SP-Variante ebenfalls 64 TMUs hat. Und die 64 TMUs erscheinen realistisch, weil Füllratenbenchmarks einer GTX-460-Sample-Karte auf 56 TMUs an 336 SPs hindeuten.
Möglich wären fürs Mobilsegment z.B. 288 SPs mit 48 TMUs oder 240 SPs mit 40 TMUs.

Wenn die Mainstream- und Low-End-Varianten auf demselben Design basieren, dann wären z.B. 192 SPs mit 32 TMUs für den GF106 im Vollausbau und 96 SPs mit 16 TMUs für den GF108 im Vollausbau denkbar. Und zu 96 SPs mit 16 TMUs passt auch ein 128-Bit-GDDR5-SI durchaus gut (siehe GeForce GT 240).
So riesig dürften die Komplexitäts-Unterschiede zwischen einem GDDR5- und einem DDR3-Interface eh nicht sein. Beide Speicherarten arbeiten mit einem 8n-Prefetch und 1,5 Volt. Das aussterbende GDDR3 dagegen arbeitet wie DDR2 mit einem 4n-Prefetch und 1,8 Volt.
DDR3-Unterstützung dürfte zum Standardrepertoire der heute implementieren GDDR5-Interfaces sein, aus Flexibilitätsgründen kann man also auch gleich ein GDDR5-Interface verbauen. Teildeaktivieren kann man immer noch, falls man in niedrigere Segmente gehen möchte.

Ailuros
2010-05-31, 12:31:32
Diese Konfiguration ist dann so nicht möglich, weil die 384-SP-Variante ebenfalls 64 TMUs hat. Und die 64 TMUs erscheinen realistisch, weil Füllratenbenchmarks einer GTX-460-Sample-Karte auf 56 TMUs an 336 SPs hindeuten.
Möglich wären fürs Mobilsegment z.B. 288 SPs mit 48 TMUs oder 240 SPs mit 40 TMUs.

Rein theoretisch ist es sehr wohl moeglich (Haarspalterei-Modus). So lange Du auf A und B jeweils 8TMUs/SM hat ist es den TMUs wurscht ob in jedem SM 48 oder 32SPs stecken. Natuerlich macht es keinen besonderen Sinn aber moeglich ist es schon zwei chips zu haben mit jeweils 64 TMUs und 384 oder 256SPs.


So riesig dürften die Komplexitäts-Unterschiede zwischen einem GDDR5- und einem DDR3-Interface eh nicht sein. Beide Speicherarten arbeiten mit einem 8n-Prefetch und 1,5 Volt. Das aussterbende GDDR3 dagegen arbeitet wie DDR2 mit einem 4n-Prefetch und 1,8 Volt.
DDR3-Unterstützung dürfte zum Standardrepertoire der heute implementieren GDDR5-Interfaces sein, aus Flexibilitätsgründen kann man also auch gleich ein GDDR5-Interface verbauen. Teildeaktivieren kann man immer noch, falls man in niedrigere Segmente gehen möchte.

Es muss einen Grund geben warum NV die Speicherfrequenzen bis jetzt so verdammt konservativ ansetzt. Der GF100 top dog war nie mit knapp 930MHz geplant sondern um ein gutes Stueck mehr.

Das macht jetzt keinen Sinn. Du meinst sicher wenn GF100B mit 384SP antritt, dann...

GF100b ist zwar OT aber IMHO 16SMs bei leicht hoeheren Frequenzen als bei 480.

Sorkalm
2010-05-31, 14:55:51
Das macht jetzt keinen Sinn. Du meinst sicher wenn GF100B mit 384SP antritt, dann...

Ich glaub er hat sich einfach nur verschrieben.

Gast
2010-05-31, 15:07:15
[QUOTE=Ailuros;8057923
Es muss einen Grund geben warum NV die Speicherfrequenzen bis jetzt so verdammt konservativ ansetzt. Der GF100 top dog war nie mit knapp 930MHz geplant sondern um ein gutes Stueck mehr.[/QUOTE]

Der Grund dürfte wohl einfach sein, dass die GPU-Leistung unter den Erwartungen liegt und man deshalb einfach keine höhere Frequenzen braucht.

aylano
2010-05-31, 16:06:41
Ich kann mir die Tabelle nicht vorstellen: GF106 mit 256 SP und der nächstkleinere Chip GF108 mit 64 SP - passt niemals zusammen.


Ich würde ja denken, wenn GF104 wirklich mit 384 SP antritt, dann sieht es folgermaßen aus:

GF104
256SP, 64TMU, 256Bit SI
Preisbereich 200-300 Euro
DualChip-Ausführung möglich, welcher stärker als GF100 im Vollausbau wäre

GF106
128SP, 32TMU, 128Bit SI
Preisbereich 120-180 Euro

GF108
64SP, 16TMU, 128Bit SI
Preisbereich 60-90 Euro
Ein GF106 mit 256 Shader und ein GF108 mit 64 Shader könnten schon zusammenpassen.

Man darf nicht vergessen, der Stromverbrauch des GF100 ist gegenüber in der Spiele-Last um ca. 30% gestiegen.
Das Problem, im Notebook-Markt bleibt der Stromverbrauch ca. 7-15Watt (lowEnd) und 15-30 Watt (Mainstream) gleich.

Bisher war 48/256 Shader = 18,75%
Möglich ... 64/512 Shader = 12,5 % *1,30 (Höher Fermi-Verbrauch) = 16,25%
(Mainstream .. GF106 mit 64-Shader)
Also, der kommt da sehr gut hin.
wobei da wegen den niedrigen Fermi-Volt mehr probleme beim Undervolten & Stromverbrauch möglicher wären, was paar Prozent & nähere Angleichung bedeuten könnte.

Nvidia jetziges Low-End hat jetzt schon 40nm. Da werden sie kaum die 4-Fache Shader-Cores bei gleicher Fertigung anbringen können. Mit 32-Core wird es sowieso schon knapp, da es wegen den Netbook-Markt low-Power-GPUs mit 7 Watt gefragt sind und dafür bietet Nvidia sogar den Ion 2 mit 8-Shader an.

Das Problem bei den Fermi-Notebooks-Low-End & Mainstream könnte eben sein, dass Nvidia dort auch nicht auf die 40nm-Probleme mit kleineren Dies reagierte, was dann auch zu einem höheren Stromverbrauch als geplant führen könnte, die wiederum zu Performance-Reduktion oder Verzögerungen führen könnten.

Gast
2010-05-31, 17:55:21
Ich glaube kaum, dass wir Fermi in 40nm im low-end sehen werden. Das wird sicher weiter mit den alten Produkten bedient werden.

Echtes Fermi-low-end wird es erst mit 28nm geben.

Spasstiger
2010-05-31, 21:16:58
Der Grund dürfte wohl einfach sein, dass die GPU-Leistung unter den Erwartungen liegt und man deshalb einfach keine höhere Frequenzen braucht.
Ich denke zwar nicht, dass der GF100 performancetechnisch unter NVidias Erwartungen liegt, aber an Speicherbandbreite mangelt es den GTX-4xx-Karten nicht. NV kann es sich erlauben, ein paar Reserven für den Refresh offenzulassen.
Und bei der GTX 480M ist der Speichertakt so niedrig, weil das Teil nichtmal die halbe Rechenleistung einer GTX 480 hat und man unter 100 Watt Leistungsaufnahme bleiben wollte.

OgrEGT
2010-05-31, 21:20:28
Nach der AMD-Roadmap nun noch eine für NV von 4Gamer:
http://img25.imageshack.us/img25/354/006ra.jpg
http://translate.google.de/translate?u=http%3A%2F%2Fwww.4gamer.net%2Fgames%2F099%2FG009929%2F20100529002%2F&sl=ja&tl=en&hl=&ie=UTF-8

Die SPs Zahlen von GF106-GF10x passen aber wieder gar nicht zu den 48SPs-SMs von GF104, die durch den Vantage-Screen eindeutig nachgewiesen sind.
Oder gibt es neben den 32SPs/4TMUs-SMs und 48SPs/8TMUs-SMs, noch 32SPs/8TMUs-SMs? Kleinere GPUs mit geringerem TMU:ALU-Verhältnis sind ja auch nichts neues.

Wie ich befürchtet habe, tut sich in Richtung Highend bei NV lange nichts mehr. Schade eigentlich.

Dural
2010-06-01, 09:53:35
die Roadmap ist eh für nichts, irgend was zusammen gewürfelt...

schon das GF104 erst ende jahr und nach GF108 kommen soll halt ich für ausgeschlossen!

zudem fehlt ja GF100 B komplett...

Ailuros
2010-06-01, 11:55:17
Der Grund dürfte wohl einfach sein, dass die GPU-Leistung unter den Erwartungen liegt und man deshalb einfach keine höhere Frequenzen braucht.

Wie waere es mit einem Grund warum nicht alle 16SMs eingeschaltet werden koennen und/oder warum der chip generell UEBERMAESSIG Strom verbraucht?

LovesuckZ
2010-06-01, 15:06:05
Kein GF104, jedoch ein GF106:
http://www.computerbase.de/news/hardware/komplettsysteme/notebooks/2010/juni/notebook_geforce_gtx_400m/

Auch wenn Computerbase.de meint, dass es sich um eine GTX480m handeln würde.

AnarchX
2010-06-01, 15:11:58
Laut Aufsteller "Nvidia Enthusiast Graphics", also wohl eine GTX 470M oder 460M.
Wenn man vernünftige Taktraten auffährt, sollte das wohl auch kein Problem sein für einen GF106 mit weniger als 384SPs/64 TMUs.
Zum Beispiel reichen wohl 192SPs/32TMUs mit 1300MHz um ~80% der 480M zu erreichen.

aylano
2010-06-01, 16:14:08
... , sollte das wohl auch kein Problem sein für einen GF106 mit weniger als 384SPs/64 TMUs.

GF106 mit 384 SP ?

Der 106er wird doch eher 256 SP haben?!

Spasstiger
2010-06-01, 16:21:32
GF106 mit 384 SP ?
Du verstehst ihn falsch. Man erwartet eine GeForce GTX 460M/470M ja eigentlich mit dem GF104 (384 SPs, 64 TMUs). Aber mit einem GF106 (möglicherweise 192 SPs und 32 TMUs) kann man bei entsprechend hohen Taktraten auch in die nötige Geschwindigkeitsregion für eine GTX 460M/470M kommen, weil die GTX 480M die Messlatte mit ihren niedrigen Taktraten nicht besonders hoch gelegt hat. 1300 MHz Shadertakt wäre mit einem Chip aus dem unteren Performancesegment auch für eine mobile GeForce nicht ungewöhnlich.

AnarchX
2010-06-01, 16:23:34
Ich sagte doch weniger. Und ob es wirklich 256SPs sind, wird man wohl sehen müssen. Ich denke eher an 192SPs/32TMUs an einem 192-Bit SI, damit man Juniper mit einem <200mm² Die attackieren kann.

LovesuckZ
2010-06-01, 16:23:56
Wenn nVidia einen GF100 für die GTX480m nimmt, dann werden sie wohl den GF104 für die GTX470m und den GF106 für die GTX460m nehmen. Jeweils mit deaktivierten Einheiten. nVidia verkaufte auch 9800GTX m Karten mit 112SP statt 128 und eine 8800GTX m mit 64SP statt mit 128SP.
AMD nimmt Juniper für die 58xx und Redwood für die 57xx Bezeichnung. Gängiige Praxis.
Und wenn GF104 384SP haben sollte, käme ein GF106 mit der Hälfte.

AnarchX
2010-06-01, 16:31:48
Wobei ich in der 470M eher einen GF106 vermuten würde, der sich mit <200mm² wohl recht gut gegen die HD5870M positionieren sollte. Mit 192-Bit und 1,5GiB dürfte man einen Vorteil bei der Speicherseite haben.

GF104 eignet sich wohl eher für einen Refresh der GTX 480M, wenn er ~GTX 465 Leistung bei 130W TDP erreicht.

edit: Laut den NV-Folien erreicht die 470M wohl eher 90%+ der 480M: http://www.xtremesystems.org/forums/showthread.php?t=252897
Also entweder doch GF104 oder ein GF106 mit mehr als 192SPs.

AnarchX
2010-06-02, 08:29:19
Wohl doch die GTX 460M mit GF106, der offenbar 192SPs + 192-Bit hat:
http://img339.imageshack.us/img339/1135/004iac.jpg

http://www.4gamer.net/games/110/G011058/20100602001/screenshot.html?num=004

Dural
2010-06-02, 10:52:07
gut, das bestätigt dann fast schon die 384SP / 192SP / 96SP / 48SP Theorie!

Stromverbrauch scheinen sie mit den kleineren chips auch im griff zu haben, sonst würde der für eine Moblie GPU kaum so hoch takten... siehe auch memory takt!

Ailuros
2010-06-02, 11:07:56
gut, das bestätigt dann fast schon die 384SP / 192SP / 96SP / 48SP Theorie!

Wenn es tatsaechlich 3*16 von 104 bis zum kleinsten sind, dann waere ich mir ueber die 192 nicht so sicher; ist es sicher dass GF106M die gleiche Anzahl von clusters wie desktop 106 haben wird? Wenn nicht koennte ich mir eventuell auch 240SPs vorstellen.

Stromverbrauch scheinen sie auch mit den kleineren chips im griff zu haben, sonst würde der für ein Moblie GPU kaum so hoch takten... siehe auch memory takt!

Hmmm sind es jetzt nur 60GB/s oder doch 120GB/s?

AnarchX
2010-06-02, 11:14:15
Das sind nur 2,5Gbps, also 60GB/s.

Dural
2010-06-02, 11:24:41
sicher? ich hätte jetzt 120GB/s gesagt!

AnarchX
2010-06-02, 11:32:03
sicher? ich hätte jetzt 120GB/s gesagt!
NV gibt im Panel den Datentakt an, siehe auch hier: http://www.forum-3dcenter.org/vbulletin/showpost.php?p=8048244&postcount=542

120GB/s hätten auch wenig Sinn gemacht, wenn die 480M nur 76GB/s hat.
Insofern heißt es wohl noch warten, ob die IMCs der kommenden GF10x mehr als 4Gbps erlauben.

Wenn man den hier gezeigten GF106 mit 192SPs/32 TMUs und 192-Bit auf 700/1400/950MHz für die Desktopkarte bringen kann, stehen die Chancen gut sich gegen die HD 5770 entsprechend positionieren zu können.
Wobei es für einen deutlichen Sieg eher 750/1500MHz GPU oder 240SPs bräuchte.

Leonidas
2010-06-02, 11:48:22
Ich kann mir die Tabelle nicht vorstellen: GF106 mit 256 SP und der nächstkleinere Chip GF108 mit 64 SP - passt niemals zusammen.


Ich würde ja denken, wenn GF104 wirklich mit 384 SP antritt, dann sieht es folgermaßen aus:

GF104
256SP, 64TMU, 256Bit SI
Preisbereich 200-300 Euro
DualChip-Ausführung möglich, welcher stärker als GF100 im Vollausbau wäre

GF106
128SP, 32TMU, 128Bit SI
Preisbereich 120-180 Euro

GF108
64SP, 16TMU, 128Bit SI
Preisbereich 60-90 Euro



Sry, das war bei den SP völlig daneben, hab nicht kontrolliert, was ich da geschrieben habe. Ich meinte:


GF104
384SP, 64TMU, 256Bit SI
Preisbereich 200-300 Euro
DualChip-Ausführung möglich, welcher stärker als GF100 im Vollausbau wäre

GF106
192SP, 32TMU, 192Bit SI
Preisbereich 120-180 Euro

GF108
96SP, 16TMU, 128Bit SI
Preisbereich 60-90 Euro

AnarchX
2010-06-02, 12:08:51
GF108 wird wohl kaum mehr ALUs pro TMU haben als GF106. ;)

Ailuros
2010-06-02, 12:49:27
sicher? ich hätte jetzt 120GB/s gesagt!

ROFL sorry aber ich schmunzelte als ich Deinen Beitrag sah. 625 (reale) MHz sind wirklich alles andere als berauschend und so langsam kann ich sehr wohl glauben dass am Speichercontroller irgend etwas nicht stimmt.

Dural
2010-06-02, 13:02:24
625MHz ist ja wirklich böse für GDDR5 :freak: ich ging jetzt echt von 1250MHz real aus...

Die GT21x GDDR5 Controller zicken nicht so rum...

AnarchX
2010-06-02, 13:15:20
625MHz ist ja wirklich böse für GDDR5 :freak: ich ging jetzt echt von 1250MHz real aus...

Naja, mit dem 192-Bit SI kann man 1,5GiB verbauen und bei einem solchen Takt läuft der Speicher wohl deutlich unter 1,5V.

Spasstiger
2010-06-02, 13:30:46
60 GB/s sind immer noch ungefähr soviel Speicherbandbreite wie eine Mobility Radeon HD 5870 liefert (max. 64 GB/s, je nach Hersteller auch weniger). Für 192 SPs @ 1350 MHz (= 518,4 GFlops) ist der Speichertakt ausreichend hoch.
Die GeForce GTX 480M hat 584,8 GFlops und 76,8 GB/s, das Verhältniss von Rechenleistung zu Speicherbandbreite ist also ähnlich wie bei der GTX 460M. Für ein gleiches Verhältnis müsste die GTX 460M mit 709 MHz Speichertakt arbeiten (2,84 Gbps).
Die GTX 480 (Desktop) hat 1344 GFlops an 177,4 GB/s Speicherbandbreite, auch wieder ein ähnliches Verhältnis wie bei der GTX 480M.

mapel110
2010-06-02, 16:24:07
http://www.bit-tech.net/news/hardware/2010/06/02/nvidia-geforce-gtx-460-specs-and-launch-dat/1?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+bit-tech%2Fall+%28bit-tech.net+feed%29
Anfang/Mitte July soll GF104 kommen.

AnarchX
2010-06-02, 16:47:56
Ein wilder Mix an Gerüchten. :D

GTX 480 Speed wird wohl eher ein voller GF104 mit OC erreichen können. Wozu vielleicht auch die 180W TDP gehört.
Und 240SPs sind wohl eine LE-Version des GF104, die als GTS 400 an den Start geht.

Aber zuversichtlich ist, dass man GF104 schon Mitte Juli erwarten kann.

Spasstiger
2010-06-02, 18:11:42
Die 240 SPs wurden alleine aufgrund des 192 Bit breiten SI angenommen:
GTX 460: 786MB of GDDR5 - yes, I've had that confirmed. 240-stream processors is our calculation based on the relation of SIMD count to memory bit-width compared to other Fermi architecture cards. 480/384bit/1536MB, 448/320/1280, 352/256/1,000, 240/192/786MB. Some partners could double the GDDR5 density to 1536MB, but I think Nvidia really wants to hit a price and performance point. It needs to compete well with HD 5770.
Da halte die 336 SPs doch für realistischer, gerade in Verbindung mit der Aussage, dass man mit OC an die GTX 480 rankäme.

Leonidas
2010-06-02, 18:16:39
GF108 wird wohl kaum mehr ALUs pro TMU haben als GF106. ;)


Jo, da war ein Fehler im Fehler. Ist nun korrigiert, GF106 mit 32 TMUs.


Aber: Wenn Bit-Tech
http://www.bit-tech.net/news/hardware/2010/06/02/nvidia-geforce-gtx-460-specs-and-launch-dat/1
Recht behalten, dann ist der GF106 deutlich kleiner, womöglich nur 256 SP und 192 Bit im Vollausbau. Wie man damit aber - trotz Übertaktung eine GTX460 erreichen will, ist mir unklar, das würde nur mit mehr SPs gehen und auch mehr Speicherbandbreite wäre nicht schlecht. Zumindest das kleinere Speicherinterface ist aber ziemlich sicher angesichts der 768 MB Speicher.

Update: Gemäß vorstehendem Posting erledigt sich das. Wenn man mit 192 Bit SI im OC-Betrieb die GTX480 erreichen will, dann sind maximal 384SP nicht unwahrscheinlich für den GF104.


Nebenbei halte ich eine 768-MB-Karte für DoA für einen Preisbereich ab überhalb von 100 Euro. 1024 MB sind die heutige Standardgröße und auch die Spieleentwickler erwarten für eine Karte des Jahres 2010 diese Speichergröße. Kann also langfristig zum großen Problem werden, wenn man nur 768 MB hat.

Spasstiger
2010-06-02, 18:23:07
Du bringst wieder was durcheinander, statt GF106 meinst du wohl GF104.
Ich denke, dass die bisherigen Gerüchte schon passen. Also 336 SPs, 56 TMUs und 192 Bit SI mit Taktraten zwischen der GTX 470 und der GTX 480.
Es gab ja diesen Screenshot vom 3DMark-Vantage-Run einer GTX 460. Da lag die Texelfüllrate in den theoretischen Tests höher als bei einer GTX 470 (passt zu 56 TMUs), aber die Shader- und Gesamtleistung war eher auf GTX-465-Niveau (passt zu 336 SPs).
Und die von zwei unabhängigen Quellen angegebene Diesize über ATIs Cypress spricht auch dafür, dass der GF104 sehr breit angelegt ist.

Update: Gemäß vorstehendem Posting erledigt sich das. Wenn man mit 192 Bit SI im OC-Betrieb die GTX480 erreichen will, dann sind maximal 384SP nicht unwahrscheinlich für den GF104.
Wobei die Aussage zur Performance nahe einer GTX 480 sich ja explizit auf die GPU der GTX 460, nicht auf die GTX 460 selbst bezog. Mit einem 256 Bit breiten SI, 384 SPs und 64 TMUs im Vollausbau wäre das schon möglich. Der Speichertakt müsste dann halt irgendwo jenseits von 1200 MHz (4,8 Gbps) und der Shadertakt bei rund 1600-1700 MHz liegen (je nachdem, wie vorteilhaft die höhere Texelfüllrate ist).

AnarchX
2010-06-02, 18:23:24
Die 192-Bit GTX 460 wird wohl kaum eine 480 erreichen können, mit der GPU mag es möglich sein mit viel Spannung die 2GHz Hot-Clock zu erreichen, aber bei der Speicherbandbreite hat man da keine Chance. Und 0.33ns Speicher wird wohl NV kaum bei 3,6Gbps verbauen.

Spasstiger
2010-06-02, 18:34:01
Ich denke eher, dass man bei NV in den Labors mit dem GF104 rumgespielt hat und dabei auf GTX-480-Performance gekommen ist. Das war dann sicherlich ein GF104 im Vollausbau mit schnellem Speicher und einem entsprechend leistungsfähigen PCB.
Der Nvidia-Vertreter auf der Computex war davon wahrscheinlich so begeistert, dass er das auch gleich im Zusammenhang mit dem ersten GF104-Produkt - der GTX 460 - erwähnen musste.

aylano
2010-06-03, 00:04:06
GF104
384SP, 64TMU, 256Bit SI
Preisbereich 200-300 Euro
DualChip-Ausführung möglich, welcher stärker als GF100 im Vollausbau wäre

GF106
192SP, 32TMU, 192Bit SI
Preisbereich 120-180 Euro

GF108
96SP, 16TMU, 128Bit SI
Preisbereich 60-90 Euro
@An alle gerichtet
Okay, diese Abstufung klingt irgendwie logisch, wenn der GF100 mit 512-Shader @ 64 TMU eigentlich klar als Server-GPU sowie Extrem-Gaming (wo der Stromverbrauch nicht ganz so ernst genommen wird) mit "Extrem Physx" & "Extrem Tesselation" entwickelt wurde, während der GF104 so quasi der RV870 von Nvidia ist, da er wegen geringeren Shader eben auch geringere PhysX & Tesselastion-Performance besitzt.

Soviel ich weiß, wird Physx & Tesselation über die Shader beschleunigt.
(Warum der Stromverbrauch-Abstand beim 480GTX zwischen Spiele (230Watt) und Furmark (305Watt) entsteht bzw. welche Einheiten bei Spiele nicht benutzt werden und im Furmark schon, ist mir immer noch ein Rätsel.)

Was mir aber noch fehlt ist eine Low-End GPU.
Denn der GF108 mit 96 Shader könnte nur als Mainstream-Notebook-GPU verwenden.
Denn der GTS 250 M (96Shader @ 40nm) schafft ja "mit ach und krach" gerade mal 23 Watt. Mit Effizienzsteigerungen in der Fertigung (und Architektur) könnten 15-23 Watt durchaus möglich sein, was für mainstream-Notebook-GPUs typisch ist.
Oder, wenn der GF104 190 Watt-TDP (unter Spiele) hat, dann wäre 1/4 (=96Shader) so um die 50 Watt-Desktop. Und dieser Wert wäre typisch für GPUs, die dann in mainstream-Notebook-GPUs zwischen 15 und 23 Watt verwendet werden.

Also, ein Low-End-GPU mit 32/16 Shader @ 64bit & 16TMU fehlt mir, der dann (Teildeaktiviert) als ION verwendet wird.

5 Dies wäre ja nicht so unlogisch, da Nivida im Professionellen Markt mit 150-200 Mio $ Umsatz sowie 30-50 Mio. $ Gewinn ja ziemlich viel verdient und da zusätzlich 1 Die für den Server/Quadro als ATI (4 Stück mit RV810 & RV830 & RV840 & RV870) auch mehr als Logisch wären.

Leonidas
2010-06-03, 01:33:23
Letzteres (LowEnd) wollte nVidia ja aber gar nicht mit Fermi machen ...

Ailuros
2010-06-03, 09:40:25
Ein wilder Mix an Gerüchten. :D

GTX 480 Speed wird wohl eher ein voller GF104 mit OC erreichen können. Wozu vielleicht auch die 180W TDP gehört.
Und 240SPs sind wohl eine LE-Version des GF104, die als GTS 400 an den Start geht.

Aber zuversichtlich ist, dass man GF104 schon Mitte Juli erwarten kann.

Mit 768MB Speicher wird theoretisch in welcher Aufloesung genau 480 Leistung erreicht? Dass X Aufloesung aber dann auch Y mehr CPU-Limitierung entspricht lassen wir lieber weg :rolleyes:

Ich persoenlich waere mit ~GTX285 Leistung im Durchschnitt erstmal zufrieden.

Uebrigens heisst Mitte Juli satte 2 Monate delay.

Gast
2010-06-03, 11:56:23
Was mir aber noch fehlt ist eine Low-End GPU.


Fermi dürfte zu viel overhead haben um für low-end in 40nm sinnvoll zu sein.

aylano
2010-06-03, 12:37:33
Letzteres (LowEnd) wollte nVidia ja aber gar nicht mit Fermi machen ...
Und warum?

Das wundert mich schon ein bischen, da der Low-End-Markt ja gar nicht so klein ist, vorallem im Notebook-Markt.

Spasstiger
2010-06-03, 12:42:13
Das denke ich auch, der Overhead von Fermi ist sicherlich beachtlich. Die Transistorzahl ist von 1,4 Mrd. (GT200) auf 3,0 Mrd. (GF100) angestiegen. Was ist dabei mitgewachsen? Die Transistoraufwand für die ALUs hat sich grob verdoppelt, 512 statt 240 MADDs/FMAs, mehr Special-Function-ALUs, dafür wurden die MULs und die dedizierten DP-ALUs entfernt.
Die Anzahl an TMUs ist geschrumpft, nimmt man die gesteigerten Fähigkeiten hinzu, ist der Transistoraufwand aber schätzungsweise gleichgeblieben.
Die Anzahl an ROPs ist um 50% gestiegen.
Das Speicherinterface ist schmäler geworden, GDDR5 erfordert aber zusätzliche Logik und zusätzliche Leitungen gegenüber GDDR3, so dass der Transistoraufwand ähnlich sein dürfte.
Den größten Schub hat die Cache-Größe erfahren, der Transistoraufwand dafür dürfte sich grob verdreifacht haben.

Ergo:
ALU-Transistorzahl -> ~ verdoppelt
Cache-Transistorzahl -> ~ verdreifacht
ROP-Transistorzahl -> ~ um die Hälfte gewachsen
TMU- und SI-Transistorzahl -> ~ gleich geblieben
Gesamttransistorzahl -> mehr als verdoppelt

Ich denke, dass man alleine für die Tessellatoren, die Setups und die Infrastruktur beim GF100 mehrere 100 Mio. Transistoren zusätzlich gegenüber dem GT200 anrechnen muss. Ein Low-End-Chip hat derzeit ~300 Mio. Transistoren. Für einen Low-End-Chip auf Fermi-Basis könnte man den Overhead sicherlich noch stark runterbrechen (1 GPC statt 4 GPCs, 1 SM statt 16 SMs), aber nichtsdestotrotz würde der Zusatzaufwand gegenüber einer G8x/G9x/GT2xx-basierenden Architektur erheblich ins Gewicht fallen.

Imo: GF104 ~2,1 Mrd. Transistoren (256 Bit SI), GF106 ~1,3 Mrd. Transistoren (192 Bit SI), GF108 ~800 Mio. Transistoren (128 Bit SI)
Alles darunter wird in der 40-nm-Ära mit dem GT218 (260 Mio. Transistoren) und dem GT216 (486 Mio. Transistoren) abgedeckt. Den GT218 wird man nochmal mit einer Umbenennung in GeForce G 410 und den GT216 mit einer Umbenennung in GeForce GT 415 "auf den aktuellsten Stand" bringen. ;)

Leonidas
2010-06-03, 15:47:29
Aus genau diesem Grund - und weil es nVidia so angekündigt hatte (daß der originale Fermi nicht ins LowEnd geht).

davidzo
2010-06-03, 16:19:28
Und warum?

Das wundert mich schon ein bischen, da der Low-End-Markt ja gar nicht so klein ist, vorallem im Notebook-Markt.

wieso, das mit dem umbenennen funktioniert doch sehr gut im lowend?

entscheidend ist eher das man bereits einen 40nm chip hat und den neuen wohl kaum kleiner und sparsamer machen könnte als den bisherigen.

gegenüber der presse und den gamern, die sowieso kein lowend kaufen, von denen dann aber die kritik stammt wird man argumentieren können, dass man lieber bei etwas mehr rohleistung und taktraten bleibt, anstatt mit dem featureset nachzuziehen, was letzendlich für den Endnutzer auch die bessere wahl ist, der dx11 sowieso nicht benutzt.

Bei der radeon 9000 war es ähnlich. der chip war im mainstream sehr potent mit seiner 4*1 konfiguration und ein echter technologischer fortschritt im mainstream gegenüber der geforce 4mx konkurrenz die immernoch auf dx7.0 setzte. Das er wirklich kein dx9.0 geboten hat spielte keine große rolle, da dx9 erst eine rolle in der spielewelt spielte nachdem nvidia seine völlig gescheiterte implementation bei der fx-serie mit der geforce 6800 endlich verabschiedete.

Sorkalm
2010-06-03, 16:21:38
wieso, das mit dem umbenennen funktioniert doch sehr gut im lowend?

Jau, aber das DX-Level ist beim DAU sowas ähnliches wie die Speichergröße. Dementsprechend muss man halt aufpassen, dass man sich da nicht verrent, ohne DX11-Angebot.

Gast
2010-06-03, 18:40:52
Was ist dabei mitgewachsen? Die Transistoraufwand für die ALUs hat sich grob verdoppelt, 512 statt 240 MADDs/FMAs, mehr Special-Function-ALUs, dafür wurden die MULs und die dedizierten DP-ALUs entfernt.
Der Transistoraufwand für die ALUs dürfte sich locker vervierfacht haben, DP mit halbem Durchsatz gibt es nicht umsonst.

Spasstiger
2010-06-03, 18:52:36
Bei der vierfachen Transistorzahl hätte man auch DP mit gevierteltem Durchsatz und dafür die doppelte SP-Rechenleistung anbieten können. Bei ATI wird ja auch eine 4/5-VEC5-ALU pro DP-FMA genutzt.

AnarchX
2010-06-03, 19:19:10
Und nun auch noch GF108:
http://img17.imageshack.us/img17/1637/ph15a.jpg
http://pc.watch.impress.co.jp/docs/news/event/20100604_372175.html?ref=rss

Spasstiger
2010-06-03, 19:20:20
Passt doch wunderbar ins Bild, sofern sich da Niemand einen Scherz erlaubt und Fake-Bilder abfotografiert.

AnarchX
2010-06-03, 19:23:54
Da wollen wohl die Hersteller, die schon viel zu lange auf GF10x-GPUs warten, Nvidia ärgern. :D

Auch wenn es sich schon abgezeichnet hat, ist GF108 doch ungewöhnlich leistungsfähig für eine "8er-GPU", wenn man da mit G98 oder GT218 vergleicht.

Leonidas
2010-06-03, 19:29:38
Das stimmt und das ist weiterhin eine der großen Unbekannten in der aktuellen Rätselraterei.

Spasstiger
2010-06-03, 19:39:58
Nvidia hat Einiges aufzuholen, da ATI schon seit Oktober mit DX11-Produkten am Markt ist. Offenbar will man jede offerierte DX11-Lösung für DX11-Spiele sinnvoll erscheinen lassen. D.h. kein Low-End mit DX11.
So ein GF108 dürfte mit den Specs von der Diesize her zwischen dem Redwood und dem Juniper von AMD/ATI liegen. Von der Performance her allerdings nur ungefähr Redwood-Niveau.

Das Portfolio für Consumer von NV für die zweite Jahreshälfte:
Enthusiast: GF100 (Vollausbau), Dual-GF104
Desktop-High-End, Mobile-Enthusiast: GF100, GF104 (Vollausbau)
Desktop-Performance, Mobile-High-End: GF106, GF104
Desktop-Mainstream, Mobile-Performance: GF108, GT215
Desktop-Budget, Mobile-Mainstream: GT216
Low-End: GT218

Der GF100 wird dann wahrscheinlich über kurz oder lang aus dem Consumer-Segment verschwinden und vom GF104 bzw. einem Dual-GF104 ersetzt werden.

Hugo
2010-06-03, 19:45:35
warum tritt GF108 mit 1024MB wenn die GTX460 nur 768MB haben soll?
So ganz passt das noch nicht würd ich meinen

AnarchX
2010-06-03, 19:54:54
warum tritt GF108 mit 1024MB wenn die GTX460 nur 768MB haben soll?
So ganz passt das noch nicht würd ich meinen
512MiB sind zu wenig, gerade für eine OEM-Gerät. Da wird es sicherlich auch GT 4xx mit 2GiB geben. Außerdem ist es nur DDR3-Speicher.
Die GTX 460M wird 1,5GiB GDDR5 haben: http://www.forum-3dcenter.org/vbulletin/showthread.php?p=8062037#post8062037

AffenJack
2010-06-03, 19:55:51
naja, dass nen sample 1024mb hat, heißt ja nich viel. Die meisten dürften trotzdem mit 512mb verkauft werden, was auch zur leistung passen sollte.
Wenns mit 1024mb verkauft wird, dann nur um ne große zahl hinschreiben zu können, damits dumme kunden kaufen.

Spasstiger
2010-06-03, 19:57:18
Die GeForce GT 220 ist auch massenhaft mit 1 GiB VRAM (DDR2) verfügbar. Ist doch immer so, im Budet-, Mainstream- und High-End-Segment findet man die dicken Speicherausstattungen und im Performance-Segment die angemessenen Mengen. Siehe auch bei ATI: Radeon HD 5870 -> 1-2 GiB, Radeon HD 5770 -> 1 GiB, Radeon HD 5670/5750 -> 512 MiB, Radeon HD 5570 -> 1 GiB, Radeon HD 5450 -> 512 MiB - 1 GiB

Zumal das auf dem Bild eine Notebook-Lösung sein könnte, wo generell eher zuviel als zu wenig Speicher verbaut wird. Denn Aufrüsten ist im Nachhinein meist nicht möglich oder sehr teuer.

aylano
2010-06-03, 20:48:25
Ich denke, dass man alleine für die Tessellatoren, die Setups und die Infrastruktur beim GF100 mehrere 100 Mio. Transistoren zusätzlich gegenüber dem GT200 anrechnen muss. Ein Low-End-Chip hat derzeit ~300 Mio. Transistoren. Für einen Low-End-Chip auf Fermi-Basis könnte man den Overhead sicherlich noch stark runterbrechen (1 GPC statt 4 GPCs, 1 SM statt 16 SMs), aber nichtsdestotrotz würde der Zusatzaufwand gegenüber einer G8x/G9x/GT2xx-basierenden Architektur erheblich ins Gewicht fallen.

Imo: GF104 ~2,1 Mrd. Transistoren (256 Bit SI), GF106 ~1,3 Mrd. Transistoren (192 Bit SI), GF108 ~800 Mio. Transistoren (128 Bit SI)
Alles darunter wird in der 40-nm-Ära mit dem GT218 (260 Mio. Transistoren) und dem GT216 (486 Mio. Transistoren) abgedeckt. Den GT218 wird man nochmal mit einer Umbenennung in GeForce G 410 und den GT216 mit einer Umbenennung in GeForce GT 415 "auf den aktuellsten Stand" bringen. ;)
Beim RV7x0 --> RV8x0 war der Transistor-Zuwachs (non-Shader & Co) bei ca. 50 Mio. Euro.
Und das sogar mit Evenitiy.

Wenn der Transistor-Zuwachs jetzt bei einem hypotetischen Fermi-Low-End deutlich ansteigt, (RV810 hat ja kaum mehr Transistoren als GT218) dann wird die idle-Stromverbrauch bei Fermi-Low-End ja fast ein Jahrelanges Problem. Na ja, wegen Optimus ja nicht so schlimm, aber jetzt verstehe ich warum Nvidia diese Technologie so gut entwickelt hat.
Außerdem könnte das ja auch erklären, warum Fermi in ilde-Desktop so viel Strom verbrauch obwohl die Takt & Spannung mit 50 Mhz @ 0,88 Volt ja deutlich niedriger als bei RV870 ist.

Wie kann das eigentlich sein?
Könnte es nicht auch sein, dass ATI in der DX10-R6x0-Architektur schon ziemlich viel von DX11 genutzt hat, was lange ungenutzt blieb und daher jetzt dann der Transistor-Sprung bei der DX11-Einführung nicht mehr so groß war.?????????


Das Portfolio für Consumer von NV für die zweite Jahreshälfte:
Enthusiast: GF100 (Vollausbau), Dual-GF104
Desktop-High-End, Mobile-Enthusiast: GF100, GF104 (Vollausbau)
Desktop-Performance, Mobile-High-End: GF106, GF104
Desktop-Mainstream, Mobile-Performance: GF108, GT215
Desktop-Budget, Mobile-Mainstream: GT216
Low-End: GT218
Das ist doch ein ziemlich düsteres Bild von dir, wenn es bis 28nm keine Fermi-Produkte im Low-End & Mainstream-Notebook-Sekment zu finden ist.

Spasstiger
2010-06-03, 21:39:25
Der GF108 hat ja auch noch Abspeckpotential zwecks Resteverwertung, so dass man damit theoretisch auch Low-End bedienen könnte, falls die OEMs Bedarf an billigen DX11-Lösungen suchen. Aber so ein GF108 wird mit seinen schätzungsweise 140-150 mm² Diesize auch abgespeckt kein Billigchip für ein paar $ sein. Für dedizierte Low-End-Grafik wird man imo weiterhin auf den GT218 setzen, da er mit seinen 57 mm² billig herzustellen ist und für die Zielgruppe alles Nötige mitbringt. DX11 macht im Low-End einfach wenig Sinn, weil man eh auf die Sachen, bei denen DX11 vorteilhaft ist, aus Performancegründen verzichten muss. Und in 28 nm wird man dann eh auf DX11 gehen, weil man nicht ewig den Altlasten hinterherrennen will (auch in Bezug auf die Treiberentwicklung).

P.S.: Einen 32-SP-Fermi mit 64-Bit-SI und 4 TMUs schätze ich auf 70-75 mm². Eine 48-SP-Variante mit 64-Bit-SI und 8 TMUs auf 80-85 mm². Der GT216 mit 48 SPs, 128-Bit-SI und 16 TMUs bringt es auf 100 mm². Und der GT218 mit 16 SPs, 64-Bit-SI und 8 TMUs liegt bei 57 mm².
Eine gewisse Chance, dass man zumindest den GT216 durch eine 40-nm-Fermi-Variante ersetzt, sehe ich also noch.

Bucklew
2010-06-03, 22:21:38
According to information we have, GF104 is based on two GPCs, i.e. 256 Cores. There is also a 128 Core version in the works, while the low-cost "netbook edition" with just one computing cluster [32-core] should arrive only with 28nm generation of parts. Read: next-gen ION [ION 3?].

http://www.brightsideofnews.com/news/2010/6/3/nvidia-prepares-mainstream-fermi-for-back-to-school.aspx

Ailuros
2010-06-03, 22:59:20
Das Portfolio für Consumer von NV für die zweite Jahreshälfte:
Enthusiast: GF100 (Vollausbau), Dual-GF104
Desktop-High-End, Mobile-Enthusiast: GF100, GF104 (Vollausbau)
Desktop-Performance, Mobile-High-End: GF106, GF104
Desktop-Mainstream, Mobile-Performance: GF108, GT215
Desktop-Budget, Mobile-Mainstream: GT216
Low-End: GT218

Der GF100 wird dann wahrscheinlich über kurz oder lang aus dem Consumer-Segment verschwinden und vom GF104 bzw. einem Dual-GF104 ersetzt werden.

Wieso soll die GF104/X2 gleichzeitig mit einer 16SM single chip Variante die Enthusiast Sparte bedienen? Wenn ich das Wirrwarr der NV roadmap richtig verstanden habe wird 104/X2 die 480 temporaer ersetzen, waehrend alle vorhandenen GF100 chips als =/<470 weiter verkauft werden. GF100b soll dann ab Herbst die 104/X2 wieder abloesen und wenn sie von dem re-spin genug chips handausgesucht haben kommt davon dann eine echte "high end" GX2 mit 2*100b chips.

Spasstiger
2010-06-03, 23:03:16
Wieso soll die GF104/X2 gleichzeitig mit einer 16SM single chip Variante die Enthusiast Sparte bedienen?
Mobile halt. Da entspricht Enthusiast nur Performace bis High-End am Desktop.

Ailuros
2010-06-03, 23:08:21
Mobile halt. Da entspricht Enthusiast nur Performace bis High-End am Desktop.

Ich hab auf einen Paragraphen geantwortet der sich nur auf Desktop Varianten bezog :rolleyes:

Quark zur Seite dieses GF104/X2 Dingsbums koennte nur interessant fuer mich werden falls es nichts mit AFR zu tun haben sollte. Ich glaub es zwar noch nicht, aber ich bin mir sicher dass NV an aehnlichem herumexperimentiert.

Spasstiger
2010-06-03, 23:10:17
Ich hab auf einen Paragraphen geantwortet der sich nur auf Desktop Varianten bezog :rolleyes:
Hm? Du meinst den letzten Satz von mir? Der bezieht sich auf den GF100 und entsprechend alle Segmente, in denen der GF100 vertreten ist.

Ailuros
2010-06-03, 23:17:59
Hm? Du meinst den letzten Satz von mir? Der bezieht sich auf den GF100 und entsprechend alle Segmente, in denen der GF100 vertreten ist.

Nein das hier:

Enthusiast: GF100 (Vollausbau), Dual-GF104

Eine 104X2 wird hauptsaechlich die Rolle des Lueckenfuellers spielen bis GF100b in die Startloecher kommen kann (das was Du als GF100 (Vollausbau) bezeichnest und ich GF100b (respin) nenne). Eine optimistische Projektion spricht von Anfang September fuer den letzteren aber ich bin da nicht so optimisch da eine 104X2 fruehestens einen Monat spaeter nach GF104 erscheinen wird und zumindest 2 Monate unterwegs sein wird.

Waere die gesamte roadmap dank GF100 nicht so abgekackt haette es die 104 schon im April und die X2 davon schon im Mai geben sollen.

Gast
2010-06-04, 00:03:03
Bei der vierfachen Transistorzahl hätte man auch DP mit gevierteltem Durchsatz und dafür die doppelte SP-Rechenleistung anbieten können. Bei ATI wird ja auch eine 4/5-VEC5-ALU pro DP-FMA genutzt.

4-fache Transistormenge gegenüber G200. Davon 2x durch die ca. doppelte Anzahl und 2x um DP mit der entsprechenden Geschwindigkeit durchführen zu können.

Leonidas
2010-06-04, 05:27:05
warum tritt GF108 mit 1024MB wenn die GTX460 nur 768MB haben soll?
So ganz passt das noch nicht würd ich meinen


Es geht nicht anders wegen des Speicherinterfaces. Wenn die GTX460 wirklich mit einem 192 Bit Interface kommt, sind nur Speichergrößen von 768MB und 1536MB möglich. Und 1536MB sind nVidia möglicherweise zu teuer bei einer GTX460 - bei welcher NV ja sowieso aufpassen muß, nicht schneller als die GTX465 zu werden.

Spasstiger
2010-06-04, 16:19:32
Man muss dazu noch erwähnen, dass 768 MiB GDDR5-Speicher mit 4 Gbps deutlich teurer sein dürfte als 1024 MiB DDR3-Speicher mit 1,6 Gbps.

Gast
2010-06-04, 21:45:24
Nein das hier:

Waere die gesamte roadmap dank GF100 nicht so abgekackt haette es die 104 schon im April und die X2 davon schon im Mai geben sollen.

Was hat die Verzögerung beim GF100 mit dem GF104 zu tun? Hat man GF104 2 Monate nicht produziert um mit GF100 mehr Erfahrung/Besserung im Fertigungsprozess zu gewinnen?
Wenn das stimmt, ist GF104 evtl ja einen "Schritt" weiter und läuft besser als geplant. Mainstream ahoi

Ailuros
2010-06-05, 09:15:42
Was hat die Verzögerung beim GF100 mit dem GF104 zu tun? Hat man GF104 2 Monate nicht produziert um mit GF100 mehr Erfahrung/Besserung im Fertigungsprozess zu gewinnen?
Wenn das stimmt, ist GF104 evtl ja einen "Schritt" weiter und läuft besser als geplant. Mainstream ahoi

Es gab bei NV keine so parallele Entwicklung von GF10x chips so wie in etwa Cypress und Juniper. Grob vereinfacht zuerst musste GF100 Stadium X erreichen bis man mit den anderen weitermachen kann.

Der Stromverbrauch auf 104 koennte trotz allem immer noch etwas hoeher ausfallen als NV es am Anfang geplant hatte, aber ich glaube auch nicht dass sie nicht versucht haben etwas am 104 in der Zwischenzeit zu drehen.

Wenn 104 tatsaechlich fuer Mitte Juli anliegt dann haben sie sowieso nicht vor allzu langer Zeit mit der Produktion des chips angefangen.

Gast
2010-06-05, 11:06:05
Die gab es sicherlich - nur hat's bei AMD besser geklappt, weil man zunächst den Prozess ausprobierte und etwas weniger "Fusion" in die Ausführungseinheiten integrieren wollte. Das kann man ja jederzeit mit dem hauseigenen x86-Kram nachholen.

Bei Nvidia musste man, wie du sagst, nur warten, bis Punkt X erreicht war bevor man weitermachen konnte. Der war im Gegensatz zu AMD eben sehr spät erreicht. AMD hat seine DX11-Familie ja auch über sechs Monate (September bis Februar) verteilt auf den Markt gebracht.

-carsten

Gast
2010-06-05, 11:27:00
Bei Nvidia musste man, wie du sagst, nur warten, bis Punkt X erreicht war bevor man weitermachen konnte. Der war im Gegensatz zu AMD eben sehr spät erreicht. AMD hat seine DX11-Familie ja auch über sechs Monate (September bis Februar) verteilt auf den Markt gebracht.

-carsten

Es waren eher vier als sechs Monate (Ende September bis Anfang Januar AFAIK). Cypress und Juniper kamen beinahe zeitgleich, das war schon einmalig. Normalerweise kommt erstmal der High-End-Part, dann eine längere Pause und dann relativ zügig die kleineren Modelle. AMD ist hier offenbar auf Risiko gegangen und hat die beiden parallel zum Tapeout geschickt. Das bedeutet bei einem Designfehler natürlich auch doppelte Arbeit.

Gandharva
2010-06-05, 11:54:04
Wann soll GF106 kommen? Auch Mitte Juli?

Gast
2010-06-06, 11:49:03
Es waren eher vier als sechs Monate (Ende September bis Anfang Januar AFAIK).
Das NDA für die letzten Evergreens fiel im Februar. Anfang (5570) oder Ende (5830, wenn man den mitrechnen will). Der letzte ASIC war Cedar am 4.2..

Cypress und Juniper kamen beinahe zeitgleich, das war schon einmalig. Normalerweise kommt erstmal der High-End-Part, dann eine längere Pause und dann relativ zügig die kleineren Modelle. AMD ist hier offenbar auf Risiko gegangen und hat die beiden parallel zum Tapeout geschickt. Das bedeutet bei einem Designfehler natürlich auch doppelte Arbeit.
MMn: Jein. Ich glaube, AMD hat hier ein eher geringes Risiko gewählt und die Basic Blocks anhand von Juniper entwickelt, zumindest aber Juniper weitaus früher an die Entwickler geschickt, was auf ein früheres Tapeout hindeuten könnte. Allgemein hatte AMD einen wesentlich zügigeren Zeitplan als Nvidia, welche an ihrer Architektur nicht nur mehr Änderungen durchgeführt haben, sondern dies im Gegensatz zu AMD auch unbedingt mussten, weil "GT200+DX11" vs. "RV790+DX11" für Nvidia eine verlorene Situation gewesen wäre.

-carsten

AnarchX
2010-06-10, 08:17:01
Wohl $230 MSRP für die GTX 460: http://hardocp.com/news/2010/06/09/nvidias_immediate_roadmap_rumors

Bei GF106 ist man wohl optimistisch mit Juniper mithalten zu können bei einem MSRP von $129-179.

Sofern AMD nicht die Preise senkt, wird sich wohl auch im 2. Halbjahr nicht viel am aktuellen Preisniveau ändern.

AnarchX
2010-06-11, 19:17:54
Der volle GF104 soll wohl als GTX 468 veröffentlicht werden: http://translate.google.de/translate?u=http%3A%2F%2Fwww.enet.com.cn%2Farticle%2F2010%2F0611%2FA201006116682 21.shtml&sl=zh-CN&tl=en&hl=&ie=UTF-8

LuXon
2010-06-11, 20:42:32
Der volle GF106 wird dann wohl als GTS440,51 in die Geschichte eingehen...........


Nein. Also bitte. Wie kann man auf solche Namen kommen?`
Würfeln die die Namen etwa?

Kann man die Daten jetzt endlich als bestätigt ansehen?

Spasstiger
2010-06-11, 22:40:10
Der volle GF104 kann nach den Eckdaten (384 SPs, 64 TMUs, 256-Bit-SI), die man jetzt wohl als gesichert ansehen kann, GTX-470-Niveau erreichen, wenn die Taktraten an der oberen Grenze des Realistischen für ein Serienmodell kratzen. Die Bezeichnung GTX 468 passt imo sehr gut ins Bild. Nur die GTX 465 ist namentlich zu nah an der GTX 470.

Ailuros
2010-06-12, 08:30:34
Der volle GF104 kann nach den Eckdaten (384 SPs, 64 TMUs, 256-Bit-SI), die man jetzt wohl als gesichert ansehen kann, GTX-470-Niveau erreichen, wenn die Taktraten an der oberen Grenze des Realistischen für ein Serienmodell kratzen. Die Bezeichnung GTX 468 passt imo sehr gut ins Bild. Nur die GTX 465 ist namentlich zu nah an der GTX 470.

Ich weiss zwar nicht wann der volle 104 anliegen soll, aber es sieht mir nicht danach aus als ob er vor dem high end refresh ankommen koennte. Ausser natuerlich die 470 geht frueher als erwartet EOL.

Anfangs = 336SPs@675MHz
Spaeter = 384SPs@=/>700MHz
Noch spaeter (die shrinks ahoi) = =/>800MHz

Hugo
2010-06-12, 10:01:35
@Ailuros
mit high end refresh meinst du den GF100B?

AnarchX
2010-06-12, 13:20:15
Nochmal die GTX 460 mit nicht retuschiertem Treiberscreen:
http://img813.imageshack.us/img813/160/41953271276326614493102.png
http://itbbs.pconline.com.cn/diy/11506815.html

Bleibt die Frage ob man sich 768MiB wirklich einen Gefallen im Bezug auf die Leistung tut. 1,5GiB 0.5ns GDDR5 sollte wohl heute kaum noch etwas kosten, wenn man sich die Speicherausstattungen der Mainstream-HD5000 anschaut. Aber die Hersteller werden wohl für entsprechenden Versionen sorgen.

Spasstiger
2010-06-12, 13:47:45
1,5 GiB GDDR5 bekommt man an einem 192-Bit-SI derzeit nur unter, wenn man 12 statt 6 Speicherchips verwendet. Das erhöht die Leistungsaufnahme. Bei der 8800 GT 1024 MiB lag z.B. die idle-Leistungsaufnahme um 10 Watt höher als die der 8800 GT 512 MiB.

sulak
2010-06-12, 14:32:39
Verstehe nicht, warum erst die beschnittene Variante auf den Markt kommt. Hat man denn soviel Ausschuss an nicht GTX470 fähigen GPUs das man deswegen dieses Theater betreibt? Am vollständigen GF104 sind doch viel mehr Leute interessiert als an der GTX460/465...

Gast
2010-06-12, 14:36:56
Warum sollten mehr an einer ~$300 Lösung interessiert sein, als an einer $230 Lösung?
Und auf den GTX 470/465 Dies will man wohl nicht sitzen bleiben.

Botcruscher
2010-06-12, 14:42:17
Aus Kundensicht dürfte da wohl vermutlich als erstes die Leistungsaufnahme stehen.
NV geht es halt darum in den unteren Segmenten überhaupt etwas anbieten zu können. Gleichzeitig muss auch noch der Müll in Form der 465er/470er raus. Gegen einen vollen GF104 dürften die im Gesamtpaket kein Land sehen. Das erklärt auch die "günstigen" Preise der 470. Die Karte wird wohl EOL oder zumindest aufs Abstellgleis gehen.

Ailuros
2010-06-13, 08:01:20
@Ailuros
mit high end refresh meinst du den GF100B?

Ja. http://forum.beyond3d.com/showpost.php?p=1439046&postcount=6000

sulak
2010-06-15, 18:05:15
Warum sollten mehr an einer ~$300 Lösung interessiert sein, als an einer $230 Lösung?
Und auf den GTX 470/465 Dies will man wohl nicht sitzen bleiben.

Peanuts, will kein Heizkörper in Form einer GTX470 wenn ich mit ein wenig Geduld eine GTX468 (oder wie auch immer der volle GF104 sich schimpft) mit fast gleicher Leistung aber ohne Turbine bekommen kann. Denn noch reicht eine GTX260 für 1920er Auflösung...
Auf den Shrink darf man aber nicht warten, der ist locker 1Jahr entfernt.

Spasstiger
2010-06-15, 19:19:11
Die GTX 468 wird sicherlich auch ihre 180-200 Watt TDP haben. Ein Stromsparwunder würde ich nicht erwarten. Und ich gehe auch nicht davon aus, dass die GTX 468 im Referenzdesign leiser ist als die GTX 470 im Referenzdesign, weil die GTX 468 sicherlich noch 1 cm kürzer ausfällt als die GTX 470. Bei einem 256-Bit-Speicherinterface muss die Karte nicht länger als 24 cm sein.

sulak
2010-06-15, 20:13:14
Erwarte ich ja nicht, aber bei der GPU haben sie bei der Selektierung doch mehr Freiheit und wenn das Design umgekrempelt wurde, hoffe ich das die Transistorzahl mal ein wenig im Haus bleibt. An GF100 muss man doch gesehen haben was nicht richtig funktioniert hat, und warum man soviel Spannung auf das Design geben muss, damit wenigstens GTX470 Spezifikation erreicht wird.
Aber seit G200(b) hoffe ich auf garnichts mehr, Flaschenhals vom G80 Design erkannt und nichts dran geändert, das war eine herbe Enttäuschung auch wenn ich mit der GTX260 voll zufrieden bin (hab bis heute nicht verstanden warum die 256Bit SI Version des G2xx gecancelt wurde).

Dural
2010-06-15, 20:40:58
so viel Spannung?!? 1,0Volt kann man nicht gerade als viel bezeichnen und klar im Rahmen für so eine GPU.

y33H@
2010-06-15, 21:11:57
Eine GTX480 hat eine niedrigere Spannung als eine HD5850 ...

ShinyMcShine
2010-06-16, 15:10:54
Die GTX 468 wird sicherlich auch ihre 180-200 Watt TDP haben. Ein Stromsparwunder würde ich nicht erwarten. Und ich gehe auch nicht davon aus, dass die GTX 468 im Referenzdesign leiser ist als die GTX 470 im Referenzdesign, weil die GTX 468 sicherlich noch 1 cm kürzer ausfällt als die GTX 470. Bei einem 256-Bit-Speicherinterface muss die Karte nicht länger als 24 cm sein.

Wenn die in den heutigen 3D-Center News gepostete TDP für eine GTX460 mit 336SPs stimmt, und "nur" 130 Watt beträgt kann ich mir nicht vorstellen, dass ein voller GF104 mit 384SPs und einer evtl. leichten Takterhöhung auf 700MHz gleich 200 Watt verbraten soll. Damit bewegt man sich wieder auf niedrigem GF100-Niveau, wobei der GF104 dank der erwarteten "Abspeckungen" doch deutlich weniger Transistoren haben sollte!

VG
Shiny (der auch auf eine GTX468 hofft)

Spasstiger
2010-06-16, 15:22:27
Der GF104 hat wohl so ca. 2,1 Mrd. Transistoren (GF100: 3,0 Mrd.).
Und die 130 Watt für eine GTX 460 sind nur ein Gerücht, andere Gerüchte sprechen von 160-170 Watt bei der GTX 460.
Ich gehe bei 336 SPs @ 1350 MHz und 64 TMUs @ 675 MHz jedenfalls von mehr als 130 Watt TDP aus. Imo klingen 160 Watt realistischer, wenn es die GTX 480 auf 250 Watt TDP und die GTX 465 auf 200 Watt TDP bringen. Zumal die GTX-460-PCBs zwei 6-Pin-Stromanschlüsse haben sollen, was bei 130 Watt TDP nicht nötig wäre.
130 Watt TDP wären für mich eine echte Überraschung. Das wäre gegenüber der etwa gleichschnellen GTX 465 immerhin eine Reduzierung um rund 1/3 bzw. 70 Watt.

Gast
2010-06-16, 19:14:16
Der GF104 hat wohl so ca. 2,1 Mrd. Transistoren (GF100: 3,0 Mrd.).

Ist das eigentlich endlich mal bestätigt? Ich lese immer noch oft 3,2Mrd. für GF100.

V2.0
2010-06-16, 20:06:11
Der GF104 hat wohl so ca. 2,1 Mrd. Transistoren (GF100: 3,0 Mrd.).
Und die 130 Watt für eine GTX 460 sind nur ein Gerücht, andere Gerüchte sprechen von 160-170 Watt bei der GTX 460.
Ich gehe bei 336 SPs @ 1350 MHz und 64 TMUs @ 675 MHz jedenfalls von mehr als 130 Watt TDP aus. Imo klingen 160 Watt realistischer, wenn es die GTX 480 auf 250 Watt TDP und die GTX 465 auf 200 Watt TDP bringen. Zumal die GTX-460-PCBs zwei 6-Pin-Stromanschlüsse haben sollen, was bei 130 Watt TDP nicht nötig wäre.
130 Watt TDP wären für mich eine echte Überraschung. Das wäre gegenüber der etwa gleichschnellen GTX 465 immerhin eine Reduzierung um rund 1/3 bzw. 70 Watt.

Das hängt davon ab, ob man für die 460 ein eigenes PCB verwendet oder es eben nur teilbestückt.

Spasstiger
2010-06-16, 20:12:41
Die GTX 460 wird sicherlich ein eigenes PCB-Design haben. Warum unnötige Kosten? Ich denke, dass die GTX 460 um die 22 cm lang sein wird, also einen Tick länger als die Radeon HD 5770.

@Gast: Eine Bestätigung für die 3,0 Mrd. Transistoren hab ich nicht. Aber irgendwo um den Dreh scheint die Transistorzahl zu liegen. Wenn der GF100 3,2 Mrd. Transistoren hat, dann gehe ich beim GF104 von ~2,25 Mrd. Transistoren aus.

ShinyMcShine
2010-06-17, 07:54:58
nVidia spricht doch selbst von 3 Mrd. Transistoren (http://www.nvidia.com/object/GTX_400_architecture.html).

VG
Shiny

Dural
2010-06-17, 10:24:37
in GPUZ steht 3.2 und da die infos sicher direkt von NV kommen stimmen die bestimmt auch, im marketing kommt halt nur die runde 3 zum einsatz

mapel110
2010-06-17, 10:39:53
Warum soll die Info bei GPU-Z direkt von nvidia kommen?! Eher saugt sich der GPU-Z-Programmierer Dinge aus den Fingern.
Iirc sind sich die Experten im Beyond3D.com-Forum einig, dass es 3,0 Milliarden Transistoren sind. So stehts auch in den technischen PDFs von nvidia.

Gast
2010-06-17, 11:12:15
GTX 460 768MB und 1024MB am 12. Juli: http://www.fudzilla.com/content/view/19206/34/

Vielleicht meint man in der Quelle eher GTX 460 Series mit 460 und 468. Oder es kommt wirklich eine "Premium GTX 460" mit 1024MiB, die dann vielleicht etwas weniger Speichertakt hat.

ShinyMcShine
2010-06-17, 11:20:05
GTX 460 768MB und 1024MB am 12. Juli: http://www.fudzilla.com/content/view/19206/34/

Vielleicht meint man in der Quelle eher GTX 460 Series mit 460 und 468. Oder es kommt wirklich eine "Premium GTX 460" mit 1024MiB, die dann vielleicht etwas weniger Speichertakt hat.

Ich denke nicht, das es eine GTX 460 mit dem krummen Speicherinterface von 192 Bit und einer Speichermenge von 1024MB geben kann.

Außer nVidia entschliesst sich gleich eine GTX 460 mit dem vollen SI von 256 Bit rauszubringen, aber die werden dann bestimmt nicht die gleiche Bezeichnung haben. Man müßte dann das GB GDDR5 nur mit 1350 MHz takten, um auf die gleiche Bandbreite zu kommen wie bei 192 Bit @ 1800 MHz. :wink:

Ich denke nicht dass sich nVidia das antun wird, nur um eine GTX 460 mit 768MB und eine mit 1024MB zu haben.

Ebenso halte ich es für unwahrscheinlich, dass es gleich die GTX 468 geben wird (ich hätte aber nichts dagegen).

VG
Shiny

AnarchX
2010-06-17, 11:36:47
http://img709.imageshack.us/img709/6337/a3993252s.jpg
http://diybbs.zol.com.cn/10/198_97089.html

Das ist wohl ein Sample der 256-Bit Version: http://www.forum-3dcenter.org/vbulletin/showthread.php?p=8047453#post8047453

Spasstiger
2010-06-17, 12:09:14
Eine 192-Bit- und eine 256-Bit-Version unter dem gleichen Namen wäre mal wieder etwas verwirrend, aber auch nicht völlig absurd. Dann haben wir halt eine GTX 460 768 und eine GTX 460 1024 nach Nvidias Namensschema.
Die Speicherbandbreite dürfte bei der 256-Bit-Variante auch höher ausfallen, denn für nur 675 MHz Speichertakt (2,7 Gbps) sehe ich bei einer Desktopkarte keine Veranlassung. Imo wird man der 256-Bit-Variante 800 MHz Speichertakt verpassen (3,2 Gbps).

Nach den Bildern von AnarchX wäre die GTX 460 "1024" rund 22,3 cm lang, wobei ich davon ausgehe, dass das Gitter auf 1/8 Zoll eingestellt ist. 70 Pixel in der Grafik entsprechen dann einem Zoll. Das passt zur Länge des PCIe-x16-Connectors.
Der Chipträger hat dann eine Innenfläche von ca. 47-48 mm * 37-38 mm und der innere Pinbereich ca. 24-25 mm * 14 mm.

/EDIT: Wobei, wenn ich mir den PCIe-Connector nochmal anschaue, würde ich eher auf 74-75 Pixel pro Zoll korrigieren. Ergo ~ 23 mm * 13 mm = 299 mm² innerer Pinbereich. Das Die dürfte irgendwo im Bereich von dem Leerraum drumrum abschließen, der mit dem inneren Pinbereich zusammen eine Fläche von ca. 25,5 mm * 16 mn = 408 mm² abdeckt. Die Diesize liegt also irgendwo zwischen 300 und 400 mm². Die Transistorzahl kann man damit auf 1,6 Mrd. bis 2,4 Mrd. schätzen.

ShinyMcShine
2010-06-17, 12:14:16
Der Chipträger hat dann eine Innenfläche von ca. 47-48 mm * 37-38 mm und der innere Pinbereich ca. 24-25 mm * 14 mm.

Daraus kann man doch bestimmt auch die ungefähre Anzahl der Transistoren ableiten?

VG
Shiny

Dural
2010-06-17, 12:16:25
ich würde einfach mal sagen das die 1gb versinon die volle gf104 version ist oder auch einfach eine andere... zwei versionen mit je 192 oder 256Bit und den 336SP halt ich für ausgeschlossen, wo ist den da bitte der sinn bei einem nigel nagel neuen Produkt/Chip??? wenn man mehr speicher haben möchte haut man halt einfach 1,5GB drauf und das wird es sicher geben...

@mapel110 NV hat bis heute auch noch nicht die genaue DIE grösse genannt, ich geh klar von 3,2M aus...

Spasstiger
2010-06-17, 12:19:01
Daraus kann man doch bestimmt auch die ungefähre Anzahl der Transistoren ableiten?

VG
Shiny
Nein. /EDIT: Ok, man kann grob auf 1,6 Mrd. bis 2,4 Mrd. schätzen. Siehe mein /EDIT oben. Ich persönlich gehe von 2,1-2,2 Mrd. aus.

ShinyMcShine
2010-06-17, 12:24:08
Danke Dir! ;)
Wenn man mal die Die Größe des GF100 von 570mm² dagegen anschaut, hat nVidia hier (selbst bei der oberen Grenze von 400mm²) schon ordentlich eingespart.

VG
Shiny

Ailuros
2010-06-17, 15:21:02
Eine 192-Bit- und eine 256-Bit-Version unter dem gleichen Namen wäre mal wieder etwas verwirrend, aber auch nicht völlig absurd. Dann haben wir halt eine GTX 460 768 und eine GTX 460 1024 nach Nvidias Namensschema.
Die Speicherbandbreite dürfte bei der 256-Bit-Variante auch höher ausfallen, denn für nur 675 MHz Speichertakt (2,7 Gbps) sehe ich bei einer Desktopkarte keine Veranlassung. Imo wird man der 256-Bit-Variante 800 MHz Speichertakt verpassen (3,2 Gbps).

Nach den Bildern von AnarchX wäre die GTX 460 "1024" rund 22,3 cm lang, wobei ich davon ausgehe, dass das Gitter auf 1/8 Zoll eingestellt ist. 70 Pixel in der Grafik entsprechen dann einem Zoll. Das passt zur Länge des PCIe-x16-Connectors.
Der Chipträger hat dann eine Innenfläche von ca. 47-48 mm * 37-38 mm und der innere Pinbereich ca. 24-25 mm * 14 mm.

/EDIT: Wobei, wenn ich mir den PCIe-Connector nochmal anschaue, würde ich eher auf 74-75 Pixel pro Zoll korrigieren. Ergo ~ 23 mm * 13 mm = 299 mm² innerer Pinbereich. Das Die dürfte irgendwo im Bereich von dem Leerraum drumrum abschließen, der mit dem inneren Pinbereich zusammen eine Fläche von ca. 25,5 mm * 16 mn = 408 mm² abdeckt. Die Diesize liegt also irgendwo zwischen 300 und 400 mm². Die Transistorzahl kann man damit auf 1,6 Mrd. bis 2,4 Mrd. schätzen.

Bitte nicht hauen aber die von Anfang an angebenen ~375mm2 waren und sind durchaus realistisch.

AnarchX
2010-06-17, 15:28:49
Danke Dir! ;)
Wenn man mal die Die Größe des GF100 von 570mm² dagegen anschaut, hat nVidia hier (selbst bei der oberen Grenze von 400mm²) schon ordentlich eingespart.

VG
Shiny
GF100 ist eher um die ~530mm² groß: http://www.forum-3dcenter.org/vbulletin/showthread.php?p=8047445#post8047445

aylano
2010-06-17, 15:33:39
http://img709.imageshack.us/img709/6337/a3993252s.jpg
http://diybbs.zol.com.cn/10/198_97089.html

Das ist wohl ein Sample der 256-Bit Version: http://www.forum-3dcenter.org/vbulletin/showthread.php?p=8047453#post8047453

Ist das A1-Stepping für den Markt gedacht, oder gibts da noch ein A2-Stepping (, der dann die vollen Shader & Co nutzen soll?)

ShinyMcShine
2010-06-17, 15:39:27
GF100 ist eher um die ~530mm² groß: http://www.forum-3dcenter.org/vbulletin/showthread.php?p=8047445#post8047445

Ah, OK! Dann gibt es auch hier zwei Versionen (passend zu den 3,0 bzw. 3,2 Mrd Transistoren) die man im Netz finden kann! :D

VG
Shiny

Ailuros
2010-06-17, 15:51:38
Ich hab die letzten paar Seiten ein paar Mal durchgekaemmt aber konnte nichts davon lesen:

http://www.fudzilla.com/content/view/19199/1/

Gibt es tatsaechlich irgend einen geleakten shot der auf 104 zwei deaktivierte SMs zeigt? Wenn ja dann koennte der Author oben recht haben mit 16SMs - 24SPs/SM.

Ergo falls etwas daran liegen sollte 8+8+8 oder 16+8? Auf jeden Fall erklaeren 16 SMs erstmal die 64TMUs aber wenn etwas daran liegen sollte, dann wuerde ich liebend gerne wissen ob es sich um 2 oder sogar 4GPCs auf diesem handeln wuerde. Wenn auch hier jeder SM bis zu 2 pixels rastern kann, dann sind die 32 ROPs mit 32pixels/clock erstmal nicht absurd.

Liegt etwas an dem Zeug oder ist es nur eine falsch ausgelesene These?

Konami
2010-06-17, 16:00:02
Ich hab die letzten paar Seiten ein paar Mal durchgekaemmt aber konnte nichts davon lesen:

http://www.fudzilla.com/content/view/19199/1/

Gibt es tatsaechlich irgend einen geleakten shot der auf 104 zwei deaktivierte SMs zeigt? Wenn ja dann koennte der Author oben recht haben mit 16SMs - 24SPs/SM.

Ergo falls etwas daran liegen sollte 8+8+8 oder 16+8? Auf jeden Fall erklaeren 16 SMs erstmal die 64TMUs aber wenn etwas daran liegen sollte, dann wuerde ich liebend gerne wissen ob es sich um 2 oder sogar 4GPCs auf diesem handeln wuerde. Wenn auch hier jeder SM bis zu 2 pixels rastern kann, dann sind die 32 ROPs mit 32pixels/clock erstmal nicht absurd.

Liegt etwas an dem Zeug oder ist es nur eine falsch ausgelesene These?
Die GTX 468 soll jetzt plötzlich GTX 475 heißen? Dafür müsste nV den Takt doch bis ans Limit hochschrauben, oder?

Hm, wilde Theorie: Die "GTX 460 1024" wird schon ein GF104 im Vollausbau, für den allerdings nur die schlechteren Chips verwendet werden. Die besten hingegen werden für den "GTX 475 (GF104)"-Launch gespart, um gleich beim Launch eine ausreichende Menge an hochzüchtbaren Super-GF104s zu haben. :ugly:

Ailuros
2010-06-17, 16:04:09
Die GTX 468 soll jetzt plötzlich GTX 475 heißen? Dafür müsste nV den Takt doch bis ans Limit hochschrauben, oder?

Das ist das letzte was mich an der Geschichte juckt. Bis jetzt hatte ich den Eindruck dass es sich beim vollem 104 um 8SMs handelt; die 16SM These aendert einiges und koennte sein dass der chip interessanter ist als ich erwartete.

Gast
2010-06-17, 17:54:15
die 16SM These aendert einiges und koennte sein dass der chip interessanter ist als ich erwartete.

Dann wären ~2,2Mrd. Transistoren schon einiges an Einsparung

AnarchX
2010-06-17, 18:00:45
16 SMs machen doch kaum Sinn, 4 GPCs und 16 Tessellatoren wären doch Overkill für 384SPs und 64 TMUs. Zudem müsste die SMs-Struktur wieder auf "Vec8"-Einheiten geändert werden und die Threads entsprechend angepasst.

Das Perlin Noise Ergebnis der GTX 460 spricht zudem auch für eine etwas weniger effektive Umsetzung der Rohleistung, wozu SMs mit 48SPs passen würden.

dargo
2010-06-17, 18:46:36
Kann mir bitte jemand verraten ob der GF104 gleichauf mit der GTX470 oder sogar minimal schneller sein wird? Gut, die GPU hat zwar etwas weniger SPs und Speicherbandbreite, das lässt sich aber durch höhere Taktraten locker wieder reinholen - zb. 700Mhz GPU-Takt und 1000Mhz Speichertakt.

AnarchX
2010-06-17, 18:54:19
Mit ~700/1400/1000MHz wäre eine vergleichbare Leistung denkbar. Im texelfüllraten-limitierten Worstcase hätte eine solche Karte sogar einen theoretischen Vorteil von ~36%.

dargo
2010-06-17, 18:57:27
Mit ~700/1400/1000MHz wäre eine vergleichbare Leistung denkbar. Im texelfüllraten-limitierten Worstcase hätte eine solche Karte sogar einen theoretischen Vorteil von ~33%.
Das weiß ich. :) Deswegen frage ich mich ob sich die Warterei lohnt. Ich brauche für meine GTX260 einen würdigen Nachfolger. Der muss mindestens die Leistung einer GTX470 liefern. Wenn dabei sogar +33% mehr Texelfüllrate bei rumkommt nehme ich das gerne mit. :D

AnarchX
2010-06-17, 19:04:20
Leistungsmäßig macht eine solche "GTX 468" als Upgrade für ein GTX 260 wohl durchaus Sinn. Ob preislich ein vernünftiges Verhältnis, auch im Vergleich zu Vergangenheit, erreicht wird hängt wohl ganz von TSMC ab. <=200€ wäre wohl ein angemessener Preis (http://www.forum-3dcenter.org/vbulletin/showthread.php?p=7935873#post7935873) für eine solche Karte. Aber wenn man jetzt schon wieder einen MSRP von $230 für die GTX 460 nennt, wird das wohl im 3. Quartal nicht möglich sein.

Spasstiger
2010-06-17, 19:53:25
Das günstigere SP-TMU-Verhältnis des GT200 gegenüber dem GF100 hat sich in einer bis zu 17% höheren relativen AF-Performance niedergeschlagen: http://www.computerbase.de/artikel/grafikkarten/2010/test_nvidia_geforce_gtx_480/5/#abschnitt_skalierungstests. Jeweils 16:1 HQ-AF und noAF verglichen.
Beim GT200 ist das Verhältnis SPs:TMUs 3:1, beim GF100 ist es 8:1.
Der GF104 hat ein Verhältnis von 6:1. Deshalb würde ich beim 16:1 HQ-AF mit einem relativen Performancegewinn von 3-5% gegenüber dem GF100 rechnen.
D.h. für die Rechnung: Bei gleicher arithmetischer Rechenleistung und Speicherbandbreite 3-4% von den Taktraten des GF104 abziehen, um auf die mittlere Performance der GF100-Karte zu kommen. D.h. eine GeForce GTX 468 müsste mit ca. 680 MHz Chip-, 1360 MHz Shader- und 1000 MHz Speichertakt (4 Gbps) laufen, um auf GTX-470-Performance zu kommen.

Fraglich ist noch, wieviele Raster-Engines der GF104 bekommen wird und wie effizient die umgebauten SMs arbeiten. Evtl. hebt sich durch das schwächere Setup und die geringere Auslastung der Recheneinheiten der relative Vorteil bei der Texelfüllrate wieder auf, so dass eine GTX 468 deutlich über 700 MHz Chiptakt benötigt, um der GTX 470 im Schnitt Paroli bieten zu können.

VooDoo7mx
2010-06-17, 20:19:14
Mit 750/1500/1000 sollte doch ein GF104 in allen belangen schneller als eine 470 sein?

Ich finde den Namen "468" im übrigen ziemlichen Quatsch. Ich halte es viel warscheinlicher das ein voller GF104 als GTX475 vermarktet wird. Bei 750MHz würde der Name auch deutlich passen.
468 suggeriert ja langsamer als 470 und da müssten die Taktarten auf dem selben Niveau wie bei der 460 sein udn eiegntlich geht ja jeder bei den vollen GF104 von höheren Taktraten aus.

Gast
2010-06-17, 20:37:08
16 SMs machen doch kaum Sinn, 4 GPCs und 16 Tessellatoren wären doch Overkill für 384SPs und 64 TMUs. Zudem müsste die SMs-Struktur wieder auf "Vec8"-Einheiten geändert werden und die Threads entsprechend angepasst.

Die Scheduler arbeiten bei Nvidia schon immer mit Warps zu je 32 Threads, ob man diese jetzt in 4 Takten zu je 8 Threads oder in 2 Takten mit jeweils 16 verarbeitet dürfte eher egal sein.

Die SMs müssen eh umgearbeitet werden um DP rauszuwerfen.

Gast
2010-06-17, 20:38:05
Kann mir bitte jemand verraten ob der GF104 gleichauf mit der GTX470 oder sogar minimal schneller sein wird?

Ähm nein, wie auch, noch hat niemand eine Karte.

dargo
2010-06-17, 21:09:58
Ähm nein, wie auch, noch hat niemand eine Karte.
Die Karte muss niemand haben um zu wissen wie schnell sie sein wird. Gesicherte Daten reichen schon aus. ;)

Gast
2010-06-17, 21:14:23
Die Karte muss niemand haben um zu wissen wie schnell sie sein wird. Gesicherte Daten reichen schon aus. ;)


Nein, es sind einfach zu viele Unbekannte im Spiel, GF104 unterscheidet sich offensichtlich deutlich von GF100, wie sich diese Unterschiede auswirken werden kann man ohne die Karte zu testen nicht sagen.

Botcruscher
2010-06-17, 21:20:13
Wenn die Architektur noch unbekannt ist, dann ist der Rest nicht voraus zu sagen.

Gast
2010-06-18, 10:24:25
Das Perlin Noise Ergebnis der GTX 460 spricht zudem auch für eine etwas weniger effektive Umsetzung der Rohleistung, wozu SMs mit 48SPs passen würden.
Wo kann ich das Ergebnis finden? Sehe es gerade leider nirgends.

Ailuros
2010-06-18, 13:20:47
16 SMs machen doch kaum Sinn, 4 GPCs und 16 Tessellatoren wären doch Overkill für 384SPs und 64 TMUs. Zudem müsste die SMs-Struktur wieder auf "Vec8"-Einheiten geändert werden und die Threads entsprechend angepasst.

Das Perlin Noise Ergebnis der GTX 460 spricht zudem auch für eine etwas weniger effektive Umsetzung der Rohleistung, wozu SMs mit 48SPs passen würden.

Genau deshalb frage ich auch ob bei der 16SM These 8+8+8 oder 16+8 anfallen wuerde. Klar ist der zweite Fall der merkwuerdigste, aber weiss der Geier was sie genau angestellt haben.

Was jetzt die Anzahl der raster bzw. trisetup Einheiten betrifft hast Du die theoretische Wahl zwischen "zu viel" fuer 384SPs (4 rasters/trisetup) und "zu wenig" (2 rasters/trisetup).

AnarchX
2010-06-18, 14:26:49
Warum sollten 2 Rasterizer und 8 Tessellatoren zu wenig für 64 TMUs, 384SPs und 32 ROPs sein?

Gast
2010-06-18, 17:21:02
Genau deshalb frage ich auch ob bei der 16SM These 8+8+8 oder 16+8 anfallen wuerde. Klar ist der zweite Fall der merkwuerdigste, aber weiss der Geier was sie genau angestellt haben.

Auf 16+16 ist man wahrscheinlich umgestiegen um die hohe DP-Leistung bieten zu können, ich denke es ist nicht so unwahrscheinlich, dass man für die chips ohne DP wieder die "alten" 8-way ALUs verwendet.


Was jetzt die Anzahl der raster bzw. trisetup Einheiten betrifft hast Du die theoretische Wahl zwischen "zu viel" fuer 384SPs (4 rasters/trisetup) und "zu wenig" (2 rasters/trisetup).

Oder man nimmt davon 3 ;)

Gast
2010-06-19, 06:11:56
Die Frage ist doch: Sind es nicht schon im GF100 (8+8)+(8+8) - denn dann hätte man nichtmal den Scheduler von GT200 groß erweitern müssen - im Gegenteil, sogar abspecken können - und der "Dual Warp Scheduler" käme von ganz allein, nicht? ;)

-carsten

Ailuros
2010-06-19, 08:35:53
Warum sollten 2 Rasterizer und 8 Tessellatoren zu wenig für 64 TMUs, 384SPs und 32 ROPs sein?

Aus dem genau gleichen Grund weil 4 rasters und 16 Tessellatoren "zu viel" waeren fuer 384/64.

GF100 hat 4 raster/16 Tesselatoren ueber 512SPs bzw. 64 TMUs verstreut. Unter sturer Logik "passen" 2 raster/8 Tesselatoren wohl eher zu 256/32.

Die Frage ist doch: Sind es nicht schon im GF100 (8+8)+(8+8) - denn dann hätte man nichtmal den Scheduler von GT200 groß erweitern müssen - im Gegenteil, sogar abspecken können - und der "Dual Warp Scheduler" käme von ganz allein, nicht? ;)

-carsten

Was spricht technisch dagegen dass vom einen 16-er einfach die Haelfte beschnitten wurde um DP loszuwerden? Das gesamte Projekt hat einige merkwuerdige Aspekte wie z.B. der die der wohl doch tatsaechlich rechteckig ist.

Gast
2010-06-19, 08:39:18
Was spricht technisch dagegen dass vom einen 16-er einfach die Haelfte beschnitten wurde um DP loszuwerden? Das gesamte Projekt hat einige merkwuerdige Aspekte wie z.B. der die der wohl doch tatsaechlich rechteckig ist.
Nichts, aber der Weg, den Damien beschrieben hat, ist auch nicht von der Hand zu weisen.

Was das Die angeht: Bisher habe ich nur ein gephotoshopptes Bild eines Heatspreaders gesehen… Falls allerdings das Die (der Die?) wirklich extrem rechteckig ist - wobei auch andere GPUs nicht so richtig quadratisch sind - könnte das durchaus mit Signallaufwegen zu tun haben.

-carsten

Ailuros
2010-06-19, 08:51:47
Oder man nimmt davon 3 ;)

GF104 ist kein kastrierter 100 sondern offensichtlich ein von Grund auf entwickelter performance chip. Ob ich jetzt mit 8 oder 16SMs spiele bei vollem Ausbau laesst sich jegliches wohl schwer durch 3 teilen oder? Bei hypothetischen 9 bzw. 15SMs spielt meine Vorstellung fuer 3 noch mit; bei 8/16 fehlt meiner primitiven Logik aber doch etwas.

Nichts, aber der Weg, den Damien beschrieben hat, ist auch nicht von der Hand zu weisen.

Ich sehe zwar ein dass Damien's These komplizierter ist als nur der zusaetzliche ("wiedererfundene") MUL, aber ich habe es extrem schwer ein 1/2 MADD eine SP zu nennen.

AnarchX
2010-06-19, 08:59:51
Aus dem genau gleichen Grund weil 4 rasters und 16 Tessellatoren "zu viel" waeren fuer 384/64.

GF100 hat 4 raster/16 Tesselatoren ueber 512SPs bzw. 64 TMUs verstreut. Unter sturer Logik "passen" 2 raster/8 Tesselatoren wohl eher zu 256/32.

Schon bei GF100 sind die 4R/16T imo etwas zu viel. Und warum sollte man bei GF104 kein vernünftigeres Verhältnis wählen, AMD ist bei RV670 auch nicht bei 512-Bit geblieben. ;)

Ailuros
2010-06-19, 09:15:40
Schon bei GF100 sind die 4R/16T imo etwas zu viel.

IMHO eben nicht wenn man als Ziel viele kleine Dreiecke hat. Die 16 Tessellatoren klingen so oder so nur imposant auf Papier, sind aber nach wie vor IMO jeglichem dementsprechenden "workload" angepasst. Eigentlich duerfte es sich mehr ein paar Millionen Transen pro SM entsprechen als dass man von 16 Tessellations-Einheiten reden koennte. Auf GF100 sind es wohl 2 pixels/clock/SM und jeder raster kann nur 8 pixels/clock bearbeiten. Im Gegensatz zu Cypress wo jeglicher raster 16 pixels/clock bearbeiten kann.

Hat jetzt 104 tatsaechlich nur 8SMs dann sind es unter der obrigen Logik 2*8=16 pixels/clock insgesamt. Es muss gar nichts so oder so sein; es bleibt aber dabei dass es entweder eventuell zu viel oder zu wenig sein koennte fuer 384SPs (ie 3/4 GF100-SPs).


Und warum sollte man bei GF104 kein vernünftigeres Verhältnis wählen, AMD ist bei RV670 auch nicht bei 512-Bit geblieben. ;)

Und fuer was steht "vernuenftig" genau? Besser zu wenig oder zu viel?

Gast
2010-06-19, 09:36:44
IMHO eben nicht wenn man als Ziel viele kleine Dreiecke hat.
Von den Tesselatoren unabhängig lässt sich die hohe Zahl an Rastern aber offenbar auch mit ziemlich kleinen Dreiecken nicht vernünftig auslasten. Ich hab's bisher jedenfalls nicht geschafft, ein halbwegs zufriedenstellendes Verhältnis von theoretischem Roh- zu erzielter Realdurchsatz zu erreichen. Absolut gesehen sind die Zahlen natürlich trotzdem noch weit vor der nächstbesten Konkurrenz, aber trotzdem: Real hätte GF100 auch mit 2 Rastern nicht viel schlechter dagestanden, wenn ich jetzt mal davon ausgehe, dass das Limit nicht in sondern vor den Rastern liegt.

-carsten

Gast
2010-06-19, 10:36:04
GF104 ist kein kastrierter 100 sondern offensichtlich ein von Grund auf entwickelter performance chip.

Eben


Ob ich jetzt mit 8 oder 16SMs spiele bei vollem Ausbau laesst sich jegliches wohl schwer durch 3 teilen oder? Bei hypothetischen 9 bzw. 15SMs spielt meine Vorstellung fuer 3 noch mit; bei 8/16 fehlt meiner primitiven Logik aber doch etwas.


Wenn man annimmt, dass die Rastereinheiten stur zu einem Block an SMs gehören wäre es wirklich seltsam. Wenn allerdings jeder Raster in Wirklichkeit jeden SM mit Input versorgen kann spricht auch nichts gegen 3 von der Sorte.

Ob 4 wirklich ein derartiger Overkill wären ist auch zu bezweifeln, hinter den Rastern hat GF104 gleich viele TMUs und 3/4 der SMs von GF100.

Wenn wir auch noch die unterschiedlichen Clock-Domains der Raster und SMs betrachten und davon ausgehen, dass dazwischen kein 2:1-Verhältnis wie bei GF100 vorhanden ist, sondern wieder etwa 2,2:1 ist man mit 4 Rastern schon recht nahe am GF100-Verhältnis.

AwesomeSauce
2010-06-19, 16:39:42
Fudo spekuliert (http://www.fudzilla.com/content/view/19232/1/), dass eine 512-SP-Version kommen wird, jedoch nicht mit dem GF100-Chip, sondern mit der überarbeiteten GF104-Architektur.
The 512-shader card is possible and it should launch after the summer, of course if all goes well. The twist is that there is a big possibility that this card won’t be based on the GF100, Nvidia's original Fermi chip.

If Nvidia planned a single chip with 512 shaders based on Fermi it would have already launched it, and since the company's GF104 design has some 25 percent lower TDP it is more likely that the 512-shader card might be based on GF104 design fundamentals.
Wie realistisch ist das Ganze einzustufen?

Gast
2010-06-19, 16:56:09
Wie realistisch ist das Ganze einzustufen?

Imo gar nicht, der Unterschied ist einfach zu gering um dafür einen eigenen Chip zu entwickeln.

Da wäre es noch wahrscheinlicher, dass ein ~3Mrd. Transistoren-Chip auf GF104-Basis kommt für die absolute Leistungsspitze um der neuen ATI-Architektur etwas dagegen zu setzen, aber der hätte dann logischerweise mehr als 512 ALUs.

Nakai
2010-06-19, 17:00:11
Ob 4 wirklich ein derartiger Overkill wären ist auch zu bezweifeln, hinter den Rastern hat GF104 gleich viele TMUs und 3/4 der SMs von GF100.

Also GF100 hat 4*16 SIMDs, also 4*16*8 SPs. GF104 hat 6*8 SIMDs, also 6*8*8 SPs. GF100 hat 4 GPCs, GF104 nur 2.

Ausgehen davon müsste ein Ferminachfolger, welcher auf GF104 wohl mit 3GPCs auskommen. also 6*12 SIMDs, also 96TMUs und 576 SPs, wenn alles gleichbleibt, wie zum GF104.

IMO möglich, aber unwahrscheinlich.



mfg