PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : nVidia - Maxwell - GM1xx (H1/2014) / GM2xx (H2/2014)


Seiten : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 [16] 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33

hasebaer
2014-08-04, 23:12:05
Die Frage ist, wird GM200 auch weiterhin extra DP Kerne besitzen?
Ohne diese wäre GK110 ja angeblich nur 460-480mm^2 groß.

Thaiti wurde ja schon ein 2:1 SP/DP nachgesagt, Hawaii kann es.
Davon muss Nvidia doch was gelernt haben.

aufkrawall
2014-08-05, 02:12:11
Aber bei einem großen Chip mit viel Takt (1 GHz+) explodiert auch die Leistungsaufnahme. Aber 20% sind realistischer als 30-40%, mMn aber immer noch zu optimistisch. 20-25% schneller als eine Non-Ti-780 und dabei Energiesparender sieht realistischer aus.
So besonders ist die Ti auch nicht, dass sie nicht übertroffen werden kann.
Die 680 war 30% schneller als die 580. Zwar mit neuer Fertigungstechnik, aber dafür mindestens um den Faktor kleiner als GM204.
Dürfte dann davon abhängen, wie weit sie den Takt ausfahren. Das Potenzial für +20-30% zur Ti sollte vorhanden sein.

Dawn on Titan
2014-08-05, 07:02:36
Die Leistung wird sich an den Preisen orientieren.

Cubitus
2014-08-05, 07:33:41
So besonders ist die Ti auch nicht, dass sie nicht übertroffen werden kann.
Die 680 war 30% schneller als die 580. Zwar mit neuer Fertigungstechnik, aber dafür mindestens um den Faktor kleiner als GM204.
Dürfte dann davon abhängen, wie weit sie den Takt ausfahren. Das Potenzial für +20-30% zur Ti sollte vorhanden sein.

Es kommt drauf an, heutzutage sind hohe Auflösungen mehr gefragt.
Und gerade dort tat sich die 680 im Vergleich mit der 580 deutlich schwerer.

ilibilly
2014-08-05, 08:56:40
Glaubt ihr nicht das mann mit der gtx 880 erstmal mit gtx 780 vergleichen sollte und nicht die Ti version?
Nvidia könnte ja dann im frühjahr die gtx 880Ti rausbringen.

Ich geh mal davon aus das es erstmal "nur" gtx 880 gibt die 20-30% über der alten gtx 780 liegt und preislich 499€
Dann im frühjahr topdog für 599€
Presilich wirds wohl nicht mehr viel billiger nvidia ignoriert ja amd´s preisdrückerei und die marktanteile geben nvidia recht.
die alte Gtx 780 kostet teilweise mehr als custom R9 290X

4Fighting
2014-08-05, 08:59:54
worauf beziehen sich eigentlich immer die Aussagen von 20-30% mehr zur 780 (ti)? Auf den Base clock oder eine art Standard boost clock?

hasebaer
2014-08-05, 09:26:06
Glaubt ihr nicht das mann mit der gtx 880 erstmal mit gtx 780 vergleichen sollte und nicht die Ti version?

Wozu?
Ein GM204 wäre 2,5-2,7 fach größer (370-400mm^2 als Spekulationsgrundlage) als ein GM107.
Da man nicht alles 1:1 hochskalieren muss ( bspw. SI, NVENC) bleibt mehr für Shader übrig und damit auch mehr Leistung, zumindest unter Full HD 4xAA (sprich solang die Bandbreite nicht limitiert).
Also grob Faktor 3 (+X) ggü. einer GTX 750Ti.

300% wäre bei CB +17% ggü. einer GTX 780Ti (ohne OC).

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=49216&stc=1&d=1407223474

http://www.computerbase.de/2014-08/grafikkarten-2014-im-vergleich-sommerausgabe/2/

Dural
2014-08-05, 09:36:55
Viele werden sicher enttäuscht über eine stock 880GTX sein.

Den ich bin mir zu 99,9% sicher das NV auf die Kosten und Effizient schaut, und nicht auf max FPS.

Alle über 20% der 780Ti ist reines Wunschdenken. Ich bleibe bei meinen 10% :)

hasebaer
2014-08-05, 09:44:01
Unter wirtschaflichen Gesichtspunkten, wären auch nur +5% ggü. einer 780Ti nötig.
Bleibt mehr OC Spielraum für die AIBs.

Skysnake
2014-08-05, 09:48:00
Ich denke auch, das man eher im Bereich 10-20% landen wird.

Timbaloo
2014-08-05, 09:54:52
Den ich bin mir zu 99,9% sicher das NV auf die Kosten und Effizient schaut, und nicht auf max FPS.
Das will ich hoffen.

Ailuros
2014-08-05, 10:05:39
Wenn GM200 zu GK110 ähnlich skaliert wie GM107 zu GK107, dann haben wir ja eine ordentliche Leistungssteigerung was die Shaderleistung angeht. Ok, GM107 ist doch um einiges größer als GM107, also sollte GM200 nicht ganz so extrem zulegen können.

Wobei der Haken im letzten Satz liegt; man ist auf 28nm und man kann eben nicht so leicht die 550mm2 Schwelle ueberschreiten ohne Folgen.

Die Leistung wird sich an den Preisen orientieren.

Genau anders rum. Es ist eben kein Zufall dass der GTX680 Nachfolger einen kleinere MSRP haben soll.

Viele werden sicher enttäuscht über eine stock 880GTX sein.

Den ich bin mir zu 99,9% sicher das NV auf die Kosten und Effizient schaut, und nicht auf max FPS.

Alle über 20% der 780Ti ist reines Wunschdenken. Ich bleibe bei meinen 10% :)

Man koennte ja alles so stehen lassen wenn's nicht das fettgedruckte geben wuerde und das eigene SHIELD tablet. Beim K1 ist es eben leider genau der Fall waehrend Gott sei Dank im desktop eine gesundere Logik zu herrschen scheint.

Dural
2014-08-05, 10:11:20
Das will ich hoffen.

Auf ihre kosten und nicht unseren ;)

Timbaloo
2014-08-05, 10:26:05
Auf ihre kosten und nicht unseren ;)
Klar, ich meinte auch eher die Effizienz.

Der Kostenpunkt ist für mich (sorry für OT) eh nicht sonderlich relevant. Ich fahr heute noch mit einer 560ti, also gut 4-5 Jahre mit einer Graka. Selbst wenn ich eine 600€-GraKa kaufe die vielleicht nur 400€ "wert ist" und die nur 3 Jahre einsetze, sind das gerade mal ~10€/Monat die ich "umsonst" zahle, da fange ich an anderer Stelle an meine Finanzen zu optimieren...

Ailuros
2014-08-05, 10:36:00
Mit =/>400 Euros wird es schon ein sehr guter (vanilla) GTX780 Ersatz werden. Gegen die zeitige 560ti ist es eine augezeichnete Aufruestung ohne besondere Verbrauchs-Unterschiede.

Dawn on Titan
2014-08-05, 11:09:28
Genau anders rum. Es ist eben kein Zufall dass der GTX680 Nachfolger einen kleinere MSRP haben soll.

Kann man eben aus beiden Seiten sehen. Wenn man noch den dicken GM200 in absehbarer Zeit nach schieben will, dann beschränkt dies den MSRP und entsprechend wird sich auch die Leistung einsortieren. Eine 400$ Karte kann durchaus das Niveau der alten 600$ erreichen, sie muss aber immer noch genug Abstand zu kommenden 600+$ karte halten.

Ich erwarte 780 Leistung für die Salvagelösung (870) und 780ti Leistung für den Vollausbau (880). Sagen wir <400$ und <500$ jeweils.

Ailuros
2014-08-05, 11:29:37
Kann man eben aus beiden Seiten sehen. Wenn man noch den dicken GM200 in absehbarer Zeit nach schieben will, dann beschränkt dies den MSRP und entsprechend wird sich auch die Leistung einsortieren. Eine 400$ Karte kann durchaus das Niveau der alten 600$ erreichen, sie muss aber immer noch genug Abstand zu kommenden 600+$ karte halten.

Ein chip kann maximal nur N Leistung erreichen innerhalb seinem programmierten power budget. NV hat offensichtlich dafuer gesorgt dass vendors sowohl uebertakten koennen und auch eventuell einen doppelt so grossen framebuffer dafeur benutzen koennen.

Sollte heissen dass wenn sie theoretisch eine GM204 mit =/>+20% 780Ti veroeffentlichen wuerden, dann:

1. Bleibt kein Luftraum mehr fuer vendors fuer custom SKUs.
2. Wird der Abstand zwischen GM204 und GM200 am Ende zu klein und hier genau ist eigentliche Relevanz zum GM200.

Ausser natuerlich irgend jemand hier hat eine halbwegs anstaendige These wieso GM200 mehr als 50% schneller sein koennte als eine 780Ti.

Ich erwarte 780 Leistung für die Salvagelösung (870) und 780ti Leistung für den Vollausbau (880). Sagen wir <400$ und <500$ jeweils.

Welches eher dafuer spricht dass die eigentliche default Leistung den endgueltigen Preis diktiert und nicht andersrum.

Dawn on Titan
2014-08-05, 11:34:48
Ich denke man startet die Entwicklung mit einer angepeilten Leistung, die auch zum angepeilten Preispunkt passt. Manchmal hat man Glück und kann den Chip teurer als geplant verkaufen, manchmal hat man Pech und kriegt weniger. Aber im Grundsatz gehe ich davon aus, dass Leistung und Preispunkt im Regelfall aufeinander abgestimmt sind. Wobei die Leistung natürlich bestimmt was man nehmen kann, aber der Preis bestimmt wie groß und komplex der Chip werden darf.

Leonidas
2014-08-05, 11:49:13
Nur 10% schneller als die 780Ti fände ich etwas wenig. Ich gehe eher von 30-40% aus.


Halte ich für sehr schwer erreichbar mit einem 256 Bit SI.

Außerdem muß NV doch mit GM204 gar nicht so hochgehen: Es kommt ja noch GM200. NV muß mit dem GM204 pro Forma gleich schnell wie 780Ti sein. Marketingtechnisch wird man das Teil sowieso gegen eine 780 stellen, sieht besser aus.

Ailuros
2014-08-05, 12:01:31
Ich denke man startet die Entwicklung mit einer angepeilten Leistung, die auch zum angepeilten Preispunkt passt.

Das was Du meinst wird von der eigentlichen Marktkategorie (low end, mainstream, performance, high end) in sehr groben Linie beim start der Entwicklung definiert. Der eigentliche finale Preis ist eine Angelegenheit der letzten Minute.

Es will zwar keiner glauben aber das originale Marketing-Material von der GTX680 war um einiges bescheidener als es sich am Ende entpuppte. Ein diametrisch kleineres PCB, etwas geringere Frequenz und kein Frequenz-boost. Wurde alles in letzter Minute umgeschaufelt da sie sahen dass sie die HD7970 direkter anfechten koennen.

Solche Faelle sind aber Ausnahmen da IHVs ihre direkte Konkurrenz eher selten unterschaetzen.

Manchmal hat man Glück und kann den Chip teurer als geplant verkaufen, manchmal hat man Pech und kriegt weniger.

Nur weil es NV leichter hat zu verkaufen mit hoeheren Preisen als AMD heisst es noch lange nicht dass wenn sie den Preis bei 800 Euros anlegen wuerden dass sie auch wirklich so viel verkaufen wuerden wie sie es haben wollen. Es gelten nach wie vor supply/demand Regeln in jeglichem Markt.

Aber im Grundsatz gehe ich davon aus, dass Leistung und Preispunkt im Regelfall aufeinander abgestimmt sind. Wobei die Leistung natürlich bestimmt was man nehmen kann, aber der Preis bestimmt wie groß und komplex der Chip werden darf.

Eben weil ich erwarte dass die groesste GM204 SKU (default) in etwa auf 780ti Niveau liegen wird, deshalb macht der niedrigere Preis auch Sinn.

hasebaer
2014-08-05, 12:04:28
Es kommt ja noch GM200.

In 28nm und in weniger als 6 Monaten?

Skysnake
2014-08-05, 12:33:42
Halte ich für sehr schwer erreichbar mit einem 256 Bit SI.

Außerdem muß NV doch mit GM204 gar nicht so hochgehen: Es kommt ja noch GM200. NV muß mit dem GM204 pro Forma gleich schnell wie 780Ti sein. Marketingtechnisch wird man das Teil sowieso gegen eine 780 stellen, sieht besser aus.
Vor allem sollte man auch bedenken, das nVidia mit GM200 ganz klar tüchtig an der DP-Schraube drehen muss. Da hat AMD schon sehr heftig vorgelegt.

Das geht dann natürlich zu Lasten der reinen Gamer-Performance. Also bei gleichen Kosten wäre ohne den Focus halt mehr drin.

Ailuros
2014-08-05, 13:12:25
Vor allem sollte man auch bedenken, das nVidia mit GM200 ganz klar tüchtig an der DP-Schraube drehen muss. Da hat AMD schon sehr heftig vorgelegt.

Das geht dann natürlich zu Lasten der reinen Gamer-Performance. Also bei gleichen Kosten wäre ohne den Focus halt mehr drin.

Wieso 1:2 billiger sein soll in hw insgesamt als dedizierte DP Einheiten musst Du Dir wohl selber ausrechnen. Hawaii ist eben NICHT um bis zu 50% schneller als GK110b und hat zur gleichen Zeit mehr DP FLOPs/W als GM200.

Noch schlimmer wenn die Geruechte stimmen sollten ist Hawaii's Nachfolger sogar groesser als GM200 unter 28nm, ergo muss ich wohl wesentliches verpassen.

Dawn on Titan
2014-08-05, 13:21:49
Eben weil ich erwarte dass die groesste GM204 SKU (default) in etwa auf 780ti Niveau liegen wird, deshalb macht der niedrigere Preis auch Sinn.

Die TDP wird uns ja dann verraten ob sie pushen mussten oder nicht.

Ailuros
2014-08-05, 14:04:56
Die TDP wird uns ja dann verraten ob sie pushen mussten oder nicht.

ROFL auch nicht mehr unbedingt; erstens schuetzt Dich heutzutage der Treiber von "power virus" Applikationen und laesst nur X Verbrauch zu und dann aus damit und zweitens haben IHVs vom ULP mobile SoC in letzten Jahren verdammt viel mitgelernt. Anders das was man beobachten sollte ist eher der durchschnittliche Echtzeit-Verbrauch im Vergleich zu vorigen GPUs.

Dawn on Titan
2014-08-05, 14:40:14
Das meinte ich, die Leistungsaufnahme wird zeigen wie sie liegen. (sowie auch die Leistungsaufnahme de OC SKUs)

boxleitnerb
2014-08-05, 14:54:10
Mit =/>400 Euros wird es schon ein sehr guter (vanilla) GTX780 Ersatz werden. Gegen die zeitige 560ti ist es eine augezeichnete Aufruestung ohne besondere Verbrauchs-Unterschiede.

Heißt u.U. sogar leicht weniger Verbrauch als die 680?

Leonidas
2014-08-05, 15:00:10
Normalerweise nicht. Größerer Chip, mehr Performance muß auch Stromverbrauch kosten, sofern gleiche Fertigungsgröße.

Einzige Ausnahme: Wenn NV eventuell 28HPM machen sollte.

boxleitnerb
2014-08-05, 15:08:31
Normalerweise nicht. Größerer Chip, mehr Performance muß auch Stromverbrauch kosten, sofern gleiche Fertigungsgröße.

Einzige Ausnahme: Wenn NV eventuell 28HPM machen sollte.
Die 560 Ti braucht 15-20W weniger als die 680, daher meine Frage.

Godmode
2014-08-05, 15:10:37
Eben weil ich erwarte dass die groesste GM204 SKU (default) in etwa auf 780ti Niveau liegen wird, deshalb macht der niedrigere Preis auch Sinn.

Dann kann man GM204 und GM200 gleich auslassen, wenn man schon ne GK110 oder Hawaii GPU hat. Langweilig

Normalerweise nicht. Größerer Chip, mehr Performance muß auch Stromverbrauch kosten, sofern gleiche Fertigungsgröße.

Einzige Ausnahme: Wenn NV eventuell 28HPM machen sollte.


Eine neue Architektur kann da trotzdem einen gewaltigen Unterschied ausmachen, siehe GM107 vs GK107.

Ailuros
2014-08-05, 15:12:45
Normalerweise nicht. Größerer Chip, mehr Performance muß auch Stromverbrauch kosten, sofern gleiche Fertigungsgröße.

Einzige Ausnahme: Wenn NV eventuell 28HPM machen sollte.

Ich sehe keinen besonderen Gewinn in HPm gegen HP, ausser dass HPm vielleicht etwas mehr Transistoren erlauben koennte und das auch nur unter Bedingungen.

Es koennte sein dass sie seit sie mit GK20A und auch Maxwell Ablegern fuer Tegras herumfuchteln dass sie vielleicht einen Anteil der DVFS Geschichte auch in GPUs so langsam aggressiver anwenden. Fuer den eigentlichen TDP macht es zwar keinen Unterschied mehr, aber fuer den Echtzeitverbrauch dann vielleicht schon.

hasebaer
2014-08-05, 15:27:34
Normalerweise nicht. Größerer Chip, mehr Performance muß auch Stromverbrauch kosten, sofern gleiche Fertigungsgröße.

Einzige Ausnahme: Wenn NV eventuell 28HPM machen sollte.

Einzige Ausnahme?
Maxwell ist also nicht das effektive Design?

HOT
2014-08-05, 15:43:26
Maxwell ist extrem effektiv als kleiner Chip mit kleiner TDP. Ob das bei 420mm² so bleibt ist die Frage.
Wenn man jetzt tatsächlich mal das Milchmädchen für Rechenaufgaben bemühen würde und den GM107 als Grundlage nimmt, müsste GM204 bei der prognostizierten Größe auf 1920 Shader kommen (150*3-x). Wenn man damit GK110-Werte schafft bei ca. 200W wär das schon gewaltig. Und das ist schon best-Case meiner Ansicht nach, besser wirds nicht. Das ist schon extrem effektiv, auch ohne die "der ist 30% schneller". Maxwell ist noch weniger flächeneffizient als Kepler (Shader/Fläche), schafft aber mehr FPS pro Shader. Wie gesagt, alles Milchmädchen.
An den GM200 würd ich das Milchmädchen nicht ranlassen, denn das wird sicherlich aufgrund einer überarbeiteten Struktur wenig vergleichbar. GK110 ist ja auch etwas anders als GK10x.

Nakai
2014-08-05, 15:58:24
Einzige Ausnahme?
Maxwell ist also nicht das effektive Design?

Maxwell ist DEUTLICH effektiver. Nur hängt die Perf/Watt nicht immer nur vom Design ab. GM204 hat ein 256Bit SI, was dem Chip zum Verhängnis werden könnte. Der größere Cache ist bei Streaming-Architekture, wie es GPUs es sind, nicht immer seinen Nutzen(Daten werden nicht oft wiederverwendet; hängt aber konkret von der Implementierung und der Verweildauer der Daten in der Pipeline ab). Beim Compute sollte bzw. ist Maxwell definitiv stärker als Kepler(zeigen auch erste SP-Benches von GM107). Durch das kleinere SI muss der GDDR5-Takt und der Takt des SI höher ausfallen und somit der höhere Stromverbrauch. Ich erwarte GM204 bei etwa 2560SPs und eine ~3.5fache Performance auf GM107. Damit sollte man etwa 10~20% vor Titan liegen, bei höheren Auflösungen tendenziell eher schlechter.
Der Verbrauch sollte sich um 200W einpendeln. Titan/780Ti verbrauchen etwa 250W.

In dem Bereich erwarte ich eine gesteigerte Perf/Watt um 50%. Das hängt aber auch davon ab, in welchem Bereich ein Chip angesiedelt ist. Wenn man GM204 deutlich über Titan prügeln will, wird die PErf/Watt definitiv dann schlechter ausfallen.
Die GTX750Ti hat gegenüber der GTX650Ti ein gut doppeltes Perf/Watt-Verhältnis(bei ~50% Mehrperformance). Letztere Karte basiert auf GK106 und nicht GK107.
Vergleicht man direkt GK107 mit GM107 in der Form einer GTX640 und einer GTX750Ti, ist GM107 auch etwa 40~50% besser in Perf/Watt.

Es hängt immer davon ab, welche Chips in welchem Bereich besonders effizient sind und in welchen Bereich sie erzwungen werden. Ich erwarte deswegen, weil GM107 etwa 40~50% höhere Performance/Watt hat in etwa dies auch bei GM204 zu GK104. NV sollte schneller als Titan werden können mit einem GM204, wenn man dies wünscht.

aufkrawall
2014-08-05, 16:28:02
Wie hoch könnte der Speichertakt maximal sein?
Selbst mit 4Ghz kommt man nicht auf 780-Niveau und die Ti hat mit dezentem VRAM-OC auch schon 20% mehr Bandbreite.

Nakai
2014-08-05, 16:30:42
Wie hoch könnte der Speichertakt maximal sein?
Selbst mit 4Ghz kommt man nicht auf 780-Niveau und die Ti hat mit dezentem VRAM-OC auch schon 20% mehr Bandbreite.

Auf dem GM204-Testboard wurde Hynix H5GCQ4H24MFR-R2C verbaut, welcher einen Takt von 3,5GHz hat. Ergo ~220GB/s. Der Cache ist eben eine Unbekannte.

Knuddelbearli
2014-08-05, 17:17:11
Dann kann man GM204 und GM200 gleich auslassen, wenn man schon ne GK110 oder Hawaii GPU hat. Langweilig



Seit wann lohnt ein Umstieg bei selber Strukturgröße?

480 auf 580 nö

5870 auf 6970 nö

8800gtx auf 8899 ultra nö

aufkrawall
2014-08-05, 17:22:46
Bei den ganzen Beispielen keine oder geringfügige Architekturänderung.
Mittlerweile verkackt eine 5870 wegen den 1GB VRAM übrigens heftigst.
GM204 hat mehr VRAM, unterstützt wohl mehr D3D-Features, hat stark bessere Compute-Performance und auch ein deutlich besseres Perf/W-Verhältnis.
Wenn man relativ kostenneutral upgraden kann, ist das auch nicht verkehrt.

Godmode
2014-08-05, 17:25:03
Seit wann lohnt ein Umstieg bei selber Strukturgröße?

480 auf 580 nö

5870 auf 6970 nö

8800gtx auf 8899 ultra nö

Das waren alles nur Refreshes. Maxwell ist eine neue Architektur.

Dawn on Titan
2014-08-05, 17:30:44
Nicht jeder hat GK110 im Recher für Besitzer von 460-680 ist GM204 ein massives bis gerade noch sinnvolles Upgrade.

aufkrawall
2014-08-05, 17:33:27
Nicht jeder hat GK110 im Recher fpr Besotzer von 460-680 ist GM204 ein massives bis gerade noch sinnvolles Upgrade.
Wie gesagt kann der GM204 meiner Einschätzung nach bis zu 90% schneller als GK104 sein (bei Compute noch massiv mehr), wenn beide Takt voll ausgefahren haben.
Wieso sollte das "gerade noch sinnvoll" sein?

Ailuros
2014-08-05, 17:48:43
Wie gesagt kann der GM204 meiner Einschätzung nach bis zu 90% schneller als GK104 sein (bei Compute noch massiv mehr), wenn beide Takt voll ausgefahren haben.
Wieso sollte das "gerade noch sinnvoll" sein?

Was soll denn GM204 bzw. alles ausser GM200 tolles mit sich bringen dass es diesmal einen sehenswerten Unterschied bei compute gegen GK104 bringen sollte? Und die 90% Leistungsunterschied kannst Du verdammt schnell ohne einen kleineren Prozess wieder vergessen.

mczak
2014-08-05, 18:03:37
Das waren alles nur Refreshes. Maxwell ist eine neue Architektur.
6970 war kein Refresh, so grob geschätzt würde ich behaupten die Architekturänderungen waren mindestens so gross wie bei Kepler->Maxwell.
Aber Northern Islands war halt auch nicht gerade der grosse Hit.

aufkrawall
2014-08-05, 18:13:50
Was soll denn GM204 bzw. alles ausser GM200 tolles mit sich bringen dass es diesmal einen sehenswerten Unterschied bei compute gegen GK104 bringen sollte? Und die 90% Leistungsunterschied kannst Du verdammt schnell ohne einen kleineren Prozess wieder vergessen.
Warum geht GM107 so ab bei Compute? Ist der Renner für Mining-Rigs und nein, das kommt nicht nur durch die allgemeine Effizienz-Verbesserung.
Außerdem kommt GK110 den 90% bei bestimmten Szenarien schon recht nah (1,25 vs 1,25Ghz).
Hängt alles davon ab, wie gut sich GM204 takten lässt und in wie weit die Caches mitspielen. NVs marktpolitischer SweetSpot zählt nicht.

Undertaker
2014-08-05, 18:21:23
Was soll denn GM204 bzw. alles ausser GM200 tolles mit sich bringen dass es diesmal einen sehenswerten Unterschied bei compute gegen GK104 bringen sollte? Und die 90% Leistungsunterschied kannst Du verdammt schnell ohne einen kleineren Prozess wieder vergessen.

Im besten Fall liegt die 780 Ti rund die Hälfte vor der GTX 770, da fehlen also nur noch gut 25 % für die genannten 90 %. Ist es darum so abwegig, eine solche Zahl (wenn vielleicht auch nicht im Mittel über alle Settings) ins Auge zu fassen?

Ailuros
2014-08-05, 18:35:56
Warum geht GM107 so ab bei Compute? Ist der Renner für Mining-Rigs und nein, das kommt nicht nur durch die allgemeine Effizienz-Verbesserung.

Hauptsaechlich schon IMHO. Mining ist aber auch nicht gleich compute in jedem Fall.

http://www.computerbase.de/2014-08/grafikkarten-2014-im-vergleich-sommerausgabe/4/#diagramm-gpu-computing-luxmark

Außerdem kommt GK110 den 90% bei bestimmten Szenarien schon recht nah (1,25 vs 1,25Ghz).
Hängt alles davon ab, wie gut sich GM204 takten lässt und in wie weit die Caches mitspielen. NVs marktpolitischer SweetSpot zählt nicht.

Ehrlich mich interessiert kein bisschen was jeglicher vendor oder user ausserhalb vom default design auf eigene Verantwortung anrichtet. Ich hab eben nun mal die alberne Tendenz und vergleiche Aepfel gegen Aepfel bzw. default SKU gegen default SKU.

Im besten Fall liegt die 780 Ti rund die Hälfte vor der GTX 770, da fehlen also nur noch gut 25 % für die genannten 90 %. Ist es darum so abwegig, eine solche Zahl (wenn vielleicht auch nicht im Mittel über alle Settings) ins Auge zu fassen?

Ich sehe nichtmal 50% Durschnitt im Normalverbrauch zwischen den beiden: http://www.computerbase.de/2014-08/grafikkarten-2014-im-vergleich-sommerausgabe/3/#diagramm-bioshock-infinite-2560-1600

Kann durchaus sein dass in ultraHD der 2GB framebuffer der 770 ihr Ohrfeigen verpasst, aber es ist noch kein Normalfall.

Gipsel
2014-08-05, 18:47:23
Wieso 1:2 billiger sein soll in hw insgesamt als dedizierte DP Einheiten musst Du Dir wohl selber ausrechnen. Hawaii ist eben NICHT um bis zu 50% schneller als GK110b und hat zur gleichen Zeit mehr DP FLOPs/W als GM200.
Noch schlimmer wenn die Geruechte stimmen sollten ist Hawaii's Nachfolger sogar groesser als GM200 unter 28nm, ergo muss ich wohl wesentliches verpassen.
Ja, für GM200 gibt es dann ja wohl auch den Hawaii-Nachfolger. Und wenn wir uns nur mal so die bekannten Werte ansehen:

GK110 (Tesla K20): 1,17 TFlop/s Peak, 225W board power => 5,2 GFlops/W, 2,14 GFlops/mm²
GK110 (Tesla K20X): 1,31 TFlop/s Peak, 235W board power => 5,57 GFlops/W, 2,39 GFlops/mm²
GK110b (Tesla K40): 1,43 TFflop/s Peak, 235W board power => 6,08 GFlops/W, 2,60 GFlops/mm²
GK110b (Quadro K6000): 1,73 TFlop/s Peak, 225W board power => 7,70 GFlops/W, 3,17 GFlops/mm²
Hawaii (FirePro W9100): 2,62 TFlop/s Peak, 275W board power => 9,53 GFlops/W, 5,98 GFlops/mm²
edit (da ganz neu):
Hawaii (FirePro S9150): 2,53 TFlop/s Peak, 235W board power => 10,78 GFlops/W, 5,79 GFlops/mm²

Die neueren Teslas/Quadros haben 12GB RAM (die K20[X] nur 6GB), die Hawaii-FirePro natürlich 16 GB. Annahme waren übrigens 547mm² Die-Fläche für GK110(b), es zirkulieren ja auch noch größere Zahlen. Damit ist das Die des GK110(b) etwa 25% größer, was die Flächeneffizienz von Hawaii im Vergleich recht gut aussehen läßt.

Also doch, wenn ich nichts Wesentliches verpasse, sollte Maxwell in der Metrik DP-Flops/W bzw. auch DP-Flops/mm² Einiges draufpacken (wie auch immer, aber separate DP-Einheiten sehen schon ein wenig nach Verschwendung aus [und sind auch aus Stromspar-/Effizienzgründen nicht optimal], sollte nV tatsächlich welche verbauen), um gegen den nach den von Dir zitierten Gerüchten eventuell sogar größeren Hawaii-Nachfolger gut auszusehen.

PS:
Es gibt offenbar eine andere Auslegung der Toleranzen zwischen Teslas und Quadros (bei denen der GK110b zwar auch merklich was bringt, aber eben nicht den Unterschied zwischen Teslas und Quadros), habe der Vollständigkeit halber deswegen beide drin.

robbitop
2014-08-05, 19:11:31
Maxwell ist extrem effektiv als kleiner Chip mit kleiner TDP. Ob das bei 420mm² so bleibt ist die Frage.
Wenn man jetzt tatsächlich mal das Milchmädchen für Rechenaufgaben bemühen würde und den GM107 als Grundlage nimmt, müsste GM204 bei der prognostizierten Größe auf 1920 Shader kommen (150*3-x). Wenn man damit GK110-Werte schafft bei ca. 200W wär das schon gewaltig. Und das ist schon best-Case meiner Ansicht nach, besser wirds nicht. Das ist schon extrem effektiv, auch ohne die "der ist 30% schneller". Maxwell ist noch weniger flächeneffizient als Kepler (Shader/Fläche), schafft aber mehr FPS pro Shader. Wie gesagt, alles Milchmädchen.
An den GM200 würd ich das Milchmädchen nicht ranlassen, denn das wird sicherlich aufgrund einer überarbeiteten Struktur wenig vergleichbar. GK110 ist ja auch etwas anders als GK10x.
Maxwell ist 35% effizienter bei gleichem Takt pro Ausführungseinheit. Für den Vollausbau des GK110 braucht man dann 2133 SPs. Wenn man dann noch schneller sein will, braucht man entweder mehr Takt oder mehr Ausführungseinheiten.

aufkrawall
2014-08-05, 19:26:11
Hauptsaechlich schon IMHO. Mining ist aber auch nicht gleich compute in jedem Fall.

http://www.computerbase.de/2014-08/grafikkarten-2014-im-vergleich-sommerausgabe/4/#diagramm-gpu-computing-luxmark

GK110 verbrät 4,16x mehr Strom und ist nur 2,26x bzw. 1,95x schneller.
Bei 1080p 4xAA Spiele sind es 2,54x. Selbst bei Luxmark (ich nehme mal an, du hast diesen als "Worst Case" genommen?) ist der Effizienzgewinn bei Compute also größer als bei Spielen.
Was viel beachtlicher ist, dass man trotz den meist weniger performanteren OpenCL-Treibern mit der 260X (fast 2x Stromverbrauch) mithalten kann, während die großen Keplers von den großen AMDs mächtig die Hucke voll bekommen (bei vergleichbarem Stromverbrauch).
Von GK104 will ich gar nicht erst anfangen. Also doch genau das, was ich gesagt habe. :confused:

Undertaker
2014-08-05, 19:35:29
Ich sehe nichtmal 50% Durschnitt im Normalverbrauch zwischen den beiden: http://www.computerbase.de/2014-08/grafikkarten-2014-im-vergleich-sommerausgabe/3/#diagramm-bioshock-infinite-2560-1600

Also in genau dem Test von dir sind es 47%(57%) zwischen GTX 770 und GTX 780 TI (Max) in 2.560 x 1.600. Wo sind da 50 % zu hoch gegriffen? :confused:

Rating: http://www.computerbase.de/2014-08/grafikkarten-2014-im-vergleich-sommerausgabe/2/#diagramm-rating-2560-1600-4xaa-16xaf

Edit: OK, in den anderen Settings ists wohl etwas weniger. Aber ich schrieb ja oben auch vom "besten Fall", richtig? ;)

Timbaloo
2014-08-05, 20:14:22
Blöde Frage: Was wissen wir denn genau von GM204 (was nicht direkt aus GM107 zu folgern ist)? 256Bit SI, 28nm. Irgendwie ziemlich mau für einen Release in 6-8 Wochen :D

Ailuros
2014-08-05, 20:47:32
Also in genau dem Test von dir sind es 47%(57%) zwischen GTX 770 und GTX 780 TI (Max) in 2.560 x 1.600. Wo sind da 50 % zu hoch gegriffen? :confused:

Rating: http://www.computerbase.de/2014-08/grafikkarten-2014-im-vergleich-sommerausgabe/2/#diagramm-rating-2560-1600-4xaa-16xaf

Edit: OK, in den anderen Settings ists wohl etwas weniger. Aber ich schrieb ja oben auch vom "besten Fall", richtig? ;)

Eben nicht wenn ich betone dass ich stets default vs. default Frequenzen im Hinterkopf habe. Eine leicht uebertaktete 780Ti werde ich wohl gegen eine vergleichbare uebertaktete GTX880 oder was auch immer vergleichen.

Unter dem gleichen Prozess eine Leistungssteigerung von ca. 50% zu bringen ohne das Transistoren-budget bzw. die area brutal zu sprengen im Vergleich zu GK104 ist ohnehin schon ein ziemlich grosses Ereignis. Mehr waere zwar schoen aber auf dem Referenz-design sehe ich nicht besonders mehr und ja ich haette liebend gern unrecht aber es gibt auch physikalische Grenzen.

GK110 verbrät 4,16x mehr Strom und ist nur 2,26x bzw. 1,95x schneller.
Bei 1080p 4xAA Spiele sind es 2,54x. Selbst bei Luxmark (ich nehme mal an, du hast diesen als "Worst Case" genommen?) ist der Effizienzgewinn bei Compute also größer als bei Spielen.
Was viel beachtlicher ist, dass man trotz den meist weniger performanteren OpenCL-Treibern mit der 260X (fast 2x Stromverbrauch) mithalten kann, während die großen Keplers von den großen AMDs mächtig die Hucke voll bekommen (bei vergleichbarem Stromverbrauch).
Von GK104 will ich gar nicht erst anfangen. Also doch genau das, was ich gesagt habe. :confused:

Es ist trotz allem design-bedingt um das ging es mir nur. Du hast auf einer 750Ti 5 clusters/SMMs vs. 760 6 clusters/SMXs; mag zu vereinfacht klingen aber vergiss mal bei solchen Vergleichen wieviele SPs jeglicher cluster jeweils hat.

Das ist eben das schoene mit GPUs; was heute nahezu "perfekt" klingen mag sieht im Vergleich zu einem neuerem design ziemlich ueberholt und umstaendlich aus.

Höhnangst
2014-08-05, 21:46:26
Meine aktualisierte Spekulation:

GTX 870
Preis: 499
Leistung: 780 Ti - 5 %
Verbrauch: 200 W


GTX 880
Preis: 649
Leistung: 780 Ti + 20 %
Verbrauch: 230 W

Cortana
2014-08-05, 22:00:13
Ich warte auf die 880Ti Superclocked xD

Hoffe auf 8 Tflops und dann steige ich um.

Undertaker
2014-08-05, 22:21:28
Eben nicht wenn ich betone dass ich stets default vs. default Frequenzen im Hinterkopf habe. Eine leicht uebertaktete 780Ti werde ich wohl gegen eine vergleichbare uebertaktete GTX880

Auch default sind es im obigen Test und Setting 47%, willst du jetzt wegen 3% eine Diskussion beginnen? Nochmal, ich sprach vom besten Fall und nicht vom Durchschnitt. Übrigens: Von den 47% ausgehend fehlen weniger als 30% Plus für GM204 zu GK110, um 90% auf GK104 zu legen. Das könnte in einigen Fällen - ich spreche auch hier nicht vom Durchschnitt - durchaus eintreffen. Ich würde es zum jetzigen Zeitpunkt jedenfalls noch nicht ausschließen.

Ailuros
2014-08-05, 22:50:19
Auch default sind es im obigen Test und Setting 47%, willst du jetzt wegen 3% eine Diskussion beginnen?

Es sind auf jeden Fall einige Meilen bis zu den zu optimistischen +90% um das ging es nur.

Nochmal, ich sprach vom besten Fall und nicht vom Durchschnitt. Übrigens: Von den 47% ausgehend fehlen weniger als 30% Plus für GM204 zu GK110, um 90% auf GK104 zu legen. Das könnte in einigen Fällen - ich spreche auch hier nicht vom Durchschnitt - durchaus eintreffen. Ich würde es zum jetzigen Zeitpunkt jedenfalls noch nicht ausschließen.

"Bis zu" wird womöglich sogar mehr sein nur hilft es wohl den Leser besser wenn man sich auf einen Durchschnittswert bezieht.

Skysnake
2014-08-06, 00:24:07
Wieso 1:2 billiger sein soll in hw insgesamt als dedizierte DP Einheiten musst Du Dir wohl selber ausrechnen. Hawaii ist eben NICHT um bis zu 50% schneller als GK110b und hat zur gleichen Zeit mehr DP FLOPs/W als GM200.

Noch schlimmer wenn die Geruechte stimmen sollten ist Hawaii's Nachfolger sogar groesser als GM200 unter 28nm, ergo muss ich wohl wesentliches verpassen.
Kann es sein, das du meinen Post nicht verstanden hast :confused:

Ich sag doch, das nVidia sich strecken muss bei der DP-Leistung, und das eben auf Kosten der Gameingperformance geben wird. Also genau das Gleiche wie du, nur mit anderen Worten :freak:

Normalerweise nicht. Größerer Chip, mehr Performance muß auch Stromverbrauch kosten, sofern gleiche Fertigungsgröße.

Einzige Ausnahme: Wenn NV eventuell 28HPM machen sollte.
Müssen muss erstmal gar nichts. Die heutigen deep submicron Prozesse reifen noch eine beträchliche Zeit lang, und man wird die auch nicht direkt ausreizen auf Teufel komm raus, sondern recht konservativ dran gehen, damit wenigstens der Chip überhaupt geht. Das rmöglicht dann natürlich viel Raum für weitere Optimierungen, weil man den Prozess einfach besser ausreizt mit der Zeit.

Es ist der hammer, was einem die Tools an Ergebnissen um die Ohren hauen, je nachdem, welche Modelle man verwendet.

Ich sehe keinen besonderen Gewinn in HPm gegen HP, ausser dass HPm vielleicht etwas mehr Transistoren erlauben koennte und das auch nur unter Bedingungen.

Es kommt meiner Meinung nach vor allem drauf an, was man für SPICE Modelle hat für die Transistoren, und welche Designrules es halt jeweils gibt. Was bringt mir nen super Transistor, wenn das Modell, mit dem ich designe mir sagt, das er eigentlich schlecht ist? Eben rein gar nichts, auf die Modelle muss ich aber blind vertrauen.


Was soll denn GM204 bzw. alles ausser GM200 tolles mit sich bringen dass es diesmal einen sehenswerten Unterschied bei compute gegen GK104 bringen sollte? Und die 90% Leistungsunterschied kannst Du verdammt schnell ohne einen kleineren Prozess wieder vergessen.
da kann ich allerdings voll zustimmen.

Ja, für GM200 gibt es dann ja wohl auch den Hawaii-Nachfolger. Und wenn wir uns nur mal so die bekannten Werte ansehen:

GK110 (Tesla K20): 1,17 TFlop/s Peak, 225W board power => 5,2 GFlops/W, 2,14 GFlops/mm²
GK110 (Tesla K20X): 1,31 TFlop/s Peak, 235W board power => 5,57 GFlops/W, 2,39 GFlops/mm²
GK110b (Tesla K40): 1,43 TFflop/s Peak, 235W board power => 6,08 GFlops/W, 2,60 GFlops/mm²
GK110b (Quadro K6000): 1,73 TFlop/s Peak, 225W board power => 7,70 GFlops/W, 3,17 GFlops/mm²
Hawaii (FirePro W9100): 2,62 TFlop/s Peak, 275W board power => 9,53 GFlops/W, 5,98 GFlops/mm²

Alle Teslas/Quadros haben 12GB RAM, die Hawaii-FirePro natürlich 16 GB. Annahme waren übrigens 547mm² Die-Fläche für GK110(b), es zirkulieren ja auch noch größere Zahlen. Damit ist das Die des GK110(b) etwa 25% größer, was die Flächeneffizienz von Hawaii im Vergleich recht gut aussehen läßt.

Also doch, wenn ich nichts Wesentliches verpasse, sollte Maxwell in der Metrik DP-Flops/W bzw. auch DP-Flops/mm² Einiges draufpacken (wie auch immer, aber separate DP-Einheiten sehen schon ein wenig nach Verschwendung aus [und sind auch aus Stromspar-/Effizienzgründen nicht optimal], sollte nV tatsächlich welche verbauen), um gegen den nach den von Dir zitierten Gerüchten eventuell sogar größeren Hawaii-Nachfolger gut auszusehen.

PS:
Es gibt offenbar eine andere Auslegung der Toleranzen zwischen Teslas und Quadros (bei denen der GK110b zwar auch merklich was bringt, aber eben nicht den Unterschied zwischen Teslas und Quadros), habe der Vollständigkeit halber deswegen beide drin.
100% sign!

Dawn on Titan
2014-08-06, 07:10:44
Ich verstehe die Erwartungen nicht. 780ti Leistung für weniger Geld und weniger Stromverbrauch sind doch lecker. Für mehr Leistung wird ja GM200 erscheinen und natürlich der Monsterchip von AMD.

Dural
2014-08-07, 16:47:35
das es derzeit keine info gibt, lege ich mich für GM204 mal fest :wink:

GM204
2560SP
160TMUs
32ROPs
950MHz

hört sich doch gut an :D

Duplex
2014-08-07, 16:51:59
Naja, also 10-20% mehr Performance als die 780Ti finde ich nicht so besonders spannend, scheiss auf Maxwell.

Ich kauf mir erst eine neue Karte wenn ich 100% mehr als GK110 bekomme, vor 16/14nm kommt eh nichts mehr gutes...

aufkrawall
2014-08-07, 16:59:33
Es sind auf jeden Fall einige Meilen bis zu den zu optimistischen +90% um das ging es nur.

Was für Meilen? 560 Ti vs 680 ist ein vergleichbarer Sprung.
Architekturänderung ist diesmal sogar eher größer und die Die Size auch mehr als +30% gegenüber einem Full Node.

Gipsel
2014-08-07, 21:55:29
Ja, für GM200 gibt es dann ja wohl auch den Hawaii-Nachfolger. Und wenn wir uns nur mal so die bekannten Werte ansehen:

GK110 (Tesla K20): 1,17 TFlop/s Peak, 225W board power => 5,2 GFlops/W, 2,14 GFlops/mm²
GK110 (Tesla K20X): 1,31 TFlop/s Peak, 235W board power => 5,57 GFlops/W, 2,39 GFlops/mm²
GK110b (Tesla K40): 1,43 TFflop/s Peak, 235W board power => 6,08 GFlops/W, 2,60 GFlops/mm²
GK110b (Quadro K6000): 1,73 TFlop/s Peak, 225W board power => 7,70 GFlops/W, 3,17 GFlops/mm²
Hawaii (FirePro W9100): 2,62 TFlop/s Peak, 275W board power => 9,53 GFlops/W, 5,98 GFlops/mm²
edit (da ganz neu):
Hawaii (FirePro S9150): 2,53 TFlop/s Peak, 235W board power => 10,78 GFlops/W, 5,79 GFlops/mm²

Die neueren Teslas/Quadros haben 12GB RAM (die K20[X] nur 6GB), die Hawaii-FirePro natürlich 16 GB. Annahme waren übrigens 547mm² Die-Fläche für GK110(b), es zirkulieren ja auch noch größere Zahlen. Damit ist das Die des GK110(b) etwa 25% größer, was die Flächeneffizienz von Hawaii im Vergleich recht gut aussehen läßt.

Also doch, wenn ich nichts Wesentliches verpasse, sollte Maxwell in der Metrik DP-Flops/W bzw. auch DP-Flops/mm² Einiges draufpacken (wie auch immer, aber separate DP-Einheiten sehen schon ein wenig nach Verschwendung aus [und sind auch aus Stromspar-/Effizienzgründen nicht optimal], sollte nV tatsächlich welche verbauen), um gegen den nach den von Dir zitierten Gerüchten eventuell sogar größeren Hawaii-Nachfolger gut auszusehen.

PS:
Es gibt offenbar eine andere Auslegung der Toleranzen zwischen Teslas und Quadros (bei denen der GK110b zwar auch merklich was bringt, aber eben nicht den Unterschied zwischen Teslas und Quadros), habe der Vollständigkeit halber deswegen beide drin.
100% sign!
Jetzt nochmal mit der gerade vorgestellten S9150 (Tesla-Äquivalent) ergänzt. Den Tesla K40 schlägt man in der Flächeneffizienz mit dem Faktor 2,2 (okay, im Prinzip nur wichtig für die Kosten) und in der Powereffizienz (bei identischen 235W board power) mit dem Faktor 1,77. NVidia muß da mit dem Maxwell-Topdog was tun, selbst wenn der AMD-Vorteil in den Top/Green500-Benchmarks etwas sinken dürfte (aber intel macht mit dem Xeon Phi ja auch noch Kunden abspenstig).

hasebaer
2014-08-07, 22:44:19
Jetzt nochmal mit der gerade vorgestellten S9150 (Tesla-Äquivalent) ergänzt. NVidia muß da mit dem Maxwell-Topdog was tun.

Was ist eigentlich unser Stand der Dinge aus Forensicht, bei GM200?!
Ist das gesichert das der auch in 28nm kommt?

Und hat das Teil wieder extra DP Einheiten oder müsste NV nicht gar auch auf 2:1 SP/DP gehen und dann ganz auf Extra Einheiten verzichten?
Denn wenn GM204 schon ~400mm^2 groß wird (bei 1920-2560 ALUs) und GM200 noch mal ca. 50-70% mehr ALUs (sowie SI) bekommt, ist doch eigentlich kein Platz mehr für die DP Einheiten.

Die Aussicht für GM200 hatte NV ja schon nach unten korrigiert zuletzt.
Siehe Anand:
- http://images.anandtech.com/doci/7900/PascalRoadmap.jpg
- http://www.anandtech.com/show/7900/nvidia-updates-gpu-roadmap-unveils-pascal-architecture-for-2016

Aber auch wenn es nur 12-13 GFLOPS / Watt, werden sollen, statt bis zu 16 GFLOPS / Watt so kann das doch auch bei Maxwell nur dann gehen wenn man mindestens um die 26 SMM (3.328 ALUs) @ 850-900Mhz bei 2:1 hat.

Dural
2014-08-07, 23:28:40
Ich sehe da keine veränderung, bei beiden roudmaps ist maxwell auf der 12.

DP einheiten? Ich glaube die gab es nie, ausser vieleicht beim gt200 obwohl ich mir da nicht mal sicher wäre.

Nakai
2014-08-07, 23:32:23
Was ist eigentlich unser Stand der Dinge aus Forensicht, bei GM200?!
Ist das gesichert das der auch in 28nm kommt?

Und hat das Teil wieder extra DP Einheiten oder müsste NV nicht gar auch auf 2:1 SP/DP gehen und dann ganz auf Extra Einheiten verzichten?
Denn wenn GM204 schon ~400mm^2 groß wird (bei 1920-2560 ALUs) und GM200 noch mal ca. 50-70% mehr ALUs (sowie SI) bekommt, ist doch eigentlich kein Platz mehr für die DP Einheiten.

Aber auch wenn es nur 12-13 GFLOPS / Watt, werden sollen, statt bis zu 16 GFLOPS / Watt so kann das doch auch bei Maxwell nur dann gehen wenn man mindestens um die 26 SMM (3.328 ALUs) @ 850-900Mhz bei 2:1 hat.

GM200 kommt in 28nm, aber welcher Prozess genau, ist noch nicht sicher.

GM200 wird nicht viel größer sein als GK110. Geht auch schwer, man ist so ziemlich am Limit der Diegröße. GM200 wird deswegen auch kaum mehr Transistoren haben. Dementsprechend wird wohl GM200 deutlich uninteressanter für Spieler werden.GM200 DP:SP-Verhältnis schätze ich mal auf 1:2 ein.

GM204: 20SMMs, 4 GPCs
GM200: 25~30SMMs, 5~6 GPCs

GM200 braucht nicht viel Mehrperformance als GM204. 20~30% sollten reichen, um eine Consumerkarte zu rechtfertigen. Wichtig ist, dass GM200 eine hohe DP-Performance liefert.

Ahja NVs Selbsteinschätzungen sind ziemlich lächerlich. Beide Diagramme sind äquivalent. Nur die Skala links wurde angepasst. Bei Architekturen die noch in der Entwicklung sind, gibt es natürlich noch unbekannte Faktoren.
Also statt zwischen 8 und 16 GFLOPs/Watt ist es eben zwischen 10 und 14 GFLOPs/Watt. Ich finde diese Folien sowieso komisch. Tesla hat DP-Einheitehn eingeführt, nicht Fermi. Wieso steht bei Fermi FP64 da? Außer die meinen mit Tesla den alten G80/G92, was Tesla(GT200) nicht ist.

€:

DP einheiten? Ich glaube die gab es nie, ausser vieleicht beim gt200 obwohl ich mir da nicht mal sicher wäre.


Es kann unter bestimmten Gesichtspunkten, schon Sinn machen.

Siehe Interview (http://www.heise.de/newsticker/meldung/GTC-2012-Die-GK110-Schoepfer-ueber-Performance-und-zukuenftige-Herausforderungen-1578605.html) von c't:

c't: Setzt Nvidia bei GK110 auf dedizierte Double-Precision-Einheiten oder arbeiten dafür mehrere Single-Precision-Kerne zusammen?

Danksin: Es gibt eigenständige Double-Precision-Einheiten.

c't: Nehmen diese viel Platz in Anspruch?

Alben: Zumindest nicht wenig. Dadurch belegt eine GK110-SMX deutlich mehr Die-Fläche als jene von GK104. Ein weiterer Platzfresser ist die Implementation der ECC-Funktionen.

c't: GK110 hat ein Double- zu Single-Precision-Verhältnis von 1:3 – wieso nicht 1:2?

Danskin: Das wäre architekturbedingt schwierig umzusetzen.

Alben: Es kostet schlicht mehr Ressourcen: wir bräuchten mehr Register und müssten die Transferraten und andere Dinge ändern.

Danskin: Wahrscheinlich wäre dann auch die Performance pro Watt beziehungsweise pro Millimeter geringer. Das jetzige Verhältnis passt einfach gut.

Dural
2014-08-07, 23:39:00
Gm200 wird sicher nicht über die 25 smms gehen wenn gm204 20 davon hat, die 48rops und der andere kram passt doch sonst nicht in die 500mm2 ausser man geht richtung 600mm2


Ich traue nv in sachen dp einheiten nicht so recht, zudem benötigt gk110 ja nicht wirklich mehr platz als gk104 hmmm

mczak
2014-08-08, 05:54:57
Die 1:2 DP Rate ist ja praktisch zwingend, genau so wie eben 1:2 schwierig gewesen wäre bei Kepler (weil man eben 6x32 SP Einheiten hatte und es nun bei Maxwell nur noch 4x32 sind, jedenfalls gehe ich mal davon aus dass da GM2xx nichts ändert...). Da jetzt auch nicht so viele SMM erwartet werden hätte 1:4 (was problemlos machbar wäre) keine höhere Peak-DP Rate (bei 30 SMM und gleichem Takt) als gk110 was wohl kaum akzeptabel wäre.

Ailuros
2014-08-08, 09:20:29
Die 1:2 DP Rate ist ja praktisch zwingend, genau so wie eben 1:2 schwierig gewesen wäre bei Kepler (weil man eben 6x32 SP Einheiten hatte und es nun bei Maxwell nur noch 4x32 sind, jedenfalls gehe ich mal davon aus dass da GM2xx nichts ändert...).

Jeder Kepler SMX hat afaik 2 FP64 SIMD32 neben den 6 FP32 SIMD32. Was genau haette gegen 3 FP64 SIMD32 gesprochen?

1:3 bzw. 1:2 oder weiss der Geier was noch ist rein theoretisch da es sich um dedizierte FP64 SPs handelt und ja GM200 wird wohl eine 1:2 Relation haben.

Da jetzt auch nicht so viele SMM erwartet werden hätte 1:4 (was problemlos machbar wäre) keine höhere Peak-DP Rate (bei 30 SMM und gleichem Takt) als gk110 was wohl kaum akzeptabel wäre.

Bei theoretischen 25 SMMs mit jeweils 64 FP64 SPs sind es bei hypothetischen 800MHz 2.56 TFLOPs DP oder anders 11.4 DP FLOPs/W.

--------------------------------------------------------------------------------------------------------------------------------
Am Rand nochmal: dedizierte FP64 kosten mehr in die area, sparen aber insgesamt mehr Strom. Ist zwar nur eine synthetisis Rate aber ein FP64 SP@1GHz kostet in 28LP/TSMC 0.025mm2. GM200 wird entweder auf 28HPm oder HP sein, wird NICHT auf 1GHz takten und bei hypothetischen 1600 FP64 SPs sind es 40mm2 nur fuer synthesis. Natuerlich kommt noch einiges an Logik dazu, aber der groesste Brocken fuer die Einheiten selber liegt im synthetis Wert. Sind es insgesamt mit irgendwelcher surrounding logic sogar 100mm2 ist es immer noch kein Beinbruch. Wenn HPC nicht waere haette NV den GM200 sich theoretisch sogar fuer diese Runde gleich ganz haette sparen koennen.

Gm200 wird sicher nicht über die 25 smms gehen wenn gm204 20 davon hat, die 48rops und der andere kram passt doch sonst nicht in die 500mm2 ausser man geht richtung 600mm2

GM200 liegt genau in der area Mitte afaik.

Ich traue nv in sachen dp einheiten nicht so recht, zudem benötigt gk110 ja nicht wirklich mehr platz als gk104 hmmm

GK110
551 mm2
7.1b transistors
15 SMXs (64 FP64 SPs/SMX)

GK104
294 mm2
3.54b transistors
8 SMXs (8 FP64 SPs/SMX)

GK106
214 mm2
2.54b transistors
5 SMXs (8 FP64 SPs/SMX)

GK107
118 mm2
1.3b transistors
2 SMXs (8 FP64 SPs/SMX)

Dural
2014-08-08, 10:55:41
ja und? GK110 ist pro SMX ca. 10% grösser (Milchmädchenrechnung) als GK104, darin sind aber noch mehr ROPs, grösseres SI, deutlich mehr Cache, ECC und der sonstige Kram halt... und da sollen dann noch 960 DP ALUs Platz haben? OK.

Schau mal wie viel grösser Hawaii/Tahiti ist.

Ailuros
2014-08-08, 11:00:30
ja und? GK110 ist pro SMX ca. 10% grösser (Milchmädchenrechnung) als GK104, darin sind aber noch mehr ROPs, grösseres SI, deutlich mehr Cache, ECC und der sonstige Kram halt... und da sollen dann noch 960 DP ALUs Platz haben? OK.

Wenn Dir nichts bei der Liste einleuchtet kann ich Dir nicht wirklich weiterhelfen. Wenn Du schon mit Milchmaedchenrechnungen spielen willst, dann fehlen Dir eigentlich einige hundert Million Transistoren fuer den GK110 wenn man wirklich annaehernd korrekter hochrechnet. NV engineering hat mehr als nur einmal privat und oeffentlich bestaetigt dass es dedizerte FP64 Einheiten in Kepler chips gibt und daran gibt es NICHTS zu bezweifeln.

Schau mal wie viel grösser Hawaii ist.

Ich trau mich nicht nach dem Zusammenhang zu fragen....

HOT
2014-08-08, 11:09:50
Wenn man jetzt Fiji bedenkt, der ziemlich sicher vorm GM200 auf den Markt entlassen wird (Tapeout war ja offenbar früher, könnte auch deutlich früher gewesen sein) und sicherlich 4000 Shader hat und mit tödlicher Sicherheit wieder ein 1/2-Verhältnis bietet... rein von der Rechenleistung her wirds problematisch für NV. Da muss man voll auf Effizienzverbesserungen setzen.
Wie gesagt, verbrät Maxwell ja noch mehr Platz, wahrscheinlich durch die großen Caches, als Kepler. Ein GM204 hätte lt. Milchmädchenrechnung nur 1920 Shader und 8 MiB L2-Cache mit GM107 als Grundlage. Ein GM200 wird schon <=3000 1DP zu 2SP Shader mitbringen.

Ailuros
2014-08-08, 11:15:44
Wenn man jetzt Fiji bedenkt, der ziemlich sicher vorm GM200 auf den Markt entlassen wird (Tapeout war ja offenbar früher, könnte auch deutlich früher gewesen sein) und sicherlich 4000 Shader hat und mit tödlicher Sicherheit wieder ein 1/2-Verhältnis bietet...

Wann war denn der tapeout von Fiji genau und wie gross ist der die denn? Nicht dass es hier auch irgendwelche Relevanz gibt bei so verschiedenen Architekturen, aber die Unmenge an BS die hier herumfliegt muss auch irgendwo ihre "Quelle" haben.

Wie gesagt, verbrät Maxwell ja noch mehr Platz, wahrscheinlich durch die großen Caches, als Kepler. Ein GM204 hätte lt. Milchmädchenrechnung nur 1920 Shader und 8 MiB L2-Cache mit GM107 als Grundlage. Ein GM200 wird schon <=3000 1DP zu 2SP Shader mitbringen.

Du darfst genauso wie Dural Dich in Kontakt mit NV engineering setzen und ihnen "erklaeren" wie sie Kepler eigentlich entwickelt haben.

HOT
2014-08-08, 11:18:54
Wann war denn der tapeout von Fiji genau und wie gross ist der die denn? Nicht dass es hier auch irgendwelche Relevanz gibt bei so verschiedenen Architekturen, aber die Unmenge an BS die hier herumfliegt muss auch irgendwo ihre "Quelle" haben.

Gab doch diese Quelle von der beauftragten Firma, auf der (ziemlich sicher) Fiji und Bermuda auftauchten (>500 und >350 mm²). Beide hatten vor dem 2.HJ Tapeout (Wortlaut war innerhalb des letzten Jahres), also definitiv vor dem GM200 und beide Chips sind in 28nm HPM (99% TSCM) gefertigt. Im Volcanic-Thread gibts dazu mehr.


Du darfst genauso wie Dural Dich in Kontakt mit NV engineering setzen und ihnen "erklaeren" wie sie Kepler eigentlich entwickelt haben.
Kepler ist doch gar nicht das Thema hier. Zudem glaube ich dass du mich einfach missverstanden hast. Ich gehe auch davon aus, dass GM200 genauso flächeneffizient wird wie GM204.


Ich brauch NV Ingeneuren sowieso nichts erklären, denn das hat man den Ingeneuren ja wenig zu tun. Das ist ja ne Planungssache von Leuten, die den Markt vor Jahren einschätzen mussten. Darauf basiert doch die Entscheidung wieder mehr Effizienz pro Shader zu forcieren. Der GM204 ist ja nicht im Mai entstanden sondern die Entwicklung läuft sicherlich seit 2012 und da gab es noch nicht mal einen Hawaii...

Ailuros
2014-08-08, 11:27:25
Gab doch diese Quelle von der beauftragten Firma, auf der (ziemlich sicher) Fiji und Bermuda auftauchten (>500 und >350 mm²).

Wenn dann wohl "Quelle" und sonst nichts.

Beide hatten vor dem 2.HJ Tapeout (Wortlaut war innerhalb des letzten Jahres), also definitiv vor dem GM200 und beide Chips sind in 28nm HPM (99% TSCM) gefertigt. Im Volcanic-Thread gibts dazu mehr.

Ach so "genau" war die "Quelle"....

Das brauch ich garnicht, denn das hat man den Ingeneuren ja wenig zu tun. Das ist ja ne Planungssache von Leuten, die den Markt vor Jahren einschätzen mussten. Darauf basiert doch die Entscheidung wieder mehr Effizienz pro Shader zu forcieren.

Wenn die eigentlichen hw engineers privat und oeffentlich dedizierte Einheiten bestaetigen dann gibt es keinen Grund daran zu zweifeln.

Der GM204 ist ja nicht im Mai entstanden sondern die Entwicklung läuft sicherlich seit 2012 und da gab es noch nicht mal einen Hawaii...

Ist auch nicht relevant zum obrigen.

Gipsel
2014-08-08, 12:19:16
NV engineering hat mehr als nur einmal privat und oeffentlich bestaetigt dass es dedizerte FP64 Einheiten in Kepler chips gibt und daran gibt es NICHTS zu bezweifeln.Außer dem Sinn. ;)
Denn das hier:
Am Rand nochmal: dedizierte FP64 kosten mehr in die area, sparen aber insgesamt mehr Strom.Ist meiner Meinung nach eine Schutzbehauptung oder was auch immer aber eben keine umfassende Darstellung. Es mag vielleicht für die Recheneinheiten selber gelten, aber in der Gesamtbetrachtung kosten Datenbewegungen am meisten, also das Lesen und Schreiben der Werte in die Register und der Transfer zu den ALUs, nicht das eigentliche Rechnen (das sagt nV ja selber). Und bei den Datenbewegungen sind eben Multiprecision-Einheiten (also das "Zusammenlegen" von Einheiten bzw. das "Loopen" in ihnen) prinzipiell im Vorteil.

Nakai
2014-08-08, 12:28:30
Jeder Kepler SMX hat afaik 2 FP64 SIMD32 neben den 6 FP32 SIMD32. Was genau haette gegen 3 FP64 SIMD32 gesprochen?


Eine DP-Rate von 1:3 spricht sehr stark für dedizierte DP-Einheiten. Im Interview, was ich auch zitiert habe, wurden "Probleme" erörtert, welche eine höhere Anzahl an dedizierten FP64-Einheiten verhindert hätten bzw. deren Effizienz vermindert hätte. Ich befürchte, die Registerfile-Problematik bei Kepler, wäre so ein Punkt, welcher die Bandbreite für höhere DP-Raten eingeschränkt hätte. Es gab wahrscheinlich noch andere Punkte, aber als spekulierender Laie steht man da auf verlorenem Posten.

Und noch etwas vom Interview:

c't: Worin liegen die größten Herausforderungen bei der Entwicklung zukünftiger GPUs?

Danskin: Die größte Herausforderung bleibt die Leistungsaufnahme. Schaut man etwas in die Vergangenheit, haben wir und AMD bis zu einem bestimmten Punkt eine höhere Performance schlicht mit einer höheren Leistungsaufnahme erkauft. Das hat sich nun aber geändert, der Leistungsaufnahme sind klare Grenzen gesetzt. Auch jeweils feinere Fertigungstechniken helfen diesbezüglich nicht mehr in dem Maße wie in der Vergangenheit.

Alben: Es geht schlicht primär um die Performance pro Watt. Das Design eines Grafikchips muss sich diesem Faktor unterordnen.

GM200 liegt genau in der area Mitte afaik.

Schön, dann ist eine DP-Rate von 1:2 ziemlich gesichert. Anders geht es sowieso nicht wirklich, wie du es schon gesagt hast:

Bei theoretischen 25 SMMs mit jeweils 64 FP64 SPs sind es bei hypothetischen 800MHz 2.56 TFLOPs DP oder anders 11.4 DP FLOPs/W.

GM200 wird kaum schneller als GM204 werden. Eventuell sehen wir eine Titan-Maxwell, mit ~20% auf GM204. Recht viel mehr sehe ich da aber nicht kommen.

GM204 ~ Titan+~20%
GM200 ~ Titan+~50%

GK110
551 mm2
7.1b transistors
15 SMXs (64 FP64 SPs/SMX)

GK104
294 mm2
3.54b transistors
8 SMXs (8 FP64 SPs/SMX)


GM200
~550mm2
~7.5b transistors

GM204
~380mm2
~4.7b transistors


Ja, der Sprung von GM204 auf GM200 wird kleiner, als bisher sein.

aufkrawall
2014-08-08, 12:39:40
Ja, der Sprung von GM204 auf GM200 wird kleiner, als bisher sein.
Für Spieler prinzipiell eine tolle Sache. Jetzt müssten nur noch Preispolitik und Fertigungstechnik stimmen. :redface:

Ist schon etwas zu einem GM204 GCN2.0-Äquivalent bekannt?

Hugo
2014-08-08, 12:59:01
gab es da nicht mal irgendwo eine Meldung, dass NV die FP64 Units für FP32 Berechnung nutzen kann(wird, will)??

AffenJack
2014-08-08, 13:06:36
Ist meiner Meinung nach eine Schutzbehauptung oder was auch immer aber eben keine umfassende Darstellung. Es mag vielleicht für die Recheneinheiten selber gelten, aber in der Gesamtbetrachtung kosten Datenbewegungen am meisten, also das Lesen und Schreiben der Werte in die Register und der Transfer zu den ALUs, nicht das eigentliche Rechnen (das sagt nV ja selber). Und bei den Datenbewegungen sind eben Multiprecision-Einheiten (also das "Zusammenlegen" von Einheiten bzw. das "Loopen" in ihnen) prinzipiell im Vorteil.

Glaube ich nicht unbedingt, PowerVR verbaut in seinen Chips auch nicht umsonst dedizierte FP16 und FP32 Einheiten und da sind wir wirklich in Bereichen wo es um jede Stromersparnis geht. Das würden sie kaum machen, wenn das mehr Leistungsaufnahme kosten würde. Was für einen Sinn würde es denn für Nv und PVR machen sonst extra Einheiten zu benutzen? In jedem Fall hat man da immer nen Flächennachteil, weil man die Shader mehrfach verbaut.

Nakai
2014-08-08, 13:10:24
gab es da nicht mal irgendwo eine Meldung, dass NV die FP64 Units für FP32 Berechnung nutzen kann(wird, will)??

Meinst du das hier? http://pastebin.com/jm93g3YG

:freak:;D:rolleyes::P

Ich hoffe die Smileys verdeutlichen, was man davon halten sollte. :D

Ahja, es soll nicht heißen, dass da alles Unsinn ist, was da steht. Nein, im Gegenteil es ist eigentlich sogar relativ vernünftig, wenn man die Irrsinnigen Speks herausnimmt.

Für Spieler prinzipiell eine tolle Sache. Jetzt müssten nur noch Preispolitik und Fertigungstechnik stimmen.

Ich glaube kaum, dass NV ihre Marge in irgendeiner Hinsicht schmälert, nur damit ein paar User froh sind. Billiger als Titan, wird es schon sein, aber ich glaube kaum, dass der Preis gerechtfertigt sein wird.

aufkrawall
2014-08-08, 13:19:19
Ich glaube kaum, dass NV ihre Marge in irgendeiner Hinsicht schmälert, nur damit ein paar User froh sind. Billiger als Titan, wird es schon sein, aber ich glaube kaum, dass der Preis gerechtfertigt sein wird.
Bei Titan konnten sie sich mit der Fertigung rausreden. Wenn sie GM200 wieder mit Titanpreisen brächten, wären die Margen astronomisch. 1000€ für maximal GM204 + 30% in 28nm, da muss man echt einen an der Waffel haben (Titan unleashed war ja wenigstens was besonderes von der Leistung her)...
GM204 ohne Konkurrenz kann einem aber auch Sorgen machen...
Hoffentlich wirds wirklich nur ein 780-Ersatz, an dem man selber noch ordentlich Hand anlegen kann.

Dawn on Titan
2014-08-08, 13:42:24
AMd schläft doch nicht. Und AMD hat deutlich mehr Spielraum bei den neuen Chips. NV ist imho langweilig, bei AMD wird es abgehen.

Nakai
2014-08-08, 13:48:33
AMd schläft doch nicht. Und AMD hat deutlich mehr Spielraum bei den neuen Chips. NV ist imho langweilig, bei AMD wird es abgehen.

Bei AMD ist die Leakage/mm2 deutlich schlechter als NV. AMD muss erst daran etwas tun. Hawaii in Quiet verbraucht weniger als Tahiti, aber in Uber wird es krass.

Dawn on Titan
2014-08-08, 13:56:01
Und ich sage ja man hat mehr Potential.

Hugo
2014-08-08, 14:32:49
Meinst du das hier? http://pastebin.com/jm93g3YG

:freak:;D:rolleyes::P



ja das ware es glaub ich.
Wäre das denn überhaupt möglich?

Nakai
2014-08-08, 14:58:51
ja das ware es glaub ich.
Wäre das denn überhaupt möglich?

Also FP32-Berechnung auf FP64-Einheiten. Klar, nur gibt es ein paar Probleme:
1. Die FP64-Einheiten müssen genauso verdrahtet werden, wie die FP32-Einheiten. Ergo Verdrahtungsaufwand steiget. Eventuell benötigt man mehr Registerfiles.
2. FP64-Einheiten haben schonmal eine höhere Latenz, als FP32-Einheiten. Wie das dann mit dem Scheduling funktioniert und das gehandhabt wird, keine Ahnung.
3. Berechne ich FP32-Werte in FP64-Einheiten erhaltet man FP64-Werte, welche, wenn sie zurück in FP32-Register geschrieben werden, truncated und dementsprechend gerundet werden müssten. Kurz, es kommen "andere" Ergebnisse, als bei reiner FP32-Berechnung raus. Vor allem bei allen Float-Sonderfälle wird es interessant. Wäre das überhaupt noch IEEE-754-2008 konform?

Also es wäre möglich, aber nicht unproblematisch.

€: Anmerkung: Natürlich hängen die Probleme von der generellen Implementierung der FP64-Einheiten ab.

HOT
2014-08-08, 15:36:49
[...]
Wenn die eigentlichen hw engineers privat und oeffentlich dedizierte Einheiten bestaetigen dann gibt es keinen Grund daran zu zweifeln.
[...]
Hab ich nicht bezweifelt ;).

aufkrawall
2014-08-08, 15:40:10
Bei AMD ist die Leakage/mm2 deutlich schlechter als NV. AMD muss erst daran etwas tun. Hawaii in Quiet verbraucht weniger als Tahiti, aber in Uber wird es krass.
Das ist aber "unfair", mit besserem Kühler ist der Spieleverbrauch nicht so schlecht (hier sind ja auch die NV-Referenzkäufer in der Minderzahl).
Problem ist eher, dass der Chip kaum Takt mitmacht und deshalb fast alle Custom Designs nur im mittleren einstelligen Prozentbereich schneller als Uber sind.

Für Maxwell gabs halt schon lange einen Vorgeschmack, was die Effizienz angeht. GCN war der größte Architektursprung bei AMD seit Langem. Können die da so einfach GCN 2.0 mit ähnlichem Effizienzgewinn wie bei Maxwell aus dem Ärmel ziehen?
Btw. ist auch bei vergleichbaren Temperaturen das Perf/W-Verhältnis bei GCN schlechter als bei Kepler im Schnitt, also müssen sie eh schon stärker aufholen.

Ailuros
2014-08-08, 15:44:55
Glaube ich nicht unbedingt, PowerVR verbaut in seinen Chips auch nicht umsonst dedizierte FP16 und FP32 Einheiten und da sind wir wirklich in Bereichen wo es um jede Stromersparnis geht. Das würden sie kaum machen, wenn das mehr Leistungsaufnahme kosten würde. Was für einen Sinn würde es denn für Nv und PVR machen sonst extra Einheiten zu benutzen? In jedem Fall hat man da immer nen Flächennachteil, weil man die Shader mehrfach verbaut.

...und drei Mal duerft Ihr raten wieso ich glaube dass zukuenftige PowerVR GPU IP mit getrennten FP64 Einheiten ankommen wird (sonst koennte ich auch nicht so leicht die synthesis rate von einer Einheit unter 28LP wissen).

Ist zwar noch mehr OT aber die FP16 SPs in den 6x30/6x50 Rogue Varianten verbrauchen weniger als die Haelfte Strom fuer FP16 als eine FP32 SP.

Und ich sage ja man hat mehr Potential.

Na tut mir leid aber im gegebenen Zusammenhang zu den vorigen Posts: ja natuerlich hat AMD mehr Potential fuer noch lautere GPUs :biggrin:

Dawn on Titan
2014-08-08, 16:03:54
.
Na tut mir leid aber im gegebenen Zusammenhang zu den vorigen Posts: ja natuerlich hat AMD mehr Potential fuer noch lautere GPUs :biggrin:

Lauter geht immer :biggrin: Aber was wäre wenn sie eine brauchbare Refrenzkühlung bringen würden. Ok sehr unwahrscheinlich...:wink:

Ailuros
2014-08-08, 16:11:56
Lauter geht immer :biggrin: Aber was wäre wenn sie eine brauchbare Refrenzkühlung bringen würden. Ok sehr unwahrscheinlich...:wink:

Es war nichts anderes als ein relativ uebler Scherz ;)

aufkrawall
2014-08-08, 16:14:38
...gefolgt von einem üblen Scherz.
Erst Besserung geloben und dann einen Grill 290X und eine Turbine 290 taufen...

mczak
2014-08-08, 17:35:36
Jeder Kepler SMX hat afaik 2 FP64 SIMD32 neben den 6 FP32 SIMD32. Was genau haette gegen 3 FP64 SIMD32 gesprochen?
Naja also dass das nicht so einfach geht hat ja schon der eine nivida-Mensch behauptet im c't Interview. Dass es einfach 6x32 FP32 Einheiten sind und es keine Rolle spielt ob man da 1, 2, oder 3 x32 FP64 verbaut entspricht nicht ganz der Wahrheit denn der interne Aufbau ist einiges komplizierter, da gab's mal diese schönen Diagramme:
http://www.hardware.fr/articles/916-3/maxwell-1st-gen-smm-details.html
Für Kepler würde das implizieren dass man sowohl gesharte wie nicht-gesharte FP64 Einheiten hat. Sicherlich irgendwie machbar (bei den FP32 geht's ja auch), allerdings hätte man sowieso zu wenig Registerbandbreite (das Problem haben die FP32 Einheiten ja auch).
Bei Maxwell allerdings würde 1:3 wohl sehr schwierig werden.

Bei theoretischen 25 SMMs mit jeweils 64 FP64 SPs sind es bei hypothetischen 800MHz 2.56 TFLOPs DP oder anders 11.4 DP FLOPs/W.

Klar bei 1:2, ich habe ja bloss gesagt bei 1:4 hätte man eben keine höhere Rate als bisher.

Dawn on Titan
2014-08-08, 18:02:23
Es war nichts anderes als ein relativ uebler Scherz ;)

Meine Antwort doch auch :smile:

Ailuros
2014-08-08, 22:41:35
Meine Antwort doch auch :smile:

Better safe than sorry ;)

mczak,

Kein Einwand. Mir ging es nur darum dass technisch nichts dagegen spricht. Haetten sie sich für 96 SPs/SMX entschieden hatten sie auch jeglichen cluster anders ausgelegt, welches sie wohl einen cluster weniger gekostet hätte. Für den HW designer ist es verdammt schwer 4 Jahre in die Zukunft die richtige Balancen zwischen HPC und 3D/desktop einzuschätzen.

mczak
2014-08-09, 00:29:24
Kein Einwand. Mir ging es nur darum dass technisch nichts dagegen spricht. Haetten sie sich für 96 SPs/SMX entschieden hatten sie auch jeglichen cluster anders ausgelegt, welches sie wohl einen cluster weniger gekostet hätte. Für den HW designer ist es verdammt schwer 4 Jahre in die Zukunft die richtige Balancen zwischen HPC und 3D/desktop einzuschätzen.
Ah da sind wir uns ja einig.
Abgsehen dvaon es fragen sich ja alle wie sich GM204 eigentlich die "2" verdient, vielleicht überrascht nvidia und da gibt es tatsächlich unerwartete Aenderungen (denke aber die SMM überleben das so grob betrachtet ziemlich unverändert was den prinzipiellen Aufbau angeht). Damien bei hardware.fr hat behauptet ziemlich sicher die L1/Tex Cache Geschichte würde anders sein, das würde wohl schon den Sprung rechtfertigen (gk1xx -> gk2xx war architekturtechnisch gesehen auch nicht gerade ein Riesensprung). Vielleicht gibt's ja auch z.B. Aenderungen in der Weise wie die Multi-GPC Geschichte funktioniert (wobei "Aenderungen" da gegenüber GM107 das falsche Wort ist, da gibt es schliesslich sowas gar nicht erst).

Skysnake
2014-08-09, 11:37:44
...und drei Mal duerft Ihr raten wieso ich glaube dass zukuenftige PowerVR GPU IP mit getrennten FP64 Einheiten ankommen wird (sonst koennte ich auch nicht so leicht die synthesis rate von einer Einheit unter 28LP wissen).

Ist zwar noch mehr OT aber die FP16 SPs in den 6x30/6x50 Rogue Varianten verbrauchen weniger als die Haelfte Strom fuer FP16 als eine FP32 SP.

Na tut mir leid aber im gegebenen Zusammenhang zu den vorigen Posts: ja natuerlich hat AMD mehr Potential fuer noch lautere GPUs :biggrin:
Und die haben dir auch ganz sicher bestätigt, dass die FP16 und FP32 Einheiten KEINE! Transitoren bei den ALUs sharen?

Wenn nicht, kannste die Aussage wieder in die Tonne treten, denn man kann FP16 auch auf FP32 einheiten 1:1 laufen lassen. Dann macht die halbe Einheit halt Blödsinn kostet aber dennoch genau so viel Energie, als ob Sie was sinnvolles machen würde. Usw usw usw.

Man kann da so viel drehen und wenden, das es oft nur noch Ansichtssache ist, was man denn nun da hat.

2 FP16 Einheiten, die mit etwas Zusatzaufwand zu 1 FP32 wird,
1 FP32 Einheit, die mit etwas Zusatzaufwand zu 2 FP16 wird,
2 FP16 Einheiten und eine FP32 Einheit, die sich in gewissen Bereichen etwas sharen oder was?

Also nichts gegen dich, aber bei solchen Allgemeinsätzen bin ich sehr vorsichtig geworden.

Gipsel
2014-08-09, 12:58:21
Oder wie Ryan Smith von anandtech schrieb, nachdem er darüber gebrieft wurde (http://www.anandtech.com/show/7793/imaginations-powervr-rogue-architecture-exposed/3):
Unfortunately Imagination is unable to share the complete details with us of why this is (as we've noted before, they’re not yet fully open), [..]
But from the perspective of an individual pipeline it’s interesting to see that with Series 6XT Imagination has shaken things up by "adding" 2 more FP16 ALUs. Keeping in mind that these are logical diagrams and not physical diagrams – in reality these ALUs are almost certainly tied together in a limited fashion rather than standing alone.

Ailuros
2014-08-09, 14:40:12
Das Zeug gehört in den IMG thread. Ja es sind eigenständige FP16 ALUs. Da ich aber bezweifle dass man alle FP32 und alle FP16 ALUs gleichzeitig nutzen kann könnt Ihr Euch selber ausdenken wieso.

Sonst gibt es bei ULP GPUs auch noch INT8 Einheiten die auch keiner ausdrücklich erwähnt.

ARM benutzt in ihrem neusten IP 1:4 FP64. Drei Mal dürft Ihr raten warum man bei diesen 2x Mal so viel area, clusters und 50% mehr FP32 FLOPs braucht um der Rogue Effizienz gleich zustehen (Allwinner A80, G6230@780MHz/99.8 GFLOPs 11.4fps Manhattan offscreen, Rockchip RK3288, Mali T760@700MHz/81.6 GFLOPs 7.4 fps).

AnarchX
2014-08-09, 20:21:51
Das könnte wohl ein Anhaltspunkt zur HPC-Eignung von GM204 geben und die Notwendigkeit von GK210 erklären:

GPU Architecture | FLOPS / Watt| Timeline
GK110| 12 | Current
GK210| 14 | Summer 2014
GM200 | 25| End of 2014
GP100| 35| Beginning of 2016

Aus diesem Paper: http://arxiv.org/abs/1407.4698
Daran hat auch jemand von NV mitgeschrieben.

hasebaer
2014-08-09, 20:43:08
Hmm dann setzt Nvidia mit dem GK210 jetzt wirklich extra nur für 6 Monate einen reinen HPC Mid-Life Kicker auf,
... na mal schauen wann davon die ersten in Titan Blacks zufinden sind.

AffenJack
2014-08-09, 21:12:41
Das könnte wohl ein Anhaltspunkt zur HPC-Eignung von GM204 geben und die Notwendigkeit von GK210 erklären:

GPU Architecture | FLOPS / Watt| Timeline
GK110| 12 | Current
GK210| 14 | Summer 2014
GM200 | 25| End of 2014
GP100| 35| Beginning of 2016

Aus diesem Paper: http://arxiv.org/abs/1407.4698
Daran hat auch jemand von NV mitgeschrieben.

Wo du solche Sachen immer ausgräbst ist unglaublich;)

Da die Flops per Watt merkwürdig sind, hab ich für ne grobe Hochrechnung der GM200 Shader nur ne Verdopplung der DP von gerade 1,4Tflop angenommen. Mit 3840 Shadern, 1:2 DP und 750mhz (K40 aktuell 743mhz) käme man auf 2,88Tlop DP. Das könnte halbwegs passen mit 30 SMM, statt 20 wie dann GM204 wahrscheinlich. Allerdings wäre das auch ne Leistung das da alles reinzuquetschen.

Ailuros
2014-08-09, 21:56:04
Es sind FP32 FLOPs in der Tabelle falls ich Dich nicht falsch verstanden habe. Es sind nicht 30 sondern weniger ;)

Dural
2014-08-09, 22:05:22
gm200 soll 100% effizienter als gk110 sein?! gp200 jedoch nur noch 50% auf gm200 trotz neuer 16nm fertigung hmmmm

AffenJack
2014-08-09, 22:13:53
Es sind FP32 FLOPs in der Tabelle falls ich Dich nicht falsch verstanden habe. Es sind nicht 30 sondern weniger ;)

Hast du nicht, aber auch bei FP32 hab ich keine Ahnung woher die werte herkommen. Außerdem machte eine Verdopplung von FP32/W für mich überhaupt keinen Sinn. Mit Dp Veränderung von 1:3 auf 1:2 und Maxwell Effizienzverbesserungen konnte ich ne Verdopplung der FLop/W ja verstehen, aber in FP32 macht das nun keinen Sinn mehr.

Ailuros
2014-08-09, 22:24:54
GM200 hat ca 12 DP FLOPs/W. Bei 225W TDP sind es wieviel?

AffenJack
2014-08-09, 22:36:38
2,7Tflop, fast das was ich aufgrund der Tabelle einfach mal angenommen hatte:freak:

Ailuros
2014-08-09, 22:39:11
Weniger; man zwitschert über etwas mehr als 3k SPs.

AnarchX
2014-08-09, 22:53:58
Die Werte von oben in der Tabelle beziehen sich wohl auf einen "xGPU" Benchmark, der diese Werte unter SP ermittelt: http://arxiv.org/abs/1407.8116 (... HW-Tuning als Wissenschaft. ;D)

GMxxx dürfte da wohl deutlich näher am theoretischen SP-Durchsatz liegen.

Weniger; man zwitschert über etwas mehr als 3k SPs.
6x4SMM mit 384-Bit sind wohl durchaus möglich.
Bei GM204 wären anbetracht der Die-Größe wohl 4x5SMM möglich, aber dafür wohl nur 1/4 bis 1/8 DP.

Ailuros
2014-08-09, 23:26:24
Kitguru sieht anhand dem die shot nur 300mm2 (ja ehrlich wo?)....und spekuliert auf 15 clusters für 204. Man kann es unter - und über-treiben.

AnarchX
2014-08-10, 09:23:57
300mm² sind schon weit realitätsfern, im Bereich 400mm² sind wir laut dem Bild definitiv.

Aber wohl eher 4x4 oder GK106-artig: 2x4+2x5?

Hübie
2014-08-10, 11:43:23
Das sind dann irgendwas um die 4,5-4,6 Mrd. Transistoren, oder? Dann könnten dass 2304 SPs im GM204 sein. Also exakt GTX 780 bei wahrscheinlich 2,5 MB größerem Cache (insgesamt dann 4 MB L3$).

Edgecrusher86
2014-08-10, 16:15:18
Je nach Packdichte könnte das hinkommen, wobei GM107 gegen die anderen Mainstream bis High-End-GPUs beider IHVs recht schlecht abschneidet.
Bleibt zu hoffen, dass GM204 in der Beziehung grob wie GK110 liegt oder vielleicht etwas darüber.


GM204

-> 370mm²
4440 Mio. vs. 4810 Mio. vs. 5180 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²


-> 380mm²
4560 Mio. vs. 4940 Mio. vs. 5320 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²


-> 390mm²
4680 Mio. vs. 5070 Mio. vs. 5460 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²


-> 400mm²
4800 Mio. vs. 5200 Mio. vs. 5600 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²


-> 410mm²
4920 Mio. vs. 5330 Mio. vs. 5760 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²


-> 420mm²
5040 Mio. vs. 5460 Mio. vs. 5880 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²


-> 430mm²
5160 Mio. vs. 5590 Mio. vs. 6020 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²



Ich vermute etwas zwischen 4,7 - 5,2 Mrd. Transistoren für GM204 - also eine Packdichte von 12,x Mio./mm² dürfte schon gegeben sein bei einem Chip dieser Größe. :)


NVIDIA

GK110
7100 Mio. Transistoren
551mm²
~12,886 Mio./mm²

GK104
3540 Mio. Transistoren
294mm²
~12,041 Mio./mm²

GK106
2540 Mio. Transistoren
221mm²
~11,493 Mio./mm²

GM107
1870 Mio. Transistoren
148mm²
~12,635 Mio./mm²

GK107
1300 Mio. Transistoren
118mm²
~11,017 Mio./mm²


AMD

Hawaii XT
6200 Mio. Transistoren
438 mm²
~14,155 Mio./mm²

Tahiti XT
4313 Mio. Transistoren
365 mm²
~11,816 Mio./mm²

Pitcairn XT
2800 Mio. Transistoren
212 mm²
~13,207 Mio./mm²

Bonaire XT
2080 Mio. Transistoren
160 mm²
13 Mio./mm²

Cap Verde XT
1500 Mio. Transistoren
123 mm²
~12,195 Mio./mm²

von Richthofen
2014-08-10, 16:51:38
GM107 liegt bei 148mm2 - ergo 12,635 mio./mm2

Ailuros
2014-08-10, 17:39:40
Das sind dann irgendwas um die 4,5-4,6 Mrd. Transistoren, oder? Dann könnten dass 2304 SPs im GM204 sein. Also exakt GTX 780 bei wahrscheinlich 2,5 MB größerem Cache (insgesamt dann 4 MB L3$).

Klingt nach einem relativen Treffer nur sind es immer noch keine 400mm2 afaik :freak: Moment schwirren irgendwelche schlitzaeugigen Abschreiber hier rum? :weg:

Hübie
2014-08-10, 17:53:44
370-380 nach meiner Analyse (so man es so nennen kann ;D). Dann erscheinen 4,5-4,6 Mrd Transistoren aber zuviel. Zumindest wäre so eine Packdichte unüblich.

Ailuros
2014-08-10, 17:58:51
370-380 nach meiner Analyse (so man es so nennen kann ;D). Dann erscheinen 4,5-4,6 Mrd Transistoren aber zuviel. Zumindest wäre so eine Packdichte unüblich.

Nicht dass es unbedingt stimmen muss aber rein theoretisch bedeuten 4.5Mrd bei 370mm2 eine Packdichte von etwas ueber 12Mio/mm2. Was soll daran so abwegig sein? Ich hab keine Ahnung ueber die Transistoren-Anzahl vom 204 und es koennte locker auch eine hoehere Packdichte sein falls sie HPm benutzt haben.

AnarchX
2014-08-10, 18:00:22
370-380 nach meiner Analyse (so man es so nennen kann ;D). Dann erscheinen 4,5-4,6 Mrd Transistoren aber zuviel. Zumindest wäre so eine Packdichte unüblich.
GM107 liegt bei 148mm2 - ergo 12,635 mio./mm2
GM204 dürfte hier noch zulegen, wegen größerem Die und geringerem IO-Anteil.
In die Richtung 5Mrd. könnte man sich durchaus bewegen.

Wenn NV den Verschnitt/Randbereich entsprechend nicht in die Die-Size einrechnet, kommt man vielleicht auf 380-390mm².

Hübie
2014-08-10, 18:35:50
Nicht dass es unbedingt stimmen muss aber rein theoretisch bedeuten 4.5Mrd bei 370mm2 eine Packdichte von etwas ueber 12Mio/mm2. Was soll daran so abwegig sein? Ich hab keine Ahnung ueber die Transistoren-Anzahl vom 204 und es koennte locker auch eine hoehere Packdichte sein falls sie HPm benutzt haben.

Bin nicht der beste Kopfrechner. :redface: Hast Recht. 12,16 Mio wäre sogar n sweet spot.

Ailuros
2014-08-10, 18:56:12
Bin nicht der beste Kopfrechner. :redface: Hast Recht. 12,16 Mio wäre sogar n sweet spot.

Ich glaube (bin mir aber nicht sicher) dass die bisherigen Geruechte fuer 7.9Mrd fuer GM200 stimmen. Von dem Anhaltspunkt aus sind =/>4.5Mrd. fuer GM204 nicht unrealistisch.

Hübie
2014-08-10, 19:07:41
Dann müsste GM200 aber stark an die 600 mm² Grenze gehen. Ich weiß gar nicht ob 28HPm am maximal Möglichen was ändert, aber ein HW-Engineer meinte mal dass 550 mm² ökonomisch und physisch schon beinahe das Maximum darstellen. Nehmen wir ~600 als Grundlage wäre das eine Packdichte irgendwo zwischen Tahiti und Hawaii. Nehmen wir ~550 ists deutlich näher an Hawaii (sogar leicht drüber).

Da klingen die 12,1 Mio./mm² plötzlich lächerlich :freak:

AnarchX
2014-08-10, 19:12:54
Vielleicht hat ja GM200 auch 128KiB Shared Cache in den SMM (GM107/108 haben 64KiB), was den Cache-Anteil und die Packdichte nochmal etwas erhöhen dürfte. Mit GK210(180) ist man vielleicht schon ein Schritt in diese Richtung gegangen.

Nakai
2014-08-10, 19:16:50
@AnarchX:
300mm² sind schon weit realitätsfern, im Bereich 400mm² sind wir laut dem Bild definitiv.

Aber wohl eher 4x4 oder GK106-artig: 2x4+2x5?

Genau das hab ich auch schon vor einiger Zeit spekuliert.
Mit 18 SMMs wäre man ein vernünftiges Stück von den 25 SMMs eines GM200 entfernt. Vor allem vermute ich, wie bei GK110 und GK104, dass GM204 höher taktet als GM200. Der Vorsprung sollte, reinher von der Performance, etwa ~30%. Das ist ein gesunder Abstand zwischen Enthusiast und Highend.

IMO sind 18 SMMs für GM204 eine schöne Zahl.
Für GM200 kommt es drauf an, wieviele GPCs man doch verbaut. Ich vermute, wieder 5, wie bei GK110. Ein unausgeglichenes Design, wie bei GK106 wird es bei diesem Chip nicht geben.

@Ail:
Nicht dass es unbedingt stimmen muss aber rein theoretisch bedeuten 4.5Mrd bei 370mm2 eine Packdichte von etwas ueber 12Mio/mm2. Was soll daran so abwegig sein? Ich hab keine Ahnung ueber die Transistoren-Anzahl vom 204 und es koennte locker auch eine hoehere Packdichte sein falls sie HPm benutzt haben.

Wie gut ist denn HPM gegenüber HP? Es wird überall nur geschrieben. Ähnliche bzw. höhere Taktraten bei gleicher Leakage. Auf Packdichte wird meistens nicht eingegangen, es wird nur angemerkt, dass diese auch höher ausfallen könnte.

Ich denke, GM204 und GM200 basieren auf 28HPM. Etwas anderes macht wenig Sinn und würde den Unterschied zu GM107 erklären.

Ailuros
2014-08-10, 19:17:40
Dann müsste GM200 aber stark an die 600 mm² Grenze gehen. Ich weiß gar nicht ob 28HPm am maximal Möglichen was ändert, aber ein HW-Engineer meinte mal dass 550 mm² ökonomisch und physisch schon beinahe das Maximum darstellen.

GT200@65nm war bei 575mm2 und ist NV's Rekord natuerlich.

Nehmen wir ~600 als Grundlage wäre das eine Packdichte irgendwo zwischen Tahiti und Hawaii. Nehmen wir ~550 ists deutlich näher an Hawaii (sogar leicht drüber).

Da klingen die 12,1 Mio./mm² plötzlich lächerlich :freak:

Hawaii hat doch 6.2Mrd bei 438mm2 oder? Das sind dann ueber 14Mio/mm2. GK110 ist bei 12.9Mio/mm2.

@Ail:

Wie gut ist denn HPM gegenüber HP? Es wird überall nur geschrieben. Ähnliche bzw. höhere Taktraten bei gleicher Leakage. Auf Packdichte wird meistens nicht eingegangen, es wird nur angemerkt, dass diese auch höher ausfallen könnte.

Im Vergleich zu HP keine Ahnung. Im Vergleich zu LP und LPM ist es je nach Fall ein Unterschied von einem half node kleiner.

Ich denke, GM204 und GM200 basieren auf 28HPM. Etwas anderes macht wenig Sinn und würde den Unterschied zu GM107 erklären.

Hawaii ist auch noch auf 28HP welches heute auch verdammt reif sein sollte und liegt leicht ueber 14Mio/mm2. AMD soll nach Geruechten fuer den Hawaii Nachfolger die 550mm2 Grenze ueberschritten haben. Fuer GM200 war sich jemand nicht sicher als ich fragte aber seine grobe Schaetzung war schon um =/>550mm2.

Edgecrusher86
2014-08-10, 19:39:02
GM107 liegt bei 148mm2 - ergo 12,635 mio./mm2

Oops, ok, das macht schon einen entscheidenden Unterschied, hatte mich schon über den Ausreißer gewundert - danke! ;D

Update - da ich nun die 11 Mio/mm² sicher streichen kann, hier nochmal ein paar Ergänzungen:

GM204

-> 370mm²
4440 Mio. vs. 4810 Mio. vs. 5180 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²


-> 380mm²
4560 Mio. vs. 4940 Mio. vs. 5320 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²


-> 390mm²
4680 Mio. vs. 5070 Mio. vs. 5460 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²


-> 400mm²
4800 Mio. vs. 5200 Mio. vs. 5600 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²


-> 410mm²
4920 Mio. vs. 5330 Mio. vs. 5760 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²


-> 420mm²
5040 Mio. vs. 5460 Mio. vs. 5880 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²


-> 430mm²
5160 Mio. vs. 5590 Mio. vs. 6020 Mio.
12 Mio./mm² vs. 13 Mio./mm² vs. 14 Mio./mm²


Also auch bei "nur" 370mm² sind 4,5 Mrd. Transistoren oder mehr ziemlich sicher. :)

Loeschzwerg
2014-08-11, 08:53:45
GT200@65nm war bei 575mm2 und ist NV's Rekord natuerlich.

Jup und beim SPARC64 X+ sind es 600mm² bei 2,99 Mrd. Transistoren @ TSMC 28nm HP. Das funktioniert bzw. lohnt sich ja auch irgendwie.

Bei der Größe bekommt man theoretisch ca. 90 DIEs aus nem 300mm Wafer und davon ca. 75 funktionierend bei etwa 80% Yield => ~80USD bei einem Wafer Preis von 6000USD.

Hübie
2014-08-11, 09:00:05
Och nöö. Das' ja mal n mieser Vergleich. :tongue:

Loeschzwerg
2014-08-11, 09:34:29
Nen anderen Vergleich bei 28nm und größer 550mm² kann ich leider nicht liefern, sorry :D

Edit: IBM Power8 12 Kerner mit 649mm² in 22nm SOI.
Edit2: NEC SX ACE ~570mm² in 28nm

Hübie
2014-08-11, 10:46:42
Und ich wollte noch ergänzend schreiben dass jetzt bitte niemand IBM auspackt X-D Den NEC kenne ich gerade nicht. Zumindest sagt der mir nix...

Loeschzwerg
2014-08-11, 11:09:12
I know, die wurden alle schon genannt, aber nachdem auch immer wieder die tolle Diskussion um "Was ist maximal möglich" von vorne losgeht ;)

Das Zeug von NEC sind Vektorprozessoren und spielen ihre Stärken eben genau in vektorisierbaren Aufgaben aus (Wetter und Klimamodelle). Cray ist/war da z.B. ein großer Abnehmer. Soviel zum OT.

Edgecrusher86
2014-08-11, 11:27:49
http://abload.de/img/unbenannty2ux1.png

Vom 21.7. bis 31.7. sind übrigens weitere 13 GM200 in Bangelore eingetroffen - nun erstmals auch INT2-A1 sowie INT624126-A1 dabei. Macht also insgesamt seit 8.7. 26 Stück.


https://www.zauba.com/import-graphics-processor-integrated-circuits-hs-code.html

E: Jo, schon ein paar Tage her, ich hatte nur nicht mehr dran gedacht, zwischenzeitig nachzuschauen. :D

Loeschzwerg
2014-08-11, 11:28:58
War schon alles in den News u.a. bei PCGH.

Hübie
2014-08-11, 11:51:53
I know, die wurden alle schon genannt, aber nachdem auch immer wieder die tolle Diskussion um "Was ist maximal möglich" von vorne losgeht ;)

Das Zeug von NEC sind Vektorprozessoren und spielen ihre Stärken eben genau in vektorisierbaren Aufgaben aus (Wetter und Klimamodelle). Cray ist/war da z.B. ein großer Abnehmer. Soviel zum OT.

Irgendwie einleuchtend dass prinzipiell mehr Fläche geht. Ich schrieb ja oben auch "ökonomisch und physisch".

Loeschzwerg
2014-08-11, 12:26:32
Weder ökonomisch noch physisch sehe ich bis 600mm² ein Problem.

Gehen wir von einem nahezu quadratischen DIE aus, dann liegen zwischen einem 550 und 600mm² gerade einmal 9 Chips pro 12" Wafer.

In diesem Segment völlig vernachlässigbar. Einzig die Yieldrate kann dir gefährlich werden, aber die soll ja beim aktuellen 28nm HP sehr solide (gut über 80%) sein.

Persönlich sehe ich die Sache also ganz gelassen :D

Edit: Aber irgendwie finde ich es schon ziemlich "lustig" wie wenige Leaks es mittlerweile gibt, zumal ja der GM204 eigentlich schon vor der Türe steht. Regelrecht langweilig hier ^^

Dural
2014-08-11, 13:47:26
also wenn GM204 400mm2 + gross ist und das wird er ziemlich sicher sein (Foto) dann kann man GM200 sicher näher an 600mm2 erwarten als an den 500mm2.
Da AMD angeblich auch einen 500mm2 Chip bringt, würde es mich nicht mal überraschen wenn NV sogar klar gegen die 600mm2 zu geht.

Ailuros
2014-08-11, 14:03:26
Wenn eine groessere Packdichte bei AMD nicht taboo ist spricht auch bei NVIDIA nichts dagegen. Man quetscht lieber 14Mio/mm2 als dass man weit ueber 550mm2 steigt :P

Nakai
2014-08-11, 14:08:04
also wenn GM204 400mm2 + gross ist und das wird er ziemlich sicher sein (Foto) dann kann man GM200 sicher näher an 600mm2 erwarten als an den 500mm2.
Da AMD angeblich auch einen 500mm2 Chip bringt, würde es mich nicht mal überraschen wenn NV sogar klar gegen die 600mm2 zu geht.

GM204 wird unter 400mm² groß sein. Der Sprung von GK104 auf GM204 wird, reinher von der Performance, ein Sprung einer Generation sein(~60%). GM200 wird diesen Sprung nicht hinkriegen, da die Diesze nach oben limitiert. Man kann schon einiges von GM107 nach oben interpolieren. Ich sehe keinen Grund, wieso GM204 GK110 nicht überholen sollte, ergo wird es passieren.

Dural
2014-08-11, 14:08:06
Sagt wer?

Ich war noch nie Fan von der hohen Packdichte bei AMD, erstens ist es mir als Kunde egal was ein Chip in der Herstellung kostet und zweitens leidet der Takt sehr darunter. Umso dichter die Chips Hergestellt werden umso schlechter lassen sie sich Takten. Bis jetzt war es jedenfalls so.

Ailuros
2014-08-11, 14:22:43
Ich war noch nie Fan von der hohen Packdichte bei AMD, erstens ist es mir als Kunde egal was ein Chip in der Herstellung kostet und zweitens leidet der Takt sehr darunter. Umso dichter die Chips Hergestellt werden umso schlechter lassen sie sich Takten. Bis jetzt war es jedenfalls so.

Unterhalb von Hawaii sind die Packdichten zwischen Kepler und AMD chips durchaus vergleichbar ohne dass es irgendwo Frequenzprobleme bis jetzt gab.

hasebaer
2014-08-11, 17:09:37
Angebliche Spezifikationen zur GTX 870
http://www.pcgameshardware.de/Grafikkarten-Grafikkarte-97980/News/Spezifikationen-GTX-870-Vergleich-GTX-770-1131948/

Im chinesischen Forum von coolaler.com sind Screenshots aufgetaucht, welche mit einer Geforce GTX 870 erstellt worden sein sollen. Demnach soll die Grafikkarte 13 SMM mit insgesamt 1.664 Shadereinheiten sowie 4 GiByte GDDR5-Videospeicher besitzen. Der Grafik-Score im 3DMark 11 fällt um 18 Prozent höher aus als bei der GTX 770 - sofern der Screenshot echt ist.

+ 18% wäre eine Punktlandung ggü. der 780.
Und passt zu den +35% mehr IPC für Maxwell ggü. Kepler ALUs.

Ailuros
2014-08-11, 17:27:01
Schalten sie jeweils einen GM107 ab fuer einen salvage part? :freak:

hasebaer
2014-08-11, 17:30:58
Du meinst weil nur 13 von 20 SMM aktiv sind?

Wobei man mit 15 SMM immernoch 780Ti Level erreichen könnte, wenn man 1150 Mhz als Basistakt hätte. Na ja gut, dann wäre das OC Potential aber auch nicht sonderlich.

Loeschzwerg
2014-08-11, 17:31:40
Ja, passt ziemlich gut zur Leistung der 780. Anders als im Fazit der PCGH News denke ich aber, dass die Leistung einer 780Ti durchaus erreicht und übertroffen werden kann. Gib dem GM204 Vollausbau 16 oder 17 Cluster a 128 Einheiten bei gleichen Takt und dann müsste das passen.

Ich rieche da zumindest noch eine 880 und 880Ti...

aufkrawall
2014-08-11, 17:32:03
Schalten sie jeweils einen GM107 ab fuer einen salvage part? :freak:
Wie groß dürfte dann die Margensteigerung gegenüber einem GK110 2xSalvage sein? :biggrin:
Es müssten jedenfalls auch noch 1GB VRAM mehr bezahlt werden.

Ailuros
2014-08-11, 17:32:41
Du meinst weil nur 13 von 20 SMM aktiv sind?

15 klingen mir zu wenig fuer eine 880 und 18 nahezu ideal. 18 - 5 (GM107) = 13 SMMs :P

Wobei man mit 15 SMM immernoch 780Ti Level erreichen könnte, wenn man 1150 Mhz als Basistakt hätte. Na ja gut, dann wäre das OC Potential aber auch nicht sonderlich.

Bei vollem Ausbau wird der Takt wohl nicht so hoch sein fuer GM204 zumindest reference SKUs.

hasebaer
2014-08-11, 17:35:51
15 klingen mir zu wenig fuer eine 880 und 18 nahezu ideal. 18 - 5 (GM107) = 13 SMMs :P


Ja ja ja :P

18 also, dann ist doch alles ok. :biggrin:

Und die 880Ti hat dann 20-24 SMM...X-D (scherz)

Dawn on Titan
2014-08-11, 17:38:07
870 - 880 - 880TI -> passt

13-16-18

Ailuros
2014-08-11, 17:40:03
Keine Ahnung was Ihr fuer einen Koller mit einer angeblichen "Ti" habt; eine 880 duerfte vollkommen ausreichen.

Nakai
2014-08-11, 17:41:22
Ja ja ja :P

18 also, dann ist doch alles ok. :biggrin:

Und die 880Ti hat dann 20SMM...X-D

Es wird auch auf 18 hinauslaufen. 20 sind zuviel. ;)

Ahja, aus dem eigenem Haus, wird man sich gegen eine Geforce GTX 780 (keine Ti) vermarkten. Diese hat 2304 Keplers-SPs. Ein GM204 mit 18 SMMs hat auch 2304 Maxwell-SPs.
2x4 + 2x5 wie von AnarchX angedeutet werden es wohl werden.

Loeschzwerg
2014-08-11, 17:42:51
Keine Ahnung was Ihr fuer einen Koller mit einer angeblichen "Ti" habt; eine 880 duerfte vollkommen ausreichen.

Kunden melken ;D

Ailuros
2014-08-11, 17:44:02
Kunden melken ;D

Titan = *muhhhhhh* :eek::tongue:

hasebaer
2014-08-11, 17:45:15
Mir solls recht sein, wenn die 880 der Vollausbau @ 1GHz Basistakt ist.

Btw ... eine GTX 890 werden wir diesmal aber auch wieder schnell sehen.
Ich mein die Titan Z war ja nun keine Massenware und eine GTX 790 hat sich Nvidia offenbar bewusst gespart, würde zumindest passen wenn man eine GTX 890 noch dieses Jahr bringen will.

Nakai
2014-08-11, 17:55:43
870 - 880 - 880TI -> passt

13-16-18


Dachte ich mir auch bei dem PIC. ;D

Die TI sollte schon 60~70% vor einer GTX770 liegen.

Schaffe89
2014-08-11, 18:24:11
Ich tippe eher auf ~ 18% für die GTX 870, 30% für die GTX 880 und ~ 40 für die 880 Ti.

AnarchX
2014-08-11, 18:37:53
Immerhin hat man die Karte bei 256-Bit belassen. Das könnte wohl unser Tonga XT Gegner sein? Da man so einen Kastraten schon so früh bereit hat, fühlt man sich wohl von letzteren durchaus bedroht. Bei GK104 kam so eine SKU erst nach 5 Monaten.

Nakai
2014-08-11, 18:48:39
Immerhin hat man die Karte bei 256-Bit belassen. Das könnte wohl unser Tonga XT Gegner sein?

Ich denke, das wird eher eine GTX 860 Ti werden. Ich weiß nicht, wie tief man mit GM204 gehen will, aber nur 13 SMMs sind schon ziemlich wenig.

Ich tippe eher auf ~ 18% für die GTX 870, 30% für die GTX 880 und ~ 40 für die 880 Ti.

Damit wäre gegenüber der Vorgängergeneration nichts gewonnen. Schon von 13 auf 18 SMMs sind es ~40% Mehrperformance. Mit den ~15% auf eine GTX770 sind das ziemlich genau 60%. Und dann ist man vor einer 780Ti.

Leonidas
2014-08-11, 20:06:36
Was haltet ihr von den GTX 870 Specs?

Die Daten passen natürlich nicht, könnten aber auch Fehlauslesungen sein. Die Benches könnten dagegen sogar passend. Fake-Gefahr ist trotzdem vorhanden.

AnarchX
2014-08-11, 20:21:12
Die TMUs kann GPU-Z nicht richtig berechnen, weil es bis zur Version von heute GM204 noch nicht kannte. Der Rest ergibt ein stimmiges Bild, in Details die über plumpe Fakes hinausgehen.

Hübie
2014-08-11, 20:27:00
Lass es mich so formulieren: ich konnte keine Unstimmigkeit feststellen.

Das jetzt aber schon salvage kommen heißt auch dass die yields wahrscheinlich schlechter sind als bei Kepler ;)

Askingar
2014-08-11, 20:39:22
Wenn die 349$ (die umgehen) stimmen, könnte das mit den 18% Mehrleistung zur 770 hinkommen.

Cortana
2014-08-11, 21:09:51
Finde ich etwas mager. 18% hat man schon mit einer OC Version der 770.

dildo4u
2014-08-11, 21:12:42
Maxwell lässt sich besser OC wenn man von der 750 ausgeht.

mrck
2014-08-11, 21:13:01
...

AnarchX
2014-08-11, 21:13:41
Finde ich etwas mager. 18% hat man schon mit einer OC Version der 770.

So eine OC 770 liegt aber wohl dann bei ~250W TDP. Diese GM204-SKU könnte wohl eher etwas unter 200W liegen.

Cortana
2014-08-11, 21:45:11
Ich erwarte ne 880Ti mit 3500 ALUs und 1000Mhz Takt :D

Loeschzwerg
2014-08-12, 08:01:38
Das jetzt aber schon salvage kommen heißt auch dass die yields wahrscheinlich schlechter sind als bei Kepler ;)

Hm? Kurz nach Launch des highend Parts gab es doch schon immer einen Salvage Part und im Zuge der Entwicklung wird dieser so oder so zeitgleich getestet (evtl. kleineres PCB, Spannung und Takt müssen angepasst werden usw).

Dass halt jetzt als erstes Leaks zur "GTX 870" auftauchen ist in meinen Augen purer Zufall (oder so gewollt).

X.Perry_Mental
2014-08-12, 09:11:05
Immerhin hat man die Karte bei 256-Bit belassen. Das könnte wohl unser Tonga XT Gegner sein?
Dann kann man immerhin hoffen, dass Tonga XT als 285X auch mit 4GB Speicher erscheinen wird.

hasebaer
2014-08-12, 09:21:00
Tonga ist doch kein Gegner für GM204, würde er es sein, würde AMD das Gerät R9 295 nennen, nicht R9 285. Tonga wird ein Kosten und verbrauchsoptimierter Tahiti.

X.Perry_Mental
2014-08-12, 09:34:41
Tonga ist doch kein Gegner für GM204, würde er es sein, würde AMD das Gerät R9 295 nennen, nicht R9 285. Tonga wird ein Kosten und verbrauchsoptimierter Tahiti.

So wie ich das bisher mitbekommen habe, schätze ich Tonga XT (also den Vollausbau) annähernd gleich schnell ein wie die teildeaktivierte 870. Ein kompletter GM204 auf der 880 wird natürlich schneller als Tonga sein.

hasebaer
2014-08-12, 12:57:08
So wie ich das bisher mitbekommen habe, schätze ich Tonga XT (also den Vollausbau) annähernd gleich schnell ein wie die teildeaktivierte 870.
D.h. Tonga XT legt ca. 16-20% ggü. Tahiti XT zu?
Gibts dazu auch einen Leak oder anderen Anhaltspunkt?

HOT
2014-08-12, 13:24:55
Was haltet ihr von den GTX 870 Specs?

Die Daten passen natürlich nicht, könnten aber auch Fehlauslesungen sein. Die Benches könnten dagegen sogar passend. Fake-Gefahr ist trotzdem vorhanden.
Sieht durchaus realistisch aus, der Maxwell-Effizienzgewinn ist durchaus vorhanden. Die große Variante dürfte dann 1920 oder 2048 Shader haben.
GM200 kann man dann ja erst mal als TitanII bringen, später sollte sich eine 900er-Serie mit den Chips auf höherem Takt auflegen lassen, wenn AMD seine Karten der 300er-Serie ausgespielt hat. Pascal bekommt dann ein neues Namensschema - passt also.
Eine TI wurd von NV ja nicht verheizt, gibts beispielsweise als Reaktion (780ti) oder um die Höherwertigkeit zu betonen (750ti), von daher gehe ich davon aus, dass es keine Ti geben wird. Die 780TI gibts ja auch nur, weil man alle Register gezogen hat um schneller als Hawaii zu sein.
GM107 = GTX850 = GTX750ti
GM206 = GTX860
GM204 = GTX870 salvage
GM204 = GTX880
GM200 = Titan II später

Hübie
2014-08-12, 13:34:16
Nö. Die 780 Ti gibt's weil yields gut sind und der Markt es brauchte. Man hätte eine 780 GHz bringen können um Hawaii zu kontern. Wozu funktionierende Dies teildeaktivieren wenn ich das mit mehr Marge an den Mann bringen kann? Tesla /Quadro stagniert seit längerem. Hollywood & Co sind versorgt ;)

Edit: GM204 @1920 macht am meisten Sinn...
Edit2: Wenn ich das Marketing richtig gedeutet habe gibt's nur einen Titanen. Nur das Preissegment soll in jeder folgenden Gen gefüllt werden.

M4xw0lf
2014-08-12, 13:39:51
Warum macht Nvidia eigentlich solche "krummen" Designs? 1920/15 SMMs statt 2048/16 SMMs? Für meine Noobheit klingt letzteres einfach runder :redface:

aufkrawall
2014-08-12, 13:40:03
Nun ja. Wer weiß, wie der nächste Supercomputer mit GM200 heißen wird...

Hübie
2014-08-12, 13:46:45
Warum macht Nvidia eigentlich solche "krummen" Designs? 1920/15 SMMs statt 2048/16 SMMs? Für meine Noobheit klingt letzteres einfach runder :redface:

Darüber kann man nur spekulieren, aber es sollte klar sein dass man in jeder Runde den neuen sweet spot finden muss. Nicht zu langsam, nicht zu schnell, nicht zu teuer oder billig, nicht zu verbrauchsstark und heiß. Und und und. Da bietet sich so ein modulares System mit Cluster ja an.

Tesseract
2014-08-12, 14:11:43
Warum macht Nvidia eigentlich solche "krummen" Designs? 1920/15 SMMs statt 2048/16 SMMs? Für meine Noobheit klingt letzteres einfach runder :redface:

es gibt viele stellen im chipdesign wo runde zahlen sinnvoll sind, ganz besonders bei so dingen wie caches wo runde zahlen die addressierung, die cachingalgorithmen usw. vereinfachen aber SMMs sind wohl so unabhängig, dass es de facto egal ist ob die zahl rund ist der nicht.

Ailuros
2014-08-12, 14:48:21
Darüber kann man nur spekulieren, aber es sollte klar sein dass man in jeder Runde den neuen sweet spot finden muss. Nicht zu langsam, nicht zu schnell, nicht zu teuer oder billig, nicht zu verbrauchsstark und heiß. Und und und. Da bietet sich so ein modulares System mit Cluster ja an.

Siehe Tesseract's Post oben; die Anzahl ist generell egal. Im Grund ist es eigentlich eher dass sie N Leistungsziel haben fuer A chip ergo dann so und so viel clusters egal ob es jetzt 5 SMMs beim GM107 als erstes Beispiel wurden. Beim GK110 war es eher: basta wir haben keinen Platz mehr ;)

Ailuros
2014-08-12, 15:38:07
http://www.fudzilla.com/home/item/35488-nvidia-maxwell-geforce-800-comes-in-september

Huh? :confused: :rolleyes:

Unicous
2014-08-12, 15:50:01
Da hat wohl einer den Schuss nicht gehört.:freak:

Hübie
2014-08-12, 16:52:45
September 2015?

hasebaer
2014-08-12, 17:17:17
"financial 2015"

edit: Also Nvidia hatte ja grad am 7. August 2014, dass 2.Q des "Fiscal 2015" hinter sich gebracht.
http://nvidianews.nvidia.com/News/NVIDIA-Financial-Results-for-Second-Quarter-Fiscal-2015-b88.aspx

Hübie
2014-08-12, 17:41:42
Okay anders: September 2015? ;D

Unicous
2014-08-12, 17:44:47
Nein, nicht September 2015. FU(A)D erzählt einfach scheiße. Wie so oft. Keine Ahnung von Heatpipes und Lüftern (oder wie das heißt:wink:) aber immer schön die Massen mit clickbait SEO "Artikeln" befüllen.

(Nvidia befindet sich gerade im FQ (fiscal oder financial) 3'15, das ist nicht an das laufende Jahr gebunden http://en.wikipedia.org/wiki/Fiscal_year)

Hübie
2014-08-12, 18:03:09
War das etwa immer noch nicht deutlich genug als Scherzfrage deklariert ? :(

Ailuros
2014-08-12, 18:30:20
War das etwa immer noch nicht deutlich genug als Scherzfrage deklariert ? :(

Der andere Scherz ist zwar alt aber nochmal zum mitlachen:

http://www.fudzilla.com/home/item/34451-nvidia-20nm-maxwell-comes-in-late-2014

If Maxwell is ever to reach between 8 and 16 Gigaflops performance as outlined in Nvidia’s roadmap, the upcoming parts need to pack more transistors. Currently the fastest single chip Geforce GTX Titan Black has 5,121 Gigaflops and we expect that an upcoming high-end GK chip will start with at least 8 Gigaflops single precision, as this is what Nvidia GPU roadmap has implied.

...und bevor jemand fragt "wo" der Witz ist....NV's roadmap wo u.a. Maxwell draufsteht hat Maxwell zwischen einer 8 und einer 16 eingetragen (mit Tendenz ziemlich genau auf ~12) und es steht in der linken Ecke ziemlich deutlich dass es sich um DP FLOPs/W handelt. Der Artikel steht so seit April 2014 und es hat sich niemand geschehrt den Bloedsinn aufzurauemen. Dass er zu bloed ist GIGAFLOPs von TERAFLOPs zu unterscheiden uebersehen wir mal ganz diskret.....zum zweiten Mal :freak:

It will take a dual card and probably a lot of time until Nvidia’s first 20nm GM architecture reaches 12 Gigaflops.

....wo ist der smiley mit der weissen Fahne wenn man es braucht?

Hübie
2014-08-12, 18:43:49
Ich könnt mir schon wieder auf die Finger klopfen weil ich auf einen fudzilla-link gedrückt hab :freak:

hasebaer
2014-08-12, 23:22:50
Borderlands: The Pre-Sequel als Bundle für Karten ab GTX 770.
http://www.geforce.com/whats-new/articles/borderlands-the-pre-sequel-geforce-gtx-bundle-blasts-into-stores

Borderlands: The Pre-Sequel erscheint am 17. Oktober 2014 (in Dtl.).
Fehlt nur noch GTA5 als Bundle. :naughty:

Leonidas
2014-08-13, 14:37:51
Warum macht Nvidia eigentlich solche "krummen" Designs? 1920/15 SMMs statt 2048/16 SMMs? Für meine Noobheit klingt letzteres einfach runder :redface:


15 SMM passt besser zu 3 Raster-Engines. 16 SMM besser zu 4 Raster-Engines. Daran könnte es schon liegen. Primär dürfte s aber darum gehen, welche Performance man *will*.




Da hat wohl einer den Schuss nicht gehört.:freak:


Weniger wegen dem Datum, sondern wegen 20nm ...

Unicous
2014-08-13, 14:42:15
@Leonidas

Das sollte doch klar sein, oder?

Nakai
2014-08-13, 14:46:10
15 SMM passt besser zu 3 Raster-Engines. 16 SMM besser zu 4 Raster-Engines. Daran könnte es schon liegen. Primär dürfte s aber darum gehen, welche Performance man *will*.


Was ist mit 18? *wink*:redface:

€: Wenn GM204 wirklich nur 15 SMMs maximal hat...ist der Chip nicht viel flotter als Titan...

Dural
2014-08-13, 15:14:30
bin ich der einzige der 15SMM für einen 400mm2 Chip für sehr wenig haltet?
GM107 ist 150mm2 gross :rolleyes: irgend was kann da nicht stimmen.




Zusammenfassung:
http://www.computerbase.de/2014-08/geforce-gtx-880-mitte-september-vorstellung/

M4xw0lf
2014-08-13, 15:18:50
bin ich der einzige der 15SMM für einen 400mm2 Chip für sehr wenig haltet?
GM107 ist 150mm2 gross :rolleyes: irgend was kann da nicht stimmen.


Stimmt, das ist zu viel :freak:
GM107 hat 5 SMM. Das mal drei plus doppelt so dickes SI - wird eng mit 400mm² ;)

Dawn on Titan
2014-08-13, 15:21:15
Wer sagt was von 400mm² ??

Askingar
2014-08-13, 15:21:19
Naja bis zur 1.September Woche ist jetzt auch nicht mehr so lang. Denke mal bis da hin werden noch paar Infos aus Leaks kommen.

Wenn die Benches stimmen kanns aber ordentlich zur Sache gehen, bin mal gespannt wies um die Zukunftsfähigkeit bestimmt ist (Dx etc.).

Dural
2014-08-13, 15:22:33
also theoretisch komme ich auf 300 - 350mm2

M4xw0lf
2014-08-13, 15:22:40
also theoretisch komme ich auf 300 - 350mm2
150 x 3 = 300-350? Magic.
Wer sagt was von 400mm² ??
Bei den Bildern von dem Entwicklungsbrett kam im Vergleich zu GK104 was von etwas über 400mm² (http://www.forum-3dcenter.org/vbulletin/showthread.php?p=10267182#post10267182) raus.

Unicous
2014-08-13, 15:26:53
also theoretisch komme ich auf 300 - 350mm2

LOL.;D

Wenn man dich nicht kennen würde,könnte man denken du willst uns trollen.
:freak:

Leider ist dem nicht so.;(

Dural
2014-08-13, 15:27:10
wie kommst du auf 3x150mm2?!?

3x mehr SMM heisst noch lange nicht 3x mehr Fläche ;)

Ailuros
2014-08-13, 15:28:28
Stimmt, das ist zu viel :freak:
GM107 hat 5 SMM. Das mal drei plus doppelt so dickes SI - wird eng mit 400mm² ;)

Schoen; dann wende mal Deine "tolle" Formel auf GK107 vs. GK104 an und erzaehl mir dann wieso sie zufaelligerweise nicht hinhaut :rolleyes:

LOL.;D

Wenn man dich nicht kennen würde,könnte man denken du willst uns trollen.
:freak:

Leider ist dem nicht so.;(

Der chip ist um einiges kleiner als sehr viele hier erwarten :P

Nakai
2014-08-13, 15:30:48
Schoen; dann wende mal Deine "tolle" Formel auf GK107 vs. GK104 an und erzaehl mir dann wieso sie zufaelligerweise nicht hinhaut :rolleyes:

Zum Glück braucht man viele Sachen bei skalierten Chips eben dann nicht öfters.
SI und MC wird wohl verdoppelt sein. Die SMMs wird man dementsprechend skalieren. Viele andere Teile kann man einfach so übernehmen.

Bei etwa weniger als 400mm² sollten schon 18 SMMs Platz haben. Bei 15 SMMs wäre der Chip imo zu groß.

Dural
2014-08-13, 15:34:14
schön und gut das GM204 kleiner sein soll als von vielen erwartet, aber das hier ist definitiv ein ca. 400mm2 Chip:

M4xw0lf
2014-08-13, 15:36:23
Schoen; dann wende mal Deine "tolle" Formel auf GK107 vs. GK104 an und erzaehl mir dann wieso sie zufaelligerweise nicht hinhaut :rolleyes:


Der chip ist um einiges kleiner als sehr viele hier erwarten :P
Joa L2 Cache und so wird nicht entsprechend hochskaliert.
Und was die Chipgröße angeht - stimmte der Bildervergleich dann nicht?

Ailuros
2014-08-13, 15:46:33
schön und gut das GM204 kleiner sein soll als von vielen erwartet, aber das hier ist definitiv ein ca. 400mm2 Chip:

Definier mal "definitiv" bei Deiner generellen Treffer-Rate :rolleyes:
Es haben viel auch geschworen dass GK104 ueber 350mm2 gross ist und ja es kinderleicht mit solchen Bildern etwas falsch einzuschaetzen.

Joa L2 Cache und so wird nicht entsprechend hochskaliert.
Und was die Chipgröße angeht - stimmte der Bildervergleich dann nicht?

Cache was?

GK104 hat 4x Mal so viel Busbreite als 107, 4x Mal so viele clusters, 2.7x Mal so viel Transistoren bei 2.5x Mal so viel die area.

Nakai
2014-08-13, 15:53:29
Cache was?

GK104 hat 4x Mal so viel Busbreite als 107, 4x Mal so viele clusters, 2.7x Mal so viel Transistoren bei 2.5x Mal so viel die area.

Nicht GK107 mit GK208 oder GK108 verwechseln. ;)

GK107 hat ein 128Bit GDDR5-SI.

Ergo 2mal soviel Busbreite, doppelt soviel Cache, und 4mal soviele Cluster.

Unicous
2014-08-13, 16:02:51
@Ailuros

Von 8 SMX(GK104) auf 15 SMX(GK110 bzw. ein hypothetischer GM104) erwarte ich nun wirklich nicht kleiner/gleich 119% Flächenzuwachs, was Dural hier vorschlägt, bzw. best case scenario 300mm² also knapp 2% mehr Fläche.:rolleyes:

Nahe an den 400mm² erwarte ich hingegen schon wobei ich mich da auch frage wie sie das bewerkstelligt haben sollen.

Dural
2014-08-13, 16:09:47
ich ahne ja schon böses, 1:2 DP für alle, jedenfalls für die die genug zahlen :freak:

Askingar
2014-08-13, 17:26:21
schön und gut das GM204 kleiner sein soll als von vielen erwartet, aber das hier ist definitiv ein ca. 400mm2 Chip:
Findest du?

http://abload.de/img/leaked-nvidia-gm204-gbrul3.jpg

Hübie
2014-08-13, 17:58:24
Auch ne geile Schätzung, diese 300-350. Ich tippe auf 0-450 :P :naughty:

@Dural: wie kommst du zu dem Schluß dass es definitiv 400 sqmm sind? Ein "schätzungsweise" fände ich angebracht.

Botcruscher
2014-08-13, 18:00:19
Speicherchip ist doch da. Wie viel haben die 11,5mm oder so?

Askingar
2014-08-13, 18:01:12
Ich tippe auf 0-450 :P :naughty:
Ähm, null??? Hättest ruhig bei 0,1 anfangen können. Null würde in dem Fall ja nix bedeuten, ist aber was zu sehen ;) (kleiner Joke). Ich bin vllt. eine Techniknull aber was solls. Und ich würde sicherlich nicht bei einem Bild mit einem Zollstock versuchen auszumessen wie groß das Die jetzt ist, vor allem wenns ein Testsample ist und man nicht weiß ob das so jemals Verwendung findet.

Dural
2014-08-13, 18:03:53
Ich finde doch, der G92-A2 war 330mm2 gross und sieht für mich kleiner aus. Zudem hat es AnarchX ja Ausgerechnet. Der Chip ist ja 40x40mm (stand doch irgend wo)

Übrigens habe ich immer gesagt ca. 400mm2 und nicht GENAU das kann zb. auch 380mm2 bedeuten :P

Unicous
2014-08-13, 18:09:50
Eben waren es noch 300-350mm²?:eek:

Dural
2014-08-13, 18:11:30
he?

Ich habe gesagt Die auf dem Foto ca. 400mm2
Ich habe gesagt für 15 SMX ca. 300-350mm2 Die Fläche.

Diese Zahlen sind reine Schätzungen von mir.

:freak::wink:

Ailuros
2014-08-13, 18:16:37
@Ailuros

Von 8 SMX(GK104) auf 15 SMX(GK110 bzw. ein hypothetischer GM104) erwarte ich nun wirklich nicht kleiner/gleich 119% Flächenzuwachs, was Dural hier vorschlägt, bzw. best case scenario 300mm² also knapp 2% mehr Fläche.:rolleyes:

Nahe an den 400mm² erwarte ich hingegen schon wobei ich mich da auch frage wie sie das bewerkstelligt haben sollen.

SMX != SMM

Du hast 2 cluster im GK107 vs. 5 cluster im GM107 fuer wieviel Flaechen-Unterschied? Wenn GM204 nur 15 SMMs haben sollte dann sind sogar 350mm2 verdammt grosse Flaechenverschwendung. Bleiben die SMMs unveraendert bis zu GM204 (wobei es wenig Grund gibt es zu bezweifeln) hast Du erstmal "nur" 2 quad TMUs pro SMM.

Bei 15 SMMs hast Du 120 TMUs um 8 sogar weniger als GK104 und TMUs sind alles andere als "platzsparende" Einheiten.

Nakai,

I stand corrected.

Askingar
2014-08-13, 18:17:45
Mal im Vergleich:
http://abload.de/img/unbenannt25g9kat.png (http://abload.de/image.php?img=unbenannt25g9kat.png)

Unicous
2014-08-13, 18:26:02
@Ailuros

Ach scheiße ja, stimmt.
Kann ich was dafür, dass Nvidia so einen Blödsinn mit ihren Akronymen macht und mir daraus ein Denkfehler entspringt?:mad:

JENSEN!!!!!!

Ailuros
2014-08-13, 18:28:19
Askingar,

Herzlich willkommen erstmal ;)

Von links nach rechts:

G92@65nm (334mm2), G92b@55nm (231mm2), GM204? (Bumsfalleramm2 ?)

hasebaer
2014-08-13, 18:29:20
@Ailuros

Ach scheiße ja, stimmt.
Kann ich was dafür, dass Nvidia so einen Blödsinn mit ihren Akronymen macht und mir daraus ein Denkfehler entspringt?:mad:

JENSEN!!!!!!

Sie mach das, damit man sich der Unterschiede bewusst wird. :ulol:

Askingar
2014-08-13, 18:32:25
Kommt mir so vor als wäre der G92-420-A2 324mm² groß, da könnte der neue wohl 350mm² schaffen? Zumal das Bild wohl nicht so schön getroffen ist. Also vllt. 33xmm²?

Ailuros
2014-08-13, 18:35:34
G92b war ein weiterer Fall von intensiven Zweifeln; der die ist 231mm2 gross obwohl viele auf rund 270mm2 schwoerten. Das Photo darf erstmal keine bloeden Winkel haben damit es nicht irrefuehrt und dann gibt es auch stets den Punkt mit den daemlichen "Raendern".

hasebaer
2014-08-13, 18:37:22
Die beiden G92 trennen schon 48mm^2 (http://de.wikipedia.org/wiki/Nvidia-Geforce-9-Serie), ich weiß nicht wie ihr da eine abschließden Aussage treffen wollt.

edit: 231mm2 wäre ja noch heftiger, da könnte Gm204 um Umkehrschluß auch 450mm^2 sein, mit etwas Fantasie.

Askingar
2014-08-13, 18:41:11
Das Photo darf erstmal keine bloeden Winkel haben damit es nicht irrefuehrt und dann gibt es auch stets den Punkt mit den daemlichen "Raendern".
Ich weiß, meinte ich auch, man kann das Bild nicht so zoomen wie man will bzw. das es passt. :biggrin:

Die beiden G92 trennen schon 48mm^2 (http://de.wikipedia.org/wiki/Nvidia-Geforce-9-Serie), ich weiß nicht wie ihr da eine abschließden Aussage treffen wollt.
War ein Joke...;). Das geht so nicht!

hasebaer
2014-08-13, 18:43:14
Oh ok.. :)

Ailuros
2014-08-13, 18:44:27
Die beiden G92 trennen schon 48mm^2 (http://de.wikipedia.org/wiki/Nvidia-Geforce-9-Serie), ich weiß nicht wie ihr da eine abschließden Aussage treffen wollt.

edit: 231mm2 wäre ja noch heftiger, da könnte Gm204 um Umkehrschluß auch 450mm^2 sein, mit etwas Fantasie.

Wieso soll ich wikipedia genau trauen?

http://hardforum.com/showthread.php?t=1325165

AnarchX
2014-08-13, 19:06:45
Mal im Vergleich:
http://abload.de/img/unbenannt25g9kat.png (http://abload.de/image.php?img=unbenannt25g9kat.png)
G92 hatte doch ein kleineres Package als 40x40mm.

M4xw0lf
2014-08-13, 19:09:50
G92 hatte doch ein kleineres Package als 40x40mm.
Er wollte ja auf die Unzuverlässigkeit solcher Bildvergleiche hinaus - allerdings ist die Vergleichbarkeit zwischen GK104 und GM204 ja viel besser gegeben.

Loeschzwerg
2014-08-13, 19:19:56
Also wenn man vom Package 40x40 ausgeht, das Bild nahezu ausrichtet, dann lande ich bei 398mm² durch Pixelabgleich. Genauigkeit für'n Arsch, da das Bild einfach zu schlecht aufgelöst ist und kleine Abweichungen gleich in +/- 15mm² resultieren.

Aber irgendetwas in der Gegend wird es schon sein.

Askingar
2014-08-13, 19:43:01
G92 hatte doch ein kleineres Package als 40x40mm.
Er wollte ja auf die Unzuverlässigkeit solcher Bildvergleiche hinaus - allerdings ist die Vergleichbarkeit zwischen GK104 und GM204 ja viel besser gegeben.
Genau...

@Ailuros Link triff es dann doch ziemlich gut. Den Unterschied sieht man auf den Bildern kaum. Der ist aber recht deutlich und dann mal auf die Ränder (roter Rahmen) achten.

Askingar
2014-08-13, 19:53:23
Genau...

@Ailuros Link triff es dann doch ziemlich gut. Den Unterschied sieht man auf den Bildern kaum. Der ist aber recht deutlich und dann mal auf die Ränder (roter Rahmen) achten.

So besser?
http://abload.de/img/unbenannt25nzuqe.png (http://abload.de/image.php?img=unbenannt25nzuqe.png)

Und jetzt noch mal die Diegrößenangaben von @Ailuros vergleichen, unter 300mm² womöglich? Die Bilder sind trotzdem beschissen.

Loeschzwerg
2014-08-13, 19:59:58
Warum machen eigentlich alle Vergleich mit anderen DIEs, wenn wir doch das Package wissen und sogar, wie von Botcruscher vorgeschlagen, den Speicher als Verhältnis hernehmen können?

M4xw0lf
2014-08-13, 20:01:31
Warum machen eigentlich alle Vergleich mit anderen DIEs, wenn wir doch das Package wissen und sogar, wie von Botcruscher vorgeschlagen, den Speicher als Verhältnis hernehmen können?
Genau so wurden die ~400mm² ja ermittelt, und deswegen halte ich den Wert für nicht so unzuverlässig.

Timbaloo
2014-08-13, 20:12:18
Ist doch egal wie groß das Ding ist, ich will endlich wissen ob wirklich ARM-Kerne unter den weggepixelten Lüftern stecken :hammer:

Loeschzwerg
2014-08-13, 20:29:47
Genau so wurden die ~400mm² ja ermittelt, und deswegen halte ich den Wert für nicht so unzuverlässig.

(y) Dann passt ja, alles weitere sehen wir eh in einem Monat.

@Timbaloo: Pass auf, NV besinnt sich auf 3dfx Patente und hat dort zwei FBI Chips versteckt :D

Gipsel
2014-08-13, 20:33:14
Von links nach rechts:

G92@65nm (334mm2), G92b@55nm (231mm2), GM204? (Bumsfalleramm2 ?)Konsistent wären in etwa 324mm², 260mm², ~347mm².
Diese Zahlen für G92/b stehen übrigens in der englischen wikipedia, keine Ahnung was die Quelle der Autoren da war, aber es paßt zumindest zu den Bildern.

Man sollte noch im Kopf behalten, daß bei den "Marketing-Diesizes" auch immer noch die Leerräume am Dierand mit den Teststrukturen abgezogen werden. Das reduziert die offizielle Diesize immer noch gegenüber einer direkt (oder per Foto) gemessenen. Wenn man von einem 40x40mm Package ausgeht, komme ich nämlich eher auf 368mm², 296mm², 394mm² (plusminus 15mm² oder so). Und wie immer ist das Ganze ziemlich im Trüben, da man bei solchen unscharfen Fotos schnell mal die Kante nicht richtig erwischt ;).

Ailuros
2014-08-13, 21:13:53
Ist doch egal wie groß das Ding ist, ich will endlich wissen ob wirklich ARM-Kerne unter den weggepixelten Lüftern stecken :hammer:

IMHO nein.

Konsistent wären in etwa 324mm², 260mm², ~347mm².
Diese Zahlen für G92/b stehen übrigens in der englischen wikipedia, keine Ahnung was die Quelle der Autoren da war, aber es paßt zumindest zu den Bildern.

Man sollte noch im Kopf behalten, daß bei den "Marketing-Diesizes" auch immer noch die Leerräume am Dierand mit den Teststrukturen abgezogen werden. Das reduziert die offizielle Diesize immer noch gegenüber einer direkt (oder per Foto) gemessenen. Wenn man von einem 40x40mm Package ausgeht, komme ich nämlich eher auf 368mm², 296mm², 394mm² (plusminus 15mm² oder so). Und wie immer ist das Ganze ziemlich im Trüben, da man bei solchen unscharfen Fotos schnell mal die Kante nicht richtig erwischt ;).

Zwischen 350 und 430 gibt es schon einen Unterschied. Wie auch GK104 besteht GM204 zu 60% aus Silizium und zu 30% aus Elastan und lässt sich auch als Socke tragen :freak:

Askingar
2014-08-13, 22:40:13
Hab mal was zusammengekritzelt, natürlich rein spekulativ, wir werden sehen. Rot 204 vs. blau 104, reine Phantasie.

http://abload.de/thumb/gm20xvs.gk104kjb9w.jpg (http://abload.de/image.php?img=gm20xvs.gk104kjb9w.jpg)

Die Socke reicht aber nicht mal für den kleinen Zeh..;).

Timbaloo
2014-08-13, 23:29:55
Also ich habe vorhin bei einem Honig-Ingwer-Jasmin-Tee die Die-Größe von GM204 ertanzt und kann dir mit absoluter Gewissheit sagen, dass ich glaube, dass deine Bilder falsch sind.

ndrs
2014-08-13, 23:51:10
Also ich habe vorhin bei einem Honig-Ingwer-Jasmin-Tee die Die-Größe von GM204 ertanzt und kann dir mit absoluter Gewissheit sagen, dass ich glaube, dass deine Bilder falsch sind.
Ich hoffe doch du hast den Tee links rum gerührt, weil abnehmender Mond ist. Ansonsten hast du dich pro Umdrehung um ca 100mio Transistoren vertan. Damit würdest du dich ziemlich lächerlich machen und deine Glaubwürdigkeit wär dahin.

Unicous
2014-08-13, 23:59:59
Ich habe einfach an Ailuros' Silicium-Elastan Socken( mit Seidenanteil) gerochen. Genauer gehts nicht. Es sind ziemlich genau 1,7 Millionen Maschen, Größe 42-46.

Askingar
2014-08-14, 00:06:27
Ich habe einfach an Ailuros' Silicium-Elastan Socken( mit Seidenanteil) gerochen. Genauer gehts nicht. Es sind ziemlich genau 1,7 Millionen Maschen, Größe 42-46.
Mist den Seidenanteil hab ich vergessen, nur das Größenverhältnis verdeutlichen wollen, aber jetzt stimm es natürlich nicht mehr. Aber wartet nur bis @Ailuros verbeikommt, dann gibts mit der Kelle, Socken sind dann out.;)

Eben alles ziemlich vage, diese Stille umheimlich, auf beiden Seiten. Hoffe die haben sich nicht abgesprochen.

Edit: Naja spätestens am 10./11. September wissen wir mehr http://www.nordichardware.se/Grafik/geforce-gtx-880-lurar-runt-hoernet-naer-nvidia-samlar-pressen-i-september.html

http://www.nordichardware.se/images/labswedish/nyhetsartiklar/Nyhetsbilder_Generic/largethumbnails/Nvidia_Geforce_GTX_700.jpg

OgrEGT
2014-08-14, 06:49:39
Wir wissen nicht wieviel Silizium sich unter dem schwarzen Lack genau verbirgt auch nicht wieviel davon genau GM204 ist d.h. wieviel Verschnitt durch das Schneiden übrig bleibt. Hinzu kommt die Ungenauigkeit durch etwaig verzerrte Bildausschnitte und geringe Auflösung...

Leonidas
2014-08-14, 15:17:23
Was ist mit 18? *wink*:redface:

€: Wenn GM204 wirklich nur 15 SMMs maximal hat...ist der Chip nicht viel flotter als Titan...


Muß er das sein? Das Die ist deutlich kleiner. Für NV lohnt sich das. Und gekauft wird es sowieso, wenn es grün lackiert ist.

dildo4u
2014-08-14, 16:18:35
GTX 880?

http://www.forum-3dcenter.org/vbulletin/showpost.php?p=10314686&postcount=132

Hübie
2014-08-14, 19:31:59
GTX 880?

http://www.forum-3dcenter.org/vbulletin/showpost.php?p=10314686&postcount=132

Wie meinen? :|

ilibilly
2014-08-14, 19:55:27
Der rote Balken,dahinter stand zuvor gtx Titan mit 4gb RAM,und eben diese 4gb deuten auf eine gtx 880 hin

-/\-CruNcher-/\-
2014-08-14, 20:04:34
Muß er das sein? Das Die ist deutlich kleiner. Für NV lohnt sich das. Und gekauft wird es sowieso, wenn es grün lackiert ist.

Wenn Titan Performance in den Preissbereich von 250 € rutscht fände ich das sehr positiv :)

M4xw0lf
2014-08-14, 20:11:16
Der rote Balken,dahinter stand zuvor gtx Titan mit 4gb RAM,und eben diese 4gb deuten auf eine gtx 880 hin
Vorhin stand da einfach nur Titan. TBW trollt wohl, bzw hechelt nach Aufmerksamkeit.

Unicous
2014-08-14, 20:16:19
Glaube ich auch.:rolleyes:

Botcruscher
2014-08-14, 20:53:31
Wenn Titan Performance in den Preissbereich von 250 € rutscht fände ich das sehr positiv :)

NV sicher nicht. :freak:

Hübie
2014-08-15, 08:39:18
Vorhin stand da einfach nur Titan. TBW trollt wohl, bzw hechelt nach Aufmerksamkeit.

Das darauf reagiert wird... :rolleyes: