PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: nVidias Volta-Generation kommt mit den Grafikchips GV104, GV102, GV110


Leonidas
2016-08-16, 16:09:40
Link zur News:
http://www.3dcenter.org/news/nvidias-volta-generation-kommt-mit-den-grafikchips-gv104-gv102-und-gv110

HOT
2016-08-16, 17:21:14
Maxwell war ganz sicher nicht für 20nm geplant, dagegen spricht eindeutig der GM107. Einstein dürfte 20nm gewesen sein -> gecancelte Generation bei gecanceltem Prozess. 28nm Maxwell2 und 16nm Pascal ersetzten diesen. Und ob Volta das ist, was ursprünglich geplant war ist auch sehr zweifelhaft. Man wird Volta an die heutigen Bedürfnisse angepasst haben und endlich echtes AsyncCompute mitbringen, was gut zur drastischen Erhöhung der Recheneinheiten passen würde.

Ex3cut3r
2016-08-16, 18:02:33
Danke für den Artikel. :)

Gast
2016-08-16, 18:10:47
Machen kann man viel.

Die angepeilten Performanceprognosen wären sicher auch mit mit 16nm erreichbar, oder eventuell wie man in den letzten Tagen gehört hat auch mit 14nm von Samsung, welches ja bekanntermaßen eine etwas bessere Integrationsdichte bietet.

Die +75% an DP-Performance wären schon alleine dadurch erreichbar, wenn Nvidia nur DP-Einheiten verbauen würde, anstatt wie bisher für SP und DP unterschiedliche Hardware zu verwenden. Für SP/HP könnten diese dann die 2x bzw. 4x Performance bieten, wie es bisher auch auf GP100 mit 2x HP auf einem SP-Core funktioniert.

Damit würde man zwar an Energieeffizienz (bei SP-Berechnungen) gegenüber den getrennten Einheiten einbüßen, aber natürlich deutlich mehr DP-Einheiten auf die selbe Fläche bringen.
Wenn man die Energieeffizienz an anderer Stelle steigert könnte sich dieses aber ausgleichen, bzw. über die Power-Target-Steuerung die Taktraten wie schon bisher anhand der Auslastung steuern. Dann bekommt man die +75% eben nur bei DP zustande und nicht bei SP/HP.

Die von Nvidia prognostizierte Steigerung ist zumindest in Teilbereichen auf jeden Fall drinnen, unabhängig von der Fertigung.
Hat man nur 14/16nm zur Verfügung muss man dafür natürlich an die Grenzen des herstellbaren gehen.
Mit 10nm hätte man noch Luft nach oben für eine weitere Generation mit weiteren Performancesteigerungen.

Mike
2016-08-17, 00:24:44
und endlich echtes AsyncCompute mitbringen Ist das bei Pascal unecht?

Setsul
2016-08-17, 00:47:53
700mm² sind doch Schwachsinn, wenn ich mich nicht fürchterlich irre ist im TSMC Back End bei 25mmx25mm Schluss. 625mm² und dann ist Ende.
Bloß weil man beliebig große Dies aus einem Wafer schneiden kann und IBM mal gerne Richtung 700mm² geht, heißt das nicht dass TSMC das kann. Intel geht für den Xeon Phi über 30mm Seitenlänge, das hab ich sonst auch nirgendwo so gesehen.

Und dann bitte nicht vergessen dass, falls Volta auch HBM hat, wovon ich doch ausgehe, muss das ganze Ding noch auf einen Interposer. Die sind jetzt schon hart an der Grenze. Natürlich kann man mit Split Field noch größere bauen. Aber wer kann das und bleibt dann noch Gewinn übrig?

@Mike
Echt ist es schon aber mit 2% Leistungsgewinn witzlos. Für 2% implementiert das doch keiner. Solange das immer einen ganzen GPC anspricht ändert sich daran auch nichts. Ist aber nicht so als ob nVidia es bräuchte.

Elkinator
2016-08-17, 03:56:04
10nm kann es doch eh nicht werden, man wird einen Prozess kaum mit >200mm² Chips hochfahren!

Ist das bei Pascal unecht?
Ja, weil Graphics und Compute nicht wirklich asynchron ausgeführt werden kann, Pascal unterstützt wie Maxwell 2.0 nur PreEmption.
https://www.youtube.com/watch?v=v3dUhep0rBs

Gast
2016-08-17, 18:53:53
Ja, weil Graphics und Compute nicht wirklich asynchron ausgeführt werden kann, Pascal unterstützt wie Maxwell 2.0 nur PreEmption.
https://www.youtube.com/watch?v=v3dUhep0rBs

Ähm kann er doch:
http://www.anandtech.com/show/10325/the-nvidia-geforce-gtx-1080-and-1070-founders-edition-review/9

Ganz interessanter Artikel, auch weil man erfährt warum sich Maxwell mit Async Compute so schwer tut.
Auch Maxwell kann schon Compute und Graphics parallel ausführen, aber nicht dynamisch die Last zwischen den queues verteilen.
Damit müsste entweder der Entwickler oder Nvidia über den Treiber für jede Situation die optimale Verteilung schon voreinstellen, damit es auch was bringt.
Wenn sich diese dynamisch ändert hat Maxwell eh verloren.
Pascal hat diese Einschränkung nicht mehr und noch dazu die fortschrittlichste Preemption aller aktuellen GPUs

Elkinator
2016-08-17, 23:44:58
Pascal hat diese Einschränkung nicht mehr und noch dazu die fortschrittlichste Preemption aller aktuellen GPUs
PreEmption ist nie fortschrittlich...

Gast
2016-08-23, 16:07:42
PreEmption ist nie fortschrittlich...

Das zeigt dass du keinerlei Ahnung hast was Preepmtion ist.
Kleiner Tipp, ohne Preemption wäre weder Multitasking, noch die Priorisierung einzelner Tasks und auch kein Async Compute möglich.

Mike
2016-08-25, 00:35:39
Kleiner Tipp, ohne Preemption wäre weder Multitasking, noch die Priorisierung einzelner Tasks und auch kein Async Compute möglich. Naja, es gibt auch kooperatives Multitasking.