Anmelden

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: News des 5./6. Februar 2022


Leonidas
2022-02-07, 08:42:22
Link zur News:
https://www.3dcenter.org/news/news-des-56-februar-2022

Gast
2022-02-07, 10:50:35
Mittels dieser Veränderung bei der Chipfertigung dürfte nVidia vermutlich AMD bei den Chiptaktraten wieder deutlich näher kommen können, nachdem AMD in dieser Disziplin zuletzt doch deutlich davongezogen ist.

Unwahrscheinlich, heutzutage ist die Architektur wesentlich wichtiger als die Fertigung. Die Fertigung erlaubt in erster Linie mehr Transistoren, mit denen muss man aber etwas anfangen, sprich die Architektur verbessern, um mehr Fortschritte als die reine Einheitenskalierung zu zeigen.

Bestes Beispiel AMD, die verwenden nun 7nm schon geraume Zeit, und die Taktratensprünge gab es erst mit RDNA2, sprich mit Architekturverbesserungen. Und netterweise hat uns AMD mit Vega in 14/12nm und 7nm sogar gezeigt was man von einer Fertigung alleine ohne Architekturverbesserung erreichen kann, bekanntermaßen nicht viel, und der Sprung von 14nm+ auf 7nm ist durchaus vergleichbar mit Nvidia von 10nm+ auf 5nm.

Wobei man den Tweet durchaus auf verschiedene Arten interpretieren kann, "doesn´t change much" kann durchaus meinen, dass die zu erwartende Performance pro Takt und Einheit sich nicht großartig verändern wird, es aber durchaus Architekturverbesserungen für die Taktbarkeit gibt.

Wobei beides einigermaßen überraschend wäre, schließlich hat sich die Architektur schon zwischen Turing und Ampere für Nvidia-Verhältnisse recht wenig verbessert, da könnte man durchaus wieder mal einen größeren Schritt nach vorne erwarten.

Andererseits könnte es natürlich sein, dass Nvidia die low hanging fruits schon mit Maxwell abgeholt hat, und die Architektur selbst einfach schon so gut ist, dass es da keine großen Schritte mehr geben kann.


Dies wäre sogar etwas mehr als bei der "Radeon RX 6900 XT LC" mit 2435 MHz Boost-Takt und läßt dann natürlich die Frage offen, wie AMD diese Taktrate ohne Wasserkühlung halten will.

Die Wasserkühlung der LC ist hat gerade mal einen 120er Radiator, dass ist bei über 300W gerade mal eine kleinere Unterstützung und nichts was sich mit Luft nicht auch erreichen lassen würde.

Midnight-3DC
2022-02-07, 10:51:43
Name und Chip-Bestückung dieser Karte sind unbekannt, allerdings läßt sich jene aufgrund Bauart (DualSlot, DualFan, 1x6pol + 1x8pol Stromstecker) und Größe (ca. 22nm) durchaus dem Midrange-Segment zuordnen.
Da sind wohl 22cm gemeint. 22nm wären ja mal eine Ansage selbst für sehr kleine Gehäuse. :biggrin:

Gast
2022-02-07, 12:38:15
"Zwar verändert der AD102-Chip wohl nicht das Verhältnis von GPC zu SM zu ROP gegenüber dem GA102-Chip – aber dadurch, dass es überall +71% mehr davon gibt, bekommen GPC und ROP genügend Reserven, um die enorm hohe FP32-Rechenleistung (Richtung 80 TFlops) tatsächlich auf die Straße zu bringen. "
Verstehe die Logik nicht. Wenn ich jetzt ein Bottleneck habe und dann einfach den Chip in allen Bereichen verbreitere, dann werde ich da auch wieder ein Bottleneck haben. Im Endeffekt genau das, was AMD bei Vega hatte. Vega war im Vergleich zu Fiji nicht wirklich besser, hatte nur mehr Takt. Und das in 2 Revisionen (Vega 10 und Vega 20).
Wenn NVidia da nichts anpasst, wird man mit einer massiven Verbreiterung des Chips nur wieder das selbe Problem haben und unnötig Leistung verschenken.Wenn man hingegen den Chip massiv verbreitert und dazu noch das Bottleneck behebt, dann hätte man einen erheblichen Leistungssprung. Man will ja auch vor AMD bleiben. Und das nicht nur in RT und DLSS, sondern auch in Rasterizing.

Leonidas
2022-02-07, 13:28:30
Da sind wohl 22cm gemeint.

Gefixt ;)

Leonidas
2022-02-07, 13:31:10
Wenn ich jetzt ein Bottleneck habe und dann einfach den Chip in allen Bereichen verbreitere, dann werde ich da auch wieder ein Bottleneck haben.

Hört sich auf den ersten Blick so an, ist aber nicht so. Grund: Die Skalierung ist ungleichmäßig. Wenn NV 100% mehr FP32 bringt, reichen vielleicht 50% mehr GPC. Bei GA104 zu GA102 war dies ein sehr schlechtes Verhältnis - einfach nur dick mehr FP32, aber kaum mehr GPC und ROP. Bei AD102 passt es dann besser, weil ausgehend vom schlechten Verhältnis alles gleichmäßig gesteigert wurde - damit kommt der Laden wieder ins Lot.

Rsioux
2022-02-07, 13:33:48
Ein anderer wesentlicher Punkt der Lovelace-Architektur dürfte die bessere Austangierung der einzelnen Chipteile an der Leistungsspitze sein – womit das Problem der Ampere-Architektur vermieden werden sollte, wo die Spitzenlösungen trotz hohem Rechenleistungs-Vorteil vergleichsweise schlecht skalieren. Zwar verändert der AD102-Chip wohl nicht das Verhältnis von GPC zu SM zu ROP gegenüber dem GA102-Chip – aber dadurch, dass es überall +71% mehr davon gibt, bekommen GPC und ROP genügend Reserven, um die enorm hohe FP32-Rechenleistung (Richtung 80 TFlops) tatsächlich auf die Straße zu bringen. Beim aktuellen GA102-Chip fehlt wahrscheinlich die eine oder andere Raster-Engine (GPC) und eventuell auch ein paar ROPs, um mit der vorhandenen hohen FP32-Power effektiv umzugehen. Lovelace könnte hier aufgrund der Erfahrungswerte mit Ampere ein besseres Feintuning betreiben – auch wenn dies dann nicht als "Architektur-Verbesserung" durchgeht.

Das verstehe ich nicht. Wie soll Lovelace die FP32-Leistung besser auf die Straße bringen.

GA102 = 35,x TFlops
AD102 = 80,x TFlops

Die FP32-Leistung verdoppelt sich gegenüber Ampere. Die GPC, ROP usw. aber nicht. Wo sollen da die Reserven her kommen?

Gast
2022-02-07, 13:49:55
Wenn NV 100% mehr FP32 bringt, reichen vielleicht 50% mehr GPC. Bei GA104 zu GA102 war dies ein sehr schlechtes Verhältnis - einfach nur dick mehr FP32, aber kaum mehr GPC und ROP.

GA104 zu GA102 skaliert eh innerhalb der Erwartungen?

Was nicht innerhalb der Erwartungen skaliert ist Turing auf Ampere, zumindest wenn man nur blind FP32 betrachtet, wenn man die gesamte Architektur betrachtet skaliert auch Turing auf Ampere wie erwartet, und angesichts des geringen Transistoraufwands für die nominelle FP32-Verdopplung war das sicher auch die richtige Entscheidung.

Gast
2022-02-07, 15:30:27
Hört sich auf den ersten Blick so an, ist aber nicht so. Grund: Die Skalierung ist ungleichmäßig.
Naja, dann bin ich gespannt. Klingt jetzt erst mal für mich und offensichtlich für Andere (siehe Rsioux) nicht logisch.
Aber z.B. bei den ROPs ist Ampere ja auch etwas unterdimensioniert im Vergleich zu Turing, daher kannst du da Recht haben.

Buddy Casino
2022-02-07, 18:45:06
Wenn NV 100% mehr FP32 bringt, reichen vielleicht 50% mehr GPC.
Warum das so ist wäre von Interesse. Hängt GPC / ROP Bedarf eher von der verwendeten Auflösung ab?

Gast
2022-02-07, 19:01:39
näher an was ? an die navi 21 ?
aber wenn das da unten stimmt ?

Some information and a few guesses:
31=
~60WGP
~16GB 256bit GDDR6
~256M 3D IFC
~2.5GHz

32=
~40WGP
~12GB 192bit GDDR6
~192M 3D IFC
~2.6~2.8GHz

33=
~16WGP
~8GB 128bit GDDR6
~64M IFC
~2.8~3.0GHz
5:08 AM · Dec 17, 2021·Twitter for Android

link dazu wenn nicht erlaubt bitte löschen .


https://twitter.com/greymon55/status/1471693761579130888?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1471693 761579130888%7Ctwgr%5E%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fwww.gamestar.de%2Fartikel%2Fleak-amd-radeon-rx-7000-3-gigahertz3376381.html

iamthebear
2022-02-07, 19:44:29
Hört sich auf den ersten Blick so an, ist aber nicht so. Grund: Die Skalierung ist ungleichmäßig. Wenn NV 100% mehr FP32 bringt, reichen vielleicht 50% mehr GPC. Bei GA104 zu GA102 war dies ein sehr schlechtes Verhältnis - einfach nur dick mehr FP32, aber kaum mehr GPC und ROP. Bei AD102 passt es dann besser, weil ausgehend vom schlechten Verhältnis alles gleichmäßig gesteigert wurde - damit kommt der Laden wieder ins Lot.

Ich denke das wird stark davon abhängen unter welchen Bedingungen die Karten getestet werden:
.) Falls die neuen Karten in Benchmarks in denselben Einstellungen wie die alten antreten müssen und sich die Framerate verdoppelt dann wüsste ich nicht warum die Skalierung stark ungleichmäßig sein sollte.
.) Falls die höhere Performance dazu genutzt wird um in höheren Details zu testen (z.B. 8K statt 4K oder mit RT statt ohne) dann kann dies mit der ungleichmäßigen Skalierung gut hinkommen.

Was jedoch bei Nvidia ein großes Thema wird ist der CPU Overhead. Mit einer Verdopplung der GPU Leistung wird die CPU selbst unter 4K schon ein Thema. Im Vergleich zur Vorgängergeneration ist das vielleicht kein großes Problem aber man will ja Navi31 schlagen.

CD-LABS
2022-02-07, 22:45:44
Einige scheinen hier von den Zahlen etwas verwirrt...
...vielleicht kann das etwas entwirrt werden.
Von GA104 auf GA102 wurden zwei Schritte gleichzeitig vollzogen: Das Verhältnis aus GPCs/ROPs zu SMs angepasst und das Gesamtdesign verbreitert. Die Verhältnisänderung ist eine um Erhöhung um 50%, ein rein im Verhältnis angepasster GA104 hätte +50% SMs. Der GA102 wurde darüber hinaus um ein Sechstel verbreitert. Ein Sechstel drauf auf 150% → 175%. Der AD102 stellt hingegen anscheinend eine Verbreiterung um 100%, auch genannt eine Verdoppelung, des "rein im Verhältnis angepasster GA104" dar.

Die von Leonidas genannten +71% sind übrigens genau gesagt zwölf siebtel. Sieben sechstel mal zwölf siebtel ergibt dann auch passend genau die Verdoppelung.

iamthebear
2022-02-07, 23:35:28
Also wenn ich mal einen Blick auf den Performanceindex werfe:
3090 (82SM/7GPC): 376%
3080 (68SM/6GPC): 330%
3070 (46SM/6GPC): 250%

Taktraten dieser Karten sind in der Praxis meines Wissens nach ziemlich ident.

3080 vs. 3070 hat 48% mehr SM, Rest bleibt gleich und bringt 32% mehr Performance d.h. die Karte skaliert mit 67%

3090 vs. 3080 hat 20.5% mehr SM und 16.7% mehr Rest und bringt 13.9% mehr Performance d.h. die Karte skaliert mit 67.8%

Also irgendwie habe ich den Eindruck dass das Problem hier eher wo anders liegt.

Die Frage ist was sind die restlichen 32%?

Ca. die Hälfte lässt sich dadurch erklären, dass die CPU, PCIe etc. nicht mitskalieren.

Beispiel laut CB Rangliste:
5800X vs. 2700X: 54% unter 720p, 9% unter 4K entspricht 17%

Leonidas
2022-02-08, 02:06:16
Jein, die 3080 skaliert noch gut. Aber die 3090 nicht mehr. Eigentlich darf man nur 3070 vs 3090 vergleichen. Die Skalierung ist für den angesetzten Hardware-Einsatz nicht toll. Nicht schlecht, aber auch nicht wirklich gut. Gerade wenn man noch höher hinauswill, muß man da neu arrangieren.

Das die Neu-Arrangierung auf den ersten Blick wie "überall gleich viel drauf" aussieht - geschenkt. Praktisch dürfte es eher darauf hinauslaufen, dass NV gesehen hat, dass der Spitzenchip (GA102) zu wenig an absoluter GPC/ROP Power hatte. Deswegen wurde GPC/ROP entgegen früheren Steigerungen, wo jene unsymetrisch erfolgte, nun symetrisch gesteigert (AD102). In diesem Fall ist die symetrische Steigerung eher das ungewöhnliche. Wenn man das Ampere-Prinzip fortgesetzt hätte, hätte es wieder eine unsymetrische Steigerung gegeben.

Aber: Das sind natürlich alles fehlbare Deutungen. Spekulationen über die Beweggründe von NV, die sich dann mit dem Release besser klären lassen werden.

Gast
2022-02-08, 11:12:59
Jein, die 3080 skaliert noch gut. Aber die 3090 nicht mehr. Eigentlich darf man nur 3070 vs 3090 vergleichen.

3070 --> 3090 50% Mehrperformance
3070 --> 3090 78% mehr Hardware

Also eine Skalierung mit 84% Effizienz. Fehlen nur 16%, wovon locker 10% auf die niedrigeren Realtaktraten der 3090 gehen.

Ich sehe da eine angebliche mangelnde Skalierung in keiner Form nachvollziehbar.

Gast
2022-02-08, 11:18:13
Jein, die 3080 skaliert noch gut. Aber die 3090 nicht mehr. Eigentlich darf man nur 3070 vs 3090 vergleichen. Die Skalierung ist für den angesetzten Hardware-Einsatz nicht toll. Nicht schlecht, aber auch nicht wirklich gut. Gerade wenn man noch höher hinauswill, muß man da neu arrangieren.

3070 --> 3090 50% Mehrperformance
3070 --> 3090 78% mehr Hardware.

Damit wird 84% der Hardware in Performance umgesetzt, wovon ±10% schon durch die niedrigeren realen Taktraten erklärbar sind.
Ich sehe da nicht das geringste Skalierungsproblem.

Leonidas
2022-02-08, 15:45:04
Möglicherweise habe ich mich da von den Ergebnissen der 3080 zu 3090 verleiten lassen. Da läßt die Skalierung dann stark nach. Von 3070 zu 3090 augenscheinlich nicht - da war meine vorherigen Darstellung nicht korrekt.

Denniss
2022-02-08, 15:48:14
bei 3070 zu 3090 gibts auch noch so ne kleinigkeit wie GDDR6X

Orko
2022-02-08, 17:31:27
"Laut Twitterer Greymon55 braucht man zu nVidias kommender "Lovelace"-Architektur für Gaming-Grafikchips ... keine großen Architektur-Verbesserungen zu erwarten. Dies erscheint allerdings auch nicht zwingend notwendig, denn nVidia hat hierfür zwei andere gewichtige Argumente: Zum einen der große Sprung von ... 84 auf 144 Shader-Cluster ..., zum anderen der Wechsel von Samsung 8nm auf TSMC 5nm."

Auch in der Vergangenheit gab es bei NV Generationen mit grossen Architektursprüngen (Maxwell, Turing) und Generationen mit eher kleinen Änderungen (Pascal). Gerade Pascal könnte hierbei als Blaupause für Lovelace dienen: gleiche Architektur, ein grosser Sprung in der Fertigungstechnologie, dadurch ermöglicht eine deutliche Erhöhung der Recheneinheiten und der Taktraten.

Auch NV wird in absehbarer Zukunft auf Chiplet / Multi-Chip Konstrukte umsatteln müssen, und dies erfordert einen entsprechenden Umbau der Architektur (Datenlokalität, Caches, Chip-Chip-Interfaces, ...). Da Lovelace noch monolithisch antritt, würde ich dies dann für die Nachfolgegeneration erwarten, also gemäß der üblichen NV 2-Jahres-Kadenz gegen Ende 2024 / Anfang 2025.

Ich würde diese Meldung also dahingehend interpretieren, dass NV ihre Entwicklungsressourcen schon dementsprechend umpriorisiert haben, also Architekturverbesserungen für monolithische Boliden während der Lovelace-Entwicklung nicht mehr im Fokus standen / stehen.

Leonidas
2022-02-09, 04:00:47
Guter Gedanke. Für MCM muß man dann in der Tat gewaltig umdenken, das erfordert dann viel Entwickler-Arbeit.

Rampage 2
2022-02-09, 05:59:36
Ich hatte ja schonmal die Möglichkeit in den Raum geworfen, ob GL102 nicht mit 12 sondern gleich 18 GPCs kommen könnte, so dass pro GPC nicht mehr als 1024 Einheiten verbaut sind - genauso wie beim GA104 (3070/Ti). So können diese GPCs besser ausgelastet werden, weil sie schlanker sind als die von GA102 (Letztere hat satte 1536 SPs pro GPC) und die GPU hätte mehr Geometrie-Leistung, weil schlicht absolut mehr GPCs vorhanden sind.

Bei den ROPs bin ich derselben Meinung wie Leo: 192 ROPs (16*12) werden es vermutlich sein bei 12 GPCs oder maximal 288 ROPs bei 18 GPCs.

R2

Gast
2022-02-10, 12:02:57
Auch NV wird in absehbarer Zukunft auf Chiplet / Multi-Chip Konstrukte umsatteln müssen, und dies erfordert einen entsprechenden Umbau der Architektur (Datenlokalität, Caches, Chip-Chip-Interfaces, ...). Da Lovelace noch monolithisch antritt, würde ich dies dann für die Nachfolgegeneration erwarten, also gemäß der üblichen NV 2-Jahres-Kadenz gegen Ende 2024 / Anfang 2025.



MCM wird mittelfristig keine Lösung für die Allgemeinheit sein, sondern lediglich um die Performance noch weiter zu steigern als mit einer Singlechip Lösung möglich wäre, also lediglich für Karten die weit in den 4-Stelligen Bereich reingehen.