PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: Hardware- und Nachrichten-Links des 3. März 2020


Leonidas
2020-03-04, 10:39:56
Link zur News:
https://www.3dcenter.org/news/hardware-und-nachrichten-links-des-3-maerz-2020

Gast
2020-03-04, 11:25:33
Wieso hat die PCIe Variante von Volta mehr Punkte als die höher taktende SXM Variante? Wegen dem doppelten Speicher? Oder boostet die deutlich höher (trotz weniger 50W TDP)? Oder ist das eine V100s?

Gast
2020-03-04, 14:16:20
Angesichts der genannten Rechenleistungs-Werte kommt aus unserem Forum dann die sicherlich bedenkenswerte Anmerkung, was das für entsprechend große Konsolen-SoCs ergeben würde bzw. bezüglich der Konsolen-Preise dann aussagt. Denn beispielsweise die zur Playstation 5 kolportierten 9 TFlops Rechenleistung findet man exakt so auch bei der Radeon RX 5700 XT – auf Basis des 251mm² großen Navi-10-Chips. Zuzüglich des Hardware-RayTracings von RDNA2 (welches Sony soeben nochmals für die Playstation 5 bestätigt hat), der Zen-2-CPU sowie der Chipsatz-Kapazität kommt da schnell ein Konsolen-Chip von ca. 400mm² in der 7nm-Fertigung heraus, was unter 7nm+ dann vielleicht noch ~350mm² sein könnten.

Grob entspricht die Konsole einem Navi10 + einem Zen2 Chiplet, das wären dann ca. 250mm² + 75mm², also "nur" 325mm².

Allzu viel müsste man da auch nicht mehr dazurechnen. Ausgehend von Turing könnte Hardware Raytracing weitestgehend von der Skalierung von 7nm auf 7nm+ aufgefangen werden.

Das CPU Chiplet hat zwar kaum IO, aber in Navi10 ist eigentlich fast alles an IO drinnen was man an IO braucht. Das Speicherinterface ist bereits dabei, und viel mehr als 16x PCIe4x wird man nach außen nicht brauchen.

Dafür könnte man eventuell beim Layout etwas einsparen, weil mit gleicher Anzahl an Funktionseinheiten ist in der Regel ein kombinierter großer DIE in der Summe in der Regel etwas kleiner als mehrere kleine DIEs.

Auf CPU Seite könnte man sogar noch weiter einsparen, da die IF-Links nach außen nicht benötigt werden, und nur mehr der interne IF. Eventuell könnte man auch den Cache etwas reduzieren.

Wenn man wollte könnte man also wahrscheinlich sogar auf knapp unter 300mm² landen, aber auf jeden Fall eher im niedrigen 300er Bereich und nicht im hohen.

Mr.Smith
2020-03-04, 20:22:12
du vergißt die 20% Chipfläche für Raytracing (von der gpu)
und schon bist wieder im höheren 300mm^2 bereich

einfach abwarten, ist doch großteils rätselraten aktuell.

Gast
2020-03-04, 22:29:58
du vergißt die 20% Chipfläche für Raytracing (von der gpu)
und schon bist wieder im höheren 300mm^2 bereich

Ca. 20% sollte 7nm+ bringen.
Und bei NV kostet Raytracing eher im Bereich 10%, vielleicht maximal 15%.

Was natürlich nicht bekannt und damit auch nicht mit inwiefern sich weitere Änderungen in RDNA2 auf den Transistorcount auswirken.

Gast
2020-03-04, 22:37:28
Taktnormiert würde speziell dieser neue Benchmark-Wert somit auf eine um ca. 25-30% höhere OpenCL-Leistung pro Shader-Cluster für den GA100-Chip hinauslaufen

Also ausgehend von den bekannten Taktraten komme ich eher in die Richtung +40%

Leonidas
2020-03-05, 03:25:22
Wieso hat die PCIe Variante von Volta mehr Punkte als die höher taktende SXM Variante? Wegen dem doppelten Speicher? Oder boostet die deutlich höher (trotz weniger 50W TDP)? Oder ist das eine V100s?


Ich weiss es auch nicht, aber die Ergebnisse sind da ziemlich konstant.




Grob entspricht die Konsole einem Navi10 + einem Zen2 Chiplet, das wären dann ca. 250mm² + 75mm², also "nur" 325mm².


+ Chipsatz-Funktionalität. Das CCD beinhaltet ja nur Core + Cache. Nicht viel, aber etwas isses schon. Die wollen garantiert keine weiteren Klein-Chips auf Board klatschen.




Also ausgehend von den bekannten Taktraten komme ich eher in die Richtung +40%


Ich habe es von der PCIe-Variante der V100 ausgehend berechnet, die hat einen höheren Benchmark-Wert. Dafür fehlt bei dieser leider eine GB-Taktangabe.

Gast
2020-03-05, 14:32:42
+ Chipsatz-Funktionalität. Das CCD beinhaltet ja nur Core + Cache. Nicht viel, aber etwas isses schon. Die wollen garantiert keine weiteren Klein-Chips auf Board klatschen.


So ziemlich alles was man dafür braucht sind in der GPU.

Speichercontroller ist bereits mitgerechnet, und 16x PCIe4x auch.
Wirklich mehr braucht es nicht.
Nimm 4 PCIe für den IO-Hub und 4 für die SSD.

Bleiben immer noch 8 übrig für andere Dinge.

Davon könnte man vielleicht 2 für USB, und 2 für SATA verwenden, falls man hier eine Upgrademöglichkeit anbieten will, vielleicht 1 für LAN wenn man diesen direkt anschließen will.

Wobei man den Rest falls nötig auch einfach über das IO-Hub ansteuern könnte.

USB, SATA und PCIe sind alles serielle Interfaces, und damit weitestgehend identisch, was die physische Schnittstelle angeht, man kann da also recht einfach das eine gegen das andere tauschen.



Ich habe es von der PCIe-Variante der V100 ausgehend berechnet, die hat einen höheren Benchmark-Wert. Dafür fehlt bei dieser leider eine GB-Taktangabe.

Ja weshalb ich davon ausgehe, dass die Reale Taktfrequenz bedeutend höher liegt, ansonsten wäre ja der Vorsprung zur angeblich höher taktenden Variante nicht erklärbar.

Und dort wo reale Angaben zur Taktfrequenz vorliegen geht es wie gesagt eher in die Richtung von 40%.

Leonidas
2020-03-06, 05:00:10
Tja, da hast Du wohl Recht. Ich wollte nicht gleich wieder die bestmögliche Rechnung aufmachen und habe reichlich defensiver gerechnet.