PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: Hardware- und Nachrichten-Links des 21./22. August 2018


Leonidas
2018-08-23, 10:37:51
Link zur News:
https://www.3dcenter.org/news/hardware-und-nachrichten-links-des-2122-august-2018

Bösewicht
2018-08-23, 12:24:22
1060 hatte kein sli bekommen, nun hat die 2070 kein sli, vielleicht teilen sich 2060 und 2070 nun auch denn selben chip.

MasterElwood
2018-08-23, 13:28:07
"Bezüglich des RayTracing-Einsatzes dürfte die kommende Turing-Generation sicherlich noch etwas zu schwach sein – das ganze dient eher dazu, das die Spieleentwickler jetzt schon etwas zum Anfassen und Ausprobieren haben, damit die Übernahme in echte Spiele mit späteren RayTraing-Beschleunigern schneller und breiter erfolgen kann."

Stimmt so nicht! Die Entwickler hatten genau mal 2! Wochen Zeit das RTX Ding zu implementieren vor der Präsentation - deswegen ist die Performance noch so schwach.

Die Entwickler von BF-V haben auch klargestellt das es MIT RTX in 4K auf stabilen 60fps laufen wird.

Redirion
2018-08-23, 13:55:26
woher stammt eigentlich die Info, die 3072 Shader von der Quadro RTX 5000 seien der TU104 Vollausbau? Gibt es dazu eine offizielle Bestätigung von Nvidia?

Wenn es nämlich nicht der Vollausbau wäre, könnte die RTX 2070 sehr wohl auf dem TU106 basieren und würde noch Platz für eine GTX 2060 lassen, bei der einige CUs und die RT-Cores deaktiviert sind.

Bei der Geforce-10-Generation bestanden die Sprünge zwischen den Chips aus 1280 CUs. (3840 GP102, 2560 GP104, 1280 GP106). Volta hielt sich mit GV100 ebenfalls an die 1280er Differenz mit 5120CUs.

Da die Quadro RTX 8000 (TU102) 4608 CUs hat, muss der Vollausbau von TU104 dieser Logik folgend 3328 CUs betragen.

MrSpadge
2018-08-23, 15:48:49
Für heute noch interessant: GTX2080 performance (von nVidia) (https://www.anandtech.com/show/13266/nvidia-teases-geforce-rtx-2080-performance-numbers-announces-ansel-rt#comments).

MrS

Iapetos
2018-08-23, 16:10:50
Der eigentlich bemerkenswerte Punkt liegt jedoch darin, das es sich hierbei um ein In-Order-Design auf Basis eines eigenen Befehlssatzes handelt, x86- oder ARM-Code läuft hierauf nur (angeblich zur Laufzeit) emuliert. Das Tachyum damit (trotz on-the-fly-Emulation) eine höhere Pro-Kern-Performance als Intels Xeon anpeilt (und in den Ruhephasen mal nebenbei AI-Beschleunigungen durchführen will), geht dann sicherlich schon in Richtung "unglaubwürdig", denn: In-Order ist ja nun generell viel langsamer als Out-of-Order, und Emulation anderer CPU-Befehlssätze war noch nie für eine wirklich herausragende Performance bekannt. Der letzte Prozessor, welcher selbiges versucht hat, war im übrigen Intels Itanium – welche nach Jahren der Entwicklung wie Weiterentwicklung und Milliarden Dollar an Kosten letztlich doch eingestellt wurde, weil jener nie zu einem sinnvollen Ergebnis gefunden hat.
Deine Einschätzung, dass die angepeilte Mehrleistung ggü. einem Xeon unglaubwürdig sei, ist fehlgeleitet. Durch kontinuierliche Optimierung kann ein In-Order-Design sehr wohl die Geschwindigkeit eines Out-of-Order-Designs erreichen, der Code muss dafür nur einige Male ausgeführt und währenddessen per Software optimiert werden. Ich verweise hier auf Nvidias Project Denver, ein sehr breites In-Order-Design mit massig Performance, etwa vergleichbar mit Intels Haswell. Der Prozessor kam im Nvidia Tegra K1 (Denver-Version) zum Einsatz und war wirklich schnell.

Gast
2018-08-23, 20:00:09
Da die Quadro RTX 8000 (TU102) 4608 CUs hat, muss der Vollausbau von TU104 dieser Logik folgend 3328 CUs betragen.

Wenn wir von weiterehin 128 Cuda-Cores pro SM ausgehen würden 3328 Cores 26 SMs ergeben.

Da der Vollausbau mit Sicherheit die SMs gleichmäßig auf die GPCs aufteilt wird es mit 26SMs ziemlich schwer, da wären nur 2 GPCs á 13 SMs oder 13GPCs á 2 SMs möglich, was beides sehr unwahrscheinlich erscheint.

3072 Cuda-Cores würden dagegen 24SMs ergeben, was sich sehr gut auf die GPCs aufteilen lässt.

Damit wären 6 GPCs á 4 SMs oder 4 GPCs á 6SMs möglich.

Mit hoher Wahrscheinlichkeit werden zwischen TU104 und TU102 auch eine ganze Zahl an GPCs mehr verbaut, und die GPCs an sich bleiben unangetastet.
Das geht auch mit beiden Varianten perfect, sowohl 9 GPCs á 4 SMs sowie 6 GPCs á 6 SMs gehen sich perfekt auf 4608 Cuda-Cores aus.

Also 3328 Cuda-Cores sind vielleicht nicht unmöglich aber doch extrem unwahrscheinlich.

Zudem bleibt der relative Unterschied zwischen 2 Leistungsklassen in der Regel gleich, was zwangsläufig mit mehr Einheiten ergibt, dass sich der absolute Unterschied an Einheiten sich vergrößert, je mehr dieser Einheiten verbaut werden.

Das Festhalten an 1280CUDA-Cores an Unterschied erscheint daher ziemlich willkührlich.