PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Cyberpunk 2077 Pathtracing – integrierter Benchmark


Raff
2023-04-14, 22:15:17
Moin!

In Anlehnung an diesen Thread hier (https://extreme.pcgameshardware.de/threads/pcgh-community-benchmark-cyberpunk-2077-path-tracing.633327/): Lasst uns das Grafikbrett mal hart benchen! :) Der Einfachheit halber mithilfe des integrierten Benchmarks, damit möglichst viele Leute mit wenigen Klicks dabei sein können. Ich hoffe auf einige Radeon-Werte, denn da besteht noch Klärungsbedarf.

Ablauf:
– Ihr ladet euch die aktuelle Spielversion runter (GOG, Steam, whatever). Aktuell ist v1.62.
– Habt ihr's schon, entfernt bitte alle Mods unter \Cyberpunk 2077\archive\pc\mod!
– Die Option Mengendichte (müsste unter "Gameplay" stehen) auf "Hoch" setzen.
– Ihr setzt die Grafikeinstellungen zurück. Müsste die F1-Taste sein. Übernehmen.
– Ihr wählt ganz oben das Preset "Raytracing: Overdrive".
– Gewünschten AA-Modus bzw. Upsampling-Verfahren wählen und übernehmen.
– Benchmark starten und normal durchlaufen lassen. Ergebnisbild shooten und hier hochladen.

Nicht über die geringen Bildraten wundern, Pathtracing gilt nicht umsonst als "Endgegner" und "Heiliger Gral" zugleich. :D Ohne heftiges Upsampling wird das erst mit der übernächsten GPU-Generation flüssig laufen.

Achtung: Das Preset Overdrive inkludiert auf RTX-Karten DLSS - und hier lauert ein Stolperstein, Bug, Cheat, ich bin nicht ganz sicher. Selbst wenn ihr von "Automatisch" auf "Qualität" oder einen anderen DLSS-Modus geht, kommt es vor, dass das Spiel auf DLSS Auto und somit DLSS Performance wechselt. War bei mir so. Lösung: Nach dem Setzen des Overdrive-Presets einmal irgendeinen anderen DLSS- oder FSR-Modus auswählen und übernehmen klicken. Erst dann erst den gewünschten AA-Modus einstellen und übernehmen.

MfG
Raff

Raff
2023-04-14, 22:19:39
Ich lege mal mit meinem Ampere-Gammel vor. Alles ab AD103 dürfte spielend vorbeikommen (AD104 nur knapp) - ich würde mich aber am meisten über RDNA-3-Werte freuen. Lasst mal eure optimierten 7900er sprechen. Nur keine Scheu. :)

3.840 × 2.160:

TAA: 9/11,4 Fps (Min./Avg.)​
DLSS Q: 19/23,3 Fps (Min./Avg.)​
DLSS B: 23/28,9 Fps (Min./Avg.)​
DLSS P: 29/36,0 Fps (Min./Avg.)​

2.560 × 1.440:

TAA: 20/25,2 Fps (Min./Avg.)
DLSS Q: 37/45,5 Fps (Min./Avg.)
DLSS B: 45/56,1 Fps (Min./Avg.)
DLSS P: 54/68,3 Fps (Min./Avg.)


AMD Ryzen 9 5950X @ 16C/16T @ Eco-Curve, Nvidia Geforce RTX 3090 Ti Founders Edition @ 2.010-2.055 MHz, 23,5 GT/s (UV), B550, 32 GiB DDR4-3600 (1T), rBAR an, Windows 11, GRD 531.61 WHQL

MfG
Raff

Lyka
2023-04-14, 22:37:49
ich hatte gestern 5-6 fps mit meiner 6700 XT, aber ich ziehe das nochmal durch ;D

keine Bildverbesserung - 5.15 FPS
https://abload.de/img/rechner-1-keinebildve48f8a.png

FSR Automatikmodus - 10.91 FPS
https://abload.de/img/rechner-2-fsrautomati7kdff.jpg

AMD Ryzen 3600 - Standard-Settings
Radeon 6700 XT - Standard-Settings
16 GB RAM (2x8GB, DDR4, @3000MHz)
Asrock B550M Pro4
Windows 11

Raff
2023-04-14, 23:17:22
Autsch. :biggrin: FSR Auto müsste in diesem Fall (Full HD) Quality sein. Kannst du ja mal explizit setzen, um das zu checken. Wie läuft's mit FSR 2 Performance? Eventuell kommst du damit ansatzweise Richtung 20 Fps ...

Hast du vorher die Settings zurückgesetzt? Vermutlich greift es im Benchmark nicht, aber da steht, dass Vsync aktiv ist - eventuell bietet sich da noch ein Run ohne an.

MfG
Raff

Lyka
2023-04-14, 23:23:06
ja, ist zurückgesetzt. ich schau nochmal :D

ja, die Werte entsprechen denen von FSR Ultra. VSYNC ist nun aus. Ich teste mal FSR Ultra-Performance ;D

https://abload.de/img/rechner3-fsrultraperf44ch3.png

FSR Balanced bringt 13.68 FPS

FSR Performance bringt 18.32 FPS

vinacis_vivids
2023-04-14, 23:31:32
https://youtu.be/2-fkXY3WL_I

7900X3D + 7900XTX @FSR 1080p 35-40fps.

Radeonfreak
2023-04-14, 23:44:59
Nicht über die geringen Bildraten wundern, Pathtracing gilt nicht umsonst als "Endgegner" und "Heiliger Gral" zugleich

MfG
Raff

Mach ich nicht.

https://abload.de/img/unbenanntwzf7y.png

https://abload.de/img/unbenanntmbe28.png

Sardaukar.nsn
2023-04-15, 09:16:44
109 FPS - All-in mit 3 Ghz und +1500 Vram bei 666 Watt Powerlimit (Galax HOF Bios)


106 FPS - 24/7 Settings mit 65% Powerlimit bzw. ~360 Watt. GPU Takt senkt sich dann auf 2835 Mhz. Siehe Screenshot im Anhang.


22 FPS - Ohne DLSS :freak:

https://imgur.com/a/cGCtj7m

AMD Ryzen 7 5800X @ MSI Kombo-Strike 2, ASUS RTX 4090 TUF @ Galax HOF Bios + Alphacool Wasserblock, MSI B550, 32 GiB DDR4-3600CL14, rBAR an, Windows 11, GRD 531.41 WHQL

Lyka
2023-04-15, 12:28:14
Ohne DLSS, hmmmmm, dann kann ich damit relativ leicht ausrechnen, dass die 4090 TUF 4x schneller ist als meine 6700 XT beim Pathtracing :uponder: (Gut, meine GPU kostete 2021 auch 500 EUR :uponder:)

dildo4u
2023-04-15, 12:31:26
Ohne DLSS, hmmmmm, dann kann ich damit relativ leicht ausrechnen, dass die 4090 TUF 4x schneller ist als meine 6700 XT beim Pathtracing :uponder: (Gut, meine GPU kostete 2021 auch 500 EUR :uponder:)
Haut nicht ganz hin laut dem ist 4070 3.5 mal schneller als 6800XT.(Ohne Framegen)

https://www.youtube.com/watch?v=LVovUcHnwws&t=396s

denjudge
2023-04-15, 13:41:39
Ryzen 5900x ohne SMT mit PBO2 Tuner, RTX 3080 Curve optimiert bei durchschnittlich 1935Mhz und 10500Mhz VRAM

Man From Atlantis
2023-04-15, 16:43:50
5800X3D@CO -30, BCLK 101.75MHz, PPT/TDC/EDC 124/75/125, 4*8GB 3933MHz CL16,
Palit RTX 4090 GameRock OC 2745/24000MHz @950mV,
Win11 Home 22H2, Driver 531.41,
RT Overdrive

1920*1080, TAA, no FG 69,03
2560*1440, TAA, no FG 44,23
3840*2160, TAA, no FG 21,48
1920*1080, TAA, FG 120,25
2560*1440, TAA, FG 78,65
3840*2160, TAA, FG 40,00

1920*1080, DLSS Q 111,50
2560*1440, DLSS Q 78,03
3840*2160, DLSS Q 42,54
1920*1080, DLSS Q, FG 180,75
2560*1440, DLSS Q, FG 127,89
3840*2160, DLSS Q, FG 70,19

1920*1080, FSR Q 111,11
2560*1440, FSR Q 77,73
3840*2160, FSR Q 42,00
1920*1080, FSR Q, FG 179,53
2560*1440, FSR Q, FG 127,04
3840*2160, FSR Q, FG 69,49

1920*1080, XeSS Q 105,37
2560*1440, XeSS Q 73,84
3840*2160, XeSS Q 40,10
1920*1080, XeSS Q, FG 172,44
2560*1440, XeSS Q, FG 121,77
3840*2160, XeSS Q, FG 66,82


https://abload.de/gallery.php?key=egrZ8zKu

basix
2023-04-15, 18:11:45
Nice, ziemlich umfangreiches Testing hast du da gemacht :up:

Edit:
5800X3D@CO -20, 3*8GB 3200MHz CL14,
RTX 4090 @ 2550/22400MHz @890mV,
Win10 Home 22H2, Driver 531.61,
RT Overdrive

Oder: Wie man eine 4090 niederstreckt :D
- 3240p mit DLAA oder 8K DLSS-Q ist das Maximum was geht. 8K nativ lässt die 24 GByte überlaufen


3840*2160, TAA, no FG 19.5
3840*2160, DLAA, no FG 19.4
3840*2160, DLSS-P, no FG 57.5

5120*2880, DLSS-P, no FG 36.1
5760*3240, DLSS-P, no FG 30.2
7680*4320, DLSS-P, no FG 18.1

5760*3240, DLAA, no FG 8.8
7680*4320, DLSS-Q, no FG 10.9

5120*2880, DLSS-P, FG 57.6

RoNsOn Xs
2023-04-15, 18:35:45
7900xtx @360w
AMD kackt ziemlich ab.

1440p, kein FSR: 9,92 fps
1440p, FSR-Q: 21,10 fps
1440p, FSR-P: 34 fps
4k, FSR-P: 17 fps

TobiWahnKenobi
2023-04-15, 22:11:39
https://abload.de/img/cyberpunk2077_2023_04mec94.jpg
https://abload.de/img/cyberpunk2077_2023_04iocjv.jpg
https://abload.de/img/cyberpunk2077_2023_04m6e49.jpg
https://abload.de/img/cyberpunk2077_2023_04n4it0.jpg
Asus RTX4090 TUF OC @ >500W ; i9 @ ca 90W

https://abload.de/img/cyberpunk2077_2023_04jrckc.jpg



(..)

mfg
tobi

Andron
2023-04-16, 01:42:25
2.560 × 1.440:

TAA: 3,79/5,31 Fps (Min./Avg.)​
DLSS Q: 8,06/11,35 Fps (Min./Avg.)​
DLSS B: 10,12/14,31 Fps (Min./Avg.)​
DLSS P: 13,18/19,11 Fps (Min./Avg.)​

1.920 × 1.080:

TAA: 6,35/9,10 Fps (Min./Avg.)
DLSS Q: 13,53/19,31 Fps (Min./Avg.)
DLSS B: 16,82/23,86 Fps (Min./Avg.)
DLSS P: 21,77/30,43 Fps (Min./Avg.)

AMD Ryzen 9 5950X @ standard
AMD Radeon RX 6800XT @ 1035mV UV
MSI MEG X570 Unify, 32 GiB DDR4-3600 (1T)
rBAR an, Windows 11, Adrenalin 23.4.1

Messung außer Konkurrenz mit Performance Mod "Raytracing Overdrive Optimizations":

2.560 × 1.440:

TAA: 9,72/11,93 Fps (Min./Avg.)​ (+125%)
DLSS Q: 19,35/24,33 Fps (Min./Avg.)​ (+114%)
DLSS B: 22,99/29,62 Fps (Min./Avg.)​ (+107%)
DLSS P: 30,10/37,57 Fps (Min./Avg.)​ (+97%)

1.920 × 1.080:

TAA: 16,24/20,16 Fps (Min./Avg.) (+122%)
DLSS Q: 29,65/38,36 Fps (Min./Avg.) (+99%)
DLSS B: 35,27/45,50 Fps (Min./Avg.) (+91%)
DLSS P: 42,75/56,00 Fps (Min./Avg.) (+84%)

basix
2023-04-16, 13:44:42
Interessant, dass die Reduktion auf Radeon +100% Performance bringt. Auf einer 4090 sind es etwa +20-30%, habe ich vorhin getestet @ 4K DLSS-Q. Das selbe bei den Rays (1/2 Rays = +30% Performance). Mehr Rays bringen auf den ersten Blick nicht sehr viel. 2 statt 1 Bounces haben schon einen bemerkbaren Effekt.

Overkill ist natürlich die "PT Extreme Quality" Mod, wo man 8 statt 2 rays und 4 statt 2 Bounces verwendet:
https://www.nexusmods.com/cyberpunk2077/mods/8059?tab=files
- 4K DLSS-Q = 10fps
- 4K DLAA = 4.4fps

Mehr als 2 Bounces wertet einige Stellen der Optik auf (z.B. Unterseite von Palmenwedeln, temporal stability des GI). Der Unterschied rechtfertigt den Performance drop aber nicht

Da hat Nvidia also noch ein paar Stellschrauben, um künftige GPUs in die Knie zu zwingen ;) Neben dem, dass die Sichtweite der Schatten auch bei PT nicht sehr hoch ist (an dynamischen Objekten wie Autos oder Passanten).

Was ich mich aber frage:
Bei der UE5 spricht man von "Infinite Bounce", womit das Problem bei z.B. den Palmwedeln eigentlich erschlagen wäre? Bin nicht ganz sicher, wie das beim RTX Pathtracing SDK genau funktioniert und wie es temporal akkumuliert wird. Verglichen mit RT in der UE 5.1 in der City Demo ist das Ghosting der Schatten an Autos und Passanten allerdings geringer.

vinacis_vivids
2023-04-16, 13:59:13
Werden die Rays und Bounces mit fp32 oder fp16 berechnet bei CP2077?
Mit fp16 reicht die Präzision völlig aus. Mit fp32 ist das ein klarer Nachteil für RDNA uArch, weil zu viele Ressourcen damit gebunden werden.

GanjaBob
2023-04-16, 14:29:04
Interessant ... (die FSR Werte sind nicht vertauscht!) :)

3700X & 3070 auf default


2560x1440
nativ: 11.53/21.69 (Min./Avg.)​
DLSS Q: 20.46/43.57 (Min./Avg.)​
DLSS B: 30.43/54.76 (Min./Avg.)​
FSR Q: 21.74/40.41 (Min./Avg.)​
FSR B: 16.09/37.79 (Min./Avg.)​

ChaosTM
2023-04-16, 14:34:18
Da hat Nvidia also noch ein paar Stellschrauben, um künftige GPUs in die Knie zu zwingen ;) Neben dem, dass die Sichtweite der Schatten auch bei PT nicht sehr hoch ist (an dynamischen Objekten wie Autos oder Passanten).




genau das ist das geniale an der NV "RTX" Marketing Politik.
Mit der nächsten Generation gibt es wieder ein neues "Feature",
dass 50% Leistung kostet aber praktisch keinen oder nur sehr wengi Optischen Gewinn beschert.

basix
2023-04-16, 15:51:44
Wenn ich Nvidias Pathtracing und Lumen der UE5 anschaue: Es gibt noch einige Effekte, die bei temporaler Stabilität, Rauschen, räumlicher Genauigkeit, weniger Schlieren und von der Weitsicht / LoD her noch Spielraum haben. Aber: Das sind alles Artefakte, wo der allgemeine Bildeindruck bereits recht gut ist. Man bewegt sich auch hier in gewissen Regionen in Richtung abnehmenden Grenzertrags. Das bedeutet dann überproportional viel Leistungshunger bei wenig Gewinn. Und um die Artefakte zu beseitigen benötigt man oft ebenfalls überproportional Leistung. Ist halt leider so und in der Natur der Sache. Das ist nicht eine "Nvidia ist böse" Geschichte. Genau das selbe wirst du auch bei AMD, Intel und anderen Game Engines sehen. Und man sieht es heute bei Games hinsichtlich Ultra vs. Very High Settings, wo optisch oftmals kein extremer Unterschied besteht aber die Performance stark leidet.

Das einzige was man machen kann: Über intelligente HW-Architektur, temporal Upsampling und smarten Algorithmen (SW) die Kosten für das selbe Resultat senken. Also mit weniger Rays und Bounces auf die selbe Bildqualität kommen. Das ist am Ende sinnvoller, als Brute Force die Rays und Bounces zu erhöhen.
Hier sind die Konsolen sogar ein Segen: Sie verlangen danach, dass von Seiten SW optimiert wird. Das HW-Budget ist fixiert, mehr gibt es nicht.

Interessant ... (die FSR Werte sind nicht vertauscht!) :)

3700X & 3070 auf default


2560x1440
FSR Q: 21.74/40.41 (Min./Avg.)​
FSR B: 16.09/37.79 (Min./Avg.)​



Speicherüberlauf? Konnte gestern 8K DLSS-Q benchen und heute ist 8K DLSS-P ein Problem. Aus irgendwelchen Gründen wird der Speicher deutlich stärker aufgefüllt. Das führte zu deutlich geminderter Performance.

Andron
2023-04-16, 16:35:17
Interessant, dass die Reduktion auf Radeon +100% Performance bringt. Auf einer 4090 sind es etwa +20-30%, habe ich vorhin getestet @ 4K DLSS-Q. Das selbe bei den Rays (1/2 Rays = +30% Performance). Mehr Rays bringen auf den ersten Blick nicht sehr viel. 2 statt 1 Bounces haben schon einen bemerkbaren Effekt.

War die Modeversion mit RIS, welche vor allem auf Radeons einen zusätzlichen Boost bringen soll. Mit Mod wird die Karte auch besser ausgelastet, der Stromverbrauch steigt um ca 10-12% an, bleibt aber immer noch dauerhaft unter dem TDP Limit.

GanjaBob
2023-04-16, 20:40:51
...

Speicherüberlauf? Konnte gestern 8K DLSS-Q benchen und heute ist 8K DLSS-P ein Problem. Aus irgendwelchen Gründen wird der Speicher deutlich stärker aufgefüllt. Das führte zu deutlich geminderter Performance.
Jo. Habe den VRAM vorhin gar nicht so beachtet und jetzt versucht nachzustellen: Einmalig war er wieder nur bei "FSR Balanced" lt. Afterburner bei 8144 MB. Die anderen FSR Modi max bei 7950 MB. Bei erneuten Versuchen dann aber auch bei "B" nicht mehr so hoch.

TobiWahnKenobi
2023-04-17, 16:16:28
ich weiss nicht.. dieser overdrive-raytracingmodus läuft bei mir nicht stabil. wenn ich so zocke gibts irgendwann einen blackscreen und ich muss das system resetten. das passiert sowohl mit sys-OC als auch stock. spiele ich ein setting ohne RT kachelt CP2077 nicht ab.. ebenfalls mit und ohne sys-OC probiert. treiber und win11 sind aktuell, bios für board und graka ebenfalls.. mehr kann ich nicht tun. bin ich der erste?


(..)

mfg
tobi

dildo4u
2023-04-17, 16:34:30
Ist dein Ram Stabil 7200 ist nicht grad Standard.

TobiWahnKenobi
2023-04-17, 16:46:12
gute frage.. der läuft mit seinen xmp settings und fiel bislang nicht negativ auf.. hab den ja schon ein paar wochen im einsatz.. *kopfkratz*

deutet signalverlust und numlock bleibt schaltbar auf RAM?


edit
BIOS zurückgesetzt
DDR5 4800 geladen, eine mission fehlerfrei gespielt.
DDR5 7200 geladen, wieder eine mission fehlerfrei gespielt.

im RAM-menu kann ich im XMP betrieb entscheiden, ob das board alle timings aus dem profil nehmen soll oder nur die primären. ich hab
dieses mal letzteres gewählt. die anderen hat es sich wohl antrainiert und augenscheinlich läufts so.. kacke..

genau wg. so einer shice fingere ich nicht an den timings rum. jetzt wo ich es verifizieren will lässt es sich nicht reproduzieren.


thx


(..)

mfg
tobi

Matrix316
2023-04-17, 23:01:30
Hairworks 2.0. ;)

7900XTX XFX Merc @default, 13900K @253W

Raytracing Overdrive
Ultra HD Kein FSR
Avg 4,54
Min 3,35

Ultra HD FSR Quality
Avg 9,65
Min 3,6

1440p Kein FSR
Avg 9.86
Min 5,22

1440p FSR Quality
Avg 21.08
Min 11.79

1440p FSR Performance
Avg 34,06
Min 20,14

Raytracing Ultra
Ultra HD FSR Quality
Avg 37,93
Min 4,26

Raff
2023-04-18, 00:36:58
Uff. Dass Navi 31 so krass wegstirbt, hatte ich nicht erwartet - nicht mal halb so schnell wie GA102. Jetzt würde ich gerne noch eine RTX 2080 Ti oder Titan RTX im Vergleich sehen ... Feinwein. :ulol:

MfG
Raff

basix
2023-04-18, 11:32:28
Turing ist schon sehr gut gealtert. Nach 4.5 Jahren unterstützt man immer noch das komplette und neueste Feature-Set (DX12 Ultimate, gut beschleunigtes Raytracing, DLSS 2.0, FSR/XeSS, hohen Matrix/Tensor Rohperformance für zukünftige AI-Spielereien, hohe Compute Performance) mit Ausnahme von Frame Generation (was mit FSR3 evtl. auch auf Turing kommt). War wirklich eine visionäre Architektur. Bei neuesten Spielen merkt man sicher, dass es in hohen Auflösungen und höchsten Details langsam an Rohperformance mangelt. Doch mittels DLSS/FSR hat man oftmals ein Ass im Ärmel, wenn es knapp wird. Oder man stellt halt nur den zweithöchsten Detailgrad ein ;)

Fun Fact:
Die 2080 Ti landet bei CP Pathtraced ungefähr auf Niveau 7900 XTX ;) Hätte die 2080 Ti noch da, doch auf das rein- und rauswürgen der 4090 bei meinem Gehäuse habe ich gerade nicht viel Lust drauf :D
Hier aber ein Video mit 1440p DLSS-P, wo man bei ~30fps landet: https://www.youtube.com/watch?v=f6TFttVWGx8

Edit:
Eurogamer hat einen Direktvergleich von 7900 XTX und 2080 Ti im integrierten Benchmark: https://www.eurogamer.net/digitalfoundry-2023-how-we-ran-cyberpunk-2077-rt-overdrive-on-an-entry-level-rtx-3050

1440p DLSS/FSR-Balanced
- 7900 XTX = 26.12fps
- 2080 Ti = 24.65fps

Matrix316
2023-04-18, 11:48:15
Das Problem hier ist einfach, dass Path RT einfach Nvidia viel zu gut aussehen lässt.

"Waaas? Die 3070 ist schneller als die 7900RTX? Dann kauf ich doch lieber die..."

Zumindest wird das so suggeriert.

basix
2023-04-18, 11:51:19
Schlussendlich ist das ein einzelnes Game, mehr nicht. Dazu noch speziell mit einer Nvidia eigenen Technologie gepimpt. Für eine fundierte Kaufentscheidung ist das also nicht geeignet. Da sind die Benchmark-Serien von CB, PCGH und Co. besser geeignet ;)

Selbst für Nvidia Nutzer ist RTX Overdrive nur begrenzt spielbar (Ausnahme sind die 40er Karten, wer hätte es gedacht). Eher eine Technologie-Demo. Die meisten werden immer noch ohne Pathtracing spielen. Die 30fps auf einer 2080 Ti werden sich nicht schön anfühlen ;)

Edit:
Was ich noch beachtlich finde ist, dass die 3070 etwa 1.5x so schnell wie eine 2080 Ti ist. Hier ist der stark gesteigerte FP32-Throughput von Ampere anscheinend sein Geld wert und schlägt voll durch.
Ausserdem sieht man von der 3050, über die 2080 Ti bis 4070 Ti: Fast lineare Skalierung anhand der FP32-FLOPS. Und das bei 1440p DLSS-P und somit 847p Rendering. Drei verschiedene Architekturen und dennoch so nahe an einer linearen Kurve. Nice. Kann jetzt Zufall sein oder Nvidia hat ihren RTX-Pathtracing Code sehr gut auf Turing, Ampere und Lovelace optimiert und quetscht alles aus den Karten raus.

Achill
2023-04-18, 13:56:27
Ist halt das alte Gameworks Prinzip, wie immer Optimiert und am Limit der eigenen aktuellen GPUs. Wer seine FPS bei der 6X00 oder 7900 nicht töten will (wie früher schon mit 64x Tessellation) nimmt ein Preset mit nur einen Ray anstatt zwei .. siehe: RTX Overdrive Presets (Better Perfromance to House on Fire) (https://www.nexusmods.com/cyberpunk2077/mods/8069?tab=description)

Langlay
2023-04-18, 14:23:10
Ist halt das alte Gameworks Prinzip, wie immer Optimiert und am Limit der eigenen aktuellen GPUs. Wer seine FPS bei der 6X00 oder 7900 nicht töten will (wie früher schon mit 64x Tessellation) nimmt ein Preset mit nur einen Ray anstatt zwei .. siehe: RTX Overdrive Presets (Better Perfromance to House on Fire) (https://www.nexusmods.com/cyberpunk2077/mods/8069?tab=description)

Nur mit dem Unterschied das man keinen Unterschied zwischen Tessellation 16x und 64x gesehen hat, man aber schon einen Unterschied zwischen 1B1R und 2B2R sieht und auch die Nvidia Karten gewinnen relativ viel Leistung mit 1B1R.

basix
2023-04-18, 16:01:23
Ausserdem sieht man von der 3050, über die 2080 Ti bis 4070 Ti: Fast lineare Skalierung anhand der FP32-FLOPS. Und das bei 1440p DLSS-P und somit 847p Rendering. Drei verschiedene Architekturen und dennoch so nahe an einer linearen Kurve. Nice. Kann jetzt Zufall sein oder Nvidia hat ihren RTX-Pathtracing Code sehr gut auf Turing, Ampere und Lovelace optimiert und quetscht alles aus den Karten raus.

Ich habe die Messwerte von Eurogamer zusammen mit den FP32-FLOPS in ein Diagramm eingetragen und man sieht schön, dass die Framerate sehr gut mit den FP32-FLOPS skaliert. Turing kommt etwas besser weg als Ampere und Lovelace. Das kann jetzt aber daran liegen, dass 10-15% der Instruktionen INT sind und nicht FP32 oder Turing allgemein seine Einheiten besser ausgelastet bekommt. Ampere ist aber sehr nahe an 2x Performance pro SM bei selben Taktraten (~1.75x pro SM) und viel besser skalierend wie im Durchschnitt bei Spielen (~1.3x)

Interessant auch der Vergleich 4070 Ti vs. 3050: Man erreicht immer noch 93% Scaling, obwohl >4x FLOPS und 3x SMs sowie relativ niedriger Renderauflösung (wo breitere GPUs schlechter skalieren).

robbitop
2023-04-18, 17:05:50
Das ist jetzt aber auch nicht überraschend, denn RT ist extrem computation heavy.

basix
2023-04-18, 17:10:31
Nicht komplett überraschend, nein. Aber fast perfekte Skalierung? Das Spiel besteht ja nicht nur aus reinem Path-Tracing. Und man muss die Shader-ALUs auch füttern können, ohne auf andere Bottlenecks zu treten (Caches, Speicherbandbreite, Latenzen, ...). Das bei 3 verschiedenen Architekturen und massiv aufgebohrten FP32-Units, abgewandelten RT-Units und bei Ada grossem L2$ zu sehen ist nicht selbstverständlich. Interessant wäre es noch, die ALU-Utilization anzuschauen. Evtl. ziehe ich mir das noch mit Nsight rein. Kann das allerdings nur mit einer einzelne GPU machen und nicht vielen verschiedenen.

robbitop
2023-04-18, 17:37:48
Naja aber alles andere skaliert Nvidia doch auch nahezu mit den SMs. Größere SKUs haben entsprechend mehr Bandbreite. Pro SM erhöht sich auch die Texturefillrate und mehr L2 Cache. Bei mehr SMs gibts auch mehr GPCs also mehr ROPs und mehr Rasterleistung.
Es steigt doch nahezu alles proportional.

Das mit der FP32 Verdopplung ab Ampere hast du natürlich Recht. Das hat bisher nicht so doll skaliert.


Andererseits steigt die Frametime vs max rasterizing details mit PT auf Faktor 4. Entsprechend wird damit der überwiegende Teil der Frametime nun aus Compute bestehen. Dann schlägt FP32 Throughput natürlich durch.

basix
2023-04-18, 23:26:08
So habe mal Nsight angeworfen und da gibt es interessante Sachen zu sehen. Ich bin da nur Laie aber was mir aufgefallen ist:
- SM Throughput insgesamt ist relativ niedrig, selbst mit 4K DLAA bei ~35%. Das ist aber deutlich höher als bei Witcher 3 Enhanced, wo es bei vergleichbaren Settings ~25% sind
- Hohe Register Utilization >70%
- L1 Hitrate ist bei ~80%
- L2 Hitrate ist bei wahnsinnigen ~90% (VRAM Throughput Utilization oftmals <30%)
- Hohe Tensor Pipe Utilization sehr kurz, nur etwa ~0.15ms und inkl. FG ~0.25ms pro Frame --> DLSS ginge wohl auch via Shader, wenn hier die "DLSS Magie" passiert ;)
- RT Cores sehe ich leider nirgends (separat) aufgelistet

So wie es aussieht ist RTX Pathtracing stark auf die Ausnutzung der Chip-Caches ausgelegt

Raff
2023-04-19, 00:04:37
Coole Infos. :up: Und ergibt absolut Sinn. Hochoptimiert auf alles, was Ada zu bieten hat.

MfG
Raff

robbitop
2023-04-19, 06:54:05
Sind die hitrates im Vergleich zu anderen Titeln unüblich? Gerade der L2 bei Ada ist ziemlich groß - da sollte man auch eine hohe hitrate erwarten dürfen.

basix
2023-04-19, 10:32:18
Ich habe nur Witcher 3 Enhanced gegengetestet. Dort sind die Hitrates wesentlich geringer. Immer noch hoch (glaube 60-70% beim L2$) doch es wird mehr vom VRAM nachgefragt. Ich kann bei Gelegenheit noch in ein paar andere Spiele schauen (ohne Pathtracing, auch ohne RTX).

Edit:
Ich habe Shadow of the Tomb Raider, Uncharted und UE5 City Sample durch Nsight laufen lassen. Jeweils 4K DLSS-Q. Und in der Tat: L1/L2 Hitrate sind jeweils im Bereich 70-80%. Nicht ganz so hoch wie bei CP2077 Pathtraced aber immer noch sehr hoch. UE5 City Sample @ 8K DLSS-Q ist zudem noch interessant. Es gibt einige "Crunch-Phasen", wo zum Teil über längere Zeit >98% L1$ Hitrate oder an anderen Orten >90% L2$ Hitrate erreicht werden. SM-Throughput erreicht aber auch hier nicht mehr als 30-35%. Und in den anderen Spielen ist man eher bei 20-25%.

Fazit: L2$ wird anscheinend sehr gut ausgenutzt.

Nuon
2023-09-23, 12:10:38
Die neue Version 2.0 ist draussen!
R9 5900X@87W, 4080@default.
Gebencht mit altem und neuem Nvidia Treiber mit DLSS Q und DLSS Auto - keine großen Unterschiede:

Raff
2023-09-26, 14:24:58
Ich wollt's gerade mal laufen lassen, aber ... das macht eine Arc A770 mit dem frischen Treiber, sobald man den Pfadfinder-Modus einschaltet:

https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=85361&stc=1&d=1695731079

Die Bildrate sinkt gegenüber dem fehlerfreien Raytracing Ultra deutlich, berechnet wird das Gerümpel also ... :ulol:

MfG,
Raff

ianm
2023-09-30, 16:58:50
Für die Nachwelt, weil es immer heißt man bräuchte eine 4080/4090 um PT nutzen zu können. In 1440p jedenfalls nicht.

Settings: DLSS Quality + FG + RR + PT

Alles High, außer
Colour Precision: Medium
Max Dynamic Decals: Ultra
Volumetric Cloud Quality: Medium

CA off
MB off

https://abload.de/thumb/unbenanntxgcbv.png (https://abload.de/image.php?img=unbenanntxgcbv.png) https://abload.de/thumb/unbenannt1eeenn.png (https://abload.de/image.php?img=unbenannt1eeenn.png)

The_Invisible
2023-09-30, 17:30:47
Hab ich nie gesagt, Bruder spielts auch mit seiner 4060Ti16gb in 1080p/max mit PT

Dennis50300
2023-11-10, 17:58:22
Vor paar Tagen mal wieder gesaugt mit gog-Galaxy


Gruss

Wiseman
2024-10-13, 03:35:49
7900xtx @360w
AMD kackt ziemlich ab.

1440p, kein FSR: 9,92 fps
1440p, FSR-Q: 21,10 fps
1440p, FSR-P: 34 fps
4k, FSR-P: 17 fps

Hast du noch deine 7900XTX? Wenn ja, überprüfe diesen Test nochmals. Wirst sehen, mit FSR 3 + FG läufts viel besser: 4k, FSR3 P, FG: 61 fps

Auto = Performance

RoNsOn Xs
2024-10-13, 13:11:11
Ja, aber nicht mehr installiert. Keine Lust da zu investieren.

aufkrawall
2024-10-13, 13:35:09
Kannst du dir auch sparen, weil die FSR 3 FG Implementierung komplett kaputt in dem Spiel ist. Es gibt eine Art seltsames Tearing, das es mit den Mods für DLSS FG -> FSR FG nicht gibt. Aber wenn man nur geil auf lange Balken ist, spielt so etwas natürlich keine Rolle...

Wiseman
2024-10-13, 19:04:49
Ja, aber nicht mehr installiert. Keine Lust da zu investieren.

Kann ich verstehen. Ich würde es auch nicht extra nochmals installieren. CP77 interessiert mich nicht die Bohne. Ich wollte dir nur zeigen, dass AMD beim Path Tracing in CP77 inzwischen nicht mehr abkackt.

vinacis_vivids
2024-10-14, 03:52:49
Radeon Path Tracing (RPT) für RDNA3 optimiert :-)

https://i.ibb.co/YfzwkVC/Cyberpunk-2077-RDNA3-Radeon-Path-Tracing-UHD-Xe-SS-P-FG-110fps.jpg

So siehts aus :biggrin:

vinacis_vivids
2024-11-26, 12:55:57
7950X Enhanced CPU Test mit 720p (7900 XTX) - CP2077 ;-)

zQksxsel9oU

Interessant sind die Messungen zum Compute-Anteil und die durchaus hohe CPU-Auslastung :eek:

hq-hq
2025-01-26, 21:46:08
720p ultra ohne DLSS o.ä.

9800x3d stock - DDR5@4800 Cl40 40 40 77
Gigabyte Gaming OC 4090@ +165/+750MHz
rbar=off
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=91171&stc=1&d=1737923526

9800x3d CO-36 +200MHz, Bus 101MHz, FCLK 2121MHz, DDR5@6262MHz Cl 28 36 36 62
Gigabyte Gaming OC 4090@ +165/+750MHz
rbar=off
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=91170&stc=1&d=1737923526


9800x3d CO-36 +200MHz, Bus 101MHz, FCLK 2121MHz, DDR5@6262MHz Cl 28 36 36 62
Gigabyte Gaming OC 4090@ +165/+750MHz
rbar=on
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=91172&stc=1&d=1737926428

-------------------------------------------------------------------------------------------------------



[rbar=off]
Auflösung avg fps avg % min fps min %
720p stock 167.96 100.00 124.84 100.00
720p OC 191.25 113.87 148.43 118.90
1080p stock 124.92 100.00 106.72 100.00
1080p OC 131.59 105.34 115.64 108.36
2160p stock 45.66 100.00 40.20 100.00
2160p OC 46.11 100.99 41.19 102.46

CompuJoe
2025-04-04, 02:33:37
Mal alles auf Anschlag, aber Energieeffizienz optimiert, uv, co usw.

FSR

CompuJoe
2025-04-04, 02:43:11
Mal alles auf Anschlag, aber Energieeffizienz optimiert, uv, co usw.

DLSS Q, DLSS Auto TM