Archiv verlassen und diese Seite im Standarddesign anzeigen : Shader Stress - CPU-Kompilier-Performance (simuliert)
aufkrawall
2025-11-29, 14:04:50
Download:
https://github.com/aufkrawall/Shader-Stress/tags
Muss man nicht lange laufen lassen, Performance sollte fast nicht schwanken.
5700X 88,7k/s:
https://s1.directupload.eu/images/251129/temp/undn979t.jpg (https://www.directupload.eu/file/d/9118/undn979t_jpg.htm)
wine-staging mit Standard Arch-Kernel mit Mitigations an:
https://s1.directupload.eu/images/251129/temp/v4f8br3g.png (https://www.directupload.eu/file/d/9118/v4f8br3g_png.htm)
Ja, ist etwas schneller als nativ. :freak:
13700K 5,3GHz (mit minimaler Drosselung): ~185k/s
misterh
2025-11-29, 20:00:39
285K + 8400CL38
https://s1.directupload.eu/images/user/251129/uroshix4.png
Tesseract
2025-11-29, 20:51:16
9800X3D
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94724&stc=1&d=1764445803
aufkrawall
2025-11-29, 21:08:53
Oha, krass. Könnte an AVX-512 liegen. Mit --no-avx512 wird stattdessen AVX2 genutzt.
Scalar-Modus ohne AVX2 ist zwar für CPUs ohne Support implementiert, der manuelle Befehl --no-avx2 allerdings nicht im Release-Build. Hab es mal neu kompiliert getestet und bringt einiges auf Zen 3, geht von 88k auf 67k runter. Skalar ist vermutlich realistischer für die real-world Vergleichbarkeit. Allerdings immer noch mehr FMA-Operationen als echtes Kompilieren. Die Relationen mit AVX2 zwischen Zen 3 und Raptor Lake scheinen aber auf den ersten Blick gut zur Real-World-Last zu passen.
Tesseract
2025-11-29, 21:29:25
5800X3D
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94725&stc=1&d=1764448110
aufkrawall
2025-11-29, 21:35:49
Lief der mit unter 4GHz? Mein 5700X PBO/CO geht auf 4,45 runter bei 120-125W.
Ideen für Version 2.0: Skalar vs. AVX sowie einen weiteren Workload näher an echtem Kompilieren für den Benchmark-Modus im UI direkt auswählbar machen. Aber die Reihenfolge stimmte schon so, erstmal musste die Auslastung auf verschiedenen CPUs generell passen.
Tesseract
2025-11-29, 21:48:23
so um die 4GHz. der ist im HTPC und läuft da mit solchen lasten in den thermal throttle. heavy crunching und vcache über der logic ist... suboptimal.
x-force
2025-11-29, 21:51:51
Mein 5700X PBO/CO geht auf 4,45 runter bei 120-125W.
7800x3d geht auf 4,8 runter bei 75w -> 110k
mit prime kann man ihn unter 4,5 drücken.
hier kommt man langsam mit oc/uv in bereiche, in denen sich pseudo von rockstable trennt und der effektive takt zu beachten ist.
user77
2025-11-29, 22:01:04
Ryzen 7 5800X3D (no cap 142W, -30 curve) -> um die 85,5k bei 4,35Ghz
bei 100W cap 4,30Ghz -> 85,3k
bei 90W cap 4,18Ghz -> 83,1k
bei 75W cap 3,86Ghz -> 76,4k
bei 4GHz cap 78W -> 79,2k
PS: zeigt bei Euch Windows Taskmanager teilweise auch 110% CPU Auslastung an?
aufkrawall
2025-11-29, 22:34:05
Ryzen 7 5800X3D (no cap 142W, -30 curve) -> um die 85,5k bei 4,35Ghz
bei 100W cap 4,30Ghz -> 85,3k
Schon besser. Aber auch etwas schräg, dass der 5700X trotzdem leicht vorne liegt. Den Tray gab es schon für ca. 100€.
PS: zeigt bei Euch Windows Taskmanager teilweise auch 110% CPU Auslastung an?
Ja, ist ein Haufen Kacke. Er zeigt auch weniger als 100% Gesamtauslastung an, obwohl im selben Fenster rechts daneben jeder einzelne Thread bei 100% festgetackert ist. Mit der Firma stimmt etwas nicht.
user77
2025-11-29, 22:48:01
Schon besser. Aber auch etwas schräg, dass der 5700X trotzdem leicht vorne liegt. Den Tray gab es schon für ca. 100€.
welche temps hast du, meiner bleibt bei ca. 82-83° mit einer 120er AIO.
Er startet mit 4,45Ghz, pendelt sich aber bei 4,35Ghz ein. Ryzen Master zeigt aber auch nur 78% von 142W an, was 110W wären.
Evtl. drosselt mein ITX Board? GIGABYTE B550I AORUS Pro AX
VRM-Design: 6+2, 8 virtuelle CPU-Phasen (6+2), 8 reale CPU-Phasen (6+2)
MOSFETs VCORE: 6x 90A ISL99390 (SPS)
MOSFETs SOC/VCCGT: 2x 90A ISL99390 (SPS)
PWM-Controller: RAA229004 (max. 8 Phasen)
aufkrawall
2025-11-30, 01:11:58
welche temps hast du, meiner bleibt bei ca. 82-83€ mit einer 120er AIO.
Um die 85°C mit LK.
Er startet mit 4,45Ghz, pendelt sich aber bei 4,35Ghz ein. Ryzen Master zeigt aber auch nur 78% von 142W an, was 110W wären.
Evtl. drosselt mein ITX Board? GIGABYTE B550I AORUS Pro AX
Bei mir schwanken die Taktraten minimal, die 4,45GHz ändern sich aber über die Zeit nicht.
Ansonsten kann es bei Ryzens intern natürlich auch Clock Stretching geben. Würde nicht sagen, dass dein Board drosselt, wenn die angezeigte Taktrate nicht niedrig ist.
Vorschau auf Version 2.0 mit auswählbarem Rechenpfad und neuem realistischerem Skalar:
https://s1.directupload.eu/images/251130/temp/zr6hdl9c.jpg (https://www.directupload.eu/file/d/9119/zr6hdl9c_jpg.htm)
Die alten Pfade bleiben weiterhin vergleichbar zu Version 1.0. Aber erstmal wieder mit Raptor Lake Skalierung gegenüber 5700X abklopfen...
lilgefo~
2025-11-30, 01:17:15
https://s1.directupload.eu/images/251130/u2mgqww2.png
Hmm, hat sich ja nix geändert. X3D avg fps boost extrem schlecht, arrow lake mt booster extrem gut, raptor lake beste für games und minfps
1 apple m4 wär noch interessant zu sehen
edit: ergebnis mit 14900kf
misterh
2025-11-30, 01:25:43
285K @ 65w + 8400CL38
https://s1.directupload.eu/images/user/251130/o455p7kx.png
285K @ 100w + 8400CL38
https://s1.directupload.eu/images/user/251130/rbfgn8yd.png
RoNsOn Xs
2025-11-30, 12:13:49
265K @ stock
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94735&stc=1&d=1764528577
13600k @stock
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94729&stc=1&d=1764504636
aufkrawall
2025-11-30, 17:57:41
2x das gleiche Bild?
Version 2.0 mit realistischerem Skalar-Pfad standardmäßig für Benchmark (heizt nicht mehr so, ist aber indirekt Absicht):
https://github.com/aufkrawall/Shader-Stress/releases/tag/2.0
5700X: 3,8k
https://s1.directupload.eu/images/251130/temp/7m5d6opv.jpg (https://www.directupload.eu/file/d/9119/7m5d6opv_jpg.htm)
13700K: 7,3k
Schreibt jetzt auch die Benchmark-Run-Werte in die Logdatei usw. I bims zufrieden.
RoNsOn Xs
2025-11-30, 19:03:40
Oops, die hatten beide den gleichen Namen. 265k @ ~225k
2.0: scalar
265k @stock
9,3K
Shader Stress 2.0 Benchmark Result
CPU: Intel(R) Core(TM) Ultra 7 265K
Workload: Scalar real.
----------------------------------------
Minute 1: 9.3k Jobs/s
Minute 2: 9.3k Jobs/s
Minute 3: 9.3k Jobs/s
----------------------------------------
WINNER: Interval 2 (9.3k Jobs/s)
aufkrawall
2025-11-30, 20:01:54
Cool, ARL regelt. :up:
Dürfte bei dem Workload in dem Preisbereich alles andere killen.
misterh
2025-11-30, 20:47:48
Shader Stress 2.0 Benchmark Result
CPU: Intel(R) Core(TM) Ultra 9 285K
Workload: Scalar real.
----------------------------------------
Minute 1: 11.2k Jobs/s
Minute 2: 11.1k Jobs/s
Minute 3: 11.1k Jobs/s
----------------------------------------
WINNER: Interval 1 (11.2k Jobs/s)
user77
2025-11-30, 20:52:57
Ryzen 7 5800X3D (no cap 142W, -30 curve)
wieder nur 71% vom Powertarget... :confused:
https://i.ibb.co/4RSDpGHP/Screenshot-2025-11-30-205110.png
Tesseract
2025-11-30, 21:01:01
9800X3D
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94741&stc=1&d=1764532837
aufkrawall
2025-11-30, 21:18:34
Ryzen 7 5800X3D (no cap 142W, -30 curve)
wieder nur 71% vom Powertarget... :confused:
Steht höchstwahrscheinlich außerhalb meiner Macht. Es skaliert bislang über alle CPUs optimal im zu erwartenden Rahmen, bzw. ziemlich vergleichbar zum Vorgänger pybecrasher mit dxcompiler direkt von Microsoft. Bei Phoronix gibt es auch diverse Kompilier-Tests, wo der 5800X3D ca. die gleiche Leistung wie der 5800X zeigt:
https://openbenchmarking.org/result/2204253-NE-RYZEN758019
Also bislang kein Grund anzunehmen, dass irgendetwas nicht richtig funktioniert.
x-force
2025-11-30, 22:42:30
7800x3d geht auf 4,8 runter bei 75w -> 110k
mit prime kann man ihn unter 4,5 drücken.
hier kommt man langsam mit oc/uv in bereiche, in denen sich pseudo von rockstable trennt und der effektive takt zu beachten ist.
liegt nun bei 4,88 ghz und 72w -> 4,2k
avx2 last ist minimal höher als avx512
misterh
2025-11-30, 23:09:53
Shader Stress 2.0 Benchmark Result
CPU: Snapdragon X Elite (X1E780100) @ 3.41GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 2.6k Jobs/s
Minute 2: 2.4k Jobs/s
Minute 3: 2.4k Jobs/s
----------------------------------------
WINNER: Interval 1 (2.6k Jobs/s)
aufkrawall
2025-11-30, 23:11:48
avx2 last ist minimal höher als avx512
Der Verbrauch oder die Performance? Zen 4 hat ja nur Half-Rate AVX-512.
Ansonsten spannend, dass mit Scalar (realistic) der Sprung von Zen 4 3D auf Zen 5 3D wesentlich größer ist als von Zen 3 auf Zen 4 3D. Gut, dafür zieht meine CPU auch immer noch 110W dabei. Der 13700K ist mit 225W auch noch relativ gut dabei.
Cool, jetzt haben wir auch ARM. :)
Ich versuch mich mal zeitnah um ein natives arm64 Build zu bemühen. Mit etwas Glück null Aufwand.
misterh
2025-11-30, 23:24:07
und noch schnell über Parallels Desktop
Shader Stress 2.0 Benchmark Result
CPU: APPLE M3 MAX 16C/40GB @ 3.07GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 3.3k Jobs/s
Minute 2: 3.4k Jobs/s
Minute 3: 3.5k Jobs/s
----------------------------------------
WINNER: Interval 1 (3.5k Jobs/s)
aufkrawall
2025-11-30, 23:27:08
Was ist der SoC-Verbrauch der beiden ARM-CPUs?
misterh
2025-11-30, 23:32:12
nicht angeschlossen, denke mal zwischen 100 und 120w auf macbook pro.
und diesmal über VMware Fusion Pro
Shader Stress 2.0 Benchmark Result
CPU: APPLE M3 MAX 16C/40GB @ 2.00GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 3.4k Jobs/s
Minute 2: 3.5k Jobs/s
Minute 3: 3.6k Jobs/s
----------------------------------------
WINNER: Interval 1 (3.6k Jobs/s)
x-force
2025-11-30, 23:45:56
Der Verbrauch oder die Performance? Zen 4 hat ja nur Half-Rate AVX-512.
der takt ist minimal (1-2 steps) niedriger, verbrauch höher, performance besser:
avx2 -> 115k
avx512 -> 97k
Ansonsten spannend, dass mit Scalar (realistic) der Sprung von Zen 4 3D auf Zen 5 3D wesentlich größer ist als von Zen 3 auf Zen 4 3D. Gut, dafür zieht meine CPU auch immer noch 110W dabei. Der 13700K ist mit 225W auch noch relativ gut dabei.
müsste man mal taktbereinigt betrachten.
vielleicht liefert tesseract noch takt und verbrauch nach.
zen3 3d 4,36 ghz -> 3,8k jobs/s@75w -> 0,87 jobs/s/mhz 50,6 jobs/s/w
zen4 3d 4,88 ghz -> 4,2k jobs/s@72w -> 0,86 jobs/s/mhz 58,3 jobs/s/w
zen5 3d x,xx ghz -> 5,9k jobs/s@xxw ->
aufkrawall
2025-11-30, 23:46:44
2.1 mit arm64 Build, x86 sollte keine Veränderungen zeigen:
https://github.com/aufkrawall/Shader-Stress/releases/tag/2.1
misterh
2025-11-30, 23:57:27
so hier erneut mit Parallels Desktop
Shader Stress 2.1-Universal Benchmark Result (ARM64)
CPU: APPLE M3 MAX 16C/40GB @ 3.07GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 5.4k Jobs/s
Minute 2: 5.4k Jobs/s
Minute 3: 5.5k Jobs/s
----------------------------------------
WINNER: Interval 1 (5.5k Jobs/s)
aufkrawall
2025-12-01, 00:04:51
Cool, es funktioniert. War die Taktangabe von 2GHz mit dem x86-Build falsch?
Ok, lag wohl an vmware? Ob das ein guter Score im Vergleich zu den x86-CPUs ist, hinge wohl vom Verbrauch ab.
misterh
2025-12-01, 00:13:49
liegt an VMware Fusion
hab ja jeweils vor @ angepasst. Sonst steht ja "Virtual CPU @"
bei ARM64 steht nur "ARM64 Processor" die ich ja ebenso angepasst habe danach.
Shader Stress 2.1-Universal Benchmark Result (ARM64)
CPU: Snapdragon X Elite (X1E780100) @ 3.41GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 3.0k Jobs/s
Minute 2: 2.9k Jobs/s
Minute 3: 3.0k Jobs/s
----------------------------------------
WINNER: Interval 1 (3.0k Jobs/s)
aufkrawall
2025-12-01, 00:26:24
Schon sehr cool hier auch ARMs zu haben. Dann sieht man auch gleich, was die Emulation kostet. Wenn Prism AVX2-Emulation unterstützt, kann man auch direkt sehen, wie sich das vs. Scalar auswirkt.
Mit Scalar (realistic) verlier ich in Wine etwas Performance:
https://www.forum-3dcenter.org/vbulletin/showpost.php?p=13846791&postcount=16
3,6k:
https://s1.directupload.eu/images/251201/temp/xc47m25h.png (https://www.directupload.eu/file/d/9120/xc47m25h_png.htm)
Aber ist nichts vs. die x86-Emulation. Dafür hab ich ja den ganzen Aufwand mit der kompletten Simulation anstatt dxc gemacht, dass man das auch in Wine ohne ständige Crashes vergleichen kann. :)
Tesseract
2025-12-01, 00:59:29
müsste man mal taktbereinigt betrachten.
vielleicht liefert tesseract noch takt und verbrauch nach.
zen3 3d 4,36 ghz -> 3,8k jobs/s@75w -> 0,87 jobs/s/mhz 50,6 jobs/s/w
zen4 3d 4,88 ghz -> 4,2k jobs/s@72w -> 0,86 jobs/s/mhz 58,3 jobs/s/w
zen5 3d x,xx ghz -> 5,9k jobs/s@xxw ->
5,26 GHz bei ca. 143W PPT, takt ist +200 und voltage -10, sonst alles default.
x-force
2025-12-01, 01:12:41
5,26 GHz bei ca. 143W PPT, takt ist +200 und voltage -10, sonst alles default.
zen3 3d 4,36 ghz -> 3,8k jobs/s@75w -> 0,87 jobs/s/mhz 50,6 jobs/s/w
zen4 3d 4,88 ghz -> 4,2k jobs/s@72w -> 0,86 jobs/s/mhz 58,3 jobs/s/w
zen5 3d 5,26 ghz -> 5,9k jobs/s@143w -> 1,12 jobs/s/mhz 41,1 jobs/s/w
zen 5 dreht den hahn auf.
edit:
apple m3 3,07 ghz -> 5,5k jobs/s@81w -> 0,9 jobs/s/mhz 67,9 jobs/s/w
jobs/s/mhz hier halbiert, da doppelte kerne
misterh
2025-12-01, 01:13:29
Ob das ein guter Score im Vergleich zu den x86-CPUs ist, hinge wohl vom Verbrauch ab.
Macbook Pro 16" M3 MAX + 48GB aber für Win on ARM 40GB eingestellt.
Parallels Desktop
Idle : 10-12w
64bit : 73-76w (3.5k/s)
ARM64 : 79-83w (5.5k/s)
Verbrauch ganze Laptop ausgelesen.
aufkrawall
2025-12-01, 01:16:35
Ok, das wäre den Werten von Tesseract nach mal eben irgendwas um die Größenordnung der doppelten Effizienz vs. Zen 5. :freak:
Wobei das bei den Werten von Cubitus anders aussieht. Wahrscheinlich also das PPT nicht ausgereizt.
Cubitus
2025-12-01, 01:18:17
Ryzen 9800X3D
https://i.postimg.cc/Wb9g38QX/Screenshot-2025-12-01-011046.png (https://postimg.cc/mtHtpYZH)
Meine PBO Settings
https://i.postimg.cc/xj6cyCgW/Screenshot-2025-12-01-011709.png (https://postimages.org/)
x-force
2025-12-01, 01:22:09
Ok, das wäre den Werten von Tesseract nach mal eben irgendwas um die Größenordnung der doppelten Effizienz vs. Zen 5. :freak:
siehe mein edit, es sind +65%, was am betriebspunkt, und/oder falscher auslesung bei tesseract liegen dürfte.
zu zen4 sind es nur noch +16,5%.
vielleicht übernimmst du die werte in den startpost?
zen3 3d 4,36 ghz -> 3,8k jobs/s@75w -> 0,87 jobs/s/mhz 50,6 jobs/s/w
zen4 3d 4,88 ghz -> 4,2k jobs/s@72w -> 0,86 jobs/s/mhz 58,3 jobs/s/w
zen5 3d 5,26 ghz -> 5,9k jobs/s@143w -> 1,12 jobs/s/mhz 41,1 jobs/s/w (tesseract)
zen5 3d 5,23 ghz -> 5,8k jobs/s@109w -> 1,11 jobs/s/mhz 53,21 jobs/s/w (cubitus)
apple m3 3,07 ghz -> 5,5k jobs/s@81w -> 0,9 jobs/s/mhz 67,9 jobs/s/w
jobs/s/mhz hier halbiert, da doppelte kerne. verbrauch kompletter laptop.
müsstest du vielleicht nochmal sauber pro kern umrechnen
misterh
2025-12-01, 01:30:37
man kann ja nicht so vergleichen?
zen3 bis zen5 sind ja only CPU Angabe an verbrauch?
M3 Max ist aber ganze Laptop. Only CPU wäre ja dann weniger als 74.5w bzw. 81w?
x-force
2025-12-01, 01:41:38
zen3 bis zen5 sind ja only CPU Angabe an verbrauch?
ja, wobei idle bei mir schon 20w verbraten werden.
M3 Max ist aber ganze Laptop. Only CPU wäre ja dann weniger als 74.5w bzw. 81w?
ne, das wären äpfel und birnen ;)
gibts für mac auch etwas wie hwinfo, das genauere daten liefert?
aufkrawall
2025-12-01, 01:48:17
vielleicht übernimmst du die werte in den startpost?
Ja, mach ich noch. Aber wär schon gut, wenn man wirklich immer unmissverständlich den durchschnittlichen Package-Verbrauch mit angibt, sofern auslesbar.
misterh
2025-12-01, 01:55:19
gibts für mac auch etwas wie hwinfo, das genauere daten liefert?
Hab nur hwinfo pro und nur das wird erkannt. und bei App außerhalb Windows hab ich mir keine gekauft. Werde auch nicht holen.
https://s1.directupload.eu/images/user/251201/86malsrf.png
Edit : Hab passend gefunden für Mac (Mac Power Monitor)
M3 MAX (12x P-Core, 4x E-Core)
P-Core 4056Mhz und E-Core 2568Mhz sowie only CPU zwischen 62 und 64w (ARM64)
Edit2: 285K + 8400CL38 : 11,2k/s -> 263-279w
Darkman.X
2025-12-01, 03:33:47
i9-14900K @ Performance-Profil
242 bis 253 W laut HWiNFO.
Shader Stress 2.1:
Shader Stress 2.1-Universal Benchmark Result
CPU: Intel(R) Core(TM) i9-14900K
Workload: Scalar real.
----------------------------------------
Minute 1: 9.8k Jobs/s
Minute 2: 9.8k Jobs/s
Minute 3: 9.8k Jobs/s
----------------------------------------
WINNER: Interval 1 (9.8k Jobs/s)
Tesseract
2025-12-01, 08:25:16
siehe mein edit, es sind +65%, was am betriebspunkt, und/oder falscher auslesung bei tesseract liegen dürfte.
zu zen4 sind es nur noch +16,5%.
die spannung geht hier auf 1.26V hoch was gegenüber schwankenden ~1.16V schon ein deutlicher unterschied ist. ist einfach ein anderer betriebspunkt.
edit: 75W PPT -> 4.8k; 65W PPT -> 4.3k; 55W PPT -> 3.8k; 45W PPT -> 3.3k, jeweils 1 min
Sonyfreak
2025-12-01, 11:29:12
Shader Stress 2.1-Universal Benchmark Result
CPU: 12th Gen Intel(R) Core(TM) i9-12900H
Workload: Scalar real.
----------------------------------------
Minute 1: 3.3k Jobs/s (Thermal throttle)
Minute 2: 2.9k Jobs/s
Minute 3: 2.9k Jobs/s
Shader Stress 2.1-Universal Benchmark Result
CPU: Intel(R) Core(TM) i9-7980XE CPU @ 2.60GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 5.7k Jobs/s
Minute 2: 5.7k Jobs/s
Minute 3: 5.7k Jobs/s
mfg.
Sonyfreak
x-force
2025-12-01, 12:12:59
die spannung geht hier auf 1.26V hoch was gegenüber schwankenden ~1.16V schon ein deutlicher unterschied ist. ist einfach ein anderer betriebspunkt.
edit: 75W PPT -> 4.8k; 65W PPT -> 4.3k; 55W PPT -> 3.8k; 45W PPT -> 3.3k, jeweils 1 min
dann kosten die letzten 0,1k 34 watt :D (vgl. cubitus)
wärst du so nett und guckst nochmal wie viel spannung und takt bei dem 4,3k run anliegt?
bei meinem zen4 3d sind 1,019v für 4,88ghz nötig, was dann zu 4,2k bei 71w ppt führt.
zen4 3d darf ja bis 1,1v. ich würde gerne wissen, was da im hintergrund limitiert. temp, ppt, edc, tdc und vcore sind es nicht.
muss wohl ein strom sein, der warum auch immer, nicht über edc abgebildet wird.
Ja, mach ich noch. Aber wär schon gut, wenn man wirklich immer unmissverständlich den durchschnittlichen Package-Verbrauch mit angibt, sofern auslesbar.
die übrigen werte sollten ppt sein.
ich habe mich gerade gewundert weshalb das system auf einmal laggy ist... du hast offenbar vergessen einen stop nach der dritten minute einzubauen ;)
Cubitus
2025-12-01, 16:51:23
dann kosten die letzten 0,1k 34 watt :D (vgl. cubitus)
Das sind schon fast 5090 Effzienz-Verhältnisse ;D
Mit ordentlicher Einzelcore-Optmierung bekommt man den 9800X3D Hitzkopf schon gut gezähmt. :)
aufkrawall
2025-12-01, 16:56:53
ich habe mich gerade gewundert weshalb das system auf einmal laggy ist... du hast offenbar vergessen einen stop nach der dritten minute einzubauen ;)
Ist Absicht, damit man optional auch die reine Compile-Last länger als Stresstest laufen lassen kann.
Tesseract
2025-12-01, 17:57:07
wärst du so nett und guckst nochmal wie viel spannung und takt bei dem 4,3k run anliegt?
hängt natürlich vom voltage offset ab, mit -10 ca. 3950MHz/0.915V/65W PPT, mit -30 sind es ca. 4GHz/0.855V/60W PPT. damit ist man dann schon effizinter als der M3. :D
aufkrawall
2025-12-01, 19:49:36
Ich hatte übrigens ARM und Apple/Qualcomm in den Prompts für die Workloads nicht explizit benannt. Kann sein, dass da noch Potenzial vorhanden ist. Muss aber nicht.
Ich hatte es auch schon nativ für Linux und macOS kompiliert, aber Clang ist viel aggressiver als MSVC bei Optimierungen, was die Werte zumindest für die synthetischen Workloads nicht mehr vergleichbar macht. Scalar (realistic) war aber nicht schneller als Wine.
Mit einer Version 3.0 mit Cross-Platform/Compiler-Support und weiteren Optimierungen wird daher vermutlich die Vergleichbarkeit zu den alten Versionen nicht mehr gegeben sein. Aber erst in ein paar Wochen, wenn ich wieder Opus-Prompts habe.
x-force
2025-12-01, 23:20:07
hängt natürlich vom voltage offset ab, mit -10 ca. 3950MHz/0.915V/65W PPT, mit -30 sind es ca. 4GHz/0.855V/60W PPT. damit ist man dann schon effizinter als der M3. :D
da hat amd mal eben von n5 auf n4x 28% mehr transistoren auf minimal kleinere fläche gequetscht und in +22% ipc leistung umgesetzt.
jetzt bitte nochmal die gleiche übung und die fläche verdoppeln... wäre immer noch monolitisch ne ecke kleiner als intel mit dem 285.
Cubitus
2025-12-02, 00:41:13
Zweitsystem aus der alten Heimat
13600K, leicht übertaktet + UV mit Loadline Level 4.
Sparsam und Workload kann er :)
https://i.postimg.cc/1XqtZ2fY/Screenshot-2025-12-02-003400.png (https://postimg.cc/ZvJZ8fPr)
Gebrechlichkeit
2025-12-02, 16:42:55
templimit (<65º)
benchmark, auto
Shader Stress 2.1-Universal Benchmark Result
CPU: Intel(R) Core(TM) i5-10400 CPU @ 2.90GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 46.4k Jobs/s
Minute 2: 46.5k Jobs/s
Minute 3: 46.1k Jobs/s
----------------------------------------
WINNER: Interval 2 (46.5k Jobs/s)
benchmark, scalar
Shader Stress 2.1-Universal Benchmark Result
CPU: Intel(R) Core(TM) i5-10400 CPU @ 2.90GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 1.5k Jobs/s
Minute 2: 1.5k Jobs/s
Minute 3: 1.4k Jobs/s
----------------------------------------
WINNER: Interval 1 (1.5k Jobs/s)
no templimit (>85º)
benchmark, auto
Shader Stress 2.1-Universal Benchmark Result
CPU: Intel(R) Core(TM) i5-10400 CPU @ 2.90GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 63.3k Jobs/s
Minute 2: 57.7k Jobs/s
Minute 3: 57.6k Jobs/s
----------------------------------------
WINNER: Interval 1 (63.3k Jobs/s)
benchmark, scalar
Shader Stress 2.1-Universal Benchmark Result
CPU: Intel(R) Core(TM) i5-10400 CPU @ 2.90GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 2.1k Jobs/s
Minute 2: 2.1k Jobs/s
Minute 3: 2.0k Jobs/s
----------------------------------------
WINNER: Interval 2 (2.1k Jobs/s)
aufkrawall
2025-12-02, 17:27:13
Gibt offenbar einen Bug im Logging, dass er den Modus nicht korrekt benennt. Investigaten...
Anekdote: Mit der nativen Linux-Version bzw. dem Compiler-Wechsel (betrifft nicht die releasten Versionen) lief der AVX2-Pfad nicht mehr mit hohem Verbrauch, Ergebnis also komische 100% Allcore-Last auf allen Kernen bei nur 70W. Dadurch boostete offenbar mein 5700X zu hoch und das System verabschiedete sich mehrfach sofort mit Reboot. :freak: Ohne Custom PBO-Einstellungen crashte es dann nicht mehr.
Ist in über zwei Jahren realen Nutzungsszenarien und anderen Stresstests noch nicht einmal vorgekommen. :eek:
Vielleicht auch eine lustige Idee als Modus.
2.2 (keine Änderung der Performance):
https://github.com/aufkrawall/Shader-Stress/releases/tag/2.2
Moin!
Ich habe v2.2 schnell auf meinem sekundären Testrechner laufen lassen:
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94759&stc=1&d=1764751427
Core i9-14900K ohne SMT, dafür mit mildem Undervolting, "offener" Power und DDR5-7200 unter einem frischen Windows 11 25H2. Verglichen mit Darkman.X (https://www.forum-3dcenter.org/vbulletin/showpost.php?p=13846956&postcount=45) im Nachteil – SMT hilft also (erwartungsgemäß). :)
MfG
Raff
Colin MacLaren
2025-12-03, 20:54:29
GPD Win5 @75W.
aufkrawall
2025-12-03, 21:02:08
Verglichen mit Darkman.X (https://www.forum-3dcenter.org/vbulletin/showpost.php?p=13846956&postcount=45) im Nachteil – SMT hilft also (erwartungsgemäß). :)
Jo. Mit HT wäre ein 285K allen noch enteilter als ohnehin schon.
Auch mal im Bios für den 5700X abschalten...
Shader Stress 2.2 Benchmark Result
OS: Windows | Arch: x64
CPU: AMD Ryzen 9 5950X 16-Core Processor
Workload: Scalar real.
----------------------------------------
Minute 1: 5.1k Jobs/s
Minute 2: 5.2k Jobs/s
Minute 3: 5.2k Jobs/s
Ryzen 9 5950X @ 16C/16T (kein SMT), 90W-Eco-ULV-Mode, DDR4-3600 (1T)
MfG
Raff
x-force
2025-12-04, 00:10:16
Core i9-14900K ohne SMT
Ryzen 9 5950X @ 16C/16T (kein SMT)
hab ich was verpasst, oder ist das ein anachronismus aufgrund von zweit und drittrechner, oder theoretische betrachtungen?
Colin MacLaren
2025-12-04, 06:37:02
Update: GPD Win 5@85W und -30mv Undervolting.
hab ich was verpasst, oder ist das ein anachronismus aufgrund von zweit und drittrechner, oder theoretische betrachtungen?
Ich habe einen Privatrechner und zwei grundverschiedene Testsysteme im 24/7-Office-Lab. :)
Oder spielst du gezielt auf "SMT off" an? Das ist eine Gaming-Optimierung, bei vielen Kernen ist SMT (leider) immer noch in vielen Fällen etwas langsamer als nur mit "echten" Kernen.
MfG
Raff
hq-hq
2025-12-04, 19:14:17
9800x3d, 5300MHz effektiver Takt, 148Watt Verbrauch, CO -36
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94779&stc=1&d=17648719648
aufkrawall
2025-12-04, 19:30:03
Oder spielst du gezielt auf "SMT off" an? Das ist eine Gaming-Optimierung, bei vielen Kernen ist SMT (leider) immer noch in vielen Fällen etwas langsamer als nur mit "echten" Kernen.
Aber nur minimal im Durchschnitt und quasi nicht merkbar. Dass bei UE5 mit HT Shader Compile schneller geht oder die anderen Threads weniger beeinträchtigt, ist sicherlich spürbarer. Zumindest auf 8C-CPUs.
Jo, auf 'nem Oktopus würde ich es auch nicht ausmachen, aber bei einem 16-Chor-Knaben überwiegen die (Gaming-)Vorteile bis heute. Bei meinem baldigen 285K habe ich dann keine Wahl mehr. :ugly:
MfG
Raff
lilgefo~
2025-12-05, 01:45:34
https://s1.directupload.eu/images/251205/zlgvhgq7.png
mit v2.2, 14900kf
p.s.: reizt die cpu aber nicht aus, nur bisschen über 300W Powerdraw/220a mit recht konservativem limit bei 380w/400irgendwas A, iwas klemmt da noch in der app
https://s1.directupload.eu/images/251205/kt4mekni.png
BeetleatWar1977
2025-12-06, 10:15:58
Shader Stress 2.2 Benchmark Result
OS: Windows | Arch: x64
CPU: AMD Ryzen 9 5950X 16-Core Processor
Workload: Scalar real.
----------------------------------------
Minute 1: 5.1k Jobs/s
Minute 2: 5.2k Jobs/s
Minute 3: 5.2k Jobs/s
Ryzen 9 5950X @ 16C/16T (kein SMT), 90W-Eco-ULV-Mode, DDR4-3600 (1T)
MfG
Raff
5900X 200W
Shader Stress 2.2 Benchmark Result
OS: Windows | Arch: x64
CPU: AMD Ryzen 9 5900X 12-Core Processor
Workload: Scalar real.
----------------------------------------
Minute 1: 5.9k Jobs/s
Minute 2: 5.9k Jobs/s
Minute 3: 6.0k Jobs/s
----------------------------------------
WINNER: Interval 3 (6.0k Jobs/s)
========================================
5900X 90W
========================================
Shader Stress 2.2 Benchmark Result
OS: Windows | Arch: x64
CPU: AMD Ryzen 9 5900X 12-Core Processor
Workload: Scalar real.
----------------------------------------
Minute 1: 4.7k Jobs/s
Minute 2: 4.6k Jobs/s
Minute 3: 4.7k Jobs/s
----------------------------------------
WINNER: Interval 1 (4.7k Jobs/s)
========================================
Hoschi75
2025-12-08, 16:30:56
9800X3D, 5440Mhz effektiv, 138W
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94811&stc=1&d=1765207824
GaryX
2025-12-08, 23:04:20
5950x
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94816&stc=1&d=1765231386
aufkrawall
2025-12-08, 23:19:05
Die Scalar (realistic)-Werte werden übrigens nach der Portierung zu Clang weiterhin gültig bleiben, inkls. nativer Version für mindestens Linux (und vermutlich auch macOS).
Das Workload-Design war offenbar ein sehr glücklicher Griff, hat Opus gut gemacht. :D
Sonyfreak
2025-12-09, 15:30:10
Xeon W3-2423 (https://www.techpowerup.com/cpu-specs/xeon-w3-2423.c3120#:~:text=The%20Intel%20Xeon%20w3-2423,effectively%20doubled%2C%20to%2012%20threads.) // 2x16GB DDR5-4400 36/36/35/72 (das System hätte eigentlich Quadchannel)
Shader Stress 2.2 Benchmark Result
OS: Windows | Arch: x64
CPU: Intel(R) Xeon(R) w3-2423
Workload: Scalar real.
----------------------------------------
Minute 1: 2.3k Jobs/s
Minute 2: 2.3k Jobs/s
Minute 3: 2.2k Jobs/s
----------------------------------------
WINNER: Interval 1 (2.3k Jobs/s)
mfg.
Sonyfreak
aufkrawall
2025-12-11, 09:11:17
Here we go:
https://github.com/aufkrawall/Shader-Stress/releases/tag/3.0
Mal gucken, ob es Regressions gibt. Der Hash ist auch im Log:
Shader Stress 3.0 Benchmark Result
OS: Windows | Arch: x64
CPU: AMD Ryzen 7 5700X 8-Core Processor
Workload: Scalar real.
----------------------------------------
Minute 1: 3.8k Jobs/s
Minute 2: 3.9k Jobs/s
Minute 3: 3.9k Jobs/s
----------------------------------------
WINNER: Interval 2 (3.9k Jobs/s)
HASH: SS3-30CL13uiknW
https://s1.directupload.eu/images/251211/temp/rocix29p.jpg (https://www.directupload.eu/file/d/9130/rocix29p_jpg.htm)
Die Cross-Platform-Builds spuckt Zig einfach so unter Windows aus. Schon ziemlich cool (/Selbstlob).
Zig kann keine Windows- und macOS-Builds mit LTO kompilieren. Scheint hier aber egal für die Performance zu sein.
aufkrawall
2025-12-11, 10:53:45
SMT off:
Shader Stress 3.0 Benchmark Result
OS: Windows | Arch: x64
CPU: AMD Ryzen 7 5700X 8-Core Processor
Workload: Scalar real.
----------------------------------------
Minute 1: 3.0k Jobs/s
Minute 2: 3.0k Jobs/s
Minute 3: 3.0k Jobs/s
----------------------------------------
WINNER: Interval 1 (3.0k Jobs/s)
HASH: SS3-3j1nYOK4UyM
SMT bringt bei dem 5700X also 30% mehr Performance, bei genau 10% höherem Verbrauch (110 statt 100W).
Linux-Version mit SMT ist etwas langsamer, kein Unterschied zu Wine:
OS: Linux
Architecture: x64
CPU: AMD Ryzen 7 5700X 8-Core Processor
[10:37:41.835] Config auto-selected: Benchmark Scalar Realistic (Forced)
[10:38:42.843] Benchmark Minute 1: 3.7k Jobs/s | Hash: SS3-2lvxzA1anX4
misterh
2025-12-11, 11:29:11
Shader Stress 3.0 Benchmark Result
OS: Windows | Arch: ARM64
CPU: Apple M3 MAX 16C/40GB
Workload: Scalar real.
----------------------------------------
Minute 1: 5.7k Jobs/s
Minute 2: 5.7k Jobs/s
Minute 3: 5.7k Jobs/s
----------------------------------------
WINNER: Interval 1 (5.7k Jobs/s)
HASH: SS3-1O665Hy9Qwu
MacOS wird kein TXT erstellt daher kann ich nur werte nennen. Alle 3 wurde 4.5k Jobs/s erreicht.
Shader Stress 3.0 Benchmark Result
OS: Windows | Arch: x64
CPU: Intel(R) Core(TM) Ultra 9 285K
Workload: Scalar real.
----------------------------------------
Minute 1: 10.6k Jobs/s
Minute 2: 10.6k Jobs/s
Minute 3: 10.5k Jobs/s
----------------------------------------
WINNER: Interval 1 (10.6k Jobs/s)
HASH: SS3-9bbbgdfcVDQ
aufkrawall
2025-12-11, 11:51:08
MacOS wird kein TXT erstellt daher kann ich nur werte nennen. Alle 3 wurde 4.5k Jobs/s erreicht.
Ist mit der Linux-Version nicht so, interessant. Sollte fixbar sein.
Aber immerhin leicht schneller als mit dem API-Wrapper.
Edit: Wait, die native macOS-Version ist langsamer. Kurios.
aufkrawall
2025-12-11, 16:15:17
Bugfix 3.1:
https://github.com/aufkrawall/Shader-Stress/releases/tag/3.1
Noch einen Bug gefixt, der mit den nativen Versionen für Linux und macOS Leistung gekostet hat. Linux jetzt leicht schneller als Windows:
Shader Stress 3.1 Benchmark Result
OS: Linux | Arch: x64
CPU: AMD Ryzen 7 5700X 8-Core Processor
Workload: Scalar real.
----------------------------------------
Minute 1: 4.0k Jobs/s
Minute 2: 4.0k Jobs/s
Minute 3: 4.0k Jobs/s
----------------------------------------
WINNER: Interval 3 (4.0k Jobs/s)
HASH: SS3-2vPpj0g3rwE
Außerdem Zig direkt von der Quelle bezogen, die msys2-Version hatte ein komisches libc-Mismatch. Jetzt ist auch LTO mit dem Windows-Build damit genutzt.
(Was ein Krampf. :freak: )
misterh
2025-12-11, 18:16:57
kriege nur so. also ohne TXT Speicherung. Und Leistung bleibt gleich.
MacOS ARM64
https://s1.directupload.eu/images/user/251211/rx4uuwv6.png
aufkrawall
2025-12-11, 18:19:25
Kann ich wahrscheinlich nicht ändern. macOS- und Linux-Build sind sich wesentlich ähnlicher als Windows und Linux, und Linux läuft normal.
Sonyfreak
2025-12-11, 21:24:59
Intel Core i9 12900KS @ 8C/16T // UV @ 60W PL1/100W PL2
2x 16GB Kingston Fury @ DDR5-5400 36/39/39/78 // 1,27V
========================================
Shader Stress 3.1 Benchmark Result
OS: Linux | Arch: x64
CPU: 12th Gen Intel(R) Core(TM) i9-12900KS
Workload: Scalar real.
----------------------------------------
Minute 1: 4.0k Jobs/s
Minute 2: 3.3k Jobs/s
Minute 3: 3.3k Jobs/s
mfg.
Sonyfreak
aufkrawall
2025-12-12, 14:58:39
3.2:
https://github.com/aufkrawall/Shader-Stress/releases/tag/3.2
Scores könnten durch Optimierungen leicht höher sein. Es hat mir jedenfalls unter Linux mit den synthetischen Modi sofort die Kiste rebootet, dort zeigt der Power-Sensor auch mit 130W höhere Werte als unter Windows an. Mit PBO CO -20 statt -30 scheint es zu laufen. Crazy, die CPU lief damit bald drei Jahre ohne Crashes in realen Anwendungen und anderen Stresstests. :freak:
Sonyfreak
2025-12-13, 15:41:12
Intel Core i9 12900KS @ 8C/16T // UV @ 60W PL1/100W PL2
2x 16GB Kingston Fury @ DDR5-5400 36/39/39/78 // 1,27V
========================================
Shader Stress 3.2 Benchmark Result
OS: Linux | Arch: x64
CPU: 12th Gen Intel(R) Core(TM) i9-12900KS
Workload: Scalar real.
----------------------------------------
Minute 1: 4.1k Jobs/s
Minute 2: 3.6k Jobs/s
Minute 3: 3.6k Jobs/s
Die neue Version ist offenbar deutlich performanter. Stabilitätsprobleme habe ich trotz langwierig ausgetüfteltem Undervolting keine. :smile:
mfg.
Sonyfreak
Schrotti
2025-12-13, 16:39:16
Hier mein 285K PL1: 65W PL2: 105W
https://s1.directupload.eu/images/251213/temp/5hhi4rbe.jpg (https://www.directupload.eu/file/d/9132/5hhi4rbe_jpg.htm)
Lifestream lief noch nebenbei.
aufkrawall
2025-12-13, 16:47:40
Die neue Version ist offenbar deutlich performanter. Stabilitätsprobleme habe ich trotz langwierig ausgetüfteltem Undervolting keine. :smile:
Jap. War wahrscheinlich ein Bug, laut Opus ist der Workload immer noch optimal. Die geringere Performance in Wine ist jetzt auch weg, läuft mir jetzt etwas schneller als Windows nativ und vergleichbar zu Linux nativ.
3.4 (gleich gebliebene Scalar (Realistic)-Performance):
https://github.com/aufkrawall/Shader-Stress/releases/tag/3.4
Sollte jetzt mit AVX2/AVX-512 mehr heizen, CPU geht mir sofort auf 90°C. Mit etwas Glück heizt das Half-Rate AVX-512 auf Zen 4 jetzt auch besser als AVX2.
misterh
2025-12-13, 18:03:42
Shader Stress 3.4 Benchmark Result
OS: Windows | Arch: ARM64
CPU: Microsoft SQ1 @ 3.0 GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 1.2k Jobs/s
Minute 2: 1.2k Jobs/s
Minute 3: 1.2k Jobs/s
----------------------------------------
WINNER: Interval 2 (1.2k Jobs/s)
HASH: SS3-NuOf982sdFefLqrk
Shader Stress 3.4 Benchmark Result
OS: Windows | Arch: ARM64
CPU: Snapdragon X Elite X1E78100
Workload: Scalar real.
----------------------------------------
Minute 1: 3.2k Jobs/s
Minute 2: 3.3k Jobs/s
Minute 3: 3.2k Jobs/s
----------------------------------------
WINNER: Interval 2 (3.3k Jobs/s)
HASH: SS3-NuOTjtlqQHzhtvZj
Shader Stress 3.4 Benchmark Result
OS: Windows | Arch: ARM64
CPU: Apple M3 MAX 16C/40GB
Workload: Scalar real.
----------------------------------------
Minute 1: 5.2k Jobs/s
Minute 2: 5.2k Jobs/s
Minute 3: 5.2k Jobs/s
----------------------------------------
WINNER: Interval 1 (5.2k Jobs/s)
HASH: SS3-NuP1kmZd4NyTG8MG
Also wieder langsamer mit 3.4?
Shader Stress 3.4 Benchmark Result
OS: Windows | Arch: x64
CPU: Intel(R) Core(TM) Ultra 9 285K
Workload: Scalar real.
----------------------------------------
Minute 1: 9.7k Jobs/s
Minute 2: 9.7k Jobs/s
Minute 3: 9.6k Jobs/s
----------------------------------------
WINNER: Interval 1 (9.7k Jobs/s)
HASH: SS3-NtDKQfT1oruDTTOT
Saugbär
2025-12-14, 01:45:11
--- Session Start (v3.4) ---
OS: Windows | Arch: x64
CPU: 11th Gen Intel(R) Core(TM) i7-11800H @ 2.30GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 3.4k Jobs/s
Minute 2: 3.2k Jobs/s
Minute 3: 3.2k Jobs/s
----------------------------------------
WINNER: Interval 1 (3.4k Jobs/s)
HASH: SS3-NtQ2r6ZYPXbo7w1w
========================================
[23:20:2.58] Benchmark Finished. Hash: SS3-NtQ2r6ZYPXbo7w1w
[23:20:48.581] State changed: STOPPED
[23:22:22.625] User changed ISA to: AVX-512 (Forced)
[23:22:32.155] State changed: STARTED
[23:23:32.948] Benchmark Minute 1: 86.8k Jobs/s | Hash: SS3-NtUABqEZQOnoSMHZ (v3.4)
[23:24:32.846] Benchmark Minute 2: 83.3k Jobs/s | Hash: SS3-NtUABl2sr6PNbVch (v3.4)
[23:25:33.213] Benchmark Minute 3: 82.9k Jobs/s | Hash: SS3-NtUABl2srq3xg2uT (v3.4)
========================================
Shader Stress 3.4 Benchmark Result
OS: Windows | Arch: x64
CPU: 11th Gen Intel(R) Core(TM) i7-11800H @ 2.30GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 86.8k Jobs/s
Minute 2: 83.3k Jobs/s
Minute 3: 82.9k Jobs/s
----------------------------------------
WINNER: Interval 1 (86.8k Jobs/s)
HASH: SS3-NtUABl2srq3xg2uT
========================================
[23:25:33.213] Benchmark Finished. Hash: SS3-NtUABl2srq3xg2uT
[23:26:17.355] State changed: STOPPED
[23:26:28.616] Mode changed to: Dynamic
[23:26:28.616] Workload reset to: AVX-512 (Auto)
[23:26:31.302] Mode changed to: Steady
[23:26:31.302] Workload reset to: AVX-512 (Auto)
[23:26:32.817] Mode changed to: Benchmark
[23:26:32.817] Benchmark enforcement: Workload set to Scalar Realistic (Forced)
[23:28:9.776] User changed ISA to: AVX-512 (Forced)
[23:28:23.150] User changed ISA to: AVX2 (Forced)
[23:28:23.968] User changed ISA to: AVX-512 (Forced)
[23:29:20.593] User changed ISA to: Scalar Realistic (Forced)
[23:29:38.505] State changed: STARTED
[23:30:39.220] Benchmark Minute 1: 3.5k Jobs/s | Hash: SS3-NtQ3ybOTucJwoiaB (v3.4)
[23:31:39.182] Benchmark Minute 2: 3.2k Jobs/s | Hash: SS3-NtQ3yaMyp3c70chx (v3.4)
[23:32:39.113] Benchmark Minute 3: 3.2k Jobs/s | Hash: SS3-NtQ3yaMylFmJrDbP (v3.4)
Gibt es keinen Autostop nach dem Benchmark?
Der AVX512 Benchmark skaliert ordentlich
-=Popeye=-
2025-12-14, 01:55:35
13900k @ PL1/PL2 offen ~ 275 Watt / 90°C Temp-Limit
2x16GB DDR4-4200 16-16-16-32 2T + Subs
========================================
Shader Stress 3.4 Benchmark Result
OS: Windows | Arch: x64
CPU: 13th Gen Intel(R) Core(TM) i9-13900K
Workload: Scalar real.
----------------------------------------
Minute 1: 9.6k Jobs/s
Minute 2: 9.5k Jobs/s
Minute 3: 9.4k Jobs/s
----------------------------------------
WINNER: Interval 1 (9.6k Jobs/s)
HASH: SS3-NrMYsGqrJtVNULTz
========================================
aufkrawall
2025-12-14, 10:06:17
Gibt es keinen Autostop nach dem Benchmark?
Werd's mal als Checkbox einbauen.
Der AVX512 Benchmark skaliert ordentlich
Scalar (realistic) ist komplett nicht vergleichbar zu den anderen Modi, und die anderen Modi untereinander auch nicht mehr wirklich:
https://s1.directupload.eu/images/251214/temp/y3wf5bae.png (https://www.directupload.eu/file/d/9133/y3wf5bae_png.htm)
Da ist eher der Stromverbrauch der CPU interessant.
Scalar (realistic): Benchmarks
alles andere: Stabilitätstest
Weißt du noch, was du geklickt hattest, damit das passiert war?
Workload: Scalar real.
----------------------------------------
Minute 1: 86.8k Jobs/s
Sieht so aus, als wär der AVX-Modus hängen geblieben, und er hat trotzdem Scalar (realistic) reingeschrieben.
Sonyfreak
2025-12-14, 12:47:28
HP EliteDesk800G4 SFF (i7 8700T, 2x16GB DDR4-2666)
Standard
========================================
Shader Stress 3.4 Benchmark Result
OS: Linux | Arch: x64
CPU: Intel(R) Core(TM) i7-8700T CPU @ 2.40GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 1.6k Jobs/s
Minute 2: 1.6k Jobs/s
Minute 3: 1.6k Jobs/s
----------------------------------------
WINNER: Interval 1 (1.6k Jobs/s)
HASH: SS3-NkS8Mwd1bV7o7NiI
Powercap@20W
========================================
Shader Stress 3.4 Benchmark Result
OS: Linux | Arch: x64
CPU: Intel(R) Core(TM) i7-8700T CPU @ 2.40GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 1.3k Jobs/s
Minute 2: 1.1k Jobs/s
Minute 3: 1.1k Jobs/s
----------------------------------------
WINNER: Interval 1 (1.3k Jobs/s)
HASH: SS3-NkSC03Jaa5qPns22
Powercap@14W
========================================
Shader Stress 3.4 Benchmark Result
OS: Linux | Arch: x64
CPU: Intel(R) Core(TM) i7-8700T CPU @ 2.40GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 1.0k Jobs/s
Minute 2: 870 Jobs/s
Minute 3: 887 Jobs/s
----------------------------------------
WINNER: Interval 1 (1.0k Jobs/s)
HASH: SS3-NkS4gekLysjQ47mm
mfg.
Sonyfreak
aufkrawall
2025-12-14, 15:49:46
Sieht so aus, als wär der AVX-Modus hängen geblieben, und er hat trotzdem Scalar (realistic) reingeschrieben.
Hoffentlich gefixt:
https://github.com/aufkrawall/Shader-Stress/releases/tag/3.4.1
misterh
2025-12-14, 16:44:02
Shader Stress 3.4 Benchmark Result
OS: Windows | Arch: ARM64
CPU: Microsoft SQ1 @ 3.0 GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 1.2k Jobs/s
Minute 2: 1.2k Jobs/s
Minute 3: 1.2k Jobs/s
----------------------------------------
WINNER: Interval 2 (1.2k Jobs/s)
HASH: SS3-NuOf982sdFefLqrk
Update auf 25H2 ( davor war 23H2 )
Shader Stress 3.4 Benchmark Result
OS: Windows | Arch: ARM64
CPU: Microsoft SQ1 @ 3.0 GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 1.3k Jobs/s
Minute 2: 1.3k Jobs/s
Minute 3: 1.3k Jobs/s
----------------------------------------
WINNER: Interval 1 (1.3k Jobs/s)
HASH: SS3-NuOftvFonBYKGMCb
Saugbär
2025-12-14, 20:30:53
--- Session Start (v3.4.1) ---
OS: Windows
Architecture: x64
[19:50:5.578] Config auto-selected: Dynamic (AVX-512 (Auto))
[19:50:11.517] User changed ISA to: AVX-512 (Forced)
[19:50:18.531] Mode changed to: Benchmark
[19:50:18.531] Benchmark enforcement: Workload set to Scalar Realistic (Forced)
[19:50:21.81] User changed ISA to: AVX-512 (Forced)
[19:50:29.376] State changed: STARTED
[19:51:30.256] Benchmark Minute 1: 88.4k Jobs/s | Hash: SS3-NtUABqEZQOnoSMHZ (v3.4.1)
[19:52:30.92] Benchmark Minute 2: 84.4k Jobs/s | Hash: SS3-NtUABl2sr6PNbVch (v3.4.1)
[19:53:30.204] Benchmark Minute 3: 85.0k Jobs/s | Hash: SS3-NtUABl2srq3xg2uT (v3.4.1)
========================================
Shader Stress 3.4.1 Benchmark Result
OS: Windows | Arch: x64
CPU: 11th Gen Intel(R) Core(TM) i7-11800H @ 2.30GHz
Workload: AVX-512 (Forced)
----------------------------------------
Minute 1: 88.4k Jobs/s
Minute 2: 84.4k Jobs/s
Minute 3: 85.0k Jobs/s
----------------------------------------
WINNER: Interval 1 (88.4k Jobs/s)
HASH: SS3-NtUABl2srq3xg2uT
========================================
[19:53:30.204] Benchmark Finished. Hash: SS3-NtUABl2srq3xg2uT
[19:53:30.204] Auto-stopped benchmark to reduce CPU load.
[19:53:51.949] User changed ISA to: Scalar Realistic (Forced)
[19:54:10.117] User changed ISA to: AVX2 (Forced)
[19:54:24.46] State changed: STARTED
[19:55:25.579] Benchmark Minute 1: 123.7k Jobs/s | Hash: SS3-NtUABqEZQOnoSMHZ (v3.4.1)
[19:56:25.62] Benchmark Minute 2: 117.0k Jobs/s | Hash: SS3-NtUABl2sr6PNbVch (v3.4.1)
[19:57:25.125] Benchmark Minute 3: 118.1k Jobs/s | Hash: SS3-NtUABl2srq3xg2uT (v3.4.1)
========================================
Shader Stress 3.4.1 Benchmark Result
OS: Windows | Arch: x64
CPU: 11th Gen Intel(R) Core(TM) i7-11800H @ 2.30GHz
Workload: AVX2 (Forced)
----------------------------------------
Minute 1: 123.7k Jobs/s
Minute 2: 117.0k Jobs/s
Minute 3: 118.1k Jobs/s
----------------------------------------
WINNER: Interval 1 (123.7k Jobs/s)
HASH: SS3-NtUABl2srq3xg2uT
========================================
[19:57:25.125] Benchmark Finished. Hash: SS3-NtUABl2srq3xg2uT
[19:57:25.125] Auto-stopped benchmark to reduce CPU load.
[19:57:39.56] User changed ISA to: Scalar Realistic (Forced)
[20:3:4.340] State changed: STARTED
[20:4:5.373] Benchmark Minute 1: 3.6k Jobs/s | Hash: SS3-NtQ3OnXbGwa3m07Y (v3.4.1)
[20:5:5.87] Benchmark Minute 2: 3.3k Jobs/s | Hash: SS3-NtQ3Omb0QLe4LkAv (v3.4.1)
[20:6:5.363] Benchmark Minute 3: 3.4k Jobs/s | Hash: SS3-NtQ3Omb0MwwyiVke (v3.4.1)
========================================
Shader Stress 3.4.1 Benchmark Result
OS: Windows | Arch: x64
CPU: 11th Gen Intel(R) Core(TM) i7-11800H @ 2.30GHz
Workload: Scalar Realistic (Forced)
----------------------------------------
Minute 1: 3.6k Jobs/s
Minute 2: 3.3k Jobs/s
Minute 3: 3.4k Jobs/s
----------------------------------------
WINNER: Interval 1 (3.6k Jobs/s)
HASH: SS3-NtQ3Omb0MwwyiVke
========================================
[20:6:5.363] Benchmark Finished. Hash: SS3-NtQ3Omb0MwwyiVke
[20:6:5.363] Auto-stopped benchmark to reduce CPU load.
11800h PL1: 65W PL2: 150W, max verbrauch liegt bei 96W
Der Bench stoppt nach 3 Minuten
Der angezeigte Workload wurde auch gefixt
aufkrawall
2025-12-14, 20:48:51
Danke für den Test! :up:
aufkrawall
2025-12-27, 14:54:29
Windows:
--- Session Start (v3.4.1) ---
OS: Windows
Architecture: x64
[14:49:20.940] Config auto-selected: Dynamic (AVX2 (Auto))
[14:49:23.742] Mode changed to: Benchmark
[14:49:23.742] Benchmark enforcement: Workload set to Scalar Realistic (Forced)
[14:49:28.574] State changed: STARTED
[14:50:29.235] Benchmark Minute 1: 4.0k Jobs/s | Hash: SS3-NtW3g1QA5N8LxGPp (v3.4.1)
[14:50:33.136] State changed: STOPPED
Wine Vanilla Arch-Kernel mit Default-Mitigations:
--- Session Start (v3.4.1) ---
OS: Windows
Architecture: x64
[13:19:23.99] Config auto-selected: Dynamic (AVX2 (Auto))
[13:19:25.91] Mode changed to: Benchmark
[13:19:25.91] Benchmark enforcement: Workload set to Scalar Realistic (Forced)
[13:19:26.368] State changed: STARTED
[13:20:27.105] Benchmark Minute 1: 4.2k Jobs/s | Hash: SS3-NtWXKn9evf7uHGer (v3.4.1)
[13:20:28.617] State changed: STOPPED
Linux nativ:
--- Session Start (v3.4.1) ---
OS: Linux
Architecture: x64
CPU: AMD Ryzen 7 5700X 8-Core Processor
[13:17:53.282] Config auto-selected: Benchmark (Scalar Realistic (Forced))
[13:18:54.743] Benchmark Minute 1: 4.2k Jobs/s | Hash: SS3-NnHjd0Z5odoolNCe (v3.4.1)
RoNsOn Xs
2025-12-28, 17:24:13
Mini-PC Intel 1220P @32w
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=95065&stc=1&d=1766937393
misterh
2025-12-29, 20:45:02
mal was neues mit Minis Forum MS-R1
========================================
Shader Stress 3.4.1 Benchmark Result
OS: Linux | Arch: ARM64
CPU: CIX P1 CP8180 8C+4c
Workload: Scalar Realistic (Forced)
----------------------------------------
Minute 1: 2.0k Jobs/s
Minute 2: 2.0k Jobs/s
Minute 3: 2.0k Jobs/s
----------------------------------------
WINNER: Interval 3 (2.0k Jobs/s)
HASH: SS3-No9pjhgqFe1GY3PB
========================================
misterh
2026-01-02, 23:31:59
mal was neues mit Minis Forum MS-R1
========================================
Shader Stress 3.4.1 Benchmark Result
OS: Linux | Arch: ARM64
CPU: CIX P1 CP8180 8C+4c
Workload: Scalar Realistic (Forced)
----------------------------------------
Minute 1: 2.0k Jobs/s
Minute 2: 2.0k Jobs/s
Minute 3: 2.0k Jobs/s
----------------------------------------
WINNER: Interval 3 (2.0k Jobs/s)
HASH: SS3-No9pjhgqFe1GY3PB
========================================
und Win 11 23H2 ARM64 + Rufus (ab 24H2 lässt nimmer installieren)
Daredevil
2026-01-03, 00:06:52
Shader Stress 3.4.1
5700X@4.8Ghz SMT Off
Result: 3.5k
https://s1.directupload.eu/images/260103/a6brgcgw.png
----------
Apple M3 Ultra 28 Core
--- Performance ---
Rate (Jobs/s): 7.8k
Time: 00:03:00
--- Benchmark Rounds ---
1st Minute: 7.7k
2nd Minute: 7.7k
3rd Minute: 7.8k
WINNER: Interval 3
--- Stress Status ---
Workers: 28
> Sim Compilers: 28
> Decompressors: 0
RAM Thread: Idle
I/O Threads: Idle
Errors: 0
aufkrawall
2026-01-05, 20:02:16
Bin von PBO -20 mal auf -25 gegangen, und auch das schmiert mir, wie -30, unter Linux noch recht schnell ab. Verrückt, dass -30 jahrelang stabil unter Windows war.
CPU-Stabilitätstests unter Windows sind einfach für die Tonne. Wahrscheinlich haben zig Leute instabile Settings, ohne es zu merken. Bei RAM genau das Gleiche.
Wobei Shader Stress kein guter RAM-Stabilitätstest ist. Ggf. irgendwann mal gucken, ob man TestMem5 als open-source und Cross-Plattform nachbauen kann.
Semmel
2026-01-05, 20:04:42
Bin von PBO -20 mal auf -25 gegangen, und auch das schmiert mir, wie -30, unter Linux noch recht schnell ab. Verrückt, dass -30 jahrelang stabil unter Windows war.
CPU-Stabilitätstests unter Windows sind einfach für die Tonne. .
Was genau und wielange hast du unter Windows getestet?
aufkrawall
2026-01-05, 20:11:47
Hatte damals unter Windows mit -30 die üblichen Verdächtigen wie Prime95, CoreCycler etc. alle irgendwas um die 1-3 Stunden laufen lassen. Ist jetzt nicht die Welt, aber der Dynamic-Modus von Shader Stress unter Linux crashte mit -25 vorhin nach 5-15 Minuten. -20 laeuft gerade eine Stunde stabil.
MORPHiNE
2026-01-06, 00:16:05
7950X CO-30 / PBO+150 / 230W / DDR5-6000 CL32 / 83°C
--- Session Start ---
OS: Windows
Architecture: x64
[0:4:24.200] Config auto-selected: Dynamic (AVX-512 (Auto))
[0:4:25.981] Mode changed to: Benchmark
[0:4:25.981] Benchmark enforcement: Workload set to Scalar Realistic (Forced)
[0:7:5.234] State changed: STARTED
[0:8:6.118] Benchmark Minute 1: 10.0k Jobs/s | Hash: SS3-9rmp50vHq76
[0:9:6.6] Benchmark Minute 2: 9.9k Jobs/s | Hash: SS3-9rmQvpZTASu
[0:10:5.919] Benchmark Minute 3: 9.9k Jobs/s | Hash: SS3-9rmQvqnxp6O
========================================
Shader Stress 3.2 Benchmark Result
OS: Windows | Arch: x64
CPU: AMD Ryzen 9 7950X 16-Core Processor
Workload: Scalar real.
----------------------------------------
Minute 1: 10.0k Jobs/s
Minute 2: 9.9k Jobs/s
Minute 3: 9.9k Jobs/s
----------------------------------------
WINNER: Interval 1 (10.0k Jobs/s)
HASH: SS3-9rmQvqnxp6O
========================================
[0:10:5.919] Benchmark Finished. Hash: SS3-9rmQvqnxp6O
[Update] Linux:
--- Session Start (v3.4.1) ---
OS: Linux
Architecture: x64
CPU: AMD Ryzen 9 7950X 16-Core Processor
[1:0:53.605] Config auto-selected: Benchmark (Scalar Realistic (Forced))
[1:1:54.613] Benchmark Minute 1: 10.5k Jobs/s | Hash: SS3-NlbgKAMIflJx4NsS (v3.4.1)
[1:2:54.620] Benchmark Minute 2: 10.4k Jobs/s | Hash: SS3-NlbgKCRnYDokm2IK (v3.4.1)
[1:3:54.626] Benchmark Minute 3: 10.5k Jobs/s | Hash: SS3-NlbgKCRnLXwGhonv (v3.4.1)
========================================
Shader Stress 3.4.1 Benchmark Result
OS: Linux | Arch: x64
CPU: AMD Ryzen 9 7950X 16-Core Processor
Workload: Scalar Realistic (Forced)
----------------------------------------
Minute 1: 10.5k Jobs/s
Minute 2: 10.4k Jobs/s
Minute 3: 10.5k Jobs/s
----------------------------------------
WINNER: Interval 1 (10.5k Jobs/s)
HASH: SS3-NlbgKCRnLXwGhonv
========================================
[1:3:54.626] Benchmark Finished. Hash: SS3-NlbgKCRnLXwGhonv
[1:3:54.626] Auto-stopped benchmark to reduce CPU load.
Semmel
2026-01-20, 07:43:00
Hatte damals unter Windows mit -30 die üblichen Verdächtigen wie Prime95, CoreCycler etc. alle irgendwas um die 1-3 Stunden laufen lassen. Ist jetzt nicht die Welt, aber der Dynamic-Modus von Shader Stress unter Linux crashte mit -25 vorhin nach 5-15 Minuten. -20 laeuft gerade eine Stunde stabil.
1-2 Stunden für CoreCycle ist nicht nur nicht die Welt, das ist praktisch nichts. ;)
CoreCycler testet pro Kern. Bei einer Achtkern-CPU muss man es also achtfach solange laufen lassen, um eine vergleichbare Aussagekraft wie bei einem Allcore-Stabilitätstest zu haben.
Mein Stabilitätsanspruch von früher war: 48 h Stabilität bei Allcore und Singlecore separat getestet.
Mittlerweile habe ich das auf 96 h erhöht.
D.h. erstmal 96 h Allcore mit Prime95. Dann noch 768 h (32 Tage) mit CoreCycler. (bei meinem 9800X3D)
Während der Testphase sind die Lüfter gedrosselt, um hochsommerliche Temperaturen zu simulieren.
Vom CoreCycler-Endergebnis schlage ich nochmal +2 pro Core als Sicherheitsmarge drauf.
DANN ist es für mich stabil. Mein Anspruch ist, dass die Kiste während der gesamten jahrelangen Nutzungsdauer keine einzige OC/UV-bedingte Instabilität zeigt.
Ich stimme dir in diesem Punkt zu: Die meisten Leute, die OC/UV betreiben, sind leicht über dem Limit und daher nicht wirklich stabil unterwegs. Manchen stört der seltene Absturz nicht, mich schon.
Vielleicht deckt dein "Shader Stress" Instabilitäten schneller auf. Wenn das so ist, dann könnte es Prime95 ablösen.
Ich werde das demnächst mal versuchen zu validieren. Dauert aber noch ein paar Wochen, weil ich noch inmitten der CoreCycler-Tests bin. ;)
Übrigens, mir ist schon beim CoreCycler aufgefallen, dass AVX512 erheblich sensibler als SSE reagiert.
Die Default-Einstellung vom CoreCycler ist Prime95 im Singlecore-Betrieb mit SSE und LargeFFT. Das erzeugt nur minimale Last, aber dafür den höchsten Boosttakt.
Ich habe das auf AVX512 mit SmallFFT umgestellt, weil das meiner Erfahrung nach der Worst Case ist.
Damit erreiche ich ebenfalls deutlich schlechtere UV-Ergebnisse als mit dem Default-Test. Die Differenz zwischen SSE/HugeFFT und AVX512/SmallFFT liegt grob bei ca. 10 CO-Punkten!
aufkrawall
2026-01-20, 08:16:10
1-2 Stunden für CoreCycle ist nicht nur nicht die Welt, das ist praktisch nichts. ;)
CoreCycler testet pro Kern. Bei einer Achtkern-CPU muss man es also achtfach solange laufen lassen, um eine vergleichbare Aussagekraft wie bei einem Allcore-Stabilitätstest zu haben.
Da ist natürlich was dran.
Vielleicht deckt dein "Shader Stress" Instabilitäten schneller auf. Wenn das so ist, dann könnte es Prime95 ablösen.
Würd es eher als Ergänzung sehen, weil es jeweils vier verschiedene Lastarten gleichzeitig/im Wechsel testet, die alle nicht so sehr heizen wie zumindest die härtesten P95-Configs.
Aber dafür mit stark variierender Kern-Auslastung im Dynamic-Modus und unterschiedlichen Kombinationen. Wobei die Kerne auch höher boosten als in Prime und auch mit unterschiedlicheren Taktraten laufen sollten, wenn man nicht AC-Turbo auf z.B. Intel nutzt.
Also ein deutlich realitätsnäherer Testfall. Bei Spielen schwankt die CPU-Last ja auch, inkls. verschiedener Workloads.
Wenn längere Test-Sessions geplant sind, würd ich btw. die Linux-Version nutzen. Bzw. generell besser. Windows scheint einfach Overhead bei Kompilier-Workloads zu haben, mit entsprechend schlechterer Auslastung der Hardware.
Was schon kurios ist, weil, von dem I/O-Read-Stress-Part außerhalb vom Benchmark-Modus abgesehen, I/O überhaupt keine Rolle spielt.
Semmel
2026-01-20, 08:34:59
Würd es eher als Ergänzung sehen, weil es jeweils vier verschiedene Lastarten gleichzeitig/im Wechsel testet, die alle nicht so sehr heizen wie zumindest die härtesten P95-Configs.
Aber dafür mit stark variierender Kern-Auslastung im Dynamic-Modus und unterschiedlichen Kombinationen. Wobei die Kerne auch höher boosten als in Prime und auch mit unterschiedlicheren Taktraten laufen sollten, wenn man nicht AC-Turbo auf z.B. Intel nutzt.
Also ein deutlich realitätsnäherer Testfall. Bei Spielen schwankt die CPU-Last ja auch, inkls. verschiedener Workloads.
Das klingt sehr sinnvoll. Maximales Heizen ist nur einer von verschiedenen sinnvollen Tests. Der CoreCycler versucht sich ja auch davon abzuheben, indem er maximale Boosts erzeugen will. Aber auch hier fehlen verschiedene Teillastbereiche.
Genau solche Lastschwankungen mit verschiedenen Teillastbereichen konnte bisher kein synthetischer Test wirklich gut nachstellen. Daher mache ich die langen Testzeiten, die auch bewusst während der normalen PC-Nutzung weiterlaufen, um unregelmäßig verschiedene Mischlastfälle mitzutesten.
Ich werde mir den Shader Stress bei nächster Gelegenheit genauer ansehen. :)
aufkrawall
2026-01-20, 12:35:13
Mini-Update 3.4.2 (keine Änderungen an den Algorithmen etc.):
https://github.com/aufkrawall/Shader-Stress/releases/tag/3.4.2
Öffnet jetzt unter Linux direkt im Terminal, anstatt im Hintergrund loszuheizen, wenn man es in einer DE außerhalb vom Terminal-Emulator aufruft.
vBulletin®, Copyright ©2000-2026, Jelsoft Enterprises Ltd.