Anmelden

Archiv verlassen und diese Seite im Standarddesign anzeigen : Shader Stress - CPU-Kompilier-Performance (simuliert)


aufkrawall
2025-11-29, 14:04:50
Download:
https://github.com/aufkrawall/Shader-Stress/tags

Muss man nicht lange laufen lassen, Performance sollte fast nicht schwanken.
5700X 88,7k/s:
https://s1.directupload.eu/images/251129/temp/undn979t.jpg (https://www.directupload.eu/file/d/9118/undn979t_jpg.htm)

wine-staging mit Standard Arch-Kernel mit Mitigations an:
https://s1.directupload.eu/images/251129/temp/v4f8br3g.png (https://www.directupload.eu/file/d/9118/v4f8br3g_png.htm)

Ja, ist etwas schneller als nativ. :freak:

13700K 5,3GHz (mit minimaler Drosselung): ~185k/s

misterh
2025-11-29, 20:00:39
285K + 8400CL38
https://s1.directupload.eu/images/user/251129/uroshix4.png

Tesseract
2025-11-29, 20:51:16
9800X3D

https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94724&stc=1&d=1764445803

aufkrawall
2025-11-29, 21:08:53
Oha, krass. Könnte an AVX-512 liegen. Mit --no-avx512 wird stattdessen AVX2 genutzt.
Scalar-Modus ohne AVX2 ist zwar für CPUs ohne Support implementiert, der manuelle Befehl --no-avx2 allerdings nicht im Release-Build. Hab es mal neu kompiliert getestet und bringt einiges auf Zen 3, geht von 88k auf 67k runter. Skalar ist vermutlich realistischer für die real-world Vergleichbarkeit. Allerdings immer noch mehr FMA-Operationen als echtes Kompilieren. Die Relationen mit AVX2 zwischen Zen 3 und Raptor Lake scheinen aber auf den ersten Blick gut zur Real-World-Last zu passen.

Tesseract
2025-11-29, 21:29:25
5800X3D

https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94725&stc=1&d=1764448110

aufkrawall
2025-11-29, 21:35:49
Lief der mit unter 4GHz? Mein 5700X PBO/CO geht auf 4,45 runter bei 120-125W.

Ideen für Version 2.0: Skalar vs. AVX sowie einen weiteren Workload näher an echtem Kompilieren für den Benchmark-Modus im UI direkt auswählbar machen. Aber die Reihenfolge stimmte schon so, erstmal musste die Auslastung auf verschiedenen CPUs generell passen.

Tesseract
2025-11-29, 21:48:23
so um die 4GHz. der ist im HTPC und läuft da mit solchen lasten in den thermal throttle. heavy crunching und vcache über der logic ist... suboptimal.

x-force
2025-11-29, 21:51:51
Mein 5700X PBO/CO geht auf 4,45 runter bei 120-125W.

7800x3d geht auf 4,8 runter bei 75w -> 110k
mit prime kann man ihn unter 4,5 drücken.

hier kommt man langsam mit oc/uv in bereiche, in denen sich pseudo von rockstable trennt und der effektive takt zu beachten ist.

user77
2025-11-29, 22:01:04
Ryzen 7 5800X3D (no cap 142W, -30 curve) -> um die 85,5k bei 4,35Ghz

bei 100W cap 4,30Ghz -> 85,3k
bei 90W cap 4,18Ghz -> 83,1k
bei 75W cap 3,86Ghz -> 76,4k
bei 4GHz cap 78W -> 79,2k

PS: zeigt bei Euch Windows Taskmanager teilweise auch 110% CPU Auslastung an?

aufkrawall
2025-11-29, 22:34:05
Ryzen 7 5800X3D (no cap 142W, -30 curve) -> um die 85,5k bei 4,35Ghz

bei 100W cap 4,30Ghz -> 85,3k

Schon besser. Aber auch etwas schräg, dass der 5700X trotzdem leicht vorne liegt. Den Tray gab es schon für ca. 100€.


PS: zeigt bei Euch Windows Taskmanager teilweise auch 110% CPU Auslastung an?
Ja, ist ein Haufen Kacke. Er zeigt auch weniger als 100% Gesamtauslastung an, obwohl im selben Fenster rechts daneben jeder einzelne Thread bei 100% festgetackert ist. Mit der Firma stimmt etwas nicht.

user77
2025-11-29, 22:48:01
Schon besser. Aber auch etwas schräg, dass der 5700X trotzdem leicht vorne liegt. Den Tray gab es schon für ca. 100€.


welche temps hast du, meiner bleibt bei ca. 82-83° mit einer 120er AIO.
Er startet mit 4,45Ghz, pendelt sich aber bei 4,35Ghz ein. Ryzen Master zeigt aber auch nur 78% von 142W an, was 110W wären.
Evtl. drosselt mein ITX Board? GIGABYTE B550I AORUS Pro AX

VRM-Design: 6+2, 8 virtuelle CPU-Phasen (6+2), 8 reale CPU-Phasen (6+2)
MOSFETs VCORE: 6x 90A ISL99390 (SPS)
MOSFETs SOC/VCCGT: 2x 90A ISL99390 (SPS)
PWM-Controller: RAA229004 (max. 8 Phasen)

aufkrawall
2025-11-30, 01:11:58
welche temps hast du, meiner bleibt bei ca. 82-83€ mit einer 120er AIO.

Um die 85°C mit LK.


Er startet mit 4,45Ghz, pendelt sich aber bei 4,35Ghz ein. Ryzen Master zeigt aber auch nur 78% von 142W an, was 110W wären.
Evtl. drosselt mein ITX Board? GIGABYTE B550I AORUS Pro AX
Bei mir schwanken die Taktraten minimal, die 4,45GHz ändern sich aber über die Zeit nicht.
Ansonsten kann es bei Ryzens intern natürlich auch Clock Stretching geben. Würde nicht sagen, dass dein Board drosselt, wenn die angezeigte Taktrate nicht niedrig ist.

Vorschau auf Version 2.0 mit auswählbarem Rechenpfad und neuem realistischerem Skalar:
https://s1.directupload.eu/images/251130/temp/zr6hdl9c.jpg (https://www.directupload.eu/file/d/9119/zr6hdl9c_jpg.htm)

Die alten Pfade bleiben weiterhin vergleichbar zu Version 1.0. Aber erstmal wieder mit Raptor Lake Skalierung gegenüber 5700X abklopfen...

lilgefo~
2025-11-30, 01:17:15
https://s1.directupload.eu/images/251130/u2mgqww2.png

Hmm, hat sich ja nix geändert. X3D avg fps boost extrem schlecht, arrow lake mt booster extrem gut, raptor lake beste für games und minfps

1 apple m4 wär noch interessant zu sehen

edit: ergebnis mit 14900kf

misterh
2025-11-30, 01:25:43
285K @ 65w + 8400CL38
https://s1.directupload.eu/images/user/251130/o455p7kx.png

285K @ 100w + 8400CL38
https://s1.directupload.eu/images/user/251130/rbfgn8yd.png

RoNsOn Xs
2025-11-30, 12:13:49
265K @ stock
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94735&stc=1&d=1764528577

13600k @stock
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94729&stc=1&d=1764504636

aufkrawall
2025-11-30, 17:57:41
2x das gleiche Bild?

Version 2.0 mit realistischerem Skalar-Pfad standardmäßig für Benchmark (heizt nicht mehr so, ist aber indirekt Absicht):
https://github.com/aufkrawall/Shader-Stress/releases/tag/2.0


5700X: 3,8k
https://s1.directupload.eu/images/251130/temp/7m5d6opv.jpg (https://www.directupload.eu/file/d/9119/7m5d6opv_jpg.htm)

13700K: 7,3k

Schreibt jetzt auch die Benchmark-Run-Werte in die Logdatei usw. I bims zufrieden.

RoNsOn Xs
2025-11-30, 19:03:40
Oops, die hatten beide den gleichen Namen. 265k @ ~225k

2.0: scalar
265k @stock
9,3K

Shader Stress 2.0 Benchmark Result
CPU: Intel(R) Core(TM) Ultra 7 265K
Workload: Scalar real.
----------------------------------------
Minute 1: 9.3k Jobs/s
Minute 2: 9.3k Jobs/s
Minute 3: 9.3k Jobs/s
----------------------------------------
WINNER: Interval 2 (9.3k Jobs/s)

aufkrawall
2025-11-30, 20:01:54
Cool, ARL regelt. :up:
Dürfte bei dem Workload in dem Preisbereich alles andere killen.

misterh
2025-11-30, 20:47:48
Shader Stress 2.0 Benchmark Result
CPU: Intel(R) Core(TM) Ultra 9 285K
Workload: Scalar real.
----------------------------------------
Minute 1: 11.2k Jobs/s
Minute 2: 11.1k Jobs/s
Minute 3: 11.1k Jobs/s
----------------------------------------
WINNER: Interval 1 (11.2k Jobs/s)

user77
2025-11-30, 20:52:57
Ryzen 7 5800X3D (no cap 142W, -30 curve)
wieder nur 71% vom Powertarget... :confused:

https://i.ibb.co/4RSDpGHP/Screenshot-2025-11-30-205110.png

Tesseract
2025-11-30, 21:01:01
9800X3D
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94741&stc=1&d=1764532837

aufkrawall
2025-11-30, 21:18:34
Ryzen 7 5800X3D (no cap 142W, -30 curve)
wieder nur 71% vom Powertarget... :confused:

Steht höchstwahrscheinlich außerhalb meiner Macht. Es skaliert bislang über alle CPUs optimal im zu erwartenden Rahmen, bzw. ziemlich vergleichbar zum Vorgänger pybecrasher mit dxcompiler direkt von Microsoft. Bei Phoronix gibt es auch diverse Kompilier-Tests, wo der 5800X3D ca. die gleiche Leistung wie der 5800X zeigt:
https://openbenchmarking.org/result/2204253-NE-RYZEN758019

Also bislang kein Grund anzunehmen, dass irgendetwas nicht richtig funktioniert.

x-force
2025-11-30, 22:42:30
7800x3d geht auf 4,8 runter bei 75w -> 110k
mit prime kann man ihn unter 4,5 drücken.

hier kommt man langsam mit oc/uv in bereiche, in denen sich pseudo von rockstable trennt und der effektive takt zu beachten ist.

liegt nun bei 4,88 ghz und 72w -> 4,2k

avx2 last ist minimal höher als avx512

misterh
2025-11-30, 23:09:53
Shader Stress 2.0 Benchmark Result
CPU: Snapdragon X Elite (X1E780100) @ 3.41GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 2.6k Jobs/s
Minute 2: 2.4k Jobs/s
Minute 3: 2.4k Jobs/s
----------------------------------------
WINNER: Interval 1 (2.6k Jobs/s)

aufkrawall
2025-11-30, 23:11:48
avx2 last ist minimal höher als avx512
Der Verbrauch oder die Performance? Zen 4 hat ja nur Half-Rate AVX-512.
Ansonsten spannend, dass mit Scalar (realistic) der Sprung von Zen 4 3D auf Zen 5 3D wesentlich größer ist als von Zen 3 auf Zen 4 3D. Gut, dafür zieht meine CPU auch immer noch 110W dabei. Der 13700K ist mit 225W auch noch relativ gut dabei.

Cool, jetzt haben wir auch ARM. :)
Ich versuch mich mal zeitnah um ein natives arm64 Build zu bemühen. Mit etwas Glück null Aufwand.

misterh
2025-11-30, 23:24:07
und noch schnell über Parallels Desktop

Shader Stress 2.0 Benchmark Result
CPU: APPLE M3 MAX 16C/40GB @ 3.07GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 3.3k Jobs/s
Minute 2: 3.4k Jobs/s
Minute 3: 3.5k Jobs/s
----------------------------------------
WINNER: Interval 1 (3.5k Jobs/s)

aufkrawall
2025-11-30, 23:27:08
Was ist der SoC-Verbrauch der beiden ARM-CPUs?

misterh
2025-11-30, 23:32:12
nicht angeschlossen, denke mal zwischen 100 und 120w auf macbook pro.

und diesmal über VMware Fusion Pro
Shader Stress 2.0 Benchmark Result
CPU: APPLE M3 MAX 16C/40GB @ 2.00GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 3.4k Jobs/s
Minute 2: 3.5k Jobs/s
Minute 3: 3.6k Jobs/s
----------------------------------------
WINNER: Interval 1 (3.6k Jobs/s)

x-force
2025-11-30, 23:45:56
Der Verbrauch oder die Performance? Zen 4 hat ja nur Half-Rate AVX-512.

der takt ist minimal (1-2 steps) niedriger, verbrauch höher, performance besser:

avx2 -> 115k
avx512 -> 97k

Ansonsten spannend, dass mit Scalar (realistic) der Sprung von Zen 4 3D auf Zen 5 3D wesentlich größer ist als von Zen 3 auf Zen 4 3D. Gut, dafür zieht meine CPU auch immer noch 110W dabei. Der 13700K ist mit 225W auch noch relativ gut dabei.

müsste man mal taktbereinigt betrachten.
vielleicht liefert tesseract noch takt und verbrauch nach.

zen3 3d 4,36 ghz -> 3,8k jobs/s@75w -> 0,87 jobs/s/mhz 50,6 jobs/s/w
zen4 3d 4,88 ghz -> 4,2k jobs/s@72w -> 0,86 jobs/s/mhz 58,3 jobs/s/w
zen5 3d x,xx ghz -> 5,9k jobs/s@xxw ->

aufkrawall
2025-11-30, 23:46:44
2.1 mit arm64 Build, x86 sollte keine Veränderungen zeigen:
https://github.com/aufkrawall/Shader-Stress/releases/tag/2.1

misterh
2025-11-30, 23:57:27
so hier erneut mit Parallels Desktop
Shader Stress 2.1-Universal Benchmark Result (ARM64)
CPU: APPLE M3 MAX 16C/40GB @ 3.07GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 5.4k Jobs/s
Minute 2: 5.4k Jobs/s
Minute 3: 5.5k Jobs/s
----------------------------------------
WINNER: Interval 1 (5.5k Jobs/s)

aufkrawall
2025-12-01, 00:04:51
Cool, es funktioniert. War die Taktangabe von 2GHz mit dem x86-Build falsch?
Ok, lag wohl an vmware? Ob das ein guter Score im Vergleich zu den x86-CPUs ist, hinge wohl vom Verbrauch ab.

misterh
2025-12-01, 00:13:49
liegt an VMware Fusion

hab ja jeweils vor @ angepasst. Sonst steht ja "Virtual CPU @"

bei ARM64 steht nur "ARM64 Processor" die ich ja ebenso angepasst habe danach.
Shader Stress 2.1-Universal Benchmark Result (ARM64)
CPU: Snapdragon X Elite (X1E780100) @ 3.41GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 3.0k Jobs/s
Minute 2: 2.9k Jobs/s
Minute 3: 3.0k Jobs/s
----------------------------------------
WINNER: Interval 1 (3.0k Jobs/s)

aufkrawall
2025-12-01, 00:26:24
Schon sehr cool hier auch ARMs zu haben. Dann sieht man auch gleich, was die Emulation kostet. Wenn Prism AVX2-Emulation unterstützt, kann man auch direkt sehen, wie sich das vs. Scalar auswirkt.

Mit Scalar (realistic) verlier ich in Wine etwas Performance:
https://www.forum-3dcenter.org/vbulletin/showpost.php?p=13846791&postcount=16

3,6k:
https://s1.directupload.eu/images/251201/temp/xc47m25h.png (https://www.directupload.eu/file/d/9120/xc47m25h_png.htm)

Aber ist nichts vs. die x86-Emulation. Dafür hab ich ja den ganzen Aufwand mit der kompletten Simulation anstatt dxc gemacht, dass man das auch in Wine ohne ständige Crashes vergleichen kann. :)

Tesseract
2025-12-01, 00:59:29
müsste man mal taktbereinigt betrachten.
vielleicht liefert tesseract noch takt und verbrauch nach.

zen3 3d 4,36 ghz -> 3,8k jobs/s@75w -> 0,87 jobs/s/mhz 50,6 jobs/s/w
zen4 3d 4,88 ghz -> 4,2k jobs/s@72w -> 0,86 jobs/s/mhz 58,3 jobs/s/w
zen5 3d x,xx ghz -> 5,9k jobs/s@xxw ->

5,26 GHz bei ca. 143W PPT, takt ist +200 und voltage -10, sonst alles default.

x-force
2025-12-01, 01:12:41
5,26 GHz bei ca. 143W PPT, takt ist +200 und voltage -10, sonst alles default.

zen3 3d 4,36 ghz -> 3,8k jobs/s@75w -> 0,87 jobs/s/mhz 50,6 jobs/s/w
zen4 3d 4,88 ghz -> 4,2k jobs/s@72w -> 0,86 jobs/s/mhz 58,3 jobs/s/w
zen5 3d 5,26 ghz -> 5,9k jobs/s@143w -> 1,12 jobs/s/mhz 41,1 jobs/s/w

zen 5 dreht den hahn auf.

edit:
apple m3 3,07 ghz -> 5,5k jobs/s@81w -> 0,9 jobs/s/mhz 67,9 jobs/s/w

jobs/s/mhz hier halbiert, da doppelte kerne

misterh
2025-12-01, 01:13:29
Ob das ein guter Score im Vergleich zu den x86-CPUs ist, hinge wohl vom Verbrauch ab.

Macbook Pro 16" M3 MAX + 48GB aber für Win on ARM 40GB eingestellt.

Parallels Desktop

Idle : 10-12w
64bit : 73-76w (3.5k/s)
ARM64 : 79-83w (5.5k/s)

Verbrauch ganze Laptop ausgelesen.

aufkrawall
2025-12-01, 01:16:35
Ok, das wäre den Werten von Tesseract nach mal eben irgendwas um die Größenordnung der doppelten Effizienz vs. Zen 5. :freak:
Wobei das bei den Werten von Cubitus anders aussieht. Wahrscheinlich also das PPT nicht ausgereizt.

Cubitus
2025-12-01, 01:18:17
Ryzen 9800X3D

https://i.postimg.cc/Wb9g38QX/Screenshot-2025-12-01-011046.png (https://postimg.cc/mtHtpYZH)

Meine PBO Settings
https://i.postimg.cc/xj6cyCgW/Screenshot-2025-12-01-011709.png (https://postimages.org/)

x-force
2025-12-01, 01:22:09
Ok, das wäre den Werten von Tesseract nach mal eben irgendwas um die Größenordnung der doppelten Effizienz vs. Zen 5. :freak:

siehe mein edit, es sind +65%, was am betriebspunkt, und/oder falscher auslesung bei tesseract liegen dürfte.
zu zen4 sind es nur noch +16,5%.


vielleicht übernimmst du die werte in den startpost?

zen3 3d 4,36 ghz -> 3,8k jobs/s@75w -> 0,87 jobs/s/mhz 50,6 jobs/s/w
zen4 3d 4,88 ghz -> 4,2k jobs/s@72w -> 0,86 jobs/s/mhz 58,3 jobs/s/w
zen5 3d 5,26 ghz -> 5,9k jobs/s@143w -> 1,12 jobs/s/mhz 41,1 jobs/s/w (tesseract)
zen5 3d 5,23 ghz -> 5,8k jobs/s@109w -> 1,11 jobs/s/mhz 53,21 jobs/s/w (cubitus)

apple m3 3,07 ghz -> 5,5k jobs/s@81w -> 0,9 jobs/s/mhz 67,9 jobs/s/w

jobs/s/mhz hier halbiert, da doppelte kerne. verbrauch kompletter laptop.
müsstest du vielleicht nochmal sauber pro kern umrechnen

misterh
2025-12-01, 01:30:37
man kann ja nicht so vergleichen?

zen3 bis zen5 sind ja only CPU Angabe an verbrauch?

M3 Max ist aber ganze Laptop. Only CPU wäre ja dann weniger als 74.5w bzw. 81w?

x-force
2025-12-01, 01:41:38
zen3 bis zen5 sind ja only CPU Angabe an verbrauch?

ja, wobei idle bei mir schon 20w verbraten werden.

M3 Max ist aber ganze Laptop. Only CPU wäre ja dann weniger als 74.5w bzw. 81w?

ne, das wären äpfel und birnen ;)
gibts für mac auch etwas wie hwinfo, das genauere daten liefert?

aufkrawall
2025-12-01, 01:48:17
vielleicht übernimmst du die werte in den startpost?

Ja, mach ich noch. Aber wär schon gut, wenn man wirklich immer unmissverständlich den durchschnittlichen Package-Verbrauch mit angibt, sofern auslesbar.

misterh
2025-12-01, 01:55:19
gibts für mac auch etwas wie hwinfo, das genauere daten liefert?

Hab nur hwinfo pro und nur das wird erkannt. und bei App außerhalb Windows hab ich mir keine gekauft. Werde auch nicht holen.

https://s1.directupload.eu/images/user/251201/86malsrf.png

Edit : Hab passend gefunden für Mac (Mac Power Monitor)

M3 MAX (12x P-Core, 4x E-Core)
P-Core 4056Mhz und E-Core 2568Mhz sowie only CPU zwischen 62 und 64w (ARM64)

Edit2: 285K + 8400CL38 : 11,2k/s -> 263-279w

Darkman.X
2025-12-01, 03:33:47
i9-14900K @ Performance-Profil
242 bis 253 W laut HWiNFO.

Shader Stress 2.1:
Shader Stress 2.1-Universal Benchmark Result
CPU: Intel(R) Core(TM) i9-14900K
Workload: Scalar real.
----------------------------------------
Minute 1: 9.8k Jobs/s
Minute 2: 9.8k Jobs/s
Minute 3: 9.8k Jobs/s
----------------------------------------
WINNER: Interval 1 (9.8k Jobs/s)

Tesseract
2025-12-01, 08:25:16
siehe mein edit, es sind +65%, was am betriebspunkt, und/oder falscher auslesung bei tesseract liegen dürfte.
zu zen4 sind es nur noch +16,5%.

die spannung geht hier auf 1.26V hoch was gegenüber schwankenden ~1.16V schon ein deutlicher unterschied ist. ist einfach ein anderer betriebspunkt.

edit: 75W PPT -> 4.8k; 65W PPT -> 4.3k; 55W PPT -> 3.8k; 45W PPT -> 3.3k, jeweils 1 min

Sonyfreak
2025-12-01, 11:29:12
Shader Stress 2.1-Universal Benchmark Result
CPU: 12th Gen Intel(R) Core(TM) i9-12900H
Workload: Scalar real.
----------------------------------------
Minute 1: 3.3k Jobs/s (Thermal throttle)
Minute 2: 2.9k Jobs/s
Minute 3: 2.9k Jobs/s

Shader Stress 2.1-Universal Benchmark Result
CPU: Intel(R) Core(TM) i9-7980XE CPU @ 2.60GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 5.7k Jobs/s
Minute 2: 5.7k Jobs/s
Minute 3: 5.7k Jobs/s

mfg.

Sonyfreak

x-force
2025-12-01, 12:12:59
die spannung geht hier auf 1.26V hoch was gegenüber schwankenden ~1.16V schon ein deutlicher unterschied ist. ist einfach ein anderer betriebspunkt.

edit: 75W PPT -> 4.8k; 65W PPT -> 4.3k; 55W PPT -> 3.8k; 45W PPT -> 3.3k, jeweils 1 min

dann kosten die letzten 0,1k 34 watt :D (vgl. cubitus)
wärst du so nett und guckst nochmal wie viel spannung und takt bei dem 4,3k run anliegt?

bei meinem zen4 3d sind 1,019v für 4,88ghz nötig, was dann zu 4,2k bei 71w ppt führt.
zen4 3d darf ja bis 1,1v. ich würde gerne wissen, was da im hintergrund limitiert. temp, ppt, edc, tdc und vcore sind es nicht.
muss wohl ein strom sein, der warum auch immer, nicht über edc abgebildet wird.

Ja, mach ich noch. Aber wär schon gut, wenn man wirklich immer unmissverständlich den durchschnittlichen Package-Verbrauch mit angibt, sofern auslesbar.

die übrigen werte sollten ppt sein.

ich habe mich gerade gewundert weshalb das system auf einmal laggy ist... du hast offenbar vergessen einen stop nach der dritten minute einzubauen ;)

Cubitus
2025-12-01, 16:51:23
dann kosten die letzten 0,1k 34 watt :D (vgl. cubitus)

Das sind schon fast 5090 Effzienz-Verhältnisse ;D
Mit ordentlicher Einzelcore-Optmierung bekommt man den 9800X3D Hitzkopf schon gut gezähmt. :)

aufkrawall
2025-12-01, 16:56:53
ich habe mich gerade gewundert weshalb das system auf einmal laggy ist... du hast offenbar vergessen einen stop nach der dritten minute einzubauen ;)
Ist Absicht, damit man optional auch die reine Compile-Last länger als Stresstest laufen lassen kann.

Tesseract
2025-12-01, 17:57:07
wärst du so nett und guckst nochmal wie viel spannung und takt bei dem 4,3k run anliegt?

hängt natürlich vom voltage offset ab, mit -10 ca. 3950MHz/0.915V/65W PPT, mit -30 sind es ca. 4GHz/0.855V/60W PPT. damit ist man dann schon effizinter als der M3. :D

aufkrawall
2025-12-01, 19:49:36
Ich hatte übrigens ARM und Apple/Qualcomm in den Prompts für die Workloads nicht explizit benannt. Kann sein, dass da noch Potenzial vorhanden ist. Muss aber nicht.
Ich hatte es auch schon nativ für Linux und macOS kompiliert, aber Clang ist viel aggressiver als MSVC bei Optimierungen, was die Werte zumindest für die synthetischen Workloads nicht mehr vergleichbar macht. Scalar (realistic) war aber nicht schneller als Wine.
Mit einer Version 3.0 mit Cross-Platform/Compiler-Support und weiteren Optimierungen wird daher vermutlich die Vergleichbarkeit zu den alten Versionen nicht mehr gegeben sein. Aber erst in ein paar Wochen, wenn ich wieder Opus-Prompts habe.

x-force
2025-12-01, 23:20:07
hängt natürlich vom voltage offset ab, mit -10 ca. 3950MHz/0.915V/65W PPT, mit -30 sind es ca. 4GHz/0.855V/60W PPT. damit ist man dann schon effizinter als der M3. :D

da hat amd mal eben von n5 auf n4x 28% mehr transistoren auf minimal kleinere fläche gequetscht und in +22% ipc leistung umgesetzt.
jetzt bitte nochmal die gleiche übung und die fläche verdoppeln... wäre immer noch monolitisch ne ecke kleiner als intel mit dem 285.

Cubitus
2025-12-02, 00:41:13
Zweitsystem aus der alten Heimat

13600K, leicht übertaktet + UV mit Loadline Level 4.
Sparsam und Workload kann er :)

https://i.postimg.cc/1XqtZ2fY/Screenshot-2025-12-02-003400.png (https://postimg.cc/ZvJZ8fPr)

Gebrechlichkeit
2025-12-02, 16:42:55
templimit (<65º)

benchmark, auto
Shader Stress 2.1-Universal Benchmark Result
CPU: Intel(R) Core(TM) i5-10400 CPU @ 2.90GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 46.4k Jobs/s
Minute 2: 46.5k Jobs/s
Minute 3: 46.1k Jobs/s
----------------------------------------
WINNER: Interval 2 (46.5k Jobs/s)

benchmark, scalar
Shader Stress 2.1-Universal Benchmark Result
CPU: Intel(R) Core(TM) i5-10400 CPU @ 2.90GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 1.5k Jobs/s
Minute 2: 1.5k Jobs/s
Minute 3: 1.4k Jobs/s
----------------------------------------
WINNER: Interval 1 (1.5k Jobs/s)


no templimit (>85º)

benchmark, auto
Shader Stress 2.1-Universal Benchmark Result
CPU: Intel(R) Core(TM) i5-10400 CPU @ 2.90GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 63.3k Jobs/s
Minute 2: 57.7k Jobs/s
Minute 3: 57.6k Jobs/s
----------------------------------------
WINNER: Interval 1 (63.3k Jobs/s)

benchmark, scalar
Shader Stress 2.1-Universal Benchmark Result
CPU: Intel(R) Core(TM) i5-10400 CPU @ 2.90GHz
Workload: Scalar real.
----------------------------------------
Minute 1: 2.1k Jobs/s
Minute 2: 2.1k Jobs/s
Minute 3: 2.0k Jobs/s
----------------------------------------
WINNER: Interval 2 (2.1k Jobs/s)

aufkrawall
2025-12-02, 17:27:13
Gibt offenbar einen Bug im Logging, dass er den Modus nicht korrekt benennt. Investigaten...
Anekdote: Mit der nativen Linux-Version bzw. dem Compiler-Wechsel (betrifft nicht die releasten Versionen) lief der AVX2-Pfad nicht mehr mit hohem Verbrauch, Ergebnis also komische 100% Allcore-Last auf allen Kernen bei nur 70W. Dadurch boostete offenbar mein 5700X zu hoch und das System verabschiedete sich mehrfach sofort mit Reboot. :freak: Ohne Custom PBO-Einstellungen crashte es dann nicht mehr.
Ist in über zwei Jahren realen Nutzungsszenarien und anderen Stresstests noch nicht einmal vorgekommen. :eek:
Vielleicht auch eine lustige Idee als Modus.

2.2 (keine Änderung der Performance):
https://github.com/aufkrawall/Shader-Stress/releases/tag/2.2

Raff
2025-12-03, 09:44:01
Moin!

Ich habe v2.2 schnell auf meinem sekundären Testrechner laufen lassen:

https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=94759&stc=1&d=1764751427

Core i9-14900K ohne SMT, dafür mit mildem Undervolting, "offener" Power und DDR5-7200 unter einem frischen Windows 11 25H2. Verglichen mit Darkman.X (https://www.forum-3dcenter.org/vbulletin/showpost.php?p=13846956&postcount=45) im Nachteil – SMT hilft also (erwartungsgemäß). :)

MfG
Raff

Colin MacLaren
2025-12-03, 20:54:29
GPD Win5 @75W.

aufkrawall
2025-12-03, 21:02:08
Verglichen mit Darkman.X (https://www.forum-3dcenter.org/vbulletin/showpost.php?p=13846956&postcount=45) im Nachteil – SMT hilft also (erwartungsgemäß). :)

Jo. Mit HT wäre ein 285K allen noch enteilter als ohnehin schon.
Auch mal im Bios für den 5700X abschalten...