PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Linpack Xtreme 0.9.3


hq-hq
2018-10-22, 21:21:52
ein CPU Benchmark, angeblich sehr fordernd ( https://www.techpowerup.com/forums/threads/linpack-xtreme-released.247335/ )

"I created this project because Prime95 is no longer effective like it used to be. LinX, IntelBurnTest, OCCT use outdated Linpack binaries from 2012. Make sure to keep an eye on the temperatures as Linpack generates excessive amount of stress like never seen before."

Downloadlink: https://www.techpowerup.com/download/linpack-xtreme/

8700k@5200MHz, ~160Watt und 61°C Peak (Wassertemp 23°C)



Linpack Xtreme v0.9.3 by Regeneration (64-bit)

Current date/time: Mon Oct 22 21:12:02 2018

CPU frequency: 5.211 GHz
Number of CPUs: 1
Number of cores: 6
Number of threads: 12

Parameters are set to:

Number of tests: 1
Number of equations to solve (problem size) : 14200
Leading dimension of array : 14200
Number of trials to run : 3
Data alignment value (in Kbytes) : 4

Maximum memory requested that can be used=1613408096, at the size=14200

=================== Timing linear equation system solver ===================

Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
14200 14200 4 7.832 243.7753 1.571747e-010 2.759450e-002 pass
14200 14200 4 7.851 243.1744 1.571747e-010 2.759450e-002 pass
14200 14200 4 7.818 244.2124 1.571747e-010 2.759450e-002 pass

Performance Summary (GFlops)

Size LDA Align. Average Maximal
14200 14200 4 243.7207 244.2124

Residual checks PASSED

End of tests

Drücken Sie eine beliebige Taste . . .

Daredevil
2018-10-22, 22:02:25
Edit: Nicht stabil, andere Werte weiter unten.

Holy Mother! 50% Auslastung und 225w Verbrauch. ;D
3930k@4.7Ghz
https://abload.de/img/unbenannt6sifx.png

Linpack Xtreme v0.9.3 by Regeneration (64-bit)

Current date/time: Mon Oct 22 21:59:13 2018

CPU frequency: 4.698 GHz
Number of CPUs: 1
Number of cores: 6
Number of threads: 12

Parameters are set to:

Number of tests: 1
Number of equations to solve (problem size) : 14200
Leading dimension of array : 14200
Number of trials to run : 3
Data alignment value (in Kbytes) : 4

Maximum memory requested that can be used=1613408096, at the size=14200

=================== Timing linear equation system solver ===================

Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
14200 14200 4 12.120 157.5306 1.919978e-010 3.370824e-002 pass
14200 14200 4 11.962 159.6134 1.937880e-010 3.402255e-002 pass
14200 14200 4 11.453 166.7014 1.919978e-010 3.370824e-002 pass

Performance Summary (GFlops)

Size LDA Align. Average Maximal
14200 14200 4 161.2818 166.7014

Residual checks PASSED

End of tests

Drücken Sie eine beliebige Taste . . .

hq-hq
2018-10-22, 23:00:48
:usweet: wow, glaube bei mir limitiert etwas, die drei Runs lasten die Kerne nach HWiNFO64 im Schnitt mit nur ~60% aus (die erste Hälfte ca. 25% die zweite ca. 95%) ... angeblich hängt der Bench stark an der Speicherbandbreite... du hast ja eine relativ hohe Bandbreite zur Rechenleistung, vielleicht würgt das den 8700k ab

von 3866MHz auf 2666MHz DDR4 Takt reduziert und es bricht stark ein (8700k@5200MHz bei ~135Watt):

Size LDA Align. Time(s) GFlops
14200 14200 4 10.980 173.8790
14200 14200 4 10.957 174.2429
14200 14200 4 10.970 174.0400

der Bench hängt also heftig am Speichertakt

Darkman.X
2018-10-23, 03:30:22
@Daredevil:
Auch wenn LinX "pass" schrieb, so war der Test bei dir ein "fail". Das war, wenn ich mich richtig erinnere, ein Problem von LinX, welches mit irgendeiner LinX-Version oder Intel-LinPack-Version (darauf basiert es ja) anfing: Es konnte keine Fehler erkennen. EDIT: Das ist ein anderes LinX. Ich kannte nur eine mit Windows-GUI, das hier ist eine CLI-Version. Vielleicht erkennt diese Version beim Stress-Test die Fehler?!

Es geht um die 2 Spalten "Residual". Dort muss das Ergebnis bei jedem Durchgang identisch sein (siehe Ergebnis von "hq-hq"). Bei dir sind die Ergebnisse nicht identisch, also ist das System nicht 100% stabil. Ob sich die "Instabilität" im Alltag bemerkbar macht, ist natürlich eine andere Frage. Aber es könnte die Ursache von seltenen Programmabstürzen sein, falls du solche hast.

Und als letztes: Das muss kein CPU-Berechnungsfehler sein, das kann auch ein RAM-Fehler sein. Ich persönlich hatte mit dem Intel-LinPack schon RAM-Fehler bei mir gefunden, die diverse andere Speichertester nicht fanden, zumindest wenn man die Test-Size händisch auf die eigene RAM-Größe optimiert.


@hq-hq:
Die Benchmark-Funktion ist zu schnell durch. Mach mal einen Stress-Test mit max. Speichergröße und max. Threads, auch wenn es nicht optimal ist. Weiterhin nur 60%?


@ Ein paar allgemeine Worte:
Ich finde die Benchmark-Funktion von LinX nicht gut, die Test-Size ist zu klein, die CPU kann seine Geschwindigkeit nicht voll entfalten. Außerdem werden so viele Threads genutzt, wie die CPU HTT-Kerne hat. Beim Intel-Linpack ist HTT aber kontraproduktiv. Wenn man die Thread-Anzahl auf die echte Kern-Anzahl begrenzt (nur beim Stress-Test möglich), erhält man auch mehr GFlops. Das alles sind zumindest die Erfahrungen auf meinem System.

Darkman.X
2018-10-23, 05:09:17
i7-5930K @ 4 GHz
16 GiB (DDR4-2666 ; Quad-Channel)


Benchmark-Funktion:
Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
14200 14200 4 7.134 267.6194 1.571747e-010 2.759450e-002 pass
14200 14200 4 7.028 271.6608 1.571747e-010 2.759450e-002 pass
14200 14200 4 7.056 270.5896 1.571747e-010 2.759450e-002 pass


Stress-Test mit 6 GB Size - Ergebnisse nach 3 Durchgängen kopiert:

6 Threads:
Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
27400 27400 4 42.803 320.4315 6.419965e-10 3.039630e-02 pass
27400 27400 4 42.822 320.2871 6.419965e-10 3.039630e-02 pass
27400 27400 4 42.714 321.0960 6.419965e-10 3.039630e-02 pass

12 Threads ("Would you like to use all available threads?"):
Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
27400 27400 4 45.304 302.7394 6.374393e-10 3.018053e-02 pass
27400 27400 4 45.281 302.8937 6.374393e-10 3.018053e-02 pass
27400 27400 4 46.635 294.0997 6.374393e-10 3.018053e-02 pass

Daredevil
2018-10-23, 11:53:13
Stabil ist das definitiv nicht. :D
Beim Test ist er auch fein throttlen gegangen.

Ich meld mich nochmal, wenn der zweite Lüfter und das Liquid Metal aufgetragen sind und ich das ganze auch Stresstest stable bekomme. ^^

aufkrawall
2018-10-23, 11:59:17
Passt auf eure Kabel und Anschlüsse auf.

hq-hq
2018-10-23, 21:11:36
@hq-hq:
Die Benchmark-Funktion ist zu schnell durch. Mach mal einen Stress-Test mit max. Speichergröße und max. Threads, auch wenn es nicht optimal ist. Weiterhin nur 60%?




oha, mal 2GB probiert mit 6 Threads und jetzt sind es ~195Watt und bis zu 75°C Peak bei 23.4°C Wassertemperatur.

läuft auf Dauer nicht, da müsste ich wohl die Spannung um 25-50mV anheben - allerdings ist dafür die Spannungsversorgung auf dem Mainboard zu schwach das über einen längeren Zeitraum zu stemmen...



Linpack Xtreme v0.9.3 by Regeneration (64-bit)

Current date/time: Tue Oct 23 21:04:30 2018

CPU frequency: 5.211 GHz
Number of CPUs: 1
Number of cores: 6
Number of threads: 6

Parameters are set to:

Number of tests: 1

Number of equations to solve (problem size) : 15825
Leading dimension of array : 15825
Number of trials to run : 5
Data alignment value (in Kbytes) : 4
Maximum memory requested that can be used=2003765596, at the size=15825

=================== Timing linear equation system solver ===================

Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
15825 15825 4 6.523 405.1055 1.045965e-09 1.478762e-01 pass
15825 15825 4 6.390 413.5171 2.888702e-10 4.083985e-02 pass
15825 15825 4 6.497 406.7463 2.377856e-07 3.361761e+01 FAIL

Hardware failure detected. System failed to maintain stability.

Drücken Sie eine beliebige Taste . . .


mit 12 Threads bei max Speichergrösse (wobei das wohl egal ist ob 2 oder max) sind es 205Watt, das ist zuviel für das Mobo und wahrscheinlich auch für die CPU - die Auslastung scheint jetzt zu stimmen :freak:

ooh, i see, im Bios hab ich ein long term limit von 180Watt, ein nicht näher definiertes Limit mit 210Watt und kurzzeitig 250Watt - darum hängt er bei ~205Watt und drosselt, später kommen dann die 180Watt, tja damit stimmt die Beschreibung von Linpack Xtreme
Die Kühlung der Spannungswandler ist zu schwach, das geht nicht anders - das hatte ich mal gesetzt weil SpaWas auf Mobo >100°C

Linpack 0.9.3 mit short term 250Watt ohne Drosselung im Vergleich zu anderen CPU Benchmarks (8700k@5.200MHz)
Damit zieht Linpack tatsächlich noch mehr als Prime...


https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=64553&stc=1&d=1540327083

Darkman.X
2018-10-24, 06:35:20
:)

Wenn man auf Stabilität in Extrem-Situationen prüfen will, dann ist für Intel-CPUs das Linpack die Königsdisziplin. Ob's notwendig ist......keine Ahnung.

Aber das Linpack ist vermutlich auch ein Programm, dass CPUs wirklich schnell altern lässt. Ich würde es nicht tagelang laufen lassen.

Tobi120789
2018-10-24, 16:02:08
Linpack Xtreme v0.9.3 by Regeneration (64-bit)

Current date/time: Wed Oct 24 15:53:16 2018

CPU frequency: 2.993 GHz
Number of CPUs: 16
Number of cores: 16
Number of threads: 16

Parameters are set to:

Number of tests: 1
Number of equations to solve (problem size) : 14200
Leading dimension of array : 14200
Number of trials to run : 3
Data alignment value (in Kbytes) : 4

Maximum memory requested that can be used=1613408096, at the size=14200

=================== Timing linear equation system solver ===================

Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
14200 14200 4 14.490 131.7654 1.763539e-010 3.096172e-002 pass
14200 14200 4 14.575 130.9968 1.763539e-010 3.096172e-002 pass
14200 14200 4 14.525 131.4442 1.763539e-010 3.096172e-002 pass

Performance Summary (GFlops)

Size LDA Align. Average Maximal
14200 14200 4 131.4021 131.7654

Residual checks PASSED

End of tests

Drücken Sie eine beliebige Taste . . .

Maximale CPU Temperatur 33°C
Maximale Leistungsaufnahme laut HwInfo = 74,5 Watt

Hier einmal ohne SMT

Linpack Xtreme v0.9.3 by Regeneration (64-bit)

Current date/time: Wed Oct 24 16:10:56 2018

CPU frequency: 2.993 GHz
Number of CPUs: 8
Number of cores: 8
Number of threads: 8

Parameters are set to:

Number of tests: 1
Number of equations to solve (problem size) : 14200
Leading dimension of array : 14200
Number of trials to run : 3
Data alignment value (in Kbytes) : 4

Maximum memory requested that can be used=1613408096, at the size=14200

=================== Timing linear equation system solver ===================

Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
14200 14200 4 12.125 157.4595 2.197270e-010 3.857655e-002 pass
14200 14200 4 12.012 158.9435 2.197270e-010 3.857655e-002 pass
14200 14200 4 12.028 158.7386 2.197270e-010 3.857655e-002 pass

Performance Summary (GFlops)

Size LDA Align. Average Maximal
14200 14200 4 158.3805 158.9435

Residual checks PASSED

End of tests

Drücken Sie eine beliebige Taste . . .

Maximale CPU Temperatur 33°C
Maximale Leistungsaufnahme laut HwInfo = 78,5 Watt

Achill
2018-10-24, 20:40:47
6850k@4.4GHz / UC@3.6GHz / PowerLimit@180W (Bios)
DDR4-2800@14-16-16-36-T1 ist mit Quad-Chanel ~70GB/s Read | ~75GB/s Write | ~72GB/s Copy

https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=64563&stc=1&d=1540406256

Peak Core: 86°
Peak Package: 81°
Peak CPU Power: 185W

W.Temp war bei 28°C ... die Vega64 heizt schon gut, hoffe wir sehen das noch nicht alsbald in Spielen, brauche das nicht auch noch für die CPU ... ;D

Tobi120789
2018-10-25, 13:07:46
Gibt einen grund warum Ryzen bei den GFlops so extrem langsam ist? Gut mein Ryzen lief nur auf 3GHz aber trotzdem die Werte sind ja fast schon erbärmlich ^^

SKYNET
2018-10-25, 14:00:53
muss mal sehen was mein kleines monster da reissen kann... wenn das ding am speicher hängt, sollte mein baby da ja gut mitmischen können.

Daredevil
2018-10-27, 13:09:09
Holy Mother! 50% Auslastung und 225w Verbrauch. ;D
3930k@4.7Ghz


Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
14200 14200 4 12.120 157.5306 1.919978e-010 3.370824e-002 pass
14200 14200 4 11.962 159.6134 1.937880e-010 3.402255e-002 pass
14200 14200 4 11.453 166.7014 1.919978e-010 3.370824e-002 pass

Performance Summary (GFlops)

Size LDA Align. Average Maximal
14200 14200 4 161.2818 166.7014
So, Update. :)
Der Noctua hat nun zwei Lüfter und es klebt Liquid Metal drunter.
Es sind nur noch 220w peak und das ganze kommt nicht über 80°C. Es drosselt natürlich auch nicht mehr. :D
https://abload.de/img/unbenanntzhfp7.png

BlackArchon
2018-10-27, 13:57:36
Gibt einen grund warum Ryzen bei den GFlops so extrem langsam ist? Gut mein Ryzen lief nur auf 3GHz aber trotzdem die Werte sind ja fast schon erbärmlich ^^
Ryzen kann 256- und 512-bittigen AVX-Code nur in 128-Bit-Häppchen ausführen, das kostet Performance. Deshalb ist Ryzen bei extrem rechenoptimierten Anwendungen auch nur halb so schnell wie eine ansonsten gleichwertige Intel-CPU mit AVX und AVX2. Bei AVX512-Code sieht es dann natürlich noch düsterer aus. Glücklicherweise werden solche hochoptimierten Programmcodes nur beim Video-Encoding (speziell HEVC/x265) und wissenschaftlichen Berechnungen benutzt.

Achill
2018-10-27, 14:13:55
Ryzen kann 256- und 512-bittigen AVX-Code nur in 128-Bit-Häppchen ausführen, das kostet Performance. Deshalb ist Ryzen bei extrem rechenoptimierten Anwendungen auch nur halb so schnell wie eine ansonsten gleichwertige Intel-CPU mit AVX und AVX2. Bei AVX512-Code sieht es dann natürlich noch düsterer aus. Glücklicherweise werden solche hochoptimierten Programmcodes nur beim Video-Encoding (speziell HEVC/x265) und wissenschaftlichen Berechnungen benutzt.

Wobei es auch die RAM-Bandbreite/-Latenz sein kein. DD hat laut Info im Profil seinen Speicher mit 2400 MHz laufen. Und hq hatte gezeigt, wie bei ihm die Performance durch das Senken der RAM-Bandbreite einbricht. Ich würde die Aussage zu Ryzen & Performance noch nicht als endgültig betrachten.

Wahrscheinlich der Lauf mit 3866MHz:

[..]
Size LDA Align. Time(s) GFlops
14200 14200 4 7.832 243.7753
14200 14200 4 7.851 243.1744
14200 14200 4 7.818 244.2124
[..]


Lauf mit 2666MHz:

[..]
von 3866MHz auf 2666MHz DDR4 Takt reduziert und es bricht stark ein (8700k@5200MHz bei ~135Watt):

Size LDA Align. Time(s) GFlops
14200 14200 4 10.980 173.8790
14200 14200 4 10.957 174.2429
14200 14200 4 10.970 174.0400

der Bench hängt also heftig am Speichertakt

Tobi120789
2018-10-27, 14:48:02
Ryzen kann 256- und 512-bittigen AVX-Code nur in 128-Bit-Häppchen ausführen, das kostet Performance.

Könnte man das Hochrechnen wie schnell die wären wenn sie auch AVX 512 usw. könnten? Also 320GFlops für den Ryzen 7 1700 @ 3GHz ohne HT? Wäre das Relalistisch? ;D

BlackArchon
2018-10-27, 22:17:47
Hier ist das gut erklärt, warum AMD bei hochoptimierter Software einen Nachteil hat: http://www.numberworld.org/y-cruncher/faq.html#amd

Damit ich auch ein Ergebnis beisteuern kann: Ein Braswell-basierter Celeron N3160 (4 Kerne, Turbo bis zu 2,24 GHz) und 16 GB DDR3-1600 im Dualchannel-Modus kommt auf 2,2 GFlops. :D

Tobi120789
2018-10-28, 11:32:13
Interessant, Zen 2 wird also wird also auch kein AVX512 können. Schade, da liegt dann wohl einiges an Leistung brach, naja wird wohl seinen grund haben warum sie das nicht unterstützen.

dildo4u
2018-10-28, 12:10:35
Es macht null Sinn besser AVX support zu bringen wenn dann weniger Cores ins Transistor Budget passen.Ein 12 Core Threadripper sollte z.b in Handbrake auf Level mit dem 9900k sein.Und beim Rest wäre er dann deutlich besser.

Tobi120789
2018-10-28, 13:30:51
Ryzen 7 2700 = 4.800.000.000 Transistoren | 12 nm | 213 mm² = 22.535.211 Transistore Pro mm²
i9 9900K = ??? Transistoren | 14 nm | 178 mm² = ??? Pro mm²

Leider findet man nix über die Anzahl der Transistoren in den i9 9900K Prozessoren. Müssten ja erheblich weniger sein. Frag mich wofür die bei AMD draufgehen?

Daredevil
2018-10-28, 14:13:39
Für die Infinity Fabric, die kostet Fläche. Zumindest habe ich das letztens gelesen. ^^
Zudem hat AMD ja auch bei 12nm Zen+ keine DIE Verkleinerung geplant gehabt, es ist ja so geblieben wie bei 14nm. ( Obwohl der Unterschied eh nicht groß war. )

Twodee
2018-10-30, 08:34:00
muss mal sehen was mein kleines monster da reissen kann... wenn das ding am speicher hängt, sollte mein baby da ja gut mitmischen können.
na traut sich dein kleines Monster nicht? :rolleyes:

Frank1974
2018-10-30, 15:41:35
AMD Ryzen 7 2700X@4GHz, Turbo off
DDR4-3200@3000MHz 16-16-16-36-1T
Windows 10 x64, v1803

Linpack Xtreme v0.9.3 by Regeneration (64-bit)

Current date/time: Tue Oct 30 15:38:31 2018

CPU frequency: 3.990 GHz
Number of CPUs: 16
Number of cores: 16
Number of threads: 16

Parameters are set to:

Number of tests: 1
Number of equations to solve (problem size) : 14200
Leading dimension of array : 14200
Number of trials to run : 3
Data alignment value (in Kbytes) : 4

Maximum memory requested that can be used=1613408096, at the size=14200

=================== Timing linear equation system solver ===================

Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
14200 14200 4 10.269 185.9326 1.763539e-010 3.096172e-002 pass
14200 14200 4 10.313 185.1355 1.763539e-010 3.096172e-002 pass
14200 14200 4 10.316 185.0789 1.763539e-010 3.096172e-002 pass

Performance Summary (GFlops)

Size LDA Align. Average Maximal
14200 14200 4 185.3823 185.9326

Residual checks PASSED

End of tests

Drücken Sie eine beliebige Taste . . .

mfg
Frank

Tobi120789
2018-10-30, 15:58:09
Hi, kannst du auch mal ohne HT Testen?
mfg

Frank1974
2018-10-30, 16:13:54
Hi, kannst du auch mal ohne HT Testen?
mfg

AMD Ryzen 7 2700X@4GHz, Turbo off, SMT off
DDR4-3200@3000MHz 16-16-16-36-1T
Windows 10 x64, v1803

Linpack Xtreme v0.9.3 by Regeneration (64-bit)

Current date/time: Tue Oct 30 16:12:00 2018

CPU frequency: 3.990 GHz
Number of CPUs: 8
Number of cores: 8
Number of threads: 8

Parameters are set to:

Number of tests: 1
Number of equations to solve (problem size) : 14200
Leading dimension of array : 14200
Number of trials to run : 3
Data alignment value (in Kbytes) : 4

Maximum memory requested that can be used=1613408096, at the size=14200

=================== Timing linear equation system solver ===================

Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
14200 14200 4 9.161 208.4029 2.197270e-010 3.857655e-002 pass
14200 14200 4 9.174 208.1063 2.197270e-010 3.857655e-002 pass
14200 14200 4 9.356 204.0638 2.197270e-010 3.857655e-002 pass

Performance Summary (GFlops)

Size LDA Align. Average Maximal
14200 14200 4 206.8577 208.4029

Residual checks PASSED

End of tests

Drücken Sie eine beliebige Taste . . .

mfg
Frank

BlackArchon
2018-10-30, 17:34:12
Wow, 12% mehr Performance durch deaktivieren von HT? Das ist ja mal interessant. Wie sieht es bei Intel diesbezüglich aus?

Achill
2018-10-30, 21:10:54
Wow, 12% mehr Performance durch deaktivieren von HT? Das ist ja mal interessant. Wie sieht es bei Intel diesbezüglich aus?


Dort auch, siehe:

i7-5930K @ 4 GHz
16 GiB (DDR4-2666 ; Quad-Channel)


Benchmark-Funktion:
Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
14200 14200 4 7.134 267.6194 1.571747e-010 2.759450e-002 pass
14200 14200 4 7.028 271.6608 1.571747e-010 2.759450e-002 pass
14200 14200 4 7.056 270.5896 1.571747e-010 2.759450e-002 pass


Stress-Test mit 6 GB Size - Ergebnisse nach 3 Durchgängen kopiert:

6 Threads:
Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
27400 27400 4 42.803 320.4315 6.419965e-10 3.039630e-02 pass
27400 27400 4 42.822 320.2871 6.419965e-10 3.039630e-02 pass
27400 27400 4 42.714 321.0960 6.419965e-10 3.039630e-02 pass

12 Threads ("Would you like to use all available threads?"):
Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
27400 27400 4 45.304 302.7394 6.374393e-10 3.018053e-02 pass
27400 27400 4 45.281 302.8937 6.374393e-10 3.018053e-02 pass
27400 27400 4 46.635 294.0997 6.374393e-10 3.018053e-02 pass

BlackArchon
2018-10-30, 21:36:56
Danke für's Testen! :)

Jetzt bräuchten wir einen CPU-Guru, der uns das näher erklärt.

hq-hq
2018-10-30, 23:18:12
Unterschied zwischen 12 v 12, 6 v 12 Threads und HT deaktiviert 6 v 6 Threads... als ob geringe "fremde" Speicherzugriffe bereits lähmend wirken

lief mit 2GB @ 8700k @ 5.00GHz (1.296-1.308V, AVX_Offset=0) / 4800MHz Uncore / 3866MHz DDR4 16 16 16 30

https://abload.de/img/versus_linpack_thread5lemo.png

12v12 = 100.00%, 6v12 = 101.02% , 6v6 = 104.68%

Achill
2018-10-31, 00:11:28
Ich kann es nicht im Detail erklären, jedoch ist das Kern-Prinzip von HT die Verbesserung der Effizienz indem sich zwei Threads die Recheneinheiten (ALUs & FPUs) eines Cores teilen und ein Thread immer dann rechnet, wenn der andere gerade auf Daten wartet. Es kann jedoch (nach meinen Verständnis) immer nur ein Thread die Recheneinheiten nutzen, der andere Thread wartet und damit einher gehen muss der Wechsel auch synchronisieren werden bzw. es gibt dort definitiv ein Overhead.

"Normalen Programmen" stellen kein Problem da, weil genügend Lücken durch Waits (auf IO) existieren, sodass der jeweils andere Thread an die Reihe kommt.

Bei einen hoch optimierten Programm (Auslastung, Register, Cache-Lines & Daten-Lokalität, Latenzen, ...) kann dann der Effekt eintreten, dass der phys. Core schon durch ein Thread sehr gut ausgelastet ist und der Wechsel zwischen den Threads mehr kostet als er noch bringt.

--
Das ist aber mein Verständnis von HT - ich sage explizit, dass dies ggf. nicht (vollständig) richtig ist.

Darkman.X
2018-10-31, 02:46:42
Das sehe ich genauso. Das Linpack kommt von Intel, die werden wohl wissen wie sie ihre Kerne/Recheneinheiten auch ohne HTT perfekt auslasten können.