Archiv verlassen und diese Seite im Standarddesign anzeigen : Intel - SMT-Skalierung in Games über verschiedene Architekturen
Okay, mach ich heute abend. Die Stromsparmodi duerften alle an sein (kann ich von der Arbeit aus nicht checken). Gibt es fuer "Core Parking" noch andere Begriffe?
Wenn ich mich recht erinnere, dann nützt Coreparking C6, d.h. wenn das aus ist und der niedrigste Stromsparmodus im BIOS auf C3 steht, sollte man keine Probleme haben.
Einfach mal im Resourcenmonitor / Taskmanger nachschauen, ob was geparkt ist.
Ph0b0ss
2013-08-31, 02:11:36
Die Core Parking Option in den Energieoptionen kann über die Registry aktiviert werden:
http://diit.cz/clanek/analyzing-core-parking-in-windows-7-and-windows-8-in-relation-to-amd-bulldozer-performance-in
Die Einstellung 100% in den Energieoptionen sollte dann maximale Performance bringen. Am besten mal 0% gegen 100% mit dem Benchmark im Winrar austesten und dabei auch den Taskmanager beobachten!
Da gibts schon Tools dazu, die das automatisch machen, aber ich denke C3 im BIOS ist am einfachsten.
Ph0b0ss
2013-08-31, 12:44:55
Da gibts schon Tools dazu, die das automatisch machen, aber ich denke C3 im BIOS ist am einfachsten.
Also zumindest bei meinem Nehalem ist Core Parking selbst mit allen Stromsparmechanismen im BIOS deaktiviert noch aktiv!
Echt? Ok, dann hab ichs falsch in Erinnerung, dann hier das Tool:
http://bitsum.com/about_cpu_core_parking.php
Ronny145
2013-08-31, 15:16:37
Im neuen PCGH Heft gibt es 0,5ms Werte der PCGH Benchszene.
i7-4770k 94,8 fps
i5-4670k 79,1 fps
i7-3770k 77,3 fps
i5-3570k 60,5 fps
FX-8350 57,4 fps
Demnach wäre der FX-8350 nicht vom Timer Bug betroffen gewesen. Der Wert blieb unverändert im Gegensatz zu Haswell und Ivy Bridge. Oder hat man diesen vergessen? :freak:
SMT bringt taktbereinigt 17% beim Haswell falls hier keine GPU Limitierung vorliegt.
dargo
2013-08-31, 15:18:07
Die Szene der PCGH kann man eh vergessen was höchste CPU-Last im Spiel angeht. Der FX wird aber böse verhauen wenn man sich überlegt, dass so ein Xeon E3-1230V3 bereits knapp über 200€ kostet. :freak:
PS: hier liegt eindeutig GPU-Limit vor. Das siehst du schon an den Ergebnissen Ivy vs. Haswell (jeweils non SMT vs. SMT). Selbst bei Ivy würde ich einen leichten GPU-Limit nicht ausschließen. Die Szene ist einfach schlecht gewählt. Sorry @PCGH, es ist aber nunmal so.
Ronny145
2013-08-31, 15:23:10
Es lässt sich dennoch einiges rauslesen. Bulldozer hat trotz der Gras MT Herrlichkeit nichts zu melden gegen Haswell, die SMT Skalierung ist zu sehen und der deutliche IPC Vorsprung gegenüber IVB wird sichtbar.
dargo
2013-08-31, 15:29:56
Es lässt sich dennoch einiges rauslesen. Bulldozer hat trotz der Gras MT Herrlichkeit nichts zu melden gegen Haswell, die SMT Skalierung ist zu sehen und der deutliche IPC Vorsprung gegenüber IVB wird sichtbar.
Das weiß ich schon lange. ;)
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9856591&postcount=105
@3,7Ghz liefert die CPU ca. 47fps. Ein 3,7Ghz 4C/8T Haswell ca. 59fps, ergo +~25%.
Ronny145
2013-09-01, 01:24:10
PS: hier liegt eindeutig GPU-Limit vor. Das siehst du schon an den Ergebnissen Ivy vs. Haswell (jeweils non SMT vs. SMT). Selbst bei Ivy würde ich einen leichten GPU-Limit nicht ausschließen. Die Szene ist einfach schlecht gewählt. Sorry @PCGH, es ist aber nunmal so.
Das glaube ich nicht. Die haben einen Titan @900 Mhz verwendet in 720p ohne AA. Meine 660 Ti limitiert in dem Setting nur leicht ab 75-80 fps. Die Titan sollte gut und gerne doppelt so viel fps produzieren können, eher mehr. In dem FPS Bereich limitiert ganz sicher nicht die GPU mit Titan. Außerdem gibt es noch schnellere CPUs im Test, der Xeon E5-2867W erreicht 102,1 fps.
dargo
2013-09-01, 09:43:40
Nur weil eine Grafikkarte leicht limitiert bedeutet das nicht, dass eine schnellere CPU nichts mehr bringt. Der Übergang ist fließend. Wenn die PCGH in der Testszene keinen Fehler gemacht hat limitiert hier eindeutig schon zum Teil die Titan. Der i7-4770k müsste ca. 101fps erreichen. Das siehst du schon bei Ivy non SMT vs. SMT. Der Wert vom i7-4770k ist zu niedrig. Es gibt keinen Grund warum SMT beim Haswell schlechter skalieren sollte als bei Ivy. Der Xeon E5-2867W würde mehr als 102fps liefern mit einer schnelleren Graka als die Titan. Oder halt in meiner Szene sich stärker vom i7-4770K absetzen.
Ronny145
2013-09-01, 11:20:59
Nur weil eine Grafikkarte leicht limitiert bedeutet das nicht, dass eine schnellere CPU nichts mehr bringt.
Natürlich bringt eine schnellere CPU mehr fps solange die GPU nicht 100% limitiert.
Der Übergang ist fließend. Wenn die PCGH in der Testszene keinen Fehler gemacht hat limitiert hier eindeutig schon zum Teil die Titan. Der i7-4770k müsste ca. 101fps erreichen. Das siehst du schon bei Ivy non SMT vs. SMT.
Nein das sieht man nicht. Du kannst nicht so einfach von IVB auf HSW schließen. Auch könnte es genauso sein, dass ein IVB Wert falsch ist. Dann würde deine Rechnung nicht aufgehen. Titan kann dort nicht limitieren, dazu sind die Werte viel zu niedrig.
Der Wert vom i7-4770k ist zu niedrig. Es gibt keinen Grund warum SMT beim Haswell schlechter skalieren sollte als bei Ivy.
Bessere IPC, schlechtere SMT Skalierung. Das wäre ein ganz simpler Grund.
dargo
2013-09-01, 12:09:33
Nein das sieht man nicht. Du kannst nicht so einfach von IVB auf HSW schließen. Auch könnte es genauso sein, dass ein IVB Wert falsch ist. Dann würde deine Rechnung nicht aufgehen. Titan kann dort nicht limitieren, dazu sind die Werte viel zu niedrig.
Es ist völlig egal was da bei der PCGH nicht stimmt. Ob GPU-Limit oder nicht auch egal. Haswell skaliert bei SMT nicht schlechter als Ivy, ganz im Gegenteil. Und das hat dir schon Simon mit meiner Szene gezeigt. Ivy +~36%, Haswell +~40%. Es macht auch keinen Sinn über die Ergebnisse der PCGH weiter zu diskutieren weil die Szene einfach Mist ist.
Bessere IPC, schlechtere SMT Skalierung. Das wäre ein ganz simpler Grund.
Sorry, aber das ist keine Erklärung sondern Unsinn. Ich stelle mir das gerade vor... mit jeder neuen CPU von Intel nimmt die SMT-Skalierung ab weil die IPC steigt. :| SMT-Skalierung hat rein gar nichts mit der IPC zu tun. Da gibt es keine direkten Abhängigkeiten.
Ronny145
2013-09-01, 12:29:06
Es ist völlig egal was da bei der PCGH nicht stimmt. Ob GPU-Limit oder nicht auch egal. Haswell skaliert bei SMT nicht schlechter als Ivy, ganz im Gegenteil. Und das hat dir schon Simon mit meiner Szene gezeigt. Ivy +~36%, Haswell +~40%. Es macht auch keinen Sinn über die Ergebnisse der PCGH weiter zu diskutieren weil die Szene einfach Mist ist.
Sorry, aber das ist keine Erklärung sondern Unsinn. Ich stelle mir das gerade vor... mit jeder neuen CPU von Intel nimmt die SMT-Skalierung ab weil die IPC steigt. :| SMT-Skalierung hat rein gar nichts mit der IPC zu tun. Da gibt es keine direkten Abhängigkeiten.
Kein Unsinn sondern Realität. Umso effizienter die Kernleistung ist desto weniger bringt SMT. Schau dir den in-order Atom an. Oder schau dir die SMT Core speedup Entwicklung der letzten Jahre an. Die nahm minimal ab, eben weil gleichzeitig die Kerneffizienz angestiegen ist. Im Durchschnitt skaliert das SMT nicht schlechter, das verhindert noch lange keine Ausnahmen nach oben oder unten. Und wie gesagt, wenn auch nur einer der IVB Werte nicht stimmt, kannst du deine Rechnung vergessen.
dargo
2013-09-01, 12:44:20
Kein Unsinn sondern Realität. Umso effizienter die Kernleistung ist desto weniger bringt SMT.
Nein, nicht zwangsläufig!
Und wie gesagt, wenn auch nur einer der IVB Werte nicht stimmt, kannst du deine Rechnung vergessen.
Die Werte der PCGH habe ich schon lange abgehakt, ist Zeitverschwendung weil zu viele Fragezeichen.
Tesseract
2013-09-01, 17:52:29
Umso effizienter die Kernleistung ist desto weniger bringt SMT.
IPC ist nicht das gleiche wie auslastung. eine neue architektur kann IPC-stärker sein und trotzdem einen geringeren auslastungsgrad haben und in dem fall kann SMT auch mehr bringen als bei der vorgängergeneration.
Duplex
2013-09-01, 19:23:58
Bei Haswell wurde das Backend gegenüber den Vorgänger erweitert, ich glaube nicht das die SMT Performance abnimmt.
Botcruscher
2013-09-01, 19:46:45
Dank der zusätzlichen Einheiten müsste da noch deutlich mehr drin sein. Imo was nettes für einen Test. Irgendwo muss da ja der Flaschenhals stecken.
Ronny145
2013-09-01, 22:59:12
Nein, nicht zwangsläufig!
Das hat auch keiner behauptet. Du wolltest einen Grund hören, den habe ich genannt. Ob er zutreffend ist, weiß ich nicht. Es geht darum das man nicht so einfach von IVB auf HSW schließen kann.
IPC ist nicht das gleiche wie auslastung. eine neue architektur kann IPC-stärker sein und trotzdem einen geringeren auslastungsgrad haben und in dem fall kann SMT auch mehr bringen als bei der vorgängergeneration.
Bessere Auslastung der Pipeline, mehr IPC, weniger Ausnutzungsspielraum für freie Ressourcen eines zweiten Threads. Natürlich kann man in die Breite gehen und beides steigern.
Bei Haswell wurde das Backend gegenüber den Vorgänger erweitert, ich glaube nicht das die SMT Performance abnimmt.
Davon habe ich noch nichts gesehen. Eher im Gegenteil, die Tests zeigten meist eine minimal größere Steigerung beim i5. Nach dem ht4u zu urteilen sank der speedup minimal mit Haswell. Über die letzten Generationen seit Nehalem sank der SMT speedup im Mittel um 1-2%. Über Crysis 3 sagt das nichts aus, es ist schwer aussagekräftige Tests zu finden wegen dem Timer Bug.
dargo
2013-09-02, 09:08:08
Über die letzten Generationen seit Nehalem sank der SMT speedup im Mittel um 1-2%.
Im Mittel über was? Ich hoffe du meinst nicht Games weil nahezu alles was CPU-Tests in Games angeht im Netz reiner Dünnschiss ist.
Battlefield 4 Beta-Test: Prozessor-Benchmarks und Skalierung von 1 bis 8 Threads (http://www.pcgameshardware.de/Battlefield-4-PC-238749/Tests/Battlefield-4-Beta-Test-Prozessor-Benchmarks-Cores-1091016/)
Battlefield 4 wird nach Crysis 3 wohl das beste Spiel, um ordentliches Multithreading und Vorteile durch SMT aufzuzeigen. Tadellos ist's derzeit aber nicht, das zeigt das Gesucke des FX-6xx0 ... ;)
MfG,
Raff
Ronny145
2013-10-02, 21:38:04
Der SMT-lose Core i5-3570K schlägt sich wacker, der gleichgetaktete Core i7-3770K mit SMT stemmt jedoch um zehn Prozent höhere Min-Fps.
Min FPS sind ohne Diagramm nichtssagend. Takt und Cache bereinigt würden davon vielleicht 6-7% übrig bleiben, im Schnitt gar nichts. Kein Vergleich zu Crysis 3 mit bis zu 30% Unterschied.
+16% von 4 auf 6 Kerne beim Phenom sind jetzt auch nicht so überwältigend, kein Wunder das SMT so gut wie nichts bringt.
Ok beim Bulldozer gibt es deutlich Zuwachs von 4 auf 8 Kerne. Bei einem AMD gekauften Spiel würde ich das aber nicht überbewerten.
Nightspider
2013-10-02, 21:39:00
beste Spiel? SMT bringt laut euren Benchmarks fast gar nichts.
Da gibt es Spiele die das besser können.
Kann natürlich auch an der Benchmarkszene liegen.
Min FPS sind ohne Diagramm nichtssagend. Takt und Cache bereinigt würden davon vielleicht 6-7% übrig blieben, im Schnitt gar nichts. Kein Vergleich zu Crysis 3 mit bis zu 30% Unterschied.
+16% von 4 auf 6 Kerne beim Phenom sind jetzt auch nicht so überwältigend, kein Wunder das SMT so gut wie nichts bringt.
Zumindest bei den Phenömern ist bekannt, dass der Uncore oft eine bessere Skalierung verhindert.
MfG,
Raff
Ronny145
2013-10-02, 21:46:00
FX-8350 mit 3 Modulen läuft schneller als mit 2 Modulen?
Ronny145
2013-10-02, 21:51:05
Dann kann man die Skalierung beim Bulldozer knicken. Wegen dem 3 Modul Bug sieht die Skalierung besser aus als sie wäre.
Knuddelbearli
2013-10-02, 22:49:40
Jetzt kackt NV im CPU Limit nicht mehr nur bei 2 Kernen / Threads ab sondern auch bei mehr? na super ...
Ronny145
2013-10-02, 22:53:32
Erzähl nicht so ein Mist. Getestet wurde mit einer AMD Karte.
Knuddelbearli
2013-10-02, 23:57:20
Der Test besteht mehr als nur aus Balken lies einfach mal den Text und Vergleich DANN die Balken ... :rolleyes:
Übrigens: Während unserer Tests zeigte sich erneut, dass der Geforce-Treiber einen größeren Overhead erzeugt als der Catalyst. Dies hat beim Spielen zur Folge, dass ein Geforce-PC im CPU-Limit geringere Bildraten erzeugt als der gleiche PC mit einer Radeon-Grafikkarte. Dieses Verhalten haben wir auf mehreren Systemen beobachtet und unabsichtlich bestätigt – die Kernskalierung wurde mit einer Radeon HD 7970 durchgeführt, die übrigen Benchmarks mit einer Geforce GTX Titan. Wie Sie den Werten entnehmen, fallen die Fps bei der Kernskalierung höher aus als bei den Benchmarks oben.
fps titan vs 7970 GHz im CPU Limit
35 vs 38
45 vs 48
49 vs 52
klar nicht die Welt und vor allem weniger als bei den 2 Kernern, aber trotzdem fast schon 2 stellige Prozentwerte gerade wenn man eh schon geringe FPS hat ( scheinen konstant immer 3 fps zu sein )
und das könnte dann zum Teil dann auch die massiv höheren min FPS bei dem Grafikkartentest erklären
Ronny145
2013-10-03, 00:09:17
Von einem Spiel kannst du nicht auf die Allgemeinheit schließen, erst recht nicht wenn wir von einem AMD gekauften Spiel reden.
Botcruscher
2013-10-03, 13:23:47
Jetzt kackt NV im CPU Limit nicht mehr nur bei 2 Kernen / Threads ab sondern auch bei mehr? na super ...
Ja. Die Treiber sind halt scheiße. :D Intel soll auch mal endlich mehr Kerne raus hauen. 4 Kerne haben auch HT-Stützrädern ihren Zenit hinter sich.
Von einem Spiel kannst du nicht auf die Allgemeinheit schließen, erst recht nicht wenn wir von einem AMD gekauften Spiel reden. Im CPU-Limit ist es bei jedem so.
Ronny145
2013-10-03, 13:43:44
Im CPU-Limit ist es bei jedem so.
Was ist deine Quelle?
Undertaker
2013-10-03, 14:05:06
Ja. Die Treiber sind halt scheiße. :D Intel soll auch mal endlich mehr Kerne raus hauen. 4 Kerne haben auch HT-Stützrädern ihren Zenit hinter sich.
Du bekommst doch 6- und 8-Kerner für LGA2011. :) Dass diese entsprechend mehr kosten, bzw. ein 4-Kerner soviel wie ein ähnlich schneller 4-Moduler wie bei AMD, kann man Intel wohl kaum vorwerfen. Andernfalls würde es AMD wohl auch nicht mehr lange geben.
Kriton
2013-10-03, 14:40:17
Von einem Spiel kannst du nicht auf die Allgemeinheit schließen, erst recht nicht wenn wir von einem AMD gekauften Spiel reden.
Generell werden sich Auswirkungen wohl kaum nur auf BF4 beziehen, sondern eher auf die Engine generell. Und EA will AFAIK ja Frostbite bei praktisch allem verwenden (Sportspiele mal ausgenommen). Insofern werden wir dies wohl auch bei einer nicht unbeträchtlichen Anzahl anderer Spiele sehen.
Unabhängig davon ist es natürlich immer sehr erhellend wenn jemand ohne die geringsten Indizien oder auch nur Beweise mal einfach Dinge in den Raum wirft. das wirkt für mich immer sehr glaubwürdig - die Wiederholungen derselben Aussage ohne nähere Ausführungen verstärken dies ungemein. :rolleyes:
Wenn ich nicht irre haben in diesem Forum auch schon mehrere als Entwickler Tätige erwähnt, dass das so nicht funktioniert. Zwar dürften Anpassungen für AMD-Hardware vorliegen (wenn die Ingenieure dort hinschicken, was sonst sollen die tun?), aber keine Verschlimmerungen für Nvidia wie Du es suggerierst.
Gab es bei TWIIMTBP eigentlich auch so eine Empörung Deinerseits?
Und falls die 5-8 Millionen in den Raum geworfen werden sollten: Wieviel dafür ging für mantle drauf dessen Effekt wir hier noch nicht sehen? Und in diesem Fall sollten wir über Ubisoft und Nvidia reden...
Vielleicht profitiert AMD auch einfach davon, dass die Architektur zwischen Konsolen und ihren aktuellen PC-Prozessoren nicht so ungleich sind... schließlich müssen sich die Entwickler schon auf die Besonderheiten der AMD-Architektur einlassen sobald sie für Konsolen entwickeln.
Ronny145
2013-10-03, 14:52:08
Generell werden sich Auswirkungen wohl kaum nur auf BF4 beziehen, sondern eher auf die Engine generell.
Aha, wer sagt das es nicht am Treiber liegt? Wenn du Belege vorlegen kann, die das gleiche in anderen Frostbite Spielen zeigen, dann halt dich ran.
boxleitnerb
2013-10-03, 15:11:05
Interessanterweise gibt es auch Benchmarks, die bei AMD einen höheren Treiberoverhead sehen:
http://pclab.pl/art55028-3.html
Es wurde allerdings nur mit 24 Spielern getestet (Domination Mode), evtl. kein vollständiges CPU-Limit.
Undertaker
2013-10-03, 15:30:21
Es wurde allerdings nur mit 24 Spielern getestet (Domination Mode), evtl. kein vollständiges CPU-Limit.
Bei den kleineren CPUs mit ziemlicher Sicherheit schon. Und danach wäre in der Tat der Nvidia-Treiber etwas weniger CPU-lastig.
Meine Meinung: Je nach Treiberversion, Mainboard usw. wird sich das im Großen und Ganzen wahrscheinlich gar nix nehmen...
dargo
2013-10-03, 15:49:32
Interessanterweise gibt es auch Benchmarks, die bei AMD einen höheren Treiberoverhead sehen:
http://pclab.pl/art55028-3.html
Dort wurde Windows 8.1 getestet. Eventuell sind die Grafiktreiber noch nicht ausgereift. Afaik gibt es von AMD erst einen einzigen 8.1 Treiber. Wie sieht das bei NV aus? Sind die schon weiter?
Iruwen
2013-10-03, 16:22:13
Ja, gibt schon mehrere Betas und den 327.23 WHQL für 8.1.
Undertaker
2013-10-03, 16:59:16
Auch hier kann man die Treiberlast zwischen NV und AMD vergleichen:
http://www.anandtech.com/show/7189/choosing-a-gaming-cpu-september-2013/8
Knuddelbearli
2013-10-03, 17:24:45
Auch hier kann man die Treiberlast zwischen NV und AMD vergleichen:
http://www.anandtech.com/show/7189/choosing-a-gaming-cpu-september-2013/8
? das doch ein SLI / CF test? Wie soll man da treiberlast im CPU Limit messen?
dargo
2013-10-03, 17:25:57
? das doch ein SLI / CF test? Wie soll man da treiberlast im CPU Limit messen?
Indem man die fps bei der gleichen CPU und beiden IHVs vergleicht.
dargo
2013-10-23, 12:15:28
Kann mal einer der i7 Besitzer helfen wie Windows für volle Leistung genau konfiguriert werden soll? Ich habe jetzt den Haswell 4C/8T, mir fehlen aber mit HT irgendwie noch ca. 10% Leistung in der bekannten Crysis 3 Szene. Bei mir bringt momentan HT +23% gegenüber non HT. Das kann aber eigentlich nicht stimmen. Es müssten weit über 30% sein.
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9855586&postcount=51
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9855608&postcount=52
Benutze Windows 8 x64.
Ronny145
2013-10-23, 12:23:37
Vielleicht sind die nicht mehr vergleichbar. Als ich vor ein paar Tagen die Stelle getestet habe, bin ich nicht mehr auf meine ursprünglichen Werte gekommen. Mit und ohne manuellen Timer höchstens 1 fps Unterschied (also zwischen 10ms und 0,5 ms), vorher war der Unterschied viel größer. Gab es in der Zwischenzeit ein Update? Ich teste nachher nochmal neu um sicher zu gehen.
dargo
2013-10-23, 12:26:30
Vielleicht sind die nicht mehr vergleichbar. Als ich vor ein paar Tagen die Stelle getestet habe, bin ich nicht mehr auf meine ursprünglichen Werte gekommen. Mit und ohne manuellen Timer höchstens 1 fps Unterschied (also zwischen 10ms und 0,5 ms), vorher war der Unterschied viel größer. Gab es in der Zwischenzeit ein Update?
Nicht, dass ich wüsste. Mir ist in Windows 8 nur heute aufgefallen, dass die Timer Resolution bei mir mit 4C/4T bei 15,625ms liegt. Sobald Origin gestartet wird springt sie aber auf 1,001ms. Das passt also.
Edit:
Bei mir sieht es jetzt so aus @3,7Ghz (Timer Resolution 1,001ms).
4C/4T = 43,40 avg.fps
4C/8T = 53,67 avg.fps
Eigentlich müssten es mit HT aber ca. 59fps sein.
aufkrawall
2013-10-23, 12:39:21
Coreparking mal abgeschaltet?
Gibts ab Win 8 auch für physische Kerne. Allerdings hatte das bei mir keine zusätzlichen fps gebracht (ohne HTT).
Timer Resolution von 0,5ms bringt bei mir (4T) bei C3 aber trotzdem was:
http://www.forum-3dcenter.org/vbulletin/showthread.php?t=541586&page=8
Kanns vielleicht nachher auch nochmal mit HTT testen.
dargo
2013-10-23, 12:43:01
Coreparking mal abgeschaltet?
Gibts ab Win 8 auch für physische Kerne.
Wie? :redface:
In den Energieoptionen habe ich die minimale CPU-Auslastung von 5% auf 0% geändert.
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9899744&postcount=252
Das brachte aber praktisch nichts.
Edit:
Ach verdammt. Ich sehe gerade, dass ich da anders vorgehen muss. Die Core Parking Funktion muss ich erst freischalten. Verdammtes englisch. :D Ich hab also nur Minimum Processor State auf 0% geändert. :redface:
Edit 2:
Jetzt habe ich es.
46996
Habs doch noch geschafft. Egal ob 0% oder 100% beim Coreparking, die Frames bleiben gleich. Ok... 0,5fps mehr, aber das zähle ich zu Messschwankungen.
Hallo, welche Stelle benchst du? Gibts ne Anleitung? Macht "Maximalleistung" bei dir einen Unterschied?
Dr.Doom
2013-10-23, 14:04:01
46996
"Geben Sie die minimal zulässige Anzahl nicht geparkter Kerne/Pakete an (in Prozent)."
Woah, was für ein Bastardsatz. Ist 0% oder 100% keinem Kern parken erlauben? :ugly:
dargo
2013-10-23, 17:33:51
"Geben Sie die minimal zulässige Anzahl nicht geparkter Kerne/Pakete an (in Prozent)."
Woah, was für ein Bastardsatz. Ist 0% oder 100% keinem Kern parken erlauben? :ugly:
Das weiß ich selbst noch nicht. :freak:
Jedefalls sind die Frames in C3 gleich, egal ob 0 oder 100%.
aufkrawall
2013-10-23, 17:38:34
100% ist CP aus.
Habe "gebencht" (nur das Savegame vor dem großen Feld geladen, gewartet und nicht bewegt).
Waren ~53 vs. ~68fps, also durch HTT ~28% mehr fps.
dargo
2013-10-23, 17:52:37
100% ist CP aus.
Ok... aber irgendwo muss noch eine Bremse bei mir im System sein. Wie gesagt müsste ich ca. 59fps mit HT erreichen. Kann es sein, dass ich im Bios noch was verstellen muss? Da gibt es so viele Optionen für die CPU was Auslastung etc. angeht. Da blicke ich überhaupt nicht durch. :freak:
aufkrawall
2013-10-23, 18:02:41
Du bist doch bereits bei 25% mehr fps.
Sicher, dass es keine Messschwankung ist? Nachladeruckler etc.
Die fps schwanken an der von mir besagten Stelle allgemein.
Ronny145
2013-10-23, 18:15:24
Als erstes prüft man mit einem anderen Benchmark das System auf Normalität, denke Cinebench 11.5 würde sich anbieten. Zu dem gibt es genügend Vergleichswerte. Wenn das System generell zu langsam sein sollte, müsste es sich dort bestätigen. Auch könnte man im Bios sämtliche Stromsparsachen deaktivieren und schauen ob sich etwas gravierendes ändert. Wieso müssten es eigentlich mit HT 59 fps sein?
Tesseract
2013-10-23, 18:55:17
mach mal das hier (http://www.forum-3dcenter.org/vbulletin/showthread.php?t=546409) und schau ob du beim MP Ratio auf ~5,10 kommst.
Hübie
2013-10-23, 19:01:17
Also ich habe mal (Juli '13) mit meinem SandyBridge alle Energiesparmechanismen deaktiviert und Windows ebenfalls auf maximale Leistung gestellt. Per Inspector wurde der P0-state erzwungen. Das Ergebnis war etwas über 5% mehr Leistung bei 30% mehr Verbrauch.
Also denke ich nicht das dort der Hund begraben liegt. Ist diese timer-Geschichte bei Crysis 3 noch aktuell? Oder war das unter W8 (.1) nie ein Thema? Afaik hat W8 keinen fixen Timer mehr.
aufkrawall
2013-10-23, 19:17:15
Wie ich ein paar Posts vorher sagte, bringt das immer noch was.
Hübie
2013-10-23, 19:19:38
Unter W8 oder wie jetzt? Meinst die timer-Sache, nech?
dargo
2013-10-23, 19:31:40
Du bist doch bereits bei 25% mehr fps.
23%... ja. Es sollten aber um die 36% mit HT sein.
Sicher, dass es keine Messschwankung ist? Nachladeruckler etc.
Die fps schwanken an der von mir besagten Stelle allgemein.
Beim ersten Run gibts immer etwas Schwankungen, den ersten Run bewerte ich aber nicht.
Wieso müssten es eigentlich mit HT 59 fps sein?
Weil HT bei Ivy +36% bringt. Es wäre ziemlich unlogisch wenns beim Haswell nur 23% wären. Zudem habe ich noch die richtigen Benches der PCGH im Hinterkopf. In deren Szene war der i7 afaik auch um die 36% schneller als der i5.
Ronny145
2013-10-23, 19:33:41
Warum sollten es 36% sein? Gibt es mehr als eine Messung, die ein SMT speedup in dem Bereich zeigt?
dargo
2013-10-23, 19:37:14
Deshalb.
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9970523&postcount=294
Und wie gesagt kommt die PCGH zum selben Ergebnis.
Gibt es mehr als eine Messung, die ein SMT speedup in dem Bereich zeigt?
In dem hohen Bereich wirds aktuell schwierig da kein Spiel so gut parallelisiert. Vielleicht erst mit BF4, mal schauen.
aufkrawall
2013-10-23, 19:37:40
Kann mir nicht vorstellen, wie da 36% bei rauskommen sollen.
Bei x264 sinds afair auch nur ~30%. Müsste das aber mal selber benchen.
dargo
2013-10-23, 19:38:42
Kann mir nicht vorstellen, wie da 36% bei rauskommen sollen.
Bei x264 sinds afair auch nur ~30%. Müsste das aber mal selber benchen.
Spiele verhalten sich nun mal anders. Und das nicht nur im negativen Sinne.
aufkrawall
2013-10-23, 19:43:41
"Spiele" ist Mehrzahl, ich seh aber nur einen Benchmark für Crysis 3, wo Fehlerpotential auch nicht ausgeschlosssen ist.
Die Thread-Auslastung sollte mit x264 auch eher besser sein, warum sollte der Gewinn also schlechter sein?
Edit: Ok, das mit x264 muss ich zurücknehmen. Da scheints nur 20% zu bringen.
Hübie
2013-10-23, 19:44:27
Welche C3-Version nutzt PCGH denn?
Ronny145
2013-10-23, 19:56:31
Fehlerbereinigte Werte gibt es nur im Heft. 4770k 29% schneller als 4670k und 3770k 31% schneller als 3570k. Rechnet man den kleinen Taktvorsprung vom i7 raus, landet man irgendwo zwischen 25-30%, was ja immer noch viel ist. (die 2+MB ignorieren wir mal)
Den 4C/4T Wert von dargo finde ich hoch. Mehr als 40-41 fps bekomme ich beim besten Willen nicht hin. Mit 3,7 Ghz würde ich höchstens 42 fps erreichen trotz des schnelleren DDR3-2133. Läuft das unter Windows 8 schneller?
dargo
2013-10-23, 21:39:25
Den 4C/4T Wert von dargo finde ich hoch. Mehr als 40-41 fps bekomme ich beim besten Willen nicht hin. Mit 3,7 Ghz würde ich höchstens 42 fps erreichen trotz des schnelleren DDR3-2133. Läuft das unter Windows 8 schneller?
Kann ich dir gar nicht sagen. Entweder das oder es liegt an den 2MB mehr Cache. Ich hab ja nur DDR3-1600.
mach mal das hier (http://www.forum-3dcenter.org/vbulletin/showthread.php?t=546409) und schau ob du beim MP Ratio auf ~5,10 kommst.
MP Ratio 5.00. Und was sagt mir das jetzt?
Tesseract
2013-10-23, 22:32:00
MP Ratio 5.00. Und was sagt mir das jetzt?
dass dein system, wahrscheinlich bedingt durch die unterschiede bei der speicherbandbreite bzw. latenz, mit 8 threads scheinbar nicht ganz so gut skaliert wie einige andere haswell-systeme.
dargo
2013-10-23, 23:11:33
dass dein system, wahrscheinlich bedingt durch die unterschiede bei der speicherbandbreite bzw. latenz, mit 8 threads scheinbar nicht ganz so gut skaliert wie einige andere haswell-systeme.
Du meinst die Speicherbandbreite von DDR3-1600 würde mir hier tatsächlich noch ca. 10% Leistung mit 8 Threads klauen? Kann ich mir kaum vorstellen bei nur 3,7Ghz. :uponder:
Edit:
Ich hab mal ne Idee... wenn deine These stimmen sollte müsste der Unterschied zwischen non HT und HT bei 3,7Ghz und DDR3-1333 nochmal kleiner ausfallen als die von mir gemessenen 23% richtig?
Tesseract
2013-10-23, 23:19:53
Du meinst die Speicherbandbreite von DDR3-1600 würde mir hier tatsächlich noch ca. 10% Leistung mit 8 Threads klauen? Kann ich mir kaum vorstellen bei nur 3,7Ghz. :uponder:
nein, aber es würde wohl den unterschied von ~5.00 zu ~5.10 ausmachen. ich bin auch nicht der meinung, dass du wegen der ~3% unterschied den ram tauschen solltest, aber das ist wohl mit ein grund für deine werte in crysis 3.
Ich hab mal ne Idee... wenn deine These stimmen sollte müsste der Unterschied zwischen non HT und HT bei 3,7Ghz und DDR3-1333 nochmal kleiner ausfallen als die von mir gemessenen 23% richtig?
könntest du auf jedenfall mal probieren.
dargo
2013-10-23, 23:26:19
nein, aber es würde wohl den unterschied von ~5.00 zu ~5.10 ausmachen. ich bin auch nicht der meinung, dass du wegen der ~3% unterschied den ram tauschen solltest, aber das ist wohl mit ein grund für deine werte in crysis 3.
Würde ich eh nicht machen, das wäre ja total bekloppt. :tongue: Und bringen würde es auch nichts weil H87 max. DDR3-1600 unterstützt. :)
könntest du auf jedenfall mal probieren.
Mache ich gleich. Ich nehme aber DDR3-1066 damit die Bandbreite noch stärker abweicht.
Edit:
Du scheinst dich mit deiner These zu irren.
3,7Ghz @DDR3-1066
4C/4T = 40,13 avg.fps
4C/8T = 49,53 avg.fps
Ergo wieder +23% durch HT bei 33% weniger Speicherbandbreite. Diese hat also keinen Einfluss auf die Skalierung von HT vs. non HT!
Edit 2:
Apropo Core Parking unter Windows 8 deaktivieren. Dieser Typ hier geht ganz anders vor.
http://www.youtube.com/watch?v=xrvDVZg6C58
Ich werde das mal nachstellen.
Ok... im Prinzip ist das die gleiche Vorgehensweise. Nur das hier ein Neustart gemacht wird. Hab das genauso nachgestellt. Die Frames bleiben die gleichen, komme nicht mit HT über die 53,xx fps. Falls Angiesan hier mitliest... bitte nochmal die C3 Szene mit deinem Ivy testen. Wer weiß ob Crytek in der Zwischenzeit nicht doch was geändert hat. Mich würde brennend interessieren ob du immer noch +36% mit HT erreichst.
~5.00 zu ~5.10
Der MP-Ratio ist taktabhängig
Tesseract
2013-10-24, 01:25:24
Der MP-Ratio ist taktabhängig
nur in form des turbos wenn ein einzelner thread mehr takt bekommt als eine voll ausgelastete CPU. wenn der 1-core-multi gleich dem 4-core-multi ist hat der takt keinen signifikanten einfluß. von 4,2GHz auf 3,7GHz steigt mein mp-ratio minimal von 5.11 aud 5.12.
Ronny145
2013-10-24, 01:35:22
Ich würde es nicht am MP-scaling festmachen. Entweder der MP Gesamtscore liegt im normalen Bereich oder nicht. CB11.5 würde sich besser eignen wegen deutlich mehr Haswell Vergleichsauswahl aus vielen reviews mit default Takt und DDR3-1600. i7-4770k taktet 100 Mhz weniger auf 4 Kerne, das kann man sich leicht ableiten.
Dr.Doom
2013-10-24, 08:48:30
Weil HT bei Ivy +36% bringt. Es wäre ziemlich unlogisch wenns beim Haswell nur 23% wären.Warum sollte HT immer denselben Vorteil bringen?
Wenn Haswell pro (echtem) Kern effektiver/schneller rechnet als Ivy, dann nimmt der Zugewinn durch HT ab... zumindest fände ich das logischer.
dargo
2013-10-24, 09:37:32
Warum sollte HT immer denselben Vorteil bringen?
Wenn Haswell pro (echtem) Kern effektiver/schneller rechnet als Ivy, dann nimmt der Zugewinn durch HT ab... zumindest fände ich das logischer.
So einfach ist das nicht. Nach dieser Logik müsste Sandy Bridge mit HT noch effizienter sein als Ivy. Und Lynnfield müsste dann schon mit HT bei über +50% landen. :D Dem ist aber nicht so. ;)
Tesseract
2013-10-24, 10:51:57
Wenn Haswell pro (echtem) Kern effektiver/schneller rechnet als Ivy, dann nimmt der Zugewinn durch HT ab... zumindest fände ich das logischer.
nein, da besteht zwischen zwei verschiedenen architekturen kein direkter zusammenhang. eine neue CPU kann IPC-stärker sein und trotzdem einen geringeren auslastungsgrad haben.
Ronny145
2013-10-24, 11:25:39
So einfach ist das nicht. Nach dieser Logik müsste Sandy Bridge mit HT noch effizienter sein als Ivy. Und Lynnfield müsste dann schon mit HT bei über +50% landen. :D Dem ist aber nicht so. ;)
Der Vorteil nahm minimal ab.
robbitop
2013-10-24, 12:40:39
Die Execution scheint offenbar nicht der maßgebende Flaschenhals zu sein. Haswell hat mehr davon und gewinnt daraus bei SMT aber offenbar nichts.
dargo
2013-10-24, 13:15:26
Wir werden wohl erstmal neue Spiele/Engines abwarten müssen die sehr gut mit 8 Threads skalieren (2014). Dann kann ich immer noch schauen ob eventuell über 30% mit HT und Haswell drin sind. Bisher war C3 die Nr. 1 was MT bei 8 Threads anging. Ich hoffe Angiesan prüft mit seinem Ivy bald C3 nochmal. Weil das einfach keinen Sinn ergibt warum die HT Skalierung bei Haswell plötzlich so viel schlechter sein sollte. Hab ihm diesbezüglich auch ne PN geschickt.
Eggcake
2013-10-24, 15:00:31
@Dargo
Gibt's eine Anleitung dazu was ich testen muss? Würde das gerne mit dem 4770K nachstellen, sofern eine 5850 genügend ist um nicht in's GPU Limit zu laufen :>
Ronny145
2013-10-24, 15:20:45
HD5850 ist viel zu langsam das wird nichts.
Eggcake
2013-10-24, 15:30:27
Dayum :D
Ex3cut3r
2013-10-24, 16:34:02
Ich kann mich melden für Tests, habe nen i7 4770K und eine GTX 770 @ 1254/4001 (Default 780 Niveau) falls überhaupt gebraucht...
dargo
2013-10-24, 17:34:36
Ich kann mich melden für Tests, habe nen i7 4770K und eine GTX 770 @ 1254/4001 (Default 780 Niveau) falls überhaupt gebraucht...
Kannst gerne machen. Wenn bei dir HT mehr bringt dann weiß ich wenigstens, dass bei mir was nicht stimmt. Hier die Anleitung:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9854482&postcount=42
Mache am besten je 4 Runs und den ersten nicht bewerten. Nach jedem Run lass dich am besten töten dann kannst du gleich mit "Enter" an der gleichen Stelle anfangen. Nicht jedes Mal das Savegame neu laden! Die CPU kannst du @Default lassen.
Ex3cut3r
2013-10-24, 18:42:46
Auf wieviel Sekunden soll ich Fraps benchen lassen? Bin ich blind oder steht das in der Anleitung wirklich nicht?
EDIT1: 5 Sekunden vlt.?
EDIT2:
Crysis 3 1280x720 Max Details, AA+AF Off "Dargos Benchmark" 0.5 MS Timer
Frames, Time (ms), Min, Max, Avg
261, 5000, 49, 56, 52.200
56
52
52
49
52 FPS
4770K mit HT/SMT @ 3.7 Ghz
(habs mal mit 3.7 Ghz gemacht, obwohl ich sonst 4.2 Ghz fahre, dachte da könntest du vlt. mehr mit anfangen) ;)
8GB DDR3 1600 CL9
GTX 770 @ 1254/4000 Mhz
Win 7 Ultimate x64
HT/SMT Off, kommt gleich...
EDIT3: HT/SMT Off
Frames, Time (ms), Min, Max, Avg
205, 5000, 36, 47, 41.000
FPS
45
42
41
36
37
Dargo deine Haswell Xeon ergebnisse stimmen, komme fast auf die gleichen Ergebnisse wie du mit der gleichen Taktfrequenz, die 1-2 mehr FPS ohne HT müssen bei dir an Win 8.1 liegen siehe: http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9958398&postcount=155
+27% mit HT (habe den Median als Bezugswert genommen, robustere Schätzung des Erwartungswertes bei symmetrischen Verteilungen)
wenn man den ersten Wert streicht, sind es 33%, die Varianz ist hier zu hoch, um verlässlichere Ausagen zu treffen
Ich habe mal noch versucht das Beste aus dem Datensatz rauszuholen
Dazu habe Case-Resampling angewendet und 100.000 Datensätze des mittleren Geschwindigkeitszuwachses erstellt.
http://abload.de/img/htbootyts09.png
Ergebnis: in 95% der Fälle erhält man (Aufgrund von Messfehlern) einen Geschwindigkeitszuwachs zwischen 20% und 41%.
dargo
2013-10-24, 19:38:17
Dargo deine Haswell Xeon ergebnisse stimmen, komme fast auf die gleichen Ergebnisse wie du mit der gleichen Taktfrequenz, die 1-2 mehr FPS ohne HT müssen bei dir an Win 8.1 liegen siehe: http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9958398&postcount=155
Ok... danke für den Vergleich. Jetzt wäre es ganz gut wenn ein Ivy-Besitzer testen könnte.
Ex3cut3r
2013-10-24, 21:55:58
Kein Problem! Immer wieder gerne. ^^
OC_Burner
2013-10-25, 00:06:12
Wenn schon untertakten wird warum nicht auch gleich 2 Kerne im Bios deaktivieren um den Unterschied ersichtlicher werden zu lassen. Optimierungen für mehr als 4 Threads sind noch lange nicht in jedem Game vorhanden.
Weil Nvidia mit ihren Grafiktreibern "schummelt" (oder besser ausgedrückt... alles was weniger als 4 Threads hat wird extrem benachteiligt). 2C/4T ist bei NV deutlich schneller als 2C/2T und ist schon länger bekannt. Ich will aber wissen wie moderne Engines mit 4C/8T gegenüber 4C/4T performen.
Wie wäre es denn damit, anstatt auf 8 Threadanwendungen zu setzen weiterhin nur 4 Threads zu vergleichen.
Ein Durchgang mit 2 Kernen und aktivierten HT wird verglichen mit 4 Kernen und deaktiviertem HT (2C/4T vs 4C/4T). Anhand des Performancedrops bei 2 Kernen und HT sollten sich doch Rückschlüsse ziehen lassen. Natürlich ist das völlig Praxisfremd aber dient ja nur der theoretischen Natur.
dargo
2013-10-25, 00:46:13
Das möchte ich aber gar nicht wissen. Unter 4 Threads interessiert mich eh nix. Ich möchte demnächst wissen wie aktuelle Spiele mit mehr als 4 Threads skalieren. Nach Möglichkeit sehr gut mit bis zu 8 Threads. :)
vBulletin®, Copyright ©2000-2025, Jelsoft Enterprises Ltd.