PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Intel - SMT-Skalierung in Games über verschiedene Architekturen


Seiten : [1] 2

dargo
2013-06-28, 15:16:57
Gibt es eigentlich verlässliche Benchmarks der SMT-Skalierung bei einer 4C/8T Intel-CPU in aktuellen Games von Lynnfield/Nehalem bis Haswell?

Ich hatte hier damals noch mit einem Lynnfield bis zu 14% Vorteil für non SMT gemessen:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9315820&postcount=57

Ansonsten war der i7 beim gleichen Takt in anderen Games auch langsamer:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9315709&postcount=47

Das war natürlich nur ein Lynnfield. Danach kam SB, Ivy und aktuell Haswell. Mich beschleicht das Gefühl, dass die SMT-Skalierung gerade mit den neueren Architekturen wesentlich besser geworden ist und es zumindest nicht mehr zum Nachteil wird. Würde dafür aber gerne Beweise sehen.

Wer traut sich sowas zu testen? :D Die PCGH? Forum-User?

Tesseract
2013-06-28, 17:19:09
die nachteile lagen wohl eher am systemscheduler der damit nicht intelligent genug umgegangen ist als der CPU-architektur selbst.

kruemelmonster
2013-06-28, 17:25:59
Ich hatte vor einigen Wochen schon die SMT- und Taktratenskalierung meines 2600k in Crysis 3 getestet (http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9764872&postcount=62) und bin auf ~15% Vorteil durch SMT gekommen, welche PCGH_Carsten auch bestätigen (http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9765869&postcount=71) konnte.

ux-3
2013-06-28, 17:28:50
Och ne, nicht schon wieder eine neue CPU kaufen...

Hoffentlich bleibt Crysis3 die Ausnahme. :redface:

Rente
2013-06-28, 17:29:10
die nachteile lagen wohl eher am systemscheduler der damit nicht intelligent genug umgegangen ist als der CPU-architektur selbst.
Sheduler und Core-Parking-Verhalten.

Und vermutlich auch an schlecht programmierter Software.

dargo
2013-06-28, 17:41:28
die nachteile lagen wohl eher am systemscheduler der damit nicht intelligent genug umgegangen ist als der CPU-architektur selbst.
Du meinst dieser Systemscheduler ist in der Zwischenzeit besser geworden? Ich kann das leider mit einem i7 Lynnfield nicht mehr überprüfen in meinem Savegame von Dirt 3 bsw. Hab die CPU nicht mehr.

Ich hatte vor einigen Wochen schon die SMT- und Taktratenskalierung meines 2600k in Crysis 3 getestet (http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9764872&postcount=62) und bin auf ~15% Vorteil durch SMT gekommen, welche PCGH_Carsten auch bestätigen (http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9765869&postcount=71) konnte.Interessant... wäre es möglich, dass du die gleiche Szene wie die PCGH nachstellen könntest? Die haben nämlich bei Crysis 3 mit dem Patch 1.3 +33% mit SMT und Haswell gemessen.

kruemelmonster
2013-06-28, 17:46:13
Hab Dirt 3 noch installiert...gibst du Savegame bekommst du Benchmark. :D

Das ist exakt die PCGH Benchmarkszene.

Tesseract
2013-06-28, 17:48:09
Du meinst dieser Systemscheduler ist in der Zwischenzeit besser geworden?

das hoffe ich doch... andererseits ist MS ja dafür bekannt, dass ihnen performanceoptimierungen die sich nicht direkt vermarkten lassen eher am arsch vorbei gehen. müsste man testen.

dargo
2013-06-28, 17:50:59
Hab Dirt 3 noch installiert...gibst du Savegame bekommst du Benchmark. :D

Kann ich gerne machen. Geht aber frühestens heute Abend, bin nicht zu Hause.


Das ist exakt die PCGH Benchmarkszene.
Oha... das ist ein besonders wichtiger Punkt! Warst du auch tatsächlich vollkommen im CPU-Limit? Sollte das nämlich der Fall sein bedeutet das, dass Haswell bei SMT doppelt so schnell skaliert wie Sandybridge. Das würde dann auch die schlechte SMT-Skalierung vom Lynnfield eventuell erklären. Aber das wissen wir erst genau wenn du Dirt 3 mit deinem SB testest.

PS: aber willst du dir den Test mit Dirt 3 echt antun? :D

Ich warne dich schon mal im Vorfeld. Bei dem Spiel ist fast jedes Mal die Startposition anders, sodass du einen anderen Bildinhalt hast. Da sowas natürlich unbrauchbar ist musst du die Strecke sehr oft neustarten bis du wieder die gleiche Startposition einnimmst. Ich habe mich für die Startposition 6 entschieden weil die öfter vorkam. Nur so als Tipp. ;)

Knuddelbearli
2013-06-28, 17:56:56
Haswell muss auch besser skalieren hat ja immerhin 33% mehr Rohleistung je Int Kern ( FP Seitig wärens sogar 100% wenn es mich nicht täuscht )

Johnny Rico
2013-06-28, 20:52:00
Hat sich erledigt.

http://www.techpowerup.com/reviews/Intel/Core_i5_3570K_and_i7_3770K_Comparison/8.html

Ich habe nun trotzdem eine SMT CPU, hoffentlich bringt es irgendwann was.

aufkrawall
2013-06-28, 20:55:40
Schon 1050p und hohe(nicht ultra) Settings reichen aus und der Vorteil ist im Vorzeigefall in Crysis 3 nahezu nicht mehr vorhanden. In 1080p ist er sicher egalisiert.

Nope, beim Gras kommst du auch in höheren Auflösungen unter 60fps min und Crysis 3 macht im CPU-Limit böses Mikroruckeln.

Johnny Rico
2013-06-28, 21:01:57
Also gut programmiert, weil es Vorteile aus SMT zieht oder schlecht programmiert, weil es ohne SMT und generell im CPU Limit mikroruckelt?

Mikroruckeln geht nicht auf die Fps und ist nicht den FPS Benchmarks damit nicht abbildbar?

Mit SMT mikroruckelt es nicht mehr?


Was schließt du also daraus und würdest mir raten? Ich würde weiterhin sagen, trotz Mikroruckeln in C3 keine SMT CPU.

dargo
2013-06-28, 21:12:13
Nope, beim Gras kommst du auch in höheren Auflösungen unter 60fps min und Crysis 3 macht im CPU-Limit böses Mikroruckeln.
Eben... das alte leidige Thema mit der höheren Auflösung. :freak:

@kruemelmonster

Nimm bitte bei Dirt 3 diese Strecke wie hier beschrieben:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=6973307&postcount=3

Wechsle bitte in die Außenperspektive, setze die Auflösung auf 640x480 1xAA/1xAF runter und alle Details @Maximum. Untertakte deine CPU bitte auf 2Ghz (20x100), damit solltest du garantiert voll im CPU-Limit liegen. Starte dann die genannte Strecke und achte unbedingt darauf, dass du an der Startposition 6 bist! Die sechste Startposition vereinfacht unheimlich die Vergleichbarkeit weil sie öfter vorkommt.

Setze Fraps auf 10 Sekunden Aufnahme und starte diese sobald die Uhr anfängt zu laufen. Das ganze bitte 3x wiederholen und den Durchschnitt der avg.fps bei den 3 Messungen sowohl für 4C/4T als auch 4C/8T ermitteln. Wenn du einmal auf der Strecke bist nicht die Strecke verlassen für die Wiederholungen. Einfach "Esc" drücken und Rennen neustarten. Bei den Messungen darfst du dich selbst nicht bewegen, lass die KI einfach fahren.

Bitte unbedingt darauf achten, dass bei jeder Messung immer die gleiche Startposition gegeben ist!

Haswell muss auch besser skalieren hat ja immerhin 33% mehr Rohleistung je Int Kern ( FP Seitig wärens sogar 100% wenn es mich nicht täuscht )
Kleine Korrektur von mir... die PCGH hat nicht Haswell sondern Ivy-Bridge getestet.
http://www.pcgameshardware.de/Crysis-3-PC-235317/Tests/Crysis-3-CPU-Test-1068140/

OC_Burner
2013-06-28, 21:48:36
Eben... das alte leidige Thema mit der höheren Auflösung. :freak:

@kruemelmonster

Nimm bitte bei Dirt 3 diese Strecke wie hier beschrieben:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=6973307&postcount=3

Wechsle bitte in die Außenperspektive, setze die Auflösung auf 640x480 1xAA/1xAF runter und alle Details @Maximum. Untertakte deine CPU bitte auf 2Ghz (20x100), damit solltest du garantiert voll im CPU-Limit liegen. Starte dann die genannte Strecke und achte unbedingt darauf, dass du an der Startposition 6 bist! Die sechste Startposition vereinfacht unheimlich die Vergleichbarkeit weil sie öfter vorkommt.

Setze Fraps auf 10 Sekunden Aufnahme und starte diese sobald die Uhr anfängt zu laufen. Das ganze bitte 3x wiederholen und den Durchschnitt der avg.fps bei den 3 Messungen sowohl für 4C/4T als auch 4C/8T ermitteln. Wenn du einmal auf der Strecke bist nicht die Strecke verlassen für die Wiederholungen. Einfach "Esc" drücken und Rennen neustarten. Bei den Messungen darfst du dich selbst nicht bewegen, lass die KI einfach fahren.

Bitte unbedingt darauf achten, dass bei jeder Messung immer die gleiche Startposition gegeben ist!


Kleine Korrektur von mir... die PCGH hat nicht Haswell sondern Ivy-Bridge getestet.
http://www.pcgameshardware.de/Crysis-3-PC-235317/Tests/Crysis-3-CPU-Test-1068140/

Wenn schon untertakten wird warum nicht auch gleich 2 Kerne im Bios deaktivieren um den Unterschied ersichtlicher werden zu lassen. Optimierungen für mehr als 4 Threads sind noch lange nicht in jedem Game vorhanden.

dargo
2013-06-28, 21:51:49
Wenn schon untertakten wird warum nicht auch gleich 2 Kerne im Bios deaktivieren um den Unterschied ersichtlicher werden zu lassen. Optimierungen für mehr als 4 Threads sind noch lange nicht in jedem Game vorhanden.
Weil Nvidia mit ihren Grafiktreibern "schummelt" (oder besser ausgedrückt... alles was weniger als 4 Threads hat wird extrem benachteiligt). 2C/4T ist bei NV deutlich schneller als 2C/2T und ist schon länger bekannt. Ich will aber wissen wie moderne Engines mit 4C/8T gegenüber 4C/4T performen.

aufkrawall
2013-06-28, 22:43:45
Also gut programmiert, weil es Vorteile aus SMT zieht oder schlecht programmiert, weil es ohne SMT und generell im CPU Limit mikroruckelt?

Hoffentlich eher ersteres, gibt häufig arg viel Gras zu sehen. Dafür ist die Performance ok.


Mikroruckeln geht nicht auf die Fps und ist nicht den FPS Benchmarks damit nicht abbildbar?

Ist mit einfachen Frametimemessungen via Fraps abbildbar.


Mit SMT mikroruckelt es nicht mehr?

Weiß ich nicht, hab keinen i7.
Aber durch mehr Threads wirds ja eher komplizierter, ruckelt vielleicht noch mehr.


Was schließt du also daraus und würdest mir raten? Ich würde weiterhin sagen, trotz Mikroruckeln in C3 keine SMT CPU.
So viel CPU-Leistung haben, dass man nie ins CPU-Limit kommt, zumindest bei dem Spiel.
Und da würde ein HSW i7 sicherlich schon hilfreich sein. Oder gleich IVB-E.

Mit meiner Sandy Bitch@4,8 warte ich lieber auf Haswell-E mit acht Kernen.
Hätt ich geahnt, dass HSW so ne Takt-Krücke wird, hätt ich mir nen 2600k geholt.

dargo
2013-06-30, 18:51:10
@kruemelmonster

Können wir demnächst noch mit einem Ergebnis von dir rechnen? :)

ux-3
2013-06-30, 20:11:56
Weil Nvidia mit ihren Grafiktreibern "schummelt" (oder besser ausgedrückt... alles was weniger als 4 Threads hat wird extrem benachteiligt). 2C/4T ist bei NV deutlich schneller als 2C/2T und ist schon länger bekannt.

Was würdest Du bei C2D (2C/2T) und G92 als Treiber vorschlagen? Wann war das Problem noch nicht vorhanden? Oder betrifft es nur DX10 oder 11? Gerne als PM.

dargo
2013-06-30, 20:19:12
Urgh... das mit G80/G92 ist bei mir schon so lange her, dass ich gar nicht mehr weiß ab welchen Grafiktreiber Nvidia 4 Threads favorisiert hat. Dieser enormer Frameeinbruch bei einer 2C/2T CPU betrifft aber nicht alle Spieleengines! Im Prinzip sind es nur die Engines die sehr gut mit 4+ Cores/Threads skalieren (zb. Frostbite 2). Bei älteren Spielen gibts dieses Phänomen nicht.

Edit:
Wenn du mal hier schaust:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=6973305&postcount=2

Letzte Messung mit Crysis 2 war April 2011. Da sah es bei NV zumindest für einen Triplecore noch sehr gut aus. Bei den Games dadrüber eigentlich auch für den DC.

Danach, ab Dirt 3:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=6973307&postcount=3

ging das los. Die 2 und 3 Kerner haben überproportional schlecht bei NV abgeschnitten.

dargo
2013-07-22, 09:04:17
Ich suche einen freiwilligen mit einer i7 CPU @Haswell und dem Spiel Crysis 3. Gibts hier jemanden mit dieser Kombination der Lust auf einen kleinen Test hätte? :)

Angiesan
2013-07-24, 16:12:18
Da brauchst du keinen Test zu machen, ich hatte wie ich mir die GTX 690 gekauft hatte und das ganze mit meinem Core I5 2400 SB bedienen wollte bei Crysis 3 den Wolf gebencht, SMT bringt da massive und reproduzierbare Vorteile auch nach all den Patches das Gras streckt einfach jede 4 Kern CPU ohne SMT nieder mit SMt geht das je nach Szene bis zu 50 % hoch selbst 6 Kerne und SMT skaliert da noch sehr gut. Guck mal im NV Hilfethread da hatte Godmode mal ein paar Benches gemacht mit seinem 6 Kerner. Selbst mit einer GTX 660 und einem Ci7 3770 K hänge ich da sehr oft im CPU Limit:freak:
Crysis 3 ist das erste Spiel das mehr Kerne ob echte oder virtuelle dankbar entgegen nimmt. Gerade das 2 Level Welcome to the Jungle ist so abartig CPU limitiert, bei vielen anderen wechselt sich CPU und GPU Limit ab da ist es deutlich ausgewogener, aber nur auf Very High, High macht da was ganz anders und das CPU Limit geht deutlich zurück.

Grüße

Ronny145
2013-07-24, 16:19:08
Crysis 3 kannst du vergessen wegen dem Timer Bug. Das müsste man nochmal mit 1,0ms vermessen.

dargo
2013-07-24, 16:21:26
Eben.

Außerdem interessiert mich ausschließlich die SMT-Leistung eines Haswell 4C/8T. Keine 6 Core CPU mit 12 Threads. Zumal es auch kein Haswell ist.

Angiesan
2013-07-24, 16:21:31
Crysis 3 kannst du vergessen wegen dem Timer Bug. Das müsste man nochmal mit 1,0ms vermessen.
Timer Bug? gibt es da was drüber ist irgendwie an mir vorbei gegangen:confused:

@Dargo: Meinst du , dass die da anders ist wie bei einem Ivy ? Oder willst du das damit rausfinden.

dargo
2013-07-24, 16:24:32
Crysis 3 ist das erste Spiel das mehr Kerne ob echte oder virtuelle dankbar entgegen nimmt. Gerade das 2 Level Welcome to the Jungle ist so abartig CPU limitiert, bei vielen anderen wechselt sich CPU und GPU Limit ab da ist es deutlich ausgewogener, aber nur auf Very High, High macht da was ganz anders und das CPU Limit geht deutlich zurück.

Das ist alles schon lange bekannt. ;)

Es ist nicht das Preset High, Objektdetails reichen völlig aus um die CPU-Last drastisch zu senken. Damit wird nicht nur weniger Gras gerendert, auch die LoD-Stufe ist niedriger. Ergo bestimmte Objektive ploppen früher auf.


@Dargo: Meinst du , dass die da anders ist wie bei einem Ivy ?
Ja.

Zumindest lese ich das aus den Architekturdaten heraus. Ein Gegentest wäre mir natürlich lieber.

Ronny145
2013-07-24, 16:26:42
Timer Bug? gibt es da was drüber ist irgendwie an mir vorbei gegangen:confused:



Ab dort und weiter im Thread: http://www.forum-3dcenter.org/vbulletin/showthread.php?p=9837308#post9837308


Vielleicht hat SMT immer noch einen großen Vorteil, aber das müsste sauber mit 1.0ms nochmal neu überprüft werden.

aufkrawall
2013-07-24, 16:46:06
Was ist mit Core Parking?

dargo
2013-07-24, 16:48:58
Was soll damit sein?

aufkrawall
2013-07-24, 17:02:31
Warum frag ich wohl?
Angeblich soll das in einigen Fällen die Performance negativ beeinflusst haben. Oder gibts nen neueren Stand?

Angiesan
2013-07-24, 17:17:13
@ Ronny, Danke das ist interessant, aber bei mir ist es wie bei DAve, der steht auf 1,000 und eine Veränderung bringt hier auch keinen Besserung mehr. Trotzdem gut zu wissen.

dargo
2013-07-24, 17:51:38
Angeblich soll das in einigen Fällen die Performance negativ beeinflusst haben. Oder gibts nen neueren Stand?
Keine Ahnung. Jedenfalls hatte ich schon damals keine Probleme beim Test mit Lynnfield i7 und Core-Parking festgestellt.
http://www.forum-3dcenter.org/vbulletin/showthread.php?t=524303&page=4

Ronny145
2013-07-24, 17:56:14
@ Ronny, Danke das ist interessant, aber bei mir ist es wie bei DAve, der steht auf 1,000 und eine Veränderung bringt hier auch keinen Besserung mehr. Trotzdem gut zu wissen.


Dann mach doch mal ein Test. Einmal ohne SMT und einmal mit. Solange der Timer auf 1,0ms steht wäre das aussagekräftig.

aufkrawall
2013-07-24, 17:57:37
Keine Ahnung. Jedenfalls hatte ich schon damals keine Probleme beim Test mit Lynnfield i7 und Core-Parking festgestellt.
http://www.forum-3dcenter.org/vbulletin/showthread.php?t=524303&page=4
Mein Bruder holt sich voraussichtlich nen i7 Haswell. Ließe sich dann sicherlich nochmal testen.

dargo
2013-07-24, 18:03:52
Dann mach doch mal ein Test. Einmal ohne SMT und einmal mit. Solange der Timer auf 1,0ms steht wäre das aussagekräftig.
Jo... aber bitte nicht die Szene der PCGH. Ich hab da ne andere Stelle die viel cpu-lastiger ist. Kann auch gerne einen Screen von dieser Stelle heute Abend posten wenn ich daheim bin. :)

PS: macht dieser Test mit SLI überhaupt Sinn? Oder anders gefragt... ist das Ergebnis auf ein System mit Single-GPU gut übertragbar? Ich meine 2 Karten zu bedienen bedeutet mehr CPU-Last. Auch SMT-Last?

aufkrawall
2013-07-24, 18:07:34
PS: macht dieser Test mit SLI überhaupt Sinn? Oder anders gefragt... ist das Ergebnis auf ein System mit Single-GPU gut übertragbar? Ich meine 2 Karten zu bedienen bedeutet mehr CPU-Last. Auch SMT-Last?
Ich konnte bei mir noch keinen Unterschied im CPU-Limit mit sGPU und 2-Way messen. Habe dafür aber auch nicht extra eine Karte ausgebaut. Laut Godmode soll es ab 3-Way sich schon deutlich bemerkbar machen.

boxleitnerb
2013-07-24, 19:55:39
Ein kleiner Unterschied kann schon da sein, aber das sind - wenn überhaupt - nur zwei, drei Prozent.
Also mit 2 GPUs.

aufkrawall
2013-07-24, 20:01:34
Weißt du, ob man dafür die Karte ausbauen muss?

boxleitnerb
2013-07-24, 20:10:32
SLI deaktivieren reicht.

Angiesan
2013-07-24, 20:31:13
@ Dargo: Na dann schick mir mal dein Save oder zeig mir die Stelle, ich hatte gerade da ich den Mini umgebaut hatte noch mal Crysis 3 installiert und dort immer noch herbe Einbrüche mit dem Ci5 2400. Mit dem Ci3 den ich da vorher drin hatte ist das 2 Level unspielbar. Da hatte ich aber das mit den 1ms noch nicht gesehen und kann jetzt nicht sagen ob das vielleicht bei dem Mini daran gelegen hat.

aufkrawall
2013-07-24, 20:35:48
SLI deaktivieren reicht.
Jups, gerade mal Crysis 3 in 720p im CPU-Limit gemessen:
43,5fps vs ~44fps.
Genau so etwas hatte ich damals auch bei Hitman gemessen.

dargo
2013-07-24, 20:44:39
@ Dargo: Na dann schick mir mal dein Save oder zeig mir die Stelle...

In ca. einer Stunde komm ich dran.


ich hatte gerade da ich den Mini umgebaut hatte noch mal Crysis 3 installiert und dort immer noch herbe Einbrüche mit dem Ci5 2400. Mit dem Ci3 den ich da vorher drin hatte ist das 2 Level unspielbar. Da hatte ich aber das mit den 1ms noch nicht gesehen und kann jetzt nicht sagen ob das vielleicht bei dem Mini daran gelegen hat.
Diese 1ms Geschichte bringt dir "nur" 10-20% mehr fps im vollständigen CPU-Limit. Stell mal die Objektdetails auf Mittel dann wirds wieder spielbar. ;)

Edit:
@Angiesan

Das wäre die besagte Stelle und Ausgangsbasis.
http://s7.directupload.net/images/130724/temp/n4ezi8bt.jpg (http://s7.directupload.net/file/d/3326/n4ezi8bt_jpg.htm)

Hast du das passende Savegame (Willkommen im Dschungel)? Anweisung zum Benchen folgt gleich...


Stelle zum Benchen bitte Fraps auf 5 Sekunden ein.

Wenn dein Savegame geladen ist drücke bitte die Q-Taste für den Panzermodus, ansonsten lebst du u.U. zu kurz und bitte nicht bewegen. Sobald rechts der Wegpunkt mit 78,1m erscheint bewege dich bitte gerade aus nach vorne mit der W-Taste ohne die Maus zu bewegen. Unten kommt so eine kleine Erhebung, du musst die Springen-Taste im richtigen Moment betätigen damit du vor dieser Erhebung nicht stecken bleibst. Die ganze Prozedur bitte 3x wiederholen für HT und non HT.

Benche bitte das ganze in 720p ohne AA/AF und max. Details. Wenn du nicht gegentesten kannst ob du dich dann tatsächlich im absoluten CPU-Limit befindest wäre es von Vorteil wenn du deine CPU untertaktest... zb. 2Ghz. Und vergiss bitte nicht vorsichtshalber jedes Mal die Timer Resolution zu prüfen.

Angiesan
2013-07-24, 22:58:11
Heute nicht mehr, aber morgen:wink: es gibt noch eine Szene die noch mehr von der CPU fordert und da wird dann nicht mehr auf dich geschossen dürfte etwas reproduzierbarer sein, aber ich mach dir zuerst mal das so wie du es haben willst.

Grüße

dargo
2013-07-24, 23:11:49
Die von mir vorgeschlagene Szene ist sehr gut reproduzierbar. Ich hatte dort immer nur Abweichungen zwischen einzelnen Messungen von unter 1fps. :)
Da fällt mir gerade ein... wenn die Benchdauer von 5 Sekunden um ist (siehst du ja am Framecounter) lass dich einfach töten. Brauchst dann nicht jedes Mal das Savegame neu laden. Mit Enter gehts gleich wieder von vorne los.

PS: wenn du noch eine cpu-lastigere Szene kennst immer her damit. :)

Simon
2013-07-25, 02:22:50
In 1-2 Wochen sollte ein i7 hier ankommen. Weiss nur noch nicht, welcher :freak:

dargo
2013-07-25, 08:32:20
Haswell? Das wäre super. =) Hast du auch Crysis 3?

Ph0b0ss
2013-07-25, 12:30:06
Was ist mit Core Parking?

Also bei mir hat das zumindest bei Winrar massiv etwas gebracht. Alle 8 Threads werden bei meinem Nehalem fast maximal ausgelastet und die Werte im Benchmark sind ordentlich gestiegen(auf ~9900kb/s bei 4,2Ghz Winrar 4.20-64bit) . Jedoch ist bei mir (Win7) kurioserweise, anders als in dem Link unten angegeben, die Einstellung 100% am schnellsten in Winrar (bei 0% sind es nur noch 8400kb/s und ~15% weniger CPU-Auslastung)! Könnte mir vorstellen, dass diese Einstellung bei Crysis 3 auch einen kleinen Boost bringen könnte! Also auf jeden Fall mal mit 0% und 100% Einstellung mal testen!

http://diit.cz/clanek/analyzing-core-parking-in-windows-7-and-windows-8-in-relation-to-amd-bulldozer-performance-in

Angiesan
2013-07-25, 17:07:35
Hat bei mir auch einen kleinen Boost gebracht jedoch mit SLi.
100% bedeutet in diesem Fall nicht, dass die Cores maximal geparkt werden sondern das nix geparkt wird :wink:

Benches kommen gleich: habe das Save schon vorbereitet.

Grüße

aufkrawall
2013-07-25, 17:48:54
Thx.
Testest du das auch mit der gleichen Gras-Szene wie dargo?
Hatte damit btw. auch den Unterschied mit SLI on/off getestet.

Edit: Aso, haste ja geschrieben.

Simon
2013-07-25, 19:21:09
Haswell? Das wäre super. =) Hast du auch Crysis 3?
Ja und Ja. Bench-willig bin ich uebrigens auch :freak:

Angiesan
2013-07-25, 19:24:51
So hier mal die Wert mit SMT

Core i7 3770K kein OC AMD 7950 @ 1100/1375 MHz (habe mit 900/1250 kurz gegengetestet kein Unterschied) also klar full CPU Limit!

Ingame 1280x720 very high 2xSMAA
Lauf 1:
FPS
54
47
45
43
47
Lauf 2:
FPS
54
48
45
45
47
Lauf 3:
FPS
53
48
43
45
48

Und jetzt ohne SMT:

Lauf 1:
FPS
40
36
32
32
33

Lauf 2:
FPS
40
36
34
33
33

Lauf 3:
FPS
39
36
34
32
33

Timer immer auf 1,0 MS überprüft! Coreparking deaktiviert.
Ist immer noch so, dass dies ein gewaltiger Unterschied ist SMT bringt hier wirklich was.

dargo
2013-07-25, 19:44:02
Hammer. :up:

Ich danke dir für den Test! Auch wenn du mich noch rechnen lässt, das ginge auch einfacher. ;)

Ich fasse mal zusammen:

4C/8T
Durchgang 1 = 47,2 avg.fps
Durchgang 2 = 47,8 avg.fps
Durchgang 3 = 47,4 avg.fps

Schnitt = 47,47 avg.fps

4C/4T
Durchgang 1 = 34,6 avg.fps
Durchgang 2 = 35,2 avg.fps
Durchgang 3 = 34,8 avg.fps

Schnitt = 34,87 avg.fps

SMT ist also in dieser Szene 36% schneller. =)

Es freut mich auch, dass du eine AMD Graka verwendet hast. Denn das Ergebnis muss bei NV nicht 1:1 übereinstimmen. So weiß ich auch, dass SMT bei entsprechender Software auch bei AMD wunderbar skaliert.

@Simon
Wenn du den Haswell hast bitte die gleiche Szene nochmal mit dem Haswell vergleichen. :)

@Angiesan
Mit welcher Taktfrequenz lief deine CPU bei diesem Test dauerhaft? Mit 3,5Ghz?

Angiesan
2013-07-25, 19:58:05
Kann ich dir nicht genau sagen ich denke aber mit 3,7 GHz da dies der Turbotakt bei Last auf allen Kernen ist bei dem 3770 K.
Ich habe da jetzt bei beiden Durchläufen nichts verändert, nur SMT ein und aus.
Wenn du ganz nett bittest könnte ich ja noch mal die GTX 690 einbauen ;-) liegt halt auf dem Tisch weil im MP angeboten die GTX 780 ist gerade eben weg gegangen und ist schon eingepackt die würde ich jetzt nicht mehr auspacken wollen. Ich kann dir aber sagen, das die Ergebnisse sich sehr gleichen werden, ich habe nicht umsonst den 3770k gekauft das wollte ich auch zuerst nicht glauben.

Grüße

dargo
2013-07-25, 20:02:49
Kann ich dir nicht genau sagen ich denke aber mit 3,7 GHz da dies der Turbotakt bei Last auf allen Kernen ist bei dem 3770 K.

Das wäre aber ziemlich strange. :freak:

Wenn ich die Werte noch richtig im Kopf habe würde das bedeuten, dass Ivy @3,7Ghz in dieser Szene mit 4C/4T gerade mal ~16% schneller ist als mein Lynnfield @3,7Ghz. :| :confused: :freak:

Ich teste das heute Abend mal genau nach.

PS: wann hast du genau die Benchtaste betätigt? Als der Wegpunkt 78,1m zu sehen war und du direkt losgegangen bist?

Angiesan
2013-07-25, 20:22:55
Hmmm der Test sagt was anderes ;-)

guckst Du :http://www.computerbase.de/artikel/prozessoren/2013/sechs-haswell-mit-vier-kernen/29/

Ja immer möglichst gleichzeitig mit dem losrennen gedrückt 100% genau ist das sicherlich nicht aber ich denke man sieht ja das es reproduzierbar ist.
Und ich kann dir sagen das dieses Level mit SLI und einem 4 Kerner der nicht heftigst übertaktet ist nicht auf maxout spielbar ist das ruckelt wie Sau!
Ich dachte zuerst das sei Grafiklimitiert, wie ich dann die GTX 690 drin hatte wurde es schlimmer ;-) dann wie schon geschrieben machte mich Godmode darauf aufmerksam, das die CPU schwächelt
war zu dem Zeitpunkt ein Ci5 2400 @3600 MHz mit inoffiziellem OC wollte ich zuerst nicht glauben:freak:

dargo
2013-07-25, 20:28:47
Ja immer möglichst gleichzeitig mit dem losrennen gedrückt 100% genau ist das sicherlich nicht aber ich denke man sieht ja das es reproduzierbar ist.
Ok, danke. Ich wollte das nur für möglichst gute Vergleichbarkeit wissen. Natürlich machen wenige Milisekunden Abweichung nichts aus, deshalb vergleicht man auch die avgs. :)

Hmmm der Test sagt was anderes ;-)

guckst Du :http://www.computerbase.de/artikel/prozessoren/2013/sechs-haswell-mit-vier-kernen/29/

Ich sehe da gar keinen Lynnfield. :confused:

Ist aber auch egal, ich teste das heute Abend nochmal ganz genau.

Angiesan
2013-07-25, 20:37:24
War auch eher als Anhaltspunkt gedacht, der Unterschied zu Sandy ist dort ja schon relativ groß und Haswell kann da ja auch noch mal zulegen.

Ich bin mal gespannt was heute bei Dir rauskommt!

dargo
2013-07-25, 20:41:04
Wäre es zuviel verlangt wenn ich dich darum bitten würde den Test ohne Turbo zu wiederholen? :redface: Also mit fester Taktfrequenz (zb. 3,7Ghz). Nicht, dass der Turbotakt bei 4C/4T anders reagiert als bei 4C/8T. Bei einer festen Taktfrequenz bin ich immer sicherer was Vergleichbarkeit mit anderen Systemen angeht. :)

aufkrawall
2013-07-25, 20:43:46
Und gleichzeitig mit der 690? ;)
Wenn alles klappt, dürfte das ja vergleichbar sein.

Angiesan
2013-07-25, 20:54:36
Ihr unverschämten Bengel auf den Poden mit euch::freak:;D
Na ich habe eh Langeweile mal gucken habe noch ein oc Profil gespeichert mit 4,0 GHz fix, das ist doch auch ok oder, ansonsten muss ich alles wieder per Hand einstellen, die GTX ist ja schnell reingesteckt:redface: ahh ich meine eingebaut:biggrin:
Und man könnte dann auch sehen wie die Taktskalierung ist, das interessiert mich jetzt selbst auch mal.

aufkrawall
2013-07-25, 20:57:31
Sehr gut. Willste nicht noch nen Haswell kaufen? :D
Thx. :)

Angiesan
2013-07-25, 20:59:23
hehe ich bin ja doof was HW angeht :freak:so doof aber dann doch nicht:biggrin:

dargo
2013-07-25, 20:59:40
Ihr unverschämten Bengel auf den Poden mit euch::freak:;D

:D


Na ich habe eh Langeweile mal gucken habe noch ein oc Profil gespeichert mit 4,0 GHz fix, das ist doch auch ok oder, ansonsten muss ich alles wieder per Hand einstellen...
Gegen 4Ghz spricht natürlich nichts solange du immer noch vollkommen im CPU-Limit bist. Aber was gibts da großartig beim Ivy einzustellen? :confused: CPU-Multi auf 37 (für 3,7Ghz) und Turbo "off". Das sollte doch eigentlich reichen oder nicht?

Angiesan
2013-07-25, 21:06:20
Na mit der GTX 690 sollte das schon passen.
Ich denke aber das da nix anderes rauskommt da das PT bei dem MSI Board sobald eine K CPU erkannt wird automatisch auf 200 Watt erhöht wird, ich hatte das schon getestet der maximale Turbo liegt da immer an wenn die CPU gefordert wird sonst hätte ich das nicht so gelassen.
Für mich ist es halt interessant wie sich die zusätzlichen 300 MHz bemerkbar machen mal sehen was dabei rauskommt, bin dann mal unter dem Schreibtisch, bis gleich :smile:

dargo
2013-07-25, 21:49:09
Hier nun mein Ergebnis der gleichen Szene.

System:
i5-750 @3,69Ghz (20*184,53 BCLK), Speicher DDR3-1476 CL9, HD7970 @1050/1500Mhz, Win7 x64 SP1

1280x720 SMAA 2Tx/16xAF, max. Details
Durchgang 1 = 31,6 avg.fps
Durchgang 2 = 31,4 avg.fps
Durchgang 3 = 31,6 avg.fps

Schnitt = 31,53 avg.fps

Dann wäre dein Ivy mit 3,7Ghz und 4C/4T nur lächerliche ~11% schneller. :|

PS: Timer Resolution @0,5ms. 1ms kann ich nicht einstellen, nutze kein Chrome. Afaik soll es aber keinen Unterschied zwischen 0,5 und 1ms bei den Frames geben.

Angiesan
2013-07-25, 21:54:26
So hier bin ich wieder, erstr Test:
Core I7 3770K fix auf 4,0 GHz Grafikkarte GTX 690 Treiber 314.22 out of the box
Ingame wie gehabt 1280x720 MGPU SMAA
Überrascht jetzt schon etwas und werde ich auf alle Fälle noch mit standard Takt also so wie der Bench mit der HD wiederholen!

Core I7 3770K @4GHz SMT
2013-07-25 21:41:44 - crysis3
Frames: 236 - Time: 5000ms - Avg: 47.200 - Min: 44 - Max: 50

2013-07-25 21:42:29 - crysis3
Frames: 235 - Time: 5000ms - Avg: 47.000 - Min: 43 - Max: 51

2013-07-25 21:43:22 - crysis3
Frames: 239 - Time: 5000ms - Avg: 47.800 - Min: 43 - Max: 51


Core i7 3770K@4GHz SMT off
2013-07-25 21:59:49 - crysis3
Frames: 182 - Time: 5000ms - Avg: 36.400 - Min: 33 - Max: 40

2013-07-25 22:00:40 - crysis3
Frames: 181 - Time: 5000ms - Avg: 36.200 - Min: 32 - Max: 42

2013-07-25 22:01:35 - crysis3
Frames: 182 - Time: 5000ms - Avg: 36.400 - Min: 32 - Max: 41

Core i7 3770K@3,7GHz SMT
2013-07-25 22:23:50 - crysis3
Frames: 221 - Time: 5000ms - Avg: 44.200 - Min: 40 - Max: 48

2013-07-25 22:24:40 - crysis3
Frames: 222 - Time: 5000ms - Avg: 44.400 - Min: 42 - Max: 48

2013-07-25 22:25:35 - crysis3
Frames: 221 - Time: 5000ms - Avg: 44.200 - Min: 41 - Max: 48

Core i7 3770K@3,7GHz SMT, SLi off GPU 1058 MHz Fix PT 110%
2013-07-25 22:40:45 - crysis3
Frames: 223 - Time: 5000ms - Avg: 44.600 - Min: 42 - Max: 48

2013-07-25 22:41:19 - crysis3
Frames: 224 - Time: 5000ms - Avg: 44.800 - Min: 41 - Max: 48

2013-07-25 22:41:54 - crysis3
Frames: 224 - Time: 5000ms - Avg: 44.800 - Min: 42 - Max: 49

So das deckt sich mit den SLI Werten, musste jedoch neu starten da die GPu nach Deaktivierung nicht über 706 MHz zu bewegen war :freak: und das war etwas zu wenig für den Bench:biggrin:

Man(n) kann zumindest für Crysis 3 behaupten das der NV Treiber knappe 300 MHz mehr braucht um auf die Werte mit der AMD Karte zu kommen wenn es wie hier im absoluten CPU Limit abgeht.
Das passt mir gerade so in mein Bild was ich aktuell habe, ich werde das noch mal mit einer Single GPU nachtesten, aber nicht mehr heute damit man ausschließen kann, dass es an dem PLX Brückenchip liegt den die GTX 690 nun mal hat.
Wenn man es positiv sehen möchte könnte man auch sagen SLI hat einen vernachlässigbaren Verwaltungsaufwand was die Aussage es wird zu einem Großteil über HW gesteuert untermauern würde.

Grüße

dargo
2013-07-25, 21:55:50
@Angiesan

Poste bitte gleich die avgs. aus der Frapslog.txt. Die Rechnerei nervt. ;(

Lowkey
2013-07-25, 21:59:39
Hier stand Unsinn

boxleitnerb
2013-07-25, 22:05:50
Mach mal SLI aus, das verfälscht.

dargo
2013-07-25, 22:18:57
So hier bin ich wieder, erstr Test:
Core I7 3770K fix auf 4,0 GHz Grafikkarte GTX 690 Treiber 314.22 out of the box
Ingame wie gehabt 1280x720 MGPU SMAA
Überrascht jetzt schon etwas und werde ich auf alle Fälle noch mit standard Takt also so wie der Bench mit der HD wiederholen!

Core I7 3770K @4GHz SMT
2013-07-25 21:41:44 - crysis3
Frames: 236 - Time: 5000ms - Avg: 47.200 - Min: 44 - Max: 50

2013-07-25 21:42:29 - crysis3
Frames: 235 - Time: 5000ms - Avg: 47.000 - Min: 43 - Max: 51

2013-07-25 21:43:22 - crysis3
Frames: 239 - Time: 5000ms - Avg: 47.800 - Min: 43 - Max: 51


Core i7 3770K@4GHz SMT off
2013-07-25 21:59:49 - crysis3
Frames: 182 - Time: 5000ms - Avg: 36.400 - Min: 33 - Max: 40

2013-07-25 22:00:40 - crysis3
Frames: 181 - Time: 5000ms - Avg: 36.200 - Min: 32 - Max: 42

2013-07-25 22:01:35 - crysis3
Frames: 182 - Time: 5000ms - Avg: 36.400 - Min: 32 - Max: 41
Sieht so aus, dass der Verwaltungsaufwand von SLI im absoluten CPU-Limit doch paar Megaherzchen kostet. Ein Gegentest ohne SLI wäre noch interessant. Nicht, dass plötzlich der AMD-Grafiktreiber bei 4+ Threads etwas besser skaliert. X-D Früher war das nämlich genau anders rum. :D

Edit:
@Angiesan

Sicher, dass bei deinem System alles in Ordnung ist? Ich wundere mich hier die ganze Zeit, dass der Ivy mit 4 Threads nur magere ~11% beim gleichen Takt schneller ist als mein Lynnfield. Zumal dein Speicher sogar einiges schneller ist und deine CPU 2MB mehr L3 Cache hat. Wenn das wirklich wahr ist dann zweifle ich langsam am Kauf von Haswell. Der wird wohl kaum 35% gegenüber dem Ivy zulegen damit ich meine +50% mehr Pro/Mhz Leistung ohne SMT habe. :(

Naja... da müssen wir wohl die Benches von Simon noch abwarten.


Core i7 3770K@3,7GHz SMT, SLi off GPU 1058 MHz Fix PT 110%
2013-07-25 22:40:45 - crysis3
Frames: 223 - Time: 5000ms - Avg: 44.600 - Min: 42 - Max: 48

2013-07-25 22:41:19 - crysis3
Frames: 224 - Time: 5000ms - Avg: 44.800 - Min: 41 - Max: 48

2013-07-25 22:41:54 - crysis3
Frames: 224 - Time: 5000ms - Avg: 44.800 - Min: 42 - Max: 49

Lol... das hätte ich jetzt nicht erwartet. Hat da AMD etwa in den letzten Grafiktreibern weitere Optimierungen für die FX-CPUs vorgenommen? ;D Scheinbar skaliert der AMD-Treiber etwas besser mit 8 Threads als der NV-Treiber. Bei 4 Threads war das nach meinen letzten Tests 2012 noch genau umgekehrt. :tongue:

Es sieht nun folgendermaßen aus:

NV - 8 Threads = 44,73 avg.fps
AMD - 8 Threads = 47,47 avg.fps (+6%)

NV - 4 Threads = 36,33 avg.fps (+4%)
AMD - 4 Threads = 34,87 avg.fps

Angiesan
2013-07-25, 23:10:02
@Dargo, Alle Synthetischen Tests und die meisten Spiele sagen, dass mein System sehr gut eingestellt ist und ich würde das jetzt mal nicht an einem einzigen Test festmachen, dafür bräuchte man schon etwas mehr, ich habe oben ja noch was dazu geschrieben, und es bestätigt ja auch das was AufKrawall schon gepostet hat SLi kostet keine CPU Leistung sonst würde es dort Unterschiede geben.
Zumindest in Crysis 3 ist es aber so, dass die Kombination 4C, 8T und GTX 690 etwas weniger liefert wenn es im CPU Limit abgeht, ob man darauf schließen kann dass dies in allen Spielen so ist bezweifele ich jetzt mal stark. Dafür gibt es auch sehr wenige Beispiele, ich könnte mir sehr gut vorstellen, dass man dies mit Starcraft ganz gut nachtesten könnte ohne AA halt, leider habe ich das Spiel nicht sonst würde ich das noch machen.

Grüße

dargo
2013-07-25, 23:14:43
@Dargo, Alle Synthetischen Tests und die meisten Spiele sagen, dass mein System sehr gut eingestellt ist und ich würde das jetzt mal nicht an einem einzigen Test festmachen, dafür bräuchte man schon etwas mehr, ich habe oben ja noch was dazu geschrieben, und es bestätigt ja auch das was AufKrawall schon gepostet hat SLi kostet keine CPU Leistung sonst würde es dort Unterschiede geben.

Schon klar... siehe mein gestrichener Satz oben. Es liegt am Grafiktreiber, also in Bezug auf die kleinen Unterschiede was die fps bei 4 und 8 Threads angeht.


Zumindest in Crysis 3 ist es aber so, dass die Kombination 4C, 8T und GTX 690 etwas weniger liefert wenn es im CPU Limit abgeht, ob man darauf schließen kann dass dies in allen Spielen so ist bezweifele ich jetzt mal stark. Dafür gibt es auch sehr wenige Beispiele, ich könnte mir sehr gut vorstellen, dass man dies mit Starcraft ganz gut nachtesten könnte ohne AA halt, leider habe ich das Spiel nicht sonst würde ich das noch machen.

Starcraft kannst du vergessen. Das skaliert afaik kaum über 2 Threads. Für einen weiteren Vergleich bräuchte man Spiele die sehr gut mit 8 Threads skalieren. Davon wird es momentan nicht viele geben. :freak:

Angiesan
2013-07-25, 23:31:39
Ja stimmt was du sagst über Starcraft, ich habe eben gerade noch mal nachgerechnet, die Skalierung mit dem Takt 4,0 GHz zu 3,7 GHz passt auch.

Grüße

Lowkey
2013-07-26, 11:14:52
Hat zwar voll nix mit SMT am Hut, aba OC kompensiert SMT.

(1) 3,4 Ghz + Turbo + DDR3-1600 Avg 31,56 FPS <--- Standard CPU
(2) 3,7 Ghz + DDR3-1333 Avg 32,32 FPS
(3) 4.0 Ghz + DDR3-2133 Avg 35,3 FPS
(4) 4,7 Ghz + DDR3-1333 Avg 38,55 FPS
(5) 4,7 Ghz + DDR3-1600 Avg 39,15 FPS
(6) 4,7 Ghz + DDR3-2000 Avg 41,9 FPS
(7) 4,7 Ghz + DDR3-2133 Avg 42,73 FPS

(8) 4,0 Ghz + DDR3-1866 Avg 36,03 FPS
(9) 4,0 Ghz + DDR3-1866 Avg 35,32 FPS <--- Treiberreset 314.22 out of the box Powerlimit auf Max.
(10) 4,0 Ghz + DDR3-1866 Avg 35,56 FPS <--- zusätzlich Single Computer maximum Performance Multi Thread Mode.

Von Standard (1) auf maximale Übertaktung (7) von CPU und Speicher sind es 35,39% Mehrleistung.
Von Standard (1) mit DDR3-1600 auf Übertaktung (5) mit DDR3-1600 sind es 24% Mehrleistung.
Speicherübertaktung von DDR3-1600 (5) auf DDR3-2133 (7) macht 9,1% Mehrleistung aus.
27% Übertaktung von 3700 (2) auf 4700 (4) ergeben 19,2% Mehrleistung.

System: 4670k + Nvidia 660 Ti @720p Details=very High 2xSMAA TimerResolution laut Tool auf 1.001

Täusche ich mich oder entspricht der Speicher einer CPU Leistung von 400-500 Mhz?

dargo
2013-07-26, 11:27:52
Danke für den Test.

Man sieht, dass du für die gleichen fps ca. 5,2Ghz bräuchtest wie ein i7 @3,7Ghz. Ich habe für den Vergleich mit 40,5fps gerechnet, also zwischen (5) und (6) da Angiesan DDR3-1866 hat.

Vergiss es... Haswell vs. Ivy Bridge. :anonym:

Edit:
Irgendwas ist komisch. Bei 4Ghz ist dein Haswell sogar etwas langsamer als der Ivy Bridge @4C/4T? :| Bist du sicher, dass bei dir nicht schon die Graka etwas limitiert?


(2) 3,7 Ghz + DDR3-1333 Avg 32,32 FPS

Ach du Schreck. :eek: Das ist ja gleich schnell wie der Lynnfield @3,7Ghz. :confused: :| :O

Was ist denn jetzt los? :| Habt ihr irgendwelche Handbremse in euren Systemen angezogen? :tongue:

Lowkey
2013-07-26, 12:03:57
Hmm siehe (8) ... der Timerresolution springt herum. Selbst auf nicht-OC. Auf 4,7 Ghz waren es 1.001 und nun auf 4,0 sind es 0.500

dargo
2013-07-26, 12:12:09
Hmm siehe (8) ... der Timerresolution springt herum. Selbst auf nicht-OC. Auf 4,7 Ghz waren es 1.001 und nun auf 4,0 sind es 0.500
Das ändert nichts daran, dass Haswell und Ivy Bridge sich in der besagten Szene überhaupt nicht vom 4 Jahre alten Lynnfield absetzen können. Ich kanns kaum glauben und falle hier gleich vom Stuhl. :eek: Was soll ich mir dann einen Haswell zulegen? Das wäre Geldverbrennung pur.

Hochgerechnet würde der Lynnfield bei 4Ghz auf ca. 34fps kommen. Wenn man berücksichtigt, dass der NV-Treiber bei 4 Threads minimal schneller ist als der AMD-Treiber dann sind wir praktisch auf dem gleichen Niveau. Das gibts doch gar nicht! :confused: Frisst bei euch im Hintergrund irgendeine Software (Virenscanner?) CPU-Leistung ohne Ende?

PS: die aktuelle Fraps-Version habt ihr drauf?

Edit:
Testet mal bitte ohne alle Stromsparmodis der CPU. Da muss doch was faul sein? Ich hab hier nur C1E und Speedstep aktiv.

@aufkrawall
Könntest du bitte deinen Sandy Bridge auch mit 3,7Ghz in dieser Szene testen?

Angiesan
2013-07-26, 12:47:35
Moin Dargo,

nein das scheint nicht unnormal zu sein, ich habe gerade noch mal nachgeschaut bei dem Artikel zum FX 8350 auf CB da wurde auch noch dein Lynfield mitgetestet du hast doch den I5 750 oder?

Wenn man das mal Taktbereinigt betrachtet bleiben von den 31% die z.B. ein 3550 vor dem 750 liegt nicht mehr so viel übrig ;-) ich habe das jetzt nicht berechnet , da ich weder von dem 3550 noch von dem 750 er den Turbo Takt im Kopf habe, es dürften jedoch unter 10 % in Spielen übrig bleiben, wenn man dann großzügig noch mal runde 15%-20% zur Haswell Generation dazu rechnet bleiben am Schluß 20-30% geschätzt übrig, bei gleichem Takt, ja da gibt es ein paar Ausreiser aber gemittelt dürfte das schon hinkommen.

Wenn ich mir dann noch mein Auslastung der Kerne bei Crysis anschaue wundert mich das nicht wirklich, dass man hier bei Crysis3 faktisch nur einen kleinen Unterschied finden kann. Hier wurde mehr Wert gelegt auf Multithreading und nicht auf Pro MHz Leistung, man könnte jetzt auch sagen es ist sehr freundlich zu AMD CPU´s denn Kerne haben die ja genug ;-) und Takt auch:freak:
Ich bin mir ziemlich sicher, dass wenn Raff das mit seinem 8350 Monster nachtestet er alle Intels alt aussehen lässt :freak::biggrin:

Grüße

Lowkey
2013-07-26, 12:47:49
Ich habe alle Stromsparmodi für den Test ausgemacht und Windows/Treiber sind auf Höchsleistung.

Also verteilt Crysis 3 die Rechnenlast auf die Kerne, die dann nicht richtig ausgelastet sind und ignoriert den Fortschritt von durchschnittlich 29% gegenüber dem Lyn auf den HW?

Angiesan
2013-07-26, 12:52:22
Ja deine und meine Ergebnisse decken sich ja auch das spaßt schon.

So pauschal würde ich das nicht formulieren, ich denke das man damit sicherlich AMD in die Karten gespielt hat, aber modern ist das sicherlich, wenn ich mir die vielen Spiele und Anwendungen angucke, die mit mehr wie 2 Threads immer noch nichts anfangen können bin ich nicht undankbar das mal jemand damit anfängt.
Wo für braucht man sonst die Kerne, ob nun virtuell oder nicht spielt dann auch keine Rolle ich finde das fortschrittlich nicht weil ich eine CPU habe mit SMT sondern weil das meiner Meinung nach ein Blick in die Spiele-Zukunft ist.
Bei Anwendungen kommt ja langsam Bewegung in die Sache Multithreading (4Threads+) bei Spielen ist es ja eher wie schon geschrieben noch eine Randerscheinung, bin mir aber sehr sicher, dass sich dies mit den neuen Generation der X Box und Playstation schnell ändern wird.

dargo
2013-07-26, 13:03:58
Wenn man das mal Taktbereinigt betrachtet bleiben von den 31% die z.B. ein 3550 vor dem 750 liegt nicht mehr so viel übrig ;-) ich habe das jetzt nicht berechnet , da ich weder von dem 3550 noch von dem 750 er den Turbo Takt im Kopf habe, es dürften jedoch unter 10 % in Spielen übrig bleiben, wenn man dann großzügig noch mal runde 15%-20% zur Haswell Generation dazu rechnet bleiben am Schluß 20-30% geschätzt übrig, bei gleichem Takt, ja da gibt es ein paar Ausreiser aber gemittelt dürfte das schon hinkommen.

Der Witz ist ja, dass Haswell (siehe Tests von Lowkey) gegenüber deinem Ivy überhaupt nichts zulegt. :freak: Oh man... und ich dachte die +~50% höhere Pro/Mhz Leistung zwischen Haswell und Lynnfield wäre durchgehend vorhanden. In der C3-Szene sind es praktisch Null Unterschied. :hammer:


Wenn ich mir dann noch mein Auslastung der Kerne bei Crysis anschaue wundert mich das nicht wirklich, dass man hier bei Crysis3 faktisch nur einen kleinen Unterschied finden kann. Hier wurde mehr Wert gelegt auf Multithreading und nicht auf Pro MHz Leistung, man könnte jetzt auch sagen es ist sehr freundlich zu AMD CPU´s denn Kerne haben die ja genug ;-) und Takt auch:freak:

Aber das ergibt für mich keinen Sinn. Selbst beim sehr guten Multithreading muss sich doch die höhere Pro/Mhz-Leistung zusätzlich zeigen? :confused:

Ronny145
2013-07-26, 13:07:53
Ihr solltet die PCGH Benchmarkszene nehmen. Dann kann man wegen der Vergleichswerte genau sagen, ob die Ergebnisse normal sind oder nicht. Zur Not auf 1024x576 runtergehen, das ist ab einer 660 Ti fast 100% CPU limitiert.

dargo
2013-07-26, 13:17:56
Ihr solltet die PCGH Benchmarkszene nehmen. Dann kann man wegen der Vergleichswerte genau sagen, ob die Ergebnisse normal sind oder nicht. Zur Not auf 1024x576 runtergehen, das ist ab einer 660 Ti fast 100% CPU limitiert.
Und was soll das bringen?

Die PCGH-Szene ist bei weitem nicht so cpu-lastig wie meine. Ich habe dort wenn mich meine Erinnerung nicht täuscht ~66% höhere Frameraten als in meiner Szene. Wenn ich eine neue CPU kaufe dann will ich die Worst Cases deutlich anheben und nicht die Szene wo ich genug fps habe.

Angiesan
2013-07-26, 13:20:28
Aber das ergibt für mich keinen Sinn. Selbst beim sehr guten Multithreading muss sich doch die höhere Pro/Mhz-Leistung zusätzlich zeigen? :confused:

Warum wenn ich einen Lynfield Kern zu 90 % auslaste und einen Haswell nur zu 60% auslaste, entscheidet doch der Takt, ist der gleich kann die höhere Rechenleistung nicht durchschlagen. Solange der Lynfield nicht in irgend ein Limit läuft bleibt es bei dem Gleichstand. Oder mache ich da einen Denkfehler?

Ronny145
2013-07-26, 13:22:36
Und was soll das bringen?



Wenn ihr dort auf zu niedrige Werte kommt wisst ihr Bescheid das eure Ergebnisse nicht normal sind, ganz einfach. Wenn ich schon lese IVB nicht schneller als HSW mus ich das erstmal anzweifeln. In der PCGH Szene ist Haswell mindestens 10% schneller Timing Bug bereinigt.

Angiesan
2013-07-26, 13:31:35
Viel einfacher, da du ja auch eine Haswll hast ist es doch wenn du gerade mal den Bench machst, denn wir hier verwendet haben, kommt doch direkt nach der Szene die die PCGH verwendet;) Treppe hoch und video abbrechen schon biste da.

Grüße

Lowkey
2013-07-26, 13:33:57
Wenn ihr dort auf zu niedrige Werte kommt wisst ihr Bescheid das eure Ergebnisse nicht normal sind, ganz einfach. Wenn ich schon lese IVB nicht schneller als HSW mus ich das erstmal anzweifeln. In der PCGH Szene ist Haswell mindestens 10% schneller Timing Bug bereinigt.


http://ht4u.net/reviews/2013/intel_core_i7_4770_4670_haswell_cpus_test/index36.php

Die Ergebnisse stimmen.

Alle anderen 4 Spiele im Test ziehen auf und davon. Crysis 3 macht das Gegenteil. Ein 3770k mit SMT, 2 Mbyte Cache und 100 Mhz mehr liegt genau 2% vor dem 4670k. Die 2% entsprechen weniger als 100 Mhz. Bei gleichem Takt läge der 4670k vorne.


Crysis 3 verhält sich komplett anders. Assassins Creed III zB. hat mit SMT Probleme (grrr ich habe meine Samsung AS3 Keys schon verkauft)

Ronny145
2013-07-26, 13:52:53
http://ht4u.net/reviews/2013/intel_core_i7_4770_4670_haswell_cpus_test/index36.php

Die Ergebnisse stimmen.

Alle anderen 4 Spiele im Test ziehen auf und davon. Crysis 3 macht das Gegenteil. Ein 3770k mit SMT, 2 Mbyte Cache und 100 Mhz mehr liegt genau 2% vor dem 4670k. Die 2% entsprechen weniger als 100 Mhz. Bei gleichem Takt läge der 4670k vorne.



Ich erkenne den Sinn in deinem Beitrag nicht. Hier wurde geschrieben das HSW nichts auf IVB zulegt. Dein Link zeigt was anderes. Zudem ist das ein Test ohne Timer Hinweis und somit sehr unsicher. Und außerdem 150 fps? Ich erkenne null CPU Anforderung in der Testszene von ht4u bei den hohen fps Werten.

Lowkey
2013-07-26, 14:08:51
Angiesan nimmt seinen 3770k auf 4 Ghz ohne SMT und ich den 4670k auf 4 Ghz.

Er kommt auf 36,4 FPS und ich komme auf ~35,4 FPS => 2,8% Unterschied.

Im HT4U sind es nur 1,9% Unterschied, aber die Ergebnisse sind ähnlich.

Ich gebe dir recht, dass der Timer eine Rolle spielt und es noch nicht klar ist, warum er sich verstellt oder wie man ihn festnageln kann.
Eventuell hänge ich im Grafiklimit. Muss ich eben nochmal testen.

EDIT: Bei HT4U fehlt die Versionsangabe. Eventuell ist das der alte 1.2er Patch. SMT ist dort ja aktiv.

Vielleicht bekomme ich ein 3570k System zum Gegentesten.

Ronny145
2013-07-26, 14:12:04
Angiesan nimmt seinen 3770k auf 4 Ghz und ich den 4670k auf 4 Ghz.

Er kommt auf 36,4 FPS und ich komme auf ~35,4 FPS => 2,8% Unterschied.

Im HT4U sind es nur 1,9% Unterschied, aber die Ergebnisse sind ähnlich.


SMT vs no SMT aha, ist doch dann blödsinnig zu sagen HSW legt nichts zu.



Ich gebe dir recht, dass der Timer eine Rolle spielt und es noch nicht klar ist, warum er sich verstellt oder wie man ihn festnageln kann.


Bug im Spiel. Festnageln mit dem Timer Tool oder ein Chrome Fenster nebenbei laufen lassen.

Angiesan
2013-07-26, 14:15:42
Ähhhm ne SMT off gegen SMT off
mit SMT sind es 44 FPS da kommste selbst mit 4,7 GHz nicht ran

Ronny145
2013-07-26, 14:18:13
Bei ht4u sehe ich 10 und 15% Differenz, ähnlich ist sich da nicht viel. Es bleibt dabei, ohne Prüfung mit der PCGH Benchszene ist nicht klar ob die Ergebnisse normal sind oder nicht.

dargo
2013-07-26, 14:43:16
Angiesan nimmt seinen 3770k auf 4 Ghz ohne SMT und ich den 4670k auf 4 Ghz.

Er kommt auf 36,4 FPS und ich komme auf ~35,4 FPS => 2,8% Unterschied.

Das witzige daran ist, dass Haswell eben langsamer (auch wenns nur sehr wenig ist) ist als Ivy Bridge. :freak:

Lowkey
2013-07-26, 14:46:52
Timer ist auf 1.
20 Sekunden Test PCGH:

1920x1080 = Avg 30.2 FPS
1366x720 = Avg 53.25 FPS

Jetzt suche ich noch die passenden Vergleichswerte...

Ronny145
2013-07-26, 14:54:31
Timer ist auf 1.
20 Sekunden Test PCGH:

1920x1080 = Avg 30.2 FPS
1366x720 = Avg 53.25 FPS

Jetzt suche ich noch die passenden Vergleichswerte...



Mach das mit 30 Sekunden, weil mit 20s kaum Vergleichswerte vorhanden sind. Außerdem teste in 1024x576 ohne AA+AF, sonst limitiert die 660 Ti.

Angiesan
2013-07-26, 14:55:00
Auf die Schnelle

720P 3770k standard Takt


2013-07-26 14:10:58 - crysis3
Frames: 1544 - Time: 20000ms - Avg: 77.200 - Min: 66 - Max: 90

@Ronny, 30 Sekunden kannste da nicht laufen, .....glaube ich

Ronny145
2013-07-26, 15:02:00
In dem PCGH Test? Natürlich geht das.

http://www.pcgameshardware.de/Crysis-3-PC-235317/Tests/Crysis-3-Test-CPU-Benchmark-1056578/


Oder gibt es einen neuen? Da fehlen dann leider die Vergleichswerte.

Lowkey
2013-07-26, 15:03:42
Doch 30sek geht sich aus.

Aber ich muss erst einmal das System wieder auf einen gemeinsamen Nenner bringen.

4,0 Ghz + DDR3-1866 sind gerade avg: 58,483 FPS

(1024x768 ohne AA/AF)

Lowkey
2013-07-26, 15:04:25
In dem PCGH Test? Natürlich geht das.

http://www.pcgameshardware.de/Crysis-3-PC-235317/Tests/Crysis-3-Test-CPU-Benchmark-1056578/


Oder gibt es einen neuen? Da fehlen dann leider die Vergleichswerte.

Das ist der uralte Test. Glaube der letzte Test war für Patch 1.3


Stop ... es muss ein Ergebnis her, woran man die eigenen Werte eichen kann.

Ronny145
2013-07-26, 15:07:49
Doch 30sek geht sich aus.

Aber ich muss erst einmal das System wieder auf einen gemeinsamen Nenner bringen.

4,0 Ghz + DDR3-1866 sind gerade avg: 58,483 FPS

(1024x768 ohne AA/AF)


Erstens ein extrem niedriger Wert und zweitens 4:3 Auflösung. Du musst die 576p Auflösung im Control Panel hinzufügen falls die nicht standardmäßig vorhanden ist.

Das ist der uralte Test. Glaube der letzte Test war für Patch 1.3



Ja den musst du nehmen. Zu dem gibt es Vergleichswerte mit Patch 1.3. Haswell i5 mit 3,6 Ghz: http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9840386&postcount=122

Angiesan
2013-07-26, 15:07:54
Ich habe das jetzt nicht getestet, aber ich war der Meinung, dass es eng wird mit der Wand am Ende des Levels, kann ja noch mal 30 Sekunden durchlaufen lassen, hatte ja geschrieben ....glaube ich :-)

Grüße

Ronny145
2013-07-26, 15:09:55
Ich habe das jetzt nicht getestet, aber ich war der Meinung, dass es eng wird mit der Wand am Ende des Levels, kann ja noch mal 30 Sekunden durchlaufen lassen, hatte ja geschrieben ....glaube ich :-)

Grüße


Geht sich locker aus. Du musst an der Tür stehen und erst beim Benchstart nach vorne laufen.

dargo
2013-07-26, 15:26:45
@Ronny145

Teste bitte mit deinem Haswell auch meine Szene.

Lowkey
2013-07-26, 15:30:27
Kleines Update.

1024x576: Frames, Time (ms), Min, Max, Avg
1997, 30000, 59, 87, 66.567
Frames 1524 - Time: 30000ms - Avg: 51.800 - Min: 41 - Max: 62

1024x576+Ticker 0.500 ms: Frames, Time (ms), Min, Max, Avg
2372, 30000, 64, 118, 79.067

Frames: 2399 - Time: 30000ms - Avg: 79.967 - Min: 56 - Max: 113


1280x720+ticker 0.500 ms: Frames, Time (ms), Min, Max, Avg
2238, 30000, 60, 101, 74.600

Frames: 2257 - Time: 30000ms - Avg: 75.233 - Min: 55 - Max: 94


Unverändert i5-4670, DDR3-2133, 660 Ti Windforce OC...


4670k @ Standard + DDR3-2133 CL 11-14-14-36 + 660Ti

Der Timer im ersten Durchlauf ist auf default, also 15,625ms. In den anderen Fällen auf 0,500ms

Mcdave
2013-07-26, 15:43:46
3770K @ 4.3GHZ (SMT on), 2133 MHZ RAM, GTX 670 @ 1303/3350MHZ, 314.22HQ:

1.) Frames: 274 - Time: 5000ms - Avg: 54.800 - Min: 48 - Max: 62
2.) Frames: 277 - Time: 5000ms - Avg: 55.400 - Min: 47 - Max: 63
3.) Frames: 278 - Time: 5000ms - Avg: 55.600 - Min: 49 - Max: 62

720p, alles maximiert, kein AA/AF.

Gegentest mit 480p:

Frames: 282 - Time: 5000ms - Avg: 56.400 - Min: 51 - Max: 67

Ich krebse schon wieder verdammt nahm am GPU-Limit herum, trotz der geringen Auslösung. Der Timer funktioniert bei mir ordnungsgemäß (1ms).

Ronny145
2013-07-26, 15:50:14
4670k @ Standard + DDR3-2133 CL 11-14-14-36 + 660Ti

Der Timer im ersten Durchlauf ist auf default, also 15,625ms. In den anderen Fällen auf 0,500ms


Standard heißt 3,6 Ghz in Crysis 3 bei voller Auslastung? Manche Boards lassen den mit dem 1C Turbo auf 3,8 Ghz laufen. Sieht ansonsten normal aus.

Mcdave
2013-07-26, 15:50:14
3770K @ 4.3GHZ (SMT on), 2133 MHZ RAM, GTX 670 @ 1303/3350MHZ, 314.22HQ:

1.) Frames: 274 - Time: 5000ms - Avg: 54.800 - Min: 48 - Max: 62
2.) Frames: 277 - Time: 5000ms - Avg: 55.400 - Min: 47 - Max: 63
3.) Frames: 278 - Time: 5000ms - Avg: 55.600 - Min: 49 - Max: 62

720p, alles maximiert, kein AA/AF.

Gegentest mit 480p:

Frames: 282 - Time: 5000ms - Avg: 56.400 - Min: 51 - Max: 67

Ich krebse schon wieder verdammt nahm am GPU-Limit herum, trotz der geringen Auslösung. Der Timer funktioniert bei mir ordnungsgemäß (1ms).

Edit: Nun macht Ihr aber ein mächtiges Durcheinander hier... Mein Posting bezieht sich auf den 5-Sekunden Drago-Test.

Edit2: Wollte eigentlich meinen oberen Beitrag editieren.....nicht quoten....

Lowkey
2013-07-26, 15:52:25
Standard heißt 3,6 Ghz in Crysis 3 bei voller Auslastung? Manche Boards lassen den mit dem 1C Turbo auf 3,8 Ghz laufen. Sieht ansonsten normal aus.

Alle Kerne sind auf 3,6 Ghz

dargo
2013-07-26, 16:11:58
3770K @ 4.3GHZ (SMT on), 2133 MHZ RAM, GTX 670 @ 1303/3350MHZ, 314.22HQ:

1.) Frames: 274 - Time: 5000ms - Avg: 54.800 - Min: 48 - Max: 62
2.) Frames: 277 - Time: 5000ms - Avg: 55.400 - Min: 47 - Max: 63
3.) Frames: 278 - Time: 5000ms - Avg: 55.600 - Min: 49 - Max: 62

720p, alles maximiert, kein AA/AF.

Gegentest mit 480p:

Frames: 282 - Time: 5000ms - Avg: 56.400 - Min: 51 - Max: 67

Ich krebse schon wieder verdammt nahm am GPU-Limit herum, trotz der geringen Auslösung. Der Timer funktioniert bei mir ordnungsgemäß (1ms).
Wie kommst du darauf?

Angiesan
2013-07-26, 16:31:53
So hier noch mal der PCGH im 30 Sek. -Format mit HD 7950 @1100/1375 die GTX 690 ist jetzt auch verkauft und steht mir somit nicht mehr zur Verfügung.

720P 3770 K Standard SMT ein
2013-07-26 16:21:41 - crysis3
Frames: 2383 - Time: 30000ms - Avg: 79.433 - Min: 60 - Max: 108

In dem PCGH Test bin ich am Anfang auf jeden Fall im GPU Limit !


Daves Test zeigt ja das die Werte von mit mit 3,7 und HD 7950 passen sollten im Dargo-Test seine CPU taktet ja 600 MHz höher, sollte dann also eher ein Problem der GTX 690 bzw SLI sein, wäre klasse wenn das Aufkrawall mal nachtesten könnte ob es wirklich so ist das der Treiber auch die 2 deaktivierte Karte verwaltet, sieht mir gerade so aus.
Dazu müsste er dann mal eine ausbauen wenn es nicht so viel Mühe macht.

Und Achtung es macht glaube ich nur Sinn gleiches Seitenverhältnisse zu testen das Fov verändert sich und somit sicherlich nicht nur die GPU Last ;-)


Grüße

Ronny145
2013-07-26, 16:41:29
Woran erkennst du hier das GPU Limit? Dann erstelle doch eine 576p Auflösung falls das eine AMD Karte erlauben sollte.

Angiesan
2013-07-26, 16:48:00
Wenn ich die Karte, an der Tür runtertakte verliere ich 1:1 FPS in die andere Richtung habe ich es jetzt noch nicht versucht, ist aber auch egal den es schönt immer nur die Ergebnisse. Der PCGH Test ist ein GPU und kein CPU Test zumindest nicht immer ;-) 576er Auflösung wird nicht angeboten mit dem Cat 13.4

dargo
2013-07-26, 16:52:48
@Angiesan

Deshalb finde ich die PCGH-Szene für einen reinen CPU-Test nicht optimal. Bei der PCGH-Szene müsste man die CPU stark untertakten.

Und Achtung es macht glaube ich nur Sinn gleiches Seitenverhältnisse zu testen das Fov verändert sich und somit sicherlich nicht nur die GPU Last ;-)

Jepp... man sollte für gute Vergleichbarkeit immer 16:9 nehmen. 480p bedeutet etwas weniger CPU-Last.

Angiesan
2013-07-26, 17:06:17
Ja ich stimme dir da zu, es ist ja noch schlimmer, wenn ich Prophet an dem letzten Fahrzeug vorbeigleiten lasse, das sehe ich nicht in dem Test, erhöhe ich das Testergebnis aber schon da für ca.2 Sekunden die FPS deutlich nach oben gehen da der Blick auf diese Lichtung von dem Schrottfahrzeug versperrt wird.

Ich sehe das nicht als sehr reproduzierbar an, zumindest nicht wenn das nicht ein und die selbe Person testet die das erkennt und diese Ergebnisse dann verwerfen kann und nochmal testet.

So jetzt muss ich schwitzen gehen mit dem Hund :-) bin in einer Stunde wieder da:D

dargo
2013-07-26, 17:10:04
Eben, 30 Sekunden sind imo auch viel zu lange. Und du hast völlig recht, solche Feinheiten machen es dann aus. Wenn immer der gleiche Tester das weiß ist es noch ok. Wenn wir aber bei einer so langen Szene querbeet über mehrere Systeme vergleichen wollen wird das nix Genaues.

@Ronny145
Kommt da noch ein Ergebnis von dir bei meiner Szene? Das würde mich jetzt brennend interessieren. Wenn du auch so tiefe Frames wie Lowkey und Angiesan erreichst dann haben wir hier wohl ein neues Limit entdeckt. Wie soll man das nennen? Multithreading-Limit? :D Wobei das auf mich immer noch sehr seltsam wirkt. Eine Erhöhung der Taktrate und/oder der Wechsel von 4 auf 8 Threads bringen Vorteile und eine neue Architektur (Haswell/Ivy vs. Lynnfield) alleine gar nichts? :confused:

Mcdave
2013-07-26, 17:31:54
@Angiesan

Jepp... man sollte für gute Vergleichbarkeit immer 16:9 nehmen. 480p bedeutet etwas weniger CPU-Last.

854×480 ist genauso 16:9 wie 1280*720p auch.

dargo
2013-07-26, 18:00:28
854×480 ist genauso 16:9 wie 1280*720p auch.
Oh... sorry. Bei 480p denke ich immer an 640*480. :) Ok, in dem Fall limitiert bei 720p bei dir schon minimal die Graka solange der Ivy mit 4,3Ghz und SMT On läuft.

Ph0b0ss
2013-07-26, 18:55:03
@dargo

Ab wann im Level bei deinem Savegame startest du den 5s Fraps Benchmark?

Ronny145
2013-07-26, 19:10:29
@Ronny145
Kommt da noch ein Ergebnis von dir bei meiner Szene? Das würde mich jetzt brennend interessieren. Wenn du auch so tiefe Frames wie Lowkey und Angiesan erreichst dann haben wir hier wohl ein neues Limit entdeckt. Wie soll man das nennen? Multithreading-Limit? :D Wobei das auf mich immer noch sehr seltsam wirkt. Eine Erhöhung der Taktrate und/oder der Wechsel von 4 auf 8 Threads bringen Vorteile und eine neue Architektur (Haswell/Ivy vs. Lynnfield) alleine gar nichts? :confused:


Ok hier ist mein Ergebnis.

i5-4670 3,6 Ghz, 660 Ti, DDR3-2133

Frames, Time (ms), Min, Max, Avg
205, 5000, 37, 46, 41.000


Die Ergebnisse von Lowkey sind viel niedriger. Da stimmt was nicht.

dargo
2013-07-26, 19:15:11
Ok hier ist mein Ergebnis.

i5-4670 3,6 Ghz, 660 Ti, DDR3-2133

Frames, Time (ms), Min, Max, Avg
205, 5000, 37, 46, 41.000

Danke... das sieht doch gleich viel besser aus. Wären bei 3,7Ghz ca. 42fps und somit ca. 30% mehr Pro/Mhz-Leistung als mein Lynnfield bei gleicher Taktrate. Trotzdem etwas mager wenn ich nur einen i7 Haswell hole der auf 3,7Ghz übertaktet wird. :uponder: Wären in Crysis 3 +~75% mit SMT.


Die Ergebnisse von Lowkey sind viel niedriger. Da stimmt was nicht.
Jo... und ich dachte schon ich spinne hier rum. Haswell bei gleicher Taktrate nicht schneller als Lynnfield. :freak:

Lowkey
2013-07-26, 19:16:23
Mit Timeresolution Tool?

dargo
2013-07-26, 19:18:21
@dargo

Ab wann im Level bei deinem Savegame startest du den 5s Fraps Benchmark?
Wenn der Wegpunkt 78,1m rechts im Bildschirm erscheint gleichzeitig "F11" und "W" zum Vorwärsbewegen drücken, "W" natürlich weiterhin gedrückt halten. Vergiss vorher Q für den Panzermodus nicht damit du lange genug lebst.

Ronny145
2013-07-26, 19:20:17
Ja mit Timer Tool. Ich komme aber ohne Timer schon auf höhere Ergebnisse (37-38 fps). Machst du mehrere Durchläufe? Der erste Versuch ist bei mir deutlich langsamer, ca 38 fps. Erst der 2. oder 3. Durchlauf stabilisiert die fps.

dargo
2013-07-26, 19:23:42
Machst du mehrere Durchläufe? Der erste Versuch ist bei mir deutlich langsamer, ca 38 fps. Erst der 2. oder 3. Durchlauf stabilisiert die fps.
Jo... das ist wichtig!

Wenn irgendein Durchlauf verhältnismäßig stärker abweicht den nicht bewerten. Womöglich hat das Streaming beim ersten Laden vom Savegame noch Auswirkungen. Deshalb am besten 4 Durchläufe machen und nur 2-4 bewerten.

Lowkey
2013-07-26, 19:25:41
Den ersten Versuch lasse ich weg und dann drei Durchläufe.

Time Tool auf 15,625 sind Avg 32 fps
Time Tool auf 0,5 sind Avg 39,5 fps

AA und AF sind diesmal komplett aus.

Das Time Tool stellt sich manchmal statt auf 15,265 auf 1,001. Das ist mir noch nicht klar warum es dies im laufendem Betrieb tut.

aufkrawall
2013-07-26, 19:31:34
Das Time Tool stellt sich manchmal statt auf 15,265 auf 1,001. Das ist mir noch nicht klar warum es dies im laufendem Betrieb tut.
Das macht Windows bzw. andere Apps wenn nötig selber und das Tool liest es nur aus.
0,5 und 1 können aber auch schon leicht verschiedene Ergebnisse liefern, nehme ich an (bei BF3 war bei mir die CPU-Auslastung mit 0,5 definitiv leicht höher als mit 1,0).

Ronny145
2013-07-26, 19:34:26
Den ersten Versuch lasse ich weg und dann drei Durchläufe.

Time Tool auf 15,625 sind Avg 32 fps
Time Tool auf 0,5 sind Avg 39,5 fps

AA und AF sind diesmal komplett aus.

Das Time Tool stellt sich manchmal statt auf 15,265 auf 1,001. Das ist mir noch nicht klar warum es dies im laufendem Betrieb tut.



Kapiere ich nicht. Wenn du auf Maximum stellst sollte sich nichts verstellen. Klingt eher nach Default, da ist es logisch. Dann lässt du das mit Default laufen.

Lowkey
2013-07-26, 19:35:37
Ja war auf default.

Jetzt sind es auf 4,7 Ghz auch Avg: 54,300. Das ändert aber an den alten Ergebnissen zueinander nichts.

Edit: Es sind 31,5% mehr fps gegenüber Ronny145, also sogar knapp über 4700mhz => also stimmt es nun.

dargo
2013-07-26, 19:50:02
Habs nochmal nachgerechnet. Ich brauche also für eine Verdoppelung der Frames vom 3,7Ghz Lynnfield einen Haswell i7 @4,1Ghz. Hmm... wird schwierig sowas günstig zu finden. :D

Danke für die Tests Jungs! :up:

Ph0b0ss
2013-07-26, 19:54:05
Savegame von dargo:

Nehalem
W3520@4200Mhz(21x200),NB@3600Mhz,HT(on),24GB (3x 8GB) DDR3-1600(9-9-9-24-1T),GTX 470 @875/2050 (1024x576), 320.49, Win7 64-bit

Frames, Time (ms), Min, Max, Avg
226, 5000, 40, 50, 45.200
Frames, Time (ms), Min, Max, Avg
226, 5000, 41, 49, 45.200
Frames, Time (ms), Min, Max, Avg
228, 5000, 42, 50, 45.600

Dabei ordentliche CPU-Auslastung ~90%!

dargo
2013-07-26, 23:52:25
Nur mal so nebenbei...

Die Frames steigen bei mir im absoluten CPU-Limit in der besagten Szene um ganze 16% von 16:9 auf 4:3. X-D Nicht schlecht die Details pro Frame @max. Details. :D

Simon
2013-07-27, 18:48:23
Ich werd wohl mit dem CPU-Upgrade noch warten, bis Mainboards mit dem neuem Chipsatz-Stepping raus sind. Gerade in den Nachrichten gesehen, dass die langsam verkauft werden.

dargo
2013-07-27, 21:55:39
Kein Thema, würde ich genauso machen. ;) Mache ich eh. :D

Aber vergiss bitte diesen Thread nicht wenn deine CPU da ist. Mich würde trotzdem interessieren ob SMT beim Haswell im gleichen Maße wie bei Ivy zulegt oder eher mehr. :)

Edit:
Habe gerade einen interessanten Vergleich entdeckt. Ich weiß die PCGH-Szene ist nicht die beste, dennoch sind Auffälligkeiten sichtbar.

46277

Was mir direkt ins Auge sticht. Der i7-2600K legt durch SMT, 100Mhz mehr Grundtakt und 2MB mehr L3 Cache gegenüber dem i5-2500K nur 10% zu während der i7-3770K gegenüber dem i5-3570K bei gleichen Voraussetzungen stolze 37% zulegt.

Jemand eine Erklärung dafür?

Edit 2:
Gibt es hier jemanden mit einer FX-8350 CPU und Crysis 3 der mein Savageme testen könnte? Raff? :D

Edit 3:
Ok... für den zu niedrigen Wert vom i7-2600K gibts hier wohl eine Bestätigung.
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9834150&postcount=86

Da stimmen wohl einige Werte bei der PCGH nicht. Schön wäre es wenn man das mal korrigieren würde.

Raff
2013-07-29, 22:09:08
Ich lutsche Crysis 3 gerade neu herunter. Was genau soll ich testen? Und muss ich meine Kiste dafür aus dem 24/7-Stromsparmodus holen? :biggrin:

MfG,
Raff

Ronny145
2013-07-30, 02:06:18
Das hier wie beschrieben testen: http://www.forum-3dcenter.org/vbulletin/showthread.php?p=9854482#post9854482


Timer Resolution Tool auf 0.5ms. Zur besseren Vergleichbarkeit wäre ein default CPU Wert schon wichtig.



Edit:
Habe gerade einen interessanten Vergleich entdeckt. Ich weiß die PCGH-Szene ist nicht die beste, dennoch sind Auffälligkeiten sichtbar.

46277

Was mir direkt ins Auge sticht. Der i7-2600K legt durch SMT, 100Mhz mehr Grundtakt und 2MB mehr L3 Cache gegenüber dem i5-2500K nur 10% zu während der i7-3770K gegenüber dem i5-3570K bei gleichen Voraussetzungen stolze 37% zulegt.

Jemand eine Erklärung dafür?



Die CPUs sind nicht alle gleich stark vom Timer Bug betroffen. Manche vielleicht gar nicht. Daraus lässt sich absolut nichts ableiten.

dargo
2013-07-30, 06:06:38
Jo... bitte den FX-8350 @Standard und nicht mit deinem "Feintuning" testen. :)

LSSJBroly
2013-07-30, 14:58:16
Da stimmen wohl einige Werte bei der PCGH nicht. Schön wäre es wenn man das mal korrigieren würde.

wobei ich sagen muss, dass der windows timer (maximum) mir keinen FPS-vorteil gebracht hat (und auch in Crysis 3 mit 1,000 Millisekunden standardmäßig läuft)

Ronny145
2013-07-30, 15:06:38
Zwischen 1.0 und 0.5 ist bei mir auch kein Unterschied messbar (maximal innerhalb der Messungenauigkeit). Bei dem Bug geht es um 10 oder 15 ms. Bei wem das ganze mit 1.0ms ohne Tool oder anderweitigem Programm läuft, der ist vom Bug eh nicht betroffen.

LSSJBroly
2013-07-30, 15:13:21
Ich sehe keine Frage in dem Zitat. Die verbuggten PCGH Werte haben mit deinem unverbuggten nichts zu tun.
Du hast recht, ich hab mich da etwas blöd ausgedrückt.

Ronny145
2013-07-30, 15:28:18
Ich sehe keine Frage in dem Zitat. Die verbuggten PCGH Werte haben mit deinem unverbuggten nichts zu tun.

dargo
2013-07-30, 16:20:52
wobei ich sagen muss, dass der windows timer (maximum) mir keinen FPS-vorteil gebracht hat (und auch in Crysis 3 mit 1,000 Millisekunden standardmäßig läuft)
Bei Standard 1ms verwundert das auch nicht. ;) Bei mir ist bsw. in Crysis 3 Standard 10ms, bei manchen sogar 15,6ms.

Lowkey
2013-07-30, 17:21:56
Wie hoch war der SMT Vorteil zwischen SB, IB und HW?

dargo
2013-08-04, 16:49:24
@Raff

Wird das noch was mit dem FX-8350? :confused:

Raff
2013-08-05, 09:32:38
Yep, wenn wir wieder "Benchwetter" haben. Derzeit hält mich nur wenig vorm Rechner.

MfG,
Raff

dargo
2013-08-05, 11:51:33
Verständlich. :D

BeetleatWar1977
2013-08-10, 09:09:00
Bei Standard 1ms verwundert das auch nicht. ;) Bei mir ist bsw. in Crysis 3 Standard 10ms, bei manchen sogar 15,6ms.
Kann mir jemdand verraten wie ich bei Crysis (1) über Steam die Benchmarkfunktion zum laufen bekomme?

Yep, wenn wir wieder "Benchwetter" haben. Derzeit hält mich nur wenig vorm Rechner.

MfG,
Raff
Wetter passt doch heute^^


btw - Die kostenlose version vom Timertool geht auch z.B. unter Win7 - man muss sie nur als Admin starten!

Simon
2013-08-10, 19:00:06
4770k ist angekommen und eingebaut. Jetzt muss ich aber erstmal drei Tage lang Windows-Updates installieren um dann irgendwann Crysis 3 neu runterzuladen :freak:

dargo
2013-08-10, 19:03:10
Gib Gas solange wir "Benchwetter" haben. :D

Simon
2013-08-10, 19:13:02
Gib Gas solange wir "Benchwetter" haben. :D
Hier in Sued-Kalifornien hab ich ... extrem selten Bench-Wetter :P

Simon
2013-08-13, 19:58:55
CPU ist eingebaut und laeuft mit 1.05V im Standard-Takt. Crysis 3 ist auch endlich runtergeladen mit 200kb/s :freak:

Also, nur dass ich das richtig verstehe:

1) Savegame weiter oben im Thread runterladen
2) Timer-Tool besorgen und Timer auf 1ms stellen
3) Mehrfach:
* Spiel starten, Savegame laden, FPS mit Fraps messen

Sollte nach jedem Run der Rechner neugestartet werden?

Das ganze jeweils mit und ohne SMT (muss erst noch die UEFI-Option dafuer finden :freak: )

dargo
2013-08-13, 20:26:16
CPU ist eingebaut und laeuft mit 1.05V im Standard-Takt.

Schön zu hören. :)


Crysis 3 ist auch endlich runtergeladen mit 200kb/s :freak:

Mein Beileid. :usad:


Also, nur dass ich das richtig verstehe:

1) Savegame weiter oben im Thread runterladen
2) Timer-Tool besorgen und Timer auf 1ms stellen
3) Mehrfach:
* Spiel starten, Savegame laden, FPS mit Fraps messen

Sollte nach jedem Run der Rechner neugestartet werden?

Das ganze jeweils mit und ohne SMT (muss erst noch die UEFI-Option dafuer finden :freak: )
1) Ich wüsste jetzt gar nicht, dass ich hier das Savegame hochgeladen habe. Habe ich das? Sorry, ich werde auch älter. :D Ich bin jetzt davon ausgegangen du hättest C3 schon gespielt und hättest die entsprechende Stelle erreicht. Falls nicht müsste ich danach suchen. Ist nicht gerade einfach bei C3 die Savegames richtig zuzuordnen. :freak:

2) Richtig... kannst mit dem Tool auch gleich auf 0,5ms stellen. Ich hatte auch 0,5ms.

3) Um Gottes Willen. Nicht das Spiel nach jedem Durchgang neustarten. :freak: Die genaue Vorgehensweise hatte ich hier glaube ich geschrieben. Moment...

Edit:
Guckst du... (http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9854482&postcount=42)
Guckst du nochmal... (http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9854635&postcount=44)

Simon
2013-08-13, 20:44:09
Ah, danke :)

Kannst du mir das Savegame zukommen lassen? Habs leider vergessen zu sichern :freak:

dargo
2013-08-13, 21:10:06
Kannst du mir das Savegame zukommen lassen? Habs leider vergessen zu sichern :freak:
Urgh... muss ich jetzt doch suchen und sortieren? :usad: Hast du jetzt C3 schon gespielt oder noch gar nicht? Weil die Saves werden automatisch gespeichert.

Simon
2013-08-13, 21:12:37
Hab Crysis3 durchgespielt vor dem Umbau und dann hab ich die SSD komplett formatiert :biggrin: Oder meinst du, die werden in Origin gespeichert und wiederhergestellt (kann ich gerade nicht pruefen, bin noch arbeiten)?

dargo
2013-08-13, 21:15:30
Hab Crysis3 durchgespielt vor dem Umbau und dann hab ich die SSD komplett formatiert :biggrin:
Argh... :ubash2: Ich such dann mal. :freak:

Ronny145
2013-08-13, 21:23:57
Im Anhang.

dargo
2013-08-13, 21:29:22
Hab die Stelle endlich. :freak:

46456

Ups... zu langsam. :D

Simon
2013-08-15, 02:27:01
Hast du das passende Savegame (Willkommen im Dschungel)? Anweisung zum Benchen folgt gleich...


Stelle zum Benchen bitte Fraps auf 5 Sekunden ein.

Wenn dein Savegame geladen ist drücke bitte die Q-Taste für den Panzermodus, ansonsten lebst du u.U. zu kurz und bitte nicht bewegen. Sobald rechts der Wegpunkt mit 78,1m erscheint bewege dich bitte gerade aus nach vorne mit der W-Taste ohne die Maus zu bewegen. Unten kommt so eine kleine Erhebung, du musst die Springen-Taste im richtigen Moment betätigen damit du vor dieser Erhebung nicht stecken bleibst. Die ganze Prozedur bitte 3x wiederholen für HT und non HT.

Benche bitte das ganze in 720p ohne AA/AF und max. Details. Wenn du nicht gegentesten kannst ob du dich dann tatsächlich im absoluten CPU-Limit befindest wäre es von Vorteil wenn du deine CPU untertaktest... zb. 2Ghz. Und vergiss bitte nicht vorsichtshalber jedes Mal die Timer Resolution zu prüfen.

Und wann soll ich den Fraps-Benchmark aktivieren? Das fehlt in den Anweisungen ;(

Edit: Und gibt es das Timer Resolution Tool fuer Windows 7 AMD64 irgendwo ohne 10 Euro zu bezahlen? ;(

dargo
2013-08-15, 07:18:05
Und wann soll ich den Fraps-Benchmark aktivieren? Das fehlt in den Anweisungen ;(

Gleichzeitig wenn du die Taste fürs Vorwärtsbewegen drückst. Also F11 zusammen mit "W" drücken sobald du die 78,1m siehst und "W" gedrückt halten.


Edit: Und gibt es das Timer Resolution Tool fuer Windows 7 AMD64 irgendwo ohne 10 Euro zu bezahlen? ;(
Du kannst die kostenlose Version nutzen, die funzt auch.

Simon
2013-08-15, 19:43:37
Ah, das "Windows XP" in der Liste der unterstuetzen OS hat mich etwas abgeschreckt.
Ich versuch den Benchmark heute abend noch unterzukriegen. Danach bin ich erstmal bis 26. im Urlaub :frown:

Simon
2013-08-18, 21:25:24
Hab den Test letzten Freitag nicht mehr komplett geschafft. Bin jetzt erstmal im Urlaub bis uebernaechsten Montag.

dargo
2013-08-18, 21:26:24
Schönen Urlaub... danach aber bitte Benches nachholen. :D

RMA
2013-08-19, 01:12:59
Habe den Thread mal interessiert gelesen. Überlege nämlich auch, meinen i5-Haswell noch gegen einen i7-Haswell zu tauschen, weil mir das CPU-Limit in C3 auf den Sack geht. Andererseits ist das ja wohl der einzige Titel weit und breit, bei dem man das merkt. Und u. U. ist man selbst mit einem i7-4770 schon Anfang nächsten Jahres angeschmiert, wenn evtl. Konsolenports kommen, die tatsächlich für Hexacores gemacht sind, welche wir auf dem Sockel 1150 wohl nie sehen werden. Oder dürften die Konsolenports für 6C auch auf 4C/8T gut skalieren, weil die Rohleistung der Intels viel höher ist?

P.S.: Man könnte auch mal TR2013 benchen. Angeblich wurde da mit einem Patch eine entsprechende Funktion nachgeschoben (hier (http://forums.eidosgames.com/showthread.php?t=136427) (v. a. Seite 2) vor einiger Zeit noch experimentell beschrieben, mittlerweile default-implementiert), die Multi-Cores / SMT fördert. Shantytown ist wohl eine der CPU-limitierten Stellen, die sich zum Benchen eignen könnte.

robbitop
2013-08-19, 08:59:05
In Crysis 3 hast du die Ausnutzung von SMT vor allem wenn animiertes Gras zu sehen ist. Ansonsten verfällt der große Vorteil von mehr Kernen/Threads.

Gerade wenn es mehr Threads werden als Cores hilft SMT. Ein i7 könnte schon ein wenig zukunftssicherer sein. Die Frage ist nur, wie stark die Optimierung beim PC ankommt. X360 hatte bereits ebenfalls 6 Threads, PS3 wenn man die SPEs mitzählt 9 Threads.
Aber laut Coda kann man bestimmte Parallelisierungen nur hinbekommen, wenn die Hardware absolut konstant ist. Das ist beim PC nicht der Fall -> deswegen gibt es bis heute kaum Spiele, die den Quadcore voll ausnutzen und noch weniger, die mehr als 4 Kerne ausnutzen. Das animierte Gras von Crysis 3 ist da bis dato noch ein ziemlicher Spezialfall.
Vieleicht bleibt es ja bei solchen Spezialfällen und ein i7 ist verschwendetes Geld. Wer weiß das schon?

dargo
2013-08-19, 12:19:38
Habe den Thread mal interessiert gelesen. Überlege nämlich auch, meinen i5-Haswell noch gegen einen i7-Haswell zu tauschen, weil mir das CPU-Limit in C3 auf den Sack geht.

Das lohnt nicht. Du hast dir aber auch irgendwie die falsche CPU gekauft. Bei einem Z-Brett wäre hier eher eine K-CPU angebracht fürs OC. Gerade bei nur einem i5 sind die Chancen besser Richtung ~4,5Ghz zu kommen.


Und u. U. ist man selbst mit einem i7-4770 schon Anfang nächsten Jahres angeschmiert, wenn evtl. Konsolenports kommen, die tatsächlich für Hexacores gemacht sind, welche wir auf dem Sockel 1150 wohl nie sehen werden.

Ich glaube du missverstehst da was. Wenn ein Spiel bsw. 8 Threads auslasten kann dann profitiert natürlich davon automatisch eine 4C/8T CPU. Die Spiele werden nicht für Cores sondern Threads ausgelegt. Echte 8 Cores legen natürlich mehr zu als 4 echte und 4 virtuelle, bei ansonsten gleicher Architektur. Du kannst dir das anhand von Intels 2C/4T CPU momentan anschauen. Aber meide Systeme wo eine Nvidia-Grafikkarte verbaut wurde. NV hat schon länger CPUs mit weniger als 4 Cores/Threads in ihrem Grafiktreiber fallen lassen. Dort legt eine 4 Core/Thread-CPU überproportional stark zu gegenüber bsw. 2 oder 3 Thread/Core-CPU. Was eigentlich nicht stimmt, die CPUs mit kleiner 4Cores/Threads werden nur ausgebremst. Bei AMD ist das nämlich anders.


Oder dürften die Konsolenports für 6C auch auf 4C/8T gut skalieren, weil die Rohleistung der Intels viel höher ist?

Das sowieso... mach dir da keinen Kopf, du wirst auch mit dem i5 noch lange Spaß haben. Die Jaguar-Cores takten doch mit nur lächerlichen 1,6Ghz. Zudem ist die Pro/Mhz-Leistung von deinem Haswell deutlich höher als bei Jaguar. Ich gehe auch davon aus, das mit den neuen Konsolen AVX verstärkt genutzt wird. Dein Haswell hat schon AVX 2.0.


Vieleicht bleibt es ja bei solchen Spezialfällen und ein i7 ist verschwendetes Geld. Wer weiß das schon?
Dann ist jeder CPU mit mehr als 4 Cores genauso verschwendetes Geld. Sorry, aber das ist Quatsch.

aufkrawall
2013-08-19, 12:55:45
Bei Crysis 3 könnte die Auslastung aller Threads mit HTT auch noch höher sein, ergibt auch im Gras häufig nur eine Gesamtauslastung von irgendwas mit 60 oder höchstens 70% (Geforce). Einen guten Performancegewinn gibts natürlich trotzdem.

Wenn du in Crysis 3 richtig mehr fps haben willst, hilft nur ein Intel mit mehr als vier physischen Cores, am besten um die 5Ghz rum.

dargo
2013-08-19, 13:04:15
Wenn du in Crysis 3 richtig mehr fps haben willst, hilft nur ein Intel mit mehr als vier physischen Cores, am besten um die 5Ghz rum.
Geht viel einfacher, Objektdetails auf Mittel. :D

robbitop
2013-08-19, 13:37:48
Dann ist jeder CPU mit mehr als 4 Cores genauso verschwendetes Geld. Sorry, aber das ist Quatsch.
Wieso ist das quatsch? Der i7 ist leider deutlich teurer als der i5. Wenn er das nicht für den vorgesehenen Zweck (i.e. Spiele) in Mehr-Geschwindigkeit umsetzt, ist es Geldverschwednung.
Bis dato war das immer der Fall - noch bleibt Crysis 3 ein ziemlicher Einzelfall. Und selbst in C3 nur wenn animiertes Gras zu sehen ist!

Wenn in naher Zukunft die Mehrzahl der Spiele ebenfalls so reagiert, ist ein i7 keine Verschwendung - sonst schon. So sehe ich das zumindest.

Ph0b0ss
2013-08-19, 13:44:27
Bei Crysis 3 könnte die Auslastung aller Threads mit HTT auch noch höher sein, ergibt auch im Gras häufig nur eine Gesamtauslastung von irgendwas mit 60 oder höchstens 70% (Geforce).

Teste mal im CPU-Limit! So komme ich auf eine Auslastung von 85-95% mit 8 Threads.

aufkrawall
2013-08-19, 13:50:12
Hm, afair war es im CPU-Limit. Ich überprüf das mal.

dargo
2013-08-19, 14:06:57
Wieso ist das quatsch? Der i7 ist leider deutlich teurer als der i5.

Von deutlich kann keine Rede sein. Der Xeon 4C/8T @3,3-3,7Ghz kostet mich heute 203€ inkl. Versand, ein 60-70€ Brett dazu... fertig. Schau dir an was Intel für einen 6 Kerner will. Und dann noch "veraltete" Architektur + viel teurerer Sockel.


Bis dato war das immer der Fall - noch bleibt Crysis 3 ein ziemlicher Einzelfall.
Das ist kein Einzelfall. Es gibt mehr Spiele die über 4 Cores heute schon skalieren, der Zugewinn ist nur nicht immer +~36% wie in C3.

robbitop
2013-08-19, 14:26:29
Nehmen wir doch mal ordentliche K CPUs. Da sind es 100 € Differenz. Das sind prozentual 50 % mehr Preis. Dafür will ich durchgängig eigentlich auch 50 % Mehrleistung sehen. Mit durchgängigen 30 % wäre ich auch zufrieden. Aber die Regel ist eher deutlich darunter.

dargo
2013-08-19, 14:38:47
Nehmen wir doch mal ordentliche K CPUs. Da sind es 100 € Differenz. Das sind prozentual 50 % mehr Preis. Dafür will ich durchgängig eigentlich auch 50 % Mehrleistung sehen. Mit durchgängigen 30 % wäre ich auch zufrieden. Aber die Regel ist eher deutlich darunter.
Warum sollte ich CPUs mit schlechterem P/L nehmen? Damit der i7 dann schlechter aussieht? :tongue:

Ph0b0ss
2013-08-19, 14:40:09
Nehmen wir doch mal ordentliche K CPUs. Da sind es 100 € Differenz. Das sind prozentual 50 % mehr Preis. Dafür will ich durchgängig eigentlich auch 50 % Mehrleistung sehen. Mit durchgängigen 30 % wäre ich auch zufrieden. Aber die Regel ist eher deutlich darunter.

Kommt aber auch darauf an, wie man das rechnet. Wenn man die CPU-Leistung als Gesamtsystem aus Mainboard, CPU und Ram (und vielleicht noch die Hälfte vom Netzteil) betrachtet, sieht es schon deutlich günstiger aus. Oder man nimmt einen kompletten Zocker-PC für ~1000€, da sind dann 100€ Aufpreis für bessere CPU oder GPU prozentual gar nicht mehr so viel!

robbitop
2013-08-19, 15:11:54
Warum sollte ich CPUs mit schlechterem P/L nehmen? Damit der i7 dann schlechter aussieht? :tongue:
Weil man die übertakten kann. Für mich sind 4,5 GHz einfach jetzt der unterste Standard. ;)

Kommt aber auch darauf an, wie man das rechnet. Wenn man die CPU-Leistung als Gesamtsystem aus Mainboard, CPU und Ram (und vielleicht noch die Hälfte vom Netzteil) betrachtet, sieht es schon deutlich günstiger aus. Oder man nimmt einen kompletten Zocker-PC für ~1000€, da sind dann 100€ Aufpreis für bessere CPU oder GPU prozentual gar nicht mehr so viel!
Nene. Dann ist der Vergleich ja total verzerrt. Das ist schon Komponente gegen Komponente. Das Spielchen kannst du bei jeder Einzekomponente weitertreiben.

aufkrawall
2013-08-19, 15:18:38
Weil man die übertakten kann. Für mich sind 4,5 GHz einfach jetzt der unterste Standard. ;)

Dann kommt Haswell gar nicht erst in Betracht, oder willst du Lotto spielen?

Tesseract
2013-08-19, 15:19:01
Von deutlich kann keine Rede sein. Der Xeon 4C/8T @3,3-3,7Ghz kostet mich heute 203€ inkl. Versand, ein 60-70€ Brett dazu... fertig. Schau dir an was Intel für einen 6 Kerner will. Und dann noch "veraltete" Architektur + viel teurerer Sockel.
und wie bringst du den auf einen takt auf dem er (unter optimalbedingungen) auch wirklich schneller als ein i5 am taktmaximum ist?

Nene. Dann ist der Vergleich ja total verzerrt. Das ist schon Komponente gegen Komponente. Das Spielchen kannst du bei jeder Einzekomponente weitertreiben.komponente gegen komponente ist verzerrt weil eine CPU alleine gerade mal als briefbeschwerer taugt. wenn, dann musst du systemzusammenstellung gegen systemzusammenstellung vergleichen wenn dich die performance interessiert - oder zumindest die kernkomponenten CPU+board+ram+GPU. (bzw. ohne GPU wenn es um reine CPU-aufgaben geht)

dargo
2013-08-19, 16:16:29
und wie bringst du den auf einen takt auf dem er (unter optimalbedingungen) auch wirklich schneller als ein i5 am taktmaximum ist?

Indem ich den 1 Kern-Turbo-Multi festsetze. 5Ghz bei i5 sind schon extrem schwierig und zudem eine Art Lotto, wie schon aufkrawall gesagt hat. Für 3,7Ghz bei Xeon brauche ich nicht mal die Vcore erhöhen, vielleicht sogar senken. :tongue: Zudem brauchst du beim i5-K ein teureres Z-Brett.

Ich will hier aber auch keine Grundsatzdiskussion lostreten Leute. Meine Entscheidung steht schon lange fest. Ihr könnt euch das kaufen was ihr möchtet. Ich brauche bei diesem Thema keine Kaufberatung. ;)

Dann kommt Haswell gar nicht erst in Betracht, oder willst du Lotto spielen?
Bingo... 4,5GHz bei Haswell ist völlig Quark gegenüber 4,5Ghz i5 SB. Da kann er noch locker 2 Jahre warten bis sich ein Umstieg lohnt.

robbitop
2013-08-19, 16:54:28
Dann kommt Haswell gar nicht erst in Betracht, oder willst du Lotto spielen?
Gut, dass ich einen Sandy hab. Die nächste CPU muss 4,5 GHz schaffen oder mehr. Die winzigen IPC Gewinne reißen es bis dato IMO jedenfalls nicht.


komponente gegen komponente ist verzerrt weil eine CPU alleine gerade mal als briefbeschwerer taugt. wenn, dann musst du systemzusammenstellung gegen systemzusammenstellung vergleichen wenn dich die performance interessiert - oder zumindest die kernkomponenten CPU+board+ram+GPU. (bzw. ohne GPU wenn es um reine CPU-aufgaben geht)
Naja das Argument kann ich mit jeder Einzelkomponente durchführen. Und am Ende ist der PC dann doppelt so teuer.
Ist ja auch völlig egal - denn bezahlen tut man immer noch in € und nicht in %. Der i7 kostet in der guten K Version 100 € mehr.

dargo
2013-08-19, 17:04:08
Gut, dass ich einen Sandy hab. Die nächste CPU muss 4,5 GHz schaffen oder mehr. Die winzigen IPC Gewinne reißen es bis dato IMO jedenfalls nicht.

Was glaubst du denn warum ich mit dem Lynnfield so lange gewartet habe? :wink: Eigentlich müsste ich noch auf den Haswell Refresh warten. Aber das ist mir dann definitiv zu lange (~5 Jahre :freak:). Zudem passt das bei mir ganz gut, weil Kollege ein Upgrade braucht. Der ist noch mit meinem alten Core 2 Duo @2,8Ghz unterwegs. X-D


Ist ja auch völlig egal - denn bezahlen tut man immer noch in € und nicht in %. Der i7 kostet in der guten K Version 100 € mehr.
Erstens sind es keine 100€ und zweitens was soll so gut an dem i7-K sein? Da kommst du noch schneller an Temperaturlimits ran als schon mit dem i5-K. Für 4,5Ghz musst du schon sehr viel Glück haben. Ist aber auch logisch. Durch SMT wird die vorhandene Leistung viel besser ausgenutzt wodurch natürlich die Temps höher sind.

robbitop
2013-08-19, 17:41:02
Na dann warte ich bis es einen Core i7 gibt, bei dem > 4,5 GHz kein Problem sind. Skylake evtl. Gibt ja bei mir bei der CPU keinen Handlungsbedarf. :)

Tesseract
2013-08-19, 17:52:53
Naja das Argument kann ich mit jeder Einzelkomponente durchführen. Und am Ende ist der PC dann doppelt so teuer.
man vergleicht überhaupt keine einzelkomponenten, genau das ist der punkt. du kannst immer nur lauffähige konfigurationen vergleichen. (es sei denn es handelt sich um ein upgrade)

wenn z.B. system A 400€ und system B 800€ kostet aber B mehr als doppelt so viele fps schafft weil im 400er system eine gurken-graka drin steckt bringt es dir wenig damit zu argumentieren, dass die gurken-graka vielleicht mehr performance pro € hat. am ende bekommst du mit B vielleicht trotzdem mehr performance pro € raus. bei CPUs ist das im prinzip das gleiche aber nicht so stark ausgeprägt.

dargo
2013-08-19, 17:59:25
@robbitop

Ist auch vernünftig. Bei dir wird sich ein Umstieg frühestens 2015 denke ich lohnen. Und dann würde ich gleich 5+Ghz anpeilen. Vielleicht haben wir bis dahin 6C/12T CPUs beim Mainstream-Segment, dann lohnt sich das erst recht.

Ich bin auch gespannt wie schnell sich AVX durchsetzt. Mit den Jaguarkernen der Konsolen stehen die Chancen schon mal sehr gut. Ich komm ja vom Lynnfield der gar kein AVX kann. Ein Haswell kann gleich AVX2. Da erhoffe ich mir dann weitere Leistungssteigerungen. :)

aufkrawall
2013-08-19, 18:02:29
Warum sollte man sich die Mühe machen, AVX2 zu unterstützen?
Geht das "wie von selbst"?

dargo
2013-08-19, 18:16:19
Warum sollte man sich die Mühe machen, AVX2 zu unterstützen?

Frag Codemasters... die tuns, obwohl Konsolen kein AVX1 unterstützen, trotzdem.


Geht das "wie von selbst"?
Da bin ich ehrlich gesagt überfragt.

Edit:
Wenn ich mir das hier anschaue würde ich sagen es läuft automatisch sobald AVX genutzt wird.
http://www.computerbase.de/artikel/prozessoren/2013/intel-haswell-prozessor-fuer-desktop-pcs-im-test/7/

Aber Vorsicht... Halbwissen!

RMA
2013-08-19, 18:40:36
Naja, ich bleibe erstmal beim i5, fürs Gras in C3 muss ich nicht direkt 300 € ausgeben. Ist ja auch das schöne am PC, wenn Ende des Jahres doch Titel kommen, die ähnlich stark von Multithreading profitieren, ist so ein CPU-Wechsel in ein paar Stunden (inkl. Fahrt zum Händler) gemacht. :)

@ dargo: Meinst du TR2013 benchen bringt was (hatte ich vor ein paar Seiten angesprochen)? Ich finde ja ganz interessant, was der Developer von Crystal Dynamics da im Forum schreibt. Demnach wurde die Multihreading-Funktion nachträglich in das Spiel reingepatcht. Das könnte man ja auch so deuten, dass man die Engine im Hintergrund bereits für die neuen Konsolen fit machen will. Etwaige Nachfolger auf Basis der TR2013-Engine wären ja ohne Zweifel Next Gen-Material.

dargo
2013-08-19, 18:52:19
Naja, ich bleibe erstmal beim i5, fürs Gras in C3 muss ich nicht direkt 300 € ausgeben. Ist ja auch das schöne am PC, wenn Ende des Jahres doch Titel kommen, die ähnlich stark von Multithreading profitieren, ist so ein CPU-Wechsel in ein paar Stunden (inkl. Fahrt zum Händler) gemacht. :)

Woher kommt eigentlich diese Info... mehr als 4 Cores/Threads würden in C3 nur beim Gras was bringen? Hat das überhaupt schon Jemand untersucht? Dauert nicht mehr so lange bis ich den Xeon habe dann kann ich mir selbst ein Bild davon machen.


@ dargo: Meinst du TR2013 benchen bringt was (hatte ich vor ein paar Seiten angesprochen)? Ich finde ja ganz interessant, was der Developer von Crystal Dynamics da im Forum schreibt. Demnach wurde die Multihreading-Funktion nachträglich in das Spiel reingepatcht. Das könnte man ja auch so deuten, dass man die Engine im Hintergrund bereits für die neuen Konsolen fit machen will. Etwaige Nachfolger auf Basis der TR2013-Engine wären ja ohne Zweifel Next Gen-Material.
Ich werde irgendwann bei Gelegenheit Tomb Raider hierfür:
http://www.forum-3dcenter.org/vbulletin/showthread.php?t=440739

untersuchen. Allerdings werden wir da mit unseren 4 Core CPUs nicht herausfinden wie es mit noch mehr Cores/Threads ausschaut. :wink: Da musst du auf meinen Xeon warten. :)

Tesseract
2013-08-19, 22:04:16
Geht das "wie von selbst"?

jein, man muss nur den code mit entsprechenden flags auf einem aktuellen compiler mit support neu kompilieren. außerdem muss der code natürlich so aufgebaut sein, dass sich AVX-instruktionen daraus optimieren lassen. je nach dem wie der code aussieht wird das besser oder schlechter funktionieren.

S940
2013-08-20, 00:13:04
Frag Codemasters... die tuns, obwohl Konsolen kein AVX1 unterstützen, trotzdem.
Na 3x darfst Du raten wieso ... weils umsonst ist. Intel sponsort das, die schicken vermutlich wieder ein paar Entwickler vorbei.

Intel hat ne Topp-Softwareabteilung, das vergißt man gerne mal.

Früher war das oft sch...lecht, da die Intel Leute natürlich auch den Intel Compiler benutzen, der früher sch...lechten Code für AMD CPUs produzierte, heutzutage gehts einigermaßen fair zu, wenn ich mich recht erinnere, dann legen die AMD Chips bei der AVX1-Version von Grid auch schön zu.

Denke auch, dass sich durch die Konsolen AVX breiter durchsetzen wird. Ist zwar kein muss, man kann die PC-Version ja einfach nochmal compilieren, aber es böte sich schon an, wenigstens ne AVX-Zusatzversion wie bei Grid anzubieten.

dargo
2013-08-20, 08:22:30
Na 3x darfst Du raten wieso ... weils umsonst ist. Intel sponsort das, die schicken vermutlich wieder ein paar Entwickler vorbei.

Achja... da war was mit irgendeinem exklusiven Feature auf den aktuellen Intel-IGPs oder? Damit meine ich nicht AVX.

Da:
http://www.pcgameshardware.de/Grid-2-PC-239144/News/Grid-2-Exklusive-Grafikeffekte-fuer-Haswell-1071513/


Früher war das oft sch...lecht, da die Intel Leute natürlich auch den Intel Compiler benutzen, der früher sch...lechten Code für AMD CPUs produzierte, heutzutage gehts einigermaßen fair zu, wenn ich mich recht erinnere, dann legen die AMD Chips bei der AVX1-Version von Grid auch schön zu.

Wenn ich mir das hier so anschaue...
46507

dann kann Vishera mit Haswell ganz gut mithalten. Am perfekten Multithreading über 4 Threads kann es ja nicht liegen wie man an den Ergebnissen sieht. Vielleicht an AVX? Wobei Haswell schon AVX2 hat. Keine Ahnung warum hier AMD so gut mithalten kann.

Am besten wäre ein Vergleich mit vs. ohne AVX. Afaik lässt sich die Software für so einen Vergleich aber nicht überlisten.

robbitop
2013-08-20, 09:32:42
man vergleicht überhaupt keine einzelkomponenten, genau das ist der punkt. du kannst immer nur lauffähige konfigurationen vergleichen. (es sei denn es handelt sich um ein upgrade)

wenn z.B. system A 400€ und system B 800€ kostet aber B mehr als doppelt so viele fps schafft weil im 400er system eine gurken-graka drin steckt bringt es dir wenig damit zu argumentieren, dass die gurken-graka vielleicht mehr performance pro € hat. am ende bekommst du mit B vielleicht trotzdem mehr performance pro € raus. bei CPUs ist das im prinzip das gleiche aber nicht so stark ausgeprägt.
We agree to disagree. Sorry - ich sehe das komplett anders als du. Ich vergleiche Einzelkomponenten nach ihrem Leistungszugewinn.

Woher kommt eigentlich diese Info... mehr als 4 Cores/Threads würden in C3 nur beim Gras was bringen? Hat das überhaupt schon Jemand untersucht? Dauert nicht mehr so lange bis ich den Xeon habe dann kann ich mir selbst ein Bild davon machen.


PCGH hat das IIRC mal untersucht. Die Gewinne waren vor allem beim Gras da. Das hat Coda auch schon bestätigt.

dargo
2013-08-20, 09:46:25
PCGH hat das IIRC mal untersucht.

Link?


Die Gewinne waren vor allem beim Gras da. Das hat Coda auch schon bestätigt.
Blablub ist zwar nett, von Praxis halte ich aber mehr. ;)

PS: im Prinzip ist es aber auch egal. Bei meiner Szene herrscht die größte CPU-Last und gleichzeitig sind die fps am tiefsten. Solche Stellen gilt es anzuheben. Wenn da perfektes Multithreading gemacht wird umso besser. An den Stellen wo ich eh genug fps habe muss ich nicht den höchsten Zugewinn haben.

robbitop
2013-08-20, 09:52:18
Link?


Blablub ist zwar nett, von Praxis halte ich aber mehr. ;)
Das ist schon eine Weile her und ich hatte es noch sinngemäß im Hinterkopf. Aber ich buddle jetzt nicht nach dem Link. (keine Zeit und auch keine Lust)
Vieleicht kann Raff sich ja mal dazu äußern.

Loeschzwerg
2013-08-20, 10:21:47
Fauler Hund :biggrin:

http://www.pcgameshardware.de/Crysis-3-PC-235317/Tests/Crysis-3-CPU-Test-SMT-FX-1058221/

Edit: Und hier der Vergleich zwischen den Patches http://www.pcgameshardware.de/Crysis-3-PC-235317/Tests/Crysis-3-CPU-Test-1068140/

robbitop
2013-08-20, 10:43:17
Leider wird nicht quantifiziert, wie ohne Gras die Skalierung ist. Aber es ist klar, dass der FX8350 nur "im Gras" mithalten kann und ansonsten abruscht. Ein klares Indiz, dass Gras das ganze besonders parallelisierbar macht. Das hat Coda ja auch bereits gesagt.

Ich frage mich, ob sowas wie Gras oder Physik in einer HSA konformen APU nicht auch deutlich beschleunigt werden könnte. Wenn Intel und AMD diesen Status irgendwann für alle CPUs/SoCs erreichen, dann könnte reines Erhöhen der CPU Kernzahl gar nicht mehr der einzige Faktor sein.

S940
2013-08-20, 10:55:35
Achja... da war was mit irgendeinem exklusiven Feature auf den aktuellen Intel-IGPs oder? Damit meine ich nicht AVX.

Da:
http://www.pcgameshardware.de/Grid-2-PC-239144/News/Grid-2-Exklusive-Grafikeffekte-fuer-Haswell-1071513/
Ja das ist der zweite Effekt. Wie besagt, Intel hat denen das Entwicklerteam geschickt und die haben dann an der Engine herumgeschraubt. In so nem Fall packen sie natürlich CPU (AVX) und GPU (Effekte) an. Wenn sie schon mal da sind ...
100% beweisen, dass es so ist kann ich nicht, aber mir genügt er Sachverhalt, dass überhaupt ne Spieleengine auf Intel GPUs optimiert wird. Kein Gamestudio würde dafür Geld ausgeben, auch wenn die Intel iGPUs die häufigst-verbreiteten GPUs sind. Die wurden also von Intel geschickt und bezahlt, früher gabs das auch schon ganz offiziell. Das konnte man bei den Spielen meistens sehen, indem im Vorspann ne Intelwerbung lief "Optimiert auf Intel Quadcore processors" oder wie auch immer.
Da gabs auch ne offizielle Intel-Website, wo man Hilfe erfragen konnte auf der auch Stand, dass Intel bei großen Projekten Entwickler schickt.

Wenn ich mir das hier so anschaue...
46507
Seh da leider nix:
Ungültige Angabe: AnhangAber wenns nur Gras bei Cry3 ist, dann ist das wirklich nur die Threadzahl, hatten wir schon mal vor langem besprochen.

Loeschzwerg
2013-08-20, 10:58:21
@robbi: Sollte schon möglich sein die entsprechenden Bibliotheken zu erweitern. Die reine CPU außerhalb von Servern ist quasi am aussterben und die iGPU ist dank dedizierter grafik nur am herumdümpeln. Verschenktes Potential also.

Vielleicht nimmt das Thema Physik dann endlich mal wieder an Fahrt auf :) Wäre doch der richtige Weg für Intel die Havok zu pushen.

Ronny145
2013-08-20, 11:04:46
Achja... da war was mit irgendeinem exklusiven Feature auf den aktuellen Intel-IGPs oder? Damit meine ich nicht AVX.


Das hat damit nichts zu tun. Eine AVX exe gab es bereits in Grid 1.


Wenn ich mir das hier so anschaue...
46507

dann kann Vishera mit Haswell ganz gut mithalten. Am perfekten Multithreading über 4 Threads kann es ja nicht liegen wie man an den Ergebnissen sieht. Vielleicht an AVX? Wobei Haswell schon AVX2 hat. Keine Ahnung warum hier AMD so gut mithalten kann.


Der Anhang ist kaputt. AVX bringt in Grid 2 nicht viel. Dennoch löblich, jedes zusätzliche Prozent nimmt man gerne mit.

y33H@
2013-08-20, 11:16:10
Kennst du AVX on/off Messungen von Grid 1/2 oder Dirt Showdown?

Ronny145
2013-08-20, 11:19:55
Kennst du AVX on/off Messungen von Grid 1/2 oder Dirt Showdown?


Ja meine eigenen zu Grid 2. Dirt Showdown müsste das andere CM Spiel mit AVX gewesen sein jetzt wo du es sagst. Grid 1 ist viel zu alt für AVX.

y33H@
2013-08-20, 11:27:48
Wie schaltest du AVX ab? Per UEFI? Im Spiel geht das nicht, es springt immer die AVX-Exe am.

S940
2013-08-20, 11:31:19
Wie schaltest du AVX ab? Per UEFI? Im Spiel geht das nicht, es springt immer die AVX-Exe am.
Wie wärs mit: Einfach die normale EXe in AVX umbenennen :biggrin:

y33H@
2013-08-20, 11:44:06
Das klappt ... ernsthaft? Die Idee war dann wohl zu simpel :usad:

S940
2013-08-20, 11:48:04
Das klappt ... ernsthaft? Die Idee war dann wohl zu simpel :usad:Habs nicht ausprobiert und hab nichtmal das Spiel, aber wüsste nicht, wieso das nicht klappen soll.
Ne nochmalige AVX-Abfrage zwecks Warnung werden sie ja wohl kaum in die Nicht-AVX-Exe eingebaut haben.

Solange es 2 exes gibt sollte es also ziemlich trivial sein. Unterschiedliche Codepfade in der gleichen Exe wären viel schwieriger zu handhaben.

Edit: Was man noch sicherstellen sollte ist, dass die Exe auch wirklich der einzigste Unterschied ist, nicht dass es da noch ne Dll oder so mit AVX Code gibt.

dargo
2013-08-20, 11:49:52
Seh da leider nix:

Komisch... ich schon. :confused:

Und jetzt?
46508

Da fällt mir gerade ein... bei Dirt Showdown gibts doch nichts Intel-Exklusives oder? Dennoch ist AVX drin.

Ja meine eigenen zu Grid 2.
Poste mal die Egebnisse und wie du AVX deaktiviert bekommen hast. :)

Das hat damit nichts zu tun. Eine AVX exe gab es bereits in Grid 1.

In Grid 1? :confused: Gabs damals überhaupt schon CPUs mit AVX? Das Spiel kam 2008.

S940
2013-08-20, 11:53:43
Jo Danke, jetzt gehts :)
Irgendwo mal auch auch ne Aussage, dass die kleinen FM2 CPUs nett skalieren, insbesondere auch, weil die entsprechenden Billig-Pentiums kein AVX haben, hab aber leider keine Grafik dazu gefunden. In dem Preis-Bereich wird selten getestet.

y33H@
2013-08-20, 11:56:59
Ich hatte das mal in Print, n Pentium wird von nem 4C-Richland völlig versägt.

S940
2013-08-20, 12:00:56
Ich hatte das mal in Print, n Pentium wird von nem 4C-Richland völlig versägt.
Ja stimmt, die haben außerdem ja nur 2 Threads, ganz vergessen. Hab noch den 750K Test gefunden, da gabs auch nen Dirt Test:

http://www.pcgameshardware.de/Athlon-II-X4-750K-CPU-256666/Tests/Athlon-II-X4-750K-Test-1070107/

Aber beim 8350 gabs damals wohl nen Meßfehler, oder gabs bis August nen neuen Patch? Der 4350 an der Spitze sieht da etwas schräg aus...

dargo
2013-08-20, 12:11:33
Vielleicht gabs einen Patch der die Module beim FX-8350 besser auslasten kann. Sprich leichtes Tuning beim Multithreading.

Ronny145
2013-08-20, 12:23:45
Wie schaltest du AVX ab? Per UEFI? Im Spiel geht das nicht, es springt immer die AVX-Exe am.


Über bcdedit schalte ich das ab. Liegt aber wirklich nur im Bereich von 2-4% wenn überhaupt. Genau kann ich das nicht sagen, weil die Ergebnisse in Grid 2 stark variieren. Trotz 5-6 Durchläufe nicht genau bezifferbar.

robbitop
2013-08-20, 13:27:19
Wahrscheinlich ist es entweder nicht FP limiertiert oder er nutzt keine 256 bit Executions. Dann profitiert man nur bei gelegentlichen FMAs einen Takt.

Intels Optimierung war u.A. das order independant tranparency, richtig? Angeblich können die NV/AMD Karten das nicht in Hardware.

S940
2013-08-20, 14:08:28
Wahrscheinlich ist es entweder nicht FP limiertiert oder er nutzt keine 256 bit Executions. Dann profitiert man nur bei gelegentlichen FMAs einen Takt.Die gibts erst ab AVX2.

y33H@
2013-08-20, 14:21:37
Angeblich können die NV/AMD Karten das nicht in Hardware.Die können das schon, aber nicht mit der Intel-Extension ^^

qiller
2013-08-24, 14:15:05
Was glaubst du denn warum ich mit dem Lynnfield so lange gewartet habe? :wink: Eigentlich müsste ich noch auf den Haswell Refresh warten. Aber das ist mir dann definitiv zu lange (~5 Jahre :freak:). Zudem passt das bei mir ganz gut, weil Kollege ein Upgrade braucht. Der ist noch mit meinem alten Core 2 Duo @2,8Ghz unterwegs.
...

Bin vom i7-950@3.86GHz auf 4770k@4.4GHz umgestiegen und wenn ich die Wahl nochmal hätte, würd ich wohl doch noch warten. Der Performance-Gewinn ist zwar da, aber Haswell ist eine in sich unschlüssige Ingenieurs-Kunst.

Die integrierten Funktionseinheiten zwar auf hohem Niveau (3d-Transistoren in 22nm, aufgebohrte Einheiten, breitere Anbindung der Caches) steht dem gegenüber:


WLP zwischen Heatspreader und Die (ich musste meinen Haswell köpfen, sonst hätte ich die 4.4GHz@1.295V nicht kühlen können)
aufgebohrte integrierte Grafik, die viel Die-Fläche wegnimmt und bei mir nur brach liegt; als Ersatz-Grafik hätte auch ne absolute Billigst-Variante genügt
höhere benötigte Spannungen, vor allem bei Verwendung der AVX2+FMA3-Einheiten kommt es sogar zur automatischen VCore-Erhöhung, wenn man keine fixed/Override-VCore wählt
extreme Hitzeentwicklung, die selbst bei Standardbetrieb nur durch Throttling über Strom-, Temperatur- und TDP-Grenzen beherrscht wird


@Haswell-User: Wer mal sehen möchte, was Haswell zu leisten vermag und wie er es realisiert, dem empfehle mal folgendes:

-Intel Linpack 11.03+ (Unterstützung für AVX2+FMA3) (http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download)
-HWMonitor neueste Version (http://www.cpuid.com/softwares/hwmonitor.html)
-CPUZ neueste Version (http://www.cpuid.com/softwares/cpu-z.html)

Die Haswell-Besitzer mit HT sollten die Berechnung noch auf die echten Kerne begrenzen (http://hardforum.com/showpost.php?p=1040033527&postcount=35), indem die "runme_xeon64.bat" bearbeitet wird:

@echo off
SETLOCAL

rem Setting up affinity for better threading performance
set KMP_AFFINITY=nowarnings,compact,granularity=fine
rem Setting path to OpenMP library
set PATH=..\..\..\redist\intel64\compiler;%PATH%

echo Running linpack_xeon64.exe. Output can be found in win_xeon64.txt.
start /b /affinity 55 linpack_xeon64.exe lininput_xeon64 > win_xeon64.txt

echo.
echo When this window closes the calculation is done.

ENDLOCAL

...oder deaktivieren HT im UEFI.

Ich benutze dann immer noch eine abgeänderte "lininput_xeon64"-Config-Datei, damit der Test die höheren Problemgrößen stärker nutzt:

Sample Intel(R) Optimized LINPACK Benchmark data file (lininput_xeon64)
Intel(R) Optimized LINPACK Benchmark data
7 # number of tests
10000 15000 20000 25000 30000 35000 40000 # problem sizes
10000 15000 20000 25000 30000 35000 40000 # leading dimensions
4 4 4 4 3 2 1 # times to run a test
4 4 4 4 4 4 4 # alignment values (in KBytes)

Wer nur 8GB RAM hat, kann nur bis 25000 problem size gehen.

Interessante Punkte, die man dann im Auge behalten sollte, während man den Linpack laufen lässt:

-HWMonitor: CPU-Temps, TDP-Werte!
-CPUZ: Taktfrequenz bzw Multi, bei Adaptive/Offset-Modus auch die VCore

Der neueste Intel Linpack ist so ziemlich das härteste, was es für einen Haswell gibt. Alle Einheiten, die für Floating-Point-Berechnungen involviert werden können, laufen hier auf Hochtouren, dem entsprechend hoch gehen die Temperaturen (vor allem bei OC und Aufheben der TDP-/Strom-Throttle-Grenzen: http://hardforum.com/showpost.php?p=1040033069&postcount=25 - man beachte die Max-Temperaturen in Realtemp und das es sich um eine Wasserkühlung handelt).

Je nachdem, ob man nun übertaktet, die Strom-/TDP-Grenzen aufhebt oder einfach auf Standard laufen lässt, sieht man, wie Haswell seine AVX2+FMA3-Einheiten antreibt (bei OC: zusätzlich höhere benötigte VCore) oder ausbremst (bei Standard: Runtertakten auf None-Turbo Frequenz, da TDP-Grenze überschritten wird).

Während des Linpack schwankt dann die Temperatur und der TDP-Wert im HWMonitor zwischen der Vorbereitung (füllen des RAMs), der eigentlichen Berechnung, wo die AVX2+FMA3-Einheiten involviert werden, und der Überprüfung der Ergebnisse.

Die Ergebnisse sind beeindruckend, in zweierlei Hinsicht. Mein 4.4GHz Haswell kommt auf ~225GFlops, aber auch auf TDP-Werte von 147W und 97°C CPU-Temp (geköpft, CPU-Kühler: Silver-Arrow). Ivy-Bridge-CPUs liegen hier in der Rechenleistung gut 70% zurück.

TLDR: Was ich mit meiner Ausführung sagen will, ist: Haswell legt zwar in der Rechenpower leicht bis ordentlich (AVX2+FM3) zu, aber wie dies realisiert wird (höhere VCore, bzw Throttlen), erinnert eher an OC-Tricks als an gute Ingenieurskunst.

...Vielleicht an AVX? Wobei Haswell schon AVX2 hat. Keine Ahnung warum hier AMD so gut mithalten kann.

Am besten wäre ein Vergleich mit vs. ohne AVX. Afaik lässt sich die Software für so einen Vergleich aber nicht überlisten.

Soweit ich weiß, werden die AVX2-Einheiten des Haswells nicht automatisch verwendet, wenn eine Software AVX1-Befehle benutzt, da AVX2 auch ein neues Instruction-Set mitbringt, was dann gezielt benutzt werden muss. Kann natürlich sein, dass Compiler irgendwann automatische Abfragen für Fallbacks einbauen (wär ja blöd, wenn ein Programm auf AVX1- oder None-AVX-CPUs nicht laufen würde), aber da hab ich k.A. von und steck auch nicht in der Materie.

mfg Oli

Tesseract
2013-08-24, 17:09:28
so heiß wird hsw überhaupt nicht. das problem ist, dass die leute wieder in den "takt=performance"-mindset zurückfallen und haswell mit zu viel spannung quälen um auf sb/ivy-taktraten zu kommen. einem haswell ~1,3V zu geben ist vergleichbar mit einem lynnfield auf 1,4-1.5V wo man ebenfalls schon wahnsinnig viel power reinbuttert um die letzten 100-200MHz mehr rauszuquetschen zu können - der sweetspot ist da schon lange überschritten.

haswell ist einfach eine andere architektur, die selbst ohne die neuen instruktionen pro MHz teilweise deutlich stärker ist als die vorgänger, aber daraus resultiert halt auch die etwas schlechtere taktbarkeit. richtig heiß wird die CPU dann, wenn man alles voll auslastet (selbst zwischen prime95 und intel burn test sind da schon riesige unterschiede) aber dann leistet er auch entsprechend mehr. in den typischen praxisszenarien wo hsw einem sb oder ivy nicht total davonzieht ist die hitze auch bei weitem nicht so ein problem.

dargo
2013-08-24, 17:19:04
so heiß wird hsw überhaupt nicht.
Ist er auch nicht solange man es mit der Vcore nicht übertreibt. Die Vcore-Erhöhung ist nur tödlich. Wird eventuell auch damit zusammenhängen, dass ein Teil der Spawas in die CPU gewandert ist und somit mitgekühlt werden muss.

Das ist auch der Grund warum ich den Xeon mit max. 3,7Ghz haben will. Da kommt man noch mit Standard Vcore zurecht. Die ganzen OC-Ergebnisse ohne AVX kann man im Netz eh in die Tonne kloppen. Ich lache mich jetzt schon kaputt wenn vermehrt Software mit AVX kommt und die Leute sich wundern warum das System plötzlich instabil ist. ;D

Aber eine Sache verwundert mich trotzdem. Wieso ist die standard Vcore bei den 22nm CPUs noch so hoch? Das sind Bereiche die mein 45nm Lynnfield verwendet. Selbst bei OC bleibe ich unter 1,2V. Kann es sein, dass wir langsam an die Grenzen des machbaren kommen? Was bringt uns noch kleinere Fertigung wenn die Vcore nahezu gleich bleibt? Das Ganze wird immer problematischer zu kühlen.

Lowkey
2013-08-24, 17:31:08
Ich bezweifel mal ganz stark, dass du die Vcore von HW mit der Vcore von Ivy oder SB vergleichen kannst. Dafür sind die Änderungen zu groß.

Ronny145
2013-08-24, 17:51:06
so heiß wird hsw überhaupt nicht. das problem ist, dass die leute wieder in den "takt=performance"-mindset zurückfallen und haswell mit zu viel spannung quälen um auf sb/ivy-taktraten zu kommen. einem haswell ~1,3V zu geben ist vergleichbar mit einem lynnfield auf 1,4-1.5V wo man ebenfalls schon wahnsinnig viel power reinbuttert um die letzten 100-200MHz mehr rauszuquetschen zu können - der sweetspot ist da schon lange überschritten.


Er spricht von default und Linpack.

Linpack knüppelt alles nieder, dagegen ist Prime95 AVX Kindergeburtstag. Mit der Praxis hat das zum Glück nichts zu tun. Das Programm mit der AVX Auslastung möchte ich sehen. Und selbst wenn dem so wäre, könnte man die Spannung und den Takt deutlich absenken und wäre dennoch 50%+ schneller als Ivy Bridge dank AVX2/FMA3.

Tesseract
2013-08-24, 17:59:14
Er spricht von default und Linpack.

Linpack knüppelt alles nieder, dagegen ist Prime95 AVX Kindergeburtstag. Mit der Praxis hat das zum Glück nichts zu tun. Das Programm mit der AVX Auslastung möchte ich sehen. Und selbst wenn dem so wäre, könnte man die Spannung und den Takt deutlich absenken und wäre dennoch 50%+ schneller als Ivy Bridge dank AVX2/FMA3.

das war auch nicht gegen ihn gerichtet sondern eine allgemeine anmerkung zu der gängigen meinung haswell würde so heiß, die man in jedem zweiten review liest nachdem sie die performance in spielen und den verbrauch mit linpack oder ähnlichem gemessen haben. die architektur ist pro operation halt trotzdem in nahezu jedem szenario effizienter und die hitze kommt vor allem daher, dass die CPU in diesen szenarien einfach viel mehr leistet (und meist auch noch zu stark overvoltet ist).

was schafft denn ein lynnfield mit 4GHz in linpack? 60GFlops wenns hoch kommt?

qiller
2013-08-24, 19:51:34
Wie ich schon schrieb, Haswell wird im Standardbetrieb deswegen nicht so heiß, weil gedrosselt wird. Deaktiviert die Grenzen und ihr werdet Euer "heißes" Wunder erleben. WLP zwischen Die und HS + minimal größeres Gap + integrierte Spannungsregler + VCore-Anhebung bei AVX-Anwendungen.

Meine ~1.295V sind Linpack AVX2 stable, für Prime95 27.9 AVX-stable brauch ich 1.274V und für None-AVX Krams nur 1.22V. Das ganze für 4.4GHz. Meine CPU ist ein eher schlechterer Haswell.

Bei 1.295V hab ich dann folgende max Temps:
Intel Linpack 11.05: 97°C
Prime95 27.9 8/12k: 84°C
Prime95 26.6: 72°C

Bei Prime 26.6 könnte ich dann wie gesagt noch ordentlich runter gehen in der VCore, was aber auch nur rund 3°C weniger ausmacht. Meine CPU ist geköpft und wird mit nem ziemlich großen Doppelturm-Dual-Lüfter-Kühler gekühlt, ihr könnt gern 11-14°C draufpacken für ungeköpfte CPUs.

Ich stell mir grad nen ungeköpften i7-4770 mit boxed-Kühler vor, der geht selbst im Standardbetrieb mitm Linpack sofort in die Drossel über.

Wie gesagt, Haswell ist keine hohe Ingenieurskunst von Intel, da haben wir schon viel besseres gesehen (z.B. Core2-Architektur).

mfg Oli

Ronny145
2013-08-24, 19:59:11
Wie ich schon schrieb, Haswell wird im Standardbetrieb deswegen nicht so heiß, weil gedrosselt wird.

Die Aussage ist Unsinn. Gedrosselt wird eben weil die CPU zu heiß wird. Ich weiß ja nicht wann bei dir eine Drosselung auftritt, bei mir sind es 100 Grad. Das ist die Grenze, ab dort wird gedrosselt. Wenn das für dich "nicht so heiß" ist, was dann? Und wie gesagt sind das theoretische Auslastungsprogramme. Anscheinend ergötzt du dich 24/7 an Linpack oder Prime95 AVX.



Wie gesagt, Haswell ist keine hohe Ingenieurskunst von Intel

Natürlich, das hätte jeder 0815 Ingenieur besser machen können. Voll die Ingenieurs Stümper bei Intel. :rolleyes:

Coda
2013-08-24, 20:20:07
Die können das schon, aber nicht mit der Intel-Extension ^^
Nein, sie können es tatsächlich nicht.

qiller
2013-08-25, 00:13:32
Die Aussage ist Unsinn. Gedrosselt wird eben weil die CPU zu heiß wird. Ich weiß ja nicht wann bei dir eine Drosselung auftritt, bei mir sind es 100 Grad. Das ist die Grenze, ab dort wird gedrosselt. Wenn das für dich "nicht so heiß" ist, was dann? Und wie gesagt sind das theoretische Auslastungsprogramme. Anscheinend ergötzt du dich 24/7 an Linpack oder Prime95 AVX.


Bitte richtig lesen und hast du meinen Test überhaupt mal ausprobiert? Ich rede hier nicht von der Temperatur-Drossel allein und bezüglich der temp-Drossel hast du auch vollkommen recht. Es geht darum, dass vorher schon durch die TDP- bzw. Stromgrenze heruntergetaktet bzw begrenzt wird, da bei voller Auslastung durch AVX/FMA-Befehle die Leistungsaufnahme bzw. Stromzufuhr bestimmte Werte überschreiten.

Bei mir taktet mein i7-4770k im Standardbetrieb während des Linpack trotz aktiviertem Turbo nur auf 3.5GHz, wo er doch eigt. 3.7GHz haben sollte, wie bei den anderen None-AVX Tests auch.

Deaktiviert man die Grenzen oder übertaktet, sieht man den Umkehrschluss: AVX-Befehle benötigen für dieselbe Taktfrequenz mehr Spannung. Das ist es, was ich mit "keine hohe Ingenieurskunst" meine. OC-Tricks anwenden, damit bestimmte Einheiten in der CPU überhaupt genug Saft bekommen.

Sry, das wär ungefähr so, als wenn ein alter, übertakteter Pentium bei Integer-Berechnungen mit 2V läuft, bei Floating-Berechnungen aber mit 2.3V (und dementsprechend heißer). Oder im None-OC-Betrieb: Bei konstanten 2V läuft er bei Integer-Berechnungen mit 300MHz, bei Floating-Point-Berechnungen nur mit 250MHz (und ist dementsprechend langsamer).

Ich hoffe ich habe meinen Standpunkt etwas klarer ausgedrückt.

mfg Oli

Ronny145
2013-08-25, 02:17:29
Bitte richtig lesen und hast du meinen Test überhaupt mal ausprobiert?


Das kannte ich vorher schon. Die Auslastung scheint in den neuesten Linpack Versionen noch weiter angestiegen zu sein.


Bei mir taktet mein i7-4770k im Standardbetrieb während des Linpack trotz aktiviertem Turbo nur auf 3.5GHz, wo er doch eigt. 3.7GHz haben sollte, wie bei den anderen None-AVX Tests auch.

Hier liegt keine Drosselung vor. Der Basistakt liegt bei 3,5 Ghz. Das haben sollte hat hier nichts zu suchen, wenn das garantiert wäre bräuchte es keinen Turbo.


Deaktiviert man die Grenzen oder übertaktet, sieht man den Umkehrschluss: AVX-Befehle benötigen für dieselbe Taktfrequenz mehr Spannung. Das ist es, was ich mit "keine hohe Ingenieurskunst" meine. OC-Tricks anwenden, damit bestimmte Einheiten in der CPU überhaupt genug Saft bekommen.


Was wäre dein Vorschlag? Die Grundspannung einfach höher legen, damit auch der Extremst worst case AVX Benchmark mit der gleichen Spannung läuft wie jegliches 0815 Programm? Wegen 0,01% vom Nutzungsverhalten würde man sich ein sinnloses penalty erschaffen. Das wäre erst recht blödsinnig. Wir reden hier im theoretischen Fall von der verdoppelten Rechenleistung. Wenn durch die deutlich höhere Auslastung der Rechenkerne in diesem Spezialfall mehr Spannung für stabilen Betrieb der Kerne zugefügt werden muss, dann ist es nur logisch und sinnvoll das unter dem Spezialfall mehr Spannung zugefügt wird. Mit dem gleichen Argument könnte man die nach oben skalierende VID bei steigender Taktfrequenz kritisieren. Das Endprodukt ist das gleiche. Du erhältst mehr Leistung.



Sry, das wär ungefähr so, als wenn ein alter, übertakteter Pentium bei Integer-Berechnungen mit 2V läuft, bei Floating-Berechnungen aber mit 2.3V (und dementsprechend heißer). Oder im None-OC-Betrieb: Bei konstanten 2V läuft er bei Integer-Berechnungen mit 300MHz, bei Floating-Point-Berechnungen nur mit 250MHz (und ist dementsprechend langsamer).

Ich hoffe ich habe meinen Standpunkt etwas klarer ausgedrückt.

mfg Oli


Überzogener hätte der Vergleich kaum sein können. Dann zähle erstmal auf, welches paxistauglichen Programme mit AVX Support eine Linpack ähnliche Auslastung und entsprechend hohe Temperatur erzeugen. Denn das hier:


extreme Hitzeentwicklung, die selbst bei Standardbetrieb nur durch Throttling über Strom-, Temperatur- und TDP-Grenzen beherrscht wird


ist Panikmache. Damit suggerierst du chronisches Thottling und TDP Überschreiten im Standardbetrieb. Du musst dir bewusst sein, dass Linpack ein völlig praxisferner Test ist. Es wäre ja echt super, wenn wir nutzvolle Programme hätten, die durch AVX2 50-100% auf Haswell schneller rennen so wie Linpack. In dem Fall würde ich meine CPU gerne drosseln um der Temperaturprobleme aus dem Weg zu gehen. Da könnte ich locker 1 Ghz runter gehen und hätte immer noch noch ein dickes Plus auf der Seite stehen.

Simon
2013-08-26, 21:30:45
Schönen Urlaub... danach aber bitte Benches nachholen. :D
So, da sind sie:

HTT On FPS:
Run 1: 58 55 48 49 52
Run 2: 59 52 49 48 53
Run 3: 57 52 48 46 48


HTT Off FPS:
Run 1: 42 39 35 35 38
Run 2: 42 36 33 35 36
Run 3: 42 36 35 36 35


Rohdaten sind im Anhang.

System:

Win 7 Home Premium AMD64
Intel 4770k @ Default
Gigabyte Z87MX-D3H, UEFI F4D
XFX DD Radeon 7970 @ 1GHz, Catalyst 13.8
16 GB RAM

dargo
2013-08-26, 21:54:42
So, da sind sie:

HTT On FPS:
Run 1: 58 55 48 49 52
Run 2: 59 52 49 48 53
Run 3: 57 52 48 46 48


HTT Off FPS:
Run 1: 42 39 35 35 38
Run 2: 42 36 33 35 36
Run 3: 42 36 35 36 35


Rohdaten sind im Anhang.

System:

Win 7 Home Premium AMD64
Intel 4770k @ Default
Gigabyte Z87MX-D3H, UEFI F4D
XFX DD Radeon 7970 @ 1GHz, Catalyst 13.8
16 GB RAM

Danke. :up:

Wenn ich mich nicht verrechnet habe sieht es folgendermaßen aus.

SMT:
52,4
52,2
50,2

non SMT:
37,8
36,4
36,8

Sind also 51,6 vs. 37,0fps. Und somit + 39% für SMT. Noch minimal besser als bei Ivy Bridge. Allerdings könnten das auch schon Messschwankungen sein. Zudem weicht der dritte Wert mit SMT bei dir doch etwas stärker ab. Und bei non SMT der erste. Im besten Fall wären es +43%. Man kann also sagen ca. 40%. Wirklich erstaunlich... normalerweise bin ich davon ausgegangen, dass SMT beim perfekten Multithreading +25% bringt. Kannte ich so vom Encoding. Bei Games gehen hier also sogar bis zu +40%, sehr erfreulich. :)

Ronny145
2013-08-26, 21:58:07
37 fps sind zu wenig für den 4770k ohne SMT. Entweder ist das inklusive Timer Bug gemessen oder etwas liegt im Argen.

dargo
2013-08-26, 22:00:57
37 fps sind zu wenig für den 4770k ohne SMT. Entweder ist das inklusive Timer Bug gemessen oder etwas liegt im Argen.
Ich nehme an er hat in beiden Fällen unter gleichen Bedingungen, also ohne Timer Resolution getestet.

@Simon
Stimmt das soweit?

Ronny145
2013-08-26, 22:04:02
Wir wollen 0,5-1,0ms Ergebnisse um verfälschende SMT Skalierungen durch den Timer Bug auszuschließen.

dargo
2013-08-26, 22:10:21
Wir wollen 0,5-1,0ms Ergebnisse um verfälschende SMT Skalierungen durch den Timer Bug auszuschließen.
Ich wüßte jetzt zwar nicht aus welchen Grund der Timer Bug non SMT stärker bremsen sollte als SMT. Aber gut... non SMT vs. SMT wäre unter Fullspeed, ergo 0,5 oder 1ms am besten. Das stimmt schon.

Edit:
@Simon

Könntest du bitte den Test nochmal ohne den Timer Bug wiederholen?

Und wenn du schon dabei bist dann bitte auch gleich mit SMT gegentesten ob du noch vollständig im CPU-Limit bist. Dafür reicht es wenn du deine GPU von 1000Mhz auf 900Mhz untertaktest. Wenn sich an den Frames nichts ändert passt es.

robbitop
2013-08-27, 10:11:55
Noch minimal besser als bei Ivy Bridge.
Und genau hier wundert es mich, dass man den Executionbereich des Haswells aufgebohrt hat und selbst mit SMT kaum mehr dabei herumkommt.

Man kann also sagen ca. 40%. Wirklich erstaunlich... normalerweise bin ich davon ausgegangen, dass SMT beim perfekten Multithreading +25% bringt. Kannte ich so vom Encoding. Bei Games gehen hier also sogar bis zu +40%, sehr erfreulich. :)
Das widerum wundert mich nicht. Encoding ist ja an sich sehr geordneter, breiter Code (Vektorberechnungen), die die Execution gut auslasten. Das ist bei Spielen doch etwas anders. Dass SMT hier mehr bringt, ist ein logischer Schluss.

Tesseract
2013-08-27, 10:36:22
Das widerum wundert mich nicht. Encoding ist ja an sich sehr geordneter, breiter Code (Vektorberechnungen), die die Execution gut auslasten. Das ist bei Spielen doch etwas anders. Dass SMT hier mehr bringt, ist ein logischer Schluss.
außerdem läuft da 8x der selbe code, d.h. jeder thread lastet die selben einheiten mehr oder weniger stark aus.

dargo
2013-08-27, 12:11:46
Das widerum wundert mich nicht. Encoding ist ja an sich sehr geordneter, breiter Code (Vektorberechnungen), die die Execution gut auslasten. Das ist bei Spielen doch etwas anders. Dass SMT hier mehr bringt, ist ein logischer Schluss.
Also für mich ist das wirklich neu. Ich hätte nie gedacht, dass in Games bis zu 40% mehr drin sind. Wenn man sich das mal überlegt... das ist schon fast perfekte Skalierung wie bei einem Intel 6 Kerner mit non SMT. Und diesen 6 Kerner gibts noch nicht mal. :tongue: Haswell E kommt ja erst nächstes Jahr, zudem zu saftigen Preisen.

PS: man sollte hierbei auch bedenken, dass in diesem Vergleich jeweils ein i7 mit 8MB L3 verwendet wurde. Ein i5 hat 2MB weniger. Eventuell bringt das auch noch einen niedrigen Prozentsatz.

Botcruscher
2013-08-27, 12:38:30
Bei der Menge an neuen Ausführungseinheiten ist die Frage nach dem geringen Gewinn berechtigt. Gerade die Zweikerner profitieren schon lange deutlich.

robbitop
2013-08-27, 12:56:04
Also für mich ist das wirklich neu. Ich hätte nie gedacht, dass in Games bis zu 40% mehr drin sind. Wenn man sich das mal überlegt... das ist schon fast perfekte Skalierung wie bei einem Intel 6 Kerner mit non SMT. Und diesen 6 Kerner gibts noch nicht mal. :tongue: Haswell E kommt ja erst nächstes Jahr, zudem zu saftigen Preisen.

PS: man sollte hierbei auch bedenken, dass in diesem Vergleich jeweils ein i7 mit 8MB L3 verwendet wurde. Ein i5 hat 2MB weniger. Eventuell bringt das auch noch einen niedrigen Prozentsatz.
Naja bisher waren auch selten vier oder mehr Kerne wirklich voll ausgelastet. Crysis 3 + Gras sind da ein Sonderfall.
Aber beim Core i3 sollte man vorher auch schon ähnliche Benefits von SMT gesehen haben, sofern 4 Kerne wirklich voll ausgelastet würden.

dargo
2013-08-27, 14:33:30
Bei der Menge an neuen Ausführungseinheiten ist die Frage nach dem geringen Gewinn berechtigt. Gerade die Zweikerner profitieren schon lange deutlich.
Lass mich raten... mit einer Nvidia Karte? :tongue:

Simon
2013-08-27, 22:07:27
Edit:
@Simon

Könntest du bitte den Test nochmal ohne den Timer Bug wiederholen?
Kann ich gerne machen. Der Timer Bug betrifft doch Windows 8 und nicht Windows 7, oder?
Timer Resolution war mittels PCGH-Tool in allen Faellen auf 1ms eingestellt.

Und wenn du schon dabei bist dann bitte auch gleich mit SMT gegentesten ob du noch vollständig im CPU-Limit bist. Dafür reicht es wenn du deine GPU von 1000Mhz auf 900Mhz untertaktest. Wenn sich an den Frames nichts ändert passt es.
Ich schreibs mal auf. Erstmal rausfinden, wie ich die Radeon untertakte :freak:

dargo
2013-08-27, 22:15:54
Der Timer Bug betrifft doch Windows 8 und nicht Windows 7, oder?

Nee... beides. Ich hab bei Win7 10ms gehabt und bei Win8 15,6ms. :freak:


Timer Resolution war mittels PCGH-Tool in allen Faellen auf 1ms eingestellt.

Das kann eigentlich nicht stimmen da deine Werte zu niedrig sind. Bist du ganz sicher?


Ich schreibs mal auf. Erstmal rausfinden, wie ich die Radeon untertakte :freak:
Im CCC unter Leistung und dann Overdrive. :D

Simon
2013-08-28, 01:54:26
Nee... beides. Ich hab bei Win7 10ms gehabt und bei Win8 15,6ms. :freak:
Versteh ich jetzt nicht. Timer Resolution ist per Tool auf 1 ms gesetzt.
Ansonsten: Google Suche (https://www.google.com/search?q=windows+timer+bug+benchmark&oq=windows+timer+bug+benchmark&aqs=chrome..69i57.4946j0&sourceid=chrome&ie=UTF-8) spricht nur von Windows 8.


Das kann eigentlich nicht stimmen da deine Werte zu niedrig sind. Bist du ganz sicher?
Sofern das Tool nicht luegt: Ja. Mehrfach mittels Alt+Tab gecheckt aus dem Spiel raus und vor dem Spielstart auf 1ms gesetzt.


Im CCC unter Leistung und dann Overdrive. :D
Gefunden :freak:

HTT Off 1: 45 38 39 33 36
HTT Off 2: 42 37 33 35 37
HTT Off 3: 41 38 33 37 36

HTT On 1: 52 47 41 44 44
HTT On 2: 50 45 40 45 47
HTT On 3: 53 46 46 41 46


Mit 800MHz anstelle 1000Mhz auf der GPU:
HTT Off 1: 42 39 34 35 37
HTT Off 2: 42 36 33 37 35
HTT Off 3: 43 38 35 35 36

Rohdaten sind wieder im Anhang.

Und ein Video vom Benchmark: http://db.tt/v0ZMo0ek

dargo
2013-08-28, 08:26:26
Versteh ich jetzt nicht. Timer Resolution ist per Tool auf 1 ms gesetzt.
Ansonsten: Google Suche (https://www.google.com/search?q=windows+timer+bug+benchmark&oq=windows+timer+bug+benchmark&aqs=chrome..69i57.4946j0&sourceid=chrome&ie=UTF-8) spricht nur von Windows 8.

Das was du da verlinkt hast hat nichts mit dem Timer Resolution Bug von Crysis 3 zu tun. Welches Tool nimmst du dafür überhaupt?


HTT Off 1: 45 38 39 33 36
HTT Off 2: 42 37 33 35 37
HTT Off 3: 41 38 33 37 36

HTT On 1: 52 47 41 44 44
HTT On 2: 50 45 40 45 47
HTT On 3: 53 46 46 41 46


Mit 800MHz anstelle 1000Mhz auf der GPU:
HTT Off 1: 42 39 34 35 37
HTT Off 2: 42 36 33 37 35
HTT Off 3: 43 38 35 35 36

Oh weiha... wir kommen so nicht weiter. :usad:

Mit HTT off und 800Mhz GPU bist du definitiv im ganz leichten GPU-Limit sollten die Ergebnisse stimmen. Aber warum nimmst du 800Mhz? Du solltest doch 900Mhz nehmen. Du darfst die Karte fürs Gegentesten nicht so stark untertakten sonst ist die Chance für GPU-Limit umso größer. Deshalb war mein Vorschlag 900Mhz. Und ganz wichtig... wir brauchen den Gegentest mit HTT on weil da die Frames höher sind und die Chancen für GPU-Limit somit wesentlich größer.

Mach mal bitte erstmal nur folgenden Test.

1. HTT on mit 1000Mhz GPU und ohne Timerresolution Bug.
2. HTT on mit 900Mhz GPU und ohne Timerresolution Bug für den Gegentest.

Unterscheiden sich beide Ergebnisse kannst du dir weitere Tests sparen. Dann müsstest du den CPU-Takt senken. Bringt ja nichts wenn du im GPU-Limit misst. Wie gesagt mache bitte erstmal nur die beiden Tests dann sehen wir weiter. :)

PS: und nimm bitte die avg.fps aus der Frapslog.txt. Dann brauche ich nicht so viel rechnen.

Ronny145
2013-08-28, 11:42:54
Einfach 1024x576 nehmen. Eine Radeon 7970 1Ghz dürfte da aber nicht limitieren. Selbst meine 660 Ti bekommt das hin. Oder ist AA eingestellt? Die Werte sind einfach zu niedrig. Über 40 fps müssten das ohne HTT schon werden.

dargo
2013-08-28, 16:15:07
@Simon

Hier ist übrigens das Tool Timer Resolution.
46572

Weiß jetzt nicht genau welches Tool du genommen hast. Mich hats eh etwas gewundert, dass du 1ms einstellen kannst. Mit diesem Tool geht nämlich nur 0,5ms (Maximum).

Edit:
Ich sehe gerade welche Grafikkarte du genau hast. Du bist nicht zufällig von diesem Problem betroffen hoffe ich? :freak:
http://www.3dcenter.org/news/hardware-und-nachrichten-links-des-27-august-2013

Simon
2013-08-28, 20:36:18
@Simon

Hier ist übrigens das Tool Timer Resolution.
46572

Weiß jetzt nicht genau welches Tool du genommen hast. Mich hats eh etwas gewundert, dass du 1ms einstellen kannst. Mit diesem Tool geht nämlich nur 0,5ms (Maximum).
Das von der aktuellen PCGH DVD ;)


Edit:
Ich sehe gerade welche Grafikkarte du genau hast. Du bist nicht zufällig von diesem Problem betroffen hoffe ich? :freak:
http://www.3dcenter.org/news/hardware-und-nachrichten-links-des-27-august-2013
Nein, ich hab die "normale" XFX DD 7970. Radeon Pro berichtet zumindest immer stabile 1GHz auf der GPU.

dargo
2013-08-28, 20:50:08
Das von der aktuellen PCGH DVD ;)

Das nützt mir nichts, ich lese keine PCGH. ;) Ist dann nun das selbe Tool oder nicht?


Nein, ich hab die "normale" XFX DD 7970. Radeon Pro berichtet zumindest immer stabile 1GHz auf der GPU.
Oki.

Simon
2013-08-29, 04:12:25
1.0 GHz GPU 1: 60 54 53 47 50
1.0 GHz GPU 2: 56 51 47 49 51
1.0 GHz GPU 3: 58 53 49 46 51

0.9 GHz GPU 1: 58 54 50 48 51
0.9 GHz GPU 2: 59 54 51 52 54
0.9 GHz GPU 3: 57 52 51 46 53

Jeweils mit HTT On. Sieht jetzt nicht so unterschiedlich aus :confused:

dargo
2013-08-29, 09:15:15
1.0 GHz GPU 1: 60 54 53 47 50
1.0 GHz GPU 2: 56 51 47 49 51
1.0 GHz GPU 3: 58 53 49 46 51

0.9 GHz GPU 1: 58 54 50 48 51
0.9 GHz GPU 2: 59 54 51 52 54
0.9 GHz GPU 3: 57 52 51 46 53

Jeweils mit HTT On. Sieht jetzt nicht so unterschiedlich aus :confused:
:usad:

Du lässt mich wieder unnötig rechnen. In deinem Fraps-Ordner gibts die FRAPSLOG.txt. Da stehen alle Werte schon fertig drin von jedem Durchgang... min. max. und avg.fps.

1,0Ghz = 52,8, 50,8, 51,4, ergo 51,67 avg.fps
0,9Ghz = 52,2, 54,0, 51,8, ergo 52,67 avg.fps

Sieht gut aus. Das sind nur noch Messschwankungen. Zb. der zweite Wert mit 54fps weicht etwas stärker ab bei 900Mhz GPU. Das kann manchmal je nach Szene passieren. Ist jedenfalls vollkommen CPU-Limit. Und diese Werte sind jetzt mit 0,5ms Timer Resolution und dem Tool was ich verlinkt habe?

Simon
2013-08-30, 05:31:54
Sag das doch gleich, dass du nur das Log willst :biggrin:

Edit: Und die Messungen sind mit dem Tool von dir.

dargo
2013-08-30, 08:48:11
Sag das doch gleich, dass du nur das Log willst :biggrin:

Edit: Und die Messungen sind mit dem Tool von dir.
Ok... danke. :)

Also 1Ghz an der GPU ist wie gesagt schon in Ordnung. Jetzt nochmal bitte mit 1Ghz und ohne HTT. Ich fürchte aber irgendwas bremst bei dir im System. Afaik laufen bei deiner CPU alle Kerne mit 3,7Ghz. Du müsstest ohne HTT somit irgendwo bei ~42fps landen und dementsprechend mit HTT bei ca. 59fps. Check mal das Bios ob du nicht zufällig diese C6/C7 (oder wie die heißen) Stromsparmodis aktiviert hast. Ansonsten vielleicht Coreparking deaktivieren. Oder in Windows die Energieoptionen checken. Mehr fällt mir nicht mehr ein.

Simon
2013-08-30, 20:34:34
Okay, mach ich heute abend. Die Stromsparmodi duerften alle an sein (kann ich von der Arbeit aus nicht checken). Gibt es fuer "Core Parking" noch andere Begriffe?

dargo
2013-08-30, 20:59:15
Ich hab ehrlich gesagt noch keine Erfahrung mit Coreparking. Damit muss ich mich demnächst mit dem Xeon beschäftigen. :D Stell mal vorsichshalber die minimale sowie maximale Prozessorenergieverwaltung in den Energieoptionen auf 100%.