PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : SMT des P4s vs DualCore bei Spielen


Madkiller
2007-05-27, 18:24:41
Hallo.

Hier soll es darum gehen, wie viel Performance der P4 durch sein SMT bei der DualCore-Optimierung des Spiels bzw der GraKatreiber gewinnen kann. Das ist ganz ausdrücklich kein Intel vs AMD Test. Die Werte der A64 sind nur da, um einen Anhaltspunkt haben zu können, wieviel DualCore maximal bei diesen Spielen überhaupt erst bringen kann.

Erklärung zu den Benches:
Der P4 560 mit 1MiB L2-Cache lief @default mit 3600MHz (200x18). Der 4600+ natürlich auch @default mit 2400MHz.
Um die Farben der Balken zu erklären:
Die Intel Ergebnisse sind blau. Blau ist Intels Farbe.
Die AMD Ergebnisse sind grün. Grün ist AMDs Farbe.
Der hellere Frabton steht für SingleCore, der "gewöhnlichere" für DualCore bzw SMT=on.


Wie bereits unsere vorherigen Spiele-Performancereports basieren auch die Messungen dieses Artikels auf tatsächlichen Savegames und nicht Timedemos. Dies erlaubt es uns, den Nachteilen der Timedemos aus dem Weg zu gehen. Zum einen kann nicht sichergestellt werden, dass ein Timedemo Physik, KI und Eingabegeräte berücksichtigt, zum anderen befinden sich in einem Timedemo auch Szenen mit stark unterschiedlichen Performance-Charakteristika. Der resultierende Mittelwert sagt dann nur noch sehr wenig über die gefühlte Performance aus.
Unsere Messungen nutzen dagegen vier ausgewählte Savegames.
Bei allen Savegames wurden mit Hilfe von Fraps gemessen. Dabei wurde von jedem Savegame die ersten 5 Sekunden generell fünfmal vermessen, und der Durchschnitt der Messungen als Ergebnis angegeben.

GraKa-Treiber: Cat 7.03
Restliches Testsystem:
http://www.3dcenter.org/artikel/x1900xt_vs_7950gt/index4.php

Hier die Werte:
http://www.3dcenter.de/images/misc/Artikel/SMTvsDC/Anno.png
Der X2 profitiert im Schnitt mit 46% von DualCore, der P4 von SMT mit 20%.


http://www.3dcenter.de/images/misc/Artikel/SMTvsDC/Carbon.png
Der X2 profitiert im Schnitt mit 43% von DualCore, der P4 von SMT mit 7%.


http://www.3dcenter.de/images/misc/Artikel/SMTvsDC/SupCom.png
SupCom skaliert bei stressigen Szenen deutlich mehr als 1:1 von höherer CPU-Leistung. Dies hier sind also nur meine Schätzungen
Der X2 profitiert im Schnitt etwa mit 80% von DualCore, der P4 von SMT etwa mit 40%.


http://www.3dcenter.de/images/misc/Artikel/SMTvsDC/TDU.png
Der X2 profitiert im Schnitt mit 52% von DualCore, der P4 von SMT mit 15%.



http://www.3dcenter.de/images/misc/Artikel/SMTvsDC/CnC3.png
Der X2 profitiert im Schnitt mit 25% von DualCore, der P4 von SMT mit 12%.

Fazit:
Bei CnC3, SupCom und Anno1701 bringt SMT doch fast die Hälfte von dem, was 2 CPU-Kerne bringen.
Bei TDU bringt SMT immerhin nochetwa ein Drittel. Nur bei NfS:Carbon bringt SMT (7%) im Vergleich zu DualCore (43%) nur sehr wenig.

ShadowXX
2007-05-27, 19:00:17
Erklärung zu den Benches:
Der P4 560 mit 1MiB L2-Cache lief @default mit 3600MHz (200x18). Der 4600+ natürlich auch @default mit 2400MHz.
Um die Farben der Balken zu erklären:
Die Intel Ergebnisse sind blau. Blau ist Intels Farbe.
Die AMD Ergebnisse sind grün. Grün ist nVidias Farbe.
Der hellere Frabton steht für SingleCore, der "gewöhnlichere" für DualCore bzw SMT=on.

Sehr schöne Benches. Danke für deine Arbeit.

Aber was zum Teufel hat nVidia mit dem ganze gebenchmarke zu tun? :biggrin:

Silverbuster
2007-05-27, 19:34:35
Mir fehlt auch ne genauere Hardware Auflistung. Es ist bekannt das z.B. ATI Karten besser mit Dualcores Skalieren als nVidia. Wie viel Ram.. u.s.w.! Das ist zwar nicht wirklich entscheidend aber für einen glaubhaften Test wichtig.
Auch weiß ich nicht wie du beim Anno Test auf 46% Leistungsplus für einen Dualcore kommst, bei mir ergibt das 32,1%.
Den Rest rechne ich erst gar nicht nach. Wird sicherlich auch nicht ganz akkurat sein.
Schöner Ansatz für einen Test, leider ist die Umsetzung nicht sehr gut geworden. Sorry!

Gast
2007-05-27, 19:37:07
Sehr schönes Review :)

AnarchX
2007-05-27, 19:43:02
Ein interessanter Test, mit einem Thema, was wohl heute kaum noch beachtet wird, was ihm gerade einen Seltenheitswert gibt. :up:


Schon beachtlich, wie der P4 hier doch durch SMT an Leistung hinzugewinnt, wenn auch praktisch eher irrelevant.

Im Lost Planet Cave Benchmark musste ich auch erst kürzlich feststellen, was SMT doch bei der heutigen MT-Software bringen kann:
http://www.forum-3dcenter.org/vbulletin/showthread.php?p=5501862#post5501862

btw.
Die ersten beiden Werte des SC-A64 bei Supreme Commander sehen doch etwas seltsam aus?(Faktor 4 zwischen SC und DC?)

=Floi=
2007-05-27, 19:57:16
ja toller test da ich mich das auch schon gefragt habe und HT ja ja wiede "im kommen" ist mit nehalem...

du hättest aber auch einen richtigen pentium dual core mehmen können damit der vergleich besser ist da hier der amd schon derbe abgeht und es teilweise nicht vergleichbar ist (P4 DC könnte ja genauso einbrechen...)

Gast
2007-05-27, 20:02:12
Die ersten beiden Werte des SC-A64 bei Supreme Commander sehen doch etwas seltsam aus?(Faktor 4 zwischen SC und DC?)Hier bieten sich zwei (bzw. drei) Erklärungsansätze an:
ersterdings:
Es könnte eine konstante Grundlast anliegen, mit steigender Rechenleistung bleibt daher mehr zusätzlicher Dampf für die Grafik über, als die Rechenleistung insgesamt angestiegen ist. Wahrscheinlichste Problemkinder hier dürften Physik und KI (insb. Pathfinding) sein.
zweiterdings:
Wie viele Threads nutzt SC? Der Wechsel zwischen Threads bringt einen gewissen Overhead mit sich. Mehr (virtuelle bei SMT) Prozessorkerne müssen seltener zwischen den Threads wechseln, sparen also einiges dieses Overheads.

(dritterdings:
Beides trifft zu.)

dargo
2007-05-27, 20:02:54
Da stellst sich mir die Frage - würde eigendlich SMT bei einem Conroe bzw. Kentfield Sinn machen?

StefanV
2007-05-27, 20:08:17
Wenns ordentlich umgesetzt wird (in der CPU), macht sowas immer Sinn...

Wuge
2007-05-27, 20:14:26
Kennt jemand einen (nicht synthetischen) Benchmark, der 4 CPUs auslasten kann? Dann würde ich mal testen, wie sich ein Dual-Core mit SMT schlägt.

Ich habe mal mit dem 3DMark06 CPU Test 2 rumprobiert. Der ist zwar nicht sonderlich aussagekräftig, kann aber die Wirkung von SMP/SMT demonstrieren:

1 Kern, 1 Thread: 0,606 FPS
1 Kern, 2 Thread: 0,668 FPS (+10%)
2 Kern, 2 Thread: 0,869 FPS (+30%, kum +43%)
2 Kern, 4 Thread: 0,964 FPS (+11%, kum +60%)

In dem Test wird also auch deutlich, dass HT leistungsmäßig etwa 1/3 eines "echten" zusätzlichen Prozessorkerns bringt. In hoch synthetischen Tests sind teilweise auch mal 50% drin ;)

Madkiller
2007-05-27, 20:16:43
Aber was zum Teufel hat nVidia mit dem ganze gebenchmarke zu tun? :biggrin: Böses C/P :redface:

Mir fehlt auch ne genauere Hardware Auflistung. Wie viel Ram.. u.s.w.! Das ist zwar nicht wirklich entscheidend aber für einen glaubhaften Test wichtig.
Das restliche System ist doch verlinkt.
kk, my bad. Link war fehlerhaft

Es ist bekannt das z.B. ATI Karten besser mit Dualcores Skalieren als nVidia.
Es ist in den Diagrammen angegeben, welche GraKa.
Davon abgesehen geht es hier um das Verhältniss von SMT zu DC. Das sollte sich auch bei anderen GraKas nicht (groß) ändern

Auch weiß ich nicht wie du beim Anno Test auf 46% Leistungsplus für einen Dualcore kommst, bei mir ergibt das 32,1%.
Den Rest rechne ich erst gar nicht nach. Wird sicherlich auch nicht ganz akkurat sein.
Das rechne lieber doch nochmal nach ;)
Ich schrieb was von 46% mehr, nicht 46% weniger.


btw.
Die ersten beiden Werte des SC-A64 bei Supreme Commander sehen doch etwas seltsam aus?(Faktor 4 zwischen SC und DC?)
Hier noch ein Ausschnitt aus dem Report zu SupCom:
Noch eine Anmerkung zu der extrem deutlichen Skalierung bei Unterschiedlicher CPU-Leistung:
Die fps-Skalierung hängt stark von der Szene und vor allem von der CPU-Leistung ab.
Sprich: Es wird schlimmer, umso weniger fps man hat.
Wenn man bei einer Szene, bei der man 10fps mit dem E6400 hat, den OCed, kommen etwa um die Hälft mehr fps raus, als das, um was man die CPU OCed. Also bei 50% OCen hätte man dann gute 17fps.
Wenn man aber von Haus aus schon ziemlich wenig fps hat (z.B. bei der selben Szene mit dem DC 4600+ nur 7fps hat, hätte man mit nem SC 3800+ nur etwa 2fps. Also extreme Unterschiede.

Ich weiß schon, was jetzt einige denken werden. Bei einer fps-Skalierung von fast Faktor 4 kann es nur ein Bug bei SC-CPUs sein.
Dagegen aber dieses:
DC 3800+: 5,2fps
DC 5400+: 11,1fps

Der 5400+ hat etwa 33% mehr CPU-Leistung als der 3800+. Dennoch sind es ~113% mehr fps. Was hier also auch schon fast dem Faktor 4 entspricht.

Meßfehler kann ich ausschließen, da es eben auf mehreren Ebenen gegen geprüft wurde.
PS
Konfigurationsfehler genauso, da bei anderen Spielen alles so lief, "wie es sein sollte".




du hättest aber auch einen richtigen pentium dual core mehmen können damit der vergleich besser ist da hier der amd schon derbe abgeht und es teilweise nicht vergleichbar ist (P4 DC könnte ja genauso einbrechen...)
Ich weiß, ich wiederhol mich:
Aber ich kann nur testen, was ich auch habe.
Außerdem ist es prinzipell egal, wie der AMD dort "abgeht". Es ist nur wichtig, daß die Vergleichs-CPU 2 unabhängige Kerne hat (C2D hat z.B. Shared Cache) und die Werte die ausgewertet wurden alle CPU-limitiert sind.
Für das was ich aussagen will, sind die Werte des A64 voll vergleichbar.

Raff
2007-05-27, 20:16:52
Lost Planet dürfte das aktuell beste Bei-Spiel sein, das massiv von vier Kernen profitiert.

MfG,
Raff

dargo
2007-05-27, 20:20:21
Lost Planet dürfte das aktuell beste Bei-Spiel sein, das massiv von vier Kernen profitiert.

MfG,
Raff
CMR Dirt höchstwahrscheinlich auch. Leider will das mir aber im Benchmark Thread keiner der Quadcore User bestätigen, wieso auch immer. ;(
Man muss immer alles selbst testen. :D
Bei mir dauerts aber noch bis ein Quadcore in meinem Rechner Platz findet.

RainingBlood
2007-05-27, 20:23:43
heftig sind die SC Frames. Ob sich das Ergebnis tendenziell auf zukünftige Spiele (z.b. auch Shooter) ummünzen lässt bzw. lässt es erahnen, das die aktuellen Optimierungen anderer Spiele nur die Spitze eines Eisbergs sind?

AnarchX
2007-05-27, 20:24:33
Kennt jemand einen (nicht synthetischen) Benchmark, der 4 CPUs auslasten kann? Dann würde ich mal testen, wie sich ein Dual-Core mit SMT schlägt.


Der schon genannte kostenlose Lost Planet Demo Cave Benchmark:
http://www.forum-3dcenter.org/vbulletin/showthread.php?p=5502937#post5502937
http://www.forum-3dcenter.org/vbulletin/showthread.php?p=5503386#post5503386

;)

Gast
2007-05-27, 20:33:09
Bei seti@home war das noch viel stärker ausgeprägt. Da konnte man glatt zwei WU gleichzeitig berechnen ohne einbußen in der Geschwindigkeit hinzunehmen. :eek:

Mich täte mal interessieren, welche Art "Anwendungen" darunter fallen, die sich dann wie auf einem "Multicore" verhalten.

Schade das der 16 Threads-Nehalem noch so weit weg ist. ;D

Botcruscher
2007-05-27, 20:37:23
Wenns ordentlich umgesetzt wird (in der CPU), macht sowas immer Sinn...


Architekturabhängig stellt sich die Frage schon. Der P4 ist ja nicht grundlos damit ausgestattet wurden.

Coda
2007-05-27, 21:10:27
Er hat trotzdem recht. Es ist immer gut seine Einheiten besser auslasten zu können, egal auf welchem Wege.

Wuge
2007-05-27, 21:18:14
Lost Planet DX10 Caves auf Vista Ultimate 64 Bit erzeugt bei mir nur 50% Prozessorlast, gleichmäßig auf alle CPUs verteilt und läuft sehr langsam.

Btw. Gibts ne Möglichkeit direkt die Caves zu starten?

Silverbuster
2007-05-27, 21:23:02
@Madkiller

Ok.. ich muss zugeben das ich das mit der Grafikkarte irgendwie übersehen habe.
Und das mit dem Link zur Hardware :biggrin: Jetzt funzt er.

Aber was die % Anzahl betrifft.... ich meinte auch MEHR..... und 46% sind das nicht bei Anno 1701! Oder wie rechnest du es?
Alle Fps Werte im Singelcore zusammen und die im Dualcore und dann Prozentual den Unterschied ausrechnen. Oder meinst du damit nur den Maximal möglichen Gewinn?

Madkiller
2007-05-27, 21:30:17
Ich rechne natürlich "Wert des DC" geteilt durch "Wert des SC". Und das bei jedem SG und aus den 4 Werten wird dann am Schluß die 46% ermittelt.
Maximal möglicher Gewinn?
Jetzt frag ich dich: wie rechnest du das? Der maximale Gewinn bei Anno liegt sogar bei 56%. Und sogar der niedrigste Unterschied liegt über deinem Wert.

Crazy_Chris
2007-05-27, 21:59:03
Diese Auswahl an Spielen ist aber nicht repräsentativ, oder? Hätte nicht gedacht das Dual Core Support für Spiele inzwischen soviel bringt. :|

Madkiller
2007-05-27, 22:24:53
Was ist repräsentativ?
Ich habe mich bei meinem letzten Reports darum bemüht, die Spiele zu testen, die am meisten gespielt werden.
Habe dazu auch mehrere Umfragen genutzt.
Habe natürlich die Spiele verwendet, die nicht übermäßig GraKa-limitiert sind.

Gast
2007-05-27, 22:40:37
Diese Auswahl an Spielen ist aber nicht repräsentativ, oder? Hätte nicht gedacht das Dual Core Support für Spiele inzwischen soviel bringt. :|


ach, von dualcore profitiert heute fast jedes spiel ganz schön (zuminest 20-30%), was aber in erster linie daran liegt dass treiberoverhead und hintergrundarbeit des betriebssystems ausgelagert wird. mehr als 2 cores bringen allerdings bei fast keinem spiel weitere vorteile.

Schrotti
2007-05-28, 03:20:09
Ein richtiger Pentium D (mit 2 echten Kernen) sollte doch schneller sein oder?

Ich bin der Meinung das 2 richtige Kerne noch schneller sind als das SMT beim Pentium 4 (siehe diese Ergebnisse).

http://hardware.thgweb.de/2006/08/12/prozessor_vergleich_benchmark_marathon/page58.html

Call of Duty 2 (1024x768)

1. Pentium D 950 ~ 150,9fps
2. Pentium 670 (3,8GHz) ~ 123,1fps

Gast
2007-05-28, 07:45:56
Klar ist ein richtiger Dualcore schneller.

In diesem Test wurde leider ein Singlecore verwendet. Da ist es klar, das minimale Vorteile zustande kommen, weil ja schon Betriebssystem+Treiber ausgelagert werden können.

Interessant wäre mal ein Test mit einem Dualcore Pentium D mit HyperThreading. Da könnte man wirklich sehen, ob HT auch dann noch was bringt, wenn die arbeit bereits auf zweite echte Kerne aufgeteilt werden kann.

Gast
2007-05-28, 09:35:34
Interessant wäre mal ein Test mit einem Dualcore Pentium D mit HyperThreading. Da könnte man wirklich sehen, ob HT auch dann noch was bringt, wenn die arbeit bereits auf zweite echte Kerne aufgeteilt werden kann.Ja, dazu brauchts aber leider eine Extreme Edition, die damals schweineteuer waren. Tombman, hattest du nichtmal einen 955XE-Presler?

Merkor
2007-05-28, 11:26:45
Sehr interessante Ergebnisse. Um die Ergebnisse vergleichbarer zu machen und etwas besser einordnen zu können, wäre es natürlich super gewesen, dass ein P-D 960 zum Vergleich herangezogen worden wäre, aber den muss man ja erstmal haben. ;)

Bin selber gerade am Überlegen, von P4 640@3.7 auf P-D 935@3.7 umzusteigen...

Madkiller
2007-05-28, 11:32:19
Sry, aber ich wollte aufzeigen, wieviel SMT im Vergleich und in Relation zu 2 Kernen bringen kann. Das geht mit den Werten der A64 IMO optimal.
Wenn ich den Vergleich mit nem P-D gemacht hätte, wäre auch die Grundaussage eine andere gewesen auf die ich eigentlich garnicht eingehen wollte. :)

Merkor
2007-05-28, 11:46:57
Sry, aber ich wollte aufzeigen, wieviel SMT im Vergleich und in Relation zu 2 Kernen bringen kann. Das geht mit den Werten der A64 IMO optimal.
Wenn ich den Vergleich mit nem P-D gemacht hätte, wäre auch die Grundaussage eine andere gewesen auf die ich eigentlich garnicht eingehen wollte. :)

Wieso? Wäre IMO noch viel vergleichbarer gewesen, inwiefern ein- und dieselbe Prozessor-Architektur bei identischer Taktfrequenz (!) nun in unterschiedlichen Anwendungen von SMT und/oder DC profitiert.

Madkiller
2007-05-28, 12:03:58
Ich meinte, ggü dem P-D mit Hyperthreading. Wie davor schon mal jemand gemeint hatte. Kleines Missverständniss meinerseits.

Klar, ein P-D ohne SMT wäre noch ne Idee besser gewesen.
Aber so lange man eine Limitierung anderer Komponenten außer der CPU ausschließen kann, ist der A64 für das was ich zeigen wollte hier völlig ausreichend. Und der SC 3800+ (oder 4600+ mit /numproc=1) ist ja leistungsmäßig nicht arg weit von dem P4 hier entfernt.

Wuge
2007-05-28, 13:24:44
Bei Anno 1701 und C&C3 bringt ein Pentium D mit HT recht wenig. Im Gegenteil, man muss die Prozessoraffinität sogar manuell zuweisen, da die Last sonst auf 2 CPUs des gleichen Kerns verteilt wird und der andere Kern nichts zutun hat.

Der einzigste Vorteil ist dann, dass man die Priorität des Spiels auf Echtzeit setzen kann und die restlichen Threads (Treiber, Systemprozesse etc.) auf die noch freien virtuellen CPUs verteilt wird.

Ja, dazu brauchts aber leider eine Extreme Edition, die damals schweineteuer waren. Tombman, hattest du nichtmal einen 955XE-Presler?

Ich hätte nen 965XE anzubieten, muss nur wissen welchen Benchmark ich benutzen soll. Spiele hab ich allerdings kaum welche hier.

Wie bereits gesagt, Anno 1701 und C&C3 können nichtmal 2 Kerne voll auslasten, geschweige denn 2x2.

Merkor
2007-05-28, 14:17:04
Was mich auch noch interessiert: C&C3 soll laut PCGH nicht auf DC optimiert worden sein. Da wirft sich doch die Frage auf, ob dann jegliche positiven Effekte auf die Geschwindigkeit durch die Graka-Treiberunterstützung von Multithreading zurückzuführen sind oder ob doch insgeheim Vorteile von DC und HT auch bei nicht optimierten Spielen bestehen...

Gast
2007-05-28, 14:25:11
Du vergisst ein ganz entscheidendes Detail! Um einen Multicore zu nutzen ist keine spezielle Optimierung der Software notwendig.

Es ist ganz einfach so, das viele Anwendungen bereits mehrere Threads ausführen und dadurch automatisch profitieren.

Wenn z.B. ein Game programmiert wurde, das einen Thread für die KI und einen weiteren für die Physik nutzt, so kann das OS diese Threads auf zwei Kerne aufteilen.

Sogar der Fussball Manager 2004 nutzt bei mir schon ungefähr 2 Kerne aus, wahrscheinlich weil sie in mehreren Threads programmiert hatten und da gabs noch keine Dualcores...

BlackBirdSR
2007-05-28, 14:33:38
Du vergisst ein ganz entscheidendes Detail! Um einen Multicore zu nutzen ist keine spezielle Optimierung der Software notwendig.

Es ist ganz einfach so, das viele Anwendungen bereits mehrere Threads ausführen und dadurch automatisch profitieren.

Wenn z.B. ein Game programmiert wurde, das einen Thread für die KI und einen weiteren für die Physik nutzt, so kann das OS diese Threads auf zwei Kerne aufteilen.

Sogar der Fussball Manager 2004 nutzt bei mir schon ungefähr 2 Kerne aus, wahrscheinlich weil sie in mehreren Threads programmiert hatten und da gabs noch keine Dualcores...

Nein so geht das leider nicht. Man muss sich schon ganz speziell darum kümmern. Die hier aufgeführten Spiele haben nicht unbedingt Multithreading-Optimierungen. Per Prozess-Explorer kann man sehr gut nachvollziehen, dass bei diesen Spielen der Grafiktreiber bis zu 30% des 2. Kerns zugewiesen bekommt. Dazu kommen generelle Erleichterungen durch Multithreading im OS.

Das Spiel läuft weiterhin nur auf einem Kern - der ist allerdings von anderen Aufgaben frei gestellt. Das bringt sehr viel, wie man auch gut sehen kann.
Als nächstes könnte Madkiller die Treiberunterstützung für Multithreading einmal deaktivieren. Die Werte sollten dann ordentlich einbrechen. Bei mir war es so, und Comanche4 wird ja wohl niemand als "Dual-Core"-Spiel bezeichnen wollen?

Gast
2007-05-28, 14:40:37
Nein so geht das leider nicht.

Erzähl doch nicht sowas! Klar geht das, ich habs doch schon belegt!!

Zu dieser Zeit gab es noch überhaupt keinen Multicore und das Spiel war schon längst raus, als die überhaupt angekündigt wurden. Da haben die Entwickler von anfang an mit mehreren Threads gearbeitet. Rein durch Zufall profitiert es deswegen heute durch Multicores.

Der Grafiktreiber ist übrigens völlig ausgeschlossen, das verfügte nämlich noch fast über 2D Grafik. Also mehr als ein paar Menüs mit Zahlen waren da nicht. ;P

BlackBirdSR
2007-05-28, 14:44:27
Erzähl doch nicht sowas! Klar geht das, ich habs doch schon belegt!!

Zu dieser Zeit gab es noch überhaupt keinen Multicore und das Spiel war schon längst raus, als die überhaupt angekündigt wurden. Da haben die Entwickler von anfang an mit mehreren Threads gearbeitet. Rein durch Zufall profitiert es deswegen heute durch Multicores.

Der Grafiktreiber ist übrigens völlig ausgeschlossen, das verfügte nämlich noch fast über 2D Grafik. Also mehr als ein paar Menüs mit Zahlen waren da nicht. ;P


Was du belegt hast, übrigens ohne Screenshot, ist Folgendes:

Um einen Multicore zu nutzen ist keine spezielle Optimierung der Software notwendig.

Es ist ganz einfach so, das viele Anwendungen bereits mehrere Threads ausführen und dadurch automatisch profitieren.

Eine IMO pauschal unhaltbare, ungültige und unbewiesene Aussage wenn es um Spiele geht.

noch ein Gast
2007-05-28, 14:52:41
Sogar Homeworld profitiert (insb. bei sehr großen Flotten) schon von mehreren Kernen. Wirklich absehbar, wann in einem durchschnittlichen PC mehrere Kerne stecken, wars nun wirklich nicht so leicht, gab früher z.B. schon sehr kostengünstige Maschinen mit zwei Celerons. Hätte ja schon damals einschlagen können, aber Multicore ist halt erst jetzt in jedem Wald-und-Wiesen-Rechner.

Gast
2007-05-28, 15:04:26
Was du belegt hast, übrigens ohne Screenshot

Wozu sollte ich Screenshots machen, probierte es doch einfach selber aus? Hier wird eh alles angezweifelt.

Eine IMO pauschal unhaltbare, ungültige und unbewiesene Aussage wenn es um Spiele geht.

Das ist schlicht und ergreifend blödsinn.
Thread ist Thread ist Thread.
Wenn du mehrere davon hast, profitierste, wenn nicht, dann nicht. Und für die neunmalklugen: Hiermit habe ich nicht gesagt, das sich manche Anwendungen besser/schlechter parallelisieren lassen als andere, ebenso wenig wie ich ein paar Postings zuvor gesagt habe, das es egal ist wie eine Anwendung programmiert wurde ... aber das hast du leider nicht verstanden, wie ich sehe. :)

Zudem hat mir das der Chef des Projekts "Gerald" bestätigt, einige werden ihn sicher noch kennen (Anstoßserie), jetzt im FM07-Forum aktiv. Frag ihn doch selbst, er antwortet sogar. :)

Gast
2007-05-28, 15:30:15
Man muss einfach nur mal in die Vergangenheit reisen ... schon vor 10 Jahren hat man Anwendungen programmiert, bei denen nach Start der Programmdatei im Hintergrund weitere "Anwendungen" gestartet wurden, um z.B. etwas zu berechnen.

Da das OS mittlerweile die Verwaltung übernimmt, verschiebt es die Anwendungen natürlich auf einen Kern, der gerade nichts zu tun hat. Dadurch profitiert man "einfach so". Das ließe sich mit einer speziellen Optimierung natürlich noch weiter verfeinern, aber wichtig ist erstmal, das es da überhaupt eine Trennung gibt und das gab es schon sehr, sehr lange, nur halt noch nicht optimal ausgefeilt.

Mal ein aktuelles, sehr einfaches Beispiel: BOINC ist ein eigenständiger Prozess und startet dann nochmal 1, 2, 4, 8 x den (SETI, was auch immer) Client. Das Design war nie speziell für Multicore ausgelegt, sondern es macht einfach Sinn, denn die Trennung vollführte man vorallem deshalb, damit BOINC immer laufen kann und es trotzdem im laufenden Betrieb möglich ist, den Client zu aktualisieren oder weitere hinzufügen.

StefanV
2007-05-28, 19:22:23
Sogar Homeworld profitiert (insb. bei sehr großen Flotten) schon von mehreren Kernen. Wirklich absehbar, wann in einem durchschnittlichen PC mehrere Kerne stecken, wars nun wirklich nicht so leicht, gab früher z.B. schon sehr kostengünstige Maschinen mit zwei Celerons. Hätte ja schon damals einschlagen können, aber Multicore ist halt erst jetzt in jedem Wald-und-Wiesen-Rechner.
Sicher das es am Spiel und nicht dem Treiber liegt?!

noch ein Gast
2007-05-28, 19:33:35
Mit einem Kern reagieren größere Flotten kaum noch auf Kommandos, mit mehreren reagieren sie, als wenn man sich nicht durch fleißiges Entern an der Begrenzung der Flottengröße vorbeigemogelt hätte. Treiberoptimierung allein könnte höchstens höhere FPS bringen, aber nichts am Reaktionstempo ändern.

Crazy_Chris
2007-05-28, 20:11:15
Was ist repräsentativ?
Ich habe mich bei meinem letzten Reports darum bemüht, die Spiele zu testen, die am meisten gespielt werden.
Habe dazu auch mehrere Umfragen genutzt.
Habe natürlich die Spiele verwendet, die nicht übermäßig GraKa-limitiert sind.


Achso, na dann. Dachte du hättest Spiele rausgesucht bei denen bekannt ist, dass sie sehr von Multicore Systeme profitieren. :tongue: Trotzdem kaum zu glauben was sich so getan hat.
Noch vor einem Jahr wurde einem u.a. wg. den hohen Preisen + geringer Performancevorteil nur selten zu Dual Core CPUs geraten wenn man hauptsächlich spielen möchte. Inzwischen ist der Performancevorteil kaum noch durch höhere Taktraten aufzuholen. :eek: Natürlich immer vorrausgesetzt die Graka limitiert nicht. ;)

Arg, da lohnt es sich ja fast doch noch einen gebrauchten X2 3800+ für den Sockel 939 zu holen.

L.ED
2007-05-28, 20:30:24
Sicher lohnt sich das, wenn mit den restlichen Komponenten in soweit noch zufrieden (?) ist es ein kleines aber feines CPU Upgrade! (was man dann ruhig noch mitnehmen sollte) ;)

Crazy_Chris
2007-05-28, 21:57:20
Sicher lohnt sich das, wenn mit den restlichen Komponenten in soweit noch zufrieden (?) ist es ein kleines aber feines CPU Upgrade! (was man dann ruhig noch mitnehmen sollte) ;)


Naja, ich hab einen Opteron 146 @ 2.4Ghz. Da müßte ein X2 3800+ schon mit mindestens 2.6Ghz laufen um die gleiche "Einzelkern" Performance erreichen zu können. :rolleyes:
Ohh, der kostet ja neu nurnoch 75€ und ist außerdem lieferbar. =) Viel kann man bei den Preisen eigentlich nicht falsch machen. :cool:

L.ED
2007-05-28, 22:42:22
Also 2,4Ghz machen die meisten (wenn nicht sogar alle?) X2 3800+, darüber hinaus ist Glücksache.

Im Zweifel (schlechtesten Fall) würdest also + - 0 haben, dass was Dein jetziger Opteron an mehr Cache hat bügelt der X2 mit seiner 2Uhr dann locker weck (wobei die K8 bekanntlich eh nicht so sehr auf L2 cache skalieren).

Und über die länge gesehen machst natürlich Gewinn, spätestens dann wenn mal nen Packer anwirfst oder ein Film wandelst macht sich das hinzugewonnene Herz angenehm bemerkbar. :smile:

Und wie gesehen tut es mittlerweile in fast jedem Spiel auch sein Anteil bei (mal mehr mal weniger ausgeprägt).

Gast
2007-05-28, 23:15:41
mein x2 3800+ läuft auch bis 2,8 genauso der opteron 165...nur leider wird der wesentlich heisser

=Floi=
2007-05-28, 23:48:05
die 75€ kann man auch noch sparen und dafür dann in 4-6 monaten direkt neu aufrüsten und mal eben die leistung vervierfachen...
imho sind die 75€ auch noch zu teuer in der aktuellen situation und der AM2 X2 3800+ kostet nur 50€

L.ED
2007-05-29, 00:41:17
Jeder setzt andere Prioritäten und hat andere Ansichts- und Ausgangspositionen.

Mir wäre ein CPU Upgrade dieser Art auch noch 100 Euro Wert! :eek: Wenn ich mir im klaren das ich dieses System noch mindestens weitere 6 Monate sehr umfänglich Nutzen werde.

Oder eben alternativ, schon recht klare Bilder bzw. Bedürfnisse habe wie mein nächstes System auszusehen hat!
Und auch ja, für manch einem sprechen mittlerweile gute Gründe gegen Intel, die viel weniger von Technischer Natur (sah zuviel hinter die Kulissen). Was aber weiter Auszuführen an dieser Stelle zu weit ins politische dann Ufern täte und wird sicher noch einmal Thema wo anders dann hier sein!

Vor diesem Hintergrund und vielleicht, möchte man dann nun die Zeit nur noch ein wenig angenehmer Überbrücken bis es Vernünftige Angebote rund um das Thema K10 gibt!? (was wohl noch so 1 Jahr dauern dürfte)

BlackArchon
2007-06-01, 21:04:37
Sehr interessanter Test, sowas habe ich in der Form noch nicht gesehen. Danke! :)

Interessant dazu wäre noch ein Vergleich wie Pentium 4 530 gegen Pentium D 830 oder 630 gegen 930, ist so etwas machbar?

Gast
2007-06-02, 09:41:00
Könnte man sagen, das SMT vorallem deswegen Sinn macht, weil man damit besser die einzelnen Recheneinheiten auslasten kann?

Wenn ich da an Nehalem denke, der mit 8 Cores und 16 Threads daher kommen könnte: Da könnte ein Thread schon einen ganzen Kern blockieren und durch die "virtuelle Umsortierung" der Befehle könnte man durch SMT die Auslastung besser steuern. Stimmt das so?

BlackBirdSR
2007-06-02, 10:40:54
Könnte man sagen, das SMT vorallem deswegen Sinn macht, weil man damit besser die einzelnen Recheneinheiten auslasten kann?



Nein, ich glaube nicht dass beim P4 mehr gleichzeitig ausgelastet wird.
Es hat generell für das System Vorteile mehr als einen Thread laufen zu lassen, und wenn ein Thread stalled, ist der andere zur Stelle.

Es gibt beim P4 zu IMHO wenig Ansatzpunkte um in vielen Fällen zwei Threads wirklich gleichzeitig durchgehend laufen zu lassen.

Gast
2007-06-02, 10:43:54
Nein, ich glaube nicht dass beim P4 mehr gleichzeitig ausgelastet wird.

Warum glaubst du das nicht? Warum wirds beim Nehalem wieder SMT geben?

Eigentlich wars doch so, das HT eingeführt wurde, um die ungenutzten Reserven der Architektur nutzen zu können. Bei Nehalem stelle ich mir ähnliches vor.

Wenn man mehrere Recheneinheiten hat und ein Programm einen Kern blockiert, wärs ja nicht schlecht, wenn dieser Kern weiterhin für andere Dinge zur Verfügung steht.

AnarchX
2007-06-02, 10:48:29
SMT war und ist wohl eben eine einfach Möglichkeit zusätzliche Leistung freizusetzen.
Beim P4 hatte man eben noch den angenehmen Nebeneffekt, dass man hier eine Art Hardwarefix für den miesen Win-Sheduler brachte und ein deutlich besseres Arbeitsgefühl erreichte.

Gast
2007-06-02, 12:12:58
Könnte man sagen, das SMT vorallem deswegen Sinn macht, weil man damit besser die einzelnen Recheneinheiten auslasten kann?


um genau zu sein ist das der einzige zweck von HT.

Gast
2007-06-02, 12:16:11
@topic:

Mich persönlich freut dieser Bench und auch sein Ergebnis doch sehr...
nutz ich doch immer noch den ersten HT-Prozi P4 Northwood mit 3,06 Ghz ;-)

Schön bei Spielen wie C&C3 jetzt noch ein bisschen davon zu profitieren ^^

Allerdings wär ein Vergleich von Pentium HT & Pentium D (möglichst ähnliche Modelle) natürlich auch interessant gewesen...
(soll keine Kritik sein, getestet wird halt was da is)

Gast
2007-06-02, 12:19:11
Interessant war damals auch wie auf meinem System HT die Leistungsdifferenz zwischen Zocken mit aktiven Virenscanner im Hintergrund bzw. ohne in 3dMurks quasi auf "kaum messbar" reduziert hat... (war ohne HT ein Einbruch von über 12% wenn ich mich recht entsinne)

BlackBirdSR
2007-06-02, 12:43:43
Warum glaubst du das nicht? Warum wirds beim Nehalem wieder SMT geben?

Eigentlich wars doch so, das HT eingeführt wurde, um die ungenutzten Reserven der Architektur nutzen zu können. Bei Nehalem stelle ich mir ähnliches vor.

Wenn man mehrere Recheneinheiten hat und ein Programm einen Kern blockiert, wärs ja nicht schlecht, wenn dieser Kern weiterhin für andere Dinge zur Verfügung steht.

Ich finde SMT als eine sehr sehr gute Idee. Und bei IBM läuft das auch prima. Intel zeigt derweil mit Multithreading beim Montecito eine andere Version. Auch hier geht es primär darum, Threads kontinuierlich in der Pipeline zu halten, nicht die FUs breiter auszulasten.

Der P4 hat nunmal nicht unendlich Resourcen, die man nutzen könnte. Nur weil irgendwo die FMUL gerade nicht gebraucht wird, muss diese nicht "frei" sein. Auf dem Weg dorthin braucht es versch. Abwicklungsschritte, Cachezugriffe und man muss durch Ports, Scheduler und Puffer.
Was nicht verdoppelt wurde, kann auch nicht doppelt genutzt werden.

Irgendwo stand sogar, dass ein Großteil der Funktionsblöcke sich beim Bearbeiten der SMT-Threads Taktweise abwechselt. Es spicht sehr viel dafür, dass SMT beim Pentium4 primär zur Überbrückung von Leerlaufzyklen dient. Nur selten, um zusätzlich zu Thread A noch Funktionseinheiten auszulasten. Wenn man sich den Aufbau des P4 ansieht, wird es vielleicht auch verständlich, warum nehr sehr wenige Threads überhaupt größere "Strecken" direkt nebeneinander durch den Kern kommen.

Nehalem ist vielleicht mehr auf so etwas optimiert. Es muss nicht einmal SMT sein. Es gibt ein paar sehr attraktive Formen von MT.