PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: Hardware- und Nachrichten-Links des 23./24. Juli 2019


Leonidas
2019-07-25, 06:45:38
Link zur News:
https://www.3dcenter.org/news/hardware-und-nachrichten-links-des-2324-juli-2019

Pumpi74
2019-07-25, 07:37:42
naja, der ein oder andere "YoutubeTest" hat ja gezeigt das die wichtigen minimum Fps bei Spielen ansteigen bei deaktiviertem SMT. Von daher ist der AverageFps TechPowerUp Test voll für die Tonne und eben nicht erhellend. Für den Anwendungsbereich sieht es natürlich anders aus.

Ps: Guten Morgen :biggrin:

MrSpadge
2019-07-25, 13:45:57
Zu SMT on/off sollte man noch beachten, dass 12 Kerne echt viel sind. Und erst, wenn mehr als 12 Threads sinnvoll genutzt werden können, kann SMT etwas bringen. Das wird bei vielen Anwendungen nicht so sein, d.h. die Skalierung über ein möglichst breites Anwendungsfeld wird dadurch runtergezogen.

Zu "mit SMT nicht so hohe Turbo-Stufen erreicht" würden ich sagen: der Turbo hängt bei AMD ja nur von Leistungsaufnahme, Temperatur und Stromstärke ab. Wenn SMT nicht beschleunigt, macht es nichts und sorgt auch nicht für einen höheren Stromverbrauch. Damit sollten die gleichen Turbo-Stufen erreicht werden.

Ein Nachteil durch SMT ist natürlich immer durch statisch patitionierte Funktionseinheiten gegeben - hier geht dem einen Thread was verloren, egal ob der andere überhaupt genutzt wird. Wie viele ressourcen das bei Zen 2 betrifft, hab ich aber gerade nicht im Überblick.

MrS

Thomas555
2019-07-25, 13:55:33
Bei CB gab es einen guten Hinweis/Artikel. Erst wenn die physischen Kerne ausgenutzt werden, kommen die virtuellen Kerne dazu. Man hatte das Problem, dass beides gleich belegt wurde und somit Leistung weggefallen ist. Daher wollte AMD dies mit der neuen Gen besser machen. Bis jetzt, hört sich das noch nicht so an ;-)

gbm31
2019-07-25, 13:57:39
Zu SMT on/off sollte man noch beachten, dass 12 Kerne echt viel sind. Und erst, wenn mehr als 12 Threads sinnvoll genutzt werden können, kann SMT etwas bringen.


Ist das wirklich so? Oder werden einfach Aufgaben verteilt so lange sie in die Pipeline passen, also CCX weise?

Gast
2019-07-25, 14:04:01
Ist das wirklich so? Oder werden einfach Aufgaben verteilt so lange sie in die Pipeline passen, also CCX weise?
Innerhalb einer Art Compiler-Thread-Gruppierung - ja, so wie hier beschrieben wurde: https://www.forum-3dcenter.org/vbulletin/showpost.php?p=12050575&postcount=24

Klingt glaubhaft.

Gast
2019-07-25, 14:10:31
PS: Was den Urheber angeht klingt das glaubhaft, kam auf PCGH einiges an sinnvollem Content was AMD-Hardware betrifft.

Gast
2019-07-25, 14:13:35
Es gibt genung Beispiele wo zB. der 9700K bessere minimum als auch avg FPS als der 9900K liefert (Division 2 z.B. ) obwohl er ein Taktdefiziet und weniger Cache hat.

SMT bringt beim Zocken nur merklich etwas wenn man wening physische Kerne hat.
z.B. 4C4T vs 4C8T bei BF 5 wo es den Unterschied zwischen spielbar unt ruckelnd ausmacht.
6C6T vs 6C12T ist dieses Verhalten nur noch bei wenigen Spielen zu beobachten beim vergleich von 9600k vs 8700K.
8C8T vs 8C16T zeigt selbst das bestens auf breite CPUs reagierende ACO keine nennenswerten Unterschiede mehr zwischen 9700k und 9900K.

Das in diesem Kontest ein 12Kerne beim Zocken ohne SMT sehr gut dasteht sollte klar sein.
In anbetracht der Tatsache das Paralelisierung nicht unendlich Benifits abwirft und der serielle Anteil welcher nur von IPC und Takt beschleinigt wird muss man sich heutzutage fragen wo ist der Sweetspot einer Zocker CPU.

Einereits will man genung Kerne um in 2 Jahren nicht wieder neu kaufen zu müssen andereseits will man auch möglichst hohen takt und das ganze möglichs kosten günstig.

Ich denke mit einem 8 Kerner wie dem 3700X oder 9700K ist man einige Jahre reilchlich zum Zocken versorgt ohne Massen an Kohle auszugeben wenn man sch die Entwicklungsgeschwindigkeit der Software der letzten 5 Jahre ansieht.

Platos
2019-07-25, 14:39:58
Wer heute noch Tests mit AVG. FPS macht, den kann man echt nicht ernst nehmen. Techpowerup lernt's nie.

Kulasko
2019-07-25, 16:11:49
Ich finde allgemein ja schon lustig, wie die Diskussion immer das Abschalten von SMT zum Thema hat, statt einfach das Spiel oder die Anwendung auf bestimmte logische Kerne zu festzusetzen. Wieso sollte man freiwillig auf Leistung verzichten, obwohl es absolut nicht die Ursache ist, warum manche Anwendungen schlechter laufen? Das Problem ist der Scheduler.

Gast
2019-07-25, 18:45:39
Ist das wirklich so? Oder werden einfach Aufgaben verteilt so lange sie in die Pipeline passen, also CCX weise?

Normalerweise schon, es werden zuerst "echte" Kernen gefüllt und wenn noch Platz ist dann "virtuelle".

Wobei das bei Ryzen aufgrund der Architektur nicht zwangsweise die schnellste Variante ist.

Wenn es zwischen den Threads viele Datenabhängigkeiten gibt ist es theoretisch durchaus möglich, dass es schneller ist möglichst alle Threads innerhalb eines CCX abzuarbeiten, als das Ganze über die Kerne in verschiedenen CCX zu verteilen.

Dummerweise gibt es aber für den Scheduler keinerlei Möglichkeit das im Voraus zu wissen, also wird generell immer zuerst auf alle Kerne verteilt, weil das in der Mehrheit der Fälle die bessere Performance bringt.

Gast-olletsag
2019-07-25, 22:49:39
Dummerweise gibt es aber für den Scheduler keinerlei Möglichkeit das im Voraus zu wissen, also wird generell immer zuerst auf alle Kerne verteilt, weil das in der Mehrheit der Fälle die bessere Performance bringt.
AMD hat für den Launch in Zusammenarbeit mit Microsoft die "Shedulertopologie" unter Windows 10 angepasst (inklusive Treiber - was bedeudet: "fülle erst ein CCX bevor du auf ein anderes zugreifst"), davon profitieren übrigens seit dem Build alle Ryzengens. Von UEFI CPPC2 kann nur Matisse profitieren. Daher ist es sehr wichtig, das Build und den Treiber zu installieren, um höchsten Boostclock zu erreichen. Die CPU boostet damit bis zu 20x schneller als Vorgängergens. Gerade unter Games ist das wichtig, da die Taktrate oft dynamisch angepasst wird.
Leider wussten das anscheinend die wenigsten Tester, denn damit sind auch die alten Werte der Vorgänger nicht unbedingt repräsentativ (vor allem unter Spielen kann die geänderte Topologie bis zu 15% Mehrleistung bringen). CPPC2 für Matisse dann nochmal bis zu 6%. Leider kann man nicht alles "nachtesten" - verständlich.
Es war also nicht nur ein Refresh/-Hardwarelaunch, der mehr Leistung bringen kann. AMD nennst es "Topologie Awareness" und "Fast Clock Ramping" mit geänderter Ryzen@Clock Selection die auch Threadripper 3.0 betreffen wird. Heise berichtete.
Die Optimitzation ist für Microsoft Devs einsehbar und wurden hauptsächlich für 1080p optimiert. Anleihen holte man sich bei Samsung (Snapdragon usw.). Auch dort kann man mit ausreichend guter und intelligenter Kerntopologie Leistung abrufen, wenn man anwendungs- und programmgesteuerte Speicher-/Kernzugriffe sinnvoll verteilt. 7nm macht das boosten dabei deutlich "effizienter".

Rabiata
2019-07-26, 12:57:25
Bei CB gab es einen guten Hinweis/Artikel. Erst wenn die physischen Kerne ausgenutzt werden, kommen die virtuellen Kerne dazu. Man hatte das Problem, dass beides gleich belegt wurde und somit Leistung weggefallen ist. Daher wollte AMD dies mit der neuen Gen besser machen. Bis jetzt, hört sich das noch nicht so an ;-)
Aber ja doch, es scheint AMD gelungen zu sein. 12 Kerne mit SMT=on haben in den Tests ungefähr dieselbe Leistung wie 12 Kerne mit SMT=off. Die Unterschiede sind verschwindend gering.
Das deutet darauf hin, daß der Ansatz funktioniert und Programme, die weniger Cores belegen, ihre Threads wie bei SMT=off verteilt bekommen.

y33H@
2019-07-26, 14:04:30
Leider wussten das anscheinend die wenigsten Tester, denn damit sind auch die alten Werte der Vorgänger nicht unbedingt repräsentativ (vor allem unter Spielen kann die geänderte Topologie bis zu 15% Mehrleistung bringen). CPPC2 für Matisse dann nochmal bis zu 6%. Leider kann man nicht alles "nachtesten" - verständlich.Das ist halt leider Unfug, denn jeder ein Sample bekommt, kriegt auch den Reviewer's Guide und da steht auf der ersten Seite dick und fett, man soll Win10 v1903 nehmen und die Chipsatz-Treiber installieren. Zudem liefert AMD immer auch Referenzwerte für etwa CB R20, sprich jeder Tester kann vorab anhand dessen prüfen ob die CPU die richtige Geschwindigkeit hat und dann mit den eigentlichen Messungen loslegen.

Gast
2019-07-26, 16:32:13
AMD hat für den Launch in Zusammenarbeit mit Microsoft die "Shedulertopologie" unter Windows 10 angepasst (inklusive Treiber - was bedeudet: "fülle erst ein CCX bevor du auf ein anderes zugreifst"), davon profitieren übrigens seit dem Build alle Ryzengens.

Das ist aber nicht immer die Variante die im Gesamten die beste Performance bringt. Es ist die Variante die in den meisten Fällen die beste Performance bringt, aber eben nicht in allen. Und das Betriebssystem kann unmöglich Fälle erkennen in denen ein anderes Scheduling eine bessere Performance bringen würde. Das könnte man höchstens durch Profiling einer spezifischen Anwendung herausfinden, nur wird sich niemand den Aufwand antun, wenn das Ergebnis bei der nächsten CPU-Generation wieder ein anderes ist, weil sich die CPU-Topologie vielleicht ein weiteres Mal ändert.

Der Windows Scheduler kennt übrigens schon länger die Topologie von Zen/Zen+ und hat den Scheduler entsprechend angepasst. Auch wenn weitere Performancegewinne als "Seiteneffekt" der Anpassung an Zen2 nicht auszuschließen sin, ist es unwahrscheinlich, dass es für die alte Generation im allgemeinen große Gewinne gibt, und die Seiten die dies getestet haben zeigen auch Performancedifferenzen im Bereich der Messungenauigkeit.


Von UEFI CPPC2 kann nur Matisse profitieren.

CPPC2 ist quasi AMDs Version von Speedshift, und ich habe bereits damals gesagt, dass AMD was vergleichbares benötigt.
In den meisten Benchmarks bringt das aber so gut wie gar nichts, einzig Web-Benchmarks profitieren davon nennenswert, da es in den meisten anderen Benchmarks keine so extremen Sprünge in der Auslastung gibt.
Davon profitiert vor allem die gefühlte Performance des Systems, was man kaum in Benchmarks erfassen kann, und auch die Energieeffizienz bei geringer Last.

Ryzen 1xxx und Ryzen 2xxx taktet selbst im Idle > 2GHz und der ganze "Trick" vom Ryzen Balanced Energiesparplan besteht darin, den Idle-Takt noch weiter zu erhöhen um die Reaktionsgeschwindigkeit zu verbessern.
Intels CPUs takten dagegen auch auf dem Desktop seit Speedshift im Idle unter 1GHz. Für die reinen Idle-Messungen ist Zen/Zen+ noch nicht so viel schlechter, aber bei den Prozessoren reicht quasi ein Mausklick um den Verbrauch gleich mal Sprunghaft in die Höhe zu treiben
CPPC2 sollte dieses Verhalten deutlich verbessern.


Daher ist es sehr wichtig, das Build und den Treiber zu installieren, um höchsten Boostclock zu erreichen.
Alle Reviews die ich gesehen habe haben den Windows 1903 Built verwendet.
Damit wird der erreichbare Boostclock aber keinesfalls höher, er wird lediglich schneller, ausgehend vom Idle-Takt erreicht.


Die CPU boostet damit bis zu 20x schneller als Vorgängergens.
Wie gesagt, der erreichbare Takt erhöht sich damit nicht, lediglich die Zeitdauer vom Idle-Takt bis zum höchsten Boosttakt verringert sich.


Gerade unter Games ist das wichtig, da die Taktrate oft dynamisch angepasst wird.
Bei Games ist das praktisch völlig egal, da in Games immer eine mittlere bis hohe Last anliegt und damit das Betriebssystem niemals die CPU auf niedrige P-States schicken wird.
Wichtig ist das für die Reaktionsgeschwindigkeit, beispielsweise wenn du eine Website liest und dabei die CPU am niedrigsten Idle-Takt verharrt und du das Mausrad zum scrollen betätigst. Die Reaktionszeit mit welcher der Scrollvorgang dann durchgeführt wird, verbessert sich deutlich. Insbesondere bei Touchscreens ist das auch deutlich spürbar.


Leider wussten das anscheinend die wenigsten Tester, denn damit sind auch die alten Werte der Vorgänger nicht unbedingt repräsentativ (vor allem unter Spielen kann die geänderte Topologie bis zu 15% Mehrleistung bringen). CPPC2 für Matisse dann nochmal bis zu 6%. Leider kann man nicht alles "nachtesten" - verständlich.

Mir ist kein einziger Test bekannt, der nicht Windows 10 1903 verwendet, und die 15% sind AMDs Paradebeispiel Rocket League. Die Tests, die auch die Unterschiede gemessen haben zeigen im Allgemeinen einen Unterschied < 5%.