PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: News des 2./3. März 2024


Leonidas
2024-03-04, 09:06:24
Link zur News:
https://www.3dcenter.org/news/news-des-23-maerz-2024

Mega-Zord
2024-03-04, 11:37:26
Wie wäre es mit Stromverbräuchen oder elektrischen Leistungen statt Wattagen?

Leonidas
2024-03-04, 11:43:30
Wattagen ist einfach kürzer und prägnanter. Aber ich versuche es, nicht zu oft einzusetzen ;)

basix
2024-03-04, 12:31:39
Die Cache Grösse wird bei Ryzen CPUs sicher mehr Gewicht haben als bei den Prozessoren von Intel. Aber dennoch erstaunlich, dass es so wenig mit den Cores skaliert. Die Konsolen haben halt auch nur 8C.

Beim Cache sieht man auch den abnehmenden Ertrag:
- 1.20x bei Verdopplung auf 32MByte
- 1.25x bei Verdreifachung auf 96 MByte
- 1.50x bei 6x Cache

Kommt Zen 6 im "Idealfall" mit 192 MByte daher (Speku bei 16C CCX), wird es vermutlich nochmals 1.1x obendrauf geben und evtl. nochmals das selbe oder etwas mehr durch niedrige Speicherlatenzen (was in der Gerüchteküche so durchgereicht wird für Zen 6).

Platos
2024-03-04, 13:51:49
Warum sollte es bei Intel weniger nützen?

MiamiNice
2024-03-04, 14:05:29
Weil Intel nicht so abhängig ist von den Caches aufgrund des schnelleren Speichersubsystems.
AMD kaschiert mit den Caches die langen Zugriffszeiten auf den Arbeitsspeicher, bedingt durch die langsame Infinity Fabric.
Oder man könnte auch schreiben: AMD braucht die Caches um mit Intel ohne Caches mithalten zu können, weil AMDs Speichersubsystem für Server und many Core CPUs gemacht ist (und damit viele viele Cores anbinden kann, nur halt langsam) und Intels Speichersubsystem von Consumer CPUs abstammt die maximal 8 Hops (Cores) hatten. Alle Cores incl. Speichercontroller hängen an diesen Bus Systemen sowohl bei Intel als auch bei AMD. Intels ist halt deutlich schneller was die Latenz angeht (und Latenz ist halt alles).
Deswegen ist es beim AMD auch ziemlich "rille" welchen (Arbeits)Speicher man in den Slot drückt (wird in den Caches zwischengespeichert um das langsamere Speichersubsystem möglichst zu umgehen), bei Intel ist das Gegenteil der Fall (hier kann der Speicher nicht schnell genug sein).

Das ist btw. auch der Grund warum Intel immer im Gaming schneller war als AMD, eben bis die Caches bei AMD kamen.

Sweepi
2024-03-04, 14:28:12
AMD braucht die Caches um mit Intel ohne Caches mithalten zu können
Oder auch: Intel braucht ihr low-latency Speichersystem, um auf mehr Cache verzichten zu können :uhippie:

Platos
2024-03-04, 15:23:10
Oder auch: Intel braucht ihr low-latency Speichersystem, um auf mehr Cache verzichten zu können :uhippie:

Jo, jenachdem, wie sehr die Caches den Preis beeinflussen, würde ich das sogar als besser ansehen, als dass ich sehr teuren RAM kaufen muss, um schnell zu sein. Also wenn man keinen super schnellen RAM hat, müsste das ja dann auch bei Intel mehr bringen, oder ? Aber die Cache-CPUs sind ja auch immer ganz schön teuer, also...

Aber falls das mal zum Standart wird (bezweifle ich), wäre das vlt. gut. Also dann würde es sich vlt. im Preis nicht so stark nieder schlagen und man müsste auch nicht teuren RAM kaufen (bei Intel).

Aber abgesehen davon: Zen6 soll doch genau diese lahme Infinity Fabric durch was besseres austauschen oder?

basix
2024-03-04, 15:56:08
Ich bin mir nichtmal sicher, ob die Caches bei Intel wirklich schneller sind ;) Intels Cores verhalten sich bei Branch-intensivem Code ganz anders als die von AMD und können dadurch in Spielen die Speicherlatenz vermutlich besser kaschieren (prefetching usw.). Das ist einer der Gründe, wieso Intels Cores so fett sind. Die Caches an sich sind hier nichtmal das wichtigste, die reinen Cache Latenzmessungen fallen bei AMD ja sogar besser aus als bei Intel. Intel hat nur einen Vorteil bei der L1-Bandbreite und das L1/L2 leicht grösser sind

Zwei Spekus:
- Zen 5 wird sich hier mehr wie ein Intel Core verhalten, Zen 4 zeigt hier bereits erste Anzeichen. Zen 5 macht den Core fetter / Unified Scheduler (wie Intel) und schliesst beim L1$ zu Intels P-Cores auf
- Zen 6 wird zusätzlich das Speichersubsystem auf Low Latency trimmen (doppelt so grosse CCX, neues IOD mit stark beschleunigtem Infinity Fabric und "Advanced Packaging" -> Infinity Fanout Links)

Ausserdem:
Gibt ja Messungen von HWUB die eine deutlich stärkere Speicherskalierung von Ryzen aufzeigt. Intel skaliert wesentlich weniger, womit eigentlich bewiesen ist, dass AMD CPUs stärker auf Speicherlatenz reagieren.

MiamiNice
2024-03-04, 16:02:33
Oder auch: Intel braucht ihr low-latency Speichersystem, um auf mehr Cache verzichten zu können :uhippie:

Die Caches bei AMD kamen ja erst nach mehreren Zen Gens. Speziell in diesem Fall kann man also IMO sagen, AMD braucht diese Caches um mit Intel bei der Gaming Leistung mithalten zu können. Durch die vielen Cache misses beim gamen, müssen öfter Daten aus dem Ram nachgeladen werden, als bei anderen Anwendungen. Erst mit den Caches (und mehr Cores pro CCD, was auch wieder so ein IF Ding ist), konnte AMD beim Gaming gleich ziehen.

Und Intel bekommt nun auch "dicke" caches. Wahrscheinlich bringen diese aber weniger als bei AMD.

Ich bin mir nichtmal sicher, ob die Caches bei Intel wirklich schneller sind

Ist gerade nicht der entscheidene Punkt. Die Speicherlatenz ist bei Intel kürzer, daher die Caches bei AMD. Ob die Caches dann schneller sind als bei Intel, steht auf einem anderem Blatt. Platos war nicht klar, warum es diese Caches gibt und warum Intel diese nicht so dringend braucht, AMD aber schon.

Exxtreme
2024-03-04, 16:03:14
Man wird mit einem schnelleren Speichersystem nicht so wirklich viel rausholen. Auch Intel skaliert praktisch nicht mit schnellerem RAM. Sie skalieren einen Ticken besser aber das ist nur messbar. Die Problematik liegt nämlich nicht im Speichercontroller sondern in den langen Leitungen von der CPU bis zum RAM. Deshalb sinken die Latenzen mit keiner Speichergeneration in einem nennenswerten Maße. Und das ist auch der Grund warum man Caches in der CPU hat und nicht wie früher auf der Hauptplatine. Ja, früher war der Level2-Cache auf der Hauptplatine verlötet.

Was hier etwas Abhilfe bringen würde, wären CPUs mit integrierten RAM-Slots. Sodass man die Leitungen verkürzen könnte. Nur wohin dann mit dem Kühler. ;D

Platos
2024-03-04, 16:08:10
Man wird mit einem schnelleren Speichersystem nicht so wirklich viel rausholen. Auch Intel skaliert praktisch nicht mit schnellerem RAM. Sie skalieren einen Ticken besser aber das ist nur messbar. Die Problematik liegt nämlich nicht im Speichercontroller sondern in den langen Leitungen von der CPU bis zum RAM. Deshalb sinken die Latenzen mit keiner Speichergeneration in einem nennenswerten Maße. Und das ist auch der Grund warum man Caches in der CPU hat und nicht wie früher auf der Hauptplatine. Ja, früher war der Level2-Cache auf der Hauptplatine verlötet.

Was hier etwas Abhilfe bringen würde, wären CPUs mit integrierten RAM-Slots. Sodass man die Leitungen verkürzen könnte. Nur wohin dann mit dem Kühler. ;D

Do meinst so eine (bzw. mehrere) Sockel direkt um den CPU-Sockel herum, wo man dann Speicherchips rein tun kann anstatt CPUs ?

Wäre das technisch (und wirtschaftlich) überhaupt möglich? Also so dass die dann vom Nutzer noch austauschbar sind und NICHT verlöteter Scheiss.

Edit: Weil ich fände das ja irgendwie ziemlich cool. Die Speichersockel rund um die CPU wären dann eben so, dass sie auf gleicher höher wären, so dass man ein und denselben Kühler verwenden könnte.

MiamiNice
2024-03-04, 16:19:12
Eigentlich müsste der komplette Ram in die CPU wandern :biggrin:
Der 3D Cache müsste Arbeitsspeicher ersetzen, ist nur halt viel zu teuer.
Vielleicht sehen wir in Zukunft einen Intel Tile mit 16,32 und 64 GB Ram?!?
Wäre nicht der aktive Interposer die Gelegenheit um genau dies umzusetzen?
Was würde ich lachen wenn Intel so etwas in der Art bringt. Keine klassischen Caches, sondern L3 = Ram.

Exxtreme
2024-03-04, 16:23:50
Wäre das technisch (und wirtschaftlich) überhaupt möglich? Also so dass die dann vom Nutzer noch austauschbar sind und NICHT verlöteter Scheiss.

Keine Ahnung. Es ist halt so, dass man den RAM wegen der langen Leitungen nicht nennenswert beschleunigen kann. Was noch geht ist Bandbreite. Aber von der profitiert der PC eher unwesentlich. Denn der Code, den Entwickler und Compiler generieren ist sehr darauf optimiert möglichst im CPU-Cache zu laufen. Oracle passt sogar Java so an, dass es Cache-freundlicher wird. Und hohe Bandbreite bringt nur dann was wenn man permanent Gigabytes an Daten schaufelt. Und das tun die meisten Programme nicht weil es schlicht dazu keinen Grund gibt. Gut ausgelastete DB-Server profitieren davon. Aber das war's auch schon.

basix
2024-03-04, 17:10:27
Ist gerade nicht der entscheidene Punkt. Die Speicherlatenz ist bei Intel kürzer, daher die Caches bei AMD. Ob die Caches dann schneller sind als bei Intel, steht auf einem anderem Blatt.

Hast du dir mal Speicherlatenzmessungen von Raptor Lake angesehen? Ein 13900K hat bei selbem Speicher eine höhere Latenz als ein 7950X ;)
https://www.techpowerup.com/review/intel-core-i9-13900k/5.html
https://www.techpowerup.com/review/amd-ryzen-9-7950x/6.html

Die "rohe" Latenz ist wie gesagt nicht das einzige was zählt. Intels Cores können gut mit Spiele Code. Und das ist eher tief im Core zu finden (Scheduler, Branches, OoO Window, Cache Tables, ...) als direkt in den Caches und der Speicherlatenz. Mit dem kann Intel die effektive Latenz senken. Was genau es ist, kann ich nicht sagen. Vielleicht gibt es Tests von Chipsandcheese, die das näher beleuchten. Und ich vermute, dass ein Teil der gerüchteweise hohen IPC Steigerungen von Zen 5 von dem herrühren, dass man sich in diesen Bereichen den Intel Cores annähert. Speichersensitive Workloads liefen schon immer besser auf den Intel Cores. Das liegt aber nicht daran, dass Zen CPUs ein schlechtes oder langsames Speichersubsystem haben (L2 -> L3 -> DRAM) sondern was davor liegt. Mit grossen Caches kann man hier wieder kompensieren, was AMD mit dem grossen L3$ auch macht.

Zossel
2024-03-04, 19:45:20
Man wird mit einem schnelleren Speichersystem nicht so wirklich viel rausholen. Auch Intel skaliert praktisch nicht mit schnellerem RAM. Sie skalieren einen Ticken besser aber das ist nur messbar. Die Problematik liegt nämlich nicht im Speichercontroller sondern in den langen Leitungen von der CPU bis zum RAM. Deshalb sinken die Latenzen mit keiner Speichergeneration in einem nennenswerten Maße. Und das ist auch der Grund warum man Caches in der CPU hat und nicht wie früher auf der Hauptplatine. Ja, früher war der Level2-Cache auf der Hauptplatine verlötet.

DRAM ist konzeptionell "langsam".

Denniss
2024-03-04, 20:44:54
Auch bei Intel bringt mehr Cache oft eine höhere Leistung als mehr Kerne.
HWUB hat das mal bei Spielen durchgetestet
Cache ist halt wie Hubraum bei Motoren - mehr ist oft besser.

Gast
2024-03-04, 22:23:00
"Nach wie vor sind 6 CPU-Kerne für Spiele im allgemeinen somit der Goldstandard"
Ach ...

Gast
2024-03-05, 00:26:05
[...] Cache ist halt wie Hubraum bei Motoren - mehr ist oft besser.

Stimmt nicht (mehr) bei Motoren und auch nicht bei CPUs. Genau wie bei Motoren ist es eine Frage des Use Case. Ein Schiffsdiesel hat nun mal andere Anforderungen als ein F1 Rennwagen.

Jedes System hat seinen spezifischen Bottleneck. Cache bringt nur dort etwas, wo die CPU auf Daten warten müsste, um ihre volle Leistung zu bringen. Genauso gibt es Fälle, bei der der maximale Takt oder mehr Kerne eine größere Rolle spielen.

Man kann argumentieren das Benchmarks mit der Kombination aus 1080p mit einer 4090 die Unterschiede am besten zur Geltung bringen (richtig), aber es muss nicht heißen, dass ein großer L3 Cache für den eigenen Use Case (z.B. hohe Auflösung und GPU Limit bei Spielen, FPS Limit des Monitors, oder andere Anwendungsbereiche außer Games) noch eine wesentliche Rolle spielt.
Wenn die Performancedifferenz zwischen 7700X und 7800X3D bei 4K noch 5% ist, ist es zumindest für mich unterhalb der Wahrnehmungsgrenze und damit unerheblich für eine Kaufentscheidung.

Platos
2024-03-05, 04:31:15
Wenn du mit GPU Limit kommst, kannst du ja gleich jegliche Diskussion über CPUs weglassen...

Zumindest haben auch bei Intel früher zusätzliche (nicht nur grössere) Caches was gebracht. Siehe Broadwell.


Wenn die Performancedifferenz zwischen 7700X und 7800X3D bei 4K noch 5% ist, ist es zumindest für mich unterhalb der Wahrnehmungsgrenze und damit unerheblich für eine Kaufentscheidung.

Nur verschiebt sich das vlt. mit der nächsten Grafikkarte zu 10-15%.

Und es gibt doch genug Spiele, die auch in 4k Hoffnungslos CPU-(mit-)Limitiert sind. Dazu gibts ja bei GameGPU immer gute tests.

Zossel
2024-03-05, 06:56:39
Auch bei Intel bringt mehr Cache oft eine höhere Leistung als mehr Kerne.
HWUB hat das mal bei Spielen durchgetestet
Cache ist halt wie Hubraum bei Motoren - mehr ist oft besser.

Njet, je größer desto langsamer.

Ätznatron
2024-03-05, 08:56:15
Njet, je größer desto langsamer.

Ich gehe jetzt mal einfach davon aus, dass du noch nie ein hubraumstarkes Auto gefahren hast.

Gast
2024-03-05, 09:01:27
Edit: Weil ich fände das ja irgendwie ziemlich cool. Die Speichersockel rund um die CPU wären dann eben so, dass sie auf gleicher höher wären, so dass man ein und denselben Kühler verwenden könnte.
Wieso separate Sockel? Es gibt auch Lösungen, bei denen man zwei Chips in einen Sockel packt (ein kleinerer unten/innen, ein größerer oben drüber, der außen herum kontaktiert (war ein PGA).
Klar, das geht wegen der Abwärme nicht, aber anders herum geht:
Einen großen Sockel, in den man einen Träger für den Ram setzt (Ram ist da fest aufgelötet, aber den Träger kann man in allen erdenklichen Speichergrößen kaufen und nach Belieben wechseln).
In diesem Ram Träger ist in der Mitte dann eine Lücke für die CPU. Alle Speicher-Relevanten Leiterbahnen gehen gleich direkt auf den Ram-Träger, alles andere in den Sockel (man könnte auch alles in den Sockel laufen lassen und dann gleich wieder zum Ram, wäre aber ineffizienter). Der Speicher hat dann noch Kontakte zum Board, z.B. für die Spannungsversorgung.
Das Problem ist dabei: Wie befestige ich CPU und Ram mit dem Board und Miteinander? Der Sockel müsste riesig sein (Anpressdruck, Planheit und so werden da echt unschön).
Aber technisch Machbar ist das durchaus. Bedingt dann nur wieder einen neuen Speicher-Standard und kostet vermutlich. Und natürlich hat man hier die Gefahr, dass jeder CPU Hersteller sein eigenes Süppchen kocht, also der Ram-Träger von Intel passt nicht zu AMD und anders herum...

Exxtreme
2024-03-05, 09:01:39
Ich gehe jetzt mal einfach davon aus, dass du noch nie ein hubraumstarkes Auto gefahren hast.

Das bezieht sich wohl auf den Cache. Und es ist auch so, dass je größer ein Cache ist desto langsamer ist er. Und deshalb gibt es auch diese Cache-Aufteilung in den CPUs von L1 -> L3-Cache. Das ist bei RAM übrigens genauso.

MiamiNice
2024-03-05, 10:26:53
Deswegen hat eine CPU auch mehrere Stufen davon. Ich mag ja diese Autovergleiche immer gerne lesen :biggrin:
Von klein und schnell (l1) über nicht mehr ganz so schnell und klein (l2) und noch weniger schnell und trotzdem noch klein (l3).
Das ist quasi wie ein dreifacher Bezinfilter im Auto. Je reiner der Stoff, desto mehr PS und so :D

Platos
2024-03-05, 23:58:32
Wieso separate Sockel? Es gibt auch Lösungen, bei denen man zwei Chips in einen Sockel packt (ein kleinerer unten/innen, ein größerer oben drüber, der außen herum kontaktiert (war ein PGA).
Klar, das geht wegen der Abwärme nicht, aber anders herum geht:
Einen großen Sockel, in den man einen Träger für den Ram setzt (Ram ist da fest aufgelötet, aber den Träger kann man in allen erdenklichen Speichergrößen kaufen und nach Belieben wechseln).
In diesem Ram Träger ist in der Mitte dann eine Lücke für die CPU. Alle Speicher-Relevanten Leiterbahnen gehen gleich direkt auf den Ram-Träger, alles andere in den Sockel (man könnte auch alles in den Sockel laufen lassen und dann gleich wieder zum Ram, wäre aber ineffizienter). Der Speicher hat dann noch Kontakte zum Board, z.B. für die Spannungsversorgung.
Das Problem ist dabei: Wie befestige ich CPU und Ram mit dem Board und Miteinander? Der Sockel müsste riesig sein (Anpressdruck, Planheit und so werden da echt unschön).
Aber technisch Machbar ist das durchaus. Bedingt dann nur wieder einen neuen Speicher-Standard und kostet vermutlich. Und natürlich hat man hier die Gefahr, dass jeder CPU Hersteller sein eigenes Süppchen kocht, also der Ram-Träger von Intel passt nicht zu AMD und anders herum...

Ja, das ist dann wohl das Problem beim fest verlöteten Sockel-RAM Komplex. Es ist an Intel/AMD gekoppelt bzw. an die Mainboardhersteller. Das bedeutet, das eine zusätzliche Partei dazwischen geschalten wird, die auch Kohle haben will und sich dafür unnötiges Zeug ausdenkt.

Daher fände ich es besser, wenn man die nackten Speicherchips kriegen könnte.

Man könnte es ja auch so machen: Ein Sockel nach dem Prinzip wie bei HBM: Bei HBM wird der Speicher direkt um den DIE platziert und hier würde es einen grossen Sockel geben, wo in der Mitte die CPU sitzt und rundum kann man dann X Speicherchips platzieren, wobei man so viele Platzieren kann, wie man will (bzw. so viel, wie Paltz haben). Das wäre vlt. etwas besser, als pro Speicherchip ein Sockel (das wäre etwas absurd).

Dann wäre der Speicher (wirtschaftlich) entkoppelt vom Sockelhersteller (Intel/AMD + Mainboardhersteller).

Zum Technischen:

1) der Sockel: Man könnte den Sockel so designen, dass die Speicherchips 1mm tiefer liegen, so dass man die mit Wärmeleitpads versieht (die werden dann mitgeliefert beim kaufen der Chips oder des Kühlers). Alles exakt auf einer Ebene wird vermutlich schwierig.

2) Der Kühlerboden: Es würde natürlich andere Kühler erfordern. Hier würden (erstmal) wieder die reinen Heatpipe-Kühler von (wirtschaftlichem) Vorteil, denke ich. Das braucht nur paar cm mehr Heatpipe anstatt einen deutlich grösseren Kühlerboden. Aber du hast schon recht, die Kühlung wird schwieriger.

Aber ich finde diese Methode besser, wie eine Kombination von Sockel und Speicher. Dann müsste man entweder mehrere verschiedene Mainboards anbieten (die mit Viel Speicher wären dann teuer, dann kann man gleich den Speicher verlöten), oder man muss dann die Sockel ins Mainboard einbauen können. Also quasi ein Sockel im Sockel.