Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: Erster IPC-Test sieht Skylake-X sogar schwächer als Broadwell-E
Leonidas
2017-06-28, 16:29:45
Link zur News:
https://www.3dcenter.org/news/erster-ipc-test-sieht-skylake-x-sogar-schwaecher-als-broadwell-e
G3cko
2017-06-28, 17:23:36
Das neue Cache-Verhältnis und das Mesh werden erst bei sehr vielen Kernen zum Vorteil. Es ist nun mal eine Server-CPU.
Die Architektur ausgelegt für die Zukunft mit 30-100 Kerne.
Bei den popeligen 6 Kernern wird das ganz jedoch zum Nachteil. Der Ringbus ist in der Praxis kaum schlechter und vor allem hat der kleine 6 Kerner nur etwas mehr als 8MB L3 Cache. Soviel wie ein 7700k. Und gerade Spiele profitieren von mehr L3 Cache.
Tja vor sowas muss AMD sich nicht verstecken. Ein solches Desaster erst in ein paar Monaten wäre eine Lachnummer für Intel geworden.
MrSpadge
2017-06-28, 18:03:08
Anandtech haben am 19.6. schon ähnliche Ergebnisse veröffentlicht: link (http://www.anandtech.com/show/11550/the-intel-skylakex-review-core-i9-7900x-i7-7820x-and-i7-7800x-tested/16). Nicht ganz so schlecht für Skylake-X, aber dafür nur mit 4 Kernen ohne HT verglichen. Das belastet Caches und Ringbus/Mesh natürlich weniger.
Tja vor sowas muss AMD sich nicht verstecken. Ein solches Desaster erst in ein paar Monaten wäre eine Lachnummer für Intel geworden.
Hast du dir Leos link mal angesehen? Der 1800X hat nen verdammt großen Abstand zum Intel 10-Kerner. Das wird wohl auch der 12-Kernige Threadripper nicht ausgleichen können und es muss schon der 16-Kernige ran. Was für ein "Desaster"!
MrS
HeinLo
2017-06-28, 18:05:00
Das neue Cache-Verhältnis und das Mesh werden erst bei sehr vielen Kernen zum Vorteil.
Da wäre ich mir nicht so sicher. Richtig ist, dass der größere L2 Cache und kleinere L3 Cache eine solch erhebliche Änderung darstellen, dass der übliche optimierte/compilierte Code nicht mehr so gut läuft. Die Hops über mehrere Cores ändern sich positiv wie negativ, der Cache wird wohl auch anders angesprochen. Aber ein Grundprinzip, dass das generell schlechter für wenige Cores sein soll ist das noch nicht.
Die Frage ist für mich ob bzw. vor allem wann und was an Software für diese "neue Prosumer" Architektur optimiert wird.
Bei den Preisen und Positionierung von Ryzen sollte das für Konsumenten-Zeugs gut gehen, auch wegen AMDs Anstrengungen mit den Entwicklern. Bei den neuen X-Intels hingegen habe ich auf absehbare Zeit noch Zweifel. Für Intel regelt sich doch alles über Marktmacht und eigene Compiler-Optimierungen. Bis das in aktuelle Software bemerkbar einfließt wenn der Compiler das nicht ganz von alleine fixen kann geht's schon mal Jahre. (Guckst Du Hyperthreading, SSE3, AVX,...)
Vermutlich denkt man sich bei Intel mit den MHz Gewinn das ausreichend kompensieren zu können.
Solange man SW nutzt, die mit den neuen Intels trotz mehr MHz gar nicht gut läuft, würde ich noch einen Bogen um die machen. Ende Jahr weiss man sicherlich mehr.
Das der L3 des i7-7700K inklusive des Inhaltes aller L2-Caches (und L1-Caches ?) ist sind es höchstens 7MB
der i7-7700K hat 8MB L3-Cache (inkl. L2-Cache) = 8MB
der i7-7800X hat 6MB L2-Cache + 8,25MB L3-Cache= 14,25MB
8 zu 14,25 = +78,125% mehr Cache bei 50% mehr Kernen
HeinLo
2017-06-28, 19:24:00
Das der L3 des i7-7700K inklusive des Inhaltes aller L2-Caches (und L1-Caches ?) ist sind es höchstens 7MB
der i7-7700K hat 8MB L3-Cache (inkl. L2-Cache) = 8MB
der i7-7800X hat 6MB L2-Cache + 8,25MB L3-Cache= 14,25MB
8 zu 14,25 = +78,125% mehr Cache bei 50% mehr Kernen
Man kann doch nicht einfach Cache zusammenzählen oder subtrahieren und vergleichen.
Auf jeder Cache-Stufe ist die Latenz anders und unterschiedliche Grössen und Cache-Strategie verursachen unterschiedliche Misses und Verzögerungen. Der shared Cache ist nicht fest partitioniert je Core sondern hält die zuletzt geschriebenen/gelesenen Daten. Je nach Last in SW und Multitasking performt das extrem unterschiedlich.
Große L2 Caches brauchen auch große Lokalität der Daten, wenn plötzlich der shared Cache zu klein ist und L2 nicht kohärent ist geht's bis in den RAM zurück.
256k vs. 1MB im L2 sind ne grosse Hausnummer, ein im Multithreading gestresster Shared Cache der im Multitasking für die Anzahl der Cores zu klein ist aber auch.
Es ist eine anderes Balancing im Code nötig und bei den ganzen Render-Benching wird oft vergessen, dass es nicht unüblich ist im Hintergrund zu rendern während man im Viewer weiter arbeitet.
G3cko
2017-06-28, 20:39:46
Anandtech haben am 19.6. schon ähnliche Ergebnisse veröffentlicht: link (http://www.anandtech.com/show/11550/the-intel-skylakex-review-core-i9-7900x-i7-7820x-and-i7-7800x-tested/16). Nicht ganz so schlecht für Skylake-X, aber dafür nur mit 4 Kernen ohne HT verglichen. Das belastet Caches und Ringbus/Mesh natürlich weniger.
Hast du dir Leos link mal angesehen? Der 1800X hat nen verdammt großen Abstand zum Intel 10-Kerner. Das wird wohl auch der 12-Kernige Threadripper nicht ausgleichen können und es muss schon der 16-Kernige ran. Was für ein "Desaster"!
MrS
Das wird sich noch zeigen. Wenn der 10 Kerner schon so säuft wird Intel die Taktraten sicherlich nicht beim 18 Kerner genauso fahren können.
Der kleine aber feine Unterschied ist aber der Preis. Was bringt mir ein 18 Kerner für knapp 2000€ wenn diesen sich kaum Jemand leisten kann. AMD dagegen verkauft 2 popelige 200mm² Chips als 16 Kerner für unter 1000€. Da wird Intel nur über die Kriegskasse mitgehen, wenn sie den überhaupt wollen.
Das der L3 des i7-7700K inklusive des Inhaltes aller L2-Caches (und L1-Caches ?) ist sind es höchstens 7MB
Der inklusive Cache ist allerdings nicht nur eine Platzverschwendung sondern hat auch Vorteile.
Dadurch, dass im L3 immer alle Daten vorhanden sind die sich in irgendeinem Cache vom Kern befinden immer von jedem Kern aus dem L3 geladen werden, was schneller ist als der Umweg über den L2 eines anderen Kerns.
Das wird sich noch zeigen. Wenn der 10 Kerner schon so säuft wird Intel die Taktraten sicherlich nicht beim 18 Kerner genauso fahren können.
Der kleine aber feine Unterschied ist aber der Preis.
Der 6-Kerner von Intel ist genauso schnell wie AMDs 8-Kerner, bei günstigerem Preis.
Überraschend ist das keineswegs, dass Broadwell(-E) eine höhere IPC bietet als Skylake(-X), es stand schon 2015 in c't.
"Bei den Latenzen jedoch zeigt sich, dass die Skylake-Einheiten oft etwas gemächlicher arbeiten. In vielen Fällen brauchen sie nämlich einen Takt mehr als beim Haswell. Und noch stärker fällt das im Vergleich zum Broadwell auf, der für mobilen Einsatz mit niedrigerem Takt optimiert wurde. Die „entspannten“ Latenzzeiten des Skylake lassen demnach Schlüsse auf einen geplanten höheren Takt zu."
https://www.heise.de/ct/ausgabe/2015-27-Ueberblick-ueber-die-Mikroarchitektur-des-Skylake-Kerns-3033631.html
y33H@
2017-06-28, 23:25:30
Latenzen sind aber nun mal nicht alles.
Wenn ich mir die Taktraten so ansehe dann sehe ich absolut keinen Grund warum Skylake mit 5% weniger IPC im Endeffekt noch 13% schneller sein kann. Das würde heißen dass Skylake deutlich besser mit steigendem Takt skaliert d.h. es kann nur das Speichersystem bremsen.
Das Ganze ist jedoch sowieso eine mehr theoretische Diskussion, da die Bemchmarks absolut nicht die Alltagsperformance wiederspiegeln die wesentlich weniger Multicore optimiert ist.
FlashBFE
2017-06-29, 09:01:50
Der 6-Kerner von Intel ist genauso schnell wie AMDs 8-Kerner, bei günstigerem Preis.
Für diese Aussage muss es überhaupt erstmal ausreichend Tests geben und das möglichst nicht nur gegen den "teuren" 1800X, sondern auch gegen die gleichpreisigen Ryzens.
Gipsel
2017-06-29, 14:27:30
Wenn ich mir die Taktraten so ansehe dann sehe ich absolut keinen Grund warum Skylake mit 5% weniger IPC im Endeffekt noch 13% schneller sein kann.Wieso nicht?
5% niedrigere Leistung pro Takt, ~19% höherer (Boost-)Takt im Schnitt und das kommt so raus.
0,95*1,19=1,13 also 13% schneller.
Und der 7900X boostet recht aggressiv (all-core bis 4,0Ghz) und wird nur durch die TDP gebremst (bzw. offenbar bei einigen BIOS-Versionen auch nicht, wo er dann >200W zieht).
Die Tabelle in Leos Meldung scheint übrigens für den 6950X fehlerhaft zu sein. Der hat nur eine Baseclock von 3,0GHz und einen maximalen Boost von 3,5 GHz für zwei Kerne (4,0Ghz single core mit Turbo 3.0). Der maximale allcore-Boost liegt bei 3,4Ghz. Da liegt der 7900X deutlich höher:
3,3Ghz Base, allcore Boost 4,0GHz, bis 4,3GHz bei Belastung weniger Kerne (gerade keine Ahnung wie viele) und bis 4,5GHz bei last auf zwei Kernen.
vBulletin®, Copyright ©2000-2025, Jelsoft Enterprises Ltd.