PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : 8-Core Sandy Bridge


Gast
2010-11-19, 23:33:23
Wann kommen die 8-kernigen Sandy Bridges heraus?

AnarchX
2010-11-19, 23:36:28
2. Halbjahr 2011 oder später.

Demogod
2010-11-20, 01:13:43
28nm denn noch oder noch kleiner?

S940
2010-11-20, 01:48:50
28nm denn noch oder noch kleiner?
Nachwievor 32nm. Aber vielleicht kommen fast gleichzeitig 22nm Ivy Brücken Quads.

Demogod
2010-11-20, 01:54:55
Q2 2011 noch 32nm? u (quite) sure?

Schrotti
2010-11-20, 02:19:34
2. Halbjahr 2011 oder später.

Warum erst so spät?

mapel110
2010-11-20, 02:30:16
Weil man die Kunden langsam schröpfen muss. Es kommt alles kleckerweise.

MR2
2010-11-20, 08:57:49
Wie ich Intel kenne werden die wohl den 8Kerner vorziehen,um gegen den 4 Modul 4Ghz Zambesi was in der Hand zu haben;-)

AnarchX
2010-11-20, 09:07:23
Der muss erst mal den 3,46GHz Gulftown schlagen.

Sandy Bridge EP mit 8 Cores und 20MiB LL-Cache wird wohl eine >300mm² CPU, weswegen Intel auf einen reiferen Prozess setzen will.

Undertaker
2010-11-20, 10:14:02
Es wird so oder so interessant, in welcher Preisklasse sich die LGA2011 Plattform ansiedeln wird. Mit dem 4-Kanal Interface dürfte das kein Schnäppchen werden - womöglich werden wir den Sockel diesmal nur im absoluten High-End sehen, und nicht wie LGA1366 "schon" ab ~200€ CPU-Preis.

Das hängt sicherlich auch davon ab, ob man mit den LGA1155 Sandy Bridge Modellen bereits gegen alle Bulldozer-Derivate konkurrieren kann.

AnarchX
2010-11-20, 10:22:19
Es ist/war ja noch ein 3-Kanal Sockel 1356 geplant.

davidzo
2010-11-20, 11:07:41
Wie ich Intel kenne werden die wohl den 8Kerner vorziehen,um gegen den 4 Modul 4Ghz Zambesi was in der Hand zu haben;-)

ein bulldozer modul kommt von der transistorenzahl eher einem Sb core mit HT näher. Dasselbe sieht man ja auch beim cache.

Ich würde nicht damit rechnen, dass Intel einen Prozessor mit doppeltem Speicherinterface und doppelter Diegröße gegen einen mainstream 8-core aufbietet. Interlagos (Magnycours Nachfolger) ist AMDs einzige CPU mit ähnlich vielen pins, Diegröße, ebenfalls vier Speicherkanälen.

Natürlich wird die Leistung entscheiden welches Produkt gegen welche Antritt auf beiden Seiten, bei AMD ist aber bei Bulldozer genau wie bei Bobcat sehr viel preislicher Spielraum.
Daher denke ich wird sich ein Bulldozermodul preislich auf einem ähnlichen Niveau einpendeln wie ein Sandybridgekern mit HT

Bulldozer Cores ≈ Intel HT Threads
EDIT: Wohl eher 6Cores/12Thread ≈ 8BD-Cores/4Mod


Cores=HT ist mist, laut meinen jüngsten rechnungen kommt zambesi auf mindestens 1.6milliarden transistoren, das entspricht in etwa dem Westmere 6C (gulftown). der vorsprung bei der modulgröße wird durch den großen l3 verschenkt ode rumgekehrt der riesige 2mb l2 pro modul und die neuen 8T statt 6T zellen hauen ordentlich rein.

S940
2010-11-20, 13:15:59
ein bulldozer modul kommt von der transistorenzahl eher einem Sb core mit HT näher. Dasselbe sieht man ja auch beim cache.Im Großen und Ganzen ok; erwähnen sollte man vielelicht noch den zusätzlichen L3 Cache des Orochi Dies.

Ich würde nicht damit rechnen, dass Intel einen Prozessor mit doppeltem Speicherinterface und doppelter Diegröße gegen einen mainstream 8-core aufbietet. Interlagos (Magnycours Nachfolger) ist AMDs einzige CPU mit ähnlich vielen pins, Diegröße, ebenfalls vier Speicherkanälen. Von den Eckdaten hast Du hier auch recht, das Problem ist aber die Rechenleistung. Zwar steht es jeweils 8 gegen 8 Threads, aber auf der einen Seite hat man CMT, auf der anderen SMT.
Also einen mth Speedup von +80-90% <> +30-40%. Das ist grob und pro Intel gerechnet der doppelte SpeedUp.

Um den imaginären SpeedUps nun Bedeutung zu geben, braucht man die Basis / single thread IPC Leistung. Die weiss man nicht, aber man weiss das IPC Bulldozer > IPC K10 (solange man den AMD Marketing Aussagen glaubt ;))

So mit dem Wissen schaut man sich dann die aktuellen mth Benches der X6 vs. i7 870 an (x264/cinebench, povray etc. pp). Da liegt mal der X6, mal der 870 ein bisschen vorne. Mit 8 K10 Kernen wäre man dann aber in jedem Fall in Front.

Daher denke ich wird sich ein Bulldozermodul preislich auf einem ähnlichen Niveau einpendeln wie ein Sandybridgekern mit HT
Preislich sicherlich. In dem Kontext stimmt dann auch die Aussage:
Bulldozer Cores ≈ Intel HT Threads
Aber aus (mth) Rechenleistungssicht ist das eben ne ganz andere Relation und so wars wohl auch von MR2 gedacht.

davidzo
2010-11-20, 13:51:48
deswegen betrachtet man ja auch nicht nur die multithreadedleistung allein bei der evaluierung einer desktopCPU.
genausowenig betrachtet man bei bobcat nur die leistung der IGP.
es gibt anwendungen die davon profitieren und welche die es nicht tun. bei bulldozer kehrt sich der vorteil von CMT im singlethreadedbereich eher ins gegenteil um. die transistoren die man aufwendet um einen zweiten int-kern einzupflanzen der dann nichts zutun hat sind bei intel eher in die IPC des einzelkerns geflossen. rein theoretisch kann ein smt design also schon prinzipbedingt mehr ipc/core herausholen, ein CMT design aber mehr ipc/cpu.
Für wen dann der eine oder andere ANsatz das rundere produkt ergibt wird sich zeigen, jedoch werden CPUs eben nicht einzig nach multithreadedleistung bewertet. mir persönlich ist sogar die singlethreadedleistung wichtiger. Ich würde demnach eine CPU die im singlethreadedbetrieb einen 20 prozentigen Vorteil hat den Vorzug geben als einer die einen ähnlichen vorsprung im multithreaded hat, einfach weil bei mir erstere Auslastung häufiger auftritt als letztere.

Wenn also alles glatt läuft für AMD hat man die klar bessere mt performance, aber trotzdem eine konkurrenzfähige st performance. in performance pro mm² wird bulldozer so oder so verdammt gut sein, dessen bin ich mir sicher. aber ob man in performance pro watt in die richtige richtung geht und mit dem klassenprimus mithalten kann, das wage ich zu bezweifeln.

allem anschein nach sind die tdpangaben ziemlich hoch, trotz 32nm und schlankeren integer cores. naja, wollen wir hoffen, dass sie ähnlich großzügig dimensioniert sind wie bei bobcat, der praktisch noch sparsamer als eine tdpangabe ist...

S940
2010-11-20, 14:38:21
deswegen betrachtet man ja auch nicht nur die multithreadedleistung allein bei der evaluierung einer desktopCPU.
Jo, aber desktop CPUs hab ich ausgeschlossen. Denn dass die 8Kerner auf dem Desktop irgendwas besser machen, als die 4 Kerner mit höherem Takt und dicken Turbo kann man ganz einfach ausschließen.
MR2s Idee macht deshalb eh nur Sinn im Server / mth. Bereich, weswegen ich darauf eingegangen bin. Hätte ich vielleicht noch extra dazuschreiben sollen ;-)

bei bulldozer kehrt sich der vorteil von CMT im singlethreadedbereich eher ins gegenteil um. die transistoren die man aufwendet um einen zweiten int-kern einzupflanzen der dann nichts zutun hat sind bei intel eher in die IPC des einzelkerns geflossen.
Jein. Erstmal muss man die Frage stellen, ob ein einzelner Thread überhaupt alle ExU auslasten könnte. Die IPC der normalen Wald und Wiesen Apps gurkt ja im Normalfall zw. 1 und 2 herum. Das IPC Maximum was mal bei Anandtech gemessen wurde war 1,75 auf nem Nehalem. Die theoretisch nutzbare IPC=3 bekommt man nur mit extra thermischen Lastprogrammen, die nichts Sinnvolles berechnen.

SO, hat man dann das geklärt, dass ein 2issue INT Kern nicht so schlecht sein muss, kann man sich überlegen, dass AMD den 2ten Cluster im Nicht-gebrauch abschalten und dafür den ersten Int Cluster per Turbo schön hochtakten könnte ;-)

Die IPC erhöht sich damit sicher nicht, aber dank +Takt kommt am Ende doch mehr Single-Thread Leistung raus. *WENN* AMD so einen Turbo Mode bei Zambezi implementiert .. die Server haben das nicht, die takten nur komplette Module rauf und runter. Also in trockenen Tüchern ist das noch nicht.

rein theoretisch kann ein smt design also schon prinzipbedingt mehr ipc/core herausholen, ein CMT design aber mehr ipc/cpu.
Hmm ... halte ich für zu pauschal. Die Aussage lebt davon, dass Du davon ausgehst, das man immer kleine CMT INT Cluster verbauen würde. Das ist vermutlich auch die beste Entscheidung, aber man könnte genausogut einen CMT Prozessor mit gemeinsamen Front-End bringen, der dann seine Daten auf zwei dicke 3issue oder gar 4issue ExUs verteilt. Um das dann wieder voll zu nutzen, böte sich dann noch zusätzliches SMT an. Das schließt sich ja nicht aus ;-) Spätestens da wirds dann mit Deiner obigen Feststellung "interessant" ;-)
Aber im Endeffekt muss man das gegen den höheren Takt simpler 2issue Kerne gegenrechnen. Komplexe 3/4issue Kerne haben da immer einen "Dickschiff" Nachteil.

Das gemeinsame Front-End sehe ich sogar als Vorteil an. Das wird nur im Mittel nur zu 20% genutzt. Wenn man das jetzt für 2 Kerne nutzt, steigt die Rentabilität eines größeren Transistorenbudgets.


Für wen dann der eine oder andere ANsatz das rundere produkt ergibt wird sich zeigen, jedoch werden CPUs eben nicht einzig nach multithreadedleistung bewertet. mir persönlich ist sogar die singlethreadedleistung wichtiger. Ich würde demnach eine CPU die im singlethreadedbetrieb einen 20 prozentigen Vorteil hat den Vorzug geben als einer die einen ähnlichen vorsprung im multithreaded hat, einfach weil bei mir erstere Auslastung häufiger auftritt als letztere.Si claro, seh ich auch so, v.a. wenn man eh 4Kerne / 8 Threads hat. Das reicht locker für die üblichen Desktop Apps.

Wenn also alles glatt läuft für AMD hat man die klar bessere mt performance, aber trotzdem eine konkurrenzfähige st performance. in performance pro mm² wird bulldozer so oder so verdammt gut sein, dessen bin ich mir sicher. Jo, das ist der best case.

aber ob man in performance pro watt in die richtige richtung geht und mit dem klassenprimus mithalten kann, das wage ich zu bezweifeln.
Hmm, wieso nicht, wo siehst Du Probleme beim Stromverbrauch ?
Ich bin da recht optimistisch, GFs 32nm SOI hK ULK sollte keine allzugroße Stromverschwendung zulassen. Auf alle Fälle nicht mehr als Intels bulk hK.
Ansonsten sind ja die TDPs auf 125W fest. Mit dem Wissen, dass die IPC steigt und es 8 Threads geben wird, ist die Perf/W auf alle Fälle um einiges besser als bei nem aktuellen Thuban X6 mit 125W TDP.
Was Intel mit Sandy bieten kann ... mal schauen.

allem anschein nach sind die tdpangaben ziemlich hoch, trotz 32nm und schlankeren integer cores. naja, wollen wir hoffen, dass sie ähnlich großzügig dimensioniert sind wie bei bobcat, der praktisch noch sparsamer als eine tdpangabe ist...
Hm, naja 125W halt, ist doch normal ... oder meinst Du das im Vergleich zu Sandys 95W inkl der GPU ? Solange AMD die bessere mth Leistung abliefert passt das schon ;-)

ciao

Alex

=Floi=
2010-11-21, 14:19:44
ich hoffe auch noch immer auf die sockel 2011 platform und auf das 2. halbjahr 2011. ich verstehe sowieso nicht, warum intel sich mit dieser platform so zeit lässt und es nicht wie beim i7 macht. scheinbar sind die margen im normalen markt durch die kleineren chips einfach besser.

=Floi=
2010-11-22, 20:17:10
aufgrund der DIE-größe wäre sogar ein zusammengepappter 12 core prozessor denkbar.
http://img152.imageshack.us/img152/5333/18a648c865434fc4ab5cbf2.jpg
die 8 core 16 thread version sollte kein großes problem sein. schon erstaunlich wie klein sandy bridge im vergleich doch ist.

edit
bild neu upgeloadet

S940
2010-11-22, 20:51:07
aufgrund der DIE-größe wäre sogar ein zusammengepappter 12 core prozessor denkbar.
http://img.inpai.com.cn/article/2010/9/14/18a648c8-6543-4fc4-ab5c-bf26c5b0d477.jpg
die 8 core 16 thread version sollte kein großes problem sein. schon erstaunlich wie klein sandy bridge im vergleich doch ist.
Ich seh da leider nix, lad mal das Bild bei abload.de hoch :)

davidzo
2010-11-22, 21:35:59
bild funzt. Ist aber ein völlig unpassendes Bild, da hier Äpfel mit birnen verglichen werden und nicht die topmodelle der jeweiligen Generation.

der vergleich ist aber irreführend, Nehalem ist ein quadcore, der Westmere auf dem Bild ist ein Dualcore mit IGP und Sandybridge ein Quadcore mit IGP. Nehalem ist außerdem sockel 1366, also größer als die anderen beiden packages.

denn Nehalem ist links deutlich im vordergrund, wirkt daher noch größer als er schon ist.
westmere wirkt winzig, ist aber nur ein dualcore und die IGP alleine ist schon 1/3 von Nehalem.

Sandybridge liegt am weitesten von der Kamera entfernt und wirkt daher sehr klein.
Im Vergleich zu westmere/clarkdale ist der Vorspung eklatant, minimal mehr diespace aber doppelt soviele cores.

Die Position von SB ist sehr günstig gewählt, in echt ist er wohl kaum kleiner als Lynnfield, auf dem Bild sieht er aber so aus als würde sogar der dualcore westmere größer sein.

Nightspider
2010-11-22, 21:50:20
aufgrund der DIE-größe wäre sogar ein zusammengepappter 12 core prozessor denkbar.
http://img152.imageshack.us/img152/5333/18a648c865434fc4ab5cbf2.jpg
die 8 core 16 thread version sollte kein großes problem sein. schon erstaunlich wie klein sandy bridge im vergleich doch ist.

edit
bild neu upgeloadet

Was? 12 kerne? Dann wäre das Die in 32nm ja bald doppelt so groß wie der Nehalem und zur Größe des Package würde auch nichtmehr viel fehlen. :ugly:

Undertaker
2010-11-23, 11:24:10
Bei den LGA2011 Modellen fällt allerdings noch die recht große IGP weg.

davidzo
2010-11-24, 00:22:28
aufgrund der DIE-größe wäre sogar ein zusammengepappter 12 core prozessor denkbar.
die 8 core 16 thread version sollte kein großes problem sein. schon erstaunlich wie klein sandy bridge im vergleich doch ist.


Du vergisst den Cache. Viele Cores bedeuten auch viel cache, um sie zu füttern, zwischen den cores hin und her zu schieben und das geteilte Speicherintercace zu kaschieren.
die 8-core SB Version Romley ist gewiss kein Leichtgewicht. Ich rechne mit ca. 2.2-3 Milliarden Transistoren. Alleine der 20MB große L3 cache von Romley hat mehr Transistoren als ein kompletter 6-core Gulftown.

In 32nm sind das locker 400mm². Sowas passt nicht zweimal auf ein package.

Ein 6-core SB die gibts meines Wissens nicht, also gibts auch kein 12-Core MCM, obwohl das wohl analog zu thuban/interlagos denkbar wäre. Thuban ist 346mm² und ein Riese, aber man schaue sich mal den merkwürdigen sockel und das riesige package an, dann wunderts nicht wieso das möglich ist.
Das sieht eher aus als wenn AMD zwei Prozessoren in einer Box verkauft um einen größeren Kühler nutzen zu können statt zwei einzelnen, nicht wie ein gewöhnliches MCM.

Bei den LGA2011 Modellen fällt allerdings noch die recht große IGP weg.

Naja, gulftown hat auch keine IGP und trotzdem 1,7 Milliarden Transistoren.
Die IGP fällt letzendlich nur einmal an und sieht im quadcore schon recht klein aus, in einem octacore fällt sie dagegen gar nicht mehr auf.

Undertaker
2010-11-24, 11:20:16
Recht klein? Die IGP nimmt ganz grob (http://img.clubic.com/photo/02291528.jpg) die Fläche von zwei Kernen inkl. L2 ein. Und wie schon im anderen Thread, Gulftown hat 1,17Mrd, nicht 1,7Mrd Transistoren.

davidzo
2010-11-24, 22:32:56
zwei kerne? wenn du die kerne unbedingt ohne L3 zählen willst bitte. Bei 4-core SB sind es imho unter 20%. Grafik ist imo noch ziemlich unwichtig bei Intel.
Nur so, bei Fusion (Bobcat) ist es mit ca. 80% für die VPU mal eben umgekehrt.

Bei Romley sind das durch den riesigen L3+ Speichercontroller dann nichtmal mehr 8%.
Klar wird man die IGP dort einsparen, aber groß flächen frei für zusätzliche cores werden dadurch nicht...

Undertaker
2010-11-25, 11:21:55
zwei kerne? wenn du die kerne unbedingt ohne L3 zählen willst bitte.

Imho könnte man auch durchaus die Kernzahlen erhöhen, ohne immer gleich den L3 linear vergrößern zu müssen - hat ja auch bei Thuban ohne merkliche Einbußen der Skalierung geklappt. Somit wäre anstatt des 4-Kern Sandy Bridge inkl. IGP z.B. auch ein 6-Kern Modell ohne IGP bei gleicher Die-size und gleicher L3-Menge möglich. 8 Kerne, 12MB L3 und ebenfalls keine IGP sollten nur ~30% größer sein, also durchaus akzeptable ~300mm².

Vermutlich sind die Margen im High-End Bereich allerdings so extrem hoch, dass der reine Herstellungspreis kaum noch ins Gewicht fällt und man es sich so leisten kann, bzgl. L3-Cache gleich in die Vollen zu gehen.

=Floi=
2010-11-25, 18:09:04
man muß auch an die server kunden denken und da lohnt es sich einfach mehr cache zu verbauen.

Chrisch
2010-11-26, 15:08:52
Die Position von SB ist sehr günstig gewählt, in echt ist er wohl kaum kleiner als Lynnfield, auf dem Bild sieht er aber so aus als würde sogar der dualcore westmere größer sein.
Links Sandy Bridge (mobile version), rechts Clarksfield (mobiler Lynnfield)

http://www.abload.de/img/snb-lf-diezgk2.jpg

Dafür das in SNB noch eine IGP integriert ist, ist der größenunterschied schon beachtlich.

Edit: Hier mal nen bissel mit Paint gefummelt und das noch nen bissel deutlicher zu machen (wegen IGP und so)

http://www.abload.de/img/snb-lf-die-1nnri.jpg

dildo4u
2010-11-26, 15:21:26
Jup deutlich kleiner auch wenns davidzo nich passt,das haben doch schon die Preise gezeigt kein 4 Core i7 Modell wird mehr für 500€ verkauft.