PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : NEC: Projekt Aurora


Skysnake
2016-11-22, 06:31:57
Da es scheinbar noch keinem aufgefallen ist, übernehme ich das mal hiermit.

Heise hat eine News zum Projekt Aurora von NEC gebracht, mit der Sie exklusiv waren/sind.

Projekt Aurora ist das Nachfolgerprojekt der NEC SX-ACE, welche ein Vektorrechner ist. Es gab schon länger Gerüchte dazu, das es irgendetwas mit Erweiterungskarten/Boostern zu tun haben soll. Auf der SC16 war wohl nun eine Karte ausgestellt (thermal design dummy?) und es gab auch einige Informationen dazu.

Die News von Heise hat allerdings so manchen Fehler bezüglich der SX-ACE, daher würde ich die Daten mit einer gewaltigen Menge Salz zu mir nehmen. Vor allem auch, da es sich bei der News/Aussagen scheinbar eher um einen Unfall handelt. Von NEC selbst gibt es nämlich keinerlei Infos und auch ansonsten gibt es keinerlei Meldungen dazu.

http://www.heise.de/newsticker/meldung/NEC-Supercomputer-Aurora-x86-Cluster-mit-Vektorkarten-3492298.html

konkretor
2016-11-22, 18:47:54
Ein Stück Hardware was bei mir den Hardware Dämon reizt, will haben.

Sicherlich wird es für den normale nicht zu haben sein, oder elendes Spezial sei um überhaupt in Betrieb genommen zu werden.



Damals mußte ich kaufen

https://www.computerbase.de/2015-01/intel-xeon-phi-31s1p-fuer-125-statt-1.991-us-dollar/

Skysnake
2016-11-22, 19:45:34
Würde ich nicht unbedingt sagen. Das Ding sieht verdammt auf "lowcost" getrimmt aus. Keinerlei Vergleich zu den SX Systemen bisher.

Ich würde nicht erwarten, dass das Ding teurer wird als ne GPU oder nen XeonPhi.

Skysnake
2017-08-31, 10:23:04
https://www.slideshare.net/BostonDE/cpu-update-juni-2017 slide 21
https://translate.google.com/translate?hl=de&sl=ru&tl=de&u=https%3A%2F%2Fservernews.ru%2F954503

Die Karte sieht damit wahrscheinlich wie folgt aus:


8-10 Cores
300/150 GFLOPs SP/DP
1,5 TB/s Memory Bandbreite -> 6 HBM2 stacks
24 bzw 48 GB RAM (wenn wir von HBM2 mit 4 bzw 8 GB stacks ausgehen)

Entropy
2017-09-05, 00:10:06
Nur 300 GFLOPs SP bei 1.5 TB/s ? Ist das ein Vertipper?

Was meinen die Slides bei Skylake 28 Core und 112 Threads? 4x SMT?

mksn7
2017-09-05, 11:23:56
Das stimmt wohl tatsächlich so... Die Vektorrechner haben eine enorm niedrige Machinebalance. In diesem Fall 0.2 Flops/B, was genau in dem Bereich von stream-artigen Workloads ist. Obwohl die Peakperformance nicht besonders beeindruckend ist, kann die Hardware sie in sehr vielen Workloads erreichen.

Skysnake
2017-09-05, 21:36:30
@Entropy:
300/150 GFLOPs SP/DP pro Core

Das hätte ich eventuell dazuschreiben sollen. Aber man kann auch in die Links schauen, da hätte das klar werden sollen ;)

An sich kann ein Core wohl 150 GB/s an Memorybandbreite erreichen, soweit ich das richtig gesehen habe.

Bei den Skylakes, musst du an 2x28 Cores = 56 physical cores * 2-fach SMT = 112 Threads denken ;)

@mksn7
Ja, Vektorrechner haben eine gutes Byte Memory Bandwidth /FLOPs Verhältnis, aber das ist schon seit der SX-ACE bei 1:1

Also so gut wie früher einmal ist es nicht mehr. Wobei bei der SX-ACE das auf 4:1 geht, wenn man nur einen Core nimmt. Also 256GB/s Memorybandbreite bei 64 GFLOPs. Das ist schon nicht schlecht, allerdings muss der Code auch vektorisieren, was nach der Dominanz der skaleren x86 Chips etwas zu wünschen übrig lässt....

Vektorisierung wird erst seit AVX und insbesondere jetzt mit AVX512 wieder deutlich wichtiger, und meiner Erfahrung nach tun sich die Leute unglaublich schwer damit.

Die 2000er haben eine ganze Generation an Entwicklern total verhunzt. Da sind viele bei raus gekommen, die noch immer denken, Moores Law hält für immer an, und das die SingleThread-Leistung weiter ansteigt, oder wenn das nicht, dann zumindest immer mehr cores kommen, was ja auch durchaus stimmt, aber wir haben jetzt schon 8er Vektoren in x86 mit AVX512, und es wird eher nicht weniger werden.

Skysnake
2017-10-26, 16:06:15
Sodele. NEC hat gestern offiziell die SX-Aurora Tsubasa vorgestellt.

Hier ein paar links dazu. Interessant sind der Preis von 1,7 Mio Yen,also rund 12.750 €, und das man "nur" auf 1,2 TB/s an Bandbreite kommt. Das ist schon erstaunlich. Vor allem ist man damit bei HBM2 weiter weg von den specs als amd und nVidia wenn ich es richtig im Kopf habe.

Schon ein ziemliches Monster an Die. Das sind 3! HBM2 stacks auf einer Seite quer:ugly:

Wenn ich mal zeit habe werde ich mich mit Stift und Papier hinsetzen. Ich habe den Verdacht, dass der Die zu groß ist um ihn auf einmal zu belichten.

https://cloud.watch.impress.co.jp/docs/news/1088/194/amp.index.html

https://translate.googleusercontent.com/translate_c?depth=1&nv=1&rurl=translate.google.com&sp=nmt4&tl=de&u=https://cloud.watch.impress.co.jp/docs/news/1088/194/amp.index.html&usg=ALkJrhikLzxuI__bomeVQU0Rltd1UYmNOA

https://www.hpcwire.com/off-the-wire/nec-releases-new-high-end-hpc-product-line-sx-aurora-tsubasa/

Loeschzwerg
2018-08-22, 10:15:44
Den NEC Beitrag der HC2018 dürfen wir auch nicht unterschlagen:
https://www.anandtech.com/show/13259/hot-chips-2018-nec-vector-processor-live-blog

Klasse dass Ian fleißig jede Präsentation mitnimmt =)

y33H@
2018-08-22, 14:03:24
Cascade Lake hat er unterschlagen :ugly:

Loeschzwerg
2018-08-22, 16:16:23
Da gibt es doch auch einen Beitrag :D
https://www.forum-3dcenter.org/vbulletin/showthread.php?p=11776032#post11776032

Skysnake
2018-08-22, 19:27:01
Das Ding ist schon nicht schlecht. Aber der Code muss halt zwingend vektorisieren...

Trotzdem kann ich jedem in dem Umfeld nur anraten mal mit so einem Ding zu arbeiten. Selbst wenn man mit x86 schneller bzw kosten effizienter ist, so verbessert sich das Verständnis für den Code, was Mittel und langfristig auch x86 helfen wird. Denn die Vektoren werden nicht kürzer

Loeschzwerg
2018-08-22, 19:56:27
Gibt es die Karten eigentlich einzeln zu kaufen? Ähnlich wie XeonPhi?

Skysnake
2018-08-22, 20:01:09
Boah gute Frage. Keine Ahnung. Es gibt ja einen Desktop und dir 1 bis 4u server mit 1 bis 8 Karten.

Wenn man ganz lieb nach ner einzelnen Karte inklusive Software fragt gibt es die aber sicherlich auch

Loeschzwerg
2018-08-22, 20:07:52
Hm, für eine hybride Landschaft könnte so ein Beschleuniger durchaus eine Option sein. Nicht unspannend.

mksn7
2018-08-23, 10:23:03
Müsste man kaufen können. Wir haben hier im Rechenzentrum zwei Stück. Vielleicht braucht man aber schon Kontakte zu NEC

Skysnake
2018-08-23, 13:45:59
Einfach bei NEC Deutschland in Düsseldorf melden. Da werden Sie geholfen ;)

Loeschzwerg
2018-08-23, 18:28:00
:up: Danke euch