SWARM Multicore Architecture [Archiv]

Archiv verlassen und diese Seite im Standarddesign anzeigen : SWARM Multicore Architecture

mboeller

2016-06-20, 15:11:58

beim MIT haben sie eine neue(?) Multicore Architecture entwickelt; SWARM.

Links:

http://people.csail.mit.edu/emer/

edit: http://people.csail.mit.edu/mcj/ (Links zu 1-2 weiteren PDF)

edit: http://techxplore.com/news/2016-06-world-processor-chip.html gehört nicht zu der News

http://news.mit.edu/2016/parallel-programming-easy-0620

https://www.computer.org/csdl/mags/mi/preprint/07436649.pdf

Der Speedup für ein 64-Core System schaut im Vergleich zu einer Software-Lösung IMHO gut bis sehr gut aus (im PDF auf Seite 9 sind ein paar Charts).

ABSTRACT
The authors present Swarm, a parallel architecture that exploits ordered parallelism, which is abundant but hard to mine with current software and hardware techniques. Swarm programs consist of short tasks, as small as tens of instructions each, with programmer-specified order constraints. Swarm executes tasks speculatively and out of order and efficiently speculates thousands of tasks ahead of the earliest active task to uncover enough parallelism. Several techniques allow Swarm to scale to large core counts and speculation windows. The authors evaluate Swarm on graph analytics, simulation, and database benchmarks. At 64 cores, Swarm outperforms sequential implementations of these algorithms by 43 to 117 times and state-of-the-art software-only parallel algorithms by 3 to 18 times. Besides achieving near-linear scalability, Swarm programs are almost as simple as their sequential counterparts, because they do not use explicit synchronization.

edit:

IMHO auch witzig:

Cores: 64 cores in 16 tiles (4 cores/tile), 2GHz, x86-64 ISA, IPC-1 except misses and Swarm instructions

L1 caches 16 KB, per-core, split D/I, 8-way, 2-cycle latency
L2 caches 256KB, per-tile, 8-way, inclusive, 7-cycle latency
L3 cache 16MB, shared, static NUCA [40] (1MB bank/tile),
16-way, inclusive, 9-cycle bank latency

Rabiata

2016-06-20, 19:12:20

beim MIT haben sie eine neue(?) Multicore Architecture entwickelt; SWARM.
[...]
Der Speedup für ein 64-Core System schaut im Vergleich zu einer Software-Lösung IMHO gut bis sehr gut aus (im PDF auf Seite 9 sind ein paar Charts).
Der Chart, in dem eine 117fache Beschleunigung für Swarm bei 64 Cores angegeben wird, erscheint mir verdächtig.
Das wäre eine Skalierung, die mehr Leistung pro Core hergibt als die traditionelle serielle Lösung. Ob das sein kann... :rolleyes:

mboeller

2016-06-20, 20:56:16

Der Chart, in dem eine 117fache Beschleunigung für Swarm bei 64 Cores angegeben wird, erscheint mir verdächtig.
Das wäre eine Skalierung, die mehr Leistung pro Core hergibt als die traditionelle serielle Lösung. Ob das sein kann... :rolleyes:

angeblich kann es so sein weil Larger systems have larger queues and caches, which affect speedups and sometimes cause superlinear scaling.

Also nicht ganz koscher, aber auch nicht wirklich falsch.

Link: http://delivery.acm.org/10.1145/2840000/2830777/p228-jeffrey.pdf?ip=89.144.205.82&id=2830777&acc=AUTHOR%2DIZED&key=4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E69E5B956E41431A9&CFID=803533960&CFTOKEN=37240940&__acm__=1466448973_3b080ef0d15017fb40f8a28daccb403d

ich kann nicht versprechen, dass der Link funktioniert.

Gefunden hier: http://people.csail.mit.edu/mcj/

Unter "A Scalable Architecture for Ordered Parallelism" Den [text] Link anklicken

mboeller

2017-07-03, 15:35:33

SWARM heißt jetzt FRACTAL und funktioniert anscheinend noch ein wenig besser.

Links:

https://phys.org/news/2017-07-greatly-common-parallel-computing-algorithms.html

http://news.mit.edu/2017/speedup-parallel-computing-algorithms-0630

http://people.csail.mit.edu/sanchez/papers/2017.fractal.isca.pdf

basix

2017-07-03, 18:20:52

Wenn es wirklich funktioniert, wäre das ein sehr interessanter Performance Boost quer über praktisch alle Applikationen hinweg. Die Frage ist, ob die nur bei einzelnen Tasks klappt oder wie bei einer CPU eben generell.