PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: Weitere Informationen zu Intels Xeon Phi


Leonidas
2012-08-04, 11:08:28
Link zur News:
http://www.3dcenter.org/news/weitere-informationen-zu-intels-xeon-phi

pool1892
2012-08-04, 12:48:48
hi, ist beim vergleich von gk110 und knights corner (oder meinetwegen xeon phi) schon was über die effektiven speicherlatenzen bekannt? schließlich hat intel da mehrere vorteile: erfahrung, mehr caches, bessere controllertechnologie, sogar breiterer bus.
je universeller die beschleuniger, je eher könnte latenz und nicht mehr nur durchsatz limitieren - oder sehe ich das falsch?
gerade in anbetracht der tatsache, dass nvidia dynamic parallelism als großes (und wirklich bedeutendes) neues feature einführt, die gpgpus also immer autonomer werden und damit auch mehr "entscheidungen" treffen müssen, also sprünge erzeugen.
EDIT: ich vergaß: intels compiler sind darüber hinaus sehr gut darin, latenzen zu verstecken - das hat mich über die Jahre immer mal wieder verblüfft - allerdings habe ich keine ahnung, was nvidia da kann bzw. wie schwer das zu bauen ist.

Spasstiger
2012-08-04, 12:53:33
Es werden 2, 4 oder 8 GiB Speicher bei Xeon Phi sein, nicht 3, 6 oder 8 GiB.
Außerdem passen die 1,3 TFlops nicht zu 61 Cores @ 1,1 GHz. Dazu müsste jeder Core 11,7 DP-FMAs oder mehr parallel beherrschen, es sind aber sehr wahrscheinlich nur 8 DP-FMAs pro Core. Somit kommt man mit 61 Cores @ 1,1 GHz auf eine Rechenleistung von 1074 GFlops.
Intel wird die Varianten aber vermutlich so aufstellen, dass sie gerade die 1 TFlops peak garantieren können, d.h. die Variante mit 61 Core wird vielleicht nur mit den 1,05 GHz takten.

Oberst
2012-08-04, 12:58:10
Hallo,
die Rechenleistung von GK110wäre schon sehr komisch. Entweder liegt die DP Leistung auf 1/2SP, oder 1/4. Auf 1/3 wäre ein sehr ungewöhnlicher wert, man müsste da 6 Shader für 2 Aufgaben zusammen schalten (wie sollte man sonst auf 1/3 kommen). Das gab's bisher noch nie.
Zusätzlich sollte man noch erwähnen, dass AMDs Tahiti bereits heute bis zu 4TFlops in SP bietet und in den FirePro Modellen wohl mit DP = 1/2SP arbeitet, also mit 2TFlops.
Dessen Nachfolger wird ja auch in dem Zeitraum antreten, der dürfte wohl noch mal ca.30%-40% schneller sein (Vermutung).
M.f.G.

Spasstiger
2012-08-04, 13:02:49
die Rechenleistung von GK110wäre schon sehr komisch. Entweder liegt die DP Leistung auf 1/2SP, oder 1/4. Auf 1/3 wäre ein sehr ungewöhnlicher wert, man müsste da 6 Shader für 2 Aufgaben zusammen schalten (wie sollte man sonst auf 1/3 kommen). Das gab's bisher noch nie.
Das 1:3-Verhältnis kommt von Nvidia selbst, ist also bestätigt: http://www.nvidia.com/content/PDF/kepler/NVIDIA-Kepler-GK110-Architecture-Whitepaper.pdf.
Und die Tahiti-basierenden Fire Pros haben ein 1:4-Verhältnis, nicht 1:2: http://pics.computerbase.de/4/1/9/6/6/2.jpg.

Gipsel
2012-08-04, 14:41:51
Außerdem passen die 1,3 TFlops nicht zu 61 Cores @ 1,1 GHz. Dazu müsste jeder Core 11,7 DP-FMAs oder mehr parallel beherrschen, es sind aber sehr wahrscheinlich nur 8 DP-FMAs pro Core. Somit kommt man mit 61 Cores @ 1,1 GHz auf eine Rechenleistung von 1074 GFlops.Ganz genau.
Bei den früher veröffentlichten Werten, die Leo hochgerechnet hat um auf die ~1,3 TFlop/s zu kommen, muß man beachten, daß das die Leistung eines kompletten Knotens ist, also inklusive der CPU. Ohne die paßt es dann auch.

Leonidas
2012-08-04, 15:12:35
Ganz genau.
Bei den früher veröffentlichten Werten, die Leo hochgerechnet hat um auf die ~1,3 TFlop/s zu kommen, muß man beachten, daß das die Leistung eines kompletten Knotens ist, also inklusive der CPU. Ohne die paßt es dann auch.


Aaaahh ... mein Fehler. Ich rechne das nochmal neu aus.

Oberst
2012-08-05, 13:00:28
Das 1:3-Verhältnis kommt von Nvidia selbst, ist also bestätigt
Hallo,
irgendwie ist die GK110 Architektur komisch...danke für den Link und den Hinweis bezüglich Tahiti.