PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : GPGPU mit integrierten Grafikeinheiten


kunibätt
2011-11-29, 20:50:06
Angenommen für eine Anwendung wäre nicht nur der Durchsatz sondern auch die Latenz ausschlaggebend. Könnten dann Szenarien entstehen, in denen eine HD3000 (halt das integrierte Intelzeug) durch die physikalische Nähe zum Prozessor, Karten wie eine GTX5XX am 16x PCie abhängen?

ndrs
2011-11-30, 09:26:41
Ja.

hell_bird
2011-11-30, 17:56:30
Ich würde sagen begrenzt. Immerhin müssen die Daten komplett über den Speicher laufen, da es keinen gemeinsamen Cache oder direkte Verbindung gibt. Außerdem muss die Aufforderung loszurechnen durch Bibliotheken / Treiber durchgereicht werden. Alle Angaben ohne Gewähr.

ndrs
2011-11-30, 18:24:39
Bei Intel ist die GPU mit an den L3-Cache angebunden.

Skysnake
2011-11-30, 19:34:32
Ja je nach Aufgabe bist du deutlich schneller. Je weniger du pro Datenzugriff berechnest, desto besser stehen die Chancen, mit der iGPU schneller zu sein. Bei AMD siehts aber allgemein deutlich besser aus als bei Intel.

hell_bird
2011-11-30, 19:43:18
Kannst du eine Größenordnung nennen?

Coda
2011-11-30, 19:56:02
Bei Intel ist die GPU mit an den L3-Cache angebunden.
Erst ab Ivy Bridge.

deekey777
2011-11-30, 20:15:16
Erst ab Ivy Bridge.
Und erst ab Ivy Bridge ist die Grafikeinheit überhaupt GP-fähig, oder?

ENKORE
2011-11-30, 20:21:08
Hat auch schon vorher Shader gehabt, also lief auch mindestens DirectCompute.

Coda
2011-11-30, 20:54:52
Und erst ab Ivy Bridge ist die Grafikeinheit überhaupt GP-fähig, oder?
Korrekt.

Hat auch schon vorher Shader gehabt, also lief auch mindestens DirectCompute.
Nope. DirectCompute auf D3D10-Hardware ist optional.

ndrs
2011-12-01, 09:51:51
Erst ab Ivy Bridge.
Sicher? Dann sind wohl etliche Artikel fehlerhaft. Hab einfach, weil ichs so im Gedächtnis hatte mal nach "sandy bridge gpu shared l3 cache" gegoogelt und hatte passende Ergebnisse bei u.a. Wikipedia, techspot, legionhardware, realworldtech, cpu-world, anandtech, computerbase, ht4u ...

Naitsabes
2011-12-01, 14:41:27
afaik zwackt sich die igpu einfach einen Teil des L3 ab, der dann nicht wirklich mit den Kernen geshared wird...

Coda
2011-12-01, 14:53:10
Sicher? Dann sind wohl etliche Artikel fehlerhaft. Hab einfach, weil ichs so im Gedächtnis hatte mal nach "sandy bridge gpu shared l3 cache" gegoogelt und hatte passende Ergebnisse bei u.a. Wikipedia, techspot, legionhardware, realworldtech, cpu-world, anandtech, computerbase, ht4u ...
Intel hat das gesagt als sie Ivy Bridge vorgestellt haben. Ich habe das aber auch schon wo anders gelesen. Ergibt eigentlich auch Sinn, denn ohne Compute bringt einer GPU eigentlich Cache nicht viel.

Natürlich hängt die GPU am Ring, sonst hätte sie keinen Zugriff auf den Speicher-Controller, aber soweit ich weiß wird der L3 nicht verwendet.

ndrs
2011-12-01, 17:09:51
Ok, ich hätte las nächstes Argument gebracht, dass bei hoher CPU-Last auch die GPU langsamer wird, was irgendwo mal gezeigt wurde. Aber das kann natürlich auch für einen ausgelasteten Ringbus sprechen. Muss also nix mit shared Cache zu tun haben. Danke für die Klarstellung.

Coda
2011-12-02, 19:02:20
Das kann vor allem auch einfach für ein ausgelastetes Speicherinterface sprechen ;)

RavenTS
2011-12-03, 13:52:18
...
Nope. DirectCompute auf D3D10-Hardware ist optional.


Sind INTeL-GPUs nicht derzeit noch aus Treibergründen auf D3D9 Niveau begrenzt?

Das kann vor allem auch einfach für ein ausgelastetes Speicherinterface sprechen ;)


Wobei dies ja aufgrund der 3 (bald 4) Speicherkanäle ja eigentlich nur eher weniger ins Gewicht fallen sollte.?!

Gipsel
2011-12-03, 13:54:29
Sind INTeL-GPUs nicht derzeit noch aus Treibergründen auf D3D9 Niveau begrenzt?Nur beim Atom.

Skysnake
2011-12-03, 14:55:31
Wobei dies ja aufgrund der 3 (bald 4) Speicherkanäle ja eigentlich nur eher weniger ins Gewicht fallen sollte.?!
Definitiv nicht, schau dir mal das Speicherinterface einer dezidierten GPU an. Wenn du die Leistung der iGPU erhöhst, dann brauchst du massiv mehr an Bandbreite. Bei den dezidierten GPUs ist das Speicherinterface ja heute schon unterdimensioniert bei recht vielen Anwendungen.

Naja und die iGPU muss sich die Bandbreite immer teilen mit der CPU.... Also genug Bandbreite hast du da eigentlich nie, denn wenn du die Bandbreite erhöhst kannst du zur Not die Caches wieder etwas kleiner machen oder einfach die Leistung/Anzahl der ALUs erhöhen.

Coda
2011-12-03, 19:10:24
Wobei dies ja aufgrund der 3 (bald 4) Speicherkanäle ja eigentlich nur eher weniger ins Gewicht fallen sollte.?!
He? Intel CPUs mit IGP haben alle zwei Speicherkanäle.