Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: Eine erste Prognose zu "Sea Islands" aka AMDs Radeon HD 8000 Serie
Leonidas
2012-06-10, 09:38:53
Link zur News:
http://www.3dcenter.org/news/eine-erste-prognose-zu-sea-islands-aka-amds-radeon-hd-8000-serie
OBrian
2012-06-10, 10:20:16
Mal sehen, wieviele dieser Daten wir in Wochen oder Monaten als "Fakten" um zwanzig Ecken zurück verkauft bekommen...
Tippfehlerchen:
sondern eher der GPGU-Ballast
Das sollte sicher GPGPU heißen, oder?
Leonidas
2012-06-10, 17:37:08
Gefixt.
aufkrawall
2012-06-10, 20:09:49
Wegen dem Frontend: Das limitiert ja scheinend nicht überall.
Dort, wo das aber der Fall ist, könnten doch dann durchaus mehr als 40% drin sein und woanders halt weniger.
mczak
2012-06-13, 04:21:11
Also Pitcairn hat dieselben 2 Raster-Engines wie Tahiti.
Ich weiss nicht ob eine Verdoppelung des Duchsatzes wirklich viel bringen würde (das gilt für alle Chips). Pitcairn/Tahiti kann 2x16 Pixel pro Takt rastern - bei einer Verdoppelung also 2x32 Pixel (man beachte nvidia hat eh schon kleinere Granularität, 4x8 Pixel bei gk104). Die ROPs kriegen aber auch nicht mehr als 32 Pixel pro Takt hin. Mir scheint 3 Raster-Engines bei gleichzeitiger Erhöhung der ROPs auf 48 wäre deutlich sinnvoller - bei dem 384bit Speicherinterface wären 48 ROPs jedenfalls auch kein Overkill.
Gipsel
2012-06-13, 13:01:28
Bei kleinen Dreiecken (<16 Pixel, praktisch eher schon bei <32 Pixel, ist aber ein fließender Übergang) limitieren nicht die ROPs, sondern die Rasterizer den Durchsatz. Die Frage ist, benötigt man überhaupt so viel Füllrate bei großen Dreiecken (wenn auch MSAA wunderbar effizient funktioniert)? Oder benötigt man eher mehr Dreiecksdurchsatz im Peak (Die Dreiecke kommen ja sozusagen in Bursts), wenn mit z.B. nur 1 Quad belegenden (kleinen) Dreiecken man mit 2 Setup/Raster-Einheiten rechnerisch nur die Füllrate von 8 ROPs benötig (oder sagen wir mal 16 bei Verwendung von halfrate Pixelformaten)?
Verdoppelte Rasterizer ohne Anhebung der Setup-Rate steigern dagegen hauptsächlich den Pixeldurchsatz bei großen Dreiecken (die Effiziensteigerung bei kleinen verschwindet). Dies war vielleicht für Cypress noch halbwegs okay, inzwischen halte ich das aber nicht mehr für einen gangbaren Weg. Solange AMD bei den 16 Pixel Rasterizer-Granularität bleibt (das war mal ein natural match für das Füllen einer Wavefront über 4 Takte, genau wie eine Instruktion über 4 Takte ausgeführt wird), geht eine höhere Setup-Rate immer mit einer höheren Rasterleistung einher. Die Frage wäre, ob man durch eine Umstellung auf 8 Pixel Rasterizer wirklich viel spart im Vergleich zu den 16 Pixel-Rasterizern, oder ob die eigentliche Komplexität nicht das Setup ist. Wenn man dort die angestrebte Parallelität hat, sind 8 oder 16 Pixel Rasterizer vom Aufwand her wahrscheinlich nicht mehr ein soo großer Unterschied. Will sagen, 3x16 Pixel könnten billiger sein als 4x8 Pixel und auch vergleichbare Performance liefern (in sehr hohen Auflösungen/größere Dreiecke 3x16 etwas besser, bei kleineren Dreiecken 4x8 etwas besser).
Ich fand Fermis Auslegung mit den zusätzlichen ROPs schon immer bescheuert und es sah eher wie aus der Not (nach Speicherbandbreite) geboren aus. Für zukünftige Workloads macht es meiner Meinung nach eher anders herum Sinn (also mehr Rasterkapazität als ROPs).
Edit:
Also Pitcairn hat dieselben 2 Raster-Engines wie Tahiti.
Ja, das sollte man in der Tabelle korrigieren.
mczak
2012-06-13, 17:16:39
Ich fand Fermis Auslegung mit den zusätzlichen ROPs schon immer bescheuert und es sah eher wie aus der Not (nach Speicherbandbreite) geboren aus. Für zukünftige Workloads macht es meiner Meinung nach eher anders herum Sinn (also mehr Rasterkapazität als ROPs).
Naja also das ist bei Kepler prinzipiell auch nicht gross anders, wobei es die unsinnigste Kombination (gf116, 1x8 Pixel Rasterkapazität und 24 ROPs) immerhin nicht mehr gibt. Nur gk104 hat gleich viel Rasterkapazität wie ROPs alle anderen Chips weniger (glaube ich jedenfalls 100% sicher bin ich nicht) - die Hälfte bei gk106/gk107, 5/6 bei gk110. Gut über alles gesehen ist das schon eine Verbesserung, ist wohl genau gleich wie bei Fermi aus der Not geboren. Aber Pitcairn/CapeVerde sollten da einen deutlichen Vorteil haben gegenüber gk106/gk107 (1 bzw. 2x16 gegenüber 1 bzw. 2x8 Pixel) was wohl auch mit dazu beiträgt dass da offenbar nvidia mit diesen Chips nicht an die Performance herankommt (im Gegensatz dazu hat dann aber gk104 mit 4x8 einen Vorteil gegenüber den 2x16 von Tahiti).
Jedenfalls denke ich für die Pitcairn/CapeVerde Nachfolger braucht da nicht gross was verändert zu werden, nur beim High-End Chip sollte was gehen.
Leonidas
2012-06-13, 17:48:23
Ja, das sollte man in der Tabelle korrigieren.
Ist gefixt.
vBulletin®, Copyright ©2000-2025, Jelsoft Enterprises Ltd.