PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: Hardware- und Nachrichten-Links des 6. August 2012


Leonidas
2012-08-06, 17:13:16
Link zur News:
http://www.3dcenter.org/news/hardware-und-nachrichten-links-des-6-august-2012

OBrian
2012-08-07, 08:41:55
Eine reguläre GeForce GTX 660 Ti mit 2 GB Speicher hat immer das Problem, daß 1,5 GB dieses Speichers mit den vollen 192 Bit DDR des Speicherinterfaces angebunden sind, die restlichen 0,5 GB aber dann nur noch vergleichsweise schwach mit 64 Bit DDR. Ich weiß nicht, ob man das so rechnen kann. Wenn man sechs 32-bit-Kanäle mit Chips bestückt, braucht man doch nur zwei davon mit doppelt so großen zu versorgen. Theoretisch ist dann die Hälfte des RAMs mit halber Bandbreite angebunden, wenn man Bits pro MB rechnet. Was aber Quatsch ist, weil ja nicht der ganze Chip auf einmal ausgelesen wird (sonst müßte man auch sagen, daß ein 16-GB-USB-Stick nur halb so schnell ist wie ein 8-GB-Stick gleicher Bauart). Praktisch ist das also nicht spürbar.

Spasstiger
2012-08-07, 09:34:49
@OBrian: Bei der GTX 550 Ti 1 GiB ist der Nachteil durch die unsymmetrische Speicheranbindung schon sichtbar. Der Einbruch bei hohen Auflösung + AA ist kleiner als bei einer GTX 460 768 MiB, aber größer als bei einer GTX 460 1 GiB. So wie man es auch erwartet.
/EDIT: Hier der passende Test: http://www.computerbase.de/artikel/grafikkarten/2011/test-3x-nvidia-geforce-gtx-550-ti-sli/24/.
In 1680x1050 ohne AA liegt die GTX 460 768 noch 19% vor der GTX 550 Ti, in 1920x1080 mit 8xAA bleibt der GTX 460 768 aber nur noch ein Vorsprung von 7%. Die GTX 460 1024 dagegen baut ihren Vorsprung gegenüber der GTX 550 Ti von 25% auf 38% aus.

Meines Wissens nach laufen die einzelnen 64-Bit-Speichercontroller unabhängig voneinander, so dass es auch bei symmetrischer Bestückung vorkommen kann, dass ein Datensatz nur mit 64 Bit Datenbreite angefordert wird. Im Idealfall haben alle Speichercontroller parallel Arbeit. Die unsymmetrische Bestückung an einem 192-Bit-SI führt dazu, dass ein 64-Bit-Speichercontroller häufiger gefordert ist als die anderen beiden 64-Bit-Controller und somit letztere häufiger pausieren müssen.
Die effektive Bandbreite sinkt gegenüber symmetrischer Bestückung. Wie stark genau, müsste man mal untersuchen. Auf jeden Fall gibt es einen bei der Spieleperformance mess- und teilweise sichtbaren Effekt wie oben gezeigt.

P.S.: Da die MSI GTX 660 Ti Hawk Edition 3 GiB VRAM hat, gehe ich bei der Referenzversion von 1,5 GiB und nicht von 2 GiB aus.

Leonidas
2012-08-07, 10:26:45
Die unsymmetrische Bestückung an einem 192-Bit-SI führt dazu, dass ein 64-Bit-Speichercontroller häufiger gefordert ist als die anderen beiden 64-Bit-Controller und somit letztere häufiger pausieren müssen.
Die effektive Bandbreite sinkt gegenüber symmetrischer Bestückung.




Das ist doch mal eine schöne Erklärung.



Und um die Rechnung mal aufzumachen:
1 GB hängen an 64 Bit
1 GB hängen an 128 Bit.

Gehen wir davon aus, daß beide Speicherbereiche gleich häufig benutzt werden, der Treiber also nicht intelligent die Last zur besseren Speicheranbindung schiebt. Dann ist dieses Speicherinterface exakt zu 75% effizient wie der Idealzustand, daß beide Speicherteile jeweils an 128 Bit hängen.

Im konkreten Fall eines 192-Bit-Interfaces würde das bedeuten: Effekt wie von einem 144-Bit-Interface.


Oder? Andere Meinung? Rechenfehler gefunden?

Spasstiger
2012-08-07, 16:04:24
Effektive 160 Bit SI-Breite müssten es sein.
Auf ein Viertel des Speichers wird mit 64 Bit effektiv zugegriffen, auf drei Viertel des Speichers mit 192 Bit:
0,25*64+0,75*192=160.
Anders gesagt reduziert sich die effektive Speicherbandbreite um knapp 17%.

/EDIT: Wobei, vielleicht hab ich da einen Denkfehler. Ich glaube, die effektive SI-Breite reduziert sich sogar auf 128 Bit.
Ich versuche mal, eine Analogie zu schaffen:
In einem produzierenden Betrieb gibt es vier gleich große Lagerbereiche, in denen jeweils unterschiedliche Plastikteile lagern. Pro Produktionszyklus wird aus jedem Lager eine Palette benötigt. Ursprünglich war für jeden Lagerbereich ein Transporteur zuständig, aber weil das Management Geld sparen will, haben sie einem der Transporteure gekündigt. Hans Wurst hat jetzt zwei Lagerbereiche. Zunächst liefern alle drei Transporteure jeweils eine Palette aus. Hans Wurst muss aber nochmal los, um die Palette aus Lager 4 zu holen. Damit dauert es im Endeffekt doppelt so lange bis die Paletten aus dem Lager für einen Produktionszyklus ausgeliefert sind. Übertragen auf das Grafikkartenproblem entspricht die Lagergröße der Speicherkapazität und die Transporteure entsprechen den Speicherinterfaces. Die Produktionszyklen entsprechen den Frames. Vier Transporteure stehen für ein 256-Bit-SI und wenn es mit drei Transporteuren (192 Bit) doppelt so lange wie mit vier dauert, dann hat man effektiv nur noch ein 128-Bit-SI.

/EDIT2: Die effektiven 128 Bit müssten auch zutreffen, wenn man eine Warteschlange abarbeitet und nur eine begrenzte Anzahl an Aufträgen im Voraus ausführen kann, um die brachliegenden Speicherinterface zu beschäftigen. Hab das eben auf Papier durchgespielt. Ich leg mich zu 95% auf die effektiven 128 Bit fest. Das gilt aber natürlich nur für den Fall, dass die 1 GiB VRAM auch voll genutzt werden, dass permanent Speicherzugriffe stattfinden und auf jeden Speicherbereich im Schnitt gleichhäufig zugegriffen wird. Die effektive Speicherbandbreite müsste in diesem Fall um 33% gegenüber einer Karte mit symmetrischer Speicherbestückung absinken (192 Bit -> 128 Bit).

/EDIT3: Meine Vermutung wird durch Benchmarks bestätigt: http://www.anandtech.com/show/4221/nvidias-gtx-550-ti-coming-up-short-at-150/2.
Mit den Taktraten der GTX 460 erreicht die GTX 550 Ti eine Speicherbandbreite von 33,5 GB/s. Die GTX 460 768 bringt es mit gleicher Interfacebreite (192 Bit) und gleichen Taktraten auf 54,7 GB/s. Die effektive Bandbreite bricht durch die unsymmetrische Bestückung also um 39% ein, was ja gut mit den von mir vermuteten 33% übereinstimmt. Dass die Differenz noch etwas größer ist, liegt natürlich daran, dass in dem Test nicht die gleichen GPUs verglichen wurden. Die GTX 550 Ti könnte auch bei symmetrischer Bestückung und identischen Taktraten nicht die gleiche Speicherbandbreite wie die GTX 460 768 abrufen, weil der GK116 intern etwas limitierter ist als der GK114. Bereinigt um diesen Einfluss dürften ziemlich genau die prognostizierten 33% rauskommen.
Und der Vergleich mit der GTS 450 in dem Test zeigt ja auch, dass sich die GTX 550 Ti wirklich so verhält, als hätte sie ein 128-Bit-Speicherinterface, denn hier sind die Chips von der Architektur her identisch und bei gleichen Taktraten werden auch die gleichen Speicherbandbreiten gemessen.

Leonidas
2012-08-07, 17:54:50
Ist ja grässlich. Bisher dachte ich, da existiert nur ein Problem, wenn man mehr als 1,5GB Speicher nutzt. Aber so wie vorstehend ausgeführt, ist die Grafikkarte schon ab dem ersten MB Speicher gehandicapt.

Demzufolge fahren die Käufer einer 660Ti 1,5GB sogar richtig besser als die Käufer einer 660Ti 2GB.

Oder?

Spasstiger
2012-08-07, 18:07:36
Bei einem einigermaßen cleveren Speichercontroller sollte die Bandbreite eigentlich erst einbrechen, wenn mehr als 768 MiB von 1 GiB bzw. 1,5 GiB von 2 GiB belegt werden. Aber in dem Benchmark wurden ja nur 325 MiB genutzt. :conf2:
Trotz allem: 2 GiB an einem 128-Bit-GDDR5-SI sind immer noch besser als 1,5 GiB an einem 192-Bit-GDDR5-SI und 0,5 GiB an PCIe.

P.S.: Kepler könnte sich in dem Punkt völlig anders verhalten als Fermi, schließlich wurde der Speichercontroller laut Nvidia von Grund auf neu entwickelt. Ist nur die Frage, ob das mit dem neu entwickelt auch auf die logische Funktion bezogen ist oder nur auf die elektrische Umsetzung.

Ronny145
2012-08-07, 18:21:17
2GB @192 Bit sind nichts Halbes und nichts Ganzes. Schade, dass Nvidia immer so knausert. Muss sich noch genau zeigen, wie stark das Defizit in der Praxis ausfällt. Für mich eher uninteresant die Karte.

boxleitnerb
2012-08-07, 18:44:28
Finds auch schade, die Leute kaufen es aber trotzdem. 256bit sollten im Mainstream langsam Standard sein, immerhin gibts das schon seit 2002 mit der Radeon 9700 Pro :D
Würde die Chips ein bisschen größer machen und etwas mehr verbrauchen (kann man abschätzen, wieviel?), aber Kepler scheint ja gut an der Bandbreite zu hängen. Verstehe auch nicht, warum Nvidia sich da so ins Bein schießt.

AnarchX
2012-08-07, 19:02:34
Mit der 192-Bit Version kann man wohl das Yield deutlich erhöhen. Pitcairn hat wohl mögich etwas mehr Redundanz im Bereich ROPs/SI.

Knuddelbearli
2012-08-07, 22:09:26
256bit wird nie Mainstream werden da die Breite total egal ist solange es passenden Speicher gibt

Ronny145
2012-08-07, 22:50:00
Bis zu welchem Preis geht bei dir der Mainstream? Für mich sind Karten wie die GTX 560 oder HD6950 Mainstream und die haben ein 256 Bit Interface. Geht sogar noch billiger, siehe HD6850 für 120€. Wir können noch weiter zurückgehen: HD4850, 9800GT, GTS 250, GTX 460. Und die 660 Ti liegt preislich wohl über diesen Karten. 256 Bit sind nichts besonders gewesen, trotzdem geht Nvidia zurück. Wenn man bedenkt, dass die Rechenleistung der GTX 660 Ti etwa im Bereich der GTX 580 liegt, ist das schon derbe. Entweder knausert Nvidia am Speicher oder jetzt am Interface. AMD ist lange nicht so knausrig beim Interface/VRAM.

Knuddelbearli
2012-08-08, 21:12:46
meinte natürlich im Mainstream Standard werden

hängt imemr vom speicher ab der gerade verfügbar ist