PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: Ergibt die "krumme" Speicherkonfiguration der GeForce GTX 660 Ti ...


Leonidas
2012-08-19, 14:33:40
Link zur News:
http://www.3dcenter.org/news/ergibt-die-krumme-speicherkonfiguration-der-geforce-gtx-660-ti-2gb-irgendwelche-performance-nac

AnarchX
2012-08-19, 15:27:31
Nur unter sehr speziellen Konstellationen kann es zur Situation kommen, daß die Karte agiert, wie als hätte sie nur ein 128 Bit DDR breites Speicherinterface – bislang ist eine solche Konstellation aber nur in einem von zehn GPU-Computing-Benchmarks aufgetreten, unter Spiele-Benchmarks wie gesagt bislang noch überhaupt nicht.
Sollten es nicht eher ~160-Bit sein bei maximaler Speicherauslatung: 0,75*144GB/s+0,25*48GB/s -> 120GB/s @ 6Gbps => 160-Bit?

Codas CS-Benchmark@16x16 deutet wohl auch in diese Richtung hin.

Spasstiger
2012-08-21, 09:12:39
Sollten es nicht eher ~160-Bit sein bei maximaler Speicherauslatung: 0,75*144GB/s+0,25*48GB/s -> 120GB/s @ 6Gbps => 160-Bit?
Die Rechnung haut so nicht hin. Ich hatte an zwei Stellen erklärt, warum die effektive Busbreite auf 128 Bit absinken müsste:

http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9429465&postcount=21
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9416123&postcount=5

Von jedem Speicherbaustein muss ein Datensatz geladen werden. Im ersten Durchgang lesen die drei 64-Bit-Controller von 6 Speicherbausteinen simultan. Im zweiten Durchgang lädt ein 64-Bit-Controller von den verbleibenden zwei Speicherbausteinen, die anderen beiden Controller drehen Däumchen. Zwar könnten die anderen beiden Controller theoretisch schon Teile vom nächsten Datensatz verarbeiten, aber irgendwann ist halt der GPU-interne Buffer voll oder die Warteschlange abgearbeitet. Dann muss man immer noch warten, bis der 64-Bit-Controller die verbleibenden Datensätze geladen hat.
Egal wie man es anstellt, im Mittel sieht es nach einem 128-Bit-SI aus, wenn auf alle Speicherbausteine gleichermaßen zugegriffen wird.

Der Bandbreitenbenchmark, den Anandtech für die GTX 550 Ti und die GTS 450 bei gleichen Taktraten durchgeführt hat, stützt diese Vermutung:

http://www.3dcenter.org/dateien/abbildungen/Bandbreite-Test-GeForce-GTX-550-Ti.png
Quelle: http://www.anandtech.com/show/4221/nvidias-gtx-550-ti-coming-up-short-at-150/2

Die effektiven 160 Bit treffen imo nur bei zufälligen Speicherzugriffen zu, aber nicht, wenn generell immer auf jeden Speicherbaustein zugegriffen wird. Dass die GTX 660 Ti bis auf Tendenzen in den GPU-Computing-Benchmarks im Gegensatz zur GTX 550 Ti nicht unter der asymmetrischen Bestückung leidet, kann imo zwei Ursachen haben. Entweder sind schon 1,5 GiB VRAM gut genug für die Spieleparcours, was man mit eventuell noch kommenden 1,5-GiB-Versionen der GTX 660 Ti nachprüfen könnte. Oder Kepler gestaltet die Speicherzugriffe generell cleverer als Fermi.

Leonidas
2012-08-21, 10:32:01
Codas CS-Benchmark@16x16 deutet wohl auch in diese Richtung hin.


IMO deutet der Benchmark auf effektiv 128 Bit hin. Der Performance-Hit ist heftig - viel zu heftig für effektiv 160 Bit.



Die effektiven 160 Bit treffen imo nur bei zufälligen Speicherzugriffen zu, aber nicht, wenn generell immer auf jeden Speicherbaustein zugegriffen wird. Dass die GTX 660 Ti bis auf Tendenzen in den GPU-Computing-Benchmarks im Gegensatz zur GTX 550 Ti nicht unter der asymmetrischen Bestückung leidet, kann imo zwei Ursachen haben. Entweder sind schon 1,5 GiB VRAM gut genug für die Spieleparcours, was man mit eventuell noch kommenden 1,5-GiB-Versionen der GTX 660 Ti nachprüfen könnte. Oder Kepler gestaltet die Speicherzugriffe generell cleverer als Fermi.


Muß nicht sein. Kann einfach nur sein, daß schon die GTX550Ti damit per Treiber bestens zurechtkam und nur eben dieser einzelne GPGPU-Benchmark bei AnandTech reagierte.

Und ja, 1,5GB sind genug für die Spieleparcours. Selbst die 1GB Radeon HD 7850 wird teils bis in hohe Auflösungen ohne Performanceverlust gemessen.

AnarchX
2012-08-21, 10:43:55
Hoffentlich gibt es dazu nochmal einen ausführlicheren Test.

Dieser CUDA Bandbreiten Test scheint wohl aber mehr an der GPU-Leistung (Leistung des IMCs) zu hängen, als an der tatsächlichen Bandbreite.