PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : 7800gtx stark speicherbandbreitenlimitiert


Gast
2006-01-13, 17:49:17
das ist sicherlich kein geheimnis, aber dieser test hier hat mir gezeigt wie extrem das doch der fall ist
http://www.hartware.de/review_542_1.html

wenn man das auf die 7800gtx ummünzt (ca gleiches speicherbandbreite:texelfüllrate verhältnis) dürfte die 7800gtx mit 1,26ns viel schneller sein

jetzt stellt sich die frage warum nv mit dem g71 die texelfüllrate wieder immens steigert, die speicherbandbreite aber wieder nicht hinterherkommt
(imerhin müsste das gerücht von 32pipes unf 700mhz damit als unsinn abgestempelt werden)

hat vll wer ne 7800gtx oder gtx512 ^^ und will mal etwas mit den taktraten spielen?

deekey777
2006-01-13, 18:17:22
Ailuros hat seine 7800GTX mit verschiedenen VPU- und/oder Speichertakten in FEAR gequält, wo man sah, daß die verfügbare Speicherbandbreite eher brachliegt, wenn es auf die Shaderpower ankommt.

Banshee18
2006-01-13, 18:18:48
Fear ist da im Moment eher eine Ausnahme, oder?

deekey777
2006-01-13, 18:26:04
Fear ist da im Moment eher eine Ausnahme, oder?
Aber es zeigt die Richtung, in die sich das ganze entwickelt.

Odal
2006-01-13, 18:35:42
Ailuros hat seine 7800GTX mit verschiedenen VPU- und/oder Speichertakten in FEAR gequält, wo man sah, daß die verfügbare Speicherbandbreite eher brachliegt, wenn es auf die Shaderpower ankommt.

aber ich glaube es war Ailuros der mir mal auf ein posting geantwortet hatte das Speicherbandbreite und Speichermenge in Zukunft derb limitieren werden.


das die Füllrate des G71 nochmal derb ansteigt kommt wohl daher das seine Architektur anders ist als bei den x1900
Sprich das nicht wie bei den X1600/x1900er pixelalus einfach hinzugefügt werden können sondern um die shaderleistung zu steigern gleich eine komplette pipeline hinzukommt.

Gast
2006-01-13, 19:18:37
das ist schon klar nur fragt man sich ob das überhaupt was bringt, wenn die speicherbandbreite zu knapp ist
geht ja jetzt nicht nur um reine füllrate
ati hat ja das gleiche problem
viel shaderpower aber auch wenig speicherbandbreiet(bei mr580, der r520hat ja nen recht hohen speichertakt

123456
2006-01-13, 19:23:44
Der G80 könnte genau so gut ein 512 Bit-Speicherinterface und zusätzlich einen hohen Speichertakt bekommen, um die 900 MHz herum. Damit hätte man eine Speicherbandbreite > 115.200 MiB/s. Von Limitierung dürfte dann keine Rede mehr sein.

Ich bin schon lange für eine Erhöhung des Speicherinterface, aber auf mich hören nVidia und ATi ja nicht. :(

nVidia nimmt die Bandbreitenbegrenzung des G71 evtl. absichtlich in Kauf, wenn er denn tatsächlich 32 Pixel-Pipelines, einen höheren Chiptakt, aber keinen höheren Speichertakt bekommen sollte. Immerhin sollte ein Refresh-Chip nicht gleich 100 % leistungsfähiger sein als der Vorgänger. Daher sind 32 Pixel-Pipelines für den G71 eigentlich auch ganz logisch. Man wird bedingt duch die Bandbreitenbeschränkung durch zwei zusätzliche Quads keinen Mega-Leistungssprung erleben, dafür aber an dem Chip weiterarbeiten können und evtl. auf ein 512 Bit-Speicherinterface wechseln. Alleine dadurch würde die Leistung schon erheblich steigen. Dann noch ein paar Spielerein mit den Taktraten und fertig ist der G80 - doppelt so schnell wie die 7800 GTX 512 MiB.

So, das mal als kleiner Gedankengang meinerseits. :redface:

aths
2006-01-13, 20:05:41
das ist sicherlich kein geheimnis, aber dieser test hier hat mir gezeigt wie extrem das doch der fall ist
http://www.hartware.de/review_542_1.html

wenn man das auf die 7800gtx ummünzt (ca gleiches speicherbandbreite:texelfüllrate verhältnis) dürfte die 7800gtx mit 1,26ns viel schneller sein

jetzt stellt sich die frage warum nv mit dem g71 die texelfüllrate wieder immens steigert, die speicherbandbreite aber wieder nicht hinterherkommtDie TMUs sitzen bei den GeForces traditionell nahe der Pipes, bzw. sind logisch in ihnen verankert und nicht weitgehend entkoppelt wie beim R520. Damit die zusätzlichen Pipes auch Texturen nutzen können, haben sie weiterhin ihre TMU, auch wenn es durch die Speicherbandbreite zu Stalls kommen kann. Wollte man die Rechenkraft durch eine dritte MAD-ALU in der Pipe stärken, dürfte Nvidia erst mal einen neuen Pixelshader-Sheduler schreiben. Man abgesehen von den Kosten, die Pipeline zu erweitern, anstelle einfach zusätzliche fertige Pipes zu integrieren.

Godmode
2006-01-13, 20:32:26
Ich bin schon lange für eine Erhöhung des Speicherinterface, aber auf mich hören nVidia und ATi ja nicht. :(

Das kannst du vergessen, da kommt früher XDR oder irgendeine andere neue Technik. 512bit Speicherinterfaces sind aktuell und auch in den nächsten Jahren einfach zu teuer.

aths
2006-01-13, 22:54:17
Das kannst du vergessen, da kommt früher XDR oder irgendeine andere neue Technik. 512bit Speicherinterfaces sind aktuell und auch in den nächsten Jahren einfach zu teuer.Auch SLI bietet hier einen annehmbaren Ausweg, die Leistung noch deutlich zu steigern.

mapel110
2006-01-13, 22:57:45
Auch SLI bietet hier einen annehmbaren Ausweg, die Leistung noch deutlich zu steigern.
Fein, dann hat man 2x256bit Speicherinterface, aber nur nutzbar mit eben den bekannten Einschränkungen von SLI.

Gast
2006-01-13, 23:01:18
Was sind denn deiner Meinung nach diese großen Einschränkungen? Klar, SLI bringt nur was, wenn die darzustellende Szene grafiklimitiert ist, aber dem kann man ja nachhelfen. Außerdem gilt das gleiche auch für eine einzelne stärkere Graka.

Bliebe einzig und allein noch, dass man doppelt so viel bezahlt, aber in der Regel nicht doppelt so viel Leistung bekommt. Aber ist das Spiel stark grafiklimitiert und hat man die richtigen Settings gefunden, bringt SLI sehr viel.

mapel110
2006-01-13, 23:10:02
Was sind denn deiner Meinung nach diese großen Einschränkungen? Klar, SLI bringt nur was, wenn die darzustellende Szene grafiklimitiert ist, aber dem kann man ja nachhelfen. Außerdem gilt das gleiche auch für eine einzelne stärkere Graka.

Bliebe einzig und allein noch, dass man doppelt so viel bezahlt, aber in der Regel nicht doppelt so viel Leistung bekommt. Aber ist das Spiel stark grafiklimitiert und hat man die richtigen Settings gefunden, bringt SLI sehr viel.
AFR funktioniert nicht immer, also hat man nicht immer maximale SLI-Leistung. Profile muss man auch haben. spielespezifisch.
Diese Probleme hat man mit einer Karte nicht.

deekey777, also die Werte, die ich von Ailuros gesehen habe, sagen mir eher, dass FEAR beides braucht. Bandbreite und Füllrate(welche auch immer).

Gast
2006-01-13, 23:15:34
Profile muss man auch haben. spielespezifisch.Das find ich gar nicht mal schlimm. Allerdings mache ich mir auch mit meiner einzelnen Karte Profile für meine Spiele, ob ich da jetzt noch einen Eintrag mehr setzen muss, macht dann auch nichts mehr aus.

Gast
2006-01-13, 23:27:28
Die TMUs sitzen bei den GeForces traditionell nahe der Pipes, bzw. sind logisch in ihnen verankert und nicht weitgehend entkoppelt wie beim R520. Damit die zusätzlichen Pipes auch Texturen nutzen können, haben sie weiterhin ihre TMU, auch wenn es durch die Speicherbandbreite zu Stalls kommen kann. Wollte man die Rechenkraft durch eine dritte MAD-ALU in der Pipe stärken, dürfte Nvidia erst mal einen neuen Pixelshader-Sheduler schreiben. Man abgesehen von den Kosten, die Pipeline zu erweitern, anstelle einfach zusätzliche fertige Pipes zu integrieren.
ja gut aber reine shaderleistung bringt ja auch nichts bei ner limitierenden speicherbandbreite
oder hab ich da nen denkfehler

aber mein tipp geht sowieso nur richtung takterhöhung beim g71 und erst ne verbreiterung(oder eher neues(erweitertes) design)
denn so viel texturleistung ist glaub ich nciht mehr so wichtig in den hohen regionen
fear zeigt ja wo es lang geht(ok ist nur ein spiel, aber andere werden wohl mit eben so viel effekten kommen)

Odal
2006-01-14, 00:00:08
die Shaderleistung bringt schon was bei zukünftigen Spielen welche für Beleuchtung sehr komplexe shader einsetzen. Die Pixel ALUs sollten kaum auf Bandbreite angwiesen sein. Deswegen bekommt die X1900 auch soviele ALUs verpasst damit sie aus ihrer fähigkeit was shadereffekte angeht auch profit schlagen kann, ansonsten ist vieles nämlich eher ein Entwicklerfeature.

Ailuros
2006-01-14, 02:11:20
aber ich glaube es war Ailuros der mir mal auf ein posting geantwortet hatte das Speicherbandbreite und Speichermenge in Zukunft derb limitieren werden.

Ich sagte eher dass R580 und G71 vorruebergehend mit geringerer als benoetigter Bandbreite auskommen werden muessen.

deekey777, also die Werte, die ich von Ailuros gesehen habe, sagen mir eher, dass FEAR beides braucht. Bandbreite und Füllrate(welche auch immer).

Ja aber was fuer Fuellrate genau? Stimmen jetzt die spekulierten 700MHz fuer G71 und 8 quads, resultiert das in etwa 2.2x mal die rein theoretische arithmetische Leistung einer 7800GTX 256. Limitiert jetzt die Bandbreite tatsaechlich in einem Spiel wie FEAR auf G71, dann erhoeht sich die Leistung dann eben anstatt ca. 25 fps nur um 20 fps.

Meine weiteren Tests zeigten mir dass auf einer 7800GTX 256 die Erhoehung der Taktrate um 14% und gleicher Speicherfrequenz (ergo 600MHz), in etwa 9-10% mehr Leistung bringt. Im Gegenteil 430MHz default fuer den core und 14% mehr Speicherfrequenz (ergo 685MHz) bringen im Durchschnitt in etwa 4-5% mehr Leistung. Erst core und Speicher mit 14% hoeheren Frequenzen (wie auch zu erwarten waere) bringen eine ~14-15% Leistung im Durchschnitt.

Tests bei 490/685MHz:

http://www.3declipse.com//content/view/15/9/

Wo jetzt manche selbst hier eine Bandbreiten-Limitierung auf G70 sehen koennen ist mir eigentlich schleierhaft.

Die 7800GTX 512 ist im uebrigen um ~33% schneller als eine GTX 256, aber dafuer hat die erst auch 28% mehr Shader-Fuellrate und ca. 42% mehr Bandbreite. Die 5% mehr wuerde ich sowohl auf die hoehere Bandbreite als auch den doppelt so grossen Framebuffer verleiten.

aths
2006-01-14, 02:18:49
ja gut aber reine shaderleistung bringt ja auch nichts bei ner limitierenden speicherbandbreite
oder hab ich da nen denkfehlerSpeicherbandbreite braucht man primär für Z-Tests, Textursampling, Framebuffer-Schreibzugriffe (und beim Alphablending auch Lesezugriffe.) Pixelshader-Rechnungen benötigen zwar interne Bandbreite, belasten aber kaum die externe zum Grafikkarten-RAM.

reunion
2006-01-14, 11:13:25
[...]
Meine weiteren Tests zeigten mir dass auf einer 7800GTX 256 die Erhoehung der Taktrate um 14% und gleicher Speicherfrequenz (ergo 600MHz), in etwa 9-10% mehr Leistung bringt. Im Gegenteil 430MHz default fuer den core und 14% mehr Speicherfrequenz (ergo 685MHz) bringen im Durchschnitt in etwa 4-5% mehr Leistung.
[...]
Wo jetzt manche selbst hier eine Bandbreiten-Limitierung auf G70 sehen koennen ist mir eigentlich schleierhaft.
[...]


Würde die Bandbreite in keiner Situation limitieren, müsste eine Erhöhung des Speichertaktes genau 0% mehr Leistung bringen.

Ailuros
2006-01-14, 13:28:42
Würde die Bandbreite in keiner Situation limitieren, müsste eine Erhöhung des Speichertaktes genau 0% mehr Leistung bringen.

Mir sagt eher dass eine solche GPU mehr Bandbreite hat als sie ueberhaupt braucht.

"Keine Situation" heisst dann wohl aber auch dass man mit Absicht erstmal alles was SSAA betrifft weglaesst; egal ob adaptives SS, hybride modi oder reines full scene SSAA :|

saaya
2006-01-14, 13:48:03
kannst du bitte zu den ergebnissen linken die du meinst?

ich glaub nicht das speicherbandbreite in zukunft grossartig limitieren werden...
wie kommt ihr darauf?

deekey777
2006-01-14, 14:23:39
kannst du bitte zu den ergebnissen linken die du meinst?

ich glaub nicht das speicherbandbreite in zukunft grossartig limitieren werden...
wie kommt ihr darauf?
Die Speicherbandbreite wird in der Zukunft unter MSAA, aber auch und insbesondere von der Nutzung von HDRR leiden.

€: Wenn man nach Kanada schaut, wäre bei nVidia eher ein neuer Speichercontroller zu erwarten.

reunion
2006-01-14, 16:06:06
Mir sagt eher dass eine solche GPU mehr Bandbreite hat als sie ueberhaupt braucht.


Nein. Du sagst, dass eine Erhöhung des Speichertaktes um 14% eine Leistungssteigerung von 4-5% bringt. Würde der Chip mehr als genug Speicherbandbreite haben, dann dürftest du aus mehr Speicherbandbreite keinen Performancegewinn ziehen.


"Keine Situation" heisst dann wohl aber auch dass man mit Absicht erstmal alles was SSAA betrifft weglaesst; egal ob adaptives SS, hybride modi oder reines full scene SSAA :|

Wie kommst du jetzt auf SSAA?
SSAA kostet auch jedemenge Speicherbandbreite.

Ailuros
2006-01-14, 16:50:58
Nein. Du sagst, dass eine Erhöhung des Speichertaktes um 14% eine Leistungssteigerung von 4-5% bringt. Würde der Chip mehr als genug Speicherbandbreite haben, dann dürftest du aus mehr Speicherbandbreite keinen Performancegewinn ziehen.

4-5% sind so nahe wie moeglich am minimum. Beim zweiten Satz oben stimmen wir ueberein.

Wie kommst du jetzt auf SSAA?
SSAA kostet auch jedemenge Speicherbandbreite.

Du sagtest doch selber "keine Situation". Jegliche Form von SSAA - da es in mehreren Formen verfuegbar ist auf GeForces - muesste also auch hier die Bandbreite nicht limitieren, was nie und nimmer der Fall sein wird. Zwar ist es Haarspalterei, aber ich koennte mit Leichtigkeit selbst die erreichbaren 60GB/s auf einer 512 GTX verbruzeln. Vorsicht mit den Generalisierungen; keine GPU hat je genug Bandbreite.

Im Fall einer 7800GTX 256MB - um auf's Thema zurueckzukommen - muesstest Du mir erstmal einen deutlichen Fall finden wo wirklich die Bandbreite als primaerer Faktor erstmal limitiert. Wenn in 1600*1200 mit 4xAA die Leistung heutzutage nicht mehr reicht, dann sind andere Faktoren zuerst schuld. Der Albernheit zuliebe in Spielen wie FEAR ist heutzutage weder eine 7800GTX 256 und weder eine GTX 512 wirklich spielbar in 1600 mit 4xAA; zwar etwas besser im Vergleich zur 512 liegt die X1800XT aber auch nur gerade am Rand der Spielbarkeit, weil eben auch hier andere Faktoren zuerst limitieren. Gleiches gilt auch fuer CoD2; spielbar auf einer 512 GTX oder X1800XT in 1600 + 4xAA? Nein. Ach ja trotz 512MB ram und von 48-54.4GB/s Bandbreite.

Man sollte GPUs ingesamt betrachten und nicht nur wie es einem gerade passt.

IVN
2006-01-14, 17:01:53
Nein. Du sagst, dass eine Erhöhung des Speichertaktes um 14% eine Leistungssteigerung von 4-5% bringt. Würde der Chip mehr als genug Speicherbandbreite haben, dann dürftest du aus mehr Speicherbandbreite keinen Performancegewinn ziehen.


Wie kommst du jetzt auf SSAA?
SSAA kostet auch jedemenge Speicherbandbreite.
Durch den GPU-Ram-Overclock verringern sich auch die Latenzen,und das liebt eine PU jeglicher Art.

Ailuros
2006-01-14, 17:07:14
Durch den GPU-Ram-Overclock verringern sich auch die Latenzen,und das liebt eine PU jeglicher Art.

Auch anders rum (groessere Latenzen), bei den Tests wo ich den Speicher untertaktet habe; aus dem Grund alleine war die quasi "Emulation" auch ziemlich sinnlos.

Coda
2006-01-14, 18:03:50
Einer GPU sind Speicherlatenzen auch ziemlich egal.

IVN
2006-01-14, 19:12:24
Einer GPU sind Speicherlatenzen auch ziemlich egal.
Ach ja?Wieso waren dann die 6800gts geringfugig schneller als die 6800ultras beim gleichen Takt??

-Warte ich helfe dir:Weil die Latenzen bei den GTs niedriger waren.

Coda
2006-01-14, 19:15:49
Du hast recht. Die unglaubliche Differenz ist überwältigend...

Natürlich hat es eine Auswirkung, aber diese ist ggü. der Speicherbandbreite zu vernachlässigen. Random-Access Patterns mit unvorhersehbarem Lese/Schreibziel gibt es fast nicht bei GPUs, außerdem ist alles mit dicken FIFOs entkoppelt.

StefanV2
2006-01-14, 19:20:41
Ach ja?Wieso waren dann die 6800gts geringfugig schneller als die 6800ultras beim gleichen Takt??

-Warte ich helfe dir:Weil die Latenzen bei den GTs niedriger waren.
Und wie groß ist dieser Unterschied, wenn man eine Messtoleranz von 3-4% annimmt? :|

Achja: sowas gabs früher schonmal, GF4 Klasse, bei HT4U.

Die Unterschiede waren auch damals schon überwältigend, warum sollte das jetzt anders sein?! :|

Zumal eine GPU meist in den Speicher 'streamt' X-D

IVN
2006-01-14, 19:23:26
Du hast recht. Die unglaubliche Differenz ist überwältigend...

Natürlich hat es eine Auswirkung, aber diese ist ggü. der Speicherbandbreite zu vernachlässigen. Random-Access Patterns mit unvorhersehbarem Lese/Schreibziel gibt es fast nicht bei GPUs.
Mit meiner Aussage habe ich nicht uebertrieben,im Gegensatz zu dir.


"Einer GPU sind Speicherlatenzen auch ziemlich egal."

"Wieso waren dann die 6800gts geringfugig schneller als die 6800ultras beim gleichen Takt??"


p.s. lese dir den ganzen Thread durch.Oben sagt Ailuros das die Differenz nur 4-5% betregt,und das sind die Latenzen.

IVN
2006-01-14, 19:30:44
Und wie groß ist dieser Unterschied, wenn man eine Messtoleranz von 3-4% annimmt? :|

Achja: sowas gabs früher schonmal, GF4 Klasse, bei HT4U.

Die Unterschiede waren auch damals schon überwältigend, warum sollte das jetzt anders sein?! :|

Zumal eine GPU meist in den Speicher 'streamt' X-D
Der Durchschnitt aus 3 Durchlaeufen eines Benchmarks,und der Durchschnitt der anderen Karte,und da hast du die 3-4%.Da gibt es keine Messtoleranz mehr.

Coda
2006-01-14, 19:31:42
Nein, das sind nicht die Latenzen sondern einfach 14% mehr an Bandbreite X-D

IVN
2006-01-14, 19:39:59
Nein, das sind nicht die Latenzen sondern einfach 14% mehr an Bandbreite X-D
Wenn du es sagst,muss es ja wohl stimmen.*scnr*

Coda
2006-01-14, 20:39:05
Ist gut. Rechne mal aus um wieviel Prozent die Speicherlatenz da gesunken ist.

Und ich bleibe dabei, dass ein Streamprozessor durch die Entkopplung der Einheiten niemals so stark an der Speicherlatenz hängt wie eine CPU. Solange keine dependent-texture-fetches verwendet werden praktisch gar nicht, weil jeder Speicherzugriff vorhersehbar ist.

Ailuros
2006-01-15, 07:23:22
Ist gut. Rechne mal aus um wieviel Prozent die Speicherlatenz da gesunken ist.

Und ich bleibe dabei, dass ein Streamprozessor durch die Entkopplung der Einheiten niemals so stark an der Speicherlatenz hängt wie eine CPU. Solange keine dependent-texture-fetches verwendet werden praktisch gar nicht, weil jeder Speicherzugriff vorhersehbar ist.

Aechz....nochmal von Anfang an....

430/600 = N
430/685 = N +4/5%
490/600 = N +9/10%
490/685 = N +14/15%
490/550 = N +5-6%

Da ich mich hauptsaechlich auf einen geschaetzten Durchschnitt bezog auf meinen bisherigen Resultaten basierend, spielt im zweiten und letzten Fall definitiv Latenz eine Rolle mit, obwohl in beiden Faellen das Resultat nicht ausschliesslich dank des Latenz-Unterschiedes ist.

Besser jetzt?

saaya
2006-01-15, 15:19:16
Die Speicherbandbreite wird in der Zukunft unter MSAA, aber auch und insbesondere von der Nutzung von HDRR leiden.

€: Wenn man nach Kanada schaut, wäre bei nVidia eher ein neuer Speichercontroller zu erwarten.

was heisst leiden, man braucht mehr bandbreite, ja und?
dafuer gibts gddr4 gddr5 etc etc...
ich sehe keinen trend der so stark resources verbraucht das man mit der hardware entwicklung nicht mehr hinterher kommt...

Nein. Du sagst, dass eine Erhöhung des Speichertaktes um 14% eine Leistungssteigerung von 4-5% bringt. Würde der Chip mehr als genug Speicherbandbreite haben, dann dürftest du aus mehr Speicherbandbreite keinen Performancegewinn ziehen.
jein, der performence zuwachs bricht ja nicht auf einmal ab... er wird nur immer geringer... ab einer gewissen bandbreite kann man sagen das die gpu oder cpu gesaettigt ist, ab da an bringt mehr bandbreite dann relative wenig performence zuwachs, und so weit ich weiss ist das bei den 7800 karten der fall.