PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Älteren Grafikkarten per schnellem Hauptspeicher auf die Sprünge helfen?


Raff
2004-10-25, 15:08:08
Guten Abend allerseits!

Ich hatte eben beim Nachdenken über Speicherprobleme bei Grafikkarten ne spontane Idee und wüsste gerne, ob das irgendwie realisierbar ist. :)

Folgendes: Grafikkarten haben ja irgendwie immer das Problem, zu langsam zu sein. ;) Oft liegt das an mangelnder Speicherbandbreite oder einfach daran, dass das RAM-Polster auf der Platine für die Anforderungen unzureichend ist. Dafür scheint es bei neuen Geschossen vom Kaliber X800 und 6800 keine Lösung außer Overclocking zu geben ... aber für ältere Karten vielleicht?!

Nehmen wir mal eine beschnittene GeForce2 MX mit 64Bit-Speicherinterface als Beispiel. Lahm ohne Ende schon zum Erscheinen, "dank" 64Bit. Oder eine auf 16MB VRAM beschränkte Voodoo3. Beide haben die Tatsache gemeinsam, durch den RAM in ihrer Leistungsfähigkeit eingeschränkt zu werden. Dabei sollte man bitte die aus heutiger Sicht natürlich ebenfalls schwer veralteten Grafikchips außer Acht lassen und sich nur dem hier von mir angesprochenen RAM-Problem widmen.

Nun zu dem, was ich als "Lösung" auserkoren habe: Den System-Hauptspeicher! Dank Dual-Channel und DDR-Technologie sind mittlerweile Takte von 400 effektiven MHz Standard, die damit gelieferte Bandbreite höher als von den angesprochenen Grafikkarten, und die quantitativ verfügbare Menge bewegt sich mittlerweile auch bei 1024 MByte als Standard.

Gibt es eine Möglichkeit, Grafikkarten des erwähnten Kalibers statt des auf der Platine verbauten Video-RAMs ausschließlich den System-Speicher nutzen zu lassen?

Damit wären Engpässe beim Video-RAM eigentlich ausgeschlossen und die Grafikkarte hätte den Mehrtakt des Speichers, um mehr FPS zu liefern (solange der Chip nicht limitiert).
Oder macht das keinen Sinn, da der System-RAM (aus welchen Gründen auch immer) langsamer ist? Mir ist klar, dass bei der System-Bandbreite, welche dann von der Grafikkarte wie bei einer integrierten Lösung angezapft werden würde, auch die CPU nuckelt ... aber gerade bei den genannten Beispielen würde es wohl immer noch zu einem Überfluss reichen.

Was meint ihr?

€dit: So, jetzt ... nach nochmaliger Überlegung: Kann ja garnicht gehen. ;) Das Zeug müsste ja erst noch durch den AGP ... also gäbs wohl da wieder nen Engpass, da mehr als 2 GB nicht durchgehen.

Ne andere Möglichkeit gibts nicht, oder?

MfG,
Raff

Shink
2004-10-25, 15:35:42
Erstaunlicherweise hat das echt einmal was gebracht: Spezielle Versionen der Savage 4 mit extra lahmem Speicher waren dank AGPx4 tatsaechlich schneller, wenn man den Registry-Tweak zur ausschliesslichen Hauptspeicherverwendung eingeschaltet hat. Diese Treiberoption gabs uebrigens frueher auf allen S3-Karten.

Davon abgesehen: IGP-Mainboards wie der ATI 9100IGP oder der NForce2-IGP sind (mehr oder weniger) effiziente Beispiele fuer eine "andere Loesung"; effizienter (und billiger) als 64Bit-GraKas ist sowas wahrscheinlich sogar...

Tjell
2004-10-25, 15:54:19
Ich will es mal mit meinen einfachen Worten so ausdrücken:

Eine Karte, die zuwenig Grafikkartenspeicher ihr Eigen nennt, gehört mit großer Wahrscheinlichkeit für die grafikspeicherfordernden Spiele sowieso schon zum alten Eisen, ist also von der Rechenleistung eh kaum zu gebrauchen.

Limitiert der lokale Grafikkarten-RAM nicht (Beispiel FX5200 mit 256 MB) setzt auch hier der Grafikchip das Limit.

Würde man bei ersterem Beispiel den Systemspeicher mitnutzen, wäre dieser im Gegensatz zum lokalen Grafikkarten-RAM mit an sich schon viel höheren Latenzen und der Limitierung durch den Port nicht gerade in der Lage, die schlechte Leistung auf einen entscheidend/spürbar höheren Level zu bringen.

Demnach mutmaße ich, daß von aktuelle(ere)n Grafikkarten ausschließlich integrierte Grafiklösungen von schnellem/mehr Systemspeicher profitieren, bei allen anderen Fällen ist der eventuelle Leistungsgewinn unerheblich.

Bin für Korrekturen offen. :)

Raff
2004-10-25, 16:38:03
Ein Beispiel fällt mir gerade bei der Voodoo3 ein (ist mir bei meinen Tests aufgefallen). Beim 3DMark2001SE z.B. fehlen bei Auflösungen > 1280x1024x16 Texturen und die gesamte Szene ist unterirdisch lahm. Zusammenhang? IMHO ja. Es muss heftigst ausgelagert werden. Was wäre nun, wenn man der Karte statt dem maximal (mit etwas Glück) mit 200 MHz taktenden VRAM (128Bit) DDR-RAM mit 400 effektiven MHz zur Seite stellt? Das muss doch was bringen, zur Not noch AGP/PCI-Bus übertakten. :)

Doch geht das denn überhaupt? Ist sowas, wie bei der erwähnten Savage4, über den Treiber forcierbar?

MfG,
Raff

anddill
2004-10-25, 16:40:40
Sowas gabs mal. Intel hat zur Einführung des AGP auch eine passende Grafikkarte mitentwickelt, die nur einen 4 oder 8MB Framebuffer hatte, und sämtliche andere Dige komplett über den AGP abgewickelt hat, per AGP-Texturing und AGP-Execute (?). Hieß glaub ich i740 in der Intel-Variante, der Entwicklungspartner hat auch ein paar unter eigenem Namen verkauft (Real 3D).
Konnte damals halbwegs mit den gängigen PCI und AGP-Karten mithalten, wurde dann aber gnadenlos von den Grakas mit lokalem Speicher überholt.
Intel hat dann den i740 als Onboard-Grafiklösung weiterentwickelt. Zu Anfang gab es sogar Varianten mit auf dem Board aufgelötetem Framebuffer, oder man konnte ein Speichermodul in den AGP stecken, und damit die Onboardgrafik um ca. 30% beschleunigen.

Pirx
2004-10-25, 17:42:49
Die Karten unterstützen dann aber oft die hohen AGP-Modi nicht und/oder könnten die Bandbreite eh nicht verarbeiten (zuwenig Füllrate etc.). Außerdem sind garantiert die Latenzen des System-RAMs sehr schlecht im Vergleich zum lokalen RAM der Graka, spielt vielleicht nicht soo die Rolle, aber etwas garantiert.

LOCHFRASS
2004-10-25, 18:10:49
Zum Thema V3, da koennte man sich die PCI-Version mit SGRAM besorgen, die hat noch vier freie Loetstellen fuer RAMs, einfach noch mal 16 MiB draufloeten (geht notfalls auch im Backofen :ugly: ), der V3 kann AFAIR auch mit 32 MiB umgehen. :D

hmx
2004-10-25, 18:11:24
Hmm die Überlegung hatte ich auch mal. 200MHz 128bit DDR sind ja 6,4GB/s also ein ganzes stück schneller als der VRAM von solch alten Grakas. Aber leider macht AGP 8x nur max 2,1GB/s. Da ists denn wohl doch net mehr so viel schneller.

Raff
2004-10-25, 18:25:15
[...] Aber leider macht AGP 8x nur max 2,1GB/s. Da ists denn wohl doch net mehr so viel schneller.

So ist es leider ... das ist mir zu spät aufgefallen. Erschwerend kommt noch hinzu, dass z.B. die angesprochene Voodoo3 nur AGP2x beherrscht -- und das nicht mal vollständig. Mit den paar hundert MB, die über den AGP kommen würden, wäre das ganze Unterfangen auch noch arg kontraproduktiv.

Wäre sowas eventuell über PCI-Express und normalen, alten PCI-Karten möglich?

MfG,
Raff

Tjell
2004-10-25, 18:29:45
...
Wäre sowas eventuell über PCI-Express und normalen, alten PCI-Karten möglich?

MfG,
Raff
Verstehe ich Dich richtig? Du meinst, eine PCI-Karte in einen PCI-Express-Steckplatz stopfen? Doch wohl nicht, oder?

:uconf3:

hmx
2004-10-25, 19:20:35
@raff

Soweit ich weiss konnte die Voodoo3 ja überhaupt gar kein AGP Texturing. Und die Geschwindigkeit mit der Die Karte mit der Aussenwelt kummunizierte war afaik auch nicht AGP 2x sondern genauso wie wie die der PCI Karte. Das einzige was die Voodoo3 mit AGP zu tun hatte war afaik dass sie in einen AGP Slot gestckt wurde mehr nicht...

misterh
2004-10-25, 19:20:59
Verstehe ich Dich richtig? Du meinst, eine PCI-Karte in einen PCI-Express-Steckplatz stopfen? Doch wohl nicht, oder?

:uconf3:

er meint wohl speicherweg von arbeitspeicher über pci-x bzw alte pci zu graka.

Edit:

ich meinte pci-E und nicht pci-X. mein fehler

Raff
2004-10-25, 19:24:14
@raff

Soweit ich weiss konnte die Voodoo3 ja überhaupt gar kein AGP Texturing. Und die Geschwindigkeit mit der Die Karte mit der Aussenwelt kummunizierte war afaik auch nicht AGP 2x sondern genauso wie wie die der PCI Karte. Das einzige was die Voodoo3 mit AGP zu tun hatte war afaik dass sie in einen AGP Slot gestckt wurde mehr nicht...

Stimmt. Ok, war jetzt ein schlechtes Beispiel -- nehmen wir einfach ne TNT2 statt der Voodoo3, ok? ;)

@ Tjell:

Ich meinte es so, wie misterh sagte.

MfG,
Raff

Tjell
2004-10-25, 19:42:04
Stimmt. Ok, war jetzt ein schlechtes Beispiel -- nehmen wir einfach ne TNT2 statt der Voodoo3, ok? ;)

@ Tjell:

Ich meinte es so, wie misterh sagte.

MfG,
Raff
Klammern wir PCI-X mal aus dann verstehe ich Dich. :D

PCI/PCI-X ungleich PCI-E ;)

hmx
2004-10-25, 19:53:47
@raff
die tnt2 hatte doch schon 128bit SDR und 133-183MHz oder?

robbitop
2004-10-26, 10:51:09
Das Problem sollte ausserdem die Latenz sein.
Allein um ein Signal von der VPU zur Northbridge zu bekommen dauert es im best case schon 66 Takte. Dann darf das Signal moduliert werden um zum Speichercontroller zu geraten. Wieder ein paar Takte. Dann wartet das Signal, um auch mal auf den Speichercontroller zugreifen zu dürfen. (die CPU nutzt den ja sonst und nun muss man Timesharing betreiben). Man braucht für jeden Signalzugriff nun ein paar Takte, da ja der Speichercontroller geshared wird.
Und bis man hier wieder die volle Menge übertragen hat dauert es auch wieder Ewigkeiten. Das ganze muss dann nach Bedarf wieder zurück.
Lohnt IMO überhaupt nicht, weil einfach zu viele Latenzen drinliegen und die Pipeline vermutlich dauernd leerläuft oder stalls hat.

Das AGP Texturing ist also nur eine äusserste Notlösung.

Merke: Bandbreite ist nicht alles, Latenzen sind ab einem gewissen Bereich auch extrem wichtig und sie schmälern die verfügbare Bandbreite.

Mr. Lolman
2004-10-26, 12:56:27
Naja ich hab ne absolut speicherlimitierte Karte:

Eine 64MB 9500 mit 8 Pipelines, wo die GPU bis 370MHz fehlerfrei taktbar ist. Und das AGP Texturing funktioniert sogar so gut, dass ich bei manchen (älteren) Spielen 4xAA anstellen kann, sofern die GraKa im 2.4GHz AMD mit 200FSB und 1GB RAM und 8xAGP mit 256MB Aperture Size verbaut ist.

Im Rechner der Freundin (1.7GHz, 133FSB) rennt die GraKa mit 2xAGP, und 32MB Aperture Size, und da laufen Spiele wie World Champion Snooker mit 4xAA schon recht ruckelig.

robbitop
2004-10-26, 13:15:24
Naja ich hab ne absolut speicherlimitierte Karte:

Eine 64MB 9500 mit 8 Pipelines, wo die GPU bis 370MHz fehlerfrei taktbar ist. Und das AGP Texturing funktioniert sogar so gut, dass ich bei manchen (älteren) Spielen 4xAA anstellen kann, sofern die GraKa im 2.4GHz AMD mit 200FSB und 1GB RAM und 8xAGP mit 256MB Aperture Size verbaut ist.

Im Rechner der Freundin (1.7GHz, 133FSB) rennt die GraKa mit 2xAGP, und 32MB Aperture Size, und da laufen Spiele wie World Champion Snooker mit 4xAA schon recht ruckelig.

hm dann scheint es sich ja nur um den "letzten Rest" zu handeln, der über den AGP muss.