Was hat es eigentlich mit dem Speicherinterface auf sich? [Archiv]

Archiv verlassen und diese Seite im Standarddesign anzeigen : Was hat es eigentlich mit dem Speicherinterface auf sich?

ildottore

2004-12-10, 21:14:58

Godmode

2004-12-10, 23:05:29

Ich versuchs mal: Das Speicherinterface ist die Verbindung zwischen GPU und dem Grafik-RAM. 256 Bit bedeutet, das pro Taktzyklus 256 Bit übertragen werden können. Je breiter man es macht, desto teurer, weil das PCB viel komplizierter wird. Ja der Speichercontroller sitzt direkt in der GPU!

ildottore

2004-12-11, 12:55:37

Muss der Speicher auch spezieller sein, bzw. muss man mehrere Chips parallel schalten um auf solche Breiten zu kommen?

MechWOLLIer

2004-12-11, 13:12:48

Muss der Speicher auch spezieller sein, bzw. muss man mehrere Chips parallel schalten um auf solche Breiten zu kommen?
Was meinst du mit "muss der Speicher auch spezieller sein"?
Nein, imo muss man die Chips nicht parallel schalten.

Gast

2004-12-11, 14:07:09

Ja es müssen mehrere Speicherchips "parallel" geschalten werden, um auf z.B. 256 bit zu kommen. Leider weiss ich nicht genau, wieviele Datenleitungen aktuelle Grafikspeicherchips haben. Wenn ich jedoch meine X800pro betrachte (256bit Speicherinterface), dann sehe ich 8 Speicherchips. Das bedeutet, dass die Chips mindestens 32 bit breit sein müssen. Da die Gehäuse der Chips jedoch 121 pins haben (11x11 matrix, wenn ich mich nicht verzählt habe D: ), wären auch 64 bit denkbar.

Wishnu

2004-12-11, 16:18:53

Ich tippe mal auf 4x64Bit, zumindest bei Nvidia.

Ein Guru da? ;)

ildottore

2004-12-11, 17:04:32

Komplizierteres PCB soll heißen mehr Leiterbahnen?

Black-Scorpion

2004-12-11, 17:15:14

Ja, mehr Leiterbahnen und/oder Layer (Lagen).

MechWOLLIer

2004-12-11, 17:16:14

Komplizierteres PCB soll heißen mehr Leiterbahnen?
Ja, denn bei einem 256 bittrigem Speicherinterface müssen halt entsprechend mehr Leiterbahnen auf der Karte vorhanden sein als bei einem 128 bittrigem. Somit wird das PCB komplizierter.

Gast

2004-12-11, 20:03:13

Aber die Interfacebreite ist vom Grafikchip her nach unten offen, oder?
Wenn nicht, wie können die Grafikkartenhersteller dann einfach mal 128bit-9800Pros auf den Markt werfen?

Godmode

2004-12-11, 20:06:39

MechWOLLIer

2004-12-11, 20:13:32

Aber die Interfacebreite ist vom Grafikchip her nach unten offen, oder?
Wenn nicht, wie können die Grafikkartenhersteller dann einfach mal 128bit-9800Pros auf den Markt werfen?
Im Prinzip sollte ein 256 bitriges Speicherinterface nach unten hin kompatiblem sein, sprich 128 Bit und 64 Bit, etc.
Ansonsten könte ich mir nicht vorstellen, warum es plötzlich 128 bittrige 9800 Pros gibt, welche ja das selbe PCB wie eine richtige 9800 haben.

Tesseract

2004-12-11, 20:25:54

Aber die Interfacebreite ist vom Grafikchip her nach unten offen, oder?
Wenn nicht, wie können die Grafikkartenhersteller dann einfach mal 128bit-9800Pros auf den Markt werfen?

das wird bei vielen low-end chips so gemacht. da wird eine eigentlich für 128bit vorgesehene karte auf 64bit beschnitten um preislich leicht unter 100€ zu kommen.
verwendbar sind die karten aber für kaum etwas.

TeeKay

2004-12-12, 10:15:00

Nicht nur das PCB wird aufwaendiger, das Package des Chips sowie der Chip an sich sind ebenfalls teurer. Irgendwie logisch, dass steigende Komplexitaet zu steigenden Kosten fuehrt.

aths

2004-12-12, 14:27:23

Ho
Immer wieder reden alle über 64, 128 und 256-Bit Speicherinterfaces und was das in der Theorie bedeutet ist mir auch klar, aber wie äußert sich das in den Chips? Steckt das Speicherinterface direkt in den GPUs? Ist ein 256-Bit Interface teurer zu produzieren? Warum?

Google hat mir keine hinreichende Erklärung geliefert, aber vielleicht habe ichs ja nur falsch angestellt, ich nehme also auch gerne Links.

Bringt Licht ins Dunkel ;)Eine moderne GPU spricht den Speicher nicht als einen Block an, sondern unterteilt ihn, zum Beispiel in 4 Blöcke. (Ein Block kann dabei durchaus aus 2 RAM-Bausteinen bestehen.) Das heißt, der Speichercontroller der modernen GPU besteht aus 4 einzelnen Controllern. Jeder Controller kann auf jeden RAM-Block zugreifen (aber immer nur einer gleichzeitig auf einen Block.)

Wenn du jetzt jeden Controller mit 32 Datenleitungen ausstattest, und das DDR-Verfahren nutzt, können pro Takt 64 Bit ("nebeneinander stehende") Daten gelesen oder geschrieben werden. Da man 4 solcher Controller hat, sind das 4x 64 Daten pro Takt.

Die GPU muss ständig Daten austauschen: Z-Werte lesen und schreiben, fertige Pixel schreiben, Texturen einlesen usw. Je mehr Daten übertragen werden können, desto besser.

Viele heutige GPUs haben insgesamt 256 Datenleitungen zum RAM und können mit dem DDR-Verfahren also 512 Bit pro Takt übertragen. Da man die Leitungen auch auf der "Leiterplatte" verlegen muss, und bei hohen Takten unangenehme Effekte auftreten die man in den Griff bekommen muss, werden Layouts mit vielen Datenleitungen teurer.

MechWOLLIer

2004-12-12, 14:51:13

Also wäre es technisch derzeit bereits kein Problem 512 Datenleitungen zu benutzen?
Weißt du, wieviel teurer das in der Produktion ungefähr wäre?

aths

2004-12-12, 15:27:15

Also wäre es technisch derzeit bereits kein Problem 512 Datenleitungen zu benutzen?Doch. Dafür müssten vom Chip aus zusätzliche Anschlüsse herausgeführt. Außerdem wirken parallele Leiterbahnen wie Kondensatoren. Und man kann nicht beliebig hoch takten, wenn das Signal nicht gänzlich verschliffen werden soll.

Ich weiß nicht, wie weit die Forschungen sind, z. B. mit Phasensprüngen pro Takt mehrere Bits zu übertragen. Vermutlich ist so ein Verfahren bei den heutigen Taktraten impraktikabel.

Außerdem ist jedes Bauelement (auch die Leiterbahn ist eins) ein Tiefpass (sogar ein Hochpass ist letztlich auch ein Tiefpass) was die Datenmenge pro Takt limitiert.

Weißt du, wieviel teurer das in der Produktion ungefähr wäre?Teuer. Ein 256-Bit-SLI-System hat insgesamt 512 Leitungen (also 1024 Bit pro Takt) allerdings müssen bestimmte Daten auch pro Chip übertragen werden, die effektive Leistung steigt also nicht um 100%. Dafür sind SLI-Systeme heute schon realisierbar (zu hohen Kosten.)

Kann man die Speicherbandbreite nicht beliebig steigern, wäre vielleicht ein fetter Cache ein Ausweg. Dank virtualisiertem Speicher bei WGF2 erhoffe ich von WGF2-Karten in dieser Richtung eine Lösung.

Gast

2004-12-12, 15:52:21

Doch. Dafür müssten vom Chip aus zusätzliche Anschlüsse herausgeführt. Außerdem wirken parallele Leiterbahnen wie Kondensatoren. Und man kann nicht beliebig hoch takten, wenn das Signal nicht gänzlich verschliffen werden soll.

Ich weiß nicht, wie weit die Forschungen sind, z. B. mit Phasensprüngen pro Takt mehrere Bits zu übertragen. Vermutlich ist so ein Verfahren bei den heutigen Taktraten impraktikabel.

Außerdem ist jedes Bauelement (auch die Leiterbahn ist eins) ein Tiefpass (sogar ein Hochpass ist letztlich auch ein Tiefpass) was die Datenmenge pro Takt limitiert.

Teuer. Ein 256-Bit-SLI-System hat insgesamt 512 Leitungen (also 1024 Bit pro Takt) allerdings müssen bestimmte Daten auch pro Chip übertragen werden, die effektive Leistung steigt also nicht um 100%. Dafür sind SLI-Systeme heute schon realisierbar (zu hohen Kosten.)

Kann man die Speicherbandbreite nicht beliebig steigern, wäre vielleicht ein fetter Cache ein Ausweg. Dank virtualisiertem Speicher bei WGF2 erhoffe ich von WGF2-Karten in dieser Richtung eine Lösung.

Guck mal in den profi sektor

PCIe x16

Grafikchip
Bezeichnung

2x Realizm 800

Speicher
Kapazität

640 MB
Typ

GDDR3
Speicheranbindung

512 Bit

Coda

2004-12-12, 15:56:29

Die Realizm hat 2x256bit, nicht ein 512bit breites. Das ist ein großer Unterschied.

Gast

2004-12-12, 16:27:44

Die Realizm hat 2x256bit, nicht ein 512bit breites. Das ist ein großer Unterschied.
Technische Daten

Die wichtigsten Merkmale der Architektur:

Freie Programmierbarkeit

* Zwei VPUs und eine VSU (mit fortschrittlicher Geometrieverarbeitung, VPU-Management und einem PCI-Express-Interface) sorgen für eine Verdopplung der Performance.
* Freie Programmierbarkeit und Fließkomma-Fähigkeiten in allen Bereichen der Grafikpipeline.
* Reibungslose 32- zu 16-Bit und 16- zu 32-Bit-Konvertierung ohne CPU-Belastung
* 16x PCI Express für schnellere Datenübertragung über den Systembus
* Zwei Dual-Link-DVI-I-Ausgänge ermöglichen optimale Grafikleistung mit Auflösungen von 3840 x 2400 Bildpunkten.
* 512 Bit GDDR3-Speicherschnittstelle für höhere Speicherleistung
* Hardwarebeschleunigtes Pixel-Readback bis zu 4 GB/Sek.
* Unterstützung für SuperScene™-Antialiasing (multisampled)
* Unterstützung für DirectBurst™ und virtuellem Speicher für professionelle Zuweisung und Nutzung von Speicherressourcen
* Texturgrößen bis zu 8K x 8K
* Dedizierter isochroner Kanal
* Rechtwinklige, Compiler-freundliche SIMD-Arrays in der gesamten Pipeline ermöglichen Compilern die Bereitstellung einer optimalen Performance.
* Zwei unabhängige 10-Bit-DACs mit 400 MHz

Unterstützte APIs:

* OpenGL ® 2.0 (wird vollständig unterstützt, wenn sie verabschiedet ist)
* OpenGL 1.5 mit OpenGL Shading-Sprache
* Microsoft DirectX ® 9.0 mit Highlevel-Shadersprache (HLSK, VS 2.0, PS 3.0)
* Unterstützt optionale Wildcat Realizm Multiview-Karte für Framelock-/Genlock-Funktionalität.

Programmierbarkeit

* Führende Unterstützung für OpenGL Shading-Sprache und DirectX 9 HLSL
* Freie Programmierbarkeit mit Fließkommagenauigkeit
o Optimierte Fließkommagenauigkeit in jedem Pipeline-Bereich (36-Bit-Dreiecke, 32-Bit-Pixel, 16-Bit-Backend-Pixelverarbeitung) sorgt für maximale Präzision und Realitätstreue beim Rendern.
*
32 programmierbare Vertex-Shader mit 36 Bit Fließkommagenauigkeit und Unterstützung für:
o
bis zu 1024 Befehle
o
bis zu 32 Lichtquellen
o
Subroutinen, Loops und bedingte Sprünge
*
96 programmierbare Fragment-Shader mit 32 Bit Fließkommagenauigkeit und Unterstützung für:
o
bis zu 262.144 Befehle
o
Subroutinen, Loops und bedingte Sprünge
*
Programmierbarer Pixel-Shader mit 32 programmierbaren 32-Bit-Shadern

Grafikkarte

*
Die Karte belegt einen x16-PCI-Express-Steckplatz voller Länge und Höhe, wobei ein freier benachbarter Steckplatz für die Kühlung zur Verfügung stehen muss.
*
Entspricht den in der PCI-Express-Spezifikation beschriebenen elektrischen und mechanischen Eigenschaften.

Speicher

*
640 MB GDDR3 Speicher insgesamt
o
512 MB GDDR3 Unified Memory mit 512-Bit-Interface-Bus
o
128 MB GDDR3 DirectBurst-Speicher mit 128-Bit-Interface-Bus
*
64 KB Flash-EEPROM zur Speicherung von VGA-Bios- und Konfigurationseinstellungen
*
Unterstützung für virtuellen Speicher ermöglicht:
o
Nutzung des Onboard-Speichers als effizienten L2-Cache
o
Reibungslose Handhabung großer Datensätze
o
Automatische Auslagerung nicht verwendeter Puffer
o
Sehr große Texturen (z.B. 4 K x 4 K)

Treiber

*
Microsoft Windows 2000 und Microsoft Windows XP (32 und 64 Bit) Windows-Treiber beinhalten 3Dlabs Acuity Windows Manager.
*
Red Hat Linux Enterprise Edition (32 und 64 Bit Version 3.0 oder höher)

Anschlüsse

*
Zwei DVI-I-Ausgänge (analog/digital) - Dual-Link-DVI mit Unterstützung der folgenden Konfigurationen:
o
Ein oder zwei analoge Monitore
o
Ein oder zwei digitale Monitore mit Single Link
o
Ein oder zwei digitale Monitore mit Dual Link
o
Ein digitaler Monitor mit Single Link oder Dual Link und ein analoger Monitor
*
Stereo-Sync-Unterstützung
o
Frame Sequential Stereo nach VESA-Standard
o
3-poliger (Mini-DIN) Stereo-Shutter-Anschluss für 3D-Shutter-Brillen
Unterstützt

hmmm magst du mir einen link geben wo ich das nachlesen kann das das si nur 256 bit hat.

Danke

Quasar

2004-12-12, 17:14:50

Auf Seite 10 der Wildcat Realizm Tech-Präsentation wird das deutlich. Drei getrennte Interfaces: eines mit 128Bit-DDR Breite für die VSU und jeweils eines mit 256Bit-DDR Breite für jede der beiden VPUs.

Dahinter wird noch "erklärt": "A total of 512-bit data lines to GDDR3 memory for unmatched memory bandwidth".

GloomY

2004-12-21, 22:10:28

Ich tippe mal auf 4x64Bit, zumindest bei Nvidia.

Ein Guru da? ;)Das ist die logische Aufteilung. Das muss aber identisch mit der Aufteilung auf die Speicherchips sein.
Aber die Interfacebreite ist vom Grafikchip her nach unten offen, oder?
Wenn nicht, wie können die Grafikkartenhersteller dann einfach mal 128bit-9800Pros auf den Markt werfen?Der Chip muss es unterstützen, dass er auch mit weniger angeschlossenen Pins läuft. Du kannst nicht einfach Datenleitungen nicht anschliessen, wenn der Chip davon ausgeht, dass er da Daten holen und verstauen kann.

Bezüglich der maximalen Anzahl an Pins würde ich wohl eher auf die Kosten als auf die technische Machbarkeit tippen. Es gibt Chips mit > 3000 Pins, also warum auch nicht hier noch ein paar mehr?
Sicher kann man bei einer solch brachialen Anzahl die Taktfrequenz nicht so hoch halten, wie bei weitaus weniger Pins, aber ich denke dass es zumindest technisch möglich wäre.

Leonidas

2004-12-26, 21:32:31

hmmm magst du mir einen link geben wo ich das nachlesen kann das das si nur 256 bit hat.

Bei eienr DualChip-Karte kannst Du generell davon ausgehen, daß der Hersteller beim Speicherinterface die beiden Interfaces der Chips zusammenzählt. Siehe Gigabyte GV-3D1.