PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Was limitiert beim G80?


Wuge
2007-05-30, 21:16:19
Moin, heute mal eine Frage zu Grafikchips. Exemplarisch habe ich mal den G80 ausgewählt, da ich dessen logisches Design in etwa kenne und mich dafür interessiere.

Nun würde mich mal folgendes interessieren. Wenn ich div. Artikel richtig interpretiere, limitieren bei sehr aufwändigen Shaderprogrammen die ALUs, bei vielen Texturen und AF die Filtereinheiten und bei hoher Auflösung und AA die ROPs.

Wie stellt sich das in der Praxis dar? Wo bilden sich Flaschenhälse bei real-life-3-D-Anwendungen und bei welchen Settings heraus?

=Floi=
2007-05-30, 21:18:41
der prozessor ;)

Brotzeit
2007-05-30, 21:48:14
In realen anwendnungsfällen dürfte der Prozessor tatsächlich oft limitieren, allerdings gibt es auch 3d Szenen die garnicht genug Grakaleistung bekommen können.

Wo intern die Graka dann limitiert würd mich auch mal interessieren ;)

Wuge
2007-05-30, 22:06:59
Bei mir limitier fast immer die Grafikkarte. Ist nur ne Frage der Auflösung.

Also zur Klarstellung: Was limitiert im Grafik-Chip, wenn ein 10 GHz C2Q vorhanden ist ;)

deekey777
2007-05-30, 22:08:20
Moin, heute mal eine Frage zu Grafikchips. Exemplarisch habe ich mal den G80 ausgewählt, da ich dessen logisches Design in etwa kenne und mich dafür interessiere.

Nun würde mich mal folgendes interessieren. Wenn ich div. Artikel richtig interpretiere, limitieren bei sehr aufwändigen Shaderprogrammen die ALUs, bei vielen Texturen und AF die Filtereinheiten und bei hoher Auflösung und AA die ROPs.

Wie stellt sich das in der Praxis dar? Wo bilden sich Flaschenhälse bei real-life-3-D-Anwendungen und bei welchen Settings heraus?

Der G80 scheint keine Flaschenhälse zu haben. Eine Limitierung kann eigentlich nur dann vorliegen, wenn der G80 durch sich selbst ausgebremst wird, was nicht zu passieren scheint.

Coda
2007-05-30, 22:17:21
Die Frage lässt sich nicht beantworten. Es kommt ganz auf die Anwendung an.

Gast
2007-05-30, 22:38:00
Oder anders ausgedrückt: Das Design ist so ausgewogen, dass es keine tendenziell heraus kristalisierende Limitierungen gibt.

Gast
2007-05-31, 00:19:32
Sprich, liefert der G80 keine "spielbaren" FPS für dich, geht dem gesamten Packet die Puste aus, muss man an allen "Taktschrauben" ansetzen um mehr FPS zu bekommen.
In hohen Auflösungen limitiert "tendenziell" die Speicherbandbreite und die RAM Größe (abhängig von der Texturemenge), dazu kommt noch der AA Modus (SSAA mal außen vorgelassen, da isses bedingt die Füllrate).

Gast
2007-05-31, 07:43:32
In hohen Auflösungen limitiert "tendenziell" die SpeicherbandbreiteDer Füllraten- und Shaderleistungsbedarf steigt mit Erhöhung der Auflösung ebenso stark wie der Bedarf an Speicherbandbreite.

Gast
2007-05-31, 10:45:09
Durch den Trend zum Shader wird in naher Zukunft wohl die arithmetische Leistung limitieren.

Der G80 ist nach heutigem öffentlichen Kenntnisstand für die derzeitigen Anforderungen relativ ausgewogen, dies kann sich aber in der Zukunft ändern.

seahawk
2007-05-31, 10:52:29
Sweeney sieht das für die kommende Unreal Engine aber etwas anders.

Gast
2007-05-31, 11:04:19
Sweeney sieht das für die kommende Unreal
Engine aber etwas anders.

Kein Wunder, da er öffentlich angibt, eine 8800GTX als primäre Entwicklungsplattform zu verwenden.

Gast
2007-05-31, 11:05:55
Der G80 scheint keine Flaschenhälse zu haben. Eine Limitierung kann eigentlich nur dann vorliegen, wenn der G80 durch sich selbst ausgebremst wird, was nicht zu passieren scheint.

Was ist denn das für ein Quark? Irgendetwas muss limitieren, sofern der G80 nicht in der Lage ist, die naturgesetze zu brechen, was nach heutigen Kentnisstand nicht der Fall ist. Ich würde sagen am häufigsten dürfte die Shaderfüllrate limitieren.

Grestorn
2007-05-31, 11:07:20
Kein Wunder, da er öffentlich angibt, eine 8800GTX als primäre Entwicklungsplattform zu verwenden.
Was hätte er sonst nehmen sollen? Und was spielt die für die Entwicklung seiner Engine verwendete HW für eine Rolle bei der Betrachtung, ob Arithmetik oder Füllrate in Zukunft wichtiger sein werden?

Gast
2007-05-31, 11:07:57
Oder anders ausgedrückt: Das Design ist so ausgewogen, dass es keine tendenziell heraus kristalisierende Limitierungen gibt.

Auch das kommt einzig und alle auf die Anwendung drauf an.

Grestorn
2007-05-31, 11:08:07
Ich würde sagen am häufigsten dürfte die Shaderfüllrate limitieren.
Was ist eine "Shaderfüllrate"?

Gast
2007-05-31, 11:09:18
Was hätte er sonst nehmen sollen? Und was spielt die für die Entwicklung seiner Engine verwendete HW für eine Rolle bei der Betrachtung, ob Arithmetik oder Füllrate in Zukunft wichtiger sein werden?

Ich denke es ist naheliegend, dass es die Bedürfnisse seiner Engine auf die Chips anpasst, mit denen man programmiert.

Gast
2007-05-31, 11:09:57
Was ist eine "Shaderfüllrate"?

Arithmetische Rechenleistung.

Mr.Magic
2007-05-31, 11:39:47
Ich denke es ist naheliegend, dass es die Bedürfnisse seiner Engine auf die Chips anpasst, mit denen man programmiert.

Ich dachte bei DX10 sind keine Extrawürste mehr möglich/nötig?! :confused:

IceLord
2007-05-31, 11:50:04
Ich dachte bei DX10 sind keine Extrawürste mehr möglich/nötig?! :confused:
Man kann aber z. B. mehr oder weniger Shaderlastig programmieren.

blutrausch
2007-05-31, 12:02:48
ich denke der G80 ist recht ausgewogen,in zukunft wird es sicherlich knapp werden bei der arithmetische leistung wenn man da titel wie oblivion schon heute sieht.....sicher würde ein höher getakteter chip auch nicht schaden oder eine höhere bandbreite,siehe 512bit beim R600 aber es kommt halt immer drauf an was man daraus macht(AA/AF R600 ;) )

seahawk
2007-05-31, 13:21:00
Lest das ganze Interview und wofür EPIC DX10 nutzt. Das könnte dem R600 aber ganz und gar nicht schmecken.

Gast
2007-05-31, 13:52:29
Man kann aber z. B. mehr oder weniger Shaderlastig programmieren.


in der regel will man aber gewisse effekte programmieren und diese benötigen ein gewisses maß an arithmetik- und texturoperationen. man wird normalerweise nicht darauf schauen wie das verhältnis von arithmetik- zu texturleistung in einer GPU aussieht und danach die effekte auswählen die eingebaut werden.

Coda
2007-05-31, 14:59:52
Lest das ganze Interview und wofür EPIC DX10 nutzt. Das könnte dem R600 aber ganz und gar nicht schmecken.
Welches Interview?

dildo4u
2007-05-31, 15:07:17
Welches Interview?

"Most effects of UT3 are more bound to the fillrate than to basic features like geometry processing..."

http://forums.epicgames.com/showthread.php?t=571019

Wuge
2007-05-31, 17:29:58
Also limitiert die Speicherbandbreite am ehesten?

(Irgendwas muss limitieren, sonst wäre das Ding unendlich schnell ;)

// Gehen wir mal von 1920x1200, 4xAA und 16QAF aus

Shader mal aussen vor (das hängt zu sehr vom Game ab). Kommt eine Einheit im Chip an die Grenzen oder limitiert die Bandbreite?

Gast
2007-05-31, 17:34:22
[QUOTE=Wuge;5545207]

(Irgendwas muss limitieren, sonst wäre das Ding unendlich schnell ;)

QUOTE]

Unendlich schnell wäre nur mit unendlich hohem Takt zu erreichen. :)

deekey777
2007-05-31, 17:42:43
Was ist denn das für ein Quark? Irgendetwas muss limitieren, sofern der G80 nicht in der Lage ist, die naturgesetze zu brechen, was nach heutigen Kentnisstand nicht der Fall ist. Ich würde sagen am häufigsten dürfte die Shaderfüllrate limitieren.
Und jetzt erklär mal, wie die Shaderfüllrate limitieren soll - insbesondere von der Threadfrage ausgehend.

Beim G80 gibt es schon einige Designentscheidungen, die sich in bestimmten Fällen nachteilig auswirken können (zB Filterung bestimmter Formate mit halben Speed), aber sonst?

HOT
2007-05-31, 18:03:25
Lest das ganze Interview und wofür EPIC DX10 nutzt. Das könnte dem R600 aber ganz und gar nicht schmecken.
Finde ich nicht. Die neue Engine setzt massiv auf Multisamplingeffekte (auch in Shadern) HDR FP16 Rendering Rendering (offenbar inklusive HDR Texturesets) und 64Bit Support um mit sehr grossen Datenmengen umgehen zu können und zusätzlich sehr grosser Geometrielast. Das sind alle Features, die dem R600 sogar sehr schmecken könnten. In Sachen Füllrate hat der R600 keinen Nachteil, wenn entsprechende Texturen genutzt werden. Es ist alles auch eine Sache des Contents, nicht nur der Technik.
Auch in Sachen I/O und Threading weiss man nicht, ob der R600 oder der G80 jetzt besser ist. Meiner Meinung nach ist alles offen, keiner kann sagen, ob die Engine jetzt besser hier oder dort performt.

NV hat sich gedacht, dass hohe Render-Rohleistung mit akzeptabler Shaderpower und einem Kompromiss im Speicherinterface am besten fährt - und das tun sie ja auch, jedenfalls noch. Flaschenhälse gibt es immer mal, aber was beim G80 am meisten limitiert ist schwer zu sagen, es kann ja auch die Lastverteilung oder das Threading limitieren... wer weiss. Wenn man das mit dem G70 vergleicht, hat der auch keinen wirklichen Flaschenhals - er ist nur unflexibler als die R5xx. Das stellte sich aber auch erst spät als Nachteil heraus. Vllt läufts auch so wie beim R420, der sich ja trotz einfacherer Architektur ganz gut gegen NV40/G70 behauptete - bis heute.

Gast
2007-05-31, 18:24:57
Also limitiert die Speicherbandbreite am ehesten?

(Irgendwas muss limitieren, sonst wäre das Ding unendlich schnell ;)

// Gehen wir mal von 1920x1200, 4xAA und 16QAF aus

Shader mal aussen vor (das hängt zu sehr vom Game ab). Kommt eine Einheit im Chip an die Grenzen oder limitiert die Bandbreite?

Bei der GTS wird die Speicherbandbreite knapp, bei der GTX schwer zu sagen, die ROPs sind für AA wohl so mächtig das eher Füllrate und Speicherbandbreite limitieren bevor irgend eine Einheit auf die die AA Loops der ROPs warten muss.

Wenn TSSAA aktiv ist dann klar Füllrate. TSMSAA is ja fast immer gratis bzw. frist 5%

=Floi=
2007-05-31, 18:28:52
es gibt anzeichen dass der vram limitiert (auch bei den 768mb versionen)
irgendiwe verbraucht der R580 am wenigsten vram, der G71 mittel und der G80 aber ganz viel vram bei gleichen einstellungen
naja das sollte aber im alltag weniger limitieren aber tritt teilweise auf wenn es in solche auflösungen geht
schau mal in den vram thread da wurden am anfang 512mb karten verglichen und hinterher dann ist die gtx dabei


---
edit
ich finde es schon erstaunlich wie die cpu abhängigste 3d shooter engine ausgerechnet jetzt extrem an der graka hängen sollte und dann auch noch massiv von sli profitiert
ich würde es mir so wünschen aber glauben kann ich es nicht

Coda
2007-05-31, 18:30:12
In Sachen Füllrate hat der R600 keinen Nachteil, wenn entsprechende Texturen genutzt werden.
Werden sie aber nicht. Niemand verwendet unkomprimierte FP16-Texturen für Albedo oder Normalmaps und der Rest ist völlig vernachlässigbar, zumal es auch keine Lightmaps in der UE3 gibt.

Was du mit "Multisampling-Effekten" meinst ist mir auch völlig schleierhaft.

HOT
2007-05-31, 18:40:06
Werden sie aber nicht. Niemand verwendet unkomprimierte FP16-Texturen für Albedo oder Normalmaps und der Rest ist völlig vernachlässigbar, zumal es auch keine Lightmaps in der UE3 gibt.

Was du mit "Multisampling-Effekten" meinst ist mir auch völlig schleierhaft.
Schon klar was du damit meinst. Aber das muss erstmal überhaupt limitieren, was ich nicht glaube. Laut den Aussagen einiger Forennutzer (z.B. Hardwareluxx) ist AF ja auf dem R600 z.B. sehr schnell, nur AA haut rein. Ich frage mich, ob die Texelfüllrate überhaupt irgendwo limitierend wirkt ggü dem G80 (wenn man jetzt net unbedingt in 640x480 bencht :D). Ein Test ohne AA aber mit AF wär meiner Meinung mal Aufschlussreich und könnte Licht in diese Sache bringen.
Was ich mit Multisamplingeffekten meine weiss ich selber net ;). Aber ATI redet von ShaderAA. Das ist ja bei manchen Shaderprogrammen durchaus wünschenswert, so flimmerig wie diese Effekte teilweise sind. Jedoch weiss ich nicht, ob man dafür Multisampling nutzen kann... ist wahrscheinlich eher eine Sache wie man das nutzt. Die EPIC Leute reden jedenfalls davon, dass Multisampling viele optische Vorteile bringt. Wenn sowas jetzt in so einem Kontext, wo 4x MSAA schon längst Standard ist kommt, macht mich das stutzig... auch wenn meine Schlussfolgerung zugegebenermassen vllt. etwas verfrüht war.

Super Gastespam wieder :D. Bin für Regpflicht langsam ;).

AnarchX
2007-05-31, 18:52:55
Ich frage mich, ob die Texelfüllrate überhaupt irgendwo limitierend wirkt ggü dem G80 (wenn man jetzt net unbedingt in 640x480 bencht :D). Ein Test ohne AA aber mit AF wär meiner Meinung mal Aufschlussreich und könnte Licht in diese Sache bringen.


AF-Skalierung @ CB (http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_ati_radeon_hd_2900_xt/8/#abschnitt_aa_und_af_skalierung)

Da sieht man recht gut, dass AF beim R600 doch um einiges teurer ist als beim G80.

dargo
2007-05-31, 19:45:16
Bei der GTS wird die Speicherbandbreite knapp, bei der GTX schwer zu sagen, die ROPs sind für AA wohl so mächtig das eher Füllrate und Speicherbandbreite limitieren bevor irgend eine Einheit auf die die AA Loops der ROPs warten muss.

Hä? Die GTS hat sogar bei der Speicherbandbreite Vorteile gegenüber der GTX, wenn man sich das Verhältnis mal anschaut.

GTX vs. GTS:
Pixelfüllrate - 13800 zu 10000 MPix/s
Texelfüllrate - 36800 zu 24000 MTex/s
FLOPs - 518 zu 346 GFLOPs
Speicherbandbreite - 86,4 zu 64GB/s

Also, wenn ich das richtig sehe limitiert bei der GTS alles andere, aber nicht die Speicherbandbreite.

:o)Uhummel
2007-06-02, 15:08:28
Denke mal, das bald das 384-Bit-Speicherinterface die Leistung bei sehr hoher BQ und Auflösungen ausbremsen könnte. -Aber bis dahin limitieren eher andere Faktoren wie z.B. Shaderpower ...

Gast
2007-06-02, 15:50:53
Denke mal, das bald das 384-Bit-Speicherinterface die Leistung bei sehr hoher BQ und Auflösungen ausbremsen könnte.

das limitiert höchstens mit AA-modi mit 8xMSAA als basis, mit 4xMSAA+CSAA sollte das kaum limitieren.

RavenTS
2007-06-02, 16:01:08
das limitiert höchstens mit AA-modi mit 8xMSAA als basis, mit 4xMSAA+CSAA sollte das kaum limitieren.

Außerdem könnte man dies durch höher getakteten Speicher etwas ausgleichen...

dargo
2007-06-02, 16:12:43
Denke mal, das bald das 384-Bit-Speicherinterface die Leistung bei sehr hoher BQ und Auflösungen ausbremsen könnte. -Aber bis dahin limitieren eher andere Faktoren wie z.B. Shaderpower ...
Warum denn? Ich denke, dass zb. 115,2GB/s noch locker reichen werden. Das ganze ist mit 1,2Ghz und GDDR4 realisierbar.

Gast
2007-06-03, 10:15:11
Denke mal, das bald das 384-Bit-Speicherinterface die Leistung bei sehr hoher BQ und Auflösungen ausbremsen könnte.Bei einer höheren Auflösung steigen die Anforderungen an Füllrate und Shaderleistung genauso stark wie die an die Bandbreite.

Coda
2007-06-03, 13:05:17
Schon klar was du damit meinst. Aber das muss erstmal überhaupt limitieren, was ich nicht glaube. Laut den Aussagen einiger Forennutzer (z.B. Hardwareluxx) ist AF ja auf dem R600 z.B. sehr schnell, nur AA haut rein.
Nach den Benchmarks die ich gesehen hab ist auch AF auf dem R600 sehr teuer.

Ich frage mich, ob die Texelfüllrate überhaupt irgendwo limitierend wirkt ggü dem G80
Mit Sicherheit.

(wenn man jetzt net unbedingt in 640x480 bencht :D).
Das hat mit der Auflösung nichts zu tun.

Aber ATI redet von ShaderAA. Das ist ja bei manchen Shaderprogrammen durchaus wünschenswert, so flimmerig wie diese Effekte teilweise sind.
Ich wusste dass das irgendwann kommt. Das hat NICHTS mit der Reduzierung von Shaderflimmern zu tun. Da geht's nur um das endgültige Downsampling. Das nachträgliche reduzieren von flimmrigen Shadern ist nur per Supersampling möglich. Ja, das Bluring von den neuen "AA-Modi" schwächt das auch ab, aber das ist nun wirklich nicht was wir wollen.

Jedoch weiss ich nicht, ob man dafür Multisampling nutzen kann... ist wahrscheinlich eher eine Sache wie man das nutzt. Die EPIC Leute reden jedenfalls davon, dass Multisampling viele optische Vorteile bringt.
Ha? Es glättet halt die Kanten. Wie immer schon.

Wenn sowas jetzt in so einem Kontext, wo 4x MSAA schon längst Standard ist kommt, macht mich das stutzig... auch wenn meine Schlussfolgerung zugegebenermassen vllt. etwas verfrüht war.
Da geht's wohl ganz einfach drum, dass sie deferred shading machen, womit Multisampling erst wieder mit D3D10 möglich ist. Ganz einfach.