PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Wieviel TMUs hat der G80?


laser114
2007-04-28, 14:42:30
Moin,

mal eine eigentlich ganz simple Frage, die mich aber bei meinem Webstreifzug nicht sicher beantworten lies: Wieviel TMUs hat der G80? 64 oder doch nur 32? Oder hängt das davon ab, wie man misst?

AnarchX
2007-04-28, 14:46:39
64 TMUs hat der G80, aber nur 32 Textur Adress Units (TAUs), deshalb kommen die 64 TMUs erst bei 2x Bi-AF zur Geltung.

Sonyfreak
2007-04-28, 14:51:02
Das heißt, dass man 2xAF nahezu kostenlos einschalten kann oder wie?

mfg.

Sonyfreak

Dunkeltier
2007-04-28, 14:51:15
Und wie sieht es unter tri-Filterung aus?

AnarchX
2007-04-28, 14:58:16
Das heißt, dass man 2xAF nahezu kostenlos einschalten kann oder wie?

Aber wie schon gesagt nur 2x bilinearem AF, was aber wohl heutzutage keiner von uns Enthusiasten verwenden wird.

Und wie sieht es unter tri-Filterung aus?

Die wird dadurch eben entsprechend beschleunigt und zudem kann man sich auch eben das nahezu winkelunabhängige AF des G80 leisten.

Gast
2007-04-28, 15:24:51
Aber wie schon gesagt nur 2x bilinearem AF, was aber wohl heutzutage keiner von uns Enthusiasten verwenden wird.




Auch das nicht da beide Samples Caches belegen bzw Speicherbandbreite brauchen.

Sonyfreak
2007-04-28, 15:26:27
Aber wie schon gesagt nur 2x bilinearem AF, was aber wohl heutzutage keiner von uns Enthusiasten verwenden wird.Auf den Bugwelleneffekt können wir glaube ich alle sehr gut verzichten da hast du Recht.

Wieviele zusätzliche TMUs bräuchte man, um 2xAF vollkommen kostenlos zu machen? Würden da 3 TMUs pro TAU ausreichen oder lässt sich das nicht so einfach machen?

mfg.

Sonyfreak

AnarchX
2007-04-28, 15:28:45
Auch das nicht da beide Samples Caches belegen bzw Speicherbandbreite brauchen.
Das stimmt natürlich.


Wieviele zusätzliche TMUs bräuchte man, um 2xAF vollkommen kostenlos zu machen? Würden da 3 TMUs pro TAU ausreichen oder lässt sich das nicht so einfach machen?


Wie der Gast schon anmerkte, kann die Filterung theoretisch nicht kostenlos sein, wenn dann bräucht es wohl eine GPU-Architektur die um einiges anders ist als die heutigen.

robbitop
2007-04-28, 18:31:20
AF ist soziemlich kostenlos fuer die Bandbreite. Die Texturen liegen eh in den Caches, weil sie fuer die bilineare Filterung benoetigt werden. Zu einem sehr hohen Prozentsatz ist kein weiterer Zugriff auf den VRAM noetig (bei AF gibt es eine extrem hohe Cachehitrate).

Die TMUs beim NV50 (G80) koennen pro Takt 8 Point-Samples verarbeiten und bis 3 LERPs pro Takt schaffen.
Die vorgaenger TMUs schaffen pro Takt nur 4 Point-Samples und 2 LERPs.

In der Praxis filtern die G80 TMUs also deutlich fixer. Die TAs sollten in den wenigsten Faellen limitieren.

Gast
2007-05-01, 15:50:59
Moin,

mal eine eigentlich ganz simple Frage, die mich aber bei meinem Webstreifzug nicht sicher beantworten lies: Wieviel TMUs hat der G80? 64 oder doch nur 32? Oder hängt das davon ab, wie man misst?

Jeder der acht Vec16-Cluster verfügt über eine Quad-TMU, welche vier Texel adressieren und acht Texel filtern kann.


Q

Xmas
2007-05-01, 21:01:32
AF ist soziemlich kostenlos fuer die Bandbreite. Die Texturen liegen eh in den Caches, weil sie fuer die bilineare Filterung benoetigt werden.
Das stimmt so nicht, schließlich werden höher aufgelöste Mipmaps verwendet.

robbitop
2007-05-01, 23:15:06
Kommt drauf an. Wenn die zu filternde Textur nicht stark verzerrt ist (und noch nah am Betrachter dran ist), ist das MIP Level eh noch sehr klein und somit braucht man die hochaufgeloeste MIP eh. Bei hoeherer Verzerrung und Entfernung stimmt das allerdings ja. Die Cachehitrate ist ja auch nicht 100%. In der Praxis ist das jedenfalls vernachlaessigbar.

Coda
2007-05-01, 23:43:08
Könnte man theoretisch mit dem Perfkit ausmessen, wenn's das mal für G80 geben würde.

Gast
2007-05-03, 23:04:02
G80: 32 TMUs
R600: nur 16 TMUs


Wie wirkt sich das auf die Leistung aus? Ist das die Schwäche des R600?

Gast
2007-05-03, 23:05:53
In UT2004 sicherlich. ;)


Q

robbitop
2007-05-04, 07:32:14
Da man Texturfilterleistung immer und ueberall braucht, wird das sicher so gut wie ueberall zu einem gewissen Teil durchschlagen. Besonders mit AF.
Der G80 hat pro Takt bis zu 4x so viel Fuellrate wie der R600.

Gast
2007-05-05, 21:41:46
G80: 32 TMUs
R600: nur 16 TMUs


Wie wirkt sich das auf die Leistung aus? Ist das die Schwäche des R600?


kommt darauf an was die TMUs können, wenn es nur herkömliche bilineare TMUs sind, wird es der R300 ziemlich schwer haben.

robbitop
2007-05-05, 21:43:06
Es sind laut den geleakten Folien 16 bi TMUs, die allerdings bei FP16 keine Leistung verlieren.

reunion
2007-05-05, 22:03:45
Naja, wenn man sich die ersten Benchmarks so ansieht, dann scheint sich die XT ziemlich genau zwischen GTS und GTX platzieren zu können, mit Tendenz zur GTX in zukünftigen Spielen laut AiL. Wenn man jetzt wie schon gesagt bedenkt, dass R600 nur 1/4 der Texelfüllrate eines G80 pro Takt hat, dann scheint diese wohl keine sonderlich große Rolle mehr zu spielen, und/oder die 16 R600-TMUs sind verdammt effektiv was ihre Auslastung betrifft.

robbitop
2007-05-05, 22:05:31
Laut geleakten Folien hat R600 noch pro Quad TMU 4 Point Sampler, die Vertexfetches und andere Dinge erledigen. Auch hilft A.I. bis zu einem gewissen Grad (und der hohe Rohtakt).

AnarchX
2007-05-05, 22:07:17
Wenn man jetzt wie schon gesagt bedenkt, dass R600 nur 1/4 der Texelfüllrate eines G80 pro Takt hat, dann scheint diese wohl keine sonderlich große Rolle mehr zu spielen, und/oder die 16 R600-TMUs sind verdammt effektiv was ihre Auslastung betrifft.

Oder ATi hat in den vergangen Monaten, nachdem die Texelleistung des G80 bekannt war, nochmal extrem am Filter optimiert.
Ich bin schon gespannt auf AI off Benches @ HT4u.;)

reunion
2007-05-05, 22:13:54
Laut geleakten Folien hat R600 noch pro Quad TMU 4 Point Sampler, die Vertexfetches und andere Dinge erledigen. Auch hilft A.I. bis zu einem gewissen Grad (und der hohe Rohtakt).

Selbst taktbereinigt hat eine GTX noch immer eine >3x höhere Texelfüllrate. Das kann man mit AI niemals ausgleichen, selbst mit reiner bi Filterung nicht. Vielleicht können es diese mysteriösen Point Samples rausreißen, aber die dürfte ja auch bei weitem nicht immer von Vorteil sein.

Oder ATi hat in den vergangen Monaten, nachdem die Texelleistung des G80 bekannt war, nochmal extrem am Filter optimiert.
Ich bin schon gespannt auf AI off Benches @ HT4u.;)

Weniger als reine bi Filterung bringt bei bi TMUs keine Mehrleistung mehr. Aber das wird sich ATi erstens niemals erlauben können, und zweitens würde selbst das nur eine Verdoppelung der Füllrate bringen. Das Optimierungspotential ist hier also stark begrenzt. Bleibt noch immer ein beträchtlicher Vorteil des G80, der aber in Spielen wohl nicht annähernd so stark zur Geltung kommt.

robbitop
2007-05-05, 22:15:35
Du vergisst, dass selten eine reine Fuellratenlimitierung vorliegt und dass es auch Dinge gibt, wo tri TMUs nichts nuetzen.

reunion
2007-05-05, 22:31:00
Du vergisst, dass selten eine reine Fuellratenlimitierung vorliegt und dass es auch Dinge gibt, wo tri TMUs nichts nuetzen.

Das vergesse ich nicht, sonder darauf will ich hinaus. Ati konnte von R420 über R520 bis zu R600 die Leistung wohl annähernd vervierfachen, obwohl die peak Texelfüllrate nur marginal stieg. Natürlich dürfte die Effektivität erheblich gesteigert worden sein (die R600 TMUs sollen ja auch stark auf möglichst niedrige Latenzen optimiert worden sein), trotzdem zeigt sich zum einen, dass die Bedeutung der Texelfüllrate abnimmt, und zum anderen, dass theoretischen Zahlen eben nicht alles sind. Aber für eine finale Beurteilung bedarf es da sicherlich noch mehr Eindrücke zu R600.

robbitop
2007-05-05, 23:15:48
Wie du schon sagtest stieg die effektive Fuellrate (und auch die Rohfuellrate dank Takt) erheblich. Gerade bei R580 brachte neben der Entkoplung auch die Erhoehung der ALU Anzahl einiges. Die TMUs muessen immer weniger warten. Beim R600 fallen auch die Vertex/Pixel Fetches weg.
Rohpower allein ist eben nicht alles. :)

Das meine ich als Ergaenzung zu dem von dir dargstellten Trend hinsichtlich des TEX-ALU Verhaeltnises.

Gast
2007-05-05, 23:33:59
Du vergisst, dass selten eine reine Fuellratenlimitierung vorliegt und dass es auch Dinge gibt, wo tri TMUs nichts nuetzen.

die füllrate scheint aber noch immer der wichtigste faktor zu sein wenn grafiklimitierung vorliegt, die tests bei anandtech haben gezeigt dass selbst der G80 mit seiner brachialen füllrate noch immer stärker mit dem TMU-takt als mit dem shadertakt skaliert.

beim vergleich R520 vs. R580 fällt auch auf, dass der R580 mit 3-facher arithmetikpower selbst in als shaderlastig geltenden spielen maximal doppelt so schnell ist, die limitierung dürfte also beim R580 weitestgehend auf TMU-seite sein, und das ganze trotz aller möglichen AI-tricks.

auch wenn die rohleistung alleine recht wenig aussagt glaube ich kaum dass der R600 in heutiger software eine chance gegen den G80 hat, es sei denn die TMUs haben noch irgendwelche "unvorhergesehenen" fähigkeiten.

die 4 pointsampler dürften heute noch praktisch garnichts bringen (offenbar geht ATI hier genau den umgekehrten weg wie NV, während auf der einen seite die filtereinheiten doppelt ausgelegt sind, sind es auf der anderen seite die adresseinheiten, denn viel mehr als adresseinheiten sind die point-sampler ja nicht)

sollte FP16-filtering for free sein, könnte der R600 bei entsprechender software natürlich einiges gutmachen, vor allem könnte er dann mal seine enorme bandbreite ausspielen, bei NV würde es ja kaum was bringen wenn die TMUs FP16 in einem takt filtern könnten, da ja die bandbreite viel zu gering ist.