PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: News des 23. Juni 2010


Leonidas
2010-06-24, 11:59:37
Link zur News:
http://www.3dcenter.org/news/2010-06-23

Coda
2010-06-24, 17:01:53
Leo bitte frag uns doch bevor du sowas schreibst.

24 ALUs sind es auf keinen Fall. Man kann einen Warp nicht in 2,66 Takten auf 12 ALUs ausführen. Es ergibt einfach null Sinn.

aths
2010-06-24, 17:05:25
Andersherum sind es auf keinen Fall 60 TMUs im Vollausbau beim GF104.

Coda
2010-06-24, 17:10:52
Jup. Es müssen 64 sein.

AnarchX
2010-06-24, 17:37:04
Das bezieht sich wohl auf einen GF104 mit 15 SMs je 24SPs.

greeny
2010-06-24, 18:55:09
akeabmahnungen der Kanzlei Nümann & Lang aufgetaucht [Gulli]
*n großes F für die Fakeabmahnungen schenk*

Leonidas
2010-06-24, 18:58:30
Leo bitte frag uns doch bevor du sowas schreibst.

24 ALUs sind es auf keinen Fall. Man kann einen Warp nicht in 2,66 Takten auf 12 ALUs ausführen. Es ergibt einfach null Sinn.


Genauer ausformulierte Grundlage?

Es müssen nahezu 24 (oder 48) sein. Weil: 384-24-24=336 oder 360-24=336. Und die 336 sind ja eine feststehende Größe. Mit den bisherigen 32 ist da nichts zu machen.



Das bezieht sich wohl auf einen GF104 mit 15 SMs je 24SPs.


Korrekt. Und da passen die 60 TMU zumindest rechnerisch.

Sir Winston
2010-06-24, 21:34:23
Ich finde es nicht sonderlich eindrucksvoll, dass Quanta "0.000 Prozessorkerne in einem Server-Rack" unterbringt... ;)

Coda
2010-06-24, 23:03:19
Genauer ausformulierte Grundlage?
Jegliche NVIDIA-GPU seit G80 arbeitet mit Thread-Paketen der Länge 32 (Warps). Bei G80 basierenden GPUs wird pro Pipeline-Stage mit 8 ALUs in 4 Takten gearbeitet, ab Fermi mit 16 ALUs und zwei Takten.

24 lässt sich nicht durch 16 teilen. Fertig.

Es sind nicht irgendwie einzelne 32 ALUs bei Fermi, es sind zwei Vec16-SIMD-Einheiten.

Booby
2010-06-25, 03:58:23
Wie wahrscheinlich wäre es dass nV die Thread-länge geändert hat?

Leo hat recht, mit vielfachen von 32 is bei 336 nix zu machen. Einzig 16 (21*16) und 24 (14*24) sind logisch. Bei 16-SM Clustern kommt man aber nicht auf 56 TMUs, sehr wohl aber bei 14 (*4).

Kann mir schwer vorstellen, dass die Cores halbiert werden können, also halbes 32-SM Cluster um die 336 zu erklären.

Es sind nicht irgendwie einzelne 32 ALUs bei Fermi, es sind zwei Vec16-SIMD-Einheiten.
Dann würden die MTUs aber immer noch nicht stimmen

Insofern stimmen entweder die 336 Shader nicht oder nV hat die Thread-länge verändert (48 Warps ).

Gegen die 16/32 spricht auch, dass nV in dem Fall gleich zwei Cluster deaktiviert hätte, wäre in etwa so wie max. eine GTX470 bei Fermi Release.

Außerdem würde bei Leos Ansatz der GF106 wesentlich mehr Bums bekommen, würde passen wenn es oberhalb des RV840 positioniert sein soll.

Klärt mich auf wenn ich ganz daneben liege.

Edit:

Hmm jetzt hab ich es:

Es könnten 48-SM Cluster sein: 48 SM + 8 TMU + 1(2) Polymorph. also 48*7, wobei 8 Cluster vorhanden wären.
Dies wäre anhand der Daten das Nächstliegende.
Könnte man eine zweite Polymorphengine einbauen? Sonst wäre man bei Tesselation zu arg beschnitten, wobei es wäre etwa RV870-Niveau.


GF106 hätte zwei Optionen:
288 Shader, 48 TMUs, 32 ROPs (mit 240 Shader am Anfang)
oder 192 Shader, 32 TMUs, 16 ROPs

Leonidas
2010-06-25, 05:33:54
Sehe das genauso: Zu den vorliegenden Daten passt (ohne Warperei) nur 24 oder 48. Eine 32 bei GF104 ist nahezu unmöglich.

Das vorstehende Posting deutet zudem dann in die Richtung, daß man mit 48 das Warp-Problem umgehen kann. Das würde auch zu den Vec16-Einheiten - drei Stück davon. Hätte die beschriebenen Nachteile bei der Tesselationsleistung der kleinen Chips, aber ist wenigstens technisch darstellbar.

Danke für alle Beiträge, ich werde das noch verarbeiten.

Coda
2010-06-25, 13:09:35
Wie wahrscheinlich wäre es dass nV die Thread-länge geändert hat?
Null. Es gibt keinen einzigen CUDA-Chip der eine andere Warp-Size hat. Das ist praktisch in Stein gemeiselt.

Kann mir schwer vorstellen, dass die Cores halbiert werden können, also halbes 32-SM Cluster um die 336 zu erklären.
Man braucht nichts "halbieren". Es sind 3x Vec16 pro SM.

Außerdem würde bei Leos Ansatz der GF106 wesentlich mehr Bums bekommen, würde passen wenn es oberhalb des RV840 positioniert sein soll.
Der "bums" wäre exakt gleich.

Es könnten 48-SM Cluster sein: 48 SM + 8 TMU + 1(2) Polymorph.
Ja. Ist es auch. Das war aber schon länger klar, deshalb irritiert mich das Posting von Leo noch mehr.

Sehe das genauso: Zu den vorliegenden Daten passt (ohne Warperei) nur 24 oder 48. Eine 32 bei GF104 ist nahezu unmöglich.
Ja. Das habe ich auch nie in Frage gestellt. Im Gegenteil.

Leonidas
2010-06-25, 15:21:33
Gut, Problem geklärt, Danke für alle Postings.