PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : AMD/ATI - R700 im Q1 2008, multicore und 55 nm?


Seiten : 1 2 3 [4] 5

GeneralHanno
2008-01-09, 15:32:35
Die news gibt im Kontext aber nur Sinn, wenn sie sich auf 2008 bezieht ...

laser114
2008-01-09, 15:55:25
Auf der CES in Las Vegas hatte PCGH die Möglichkeit einen exklusiven Blick auf die Dual-DPU-Grafikkarte HD3870 X2 zu werfen.
[...]
Nach Aussagen von AMD sei die Karte aber durchaus konkurrenzfähig. Obwohl es sich bei der R680 um zwei HD3870-Chips handelt, die sich auf einem PCB befinden, hat es AMD geschafft die Taktraten nochmals deutlich zu steigern - die GPUs sollen mit 825 MHz laufen.

http://www.pcgameshardware.de/?article_id=627309

AnarchX
2008-01-09, 15:58:28
Re: R700 im Q1 2008, multicore und 55 nm?

:|

Aber nicht verwunderlich, da ja ATi von "Over 1 TFLOPs" in den Folien sprach. Scheint wohl doch etwas A12 dran zu sein, welche Sapphire auch für ihre 904MHz 3870 verwenden soll.

laser114
2008-01-09, 15:59:32
Och man, in den letzten Tagen erwische ich immer die falschen Threads. :(

laser114
2008-01-09, 18:38:47
So, nun aber richtiger Thread:

Nach Fudzillas Infos (http://www.fudzilla.com/index.php?option=com_content&task=view&id=5058&Itemid=1) besteht R700 aus zwei RV770-Chips. (Eher spätes) Zweites Quartal 2008 wird als Launch anvisiert.

Nakai
2008-01-09, 18:49:49
So, nun aber richtiger Thread:

Nach Fudzillas Infos (http://www.fudzilla.com/index.php?option=com_content&task=view&id=5058&Itemid=1) besteht R700 aus zwei RV770-Chips. (Eher spätes) Zweites Quartal 2008 wird als Launch anvisiert.

Das glaube ich nicht. Was soll dann der RV770 werden?

Mal ein bisschen Spekulatius:
Das neue Stepping des Rv670 also A13 lässt sich leicht hochtakten. Der RV770 wird dann speziell fürs Speichermanagement getrimmt.
Vll werden die Shader des Chips höher getaktet als der Rest und vll werden auch die TMUs etwas getrimmt.

Man erweiter die TMUs mit Filtereinheiten, dann höher taktbare Shader und dann wird das Ding noch auf Multicore getrimmt.
Dann wäre der Chip ~800Millionen Transistoren fett.

Coretakt: 900Mhz
Shadertakt: 1,350Mhz

16 DoppelTMUs * 900 = 14400MTex/s
64*10*1,35 = 864TFlops

Vll noch ein bisschen höhere Taktraten und man würde nahe an 2 TFlops rankommen.

Andersrum könnte man alle Einheiten um 50% erhöhen und den Takt dementsprechend auf 950Mhz hochschieben.

24TMUs * 950 = 22800MTex/s
96*10*0,95 = 912GFlops


Naja keine Ahnung...


mfg Nakai

AnarchX
2008-01-09, 20:16:59
Mehr als 2 Z pro ROP, 32TA/TFs und mehr oder/und höher getaktete oder/und effizientere SPs wären doch durchaus ein netter RV770 und sollte sich bei <300mm² bei 55nm machen lassen. Schliesslich klatscht man halt zwei davon wieder auf das X2-PCB.

Das Speichermanagment bzw. non-AFR soll wohl eher auf den 2009-R700 zutreffen, der dann in 45nm kommt und deswegen sich verschob, da der Prozess noch nicht zur Verfügung steht.

Nakai
2008-01-09, 20:37:59
Mehr als 2 Z pro ROP, 32TA/TFs und mehr oder/und höher getaktete oder/und effizientere SPs wären doch durchaus ein netter RV770 und sollte sich bei <300mm² bei 55nm machen lassen. Schliesslich klatscht man halt zwei davon wieder auf das X2-PCB.

Jedenfalls muss man die Filterleistung oder die Anzahl der TMUs drastisch erhöhen.
Die SPs sind schon relativ gut ausgelastet, ein paar Verbesserungen wären sicherlich nicht schlecht.
Da man wohl keinen höheren Takt erreichen kann als 1000Mhz, sollte man die Anzahl der SPs etwas erhöht.
Ich denke man steigert einfach alle Einheiten um 50% und erhöht den Takt auf 900Mhz darum.
Der R700 wurde ja nach hinten geschoben, deswegen glaube ich nicht, dass man da soviel verändert.

Das wäre etwa 60% theoretische Mehrperformance.

Bei einem X2-Gespann würde man etwa bei 3mal RV670 liegen.


mfg Nakai

Gmax
2008-01-09, 20:45:07
Man erweiter die TMUs mit Filtereinheiten, dann höher taktbare Shader und dann wird das Ding noch auf Multicore getrimmt.
Dann wäre der Chip ~800Millionen Transistoren fett.

Coretakt: 900Mhz
Shadertakt: 1,350Mhz

16 DoppelTMUs * 900 = 14400MTex/s
64*10*1,35 = 864TFlops

Vll noch ein bisschen höhere Taktraten und man würde nahe an 2 TFlops rankommen.

Andersrum könnte man alle Einheiten um 50% erhöhen und den Takt dementsprechend auf 950Mhz hochschieben.

24TMUs * 950 = 22800MTex/s
96*10*0,95 = 912GFlops

Irgend eine Chance gegen nVs nächste High-End? Hört sich eher noch gehobener Mittelklasse an ;(

deekey777
2008-01-09, 20:45:33
Dem RV670 fehlt es bestimmt nicht an der ALU-Leistung, sondern an Tex-Leistung: Was spricht gegen höher getaktete "Filter-Transistoren" bei kommenden GPUs?

AnarchX
2008-01-09, 20:53:11
Wird wohl nicht gehen, da sie doch um einiges komplexer sind als die relativ simplen ALUs.
Ansonsten hätte NV wohl auch bei G80 alles auf die Höhe der Shaderdomain gebracht.

Nakai
2008-01-09, 22:01:52
Naja die Anzahl der Einheiten des RV670 zu erhöhen, sollte auch kein Problem sein.
Die Architektur scheint ja sehr flexibel zu sein.

Der RV770 wird wahrscheinlich eh nur ein gepimpter RV670 sein.
Vll tauft man die A13 Rev des RV670 in RV770 um und verwendet ihn für die neue Generation.
Namen sind ja Schall und Rauch, wär nicht das erste Mal, dass ATI alte Karte für ne neue Generation ausgibt, wäre aber diesmal der Codename.


mfg Nakai

Coda
2008-01-09, 22:05:50
ALUs sind wohl einfacher höher zu takten. Die Filter haben wohl recht viele Gates pro Pipeline-Stage.

Naja die Anzahl der Einheiten des RV670 zu erhöhen, sollte auch kein Problem sein.
Die Architektur scheint ja sehr flexibel zu sein.
Da hab ich aber anderes vernommen. Vor allem was das ALU:Tex-Ratio angeht.

laser114
2008-01-09, 22:11:47
Da hab ich aber anderes vernommen. Vor allem was das ALU:Tex-Ratio angeht.

RV610/620: 8 ALUs, 4 TMUs
RV630/635: 24 ALUs, 8 TMUs
R600/RV670: 64 ALUs, 16 TMUs

Sieht IMHO doch relativ flexibel aus. ;)

Spekulation von mir: RV770 = dreifacher RV635 (mit 256 Bit)?

reunion
2008-01-09, 22:24:51
RV610/620: 8 ALUs, 4 TMUs
RV630/635: 24 ALUs, 8 TMUs
R600/RV670: 64 ALUs, 16 TMUs

Sieht IMHO doch relativ flexibel aus. ;)

Spekulation von mir: RV770 = dreifacher RV635 (mit 256 Bit)?

Eben, die Architektur scheint höchst flexibel zu sein. Auch die ROP-Anzahl scheint sich völlig unabhängig von SI oder den anderen Einheiten skalieren zu lassen. Ich denke allerdings schon, dass ein RV770 mehr ist als nur ein breiterer RV670, da wird es schon noch die ein oder anderen Verbesserungen geben.

BlackBirdSR
2008-01-09, 22:30:48
Nur als Frage:
Warum sollte man ein bestehendes, funktionierendes Design schnell wieder verwerfen, wenn man es weiter benutzen kann?
Was heute die RV670 X2 ist, könnte Morgen in kleinerem Prozess RV770 sein. DIe Chips sind schon jetzt relativ klein und genügsam. Die Leistung dürfte für ein Performanceprodukt ausreichend sein, die eingesparten Kosten sind immens. DX10.1 bleibt ja..

Aber ist nur so eine Frage.

deekey777
2008-01-09, 22:43:45
Naja die Anzahl der Einheiten des RV670 zu erhöhen, sollte auch kein Problem sein.
Die Architektur scheint ja sehr flexibel zu sein.
...

mfg Nakai
Es ist nicht einfach, die Anzahl der Einheiten zu erhöhen, eher im Gegenteil.
Die ALU-SIMDs sind mit den TEX-SIMDS verknüpft:
TEX ALU-SIMD1 ALU-SIMD2 ALU-SIMD3 ALU-SIMD4
A A A A A
B B B B B
C C C C C
D D D D D

Man kann zwar einzelne ALU-SIMDs deaktivieren, aber nicht einzelne Quads, denn die TEX-Quads sind mit den ALU-Quads verknüpft (TEX-Quad A füttert die ALU-Quads A1, A2, A3, A4 usw.) Für mich ergibt sich nur die folgende Überlegung: Man hängt weitere SIMDs dran. Oder die Texturenleistung wird aufgemotzt (AABBCCDD). Einzelne Quads "dranhängen" kommt nicht in Frage, denn das würde zur Erhöhung der Threadgröße führen.

laser114
2008-01-09, 23:04:32
Warum sollte man ein bestehendes, funktionierendes Design schnell wieder verwerfen, wenn man es weiter benutzen kann?
Was heute die RV670 X2 ist, könnte Morgen in kleinerem Prozess RV770 sein. DIe Chips sind schon jetzt relativ klein und genügsam. Die Leistung dürfte für ein Performanceprodukt ausreichend sein, die eingesparten Kosten sind immens. DX10.1 bleibt ja..

Welchen kleineren Prozess willst du denn nehmen? Da gibts in den nächsten Quartalen erstmal nichts im Angebot. Und schneller wird eine Lösung so auch nicht (abgesehen von Taktsteigerungen).

Bokill
2008-01-09, 23:24:39
Irgend eine Chance gegen nVs nächste High-End? Hört sich eher noch gehobener Mittelklasse an ;( Das ist doch AMDs Strategie derzeit, dass sie mit Macht auf bezahlbare Mittelklasse setzen, die auch in der Produktion selber vergleichsweise günstig ist.

Wenn IBM Mitte 2008 45 nm für ihre Produkte nutzt, dann kommen die anderen Partner Zug um Zug auch daran.

Ende 2008 könnte die erste Volumenproduktion für 45 nm GPUs bei TSMC drin sein.

Ailuros
2008-01-10, 05:34:01
Es ist nicht einfach, die Anzahl der Einheiten zu erhöhen, eher im Gegenteil.
Die ALU-SIMDs sind mit den TEX-SIMDS verknüpft:
TEX ALU-SIMD1 ALU-SIMD2 ALU-SIMD3 ALU-SIMD4
A A A A A
B B B B B
C C C C C
D D D D D

Man kann zwar einzelne ALU-SIMDs deaktivieren, aber nicht einzelne Quads, denn die TEX-Quads sind mit den ALU-Quads verknüpft (TEX-Quad A füttert die ALU-Quads A1, A2, A3, A4 usw.) Für mich ergibt sich nur die folgende Überlegung: Man hängt weitere SIMDs dran. Oder die Texturenleistung wird aufgemotzt (AABBCCDD). Einzelne Quads "dranhängen" kommt nicht in Frage, denn das würde zur Erhöhung der Threadgröße führen.

Bingo!

Cpl. Dwayne Hicks
2008-01-10, 09:25:51
Es ist nicht einfach, die Anzahl der Einheiten zu erhöhen, eher im Gegenteil.
Die ALU-SIMDs sind mit den TEX-SIMDS verknüpft:
TEX ALU-SIMD1 ALU-SIMD2 ALU-SIMD3 ALU-SIMD4
A A A A A
B B B B B
C C C C C
D D D D D

Man kann zwar einzelne ALU-SIMDs deaktivieren, aber nicht einzelne Quads, denn die TEX-Quads sind mit den ALU-Quads verknüpft (TEX-Quad A füttert die ALU-Quads A1, A2, A3, A4 usw.) Für mich ergibt sich nur die folgende Überlegung: Man hängt weitere SIMDs dran. Oder die Texturenleistung wird aufgemotzt (AABBCCDD). Einzelne Quads "dranhängen" kommt nicht in Frage, denn das würde zur Erhöhung der Threadgröße führen.

ich habe großes Vertrauen in Gott dass ich eure Gespräche eines Tages verstehen werde.... :D

Nakai
2008-01-10, 17:29:33
Es ist nicht einfach, die Anzahl der Einheiten zu erhöhen, eher im Gegenteil.
Die ALU-SIMDs sind mit den TEX-SIMDS verknüpft:
TEX ALU-SIMD1 ALU-SIMD2 ALU-SIMD3 ALU-SIMD4
A A A A A
B B B B B
C C C C C
D D D D D

Man kann zwar einzelne ALU-SIMDs deaktivieren, aber nicht einzelne Quads, denn die TEX-Quads sind mit den ALU-Quads verknüpft (TEX-Quad A füttert die ALU-Quads A1, A2, A3, A4 usw.) Für mich ergibt sich nur die folgende Überlegung: Man hängt weitere SIMDs dran. Oder die Texturenleistung wird aufgemotzt (AABBCCDD). Einzelne Quads "dranhängen" kommt nicht in Frage, denn das würde zur Erhöhung der Threadgröße führen.

Mhh, dann hab ich mich geirrt. Danke für den Hinweis.


mfg Nakai

Gast
2008-01-10, 18:18:43
Naja nicht ganz. Eigentlich zählt nur TAU:ALU und das ist 1:2 oder kleiner beschränkt. Wieviele TFUs hinter einer TAU hängen hat auf die Thradgröße eigentlich keinen Einfluß.

Gast
2008-01-10, 20:28:08
Naja nicht ganz. Eigentlich zählt nur TAU:ALU und das ist 1:2 oder kleiner beschränkt. Wieviele TFUs hinter einer TAU hängen hat auf die Thradgröße eigentlich keinen Einfluß.
Es zählt weiterhin die Anzahl der Quads per SIMD, aber ich muss dir Recht geben: Man könnte die Anzahl der Filtereinheiten innerhalb der Sampler-Quads verdoppelt, damit das Verhältnis zwischen Filtereinheiten und Adressierungseinheiten 1:1 ist.

Gmax
2008-01-15, 11:46:24
RV770 taped out
From what we have learned, it should be more than fifty percent faster while we heard even higher numbers.

http://www.fudzilla.com/index.php?option=com_content&task=view&id=5145&Itemid=1

robbitop
2008-01-15, 12:20:16
Hui fette 50% schneller ...
Ich hoffe, ATI hat für den Herbst/Winter etwas besseres. Sonst wird man gegen GT200 leider derbe abstinken.

deekey777
2008-01-15, 12:37:54
Werft mal bei Fudzilla die SuFu an und sucht nach R700. ;D

Wenn der R700 wirklich aus zwei RV770 besteht?

http://www.fudzilla.com/index.php?option=com_content&task=view&id=5145&Itemid=1
Der R700 soll sein Tapeout gehabt haben. Der R700 soll aus zwei RV770 bestehen. Warum hat der RV770 jetzt sein Tapeout?

http://www.hardforum.com/showpost.php?p=1031906993&postcount=28
R700 will be a multiple GPU architecture. Will not be CrossFire on a card. The architecture is being designed from the ground up to be "multiple GPU." Engineers at ATI have also told me specifically that AA is "fixed."

Hopefully this will clear up some of the rumors. As you know, we bat about 1000 when it comes to this kind of information. If I tell you more now, I will have to kill you.

Gast
2008-01-15, 12:43:20
Hui fette 50% schneller ...
Ich hoffe, ATI hat für den Herbst/Winter etwas besseres. Sonst wird man gegen GT200 leider derbe abstinken.

Hat man auch. AMD spricht von >4x RV670XT.

Gast
2008-01-15, 15:58:50
Was sagt 50% mehr denn aus...nix. In 25xx mit 16x AA ist isses normal

robbitop
2008-01-15, 16:20:43
Hat man auch. AMD spricht von >4x RV670XT.
Das erreicht noch keine GT200. Außerdem ist Crossfire/SLI wegen einiger Nachteile absolut kein Ersatz für richtiges HighEnd.

AnarchX
2008-01-15, 16:22:51
Das erreicht noch keine GT200
Wieso? 3xG80GTX ~ 4x RV670XT. ;)

robbitop
2008-01-15, 16:58:54
Wieso? 3xG80GTX ~ 4x RV670XT. ;)
Mit AFR/SFR? Das will ich sehen. Und die Framekadenz?

Ailuros
2008-01-16, 06:09:40
Wieso? 3xG80GTX ~ 4x RV670XT. ;)

Was rechnet Ihr alle eigentlich?

Angenommen RV670= 50fps in Fall X.

RV770 = 50fps + 50% = 75fps
2*RV770 = 75fps + 85% = 139 fps

deekey777,

Ich will's Kyle bei B3D zwar nicht oeffentlich sagen, weil dann Rys wieder meckert dass ich Salz auf die Wunde streue, aber er sollte sich eigentlich dem Gedanken angewoehnen dass er sein Wort einhalten sollte. Das was kommt ist nicht der eigentliche R700. Nach der Entwicklungszeit sollte es AMD bestenfalls selbst intern nicht mehr als R685 nennen.

Das "fixed" Zeug fuer AA gibt es schon in RV670. Wobei schon der benutzte Ausdruck laecherlich ist. Wenn irgend etwas nicht kaputt ist, braucht es auch keine Reparaturen. Sonst sagt man einfach dass man AA schneller macht. Ich will aber nicht ausschliessen dass sie die ROPs diesmal etwas aufgepumpt haben; Zeit genug hatten sie diesmal schon.

BlackBirdSR
2008-01-16, 07:04:14
Was rechnet Ihr alle eigentlich?

Angenommen RV670= 50fps in Fall X.

RV770 = 50fps + 50% = 75fps
2*RV770 = 75fps + 85% = 139 fps

deekey777,

Ich will's Kyle bei B3D zwar nicht oeffentlich sagen, weil dann Rys wieder meckert dass ich Salz auf die Wunde streue, aber er sollte sich eigentlich dem Gedanken angewoehnen dass er sein Wort einhalten sollte. Das was kommt ist nicht der eigentliche R700. Nach der Entwicklungszeit sollte es AMD bestenfalls selbst intern nicht mehr als R685 nennen.

Das "fixed" Zeug fuer AA gibt es schon in RV670. Wobei schon der benutzte Ausdruck laecherlich ist. Wenn irgend etwas nicht kaputt ist, braucht es auch keine Reparaturen. Sonst sagt man einfach dass man AA schneller macht. Ich will aber nicht ausschliessen dass sie die ROPs diesmal etwas aufgepumpt haben; Zeit genug hatten sie diesmal schon.

Gibt es bei ATI seit dem R300 überhaupt ein Design, welches nach Plan und in seiner zuerst konzipierten Form auf den Markt kam? Mir scheint, dass Nvidia ein Produkt nach dem anderen streng nach Plan entwicklet, während sich ATI von einem seidenen Faden zum anderen schwingt.

SavageX
2008-01-16, 07:51:29
Gibt es bei ATI seit dem R300 überhaupt ein Design, welches nach Plan und in seiner zuerst konzipierten Form auf den Markt kam? Mir scheint, dass Nvidia ein Produkt nach dem anderen streng nach Plan entwicklet, während sich ATI von einem seidenen Faden zum anderen schwingt.

Vielleicht ist ATI einfach ambitionierter und geschwätziger - und speckt dann ab. Wenn man sich Nvidias Errungenschaften zwischen NV40 und G80 anguckt scheint da jedenfalls nicht viel mehr Ambition als "das gleiche nochmal in schneller" dahinter gesteckt zu haben.

LovesuckZ
2008-01-16, 07:54:40
Ähm, hinter dem G80 steckt nicht mehr viel NV40. ;)

SavageX
2008-01-16, 07:55:22
Ähm, hinter dem G80 steckt nicht mehr viel NV40. ;)

*Zwischen* NV40 und G80.

AnarchX
2008-01-16, 08:03:40
Was rechnet Ihr alle eigentlich?

Angenommen RV670= 50fps in Fall X.

RV770 = 50fps + 50% = 75fps
2*RV770 = 75fps + 85% = 139 fps


Dann war der Faktor 4 wohl doch auf den ursprünglichen R700 bezogen, der aber wegen Nichtverfügbarkeit von 45nm verschoben wurde und nun gibt es halt erstmal einen aufgebohrten RV670@55nm inkl. X2-SKU?

Da könnte sich wohl ATi im Q2/3 nochmal die Krone holen, die dann kurz darauf brutal vom G200 entrissen wird...

Gast
2008-01-16, 08:06:44
Gibt es bei ATI seit dem R300 überhaupt ein Design, welches nach Plan und in seiner zuerst konzipierten Form auf den Markt kam? Mir scheint, dass Nvidia ein Produkt nach dem anderen streng nach Plan entwicklet, während sich ATI von einem seidenen Faden zum anderen schwingt.

Wer sagt, dass die nV-Produkte, die heute am Markt sind streng nach Plan entwickelt wurden? Ich finde diese Diskussion lächerlich. Es ist IMO völlig normal, dass Designs öfter mal nach hinten verschoben werden müssen oder gar völlig gecancelt werden, schlicht da man einen solchen Chip nicht von heute auf morgen entwickelt und sich die Anforderungen dann nicht immer so darlegen wie ursprünglich gedacht. NV gurkte auch über volle drei Generationen mit der CineFX-Architektur herum. Im übrigen wundert mich dieser jetzt geplante R700 eh kein bisschen, wo RV670 schon D3D10.1 kompatibel ist. Man erfindet das Rad nicht zweimal.

reunion

Gast
2008-01-16, 08:09:32
Dann war der Faktor 4 wohl doch auf den ursprünglichen R700 bezogen, der aber wegen Nichtverfügbarkeit von 45nm verschoben wurde und nun gibt es halt erstmal einen aufgebohrten RV670@55nm inkl. X2-SKU?

Da könnte sich wohl ATi im Q2/3 nochmal die Krone holen, die dann kurz darauf brutal vom G200 entrissen wird...

Die Folien sind vom November 2007. Wenn es AMD da noch nicht gewusst hat, wie R700 jetzt aussieht, dann kommt das Ding nicht vor 2009.

reunion

deekey777
2008-01-16, 16:38:34
Was rechnet Ihr alle eigentlich?

Angenommen RV670= 50fps in Fall X.

RV770 = 50fps + 50% = 75fps
2*RV770 = 75fps + 85% = 139 fps

deekey777,

Ich will's Kyle bei B3D zwar nicht oeffentlich sagen, weil dann Rys wieder meckert dass ich Salz auf die Wunde streue, aber er sollte sich eigentlich dem Gedanken angewoehnen dass er sein Wort einhalten sollte. Das was kommt ist nicht der eigentliche R700. Nach der Entwicklungszeit sollte es AMD bestenfalls selbst intern nicht mehr als R685 nennen.

Das "fixed" Zeug fuer AA gibt es schon in RV670. Wobei schon der benutzte Ausdruck laecherlich ist. Wenn irgend etwas nicht kaputt ist, braucht es auch keine Reparaturen. Sonst sagt man einfach dass man AA schneller macht. Ich will aber nicht ausschliessen dass sie die ROPs diesmal etwas aufgepumpt haben; Zeit genug hatten sie diesmal schon.
Seine Aussage habe ich eigentlich so gelesen, dass er nicht den "Ur-R700" meint. Aus deinen Aussagen kann ich davon ausgehen, dass wir Loki #2 erleben werden. Dass der R420 unverdient den Codenamen "R420" hatte, wurde darauf spekuliert, dass ATi damals die Nummern ausgegangen sind. Also wenn der neue Loki R720 heißt oder ähnlich, stört mich nicht, wobei die aktuellen Bezeichnungen von NV zwar verwirrend sind, aber ehrlicher.
Aber wie schon mehrmals erwähnt: Die ATi-Spezis sollten ihre R&D-Mitteln nicht auf die "Misswahl zum Codenamen der HD4000-Generation" verschwenden, sondern die Wehwehchen der R600-Architektur aus der Welt schaffen, ohne sich auf irgendwelche PR-Ideen wie "steigende Anforderungen an arithmetischer Leistung" festzuklammern.

Sind eigentlich die ROPs des RV630 auch "gefixt"?

Gast
2008-01-17, 10:43:27
RV770 engineering samples are out: http://www.fudzilla.com/index.php?option=com_content&task=view&id=5196&Itemid=1

Ailuros
2008-01-17, 10:46:35
Gibt es bei ATI seit dem R300 überhaupt ein Design, welches nach Plan und in seiner zuerst konzipierten Form auf den Markt kam? Mir scheint, dass Nvidia ein Produkt nach dem anderen streng nach Plan entwicklet, während sich ATI von einem seidenen Faden zum anderen schwingt.

Es gab sowohl auf ATI's als auch auf NVIDIA's roadmap Aenderungen in der Vergangenheit.

Ailuros
2008-01-17, 10:56:34
Wer sagt, dass die nV-Produkte, die heute am Markt sind streng nach Plan entwickelt wurden? Ich finde diese Diskussion lächerlich. Es ist IMO völlig normal, dass Designs öfter mal nach hinten verschoben werden müssen oder gar völlig gecancelt werden, schlicht da man einen solchen Chip nicht von heute auf morgen entwickelt und sich die Anforderungen dann nicht immer so darlegen wie ursprünglich gedacht. NV gurkte auch über volle drei Generationen mit der CineFX-Architektur herum. Im übrigen wundert mich dieser jetzt geplante R700 eh kein bisschen, wo RV670 schon D3D10.1 kompatibel ist. Man erfindet das Rad nicht zweimal.

reunion

Den 10.1 Kaugummi kannst Du Dir trotzdem sparen; bis zumindest zum Punkt wo sie eine anstaendige Antwort zu coverage sampling als das oede Schmierzeug veroeffentlichen.

Ich kann mir schon vorstellen was er eigentlich meinte, denn ATI machte es sich selber leider nicht leicht und geht auch insgesamt viel zu viele Risikos ein. NVIDIA lernte aus ihren Misserfolgen durch die Jahre, wobei man oefters bei ATI den Eindruck hatte dass sie aus merkwuerdigen masochistischen Gruenden die selben Fehler konstant wiederholen wuerden.

Gute engineers und Erfahrung sind ja schon und gut, aber wenn das Management einen Vogel hat kann man auch nichts retten. Bis zum Zeitpunkt wo die beiden unterschiedlichen Desing-teams vollkommen vereint werden, sehe ich leider keine Hoffnung dass AMD wirklich aufs Gas treten koennte.

Ailuros
2008-01-17, 11:05:22
Seine Aussage habe ich eigentlich so gelesen, dass er nicht den "Ur-R700" meint. Aus deinen Aussagen kann ich davon ausgehen, dass wir Loki #2 erleben werden. Dass der R420 unverdient den Codenamen "R420" hatte, wurde darauf spekuliert, dass ATi damals die Nummern ausgegangen sind. Also wenn der neue Loki R720 heißt oder ähnlich, stört mich nicht, wobei die aktuellen Bezeichnungen von NV zwar verwirrend sind, aber ehrlicher.
Aber wie schon mehrmals erwähnt: Die ATi-Spezis sollten ihre R&D-Mitteln nicht auf die "Misswahl zum Codenamen der HD4000-Generation" verschwenden, sondern die Wehwehchen der R600-Architektur aus der Welt schaffen, ohne sich auf irgendwelche PR-Ideen wie "steigende Anforderungen an arithmetischer Leistung" festzuklammern.

Sind eigentlich die ROPs des RV630 auch "gefixt"?

Was momentan herumgesteirt sind Geruechte dass sie in etwa genauso viel R&D Resourcen wie fuer R420 eingelegt haben. Die Bezeichnung ist mir persoenlich schnurz; ein wahrer "R700" ist das Resultat auf jeden Fall wohl nicht.

Uebrigens das was sie unter "gefixt" fuer RV6x0 fuer sowohl AA als auch AF verstehen beruht hauptsaechlich auf SW-Optimierungen. Es hat sich ja auch keiner hingesetzt um nachzupruefen ob man AF spezifische Optimierungen ueberhaupt abschalten kann.

Das heisst jetzt nicht dass der R680 Nachfolger nicht konkurrenzfaehig sein wird; nur eben wohl leider nicht im oberen high end Markt. Versuchen koennte es AMD theoretisch durchaus aber um die Leistung dort zu erreichen wuerde die pro chip Groesse auf dual-chip setups zu stark in ihre Margen beissen.

***edit: uebrigens fuer die die zwischen den Zeilen lesen koennen:

http://forum.beyond3d.com/showpost.php?p=1116843&postcount=471

Gast
2008-01-17, 11:58:14
Was momentan herumgesteirt sind Geruechte dass sie in etwa genauso viel R&D Resourcen wie fuer R420 eingelegt haben. Die Bezeichnung ist mir persoenlich schnurz; ein wahrer "R700" ist das Resultat auf jeden Fall wohl nicht.


Und wenn schon, von nV wird auch nicht mehr kommen als ein Refresh der jetztigen Architektur. Wer bei gleichem Tech-Level eine neue Generation erwartet dem ist sowieso nicht zu helfen. Soetwas wird es frühestens wieder mit D3D11 geben.

reunion

Ailuros
2008-01-17, 12:47:28
Und wenn schon, von nV wird auch nicht mehr kommen als ein Refresh der jetztigen Architektur. Wer bei gleichem Tech-Level eine neue Generation erwartet dem ist sowieso nicht zu helfen. Soetwas wird es frühestens wieder mit D3D11 geben.

reunion

Tut mir leid reunion, aber der obere Paragraph koennte sogar ein typischer Marketing-furz der AMD PR-Abteilung sein.

Der eigentliche R7x0 kommt vor D3D11 an und hat zumindest ein paar Vorteile was dual-chip configs betrifft. Wenn man schon nicht mehr auf monolithische single chips fuer high end setzen will, dann sind solche Kleinigkeiten wichtiger als Du sie hier vorstellen willst.

Ich sollte natuerlich nicht vergessen dass man nicht besonders viel an R6x0 bzw. RV6x0 zum aendern hat, ueberhaupt da der letztere schon 10.1 kompliant ist. Wenn man natuerlich nur im Hinterkopf hat einfach konkurrenzfaehig zu bleiben mit geringem oder keinem Gewinn, dann sind solche Einstellungen wie Deine auch normal. Ich will von ATI endlich mal wieder richtigen Dampf sehen und nicht alberne Pflaster um sich ueber Wasser zu halten. Und so was setzt natuerlich voraus dass man nicht Halbjahre spaeter mit effektiveren Loesungen als die Konkurrenz antanzt.

Ein wahrer "R7x0" haette dieses Potential zumindest in H2 2008. 6 oder mehr Monate spaeter bedeutet nur ein weiterer Nachfolger fuer das was Ende in H2 dieses Jahr auf die Ladentische kommt.

robbitop
2008-01-17, 12:50:47
Naja solange ATI den RV770 nach oben skaliert, soll es ruhig ein R6xx sein. Allerdings braucht das Ding halt mehr Einheiten. Da ein einzelner RV770 aber wieder sub 200$ ist, darf das Teil auch nicht so viel größer werden als RV670 und damit bleibt bei 55nm nicht so viel Spielraum.

Gast
2008-01-17, 12:56:27
Naja solange ATI den RV770 nach oben skaliert, soll es ruhig ein R6xx sein. Allerdings braucht das Ding halt mehr Einheiten. Da ein einzelner RV770 aber wieder sub 200$ ist, darf das Teil auch nicht so viel größer werden als RV670 und damit bleibt bei 55nm nicht so viel Spielraum.

Bei dem Monster-Die, das nV bringt, hat AMD genug Spielraum. Da sind locker 2 x 300mm² oder mehr drin. Außerdem hat man ja auch noch gehörig Potential was clock-domains betrifft.

reunion

Ailuros
2008-01-17, 12:58:07
Naja solange ATI den RV770 nach oben skaliert, soll es ruhig ein R6xx sein. Allerdings braucht das Ding halt mehr Einheiten. Da ein einzelner RV770 aber wieder sub 200$ ist, darf das Teil auch nicht so viel größer werden als RV670 und damit bleibt bei 55nm nicht so viel Spielraum.

R680 kommt mit 825MHz an. Sie haben sich wohl schon etwas besseres einfallen lassen als sich nur auf die Frequenz zu verlassen.

Gast
2008-01-17, 13:00:39
Tut mir leid reunion, aber der obere Paragraph koennte sogar ein typischer Marketing-furz der AMD PR-Abteilung sein.


Weil ich gesagt habe, dass von nV auch nur ein Refresh kommen wird?

reunion

LovesuckZ
2008-01-17, 13:01:36
Das hört sich bei dir immer alles so einfach an: Mehr Transistoren, größere Fläche, Clock-Domains...
Warum kann denn nVidia die Recheneinheiten auf 1500Mhz oder höher bringen? Es gibt nur wenige davon.
Je mehr Recheneinheiten, umso schwieriger wird es. Davon wird AMD nicht ausgeschlossen sein.

Ailuros
2008-01-17, 13:07:36
Bei dem Monster-Die, das nV bringt, hat AMD genug Spielraum. Da sind locker 2 x 300mm² oder mehr drin. Außerdem hat man ja auch noch gehörig Potential was clock-domains betrifft.

reunion

FYI brauchte NV ca. 1 Jahr fuer die ALU clock-domains; das entspricht wohl nicht "man-hours".

Was jetzt die 2*300mm^2 These betrifft, denkst Du wohl irgendwo im geheimen an 6 cluster/chip oder? An die 770GFLOPs pro chip sind's dann schon; aber Du musst zugeben dass es ein teuflischer Zufall waere :biggrin: Wenn ja soll das wirklich "genug" sein? :|

w0mbat
2008-01-17, 13:15:04
Wie würdet ihr den RV670 denn so verbessern das er den Namen RV770 verdient hätte?

Sagen wir mal der Chip wird allg. etwas überarbeitet, also hier und da ein Bugfix und ein paar Verbesserungen. Dann macht man die ROPs cyc 4xAA fähig und verdoppelt die TMUs auf 32 Stück (den Coretakt erhöht man natürlich auch). Die 64 Vec5 Shader würde ja reichen, wenn man hier eine höhere Shaderdomaine mit >1,2GHz ansetzt. Das 256-bit SI könnte man einfach mit 1,6GHz GDDR4 koppeln und schon hätte man >100GB/s.

Das ist jetzt reine Spekulation, aber wäre so ein Chip den schnell genug für die "next-gen" Mittelklasse?

Ailuros
2008-01-17, 13:16:07
Weil ich gesagt habe, dass von nV auch nur ein Refresh kommen wird?

reunion

Nein eben nicht. Es ist eben nicht egal dass AMD den originalen R700 storniert hat und stattdessen einen quasi R6x0 dazwischen geschoben hat. Man spart eben. Und wuerde die gesamte Strategie von vorne bis hinten nicht schon seit Jahren stinken, haette man an vielen anderen Stellen sparen koennen.

Ailuros
2008-01-17, 13:22:47
Wie würdet ihr den RV670 denn so verbessern das er den Namen RV770 verdient hätte?

Die Frage wuerde Dir nur die Spezifikationen des originalen R700 beantworten.

Sagen wir mal der Chip wird allg. etwas überarbeitet, also hier und da ein Bugfix und ein paar Verbesserungen. Dann macht man die ROPs cyc 4xAA fähig und verdoppelt die TMUs auf 32 Stück. Die 64 Vec5 Shader würde ja reichen, wenn man hier eine höhere Shaderdomaine mit >1,2GHz ansetzt. Das 256-bit SI könnte man einfach mit 1,6GHz GDDR4 koppeln und schon hätte man >100GB/s.

Wie genau willst Du auf 4 cluster 32 TMUs knallen? Wie schon oefters erwaehnt jegliches TMU-array ist auf R6x0/RV6x0 in einer Art SIMD Logik zu jedem cluster verbunden. Moeglich ist zwar vieles nur kostet es stets mehr Entwicklungszeit als sich manche vorstellen.

Ganz nebenbei 6 cluster@~800MHz bringen genauso viel GFLOPs wie 4 cluster@1.2GHz.

Das ist jetzt reine Spekulation, aber wäre so ein Chip den schnell genug für die "next-gen" Mittelklasse?

Ja. Wohl aber nicht unter dual-chip als Gewinner im high end Bereich.

robbitop
2008-01-17, 13:54:15
Man könnte die Anzahl der Texturfiltereinheiten erhöhen. Die Texturadresseinheiten aber so lassen. So hat man mehr Filterleistung pro Kanal. G80 mäßig eben.
An Shaderdomains mit > 1GHz glaube ich kaum. Sowas kostet richtig Zeit und Manhours. Also etwas, was von langer Hand gemacht werden muss.

AnarchX
2008-01-17, 13:59:31
Wobei ja gewisse Teile des Shadercores vom RV670 schon höher takten sollen:
Darüber hinaus hat man sich dem „MSAA-Shader-Resolve-Problem“ (das Shader-Resolve wird normalerweise von den ROPs durchgeführt. Beim R600 übernehmen dies die ALUs; ob dies Absicht oder ein Defekt an den ROPs ist, ist weiterhin unbekannt) angenommen und dessen Effizienz erhöht. Erreicht wird dies laut David Nalasco durch eine höhere Taktrate des „Shader-Cores“. Genauere Details konnten wir bis jetzt leider noch nicht in Erfahrung bringen. Ob die Shadereinheiten tatsächlich mit einer höheren Frequenz als die restlichen GPU-Komponenten arbeiten, können wir derzeit nur vermuten. Darüber hinaus hat ATi auf dem RV670 nach eigenen Angaben die Performance bei Geometry-Shader-Berechnungen steigern können, was in Direct3D-10-Anwendungen (falls diese Gebrauch vom Geometry-Shader machen) einen Geschwindigkeitsschub bringen soll.

http://www.computerbase.de/artikel/hardware/grafikkarten/2007/test_ati_radeon_hd_3870_rv670/3/#abschnitt_technik_im_detail_part_1

Aber ansonsten wären 32TA/TFs und min. 4 Z-Tester pro ROP sicherlich nicht vekehrt, dass MSAA-Resolve soll ja eh wieder via FF realisiert werden.

Ailuros
2008-01-17, 14:35:46
7800GTX/256 = 430/470
7800GTX/512 = 550/550
7900GTX = 650/700
8800GTX = 575/1350

Gast
2008-01-17, 14:46:04
Nein eben nicht. Es ist eben nicht egal dass AMD den originalen R700 storniert hat und stattdessen einen quasi R6x0 dazwischen geschoben hat. Man spart eben. Und wuerde die gesamte Strategie von vorne bis hinten nicht schon seit Jahren stinken, haette man an vielen anderen Stellen sparen koennen.

R700 wurde verschoben weil 45nm noch nicht weit genug ist. Besser man schiebt da jetzt noch was dazwischen als man kommt wieder mal deutlich später als die Konkurrenz.

reunion

Gast
2008-01-17, 14:47:00
FYI brauchte NV ca. 1 Jahr fuer die ALU clock-domains; das entspricht wohl nicht "man-hours".

Was jetzt die 2*300mm^2 These betrifft, denkst Du wohl irgendwo im geheimen an 6 cluster/chip oder? An die 770GFLOPs pro chip sind's dann schon; aber Du musst zugeben dass es ein teuflischer Zufall waere :biggrin: Wenn ja soll das wirklich "genug" sein? :|

Bei >300mm² pro Die wären selbst 8 Cluster durchaus machbar.

reunion

Hvoralek
2008-01-17, 14:47:03
7800GTX/256 = 430/470
7800GTX/512 = 550/550
7900GTX = 650/700
8800GTX = 575/1350Du erwartest erst einmal einen "Testlauf" von AMD mit nur leicht höherem ALU- Takt?

Gast
2008-01-17, 14:52:36
Man könnte die Anzahl der Texturfiltereinheiten erhöhen. Die Texturadresseinheiten aber so lassen. So hat man mehr Filterleistung pro Kanal. G80 mäßig eben.
An Shaderdomains mit > 1GHz glaube ich kaum. Sowas kostet richtig Zeit und Manhours. Also etwas, was von langer Hand gemacht werden muss.

Die TEX-Leistung ist für die ALU-Leistung mittlerweile durchaus angemessen, wenn man sich neuere Spiele so ansieht. Und bis R700 kommt und während seiner "Lebenzeit" wird sich das noch weiter in Richtung ALU verschieben. G80 hat mittlerweile TEX-Füllrate zum Schweinefüttern. Ein doppelter RV670 mit kleineren Verbesserungen und Optimierungen wäre IMO durchaus passend.

reunion

AnarchX
2008-01-17, 14:55:55
Wäre aber doch auch keine schlechte Sache, wenn ATi wirkliches "HQ-AF" anbieten könnte. ;)

Ailuros
2008-01-17, 15:04:51
R700 wurde verschoben weil 45nm noch nicht weit genug ist. Besser man schiebt da jetzt noch was dazwischen als man kommt wieder mal deutlich später als die Konkurrenz.

reunion

Weit genug oder zu teuer? Hast Du ueberhaupt eine Vorstellung was ein einzelner tape-out beim neuesten und kleinsten Herstellungsprozess kosten kann?

Ailuros
2008-01-17, 15:07:05
Bei >300mm² pro Die wären selbst 8 Cluster durchaus machbar.

reunion

8 cluster mit 64 TMUs und 32 ROPs und der ganze Spass bei nur 300mm^2? Ueber was traeumst Du nachts genau?

Ailuros
2008-01-17, 15:13:17
Du erwartest erst einmal einen "Testlauf" von AMD mit nur leicht höherem ALU- Takt?

Es wahr nicht so gemeint; NV hat praktisch zwei "Testanlaeufe" gemacht (bei der 512/7800GTX hat 110nm nicht mehr mitgespielt) und dazu mit sehr konservativen Frequenzen und nur mit einfachen VS Einheiten. Es waren die ersten reale Experimente bis man zum G80 kam. RV670 koennte tatsaechlich leicht hoeher getaktete ALUs haben; obwohl es fuer die ALU Effizienz des Dings nicht besonders schmeichelnd ist, erklaert es zumindest die Unterschiede was die AA Leistung im Vergleich zur 2900XT betrifft.

san.salvador
2008-01-17, 15:15:20
Weit genug oder zu teuer? Hast Du ueberhaupt eine Vorstellung was ein einzelner tape-out beim neuesten und kleinsten Herstellungsprozess kosten kann?

Wie "groß" ist so ein Tape-out überhaupt? Ich meine in Stückzahlen. :)




Man kann Beiträge übrigens editieren und muss nicht drei Posts untereinander stapeln... ;)

Ailuros
2008-01-17, 15:21:24
Die TEX-Leistung ist für die ALU-Leistung mittlerweile durchaus angemessen, wenn man sich neuere Spiele so ansieht. Und bis R700 kommt und während seiner "Lebenzeit" wird sich das noch weiter in Richtung ALU verschieben. G80 hat mittlerweile TEX-Füllrate zum Schweinefüttern. Ein doppelter RV670 mit kleineren Verbesserungen und Optimierungen wäre IMO durchaus passend.

reunion

Ich sehe keine besondere Aenderung des ALU:TEX ratios im originalen R700 Design und auch nicht in G200. Kommt aber natuerlich auch darauf an wie man genau zaehlt.

G8x/9x haben eine uebermaessige Fuellrate um nur minimal an Leistung fuer hochqualitatives AF zu verlieren. Durch die G7x Aera gab es endlose Paukereien von Euch Kerlen ueber die Filterungsqualitaet; heutzutage beschaeftigt sich aber keiner was genau mit RV670 los ist um man keinerlei Aenderung sieht wenn man AI off benutzt.

robbitop
2008-01-17, 15:44:07
Das liegt unter anderem daran, dass ATI derzeit am Boden liegt. Da tritt man nicht nochmehr zu.

Gast
2008-01-17, 15:58:50
8 cluster mit 64 TMUs und 32 ROPs und der ganze Spass bei nur 300mm^2? Ueber was traeumst Du nachts genau?
8 Cluster mit insgesamt 32 TFUs und 32 ROPs wäre n 55nm mit 330-360mm² machbar, ein doppelter (außer SI) RV670 mit ein paar Tweaks halt. Ob das sinnvoll ist steht auf einem anderen Blatt.

reunion
2008-01-17, 18:49:03
8 cluster mit 64 TMUs und 32 ROPs und der ganze Spass bei nur 300mm^2? Ueber was traeumst Du nachts genau?

Ich habe geschrieben 8 Cluster bei >300mm². Und träumen tute ich eigentlich kaum mal was.

Das liegt unter anderem daran, dass ATI derzeit am Boden liegt. Da tritt man nicht nochmehr zu.

Außerdem wird ohnehin Q vs. AI_Low verglichen und da sparen beide.

Gast
2008-01-17, 18:56:53
Nicht rausreden ;)

Wurde R700 nicht einfach verschoben, wegen DX11 @ 2009? Einen anderen Grund halte ich für nicht sehr wahrscheinlich.

Coda
2008-01-17, 18:57:18
G8x spart auch mit Q nicht an Samples, ATi schon.

nomadhunter
2008-01-17, 21:02:20
Wurde R700 nicht einfach verschoben, wegen DX11 @ 2009? Einen anderen Grund halte ich für nicht sehr wahrscheinlich.
IMHO käme auch einer von den Gründen in Frage:
-45nm-Fertigung (vor Anfang 2009 wird das nix)
-gekürzte R&D-Ausgaben

Oder auch mehrere Sachen zusammen. RV670 ist nicht schlecht, auch ein Refresh mit ~50% mehr Performance (->RV770; 9800GTX-Niveau?) würde sich ohne zu großen Entwicklungsaufwand machen lassen. Und NVIDIA macht ja momentan eh nichts (bis der GT200 kommt), also wieso nicht so lange die R&D-Ausgaben gering halten und dann gleich noch den Sprung auf die 45nm-Fertigung mitmachen. Dass man bis DX11 (momentant geht man von Ende 09/Anfang 10 aus, oder?) wartet, glaube ich aber eher nicht. Auch ein RV770X2 ist mit den üblichen CF-Nachteilen nur ein mäßiger Konkurrent für den GT200. Mehr als ein halbes Jahr ab GT200-Release kann sich ATI IMHO nicht Zeit lassen, bis man endlich wieder mit einer wirklich neuen Architektur kontert, die zumindest als 2-Chip-Lösung (der "echte" R700 soll ja mit vielen Multi-GPU-Problemen aufräumen) im High-End mitspielen kann.

Gast
2008-01-17, 21:24:57
Dx11 interessiert nicht die Bohne :D ich will Mehrleistung aber deftig

Ailuros
2008-01-18, 05:16:57
8 Cluster mit insgesamt 32 TFUs und 32 ROPs wäre n 55nm mit 330-360mm² machbar, ein doppelter (außer SI) RV670 mit ein paar Tweaks halt. Ob das sinnvoll ist steht auf einem anderen Blatt.

Bei ab 360 haette ich auch nichts einzuwenden.

Ailuros
2008-01-18, 05:45:31
Das liegt unter anderem daran, dass ATI derzeit am Boden liegt. Da tritt man nicht nochmehr zu.

Am Boden liegen sie mit RV670 durchaus nicht; ich hab den Verdacht dass man einfach die Filterungs-Optimierungen nicht mehr ausschalten kann.

Die Geschichte mit dem Filterungszeug seit NV40 unter dem damaligen focus group ist Dir zumindest bekannt. Wenn mir jemand etwas in die Hand legt und mir etwas nicht passt, dann kehre ich auch nichts unter den Teppich. Trotz allem wurde versucht mich als Marketing-heini abzustempeln und mich indirekt in eine Hexenjagd zu schicken. Wenn ich mal die Klappe darueber aufmache, duerften sich so manche verstecken. Ich eben leider viel zu anstaendig mich wie ein John Reynolds zu verhalten, obwohl es mich zugegeben oefters in den Fingern juckt.

Schluss zum OT: was meistens hinter den Kulissen vorgeht ist oefters zum erbrechen. Viel zu viele versuchen zu etwas zu kommen, egal ob man auf dem Weg ueber zich Leichen stampfen muss. Frag mich irgendwann mal darueber wenn ich Lust habe solches Zeug zu erzaehlen....

Ich habe geschrieben 8 Cluster bei >300mm². Und träumen tute ich eigentlich kaum mal was.

reunion,

Das was storniert wurde hatte weniger cluster; insgesamt haette aber das dual config so weit in die Margen gebissen dass es nicht mehr schoen gewesen waere. Plus dass es trotz allem um einiges langsamer gewesen waere als die Konkurrenz.

Ich hab zwar nicht die blasseste Ahnung was sie an dem RV770 Dingsda genau angerichtet haben, aber 8 cluster waere Ihre bloedeste Idee ueberhaupt.

Außerdem wird ohnehin Q vs. AI_Low verglichen und da sparen beide.

Moderates "brilinear" fuer G8x; ausser ein paar Eckfaelle ist es aber sowieso Bloedsinn nicht reines tri auf den Dingern zu benutzen weil man sonst die Unmenge an bilerp Rate dumm rumhocken laesst.

laser114
2008-01-21, 14:50:05
AMD has already released samples of the 55nm RV770 GPU to its partners for certification and cards are expected to launch at late second quarter, added the paper.

http://www.digitimes.com/news/a20080121PB202.html

Sir Integral Wingate Hellsing
2008-01-22, 09:11:50
*hust*

Erstes Review einer AMD ATI Radeon HD 3870 X2
http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1200984348 Ganz nett das Teil :D

GeneralHanno
2008-01-22, 09:36:00
*hust* die X2 gehört nicht in den R700 thread *hust*

übrigens sehr erfreuhlich, dass R700/RV770 schon mit etwas glück im Q2/08 vorgestellt wird :D

Gmax
2008-01-22, 16:49:00
Ich denke mal, diese Spekus sind nicht mehr neu, aber ich will sie euch nicht vorenthalten:

http://translate.google.com/translate?hl=en&sl=zh-CN&u=http://www.pconline.com.cn/diy/graphics/news/0801/1196695.html&sa=X&oi=translate&resnum=1&ct=result&prev=/search%3Fq%3Dhttp://www.pconline.com.cn/diy/graphics/news/0801/1196695.html%26hl%3Den%26sa%3DG

laser114
2008-01-22, 17:08:55
Ich denke mal, diese Spekus sind nicht mehr neu, aber ich will sie euch nicht vorenthalten:

http://translate.google.com/translate?hl=en&sl=zh-CN&u=http://www.pconline.com.cn/diy/graphics/news/0801/1196695.html&sa=X&oi=translate&resnum=1&ct=result&prev=/search%3Fq%3Dhttp://www.pconline.com.cn/diy/graphics/news/0801/1196695.html%26hl%3Den%26sa%3DG

Veraltete Infos gemischt mit anscheinend aktuellen Erscheinungsdaten.

davidzo
2008-01-22, 23:27:35
Die wichtigste Entwicklung die für AMD den ursprünglichen R700 kennzeichnete war ein on package interconnect.
Im Gegensatz zu CF/SLI würde die Redundanz des Speichers wegfallen und außerdem AFR. Die Chips könnten kommunizieren nahezu wie ein einzelner Chip. Vorstellbar wäre eine 256bit speicher crossbar pro chip mit zwei links um am rand weitere Chips anzuschließen. man könnte so mit 2 chips, 3 chips etc. in kreiskonfiguration eine hohe Bandbreite fahren.

nehmen wir an dieses Interface ist/war in der Entwicklung und das ist alles was den R700 hauptsächlich ausmacht, denn dx11 war von Anfang an noch kein Thema.

Dass die Rohleistung generell schon ein Problem sein würde hat AMD damals noch nicht geahnt. Das R700 Layout konzentrierte sich in erster Linie auf eine Interconnectlösung und eine reale verbundene höhere Speicherbandbreite mehrerer chips, entstammt die Grundidee doch noch aus den Entwicklungszeiten des R600s, als man von der grandiosen Leistung des G80s und seines refreshs nich nichts wusste.
Mit 55nm wird AMD über kurz oder lang ersteinmal keine deutlich schnelleren dx10.1 ALUs und ROPs zuer verfügung stellen können. Alles was man hat wäre der rv670.

Angesichts der enormen Transistorenmenge des RV670, was würde AMD nun tun, wenn sie gezwungen sind die Leistung dieses Designs zu verbessern um gegen g92x2 und GT200 anzukommen?
Würde man die neue Technologie einarbeiten, welche die skalierung des chips im multichipverband auf nahezu 100% erhöht?
Die Wahrscheinlichkeit R700 features in den rv670 zu integrieren und damit den rv770 zu gebähren hängt von folgenden Faktoren ab:
- Transistorenverbrauch der Interconnectarchitektur, reicht 55nm noch?
- Wieweit ist man mit Versuchen mit mehreren Dies auf einem Package?
- Reicht ein 200%tiger RV670?
- Ist ein leistungsmäßig aufgebohrter RV670 nicht günstiger und eventuell sogar leistungsfähiger und insbesondere besser nutzbar als Einzelchip füren Midrangebereich?

In anbetracht dass der r700 highend nur zwei Chips haben soll ist das ganze relativ klar. AMD hat sich entschieden den rv670 aufzubohren. Multichip meint nicht Dualchip. damals gab es Dualchipkarten schon eine Weile als das erste mal vom r700 die rede war. Vergesst es leute!
Keine bessere Crossfire Skalierung, kein neuer Interconnect.
Eine verbesserte Skalierung würde ja nur der Dualchipkarte etwas nützen, nicht der Singlechipkarte im Midrange. Verbesserte Skalierung mit meheren Chips lohnt sich also erst wirklich, wenn wir ein und denselben chip als 1x im lowend, 2x im midrange und 4x im highend haben oder so ähnlich.

Das heißt allerdings, dass AMD den RV670 ausschließlich leistungsmäßig aufbohren wird. Das Featureset ist ja noch in Ordnung, nvidia hat noch nicht nachgezogen.
Wie bewerkstelligt man das nun am besten, wenn man bedenkt dass man mit dem Chip einzeln nvidias bisherigen highend kontern muss und in zweifach asführung die 9800gx2 und GT200?
Große Schritte sind nicht möglich, da immernoch 55nm mehrere Tapeouts unakzeptabel. Lediglich eine Taktsteigerung der ALUs gegenüber dem rv670 ist damit unwahrscheinlich, da das ähnlich zuverlässig ist wie würfeln - man weiß nie genau um wieviel sich der takt noch steigern lässt.
Das SI zu vergrößern wäre ein Rückschritt zum R600, SB braucht der rv670 also nicht unbedingt. Außerdem hätte dass zwingend einen anderen Pincount zufolge, das wäre unpraktisch, bietet es sich doch an soviel wie möglich an Bauteilen mit dem rv670 zu teilen, eventuell sogar die kompletten PCBs.
Ein ähnlicher Schritt wie R520->R580 wäre denkbar und würde der derzeitigen Finanzsituation und Strategie AMDs voll entsprechen. Was die skalierung angeht so bleibt nur dem Treiberteam stress zu machen und zu hoffen und beten wie es die Tage bei AMD wohl häufig getan wird.

derzeit kann ich mir nicht vorstellen, dass AMD einen Chip weit über der Transistorenzahl des R600 geplant hat, 700-900 mio sind also realistisch.

dafür könnte man die Tex-Leistung pimpen, aber wie ich AMD kenne werden sie von ihrem Verhältnis nur ungern abweichen, siehe RV530-560, bedeutete dies ja ein Rückschritt hin zum derzeit Effizienteren G80 und damit ein deutliches Eingeständnis. Das ist außerdem sehr unwahrscheinlich weil man bisher programmierern immer von anderen Dingen erzählt hat.

Eher möglich halte ich die Variante die Architektur im selben Verhältnis zu verbreitern:
RV670: 64 ALUs, 16 TMUs
RV770: 96 ALUs, 24 TMUs

Oder gar die extreme Lösung:
RV770: 96 ALUs, 16 TMUs

Oder die Konservative:
RV770: 88 ALUs, 24 TMUs (RV670+RV635)

Ich denke dass AMD es schaffen könnte ohne den avivoquatsch und das SI eine Rochleistungssteigerung von 50% mit nur geringfügig höherem Stromverbrauch in einen RV670 Pinkompatiblen Chip mit rund 850mio Transistoren zu integrieren.
taktmäßig wird da nicht mehr viel gehen, bei 825mhz sind wir wieder am Ende und heiß und laut wirds dann auch.
Der RV670x2 sieht ja nach den ersten Angaben kühl genug aus, dass er noch ein paar Watt mehr vertragen kann. bei der singlechipkarte ist ein neuer Kühler definitiv, allein aus marketingtechnischen Gründen. Eventuell auch ein neues PCB und ein gegenüber der dualkarte gesteigerter takt.
Zumindest ist dass die Lösung die für AMD derzeit am meisten Sinn macht. - Singlechipleistung aus dem Niveau einer 8800GTS G92 und Dualchipleistung hoffentlich besser als eine 9800gx2 (nvidia wird wahrscheinlich bei der gx2 mit dem takt heruntergehen müssen). Und das ganze ohne viel Aufwand und ohne hohe Kosten evolutionär entwickelt, genau dass was AMD gerade als soliden Zwischenschieber braucht.

Ailuros
2008-01-23, 05:52:39
Zumindest ist dass die Lösung die für AMD derzeit am meisten Sinn macht. - Singlechipleistung aus dem Niveau einer 8800GTS G92 und Dualchipleistung hoffentlich besser als eine 9800gx2 (nvidia wird wahrscheinlich bei der gx2 mit dem takt heruntergehen müssen). Und das ganze ohne viel Aufwand und ohne hohe Kosten evolutionär entwickelt, genau dass was AMD gerade als soliden Zwischenschieber braucht.

9800GX2 <-> R680
GT200 <-..-> 2*RV770

Gast
2008-01-23, 07:37:26
hmm also ist die rv770 generation im cf-betrieb schon in der lage, der gt200 paroli zu bieten oder wie soll amn das jetzt verstehn?

Ailuros
2008-01-23, 08:15:53
hmm also ist die rv770 generation im cf-betrieb schon in der lage, der gt200 paroli zu bieten oder wie soll amn das jetzt verstehn?

Ich wollte lediglich anzeigen zu welchem Zeitpunkt A oder B und mit was genau konkurrieren wird. G80 bestand ja auch am Anfang aus 8800GTX/768, 8800GTS/640, 8800GTS/320; GT200 duerfte normalerweise auch zumindest eine Variante mit deaktivierten Einheiten haben. Wenn das dual-RV770 Gespann jetzt gut gegen die billigste Variante konkurrieren kann, ist es fuer AMD schon erstmal ein Vorteil. Nach mehr sieht es aber nicht aus, wenn NV tatsaechlich ihr Ziel mit GT200 erreicht.

davidzo
2008-01-23, 21:49:22
naja derzeit sieht es nicht so aus als wenn die 9800gx2 zeitgleich mit dem r680 kommt, das verschiebt sich nach hinten. man wird ja ersteinmal die partner mit genügend g92 für singlekarten beliefern müssen. es sei denn das wird wieder ein vaporprodukt von dem nur wenige formal existieren welches dann nie lieferbar ist außer in einem 10K Alienware System.

der GT200 hatte allen Anzeichen nach noch nicht sein tapeout. das wäre zumindest logisch, denn bisher kann ich mir nicht vorstellen wie jsen hsun und seine bande in so kurzer zeit ein solch riesiges Monaster zusammengebastelt bekommen kriegen.
ati kann immer noch hoffen das nvidia sich beim ersten highendchip mit 55nm ersteinmal verfransen wird wie sie selber beim r600. die chance für viele steppings bevor es richtig läuft ist leide rbei so großen chips sehr hoch.
der rv770 wird zwar garantiert langsamer sein als der gt200, aber dafür wahrscheinlich viel früher kommen.

Übrigens glaube ich einfach nicht dass der GT200 in der billigsten Variante den Dual RV770 versägen wird. wenn der RV770x2 gegenüber dem r680 gute mehrleistung bringt läge er gleichauf mit 2x 8800gtx oder ultras.
diese leistung in einem chip zu bringen und gleichzeitig directx10.1 und ein paar andere kleine neue features zu integrieren wäre eine chiptechnische meisterleistung die ich zwar am allermeisten nv zutraue, bisher abe richt für möglich halte. nicht in 55nm und absehbarer entwicklungszeit bzw. normaler steppinganzahl. Wahrscheinlicher ist es, dass der chip nicht ganz so stark ist wie angekündigt, dafür aber funktioniert oder anders herum sich eben verzögert und diverse debugsteppings braucht.

GeneralHanno
2008-01-23, 22:14:22
Zum Thema wann kommt der GT200. Immerhin hatte Nvidia seit dem G80 launch fast 1,5jahre zeit um einen neuen chip zu entwickeln ;)

edit: was die leistung angeht:

die 3870X2 liegt etwa 30% vor der GTX (mit besseren treibern + profilen vll max. 40%)
die GTX liegt etwa 20% vor der 3870
der RV770 soll etwa 50% schneller sein, als der RV670
der R700 ähnelt der 3870X2 und besteht aus 2*RV770

die GTX habe 100% leistung
die 3870 habe 80%
der GT200 mind. 2,5mal so viel haben, also mind. 250%
die 3870 hat 130-140% leistung (60-70% CF-effizienz)
der RV770 hat demnach 120%
und der R700 müsste demnach etwa 210% leistung haben (bei guter CF-effizienz)

damit sieht man, dass der R700(dual-VGA) vermutlich dem GT200(singel-VGA) unterlegen sein wird ...

Ailuros
2008-01-24, 05:42:33
der GT200 hatte allen Anzeichen nach noch nicht sein tapeout. das wäre zumindest logisch, denn bisher kann ich mir nicht vorstellen wie jsen hsun und seine bande in so kurzer zeit ein solch riesiges Monaster zusammengebastelt bekommen kriegen.

Kurze Zeit inwiefern?

ati kann immer noch hoffen das nvidia sich beim ersten highendchip mit 55nm ersteinmal verfransen wird wie sie selber beim r600. die chance für viele steppings bevor es richtig läuft ist leide rbei so großen chips sehr hoch.
der rv770 wird zwar garantiert langsamer sein als der gt200, aber dafür wahrscheinlich viel früher kommen.

Definier mal "viel".

Übrigens glaube ich einfach nicht dass der GT200 in der billigsten Variante den Dual RV770 versägen wird. wenn der RV770x2 gegenüber dem r680 gute mehrleistung bringt läge er gleichauf mit 2x 8800gtx oder ultras.
diese leistung in einem chip zu bringen und gleichzeitig directx10.1 und ein paar andere kleine neue features zu integrieren wäre eine chiptechnische meisterleistung die ich zwar am allermeisten nv zutraue, bisher abe richt für möglich halte. nicht in 55nm und absehbarer entwicklungszeit bzw. normaler steppinganzahl. Wahrscheinlicher ist es, dass der chip nicht ganz so stark ist wie angekündigt, dafür aber funktioniert oder anders herum sich eben verzögert und diverse debugsteppings braucht.

Es wurde ueberhaupt nichts angekuendigt bis jetzt. Was herausgeflossen ist bis jetzt ist sowieso nur mehr oder weniger in dieser Ecke bekannt, weil ich keine Lust habe es auf trash tabloid Seiten zu sehen.

NVIDIA wird sich darueber nicht aeussern und anstatt bis jetzt anzugeben dass sie schon auf 55nm arbeiten, schrieb jemand irgendwo dass sie sich fuer 55nm gerade erst umsehen, wobei komischerweise der Author einen eigenen fruehren newsblurb uebersehen hatte. Mehr wird es bis neue Details mit Absicht herausgeleakt werden von niemand geben.

Was jetzt die Leistung genau betrifft, gibt es einen relevanten Thread dafuer und ein paar hints aus denen man ein paar Einzelheiten herauslesen kann. Da wir im R700 thread sind, bleibt es dabei dass RV770 eigentlich eine "6" als erste Ziffer haben sollte weil eben nur "manhours" in R&D dafuer investiert wurden und weil genau um Resourcen zu sparen die RV670 Leistung nicht verdoppelt wurde wie original geplant.

naja derzeit sieht es nicht so aus als wenn die 9800gx2 zeitgleich mit dem r680 kommt, das verschiebt sich nach hinten. man wird ja ersteinmal die partner mit genügend g92 für singlekarten beliefern müssen. es sei denn das wird wieder ein vaporprodukt von dem nur wenige formal existieren welches dann nie lieferbar ist außer in einem 10K Alienware System.

Ausser es hat sich irgend etwas geaendert, kommt die GX2 im naechsten Monat und im Maerz dann die 9800GTX. NV ist sich durchaus bewusst dass es sich in beiden Faellen nur fuer Pflaster handelt, bis sich die hauptsaechliche Konzentration auf 55nm spaeter auszahlt.

AMD bleibt auf 55nm und 45nm steht vor 2009 nicht in Frage.

Cpl. Dwayne Hicks
2008-01-24, 12:00:53
Zum Thema wann kommt der GT200. Immerhin hatte Nvidia seit dem G80 launch fast 1,5jahre zeit um einen neuen chip zu entwickeln ;)

edit: was die leistung angeht:

die 3870X2 liegt etwa 30% vor der GTX (mit besseren treibern + profilen vll max. 40%)
die GTX liegt etwa 20% vor der 3870
der RV770 soll etwa 50% schneller sein, als der RV670
der R700 ähnelt der 3870X2 und besteht aus 2*RV770

die GTX habe 100% leistung
die 3870 habe 80%
der GT200 mind. 2,5mal so viel haben, also mind. 250%
die 3870 hat 130-140% leistung (60-70% CF-effizienz)
der RV770 hat demnach 120%
und der R700 müsste demnach etwa 210% leistung haben (bei guter CF-effizienz)

damit sieht man, dass der R700(dual-VGA) vermutlich dem GT200(singel-VGA) unterlegen sein wird ...

Die Lottozahlen vom kommenden Samstag hättest uns auch noch ruhig geben können.

w0mbat
2008-02-07, 15:06:20
Es gibt Gerüchte über einen Chip mit dem Codenamen RV740, was auf eine stärkere mid-range GPU der R700-Serie hindeuten könnte. Wie gesagt bisher aber nur Gerüchte, könnte also komplett warme Luft sein oder jemand will damit eben sagen das der RV635-Nachfolger gut schneller wird.

Mal sehen...

AnarchX
2008-02-07, 16:09:03
Kann/will man wohl doch nicht den RV670 langfristig gegen den G94 stellen?;)

Gast
2008-02-07, 16:20:00
Kann/will man wohl doch nicht den RV670 langfristig gegen den G94 stellen?;)

RV670 ist nur nur kleiner als G94, sondern wohl auch noch schneller.
G94 ist kein Gegner von RV740.

Gast
2008-02-07, 16:20:23
Kann/will man wohl doch nicht den RV670 langfristig gegen den G94 stellen?;)
RV670 ist in der Herstellung recht günstig, aber den kann man nur schwer als HD4xx0 verkaufen ;)
Umgelabelter RV670 :D

AnarchX
2008-02-07, 16:21:46
RV670 ist nur nur kleiner als G94, sondern wohl auch noch schneller.
G94 ist kein Gegner von RV740.

Das wird sich zeigen... :tongue:
Was über die Leistung vom G94 momentan herumschwirrt ist durchaus interessant und langfristig bleibt NV auch der optische Shrink zu 55nm offen.

reunion
2008-02-07, 17:05:35
Das wird sich zeigen... :tongue:
Was über die Leistung vom G94 momentan herumschwirrt ist durchaus interessant und langfristig bleibt NV auch der optische Shrink zu 55nm offen.

G94 hat vier Shader- und ROP-Cluster. Da braucht nichts herumzuschwirren, die Leistung kann man sehr gut einschätzen. Die Die-Size liegt über RV670, die Leistung liegt grob geschätzt auf demselben Niveau. NV hat ihren ersten 65nm Chip vorgestellt, kurz bevor AMD mit dem ersten 55nm Chip kam. So gesehen steht AMD auch noch der Shrink auf 45nm offen. Letztlich kann AMD mit Sicherheit verdammt gut damit leben, dass NV bald einen G94 und jetzt sogar einen G92 gegen RV670 stellen muss. Wie du darauf kommst das man das langfristig nicht wollen sollte, würde mich doch sehr interessieren.

AnarchX
2008-02-07, 17:15:47
So gesehen steht AMD auch noch der Shrink auf 45nm offen.
Zwischen einem optischen Shrink auf einen nutzbaren Halfnode und den Umstieg auf einen noch nicht wirklich brauchbaren Fullnode ist doch schon ein gewisser Unterschied.

Was langfristig zur Folge hätte, dass beide GPUs wohl annähernd gleich groß bzw. G94-Bx kleiner wäre und wohlmöglich durch den Shrink noch an Taktpotential aufnimmt, wie es bei NV vergangenen Halfnode-GPUs zeigte: NV42, G73-B.

Und das muss wohl eben ein RV740 her, der vielleicht dank optimierter Architektur es auch auf eine kleinere Die-Size als RV670 schafft, aber trotzdem auf dessem Leistungsniveau bleibt bzw. darüber liegt.

Hvoralek
2008-02-07, 17:49:32
NV hat ihren ersten 65nm Chip vorgestellt, kurz bevor AMD mit dem ersten 55nm Chip kam. So gesehen steht AMD auch noch der Shrink auf 45nm offen.Die Möglichkeit steht ihnen vlt. 2009 offen :wink:

Wenn es diesen RV740 wirklich gibt, wird AMD irgendeinen Grund haben, einen RV670- Nachfolger in 55nm zu produzieren. Sieht danach aus, als würde man doch auch etwas Nennenswertes an der Architektur umbauen.

Letztlich kann AMD mit Sicherheit verdammt gut damit leben, dass NV bald einen G94 und jetzt sogar einen G92 gegen RV670 stellen muss.Nur weil die billigste D8P- Karte und die teuerste RV670- Karte preislich nicht weit auseinander liegen, würde ich nicht sagen, dass die Chips miteinander konkurrieren. AMD wird weit mehr 3850 als 3870 verkaufen, also die Mehrzahl ihrer Chips in Karten <150€ verbauen lassen, wohingegen die 8800 GS nur in Ministückzahlen auf dem Markt ist und fast alle D8Ps auf Karten um oder über 200€ verkauft werden. Auch wenn Du immer so klingst, als würdest Du erwarten, dass der ja so viel günstiger zu fertigende RV670 Nvidia in den Ruin treibt, glaube ich kaum, dass die D8P- Margen schlechter sind.

Ailuros
2008-02-08, 08:23:20
RV770 ist nach allen Indizien auf 55nm. Nach 45nm in 2008 sieht es bis jetzt nicht aus.

Der Markt wo RV670 IMHLO zweifellos einen sehr grossen Vorsprung hat ist der Schlepptop Markt. Die-Groesse, Stromverbrauch, D3D10.1 (da die Hersteller hier stets ziemlich Feature-geil sind).

Da sich mit den ersten D3D10 (leistungsfaehigeren) GPUs sowieso nicht viel bewegt hat bis zu RV670/G92, hat sich hier ganz grob vereinfacht das Blatt gewendet im Vergleich zu R5x0/G7x. Wie sich hier die Prozentuale der Marktanteile damals bewegt haben, kann man ja sehen, obwohl manche damals es eher schwer hatten die damaligen Vor- und Nachteile jeder Seite einzusehen.

AMD's groesster Erfolg fuer RV670 duerfte IMHO grundsaetzlich in diesem Markt liegen und da es eh schon zu einem Aufschwung in diesem Markt in letzter Zeit kam, erwarte ich dass sie es schaffen werden weiterhin mehr Marktanteil dazuzugewinnen.

High end desktop und Profi-Maerkte bleiben weiterhin mit gutem Vorsprung in NV's Haenden. Ich bin eher neugierig was sich AMD in der weniger absehbaren Zukunft fuer den Consolen-Markt einfallen laesst.

AnarchX
2008-02-08, 11:00:20
Der Markt wo RV670 IMHLO zweifellos einen sehr grossen Vorsprung hat ist der Schlepptop Markt. Die-Groesse, Stromverbrauch, D3D10.1 (da die Hersteller hier stets ziemlich Feature-geil sind).

Nur sollte da auch mal bald eine SKU erscheinen, immerhin bietet NV ja schon seit Dezember 8800Ms an, deren Energieeffizienz nicht ganz ohne ist(5W Idle, <40W Last).
Und schliesslich wird ja bald G94 auch nachrücken und die 8800M-GTS ersetzen bei höherer Marge.

Gast
2008-02-08, 11:34:46
Nur sollte da auch mal bald eine SKU erscheinen, immerhin bietet NV ja schon seit Dezember 8800Ms an, deren Energieeffizienz nicht ganz ohne ist(5W Idle, <40W Last).
Und schliesslich wird ja bald G94 auch nachrücken und die 8800M-GTS ersetzen bei höherer Marge.

40W sind ein Wahnsinn in einem NB. Bis auf ein paar Freaknotebooks wird man hier kaum Absatzmärkte finden. Sowohl RV670 als auch G92/94 sind für einen Großteil der NBs unintressant. Der Grund, warum AMD im Notebookmarkt im Q4 6.4% Marktanteil gewinnen konnte, sind M82 und M86. Denn dagegen hat nV in punkto Kosten, Stromverbrauch und Features nicht entgegenzusetzen. Und dieser Trend wird sich fortsetzen, Digitimes prognostiziert schon für das Q2 wie einen Marktanteil von 55-60% für AMD: http://www.digitimes.com/mobos/a20080201PD210.html

reunion

Gast
2008-02-08, 11:41:44
Wer's glaubt..... schau dir mal die aktuellen Prospekte von Media Markt und Co. an, da sind 80% der Laptops mit Nvidia Karte, die restlichen 20% teilen sich ATI und Intel.

Gast
2008-02-08, 12:21:29
Noch. :)

Nakai
2008-02-08, 12:30:51
Das MM besonders für NV werbt sollte eigentlich klar sein. ;)


mfg Nakai

Gast
2008-02-08, 13:02:10
Das MM besonders für NV werbt sollte eigentlich klar sein. ;)


mfg Nakai
?Klär uns auf.

Ailuros
2008-02-08, 13:30:47
40W sind ein Wahnsinn in einem NB. Bis auf ein paar Freaknotebooks wird man hier kaum Absatzmärkte finden. Sowohl RV670 als auch G92/94 sind für einen Großteil der NBs unintressant. Der Grund, warum AMD im Notebookmarkt im Q4 6.4% Marktanteil gewinnen konnte, sind M82 und M86. Denn dagegen hat nV in punkto Kosten, Stromverbrauch und Features nicht entgegenzusetzen. Und dieser Trend wird sich fortsetzen, Digitimes prognostiziert schon für das Q2 wie einen Marktanteil von 55-60% für AMD: http://www.digitimes.com/mobos/a20080201PD210.html

reunion

Nur treibt eben leider oder Gott sei Dank (je nach Perskeptive) high end die unteren Segment eines Markts an. RV670/G92 sind high end im Schlepptop Markt; fuer besonders verrueckte gibt es ja auch SLi Dingsbumse.

deekey777
2008-02-08, 13:30:53
?Klär uns auf.
Natürlich macht MM keine Werbung für NV, sondern für die Produkte, die MM anbietet. Die wenigen Lieferanten dieser Produkte setzen oft Komponenten von NV und Intel ein (Medion/MSI, HP und weitere).

Nakai
2008-02-08, 13:34:11
Naja geh auf die Mediamarkt Homepage und schau welcher Hersteller da Werbung für seine Hardware macht.

Natürlich macht MM keine Werbung für NV, sondern für die Produkte, die MM anbietet. Die wenigen Lieferanten dieser Produkte setzen oft Komponenten von NV und Intel ein (Medion/MSI, HP und weitere).

Jaein. MM machts wie jeder größeres Geschäftsunternehmen. Sie suchen nach Angeboten und bekommen diese grad von XFX und NV.

Btw.: Das NV-Hardware ziemlich oft gekauft wird, kann man auch daran erkennen, wenn man die Hardwareverkäufe einiger freien Händler anschaut.
NV lag da schon immer relativ weit vorne.


mfg Nakai

Gast
2008-02-08, 15:29:23
Jaein. MM machts wie jeder größeres Geschäftsunternehmen. Sie suchen nach Angeboten und bekommen diese grad von XFX und NV.


mfg Nakai


Es war hier die Rede von Komplettrechnern bzw. Laptops und die werden wohl kaum von NVidia oder XFX angeboten.

LovesuckZ
2008-02-08, 15:54:07
40W sind ein Wahnsinn in einem NB. Bis auf ein paar Freaknotebooks wird man hier kaum Absatzmärkte finden. Sowohl RV670 als auch G92/94 sind für einen Großteil der NBs unintressant. Der Grund, warum AMD im Notebookmarkt im Q4 6.4% Marktanteil gewinnen konnte, sind M82 und M86. Denn dagegen hat nV in punkto Kosten, Stromverbrauch und Features nicht entgegenzusetzen. Und dieser Trend wird sich fortsetzen, Digitimes prognostiziert schon für das Q2 wie einen Marktanteil von 55-60% für AMD: http://www.digitimes.com/mobos/a20080201PD210.html

reunion

nVidia interessiert zum größten Teil nur der diskrete Notebookgrafikchipmarkt - hier sind die Margen am höhsten.
Der Erfolg von nVidia in diesem beruht auf der Verfügbarkeit von High-End - angefangen mit der Mobile 6800 Ultra.
Wenn der rv670 so geeignet für den Markt wäre, wo sind die Notebooks mit dem Chip?

reunion
2008-02-08, 16:00:59
nVidia interessiert zum größten Teil nur der diskrete Notebookgrafikchipmarkt - hier sind die Margen am höhsten.
Der Erfolg von nVidia in diesem beruht auf der Verfügbarkeit von High-End - angefangen mit der Mobile 6800 Ultra.

Natürlich geht es um diskrete Grafikchips. IPGs gibt es von AMD im Intelmarkt ohnehin nicht mehr. Auch die Meldung von Digitimes bezog sich ausschließlich auf diskrete Chips.


Wenn der rv670 so geeignet für den Markt wäre, wo sind die Notebooks mit dem Chip?

Es gibt noch keinen mobilen Ableger des RV670 den man verbauen könnte.

LovesuckZ
2008-02-08, 16:09:49
Natürlich geht es um diskrete Grafikchips. IPGs gibt es von AMD im Intelmarkt ohnehin nicht mehr. Auch die Meldung von Digitimes bezog sich ausschließlich auf diskrete Chips.

Richtig. Und sie sagt nichts aus. AMD hat also innerhalb von 6-12 Monaten ihren Marktanteil verdoppelt - und das mit Konkurrenz von nVidia?
Zur Zeit sehe ich bei Dell weniger AMD Grafikchips als nVidia - und Dell soll eine Quelle für den Anstieg sein.

reunion
2008-02-08, 16:14:01
Richtig. Und sie sagt nichts aus. AMD hat also innerhalb von 6-12 Monaten ihren Marktanteil verdoppelt - und das mit Konkurrenz von nVidia?
Zur Zeit sehe ich bei Dell weniger AMD Grafikchips als nVidia - und Dell soll eine Quelle für den Anstieg sein.

Wie unschwer zu erkennen ist bezieht sich die Meldung auf das 2Q/08. Dell soll "ready to adopt" bei AMD-Garfikchips sein. Und wie noch viel leichter zu erkennen ist, konnte AMD bereits im Q4/07 den Marktanteil von Notebookchips auf fast 30% steigern, und damit NV wieder überholen. Trotz fehlender IPG am Intelmarkt. So unwahrscheinlich erschient mir die Meldung also nicht.

LovesuckZ
2008-02-08, 16:29:34
Wie unschwer zu erkennen ist bezieht sich die Meldung auf das 2Q/08. Dell soll "ready to adopt" bei AMD-Garfikchips sein. Und wie noch viel leichter zu erkennen ist, konnte AMD bereits im Q4/07 den Marktanteil von diskreten Notebookchips auf fast 30% steigern, und damit NV wieder überholen. So unwahrscheinlich erschient mir die Meldung nicht.

Ich habe es gelesen. Und heute bietet Dell wesentlich mehr nVidia als AMD Books an.
Ausserdem beziehen sich die Zahlen auf den gesamten "notebook graphics chips" Markt - nicht nur auf die diskreten. Oder seit wann liefert Intel fast 47% diskrete Grafikkarten aus?

Gmax
2008-02-11, 21:37:31
RV770 on par with expectations, <50% faster than RV670 (http://www.nordichardware.com/news,7327.html)

The current state of RV770 of indicates that it should perform up to 50% better than RV670, which is pretty much what we're expecting (since this is the kind of leap you see with every generation...). The best thing about this is that ATI is on schedule for once and we should see the card in June, expect leaked benchmarks in May.

Diesen Sommer :smile:

nomadhunter
2008-02-11, 22:11:30
Aber eben auch höchstens 1,5x RV670-Leistung. Damit sollte klar sein, dass RV770X2 dem GT200 deutlich unterlegen ist (was aber auch zu erwarten war).

Für die 9800GTX könnte aber ein einzelner RV770 durchaus reichen (ich tippe auf ~Gleichstand) und die 9800GX2 wird IMHO gegen die RV770X2 kein Land sehen.

laser114
2008-02-11, 22:30:23
and other independent sources have said that chip will be more than fifty percent faster than the existing generation.
http://www.fudzilla.com/index.php?option=com_content&task=view&id=5605&Itemid=34

The current state of RV770 of indicates that it should perform up to 50% better than RV670
http://www.nordichardware.com/news,7327.html

Vermutlich sogar selbe Quelle, interessant was die Seiten daraus basteln.

Gosh
2008-02-11, 22:51:18
Warum hör ich immer nur vom RV770 ,das is doch nicht die Highend Version oder

Hvoralek
2008-02-11, 23:13:10
Warum hör ich immer nur vom RV770 ,das is doch nicht die Highend Version oderEs ist doch länger bekannt, dass "R700" jetzt die Bezeichnung für eine RV770- X2 ist.

Gast
2008-02-12, 10:15:43
RV770 and R700 to use GDDR5: http://www.fudzilla.com/index.php?option=com_content&task=view&id=5675&Itemid=1

Gast
2008-02-12, 12:36:31
Viel zu früh für GDDR5, wird wohl wie bei RV670 GDDR3 und GDDR4 werden.

laser114
2008-02-12, 14:35:32
RV740 is ATI's new mainstream card and from what we know, it is scheduled for second half of 2008. The new card is planned as ATI's ultimate mainstream and this is what ATI needs to fight soon the to be launched G94 based 9600GT.

The new RV740 also brings a 256 bit memory interface and it is a 55 nanometre based chip made my TSMC.

http://www.fudzilla.com/index.php?option=com_content&task=view&id=5681&Itemid=1

Damit dürfte der RV740 den RV670 ablösen.

Nakai
2008-02-12, 14:45:24
http://www.fudzilla.com/index.php?option=com_content&task=view&id=5681&Itemid=1

Damit dürfte der RV740 den RV670 ablösen.

Tut das nicht der RV770?


mfg Nakai

laser114
2008-02-12, 14:46:54
Tut das nicht der RV770?

Ich meinte leistungsmäßig, so in etwa dürfte es jedenfalls darauf hinauslaufen. Beim RV770 müssen wir mal schauen, wie groß der wird. Zwei Chips mit annähernd gleicher Größe und 256-Bit-Interface wird AMD nicht basteln.

Gast
2008-02-12, 14:54:52
http://www.fudzilla.com/index.php?option=com_content&task=view&id=5681&Itemid=1

Damit dürfte der RV740 den RV670 ablösen.

Deutet darauf hin das die RV7xx-Serie doch einige Verbesserungen erfahren hat, denn sonst könnte man auch einfach bei RV670 bleiben, der kleiner ist als ein G94 und wohl auch schneller.

nomadhunter
2008-02-12, 17:41:11
Ich vermute, dass die RV740 auf G94/9600GT-Niveau sein wird. Damit wird man vielleicht die 3850 ablösen. Dass es für die 3870 reicht, glaube ich eher nicht. In diesem Preisbereich wird vielleicht eine abgespeckte Variante des RV770 kommen.

Gast
2008-02-14, 09:36:12
Der R700 besteht aus zwei RV770, die direkt über ein neues Interface miteinander verbunden sind und auf einen gemeinsamen 1 GB großen GDDR5 Speicher zugreifen.

Gast
2008-02-14, 10:43:33
Wann soll der nochmal erschienen? 2010?

robbitop
2008-02-14, 10:44:02
Das war für den originalen R700 geplant. Beim jetzigen R700 scheint es sich noch um herkömmliches Crossfire zu handeln.

Gast
2008-02-14, 15:55:43
Das war für den originalen R700 geplant. Beim jetzigen R700 scheint es sich noch um herkömmliches Crossfire zu handeln.

Natürlich funktioniert es mit dem neuen CrossfireX-Treiber, es wird jedoch keine PCIe-Bridge mehr für die Verbindung benötigt. Auch der gemeinsam genutzte Speicher ist neu, was auch Sinn macht, da bei Crossfire sowieso jeder Grafikchip auf alle Daten zugreifen muss.

AnarchX
2008-02-14, 16:02:37
Natürlich funktioniert es mit dem neuen CrossfireX-Treiber, es wird jedoch keine PCIe-Bridge mehr für die Verbindung benötigt.
Quelle?
Software allein reicht nicht aus um unter "CF" den Speicher aller GPUs als einen gemeinsamen zu nutzen und dann noch eine brauchbare Performance zu erhalten, da brauch es teuere und schwierige Highspeed-Interconnects, für die aber wohl AMDs RnD-Budget nicht ausreichte, weshalb der ursprüngliche R700 gecancelt/verschoben wurde.

RV7xx wird wohl eher ein optimiertes R6xx-Design, wo die High-End-SKU eben wieder über ein simples Onboard-(AFR/SFR)-CF realisiert wird.


Auch der gemeinsam genutzte Speicher ist neu, was auch Sinn macht, da bei Crossfire sowieso jeder Grafikchip auf alle Daten zugreifen muss.
:|

_flx
2008-02-14, 16:10:11
.. was natürlich schade wäre.

robbitop
2008-02-14, 16:13:25
Natürlich funktioniert es mit dem neuen CrossfireX-Treiber, es wird jedoch keine PCIe-Bridge mehr für die Verbindung benötigt. Auch der gemeinsam genutzte Speicher ist neu, was auch Sinn macht, da bei Crossfire sowieso jeder Grafikchip auf alle Daten zugreifen muss.
Ich glaube, du verwechselst da was.

reunion
2008-02-14, 16:25:28
Software allein reicht nicht aus um unter "CF" den Speicher aller GPUs als einen gemeinsamen zu nutzen und dann noch eine brauchbare Performance zu erhalten, da brauch es teuere und schwierige Highspeed-Interconnects, für die aber wohl AMDs RnD-Budget nicht ausreichte, weshalb der ursprüngliche R700 gecancelt/verschoben wurde.


Der ursprüngliche R700 war 45nm. Damit wird es aber wohl dieses Jahr im High-End nichts mehr. Der jetzige RV770 ist die logische Konsequenz, also ein Zwischenschieber. Mit dem RnD-Budget hat das nichts zu tun.

Der R700 besteht aus zwei RV770, die direkt über ein neues Interface miteinander verbunden sind und auf einen gemeinsamen 1 GB großen GDDR5 Speicher zugreifen.

Der Speicher wird wohl nicht geshared aber es sieht so aus als ob beide Cores auf einen Träger kommen.

AnarchX
2008-02-14, 16:32:51
Der ursprüngliche R700 war 45nm. Damit wird es aber wohl dieses Jahr im High-End nichts mehr. Der jetzige RV770 ist die logische Konsequenz, also ein Zwischenschieber. Mit dem RnD-Budget hat das nichts zu tun.
Natürlich, mit mehr RnD hätte man ihn auch auf 55nm realisieren können und wäre nicht auf 45nm angewiesen.


Der Speicher wird wohl nicht geshared aber es sieht so aus als ob beide Cores auf einen Träger kommen.
Auch nicht schlecht, da kommt dann wohl die PCIe-Bridge auf den Die und das PCB wird noch etwas einfacher, soetwas hatte ich eigentlich schon für den R680 erwartet.

StefanV
2008-02-14, 16:46:01
Natürlich, mit mehr RnD hätte man ihn auch auf 55nm realisieren können und wäre nicht auf 45nm angewiesen.
Wär am Ende nur Geldverschwendung...

Gast
2008-02-14, 16:49:50
Warum soll der Speicher nicht geshared sein? Beide Chips können über ihr eigenes 256 Bit breites Interface darauf zugreifen. So können die 1 GB voll genutzt werden, anstatt alles doppelt abzulegen.

AnarchX
2008-02-14, 16:54:43
Wär am Ende nur Geldverschwendung...
Kann aber entscheidend sein im Kampf um die High-End-Krone und der Auswirkung auf die Verkäufe aller GPUs dieser Familie. Und da stellt sich dann die Frage wo mehr Geld verloren geht. ;)

Warum soll der Speicher nicht geshared sein? Beide Chips können über ihr eigenes 256 Bit breites Interface darauf zugreifen. So können die 1 GB voll genutzt werden, anstatt alles doppelt abzulegen.
Nein, bei 3870X2 sind an jede GPU, welche ein 256Bit SI hat 8 Chips angebunden -> 8 * 32Bit = 256Bit.
Am besten nochmal dazu etwas lesen:
http://www.computerbase.de/artikel/hardware/grafikkarten/2008/test_ati_radeon_hd_3870_x2/3/#abschnitt_technische_details
Wie schon gesagt für sinvolles shared Memory müssen ICs zwischen den GPUs bestehen, sodass z.B. der Ringbus über beide GPUs verläuft, aber dafür brauch es ICs mit >100GB/s.

reunion
2008-02-14, 17:14:58
Natürlich, mit mehr RnD hätte man ihn auch auf 55nm realisieren können und wäre nicht auf 45nm angewiesen.


Hast du eine Ahnung was es bedeutet, ein Design, welches von Grund auf auf einen bestimmten Prozess optimiert wurde mal eben umzustellen? Da kannst du wieder ganz weit vorne anfangen. Das kostet nicht nur RnD sondern vorallem jede menge Zeit. Daran auch nur zu denken wäre kompletter Unsinn IMO.

AnarchX
2008-02-14, 17:26:21
Das sind dann zwei verschiedene Interpretationsansätze, während du davon ausgehst, dass R700 grundlegend für 45nm entwickelt wurde, würde ich eher davon ausgehen, dass ATi die Vorteile der kleineren Strukturbreite benötigt um gewisse Probleme im Design auszugleichen und wiederum um ein vitales Produkt zu erhalten, welche aber wohlmöglich durch mehr RnD-Einsatz gar nicht erst bestehen würden.
Also an sich ATi-as-usual, die Prozess-Poker spielen um RnD zu sparen, was diesmal daneben ging bzw. weil AMD dieses Risiko nicht eingehen kann, in der aktuellen Lage.

StefanV
2008-02-14, 17:29:59
@AnarchX

Du machsts dir zu einfach, es ist nciht 'mal eben' möglich von einem kleineren auf 'nen größeren Prozess zu gehen, umgekehrt aber auch nicht, wenn auch einfacher, da der 'neue' Prozess idR in (fast) jedem Punkt besser denn der alte ist...

AnarchX
2008-02-14, 17:39:28
Nunja, wie schon gesagt, es ist eine Interpretationsache ob das Design vom R700 auf 45nm angewiesen ist oder ob ATi einfach diesen Prozess brauch um eine brauchbare SKU zu erhalten.
Ich tendieren doch zu letzerem, vorallem da AMD selbst mal für den echten "Multicore-R700" von 55nm sprach, was sich dann aber wohl in Simulationen als falsche Projektion herausstellte.

reunion
2008-02-14, 19:17:55
Das sind dann zwei verschiedene Interpretationsansätze, während du davon ausgehst, dass R700 grundlegend für 45nm entwickelt wurde, würde ich eher davon ausgehen, dass ATi die Vorteile der kleineren Strukturbreite benötigt um gewisse Probleme im Design auszugleichen und wiederum um ein vitales Produkt zu erhalten, welche aber wohlmöglich durch mehr RnD-Einsatz gar nicht erst bestehen würden.
Also an sich ATi-as-usual, die Prozess-Poker spielen um RnD zu sparen, was diesmal daneben ging bzw. weil AMD dieses Risiko nicht eingehen kann, in der aktuellen Lage.


Das hat nichts mit Interpretationssache zu tun. Ein Design wird für einen bestimmten Prozess ausgelegt, wenn dieser dann zur vorgesehen Zeit nicht zur Verfügung steht hat man Pech gehabt. Das lässt sich nicht mal eben schnell abändern. Die Frage ob der ursprüngliche R700 45nm benötigt hätte um konkurrenzfähig zu sein, wie von dir angedeutet, stellt sich gar nicht. Und da man über diesen Chip so gut wie nichts weiß ist die Behauptung auch ziemlich unpassend. RV770 kommt weil es eben nicht "ATi-as-usual" ist, und man die Fehler aus der Vergangenheit nicht noch mal wiederholen will. Zudem sehe ich grundsätzlich nichts schlechtes daran moderne Fertigungsprozesse einzusetzen. Durch den frühen Einsatz von 55nm konnte man hier bsw. deutliche Vorteile erzielen. Natürlich kann man sich auch mal die Finger verbrennen, aber solange man rechtzeitig die Notbremse zieht.

LovesuckZ
2008-02-14, 19:21:27
Wie kann man bitte ein Design auf einen Prozeß auslegen, der noch nicht zur Verfügung steht? Das ist so dämlich, dass es nichtmal mehr wehtut.

san.salvador
2008-02-14, 19:23:26
Wie kann man bitte ein Design auf einen Prozeß auslegen, der noch nicht zur Verfügung steht? Das ist so dämlich, dass es nichtmal mehr wehtut.
Glaubst du Intel entwickelt eine CPU, die in zwei Jahren erscheinen sol, in 45nm? ;D

reunion
2008-02-14, 19:28:41
Wie kann man bitte ein Design auf einen Prozeß auslegen, der noch nicht zur Verfügung steht? Das ist so dämlich, dass es nichtmal mehr wehtut.

Dämlich ist höchstens deine Antwort. Die Libaries für den jeweiligen Prozess stehen logischerweise deutlich vor der Massenproduktion zur Verfügung.

AnarchX
2008-02-14, 19:31:41
Glaubst du Intel entwickelt eine CPU, die in zwei Jahren erscheinen sol, in 45nm? ;D

Und hiermit nennst du schon den Unterschied:
Intel entwickelt die Fertigungsprozesse selbst und hat somit Möglichkeiten Prozess und Design entsprechend auszurichten. NV und ATi sind aber auf Fremdfertigung angewiesen und haben deshalb eher geringen Einfluss auf den Prozess und somit wiederum auch keine wirkliche Sicherheit bei der Anpassung ihrer ASICs auf einen Prozess.

Und ich habe meine Zweifel, dass R700 auf 45nm ausgerichtet wurde, er brauch wohl eher nur diesen Prozess um als konkurrenzfähiges Produkt am Markt zu bestehen können. Wohl an sich eher eine operative Entscheidung der jüngeren Vergangheit, nachdem man erste Simulationen @55nm sah und NVs kommende Produkte genauer einschätzen konnte.

san.salvador
2008-02-14, 19:34:22
Und hiermit nennst du schon den Unterschied:
Intel entwickelt die Fertigungsprozesse selbst und hat somit Möglichkeiten Prozess und Design entsprechend auszurichten. NV und ATi sind aber auf Fremdfertigung angewiesen und haben deshalb eher geringen Einfluss auf den Prozess und somit wiederum auch keine wirkliche Sicherheit bei der Anpassung ihrer ASICs auf einen Prozess.

Und ich habe meine Zweifel, dass R700 auf 45nm ausgerichtet wurde, er brauch wohl eher nur diesen Prozess um als konkurrenzfähiges Produkt am Markt zu bestehen können. Wohl an sich eher eine operative Entscheidung der jüngeren Vergangheit, nachdem man erste Simulationen @55nm sah und NVs kommende Produkte genauer einschätzen konnte.
Auch wieder richtig.
Aber ich glaub trotzdem, dass man für den nächst-kleineren Fertigungsprozess entwickelt, in der Annahme, dass dieser rechtzeitig fertig wird.
Geht oft gut, aber nicht immer. :D

LovesuckZ
2008-02-14, 19:40:03
Glaubst du Intel entwickelt eine CPU, die in zwei Jahren erscheinen sol, in 45nm? ;D

Nein, ich glaube eher, sie wissen, wann ein Prozeß zeitlich zur Verfügung steht.
Das ist laut Reunion bei AMD nicht so. Sie fangen an und irgendwann überprüfen sie dann, ob das überhaupt geht.

reunion
2008-02-14, 19:40:55
Und ich habe meine Zweifel, dass R700 auf 45nm ausgerichtet wurde, er brauch wohl eher nur diesen Prozess um als konkurrenzfähiges Produkt am Markt zu bestehen können.


Also war er nicht auf 45nm ausgerichtet? Du redest über einen Chip über den du vermutlich wenig bis gar nichts weißt als ob er bei dir als Prototyp zu Hause liegen würde. Wie schon gesagt, die Frage ob er 45nm benötigt hätte, um konkurrenzfähig zu sein stellt sich gar nicht. Er war auf 45nm ausgelegt und damit musste er in 45nm kommen.


Wohl an sich eher eine operative Entscheidung der jüngeren Vergangheit, nachdem man erste Simulationen @55nm sah und NVs kommende Produkte genauer einschätzen konnte.

Glaubst du wirklich man kann sich da einfach hinsetzen und ein Chipdesign je nach Lust und Laune auf bestimmten Prozessen mit völlig unterschiedlichen Voraussetzungen simulieren? Wenn R700 auf 45nm ausgelegt war, dann ist man auf diesen Prozess angewiesen.

reunion
2008-02-14, 19:43:13
Nein, ich glaube eher, sie wissen, wann ein Prozeß zeitlich zur Verfügung steht.
Das ist laut Reunion bei AMD nicht so. Sie fangen an und irgendwann überprüfen sie dann, ob das überhaupt geht.

Ich hoffe du bist dir darüber im klaren das bei den nV-Roadmaps in letzter Zeit ebenso einiges über den Haufen geworfen wurde. Deine Unterstellung ist einfach nur lächerlich und reine Polemik.

Gast
2008-02-14, 19:43:50
Du weist doch gar nicht was der Ursprüngliche R700 mal war, von daher kann keiner Sagen, ist gewollt, hamse nich hinbekommen oder Glanzparade.

reunion
2008-02-14, 19:47:32
Du weist doch gar nicht was der Ursprüngliche R700 mal war, von daher kann keiner Sagen, ist gewollt, hamse nich hinbekommen oder Glanzparade.

Richtig. Aber es gibt Aussagen glaubwürdiger Leute die zumindest diese Schlüsse zulassen.

Hvoralek
2008-02-14, 19:49:06
Ist TSMCs 45- nm- Prozess denn in dem Maße verschoben worden? Wenn AMD R700 stets darauf ausgerichtet hatte, hätte man ja bis vor Kurzem noch davon ausgegangen sein müssen, dass der Prozess dieses Frühjahr für Massenfertigung zur Verfügung stehe und stabil genug sei, einen ziemlich großen Chip wie R700 mit entsprechender Ausbeute und genug Taktpotenzial zu tragen. Und das, während gleichzeitig 55- nm- Chips erst für dieses Jahr geplant waren. Auch diese schlagartige Verschiebung um grob 9 Monate sieht mir eher nach einer Neuausrichtung des Chips aus und nicht des Prozesses.

Also war er nicht auf 45nm ausgerichtet? Oh Mann. Du redest über einen Chip über den du vermutlich wenig bis gar nichts weißt als ob er bei dir als Prototyp zu Hause liegen würde. Wie schon gesagt, die Frage ob er 45nm benötigt hätte, um konkurrenzfähig zu sein stellt sich gar nicht. Er war auf 45nm ausgelegt und damit musste er in 45nm kommen.Ich nehme also an, Du hast den als Prototypen zuhause?

Glaubst du wirklich man kann sich da einfach hinsetzen und ein Chipdesign je nach Lust und Laune auf bestimmten Prozessen mit völlig unterschiedlichen Voraussetzungen simulieren? Wenn R700 auf 45nm ausgelegt war, dann ist man auf diesen Prozess angewiesen.Simulationen dienen dazu, abzuschätzen, was technisch machbar ist und was nicht. Wenn es mehrere Optionen gibt, wird man sicherlich auch mehrere durchspielen und sich die sinnvollste heraussuchen.

AnarchX
2008-02-14, 19:53:05
Also war er nicht auf 45nm ausgerichtet? Oh Mann. Du redest über einen Chip über den du vermutlich wenig bis gar nichts weißt als ob er bei dir als Prototyp zu Hause liegen würde. Wie schon gesagt, die Frage ob er 45nm benötigt hätte, um konkurrenzfähig zu sein stellt sich gar nicht. Er war auf 45nm ausgelegt und damit musste er in 45nm kommen.
Und woher diese Sicherheit?

Q1 2007 war jedenfalls für R700(Multicore, 2nd Gen Tesselator,...) noch 55nm angedacht, was sich im Laufe des Jahres offensichtlich geändert hat, womit ich eben berechtigte Zweifel habe, dass er von Anfang an auf 45nm ausgelegt wurde.
Und da kommen wohl die Simulationen mit den entsprechenden Libaries ins Spiel, die die Untauglichkeit des eigentlich angedachten Prozesses für R700 zeigten.

Würde mich nicht wundern, wenn es gerade eben die HighSpeed-Interconnects sind, die man unter 55nm nicht auf die benötigte Taktrate gebracht hat.:D

reunion
2008-02-14, 19:53:26
Ist TSMCs 45- nm- Prozess denn in dem Maße verschoben worden? Wenn AMD R700 stets darauf ausgerichtet hatte, hätte man ja bis vor Kurzem noch davon ausgegangen sein müssen, dass der Prozess dieses Frühjahr für Massenfertigung zur Verfügung stehe und stabil genug sei, einen ziemlich großen Chip wie R700 mit entsprechender Ausbeute und genug Taktpotenzial zu tragen. Und das, während gleichzeitig 55- nm- Chips erst für dieses Jahr geplant waren. Auch diese schlagartige Verschiebung um grob 9 Monate sieht mir eher nach einer Neuausrichtung des Chips aus und nicht des Prozesses.


Der ursprüngliche R700 war wohl kein großer Chip.

Ich nehme also an, Du hast den als Prototypen zuhause?

Habe ich das behauptet oder irgendwie angedeutet? Ich weiß nur das er in 45nm geplant war.


Simulationen dienen dazu, abzuschätzen, was technisch machbar ist und was nicht. Wenn es mehrere Optionen gibt, wird man sicherlich auch mehrere durchspielen und sich die sinnvollste heraussuchen.

Richtig, und deshalb gibt es jetzt eben einen RV770.

reunion
2008-02-14, 19:57:03
Und woher diese Sicherheit?

Q1 2007 war jedenfalls für R700(Multicore, 2nd Gen Tesselator,...) noch 55nm angedacht, was sich im Laufe des Jahres offensichtlich geändert hat, womit ich eben berechtigte Zweifel habe, dass er von Anfang an auf 45nm ausgelegt wurde.
Und da kommen wohl die Simulationen mit den entsprechenden Libaries ins Spiel, die die Untauglichkeit des eigentlich angedachten Prozesses für R700 zeigten.

Würde mich nicht wundern, wenn es gerade eben die HighSpeed-Interconnects sind, die man unter 55nm nicht auf die benötigte Taktrate gebracht hat.:D

Möglich ist vieles. Einen Chip hingegen mal eben auf eine älteren Herstellungsprozess umzuswitchen ist sicher nicht möglich/sinnvoll. NV konnte bei NV30 ja auch nicht mal eben auf 150nm umsteigen als man merkte das 130nm noch nicht so weit war, sondern musste die Kröte schlucken.

Hvoralek
2008-02-14, 20:38:54
Der ursprüngliche R700 war wohl kein großer Chip.Ich habe zu dem Teil > 300 mm² im Hinterkopf. Allerdings weiß ich selbst nicht mehr, wo das herkommt, kann insofern auch verkehrt sein.

Aber selbst unabhängig von der Chipgröße: Durfte man bis vor Kurzem damit rechnen, dass im Frühjahr 2008 45nm bei TSMC überhaupt einsatzbereit wäre? War das überhaupt jemals so geplant (Noch einmal: AMD hatte ursprünglich 55- nm- Chips erst für Anfang 2008 geplant)

Habe ich das behauptet oder irgendwie angedeutet? Ich weiß nur das er in 45nm geplant war.Deine Äußerungen klingen ebenso sehr wie die von AnarchX danach, als würdest Du den Chip genau kennen. Wenn Du ihm vorhältst, über R700 zu reden, "als ob er bei [ihm] als Prototyp zu Hause liegen würde", finde ich, dass Du Dir dieselben Vorwürfe wirst anhören müssen.

Richtig, und deshalb gibt es jetzt eben einen RV770.Hattest Du nicht kurz vorher noch strikt ausgeschlossen, dass IHVs im Rahmen von Simulationen mehrere Modelle durchspielen :|

Was wären denn Deiner Meinung nach die Alternativen zum jetztigen RV770/ R700 gewesen?

reunion
2008-02-14, 20:54:00
Ich habe zu dem Teil > 300 mm² im Hinterkopf. Allerdings weiß ich selbst nicht mehr, wo das herkommt, kann insofern auch verkehrt sein.

Ich weiß nicht genaueres, aber durch das Multi-Core-Konzept kann man wohl davon ausgehen, dass ein Core keine neuen Rekorde aufgestellt hätte.


Aber selbst unabhängig von der Chipgröße: Durfte man bis vor Kurzem damit rechnen, dass im Frühjahr 2008 45nm bei TSMC überhaupt einsatzbereit wäre? War das überhaupt jemals so geplant (Noch einmal: AMD hatte ursprünglich 55- nm- Chips erst für Anfang 2008 geplant)


Der ursprüngliche R700 war H2/2008 in 45nm. Dazu gab es Roadmaps. Warum AMD jetzt einen RV770 noch im ersten Halbjahr bringen will und den ursprünglichen R700 auf 2009 verschoben hat kann viele Gründe haben. Man sah wohl das 45nm nicht mehr rechtzeitig Einsatzbereit sein würde und nV mit GT200 relativ zeitig antanzt. Jedenfalls wurde diese Entscheidung nicht erst seit gestern getroffen.


Deine Äußerungen klingen ebenso sehr wie die von AnarchX danach, als würdest Du den Chip genau kennen. Wenn Du ihm vorhältst, über R700 zu reden, "als ob er bei [ihm] als Prototyp zu Hause liegen würde", finde ich, dass Du Dir dieselben Vorwürfe wirst anhören müssen.

Ich habe mich stets nur wegen dem Herstellungsprozess geäußert, AnarchX spekuliert wild herum das der Chip sonst nicht konkurrenzfähig gewesen wäre. Ich finde da gibt es schon noch einen Unterschied.


Hattest Du nicht kurz vorher noch strikt ausgeschlossen, dass IHVs im Rahmen von Simulationen mehrere Modelle durchspielen :|


Nein, ich habe ausgeschlossen das man den ursprünglichen R700 mal eben auf 55nm "hochshrinken" hätte können. RV770 ist eben die Notlösung.


Was wären denn Deiner Meinung nach die Alternativen zum jetztigen RV770/ R700 gewesen?

RV770 ist bereits die Alternative.

Hvoralek
2008-02-14, 21:18:58
Ich weiß nicht genaueres, aber durch das Multi-Core-Konzept kann man wohl davon ausgehen, dass ein Core keine neuen Rekorde aufgestellt hätte.Ein einzelner sicher nicht. Aber mit Blick auf G200 kommen mir 2*300 mm² durchaus plausibel vor. Auf die Chipfläche bringt es eine 9800 GX2 auch schon.

Der ursprüngliche R700 war H2/2008 in 45nm. Dazu gab es Roadmaps.Weißt Du, von wann die ungefähr waren?

Ich habe mich stets nur wegen dem Herstellungsprozess geäußert, AnarchX spekuliert wild herum das der Chip sonst nicht konkurrenzfähig gewesen wäre. Ich finde da gibt es schon noch einen Unterschied.Das ist aber höchstens ein quantitativer.

Nein, ich habe ausgeschlossen das man den ursprünglichen R700 mal eben auf 55nm "hochshrinken" hätte können.Wer hat das denn behauptet? Es geht eher darum, ob man mit dem Ding nicht von 55nm auf 45nm umgeschwenkt ist. Ein Wechsel auf einen früher verfügbaren Prozess hätte wohl kaum zu einer solchen Verschiebung geführt.

RV770 ist bereits die Alternative.Dann frage ich so: Die Alternative zu was?

Gast
2008-02-15, 10:53:28
Ich hoffe du bist dir darüber im klaren das bei den nV-Roadmaps in letzter Zeit ebenso einiges über den Haufen geworfen wurde. Deine Unterstellung ist einfach nur lächerlich und reine Polemik.


Er hat aber im Gegensatz zu dir Recht.
Fängst du etwa beim Chipdesign auf der Transistorebene an?
Also bei mir beginnt Chipentwicklung mit der Schaltungslogik und erst wenn die fix und fertig ist, dann geht es an die Umsetzung der Logik in ein Chipdesign auf Transistorebene.

Gmax
2008-02-15, 15:32:39
Weltweit erste Details zu kommenden ATI Radeon HD 4000 Grafikkarten (http://www.hartware.de/news_44085.html)

Gast
2008-02-15, 15:34:52
Exklusiv: Radeon HD 4000 Infos

Weltweit erste Details zu kommenden ATI Radeon HD 4000 Grafikkarten

http://www.hartware.de/news_44085.html

deekey777
2008-02-15, 15:39:25
Weltweit erste Details zu kommenden ATI Radeon HD 4000 Grafikkarten (http://www.hartware.de/news_44085.html)
Die Daten klingen plausibel. Oder liegt es daran, dass eDRAM nirgendwo erwähnt wird? :biggrin:

Gast
2008-02-15, 15:46:26
Uh, da hat jemand die Präsi geleakt. :)

Gast
2008-02-15, 15:50:32
Hehe Gmax war etwas schneller als ich^^

@T ich finde die HD4850 interessant :biggrin:

AnarchX
2008-02-15, 15:50:42
Über 1GHz ROP-Takt @55nm?:| Und ein 128Bit SI für einen 40SP Low-End-Chip ist auch eher BS...

Wobei mir die 8TA/TF-TU Idee gefällt. ;)

Gast
2008-02-15, 15:56:21
Über 1GHz ROP-Takt @55nm?:|


Warum auch nicht? Bis jetzt hat ATi noch bei jeder neuen Chipserie den Takt kräftig erhöht:

R300: 325Mhz
R420: 520Mhz
R520: 625Mhz
R600: 742Mhz

Superheld
2008-02-15, 15:57:10
habse sich nur aus gedacht, Hardware.de ist wie Fuddu:rolleyes:

[dzp]Viper
2008-02-15, 15:59:32
habse sich nur aus gedacht, Hardware.de ist wie Fuddu:rolleyes:

Eigentlich nicht. Hartware.de ist eigentlich eher seriös.

Finde die Werte und Angaben jetzt auch nicht zu unrealistisch.

Bis auf die Verbrauchsangaben unter IDLE. Die sollen ja bei allen Chips gleich sein - das geht doch aber garnicht oder? :|

Gast
2008-02-15, 16:07:43
Warum auch nicht? Bis jetzt hat ATi noch bei jeder neuen Chipserie den Takt kräftig erhöht:

R300: 325Mhz
R420: 520Mhz
R520: 625Mhz
R600: 742Mhz


Aber nicht beim gleichen Fertigungsprozess!

2B-Maverick
2008-02-15, 16:08:56
Viper;6282879']Eigentlich nicht. Hartware.de ist eigentlich eher seriös.

Finde die Werte und Angaben jetzt auch nicht zu unrealistisch.

Bis auf die Verbrauchsangaben unter IDLE. Die sollen ja bei allen Chips gleich sein - das geht doch aber garnicht oder? :|

Warum net? Wenn die 3D-Teile der Chips quasi komplett deaktiviert werden?
Und evtl. für die Vista Aero-Oberfläche gerade mal ein "Cluster" oder was auch immer mit halbem Takt läuft?

CU
Markus

Gast
2008-02-15, 16:24:45
Viper;6282879']Bis auf die Verbrauchsangaben unter IDLE. Die sollen ja bei allen Chips gleich sein - das geht doch aber garnicht oder? :|
Naja da gabs ja keine richtigen Angaben außer der, dass die Chips unter 10W bleiben sollen (!= Grafikkarte!)

deekey777
2008-02-15, 16:29:57
habse sich nur aus gedacht, Hardware.de ist wie Fuddu:rolleyes:
Und jetzt beleg mal deine Behauptung.

Hvoralek
2008-02-15, 16:34:19
Viper;6282879']Eigentlich nicht. Hartware.de ist eigentlich eher seriös.

Finde die Werte und Angaben jetzt auch nicht zu unrealistisch.Ich denke auch: Großer Pluspunkt erst einmal für die Nennung einer Quelle. Dass das dann Anonymus ist, ist natürlich weniger gut ;)

Wenn die Daten korrekt sind, wäre das natürlich toll. Das läge doch ein Stück über dem, was zumindest ich von RV770 erwartet hatte (mit einem deutlich breiteren Chip und dazu noch einer wesentliche Taktsteigerung). Sie sind zumindest schon einmal in sich stimmig, was bei gefälschten Zahlen ja bereits eine Ausnahme wäre. Zumindest bis auf weiteres werde ich diese Angaben als zu erwartenden RV770 ansehen: Es sind die bisher einzigen konkreten Daten und sie sind nicht offensichtlich Unsinn. Ich musste auch gerade an das hier denken: Über 1 Milliarde Transistoren bei über 1 Milliarde Hertz mit über 1 Milliarde Byte RAM. Das dürfte schon vor einer GeForce 10 Wirklichkeit werden. G200 wird bei 1 GHz wohl kaum gemeint sein.

Zum Chip: Man kann wohl grob doppelte 3870- Leistung erwarten, was für diesen Zwischenschieber sehr beachtlich wäre (R420 ahoi). Die höhere relative Filterleistung wäre erfreulich, wenn auch leider so spät, dass man sie sich vlt. fast schon wieder hätte sparen können. Mit einem Chip sollte man eine 9800 GTX schlagen oder zumindest mithalten können, die X2 wäre erst einmal konkurrenzlos. Gegen G200 wird man aber damit kaum eine Chance haben.

Klasse wären auch die TDPs, gerade die der X2 (Das wäre kaum mehr als ide 3870 X2, die unter Last real fast 200W frisst :|). Allerdings würde ich bei denen (ebenso wie beim Takt) nicht darauf wetten, dass die bis zum Erscheinen so bleiben, auch wenn AMDs momentane Pläne so aussehen.

So ein Chip dürfte irgendwas um 300 mm² messen, oder?

AnarchX
2008-02-15, 16:35:11
Bis auf wenige Punkte, die ich schon ansprach, sind die Infos und Aufbereitung nicht schlecht bzw. kommt mir diese ziemlich bekannt vor und hier haben wir aber wieder das Problem, dass entsprechende Folien ohne Probleme von Dritten erstellt werden können.

Ein RV770 der laut Specs nach ~ 1 Mrd. Transistoren, >300mm² aussieht und dann noch nicht unbedingt die Empfehlungen von TSMC einhält, ist aber nunmal etwas riskant und somit unglaubwürdig.

Erfreulich wäre es aber natürlich, wenn die Planungen real sind und zeitnah umgesetzt werden.

Hvoralek
2008-02-15, 16:39:47
Ein RV770 der laut Specs nach ~ 1 Mrd. Transistoren, >300mm² aussieht und dann noch nicht unbedingt die Empfehlungen von TSMC einhält, ist aber nunmal etwas riskant und somit unglaubwürdig.Wenn das riskant sein soll, was ist dann G200?

LovesuckZ
2008-02-15, 16:45:36
Zum Chip: Man kann wohl grob doppelte 3870- Leistung erwarten, was für diesen Zwischenschieber sehr beachtlich wäre (R420 ahoi).


Eigentlich nicht. Das ist im Rahmen, was man nach fast 1 1/2 Jahren erwarten kann.

AnarchX
2008-02-15, 16:47:31
Wenn das riskant sein soll, was ist dann G200?
Nunja, Die-Size ist eher unproblematisch, aber Taktraten nicht, hier hat jeder Prozess seine bestimmten Grenzen, in deren Nähe zu kommen bzw. zu überschreiten man eher vermeiden sollte, mit komplexer Logik, wie TMUs oder ROPs. Und AFAIR war das bei 55nm ~1GHz.

Oder glaubst du ATi gibt aus Spass bei RV670 mit eher gering steigender Taktrate so hohe Spannungen? ;)

reunion
2008-02-15, 16:49:11
Das passt wie angegossen zu den herumschwirrenden Specs. Das wurde von Hartware garantiert nicht erfunden. Jede Wette das sich die Daten als richtig herausstellen. Auch wenn die Taktraten vielleicht etwas hoch sind, ich ging bisher aufgrund der Specs von 640SPs aus.

Nunja, Die-Size ist eher unproblematisch, aber Taktraten nicht, hier hat jeder Prozess seine bestimmten Grenzen, in deren Nähe zu kommen bzw. zu überschreiten man eher vermeiden sollte, mit komplexer Logik, wie TMUs oder ROPs. Und AFAIR war das bei 55nm ~1GHz.

Oder glaubst du ATi gibt aus Spass bei RV670 mit eher gering steigender Taktrate so hohe Spannungen? ;)

Die Taktraten hängen primär vom Design ab. Warum soll bei 55nm nicht mehr als ein Ghz drin sein? Wo du das her hast weiß ich nicht, aber das wäre schon sehr skurril.

LovesuckZ
2008-02-15, 16:52:55
640 sind einfach zuviel, wenn man keinen riesigen Die haben will. Ausserdem wäre hier wohl die Taktraten viel eher am limtieren als bei 480.

deekey777
2008-02-15, 16:54:11
...

Wobei mir die 8TA/TF-TU Idee gefällt. ;)
Mir nicht. Es sind wohl 2*4.
Reinrechnerisch geht alles auf: "480 SPE" wären 96 ALUs auf 6 SIMDs verteilt. 6*16*10 FLOP ergeben 960 FLOP pro Takt, mit 1050 wären wir gerade über 1 TFLOP/s. 32 TMUs ergeben so oder so sind (entweder 2 unabhängige TEX-SIMDs mit je 4 Quads oder ein SIMD mit 4 Quads+4 Quads, wo ein Thread auf diese verteilt wird).
RV740: ein halber RV770 und 3 RBEs.

reunion
2008-02-15, 16:55:18
RV770 = 4x RV635. Wie schon bei R580. ;)
So konnte man das auch in relativ kurzer Zeit erreichen.

Wobei mir die 8TA/TF-TU Idee gefällt. ;)

Es werden ziemlich sicher weiterhin doppelt so viel TFUs sein.

AnarchX
2008-02-15, 16:58:17
Die Taktraten hängen primär vom Design ab. Warum soll bei 55nm nicht mehr als Ghz drin sein? Wo du das her hast weiß ich nicht, aber das wäre schon sehr skurril.
Es hängt nunmal nicht primär vom Design ab, wenn man ROPs und TMUs nicht über ALUs emuliert, sonst wäre ATi schon längst weit über 1GHz. Ich glaube du unterschätzt den Einfluss des Fertigungsprozesses.

Aber ich muss zugeben, die Leistungsdaten passen in der Tat zu Projektion vom November. Für den Kunden wäre das natürlich eine feine Sache...;)


Mir nicht. Es sind wohl 2*4.
Reinrechnerisch geht alles auf: "480 SPE" wären 96 ALUs auf 6 SIMDs verteilt. 6*16*10 FLOP ergeben 960 FLOP pro Takt, mit 1050 wären wir gerade über 1 TFLOP/s. 32 TMUs ergeben so oder so sind (entweder 2 unabhängige TEX-SIMDs mit je 4 Quads oder ein SIMD mit 4 Quads+4 Quads, wo ein Thread auf diese verteilt wird).
RV740: ein halber RV770 und 3 RBEs.
Natürlich auch möglich, wobei das wiederum ziemlich an Transistoren kosten sollte.

Aber RV740 soll laut Hartware ja mit 24 TMUs und 240SPs kommen, was dann wohl eher 3+3 bzw. 3/3 Quads mit 4 SIMDs wären.

deekey777
2008-02-15, 17:07:50
RV770 = 4x RV630. Wie schon bei R580. ;)


Ich mach's deutlicher: Es ist seit dem RV530 das erste Mal, dass der Midrange-Chip ein halber Highend-Chip ist.
Wenn man weiterspinnt: Erinnert euch an die Spekulation, dass der Highend-Chip der R700-Generation aus vier kleineren Cores bestehen soll? Ein "R780" (2*RV770) wäre "4*RV740". Malwieder zeigt sich die schöne Skalierbarkeit der R600-Archittektur (wo man über Tex-Quads und ALU-Quads und ganze SIMDs skalieren kann).


Es werden ziemlich sicher weiterhin doppelt so viel TFUs sein.
Die Anzahl wird doppelt so hoch sein, aber interessant ist eher, wie diese Verdopplung erreicht wird.

laser114
2008-02-15, 17:10:26
Ich mach's deutlicher: Es ist seit dem RV530 das erste Mal, dass der Midrange-Chip ein halber Highend-Chip ist.

Naja, RV770 stellt aber nur in der Dual-Variante das High-End-Modell dar.

Ich bezweifle allerdings, dass die Taktraten jetzt schon feststehen.

AnarchX
2008-02-15, 17:18:05
Ich bezweifle allerdings, dass die Taktraten jetzt schon feststehen.
Man hat halt meist eine Projektion, die eintreffen kann oder nicht. RV670 erreicht sie bekanntlich nicht.

reunion
2008-02-15, 17:30:13
Es hängt nunmal nicht primär vom Design ab, wenn man ROPs und TMUs nicht über ALUs emuliert, sonst wäre ATi schon längst weit über 1GHz. Ich glaube du unterschätzt den Einfluss des Fertigungsprozesses.


Ich glaube du spinnst dir irgendwas zusammen. Es gibt jedenfalls keine physikalische Grenze, die Taktraten von über einem Ghz verhindern. Zudem hätte schon ein R600 problemlos 800Mhz erreicht wenn da nicht das Problem mit der Leistungsaufnahme wäre. Und der wurde in 80nm hergestellt. Bei den bisherigen 65/55nm Chips von AMD wurden anscheinend wenig Wert auf bessere Taktbarkeit gelegt, es wurden ja sogar Transistoren entfernt, die möglicherweise taktkritisch waren um sparsamer Fertigen zu können. Deshalb halte ich das Ghz nicht für ausgeschlossen.


Aber ich muss zugeben, die Leistungsdaten passen in der Tat zu Projektion vom November. Für den Kunden wäre das natürlich eine feine Sache...;)


Habe ich doch gesagt das die Folien nicht auf den ursprünglichen R700 bezogen waren. :)

Man hat halt meist eine Projektion, die eintreffen kann oder nicht. RV670 erreicht sie bekanntlich nicht.

Als R680 schon.

w0mbat
2008-02-15, 17:50:44
Hm, ich glaube nicht das jetzt schon Taktraten verfügbar sind und ein 128-bit SI im Low-end sind mMn auch Verschwendung. Und wenn die Präsentation doch echt ist, wie kam der da vor mir dran?! ;)

Hvoralek
2008-02-15, 17:54:12
Eigentlich nicht. Das ist im Rahmen, was man nach fast 1 1/2 Jahren erwarten kann.Klar: Du hast ja schon immer gesagt, dass ein einzelner RV770 grob doppelt so schnell wird wie ein dann 7 Monate alter RV670 und damit auch die 9800 GTX schlagen sollte ;D

Nunja, Die-Size ist eher unproblematisch, aber Taktraten nicht, hier hat jeder Prozess seine bestimmten Grenzen, in deren Nähe zu kommen bzw. zu überschreiten man eher vermeiden sollte, mit komplexer Logik, wie TMUs oder ROPs. Und AFAIR war das bei 55nm ~1GHz.

Oder glaubst du ATi gibt aus Spass bei RV670 mit eher gering steigender Taktrate so hohe Spannungen? ;)Bei den Taktraten bin ich wie gesagt selbst skeptisch, gerade zusammen mit dem moderaten Stromverbrauch. Wenn man die nicht erreicht, könnte ich mit meinem bisherigen Tipp (1,5- facher RV670 mit ein paar Umbauten) doch ganz gut liegen, nur mit einer höheren relativen Filterleistung hätte ich wirklich nicht gerechnet.

Aber wenn man nicht gut 1 GHz schaffen, sondern knapp darunter bleiben sollte, wäre das nicht so dramatisch. Ich mache mir aber mit Blick auf die Probleme, die man schon bei RV670 hatte, auch schon unter 1 GHz Sorgen. Bei einem deutlich größeren Chip und diesen TDPs rechnet man offenbar mit einer Spannung, die zumindest nicht höher ist als bei RV670.

Die Anzahl wird doppelt so hoch sein, aber interessant ist eher, wie diese Verdopplung erreicht wird.Ich glaube, Reunion meinte "TAUs". Also 32 TFUs + 64 TAUs (+64 zusätzliche Sampler).

reunion
2008-02-15, 17:55:42
Ich glaube, Reunion meinte "TAUs". Also 32 TFUs + 64 TAUs (+64 zusätzliche Sampler).

Richtig.

laser114
2008-02-15, 18:01:58
Hm, ich glaube nicht das jetzt schon Taktraten verfügbar sind und ein 128-bit SI im Low-end sind mMn auch Verschwendung.

Letzteres macht bei 8 TMUs dann schon langsam Sinn, so schnell gehen die Speicherpreise nicht runter. Im Mainstream ist man ja auch bei 256 Bit angekommen, anscheinend sind Platinen etwas günstiger geworden; die Chips selber sollten nicht mehr deutlich größer von 64- auf 128-Bit werden. Eine 64-Bit-Karte kann man ja immer noch erstellen...

deekey777
2008-02-15, 18:25:16
...
Ich glaube, Reunion meinte "TAUs". Also 32 TFUs + 64 TAUs (+64 zusätzliche Sampler).
Und ich glaube, wir sollten uns endlich von dieser Zählerei lösen. Genauso wie von "480 SPEs" oder ähnlichem.
Meine Kernaussage unterscheidet sich von reunions grundsätzlich nicht, es geht mir nur darum, wie man diese Verdopplung von 16 "TMUs" auf 32 erreicht. Das Wörtchen "TMU" passt in diesem Zusammenhang mit dem R600 nunmal wenig, insbesondere wenn wir seit Jahren Quad-TMUs haben. Bei dem R600 sind die 4 Sampler Arrays (B3D-Jargon) zu einem SIMD (AMD-Jargon)zusammengefasst, diese füttern das entsprechende ALU-Quad der ALU-SIMDs.
"32 TMUs" wäre bei Behaltung des Aufbaus der R600-Sampler Verdopplung der Quads innerhalb des SIMDs oder gar ein weiteres SIMD. 32 TMUs könnten aber sein, dass innerhalb der Quads die Anzahl der Filtereinheiten der Anzahl der Adressierungseinheiten entspricht, da man eingesehen hat, dass die vier "losen" TAs unnützt sind (sprich nicht benutzt werden).

Der R600 leidet an seiner geringen Filterleistung.

Man darf nicht vergessen, dass der G92 keine 64 TMUs hat, sondern jeder Block über "Octo-TMUs" verfügt.

Hvoralek
2008-02-15, 18:31:32
Und ich glaube, wir sollten uns endlich von dieser Zählerei lösen. Genauso wie von "480 SPEs" oder ähnlichem.
Meine Kernaussage unterscheidet sich von reunions grundsätzlich nicht, es geht mir nur darum, wie man diese Verdopplung von 16 "TMUs" auf 32 erreicht. [...]
"32 TMUs" wäre bei Behaltung des Aufbaus der R600-Sampler Verdopplung der Quads innerhalb des SIMDs oder gar ein weiteres SIMD. 32 TMUs könnten aber sein, dass innerhalb der Quads die Anzahl der Filtereinheiten der Anzahl der Adressierungseinheiten entspricht [...].Und Reunion geht anscheinend davon aus, dass man nicht einfach jeden Block um 4 Filtereinheiten und ein paar Sampler erweitert, sondern bei gleichem Aufbau die Anzahl der Tex- Blöcke erhöht hat.

AnarchX
2008-02-15, 18:41:41
... was dann wohl eine Textur-SIMD mit 8 Sampler-Arrays und 3 SIMDs mit je 8 ALU-Quads zur Folge hätte.

Da gibt es in der Tat allerhand Möglichkeiten, wie nun AMD auf die doppelte Textur-Quad/TF-Zahl kommen kann.:uponder:

deekey777
2008-02-15, 18:45:52
Und Reunion geht anscheinend davon aus, dass man nicht einfach jeden Block um 4 Filtereinheiten und ein paar Sampler erweitert, sondern bei gleichem Aufbau die Anzahl der Tex- Blöcke erhöht hat.
R600 mit seinen "16 TMUs":
http://www.beyond3d.com/content/reviews/16/9
Each sampler unit can setup 8 addresses per clock, fetch 16 FP32 values for bilinear filtering, and 4 FP32 values for point sampling, all per clock, and then bilinearly filter at a rate of four INT8 or FP16 bilerps per cycle, from those fetched values.
RV770 mit 32 "TMUs":
Each sampler unit can setup 8 addresses per clock, fetch 16 FP32 values for bilinear filtering, and 4 FP32 values for point sampling, all per clock, and then bilinearly filter at a rate of eight INT8 or FP16 bilerps per cycle, from those fetched values.
Das kostet deutlich weniger Transistoren.
Oder:
http://img219.imageshack.us/img219/8292/sampler2kg0.png
Sprich Verdopplung aller Sampler-Units (als ein SIMD oder zwei SIMDs).

... was dann wohl eine Textur-SIMD mit 8 Sampler-Arrays und 3 SIMDs mit je 8 ALU-Quads zur Folge hätte.

Da gibt es in der Tat allerhand Möglichkeiten, wie nun AMD auf die doppelte Textur-Quad/TF-Zahl kommen kann.:uponder:
Womit wir hier wären:
...



Natürlich auch möglich, wobei das wiederum ziemlich an Transistoren kosten sollte.


... was dann wohl eine Textur-SIMD mit 8 Sampler-Arrays und 3 SIMDs mit je 8 ALU-Quads zur Folge hätte.


Nicht 3*8, sondern 2*12. RV740 = HD2900GT mit 3 RBEs.

AnarchX
2008-02-15, 18:54:13
Und was spricht deiner Meinung nach gegen Textur-Oktets oder müsste dann die ALUs entsprechend auch so angeordnet werden?


Nicht 3*8, sondern 2*12. RV740 = HD2900GT mit 3 RBEs.
:| Das wäre aber dann 12 Quads ("48TMUs"), RV770 soll deren doch nur 8 bzw. 32 haben?

deekey777
2008-02-15, 19:19:16
Und was spricht deiner Meinung nach gegen Textur-Oktets oder müsste dann die ALUs entsprechend auch so angeordnet werden?


:| Das wäre aber dann 12 Quads ("48TMUs"), RV770 soll deren doch nur 8 bzw. 32 haben?

Ich weiß auch nicht, irgendwie ergeben die Angaben von HT nicht viel Sinn, wenn von der Threadgröße des R600 ausgegangen wird (als Maximum).

Ich will nicht hoffen, dass die Threadgröße bzw. die Breite der SIMDs von maximal 16 auf 24 verbreitet wurde.
Es ist nicht einfach, die Anzahl der Einheiten zu erhöhen, eher im Gegenteil.
Die ALU-SIMDs sind mit den TEX-SIMDS verknüpft:
TEX ALU-SIMD1 ALU-SIMD2 ALU-SIMD3 ALU-SIMD4
A A A A A
B B B B B
C C C C C
D D D D D

Man kann zwar einzelne ALU-SIMDs deaktivieren, aber nicht einzelne Quads, denn die TEX-Quads sind mit den ALU-Quads verknüpft (TEX-Quad A füttert die ALU-Quads A1, A2, A3, A4 usw.) Für mich ergibt sich nur die folgende Überlegung: Man hängt weitere SIMDs dran. Oder die Texturenleistung wird aufgemotzt (AABBCCDD). Einzelne Quads "dranhängen" kommt nicht in Frage, denn das würde zur Erhöhung der Threadgröße führen.

Ist das wirklich so?

LovesuckZ
2008-02-15, 19:24:01
Klar: Du hast ja schon immer gesagt, dass ein einzelner RV770 grob doppelt so schnell wird wie ein dann 7 Monate alter RV670 und damit auch die 9800 GTX schlagen sollte ;D


Eine Leistungsverdopplung nach 1 1/2 Jahren ist der Regelfall.

Hvoralek
2008-02-15, 21:16:10
Eine Leistungsverdopplung nach 1 1/2 Jahren ist der Regelfall.Für AMD ist das weit mehr als eine Verdopplung in der Zeit. Es geht seit R600 innerhalb von einem Jahr um die doppelte Leistung pro Chip und damit noch eine X2. Das ist schon beachtlich, zumal man so trotz der ungünstigen Voraussetzungen Nvidia bis G200 ziemlich blank erwischt hat. Aber wie gesagt, natürlich hast gerade Du genau das von RV770 erwartet, nicht wahr?

deekey777
2008-02-15, 22:21:40
Und was spricht deiner Meinung nach gegen Textur-Oktets oder müsste dann die ALUs entsprechend auch so angeordnet werden?


:| Das wäre aber dann 12 Quads ("48TMUs"), RV770 soll deren doch nur 8 bzw. 32 haben?
Jetzt nochmal, aber diesmal langsamer.
HT meint, dass der RV770 mit 480 SPs kommt, das sind dann 96 5D-Einheiten. Weiterhin sagen sie, es wären 32 TMUs. Vom R600 wissen wir, dass die Breite des Sampler-Blocks gleich Breite des ALU-Blocks ist: 16 vs. 16 bei HD2900XT/Pro, 12 vs. 12 bei der GT, 8 vs. 8 beim RV630.
Nehmen wir an, es sind 32 TMUs. 96 ist wunderbar durch 32 teilbar, ist aber schwachsinnig. Die 32 TMUs sind auf 2 Sampler-Arrays verteilt (16 hier, 16 da). Das passt auch: Wir hätten 6 ALU-SIMDs mit je 4 Quads. Oder die 32 TMUs sind weiterhin ein Sampler-Array, aber mit verdoppelter Anzahl an Filtereinheiten, passt alles zusammen.

Übertragen auf den RV740: Die Organisation wie bei der 2900GT erscheint die einzig logische. Dh 12 bzw. "2x12" TMUs stehen 12 5D-ALUs gegenüber.

Der Vorteil der G80-Architektur ist ihre Breite: Man hat 8 Blöcke, die unabhängig voneinander werkeln. Beim R600 ist die Anzahl der Blöcke (SIMDs) deutlich geringer - nur vier, - dafür aber sind die SIMDs an sich breiter (16-Wege-SIMDs), was zu einer deutlich höheren Granularität geführt hat. Wenn die "480 SPs) stimmen, dann ginge ATi "einfach" in die Breite. Aber was ist mit dem Transistor-Budget? Darum ist die Verdopplung aller Textureneinheiten so schwer vorzustellen.

Was aber bisher nicht angesprochen wurde: Was wäre, wenn nur eine Zahl stimmt und zwar ein Teraflop. Wie erreicht man eine Leistung von 1 TFLOP/s? Theoretisch mit einer HD3870 X2. Man nimmt (64*10*775)*2 und bekommt fast 1 TFLOP/s. Ganz verrückt: Man braucht einen Shadertakt von 1600 MHz und 64 5D-ALUs. Und verdoppelt nebenbei die Anzahl der TFs oder gleich der Sampler-Units.

Aber:
In der gestrigen News zum kommenden ATI RV740 Grafikchip konnten wir noch keine Details nennen. Das hat einen unserer Leser offenbar gestört und er hat uns anonym Bilder einer authentischen aussehenden Präsentation der wahrscheinlich im Juni kommenden Radeon HD 4000 Serie von AMD zukommen lassen. Wir haben leider keine Möglichkeit, diese Informationen zu verifizieren, aber interessant zu lesen sind sie auf jeden Fall.
Ergänzend:
http://www.fudzilla.com/index.php?option=com_content&task=view&id=1385&Itemid=34

Ailuros
2008-02-16, 08:32:58
Man darf nicht vergessen, dass der G92 keine 64 TMUs hat, sondern jeder Block über "Octo-TMUs" verfügt.

Wenn jedes array ueber 8 TA/TF verfuegt, dann ist 8*8=64.

Falsch waere zu behaupten dass G80 ueber mehr als 32TMUs verfuegt.

Der Vorteil der G80-Architektur ist ihre Breite: Man hat 8 Blöcke, die unabhängig voneinander werkeln.

Ich befuerchte dass sie den Vorteil auch weiterhin haben werden. Was ich eher vermute ist dass AMD im RV770 das ALU:TEX Verhaeltnis wieder leicht erhoeht, waehrend NV auf ein ziemlich kleineres ratio setzt (stets im Vergleich zu ihren eigenen Vorgaengern).

Was aber bisher nicht angesprochen wurde: Was wäre, wenn nur eine Zahl stimmt und zwar ein Teraflop. Wie erreicht man eine Leistung von 1 TFLOP/s? Theoretisch mit einer HD3870 X2. Man nimmt (64*10*775)*2 und bekommt fast 1 TFLOP/s. Ganz verrückt: Man braucht einen Shadertakt von 1600 MHz und 64 5D-ALUs. Und verdoppelt nebenbei die Anzahl der TFs oder gleich der Sampler-Units.

R680 ist auf 825 getaktet und ich glaube auch daran dass die ALUs in RV670 bei einer leicht hoeheren Frequenz operieren. Was den Rest des RV770 betrifft sind 1GHz nur ein Schuss zuviel. 742->775->825....was koennte wohl danach kommen hm? ;)

LovesuckZ
2008-02-16, 11:24:51
Was aber bisher nicht angesprochen wurde: Was wäre, wenn nur eine Zahl stimmt und zwar ein Teraflop. Wie erreicht man eine Leistung von 1 TFLOP/s? Theoretisch mit einer HD3870 X2. Man nimmt (64*10*775)*2 und bekommt fast 1 TFLOP/s. Ganz verrückt: Man braucht einen Shadertakt von 1600 MHz und 64 5D-ALUs. Und verdoppelt nebenbei die Anzahl der TFs oder gleich der Sampler-Units.

Das ist etwas, was anscheinend viele nicht verstehen: AMD hat zur Zeit 64 Recheneinheiten und taktet diese mit maximal 825MHz. nVidia hat nur 8 bzw. 16.
Wie soll AMD nun plätzlich die Recheneinheiten mit 1650MHz betreiben ohne aufwendige Kühlung und sehr hohem Stromverbrauch?
Die Peak-Leistung bei der Stromaufnahme beim G80 Design wird bei Rechenaufgaben erreicht.

reunion
2008-02-16, 12:25:40
Schon bekannt? Einträge im HDA Intel Treiber für den HDMI Audio-Support:

AZX_DRIVER_ATIHDMI }, /* ATI RV770 HDMI */
+ { 0x1002, 0xaa38, PCI_ANY_ID, PCI_ANY_ID, 0, 0,
AZX_DRIVER_ATIHDMI }, /* ATI RV730 HDMI */
+ { 0x1002, 0xaa40, PCI_ANY_ID, PCI_ANY_ID, 0, 0,
AZX_DRIVER_ATIHDMI }, /* ATI RV710 HDMI */
+ { 0x1002, 0xaa48, PCI_ANY_ID, PCI_ANY_ID, 0, 0,
AZX_DRIVER_ATIHDMI }, /* ATI RV740 HDMI */

http://article.gmane.org/gmane.linux.alsa.devel/51536

ATi fertigt immerhin vier verschiedenen Cores. Mit "R700" also fünf Serien.

deekey777
2008-02-16, 12:31:31
Wenn jedes array ueber 8 TA/TF verfuegt, dann ist 8*8=64.

Falsch waere zu behaupten dass G80 ueber mehr als 32TMUs verfuegt.
Weil nur 32 Texturen adressiert werden. Das kann der R600 auch, leider kann er nur 16 Bis raushauen.
Der Begriff "TMUs" ist heute unpassend und führt zu einem zu großen Raum für Spekulationen, insbesondere bei R600-Samplern.
Ich befuerchte, dass sie den Vorteil auch weiterhin haben werden. Was ich eher vermute ist dass AMD im RV770 das ALU:TEX Verhaeltnis wieder leicht erhoeht, waehrend NV auf ein ziemlich kleineres ratio setzt (stets im Vergleich zu ihren eigenen Vorgaengern).
Wenn ATi (es ist ein ATi-Produkt :biggrin:) das Verhältnis erhöht:
Aktuell sind wir bei 1:4 (auf eine Sampler-Einheit kommen vier Quad-ALUs). Wenn ATi tatsächlich so verrückt ist und die Zahl der Samper-Einheiten verdoppelt, wären wir bei 1:3 (32 "TMUs" vs. 480/5 = 96 5D-ALUs oder besser 8 Sampler-Units vs. 24 Quad-5D-ALUs). Das wäre zu verrückt, allein wegen der Transistorkosten.
Wenn ATi aber "nur" die Anzahl der TFs verdoppelt hat (man kann wieder von 32 TMUs sprechen), hätten wir zwar 4 Sampler-Units vs. 24, die Sampler-Units sind aber mächtiger. Ist das jetzt ein 1:6-Verhältnis oder 1:3? Ist das überhaupt interessant?

R680 ist auf 825 getaktet und ich glaube auch daran, dass die ALUs in RV670 bei einer leicht hoeheren Frequenz operieren. Was den Rest des RV770 betrifft sind 1GHz nur ein Schuss zuviel. 742->775->825....was koennte wohl danach kommen hm? ;)
Selbst mit 825 MHz hätten wir eine Texturenfillrate bei gesunden 26400 MTex/s. Die Frage ist, ab welcher Texfillrate ist das Ganze ungesund? Ab wann limitiert die Bandbreite? Da lohnt sich malwieder ein Blick in einen der vielen aths' Artikel: http://www.3dcenter.org/artikel/2006/12-28_b.php
Wir möchten die Texturfilter-Performance heute nicht en detail behandeln, aber kurz die Frage klären, ob die Bandbreite überhaupt ausreicht, um die TMUs auszulasten. Bei 32-Bit-Texturen und der Annahme, dass pro bilinearem Sample im Durchschnitt ein neues Texel gelesen werden muss (und der Rest aus dem Cache kommt), würden 147,2 GB/s alleine für die Texturen benötigt werden. Bei unkomprimierten 32-Bit-Texturen ist demnach nicht genug Bandbreite da (147,2 GB/s benötigt, nur 86,4 GB/s vorhanden) – doch die Output-Leistung ist noch immer unübertroffen. Bei allen DXT-Formaten (mit maximal 8 Bit pro Texel) ist jedoch genug Bandbreite vorhanden.
Es gibt aber nicht nur Texturen, die Bandbreite brauchen. Insbesondere im "HDR-Zeitalter" steigt der Bedarf an Framebuffer-Bandbreite weiter und weiter (wir spielen auch ungern ohne die liebe Kantenglättung).

Mein RV770 wäre aktuell:
6 16-Wege-Shader-SIMDs, 1 Sampler-SIMD/Array mit 32 TFs (sonst alles beim Alten), 4 RBEs mit 64 Z/Takt. Der Takt wäre bei 850-900 MHz, aber der "Shader-Clock" höher, um fast ein TFLOP/s zu erreichen, was PR-mäßig für offene Münder sorgt.
Der RV740:
4 12 Wege-Shader-SIMDs, 1 Sampler-Array mit 24 TFs/TAs usw, 4 RBEs.

AnarchX
2008-02-16, 12:43:22
ATi fertigt immerhin vier verschiedenen Cores. Mit "R700" also fünf Serien.
Wenn man RV700XT diesmal nicht wieder für $499 anbieten muss, so scheint da wohl genügend Platz für so eine Menge an SKUs zu sein.

RV730 wird dann wohl ein RV635 mit 16 TMUs und den neuen RBEs mit HW-Resolve und >2Z sein.


Der RV740:
4 12 Wege-Shader-SIMDs, 1 Sampler-Array mit 24 TFs/TAs usw, 4 RBEs.
Wieso 4 RBEs?

Die 2900 GT hat doch auch nur 3 aktive RBEs:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=6112567&postcount=2

Und mehr RBEs als wie die Textur-SIMDs lang sind gehen wohl nicht.

HOT
2008-02-16, 12:54:22
RV770 = 4x RV635. Wie schon bei R580. ;)
So konnte man das auch in relativ kurzer Zeit erreichen.
[...]
Das wird der Springende Punkt bei der Sache sein und das macht die Daten auch realistisch. Der RV710 = RV610 mit 128Bit + DDR5 Support, alle weiteren Chips sind auf dem RV635 aufgebaut. Das wäre billig und machbar, wie damals der R420, welcher ja faktisch aus 4 RV350 bestand, übrigens auch beim gleichen Fertigungsprozess (beide 130nm). Damals schaffte man auch hohen Takt mit dem viel grösseren Chip und machte alles durch Optimierung wett.
Dann ist RV740 = doppelt RV635 (ca. 500-600Mio Transistoren) und RV770 = 4x RV635 (ca. 1Milliarde Transistoren). hohe Taktraten sind mit den Chips jetzt schon kaum ein Problem. Dass die Architektur taktfreudig ist, hat man ja am R600 schon gesehen. Nur ist es dennoch unwahrscheinlich, dass die angepeilten Taktraten erreicht werden. Ich rechne da eher mit 825-875MHz für eine HD4870 (X2). Der Chip wäre wohl so ca. 300mm² gross, vielleicht etwas darüber. Das ist also kein Hindernis für eine Dual-Karte. Auch die Leistungsaufnahme passt durchaus und wäre damit hart am Limit bei einer X2.
Als "Zwischengeneration" wird der R700 am realistischsten dargestellt und die Technik muss ja die gleiche sein, man unterstüzt ja schon ab dem R600 alle Features (wenn sie da auch nicht alle verfügbar waren, aus welchen Gründen auch immer).

AnarchX
2008-02-16, 12:56:23
HOT, wie wäre es mal mehr als nur ein Posting zu lesen?

Was du hier zusammenspekulierst passt gar nicht zu den inoffiziellen Daten von HT und zu den Regelmässigkeiten der R6xx-Architektur auf der auch R7xx aufbauen wird.

Kurz:
RV710 != RV635 mit GDDR5-Support, sondern RV710 ist laut HT ein RV620 mit 2 Textur-Quads und einem 128 Bit SI.

HOT
2008-02-16, 12:58:54
Stimmt, macht aber nix. Ich find meine Spekulation toll :D. Dann ersetze man den RV710 durch was anderes und der RV740 ist halt nen doppelter RV635 und der RV770 ein vierfacher. Dann passts. Dann hat der RV710 nur 8 SPs wie ein RV610 und nicht 24 wie der RV635 und alle sind wieder glücklich (habs mal oben korrigiert).
I.Ü. habe ich fast alle Postings gelesen.

@deekey777
Beim RV63x sind es ja 3 SPs pro TMU sehr salop formuliert. Beim R600 und RV670 sind es 4 SPs pro TMU. Dass das Verhältnis beim RV770 verbessert wird halte ich für wahrscheinlich. Wie die jetzt arrangiert sind, weiß man nicht, aber die Annahme, man wird es möglichst transistorsparend machen, ist wohl am schlüssigsten, da AMD das ja ziemlich frei handhaben kann offenbar.

robbitop
2008-02-16, 12:59:16
Mein RV770 wäre aktuell:
6 16-Wege-Shader-SIMDs, 1 Sampler-SIMD/Array mit 32 TFs (sonst alles beim Alten), 4 RBEs mit 64 Z/Takt. Der Takt wäre bei 850-900 MHz, aber der "Shader-Clock" höher, um fast ein TFLOP/s zu erreichen, was PR-mäßig für offene Münder sorgt.
Der RV740:
4 12 Wege-Shader-SIMDs, 1 Sampler-Array mit 24 TFs/TAs usw, 4 RBEs.
Wenn ich dich jetzt richtig verstanden habe, willst du die 4x SIMD ALU Arrays auf 6x verbreitern. In dem Falle bräuchtest du aber auch noch 2x Sampler Einheiten mehr, sonst wären die 2x SIMDs ohne Input.
Dann könnte man aber schlecht 32 TFUs verbauen (32 ist nicht durch 6 teilbar) sondern lediglich 24 TFUs bzw 48 TFUs. Das Teil bräuchte dann gut 50% mehr Transistoren, da du das Design dann verbreitert hättest. Von der Granularität die sicher eine gute Variante. Man müßte auch nicht soo viel dafür tun.

Oder man reduziert die Tiefe der SIMDs von je 4xQuad-Vec5 ALUs auf je 3xQuad-Vec5 ALUs, macht daraus dann aber 8x SIMDs und 8x Sampler. So käme man auf 32 TFUs und 96xVec5 ALUs bei deutlich besserer Granularität (aber auch höherem Transistorcount). Da dürfte man dann allerdings gleich bei locker 1,2 Mrd Transistoren liegen. Fällt also wohl flach.

Oder man bleibt bei 4x SIMDs und erhöt die Tiefe auf 6xQuad-Vec5ALUs und erhöt einfach nur die Anzahl an TFUs. Dazu müßte man die Threadgröße dann noch erhöhen.

Ich bin gespannt, was am Ende dabei herauskommt. Ich tippe fast auf Variante 1. IMO sollten sie die RBE-Anzahl aber auch erhöhen oder zumindest die einzelnen RBEs aufbohren.

w0mbat
2008-02-16, 13:07:38
Wie schnell ist der RV740 wenn die aktuellen Angaben stimmen? Könnte er an eine HD3850 rankommen? Und für was soll dann der RV730 sein?

RV710 = Low-end, wenn man keine On-Board GPU hat oder den UVD braucht
RV730 = ?
RV740 = Einsteiger Spiele-GPU
RV770 = Performance Spiele-GPU
R700XT = High-end Spiele-GPU

AnarchX
2008-02-16, 13:15:03
Wie schnell ist der RV740 wenn die aktuellen Angaben stimmen? Könnte er an eine HD3850 rankommen?
Ersetzen bei höhere Leistung würde es wohl eher treffen.;)
- ALU-Leistung durch die hohen Taktraten fast gleich.
- Mehr ROP-Power durch HW-Resolve und höhere Z-Fill
- deutlich mehr Tex-Power durch 24 TMUs


Und für was soll dann der RV730 sein?

Um eben dort zu stehen, wo momentan der RV635 angeboten wird. RV740 wird wohl eben im Juni etwa soviel kosten, wie die aktuellen RV670-Karten.


So stellt sich wohl DK777 RV770 vor?
http://img265.imageshack.us/img265/2510/rv770ae9.jpg (http://imageshack.us)
Scheint durchaus nachvollziehbar zu sein und wohl auch die realistischste Version.

deekey777
2008-02-16, 13:25:31
Wenn ich dich jetzt richtig verstanden habe, willst du die 4x SIMD ALU Arrays auf 6x verbreitern. In dem Falle bräuchtest du aber auch noch 2x Sampler Einheiten mehr, sonst wären die 2x SIMDs ohne Input.

Eigentlich nicht.
Ich meine dies so:
S1 -> A1 B1 C1 D1 E1 F1
S2 -> A2 B2 C2 D2 E2 F2
S3 -> A3 B3 C3 D3 E3 F3
S4 -> A4 B4 C4 D4 E4 F4

S = Samper-Array, was aus 4 Sampler-Units besteht (S1, S2, S3, S4), ABCDEF = die einzelnen Shader-SIMDs.

Dann könnte man aber schlecht 32 TFUs verbauen (32 ist nicht durch 6 teilbar) sondern lediglich 24 TFUs bzw 48 TFUs. Das Teil bräuchte dann gut 50% mehr Transistoren, da du das Design dann verbreitert hättest. Von der Granularität die sicher eine gute Variante. Man müßte auch nicht soo viel dafür tun.
Auf meine Weise klappt es.:biggrin:
...
Wieso 4 RBEs?

Die 2900 GT hat doch auch nur 3 aktive RBEs:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=6112567&postcount=2

Und mehr RBEs als wie die Textur-SIMDs lang sind gehen wohl nicht.
Ich saß am Posting bestimmt eine Stunde, das war ein Versehen. ;(
...


So stellt sich wohl DK777 RV770 vor?
http://img265.imageshack.us/img265/2510/rv770ae9.jpg (http://imageshack.us)
Scheint durchaus nachvollziehbar zu sein und wohl auch die realistischste Version.
Das ist die Traum-Version. Bei mir sind nur vier Sampler-Units, die aber um je 4 TFs erweitert wurden. :)

AnarchX
2008-02-16, 13:34:10
Das ist die Traum-Version. Bei mir sind nur vier Sampler-Units, die aber um je 4 TFs erweitert wurden. :)

Ob das geht?
http://img261.imageshack.us/img261/5373/tfsur4.png (http://imageshack.us)

Wohlmöglich müssten dann auch noch weitere 4 TAs hinzukommen, dieses klein dargestellten TAs sehen doch etwas merkwürdig aus und können wohlmöglich nur für die Vertexsampler genutzt werden.

robbitop
2008-02-16, 13:36:17
@DK777
Ok dann meinst du meine Variante 3. ;)
Wir beide meinen schon das gleiche. Auf logischer Ebene eben breite und tiefe. Wie man das nun im Blockschaltbild zeichnet, spielt ja weniger eine Rolle.
Ob es sinnvoll ist, mehrere Sampler hintereinander zu schalten, weiß ich nicht. Es würde vermutlich genügen, die TFU Anzahl in den 4 Samplern zu erhöhen.
Die Granularität ist dann aber nicht mehr so toll.
Ich würde lieber in die Breite und nicht so sehr in die Tiefe gehen wollen. Im Prinzip 3x oder 4x parallele RV630 Kerne. Das würde aber wohl zu teuer werden.

http://img177.imageshack.us/img177/8149/rv770robbilt4.jpg

deekey777
2008-02-16, 13:47:16
Ich kann mit Paint gar nicht umgehen:
http://img407.imageshack.us/img407/183/666xx1.png
Das Original ist hier zu bewundern: http://www.beyond3d.com/content/reviews/16/5

An AnarchX:
http://www.digit-life.com/articles2/video/r600-part1.html
There are four texture units all in all. Each of these units consists of: 8 texture address processors (32 such units in total in the GPU), 20 texture samplers (80 such units in total), 4 texture filter units (16 in total). Vertices and textures are usually sampled separately. Some texture address processors and samplers in a TMU are intended for vertices (they are not connected with filtering units in the block diagram) or for non-filtered textures

robbitop
2008-02-16, 13:51:38
Bei B3D sieht das R600 Design aber durch den Dispatchprocessor entkoppelt aus. Deswegen finde ich das relativ verwirrend.

deekey777
2008-02-16, 14:06:17
@DK777
Ok dann meinst du meine Variante 3. ;)
Wir beide meinen schon das gleiche. Auf logischer Ebene eben breite und tiefe. Wie man das nun im Blockschaltbild zeichnet, spielt ja weniger eine Rolle.
Ob es sinnvoll ist, mehrere Sampler hintereinander zu schalten, weiß ich nicht. Es würde vermutlich genügen, die TFU Anzahl in den 4 Samplern zu erhöhen.
Die Granularität ist dann aber nicht mehr so toll.
Ich würde lieber in die Breite und nicht so sehr in die Tiefe gehen wollen. Im Prinzip 3x oder 4x parallele RV630 Kerne. Das würde aber wohl zu teuer werden.

http://img177.imageshack.us/img177/8149/rv770robbilt4.jpg
Hier gehst du von 4 weiteren vollständigen Sampler-Einheiten.
Ich meine aber so etwas:
http://img406.imageshack.us/img406/3525/ffskz6.png
Die Anzahl von Filter-Einheiten wird mit schwarzen Linien als verdoppelt dargestellt.
Hier nochmal anschaulicher:
http://img406.imageshack.us/img406/7503/rv770ae9pd2.jpg

AnarchX
2008-02-16, 14:26:18
Du hast 2 Striche zu viel, bei dir sind es nämlich 16 TFs pro TU.;)

w0mbat
2008-02-16, 14:27:40
Anscheinend soll PowerPlay+ nur mit IGPs arbeiten, für die 10-20 @idle braucht man also wohl einen AMD 7ner Chipsatz mit IGP.

clockwork
2008-02-16, 14:37:44
Tut mir leid, falls es hier schon irgendwo steht, bin eben nur draufgestoßen.
Wenn ich hier alte oder unrealistische Sachen einwerfe, einfach ignorieren.

http://www.hartware.de/news_44085.html
http://img123.imageshack.us/img123/8747/56014149fu2.jpg (http://imageshack.us)
http://img123.imageshack.us/img123/7872/55623217xs0.jpg (http://imageshack.us)

//
Habs eben als hotlink gesehen, sorry

laser114
2008-02-16, 14:40:11
Ja, stand hier schon. Sind mir aber zu genaue Werte für den aktuellen Diskussionsstand. ;)

deekey777
2008-02-16, 14:40:25
Du hast 2 Striche zu viel, bei dir sind es nämlich 16 TFs pro TU.;)
Ich hab mich schon gewundert, warum ich vier Striche gemacht habe. :biggrin:
Aber ich hoffe, meine Idee ist jetzt angekommen.

robbitop
2008-02-16, 15:09:43
@DK777
Ich meinte schon, wie du es meintest.

Allerdings hätte ich es lieber so, wie ich es gezeichnet habe. (Variante 2)

Coda
2008-02-16, 15:20:50
Ich möchte dagegenhalten, dass bei G92 die Umstellung von 32 Tri auf 64 Bi kaum einen Unterschied gemacht hat beim Transistorcount. Zudem schätze ich die Sampler auch viel transistorlastiger ein als die Adresseinheiten. Vor allem für D3D10, weil diese dafür voll in FP32 ausgeführt werden müssen.

Aber ich hoffe ATi kommen mal endlich von ihrem Wunschtraum runter, dass Tex so extrem zurückgehen wird wie es R6xx postuliert hat.

Wenn R7xx wirklich 32 TMU/480 ALUs wird dann traue ich durchaus wieder zu auf Augenhöhe mit nVIDIA zu sein, wenn diese nicht noch einen Ass im Ärmel haben. Ass vor allem im Sinne von: Wer braucht weniger Transistoren.

Da sie aber angeblich wieder keinen High-End-Chip bauen werden sollten sie sich tunlichst etwas besseres einfallen lassen als das derzeitige Crossfire. Und damit meine ich die Technik an sich, nicht die Treiber.

clockwork
2008-02-16, 16:36:21
Kann mal bitte jemand in die Glaskugel schauen oder mir sein Wissen mitteilen, ob die nächste Generation an Grafikkarten auf PCIe 1.1 laufen werden? Ich stehe vor dem Kauf eines neuen Board und möchte das länger behalten.
Jaja, bin schon weg. :biggrin:

aehmkei
2008-02-16, 16:57:49
Die Nvidida 8800GT z.B. ist doch auch schon PCIe 2.0 und abwärtskompatibel - keine Angst ;)

Hvoralek
2008-02-16, 18:18:43
Hier gehst du von 4 weiteren vollständigen Sampler-Einheiten.
Ich meine aber so etwas:
http://img406.imageshack.us/img406/3525/ffskz6.pngDa fehlen dann aber noch zusätzliche Sampler für die zu filternden Werte und man hätte weiterhin die 4 ungefilterten Werte/ Takt.

Verstehe ich Dich richtig, dass Du so etwas meinst:
http://img406.imageshack.us/img406/7947/rv770texln6.th.jpg (http://img406.imageshack.us/my.php?image=rv770texln6.jpg)

Oder kommen da jetzt noch 8 Adressierer und 8 Sampler zu?

HOT
2008-02-16, 18:24:30
Kann mal bitte jemand in die Glaskugel schauen oder mir sein Wissen mitteilen, ob die nächste Generation an Grafikkarten auf PCIe 1.1 laufen werden? Ich stehe vor dem Kauf eines neuen Board und möchte das länger behalten.
Jaja, bin schon weg. :biggrin:

Alles, was eine höhere PCIe Version ist, ist bis zum 1.0 Standard abwärtskomaptibel. Das muss es sein, sonst ist es nicht PCIe Konform. Diese Diskussion, die einfach nicht totzukriegen ist, ist einfach purer Unsinn und entbehrt jeder Grundlage.

Botcruscher
2008-02-17, 00:19:56
Alles, was eine höhere PCIe Version ist, ist bis zum 1.0 Standard abwärtskomaptibel. Das muss es sein...

Theorie -Praxis. (http://www.forum-3dcenter.org/vbulletin/showthread.php?t=404234)

Mit Intelboards hab ich da auch noch was im Hinterkopf.

HOT
2008-02-17, 11:04:04
Theorie -Praxis. (http://www.forum-3dcenter.org/vbulletin/showthread.php?t=404234)

Mit Intelboards hab ich da auch noch was im Hinterkopf.
Das ist aber nicht zwingend auf 2.0 zurückzugühren. G80 gingen auf VIA Chips auch nicht gut. Da herrscht wohl eine generelle Inkomptibilität vor.

Gast
2008-02-18, 15:41:18
http://www.hartware.de/news_44085.html
was haltet ihr denn davon?

Gast
2008-02-18, 15:43:23
sorry übersehen, sind ja schon alte kamelle
mich wunderts nur das keiner drüber diskutiert

GeneralHanno
2008-02-18, 15:50:28
lies dir mal die letzten 5 seiten durch. das thema haben wir da schon ausdiskutiert ;)

Gast
2008-02-18, 15:51:25
bin hier irgendwie ausschweifendere diskussionen gewöhnt :D

OBrian
2008-02-19, 05:31:25
Könnte denn mal einer der Experten hier einen "educated guess" dazu abgeben, wie sich das veränderte Balancing der Einheiten im RV770 ggü. dem RV670 nun im einzelnen auswirkt? D.h. bei kleinen/großen Auflösungen, bei AA, AF, evtl. anhand exemplarischer aktueller/alter Spiele mit vielen/wenig Shadern?

Und vielleicht auch eine Vermutung anstellen, wo (nach Beseitigung des alten) nun der neue Flaschenhals liegen könnte. Alles natürlich vorbehaltlich unter der Annahme, daß die Tabelle bei hartware.net 100%ig richtig sei.

Ein stumpfes "50% schneller" kann ja nicht stimmen, wenn nicht auch alle Teile des Chips gleichmäßig um 50% vermehrt wurden.

sklave_gottes
2008-02-19, 09:15:32
Hi,

Das kann man zur Zeit nicht so gut abschätzen, da man ja nicht weis ob die veränderungen eher in die Tiefe(schlechtere Granulität) oder eher in die Breite(mehr Kosten) gehen.
Desweiteren weis man ja auch nicht ob noch andere Feinheiten geändert wurden und wie stark oder ob sich überhaupt das "schnellere AA" auswirkt.


Ich würde bei den specs aber eher von 50%++ ausgehen, gerade mit AF, da die schwache TMU leistung des rv670 um über 150% gesteigert wurde. Also auf das 2,5 fache anstieg.
Aber auch die Alu leistung ist mit über 1TF, doppelt so hoch.
Was ich mir aber immer noch nicht vorstellen kann, ist das der Chiptakt bei dem Kompletten Chip bei 1050mhz liegen soll. Wenn dann gehe ich eher von Taktdomains aus, so das der rest des GPU´s bei 800mhz liegt(was ich nicht hoffe). Oder die Angaben sind einfach falsch b.z.w. sehr optimistisch. Aber vieleicht hat AMD auch mal bissel glück und der Chip rennt doch mit >1000mhz. Zu wünschen wäre es.

mfg martin

PS Irgendwie finde ich auch das die Alus bei der r6xx serie garnicht so Teuer sind. Wenn man sich mal rv635 und rv670 ansieht. Auch ist der erste bei weitem nicht mal halb so schnell. Was für eine gute Effizienz bei der Skallierung/für die Verbreiterung spricht. Ich denke durchaus das 128 5d alus bei um die 1Mill Transistoren drin wäre. Und diese könnte man doch auch wieder bissel mehr für andere aufgaben gebrauchen, um immer mehr weg von den z.b. ROPs/TMUs zu kommen.

robbitop
2008-02-19, 09:24:24
Grob geschätzt wird das Ding in etwa 8800 GTX bis Ultra Level erreichen. An der AA Performance wird man sicher etwas tun, zumal die Erhöhung der ALU-Leistung bei diesem Desing hier zuträglich ist (Custom Filter und das Downsampling). Die erhöte Füllrate wird gerade in den Situationen was bringen, in denen die RV670 saugt: Texturfilterung.
Ich persönlich erwarte vom RV770, dass er wie der RV570 und der RV670 ein verdammt guter Mainstream-Chip wird. Gutes P/L. Vom ganzen Multichipgedöhns mittels AFR halte ich hingegen sehr wenig.

GeneralHanno
2008-02-19, 09:24:35
man weis ja auch noch nicht ob die ROPs aufgebohrt werden und 4 z-tester erhalten ;)

ansonsten kann ich sklave_gottes da nur zustimmen.

also ULTRA performence würde ich vom stärksten singel-SKU schon erwarten ...

robbitop
2008-02-19, 09:32:29
man weis ja auch noch nicht ob die ROPs aufgebohrt werden und 4 z-tester erhalten ;)


So extrem wichtig für die Performance in heutigen Spielen sind die Z-Tester nicht, wie viele annehmen. Tendenz fallend. Die Berechnungsdauer pro Pixel steigt immer und immer mehr, so dass es zich Takte dauert, eh mal etwas in den Framebuffer geschoben wird oder mal gelesen wird. Natürlich kostet MRT als auch Shadowmapping in Extremfällen.
Allerdings zeigen die immer neueren Spiele ja schon auf den R6xx wie immer unwichtiger Dinge wie die Z-Fillrate werden. G80 hat ein Vielfaches an Textur- und Z-Füllrate und kommt trotzdem in Crysis bsw jetzt nicht so weit davon. Jedenfalls kein Vielfaches. Früher wäre der Unterschied in Spielen stärker gewesen.

AnarchX
2008-02-19, 09:32:59
AFAIK werden doch die ROPs wohl komplett überarbeitet: >2 Z und wieder HW-Resolve.

Wohlmöglich kommt auch hier der niedrige Verbrauch bei hohen Taktraten, bei R6xx sollen ja die fehlerhaften ROPs für die schlechte Pro-Watt-Leistung gesorgt haben.


Aber eine 88GTX/Ultra sollte sich eine HD4870 schon holen, auch in Extremfällen wie Gothic3 und je nach Game sollte es ihr auch möglich sein diese deutlich zu überbieten, wo es auf Shaderpower ankommt.

reunion
2008-02-19, 09:32:59
Grob geschätzt wird das Ding in etwa 8800 GTX bis Ultra Level erreichen.

Zu wenig IMHO. Schon ein RV670 hat zumindest 8800GTS-Leistung (G80). Ein RV770 wird mit den Specs in den meisten Fällen ~ doppelt so schnell sein wie ein RV670.

Gast
2008-02-19, 09:51:19
Grob geschätzt wird das Ding in etwa 8800 GTX bis Ultra Level erreichen.

Der RV770 wird eher ca. 30 Prozent schneller als eine 8800 Ultra sein. Die X2 wird dann ca. 2,5 mal so schnell wie eine 8800 Ultra werden und somit wahrscheinlich gleichauf mit dem GT200.

robbitop
2008-02-19, 11:02:20
AFAIK werden doch die ROPs wohl komplett überarbeitet: >2 Z und wieder HW-Resolve.
Und woher weißst du das? Ich wäre mir so sicher nicht, dass man das Downsampling wieder per fixed function macht.

Wohlmöglich kommt auch hier der niedrige Verbrauch bei hohen Taktraten, bei R6xx sollen ja die fehlerhaften ROPs für die schlechte Pro-Watt-Leistung gesorgt haben.
Wenn sowas nicht direkt von einem Entwickler wie Eric Demers stammt, der die Simulatorergebnisse genau kennt, dann ist es vermutlich fraglich, ob diese These so stimmt.


Aber eine 88GTX/Ultra sollte sich eine HD4870 schon holen, auch in Extremfällen wie Gothic3 und je nach Game sollte es ihr auch möglich sein diese deutlich zu überbieten, wo es auf Shaderpower ankommt.
Je nach dem. Die Bandbreite kann bei einem 256-bit-SI ja kurzfristig nicht so extrem angehoben werden. Es ist noch unklar, ob wirklich 32x TFUs im RV770 vorhanden sind. Grob schätze ich und höre ich ca delta 50% Performance. Je nach Fall ist das grob Ultra Leistung. Ich hoffe natürlich darüber.
Man sollte aber bedenken, dass V noch immer für Value steht und es sich vermutlich um eine 200-EUR-Karte handeln wird. Wenn man sich die Preise der Ultra anschaut, wäre diese Leistung für 200 EUR mehr als top oder nicht?
Hätte ich keine brauchbare Graka, würde ich da sofort zuschlagen.

Der RV770 wird eher ca. 30 Prozent schneller als eine 8800 Ultra sein. Die X2 wird dann ca. 2,5 mal so schnell wie eine 8800 Ultra werden und somit wahrscheinlich gleichauf mit dem GT200.
Zu hoffen wäre es wahrlich. Ein Monopol saugt. Allerdings bin ich mit den Performanceschätzungen nicht ganz so optimistisch.
Zudem skaliert AFR auch nicht immer 100% und es bleiben die dämlichen Mikroruckler. Zu dem Thema werde ich jedoch bald einen Artikel verfassen, um die Problematik der Öffentlichkeit darzulegen.
Zu lösen wäre dieses Problem treiberseitig von einem richtigen Experten wohl recht leicht, aber es würde vermutlich etwas an Balkenlänge kosten. (aber subjektiv mehr Flüssigkeit bringen)

Ailuros
2008-02-19, 14:37:54
Zu lösen wäre dieses Problem treiberseitig von einem richtigen Experten wohl recht leicht, aber es würde vermutlich etwas an Balkenlänge kosten. (aber subjektiv mehr Flüssigkeit bringen)

Wenn es so leicht waere, haette es zumindest einer der beiden IHVs geschafft das Problem besser zu bekaempfen. Ich koennte mir vorstellen dass ein heutiger TBDR es vielleicht leichter haben koennte mit load balancing zwischen zwei chips bzw. GPUs, aber auch nicht unbedingt mit AFR.

Sonst kann ich mir nur schwer vorstellen dass IHVs nicht fortschrittlichere Algorithmen brauchen als die die momentan existieren; wenn ja heisst dass dann wohl auch wieder zusaetzliche Logik.

robbitop
2008-02-19, 14:45:35
Wenn es so leicht waere, haette es zumindest einer der beiden IHVs geschafft das Problem besser zu bekaempfen.
Es ist so leicht und keiner der beiden IHVs hat es bisher versucht. ;)
Kostet ja Balkenlänge.
Ludi hat für die Einfachheit dessen sogar den Beweis erbracht. ;)

Ich koennte mir vorstellen dass ein heutiger TBDR es vielleicht leichter haben koennte mit load balancing zwischen zwei chips bzw. GPUs, aber auch nicht unbedingt mit AFR.

Sonst kann ich mir nur schwer vorstellen dass IHVs nicht fortschrittlichere Algorithmen brauchen als die die momentan existieren; wenn ja heisst dass dann wohl auch wieder zusaetzliche Logik.
Algorithmen sind weniger das Problem als die dafür notwenige Verbindung. Die muss kurze Laufzeiten und extrem hohe Bandbreiten zwischen den GPUs aufweisen. (im Bereich n*10^2 GiB/s)

Mit Loadbalancing würde ich da gar nicht mehr rangehen, sondern beide GPUs über den Dispatcher Quadbatches zuschießen. So wirkt es nach außen wie eine einzige GPU und skaliert auch hervoragend, ganz gleich ob TBDR oder IMR. Aber für so eine Art von MultiGPU braucht man eine von mir erwähnte Verbindung. (und dafür sollten die GPUs auf einem Package sein)
Das wäre richtiges MultiGPU. AFR hingegen ist nur eine kompromissbehaftete Krücke.

AnarchX
2008-02-19, 14:47:42
Je nach dem. Die Bandbreite kann bei einem 256-bit-SI ja kurzfristig nicht so extrem angehoben werden.

GDDR5... ;)

Es ist so leicht und keiner der beiden IHVs hat es bisher versucht. ;)
Kostet ja Balkenlänge.
Ludi hat für die Einfachheit dessen sogar den Beweis erbracht. ;)

Offenbar keine richtige Lösung:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=6292139&postcount=65

wuzetti
2008-02-19, 14:50:12
Zu wenig IMHO. Schon ein RV670 hat zumindest 8800GTS-Leistung (G80). Ein RV770 wird mit den Specs in den meisten Fällen ~ doppelt so schnell sein wie ein RV670.

mit nur 50% mehr einheiten (wenn die derzeitigen gerüchte stimmen) doppelt so schnell? wie kommst du zu dieser zahl?

Gast
2008-02-19, 15:07:34
mit nur 50% mehr einheiten (wenn die derzeitigen gerüchte stimmen) doppelt so schnell? wie kommst du zu dieser zahl?
16 vs 32 TFUs sind bei mir aber 100% mehr ;)
An Arithmetiklesitung mangelte es dem RV670 eh nicht unbedingt, soll aber nach den Angabe auf 1TF erhöht werden, also wieder doppelt so viel. Tja und dann gibt es noch Gerüchte, dass ie ROPs aufgebohrt werden sollen. Sollte das alles zutreffen, dann wird der Speicher eine nicht ganz unwichtige Rolle spielen, aber 50% bis 100% Mehrleistung je nach Spiel und Situation sind wohl drinnen.