PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : AMD/ATI - Kommende RV700-GraKas: RV770LE/SE, RV7xx@40nm, RV7xx@IGP


Seiten : [1] 2 3 4 5 6

AnarchX
2008-10-22, 18:25:10
<letztes Posting AMD - R700 im Q2 2008:RV770(LE), RV730 und RV710 - Teil 5 < (http://www.forum-3dcenter.org/vbulletin/showthread.php?p=6863733#post6863733)

AMD/ATI HD 4670/4650: (P)Review-Thread :
http://www.forum-3dcenter.org/vbulletin/showthread.php?t=430275

AMD/ATI Radeon HD 4870 X2: (P)Review-Thread :
http://www.forum-3dcenter.org/vbulletin/showthread.php?t=424872

AMD/ATI - Radeon HD 4870: (P)Review-Thread :
http://www.forum-3dcenter.org/vbulletin/showthread.php?t=422531

AMD/ATI - Radeon HD 4850: (P)Review-Thread :
http://www.forum-3dcenter.org/vbulletin/showthread.php?t=421894

AMD/ATI - Radeon HD 4830: (P)Review-Thread :
http://www.forum-3dcenter.org/vbulletin/showthread.php?goto=newpost&t=435586


Catalyst 8.9 nennt einige weitere HD4000:

* Radeon HD 4730
* Radeon HD 4570
* Radeon HD 4250
* Radeon HD 4230http://www.computerbase.de/news/hardware/grafikkarten/ati/2008/september/catalyst_89_grafikkarten/

Die 4200er könnten wohl die IGPs des RS880 sein.

AZX_DRIVER_ATIHDMI }, /* ATI RV770 HDMI */
+ { 0x1002, 0xaa38, PCI_ANY_ID, PCI_ANY_ID, 0, 0,
AZX_DRIVER_ATIHDMI }, /* ATI RV730 HDMI */
+ { 0x1002, 0xaa40, PCI_ANY_ID, PCI_ANY_ID, 0, 0,
AZX_DRIVER_ATIHDMI }, /* ATI RV710 HDMI */
+ { 0x1002, 0xaa48, PCI_ANY_ID, PCI_ANY_ID, 0, 0,
AZX_DRIVER_ATIHDMI }, /* ATI RV740 HDMI */ http://article.gmane.org/gmane.linux.alsa.devel/51536

RV770@128-Bit - HD4690 (http://bbs.chiphell.com/viewthread.php?tid=25353&extra=page%3D1)
http://img149.imageshack.us/img149/4877/2008062435869414441b7e7es6.jpg
http://img149.imageshack.us/img149/9371/2008062468ada076d131d6arb1.jpg


HD4750/4830 - RV770LE:

(P)Review zur 4830:
http://translate.google.ch/translate?u=http%3A%2F%2Fpublish.it168.com%2F2008%2F1021%2F20081021041601.shtml&sl=zh-CN&tl=en&hl=de&ie=UTF-8

http://img211.imageshack.us/img211/4445/2008090439a88c3366de281jw6.jpg (http://imageshack.us)

http://bbs.chiphell.com/viewthread.php?tid=31627&extra=page%3D1

RV770LE soll wohl auch als Radeon Mobility zum Einsatz kommen:
http://www.ati-forum.de/allgemein/news/p5510-rv770le-auch-als-mobile-gpu-technische-daten-rv770le-as-mobile-gpu-tech-specifications/#post5510

http://img524.imageshack.us/img524/5013/radeon4830jc7.gif
http://www.vr-zone.com/articles/Radeon_HD_4830_(RV770LE)_Launch_In_October/6065.html (http://www.vr-zone.com/articles/Radeon_HD_4830_%28RV770LE%29_Launch_In_October/6065.html)

http://img502.imageshack.us/img502/7436/hd483010373990jw7.gif (http://imageshack.us)

The launch for Radeon HD 4830 is set at October 21st and it is targeted primarily at Nvidia GeForce 9800 GT with a less than US$150 price tag.http://www.vr-zone.com/articles/Radeon_HD_4830_Has_640SP%2C_Launch_On_Oct_21st/6070.html

http://img407.imageshack.us/img407/8488/newshd4830pc18364056ll1.png (http://imageshack.us)
http://www.tweaktown.com/news/10226/amds_hd_4830_looks_to_be_a_9800gt_killer/index.html

RV770SE aka HD4810:
HD4810(384)
RV770SE
480SP
750/2000
192bit
384MB
6Pin×1
$109

HD4810(768)
RV770SE
480SP
750/1900
192bit
768MB
6Pin×1
$129


Q6600、P43、DDR2 4G、Vista Home Basic SP1 32-bit,3DMark Vantage v1.0.1:
HD4810 384MB -- X1718
HD4810 768MB -- X2046http://bbs.chiphell.com/viewthread.php?tid=34297&extra=page%3D1

RV790 vs GT200B

http://img511.imageshack.us/img511/9720/3a4627280so4.jpg (http://imageshack.us)
http://www.techpowerup.com/75685/AMD_to_Give_RV770_a_Refresh_G200b_Counterattack_Planned.html


RV7xx @ 40nm:

We heard from chiphell forum that TSMC now tries 40nm process to produce ATI RV740 graphics chip in the labs. It’s said that RV740 would be the vanguard of 40 nm graphics chips.http://www.pczilla.net/en/post/16.html
RV740@40 nm im ersten Quartal 2009?
AMD to launch 40/45nm GPUs in early 2009, RV870 is one of them (http://www.nordichardware.com/news,7946.html)

http://img25.imageshack.us/img25/9070/1401928.jpg (http://img25.imageshack.us/my.php?image=1401928.jpg)
http://img27.imageshack.us/img27/7467/1401930.jpg (http://img27.imageshack.us/my.php?image=1401930.jpg)
http://img7.imageshack.us/img7/2264/1401932.jpg (http://img7.imageshack.us/my.php?image=1401932.jpg)
http://publish.it168.com/2009/0331/20090331020601.shtml

reunion
2008-10-22, 21:57:31
HIS Radeon HD 4830:

http://img508.imageshack.us/img508/7895/78fd2hd4830512mbpcie500ni2.jpg (http://imageshack.us)

http://img50.imageshack.us/img50/7897/78d0ehisradeonhd4830boxge3.jpg (http://imageshack.us)

http://www.hardware-aktuell.com/news/883/exklusiv_radeon_hd_4830_von_his/

Auch der morgige Marktstart und der Preis von 150$ wird explizit bestätigt.

Sorkalm
2008-10-22, 22:19:36
Joa, fehlen nur noch mehr (und ausführlichere) Tests. ;)

AnarchX
2008-10-23, 09:13:58
AMD/ATI - Radeon HD 4830: (P)Review-Thread (http://www.forum-3dcenter.org/vbulletin/showthread.php?goto=newpost&t=435586)

Spasstiger
2008-10-23, 09:48:27
RV770@128-Bit - HD4690 (http://bbs.chiphell.com/viewthread.php?tid=25353&extra=page%3D1)
http://img149.imageshack.us/img149/4877/2008062435869414441b7e7es6.jpg
http://img149.imageshack.us/img149/9371/2008062468ada076d131d6arb1.jpg
Nach meinen Berechnungen wäre diese Karte kaum sinnvoll, da sie nur etwa 5% schneller sein dürfte als die HD4670. Die hohe Shaderleistung kann sie zumindest in aktuellen Spielen nicht sinnvoll umsetzen.
Die HD4830 sollte meinen Berechnungen zufolge um ca. 30% schneller sein als die spekulierte HD4690 trotz geringerer Shaderleistung und Füllrate.

Meine theoretischen Berechnungen sehen übrigens die HD4830 um 37% vor der HD4670. Und im Computerbase-Rating liegt die HD4830 in 1280x1024 4xAA um 33% und in 1600x1200 4xAA um 43% vorne. Meine Berechnungsgrundlage passt also halbwegs. ;)
Auch das Verhältnis zur HD4850 kommt gut hin, nach meinen Berechnungen sollte die HD4830 bei 83% der HD4850 liegen. Bei Computerbase sinds 80% bzw. 82%.
Ich verwende für diese Berechnungen wohlgemerkt keinerlei Benchmarks.

AnarchX
2008-10-23, 10:13:33
Diese 4690 scheint wohl eh nur eine Machbarkeitsstudie eines AIBs zu sein und wird wohl so nie den Markt erreichen bzw. tat es in nur kleiner Stückzahl in Asien.

Spasstiger
2008-10-23, 10:26:57
Diese 4690 scheint wohl eh nur eine Machbarkeitsstudie eines AIBs zu sein und wird wohl so nie den Markt erreichen bzw. tat es in nur kleiner Stückzahl in Asien.
Ja, man könnte zwar mit Teraflops-Computing werben, aber Spielebenchmarks würden schnell zeigen, dass die Karte rausgeworfenes Geld ist.

reunion
2008-10-27, 21:34:06
Sapphire 4850 X2 aufgetaucht:

http://img504.imageshack.us/img504/8596/sapphireradeonhd4850x20re3.jpg (http://imageshack.us)

http://img206.imageshack.us/img206/2858/sapphireradeonhd4850x20ep5.jpg (http://imageshack.us)

http://img355.imageshack.us/img355/7268/sapphireradeonhd4850x20mp0.jpg (http://imageshack.us)

http://www.pchacc.cn/

Gast
2008-10-28, 00:20:58
Sapphire 4850 X2 aufgetaucht:

Doch so früh, der Paperlaunch war doch gerade erst vor 2 Monaten. ;D

Ferengie
2008-10-29, 22:31:01
Kann man irgendwo Wetten abschließen, ob Gecube, Powercolor und Co. HD4xxx (Low-Mid) zusammen schustern wird?

AnarchX
2008-11-07, 20:04:27
RV790 vs GT200B

http://img511.imageshack.us/img511/9720/3a4627280so4.jpg (http://imageshack.us)
http://www.techpowerup.com/75685/AMD_to_Give_RV770_a_Refresh_G200b_Counterattack_Planned.html

Sorkalm
2008-11-07, 21:22:43
Hmm, noch eine GPU in 55-nm-Technologie von AMD. Hätte ich jetzt nicht so erwartet, auch wenn RV790 wohl RV770 relativ ähnlich sein wird...
(nur neue Revision?)

AnarchX
2008-11-07, 21:28:18
Vielleicht noch ein Indikator, dass man mit 40nm nicht vor Q2 rechnen kann.

RV770 + 2 SIMDs a 20mm² und halt noch ein paar Massetransitoren für Taktbarkeit = ~300mm² Die mit 960SPs @ 800-850MHz, kombiniert mit >2GHz GDDR5 und man dürfte die GTX 280 inkl. 55nm Refresh von dem man imo nicht soviel erwarten kann, schlagen.

Zwei davon kommen dann halt auf eine X2 mit Triple-Slot-Kühler, wie ihn Gainward/Palit für die aktuelle X2 verwendet und eben 2x 8-Pin.:D

Sorkalm
2008-11-07, 22:09:28
Der Artikel von Techpowerup liest sich aber nicht so, als dass die Einheiten erhöht wurden...

Gast
2008-11-08, 00:34:49
Nein, die werden anscheinend um keinen Preis erhöht, auch hier (http://www.hardware-infos.com/news.php?news=2501) nachzulesen.

Angesichts der Optimierung spekulier ich eher in Richtung < 250 mm² und 850 MHz Chiptakt. ;)

w0mbat
2008-11-08, 00:39:05
Wie soll man etwas von hardware-infos erfahren wenn die die News nur abgeschrieben haben. AMD könnte sehr wohl die Einheiten erhöhen.

Sorkalm
2008-11-08, 00:52:44
AMD könnte sehr wohl die Einheiten erhöhen.

Können tun die theoretisch viel. Aber nach den News tun sie das nicht, Techpowerup vergleicht den RV790 ja auch mit den Super-RV770. Liest sich für mich wie RV770 Revision A13, A14 oder so...

Gast
2008-11-08, 01:39:47
Ich weiß nicht, ob hardware-infos sich nur auf techpowerup allein bezieht. Immerhin fallen hier auch die Namen hd4950 und hd4970. Außerdem wird da nurmal klipp und klar festgehalten, dass sich die Ausführungseinheiten nicht erhöhen. Das war ja bei techpowerup selber etwas schwammig, deswegen noch mal der Verweis. ;)

Gast
2008-11-08, 10:07:27
Angesichts der Optimierung spekulier ich eher in Richtung < 250 mm² und 850 MHz Chiptakt. ;)

Um noch mehr Probleme mit der Kühlung zu bekommen als man jetzt schon hat?
Eine weitere Verkleinerung des Die ist bei AMD kontraproduktiv.

horn 12
2008-11-08, 10:14:23
und soll der noch zu Weihnachten kommen, der ATI "Refresh"

Gast
2008-11-08, 10:14:49
Du hast selbstverständlich recht. Mein Kommentar ist so vollkommener Blödsinn. Ich meinte > 250 mm², weil ja, wie zumindest hardware-infos schreibt, auch zusätzliche Massetransistoren eingesetzt werden sollen.

Gast
2008-11-08, 11:32:50
RV790 sollte im 40nm gefertigt werden, was wohl nicht der Fall sein wird.
(vll. wird eine andere 40nm-Fertigung getestet, welche den RV790 schon bei Weihnachten bringt?)

Im 55nm-Bereich seh ich keinen Vorteil. Ergo geht es wohl hier um Takterhöhung. Eine neue Rev. des Chips reicht da wohl. Ich rechne um die 850 Mhz, eher sogar 900Mhz.

RV870 soll 50% mehr SCP mit nur 25% mehr Einheiten bringen? Wieder ne Takterhöhung auf 900Mhz. Bei 40nm sollte es möglich sein.


mfg Nakai

Gast
2008-11-08, 12:51:06
Ja, es wird von AMD angestrebt, ihn vor Weihnachten zu bringen, heißt es.

Gast
2008-11-19, 23:15:05
Alles nur heiße Luft:

http://news.ati-forum.de/index.php/de/news/34-amdati-grafikkarten/106-rv790-alles-nur-heisse-luft

Gast
2008-11-20, 17:15:26
http://www.fudzilla.com/index.php?option=com_content&task=view&id=10560&Itemid=34

deekey777
2008-11-20, 17:24:55
http://www.fudzilla.com/index.php?option=com_content&task=view&id=10560&Itemid=34
Was hat das mit dem Thema zu tun?

Sorkalm
2008-12-11, 22:38:39
AMD Plans RV775XT To Compete GeForce GTX 285 (http://vr-zone.com/articles/amd-plans-rv775xt-to-compete-geforce-gtx-285/6275.html?doc=6275)

Gibt aber inzwischen ziemlich viele Codenamen für einen "Super-RV770" (ja, VR-Zone schreibt davon nichts, klingt aber so). Da scheint AMD wohl weiter Löcher zu stopfen bzw. sich fleißig an der Gerüchtküche zu beteiligen.

Ob überhaupt noch ein aufgepimpter RV770 kommt?

Spasstiger
2008-12-11, 22:52:28
Ich frage mich, wie AMD selbst mit einem selektierten RV770 mit einer GeForce GTX 285 mithalten möchte. Die GTX 285 soll ja 10% schneller als die GTX 280 sein und somit rund 30% schneller als die HD 4870.
D.h. man bräuchte zwischen 950 und 1000 MHz Chiptakt und zwischen 1150 und 1200 MHz Speichertakt (Befehlstakt), um der GTX 285 Paroli bieten zu können. Speicher mit diesen Taktraten sollte auf jeden Fall verfügbar sein, aber knapp 1 GHz Chiptakt mit dem RV770 wären doch sehr gewagt. Dazu benötigt man definitiv auch mehr Spannung und dadurch auch exotische Kühllösungen wie eine Wakü. Man hätte eine Karte mit der TDP einer HD 4870 X2, die dennoch in Benchmarks schlechter dastehen würde.

LovesuckZ
2008-12-11, 22:56:44
Abgesehen davon macht es für AMD keinen Sinn. Man hat zwei Dual-Chip Karten auf den Markt die schneller sind. Wozu also eine Single-Chip Karten launchen, die weder an diese heranreicht noch nVidia gefährlich werden kann?

reunion
2008-12-12, 08:14:19
Ich frage mich, wie AMD selbst mit einem selektierten RV770 mit einer GeForce GTX 285 mithalten möchte. Die GTX 285 soll ja 10% schneller als die GTX 280 sein und somit rund 30% schneller als die HD 4870.
D.h. man bräuchte zwischen 950 und 1000 MHz Chiptakt und zwischen 1150 und 1200 MHz Speichertakt (Befehlstakt), um der GTX 285 Paroli bieten zu können. Speicher mit diesen Taktraten sollte auf jeden Fall verfügbar sein, aber knapp 1 GHz Chiptakt mit dem RV770 wären doch sehr gewagt. Dazu benötigt man definitiv auch mehr Spannung und dadurch auch exotische Kühllösungen wie eine Wakü. Man hätte eine Karte mit der TDP einer HD 4870 X2, die dennoch in Benchmarks schlechter dastehen würde.

GTX285 kann man sicher nicht schlagen, aber 10% mehr Leistung würden schon reichen um die GTX260-216 zu schlagen, und so einen signifikat höheren Preis erzielen zu können. Es geht aber ohnehin hauptsächlich um das Prestigeduell 4890(?) X2 gg. GTX295. Und da muss nV zwei ROP-Cluster deaktivieren und wohl auch die Taktraten lockern. Aber viel wird da sicherlich nicht mehr kommen, denn die 40nm-Chips stehen ohnehin schon in den Startlöchern, und dann will niemand mehr die alten Stromschleudern.

robbitop@work
2008-12-12, 13:05:21
40 nm GPUs erwarte ich erst zum Sommer. Gibt es denn Anzeichen, dass diese in Kürze aufschlagen könnten?

reunion
2008-12-12, 13:09:45
40 nm GPUs erwarte ich erst zum Sommer. Gibt es denn Anzeichen, dass diese in Kürze aufschlagen könnten?

http://forum.beyond3d.com/showpost.php?p=1247745&postcount=79

AnarchX
2008-12-12, 13:11:43
http://img370.imageshack.us/img370/2905/rv7753876943eq7.png (http://imageshack.us)
http://en.expreview.com/2008/12/12/amd-rv775-ready-to-give-nvidia-a-punch.html

:|

reunion
2008-12-12, 13:12:56
Weniger Die-Size/Transistoren, mehr Einheiten/Takt. Wenn das stimmt alle Achtung. Aber dann darf man wohl wirklich nicht mit 40nm High-End vor dem Sommer rechnen.

AnarchX
2008-12-12, 13:16:58
Wo die zusätzliche SPs daherkommen sollen klingt aber eher ziemlich unsinnig, was eher dazu tendieren lässt, dass es wohl eine Fehlinfo ist.

Gast
2008-12-12, 13:23:49
Die Daten kann ich mir überhaupt nicht vorstellen...

Macht alles nur wenig Sinn, wer baut den seine GPU komplett um für ein Refresh??? und das erst noch in der kurzen Zeit.

Zudem andere Quellen davon Berichten dass der RV775 nur ein handselektierter RV770 mit etwas mehr Takt sei.

derguru
2008-12-12, 13:24:23
hui wenn das stimmt:eek:,
denn "nur" eine takterhöhung würde nie und nimmer der 285gtx das wasser reichen.


Zudem andere Quellen davon Berichten dass der RV775 nur ein handselektierter RV770 mit etwas mehr Takt sei.

das könnten die sich aber gleich sparen,denn das macht noch weniger sinn. die gerüchte gabs auch schon von den diamond black edition karten das die handselektiert sein sollen und gut zu clocken sind war aber auch eine ente.

reunion
2008-12-12, 13:26:17
Es wäre natürlich ein neues Tapeout fällig, klar. Aber da der Codename RV775 schon ziemlich sicher sein sollte ist es das sowieso. Da kann man auch gleich noch neben den Optimierungen ein paar Einheiten ranflashen und das ALU/TEX-Verhältnis leicht anpassen. Ob man das wirklich gemacht hat bleibt natürlich abzuwarten.

derguru
2008-12-12, 13:27:21
ups,löschen;)

GeneralHanno
2008-12-12, 13:31:26
naja, alle halbe jahr ein neuer chip ... würde ja zu ATis strategie passen ...
aber ob diese daten stimmen ... schwer zu sagen ;)
in jedem fall werden wir ~jan einen RV775 sehen ...

Tarkin
2008-12-12, 13:36:55
bei den Spezifikationen sollte der RV775XT etwa 20% schneller sein als der Vorgänger... sollte reichen um knapp an die GTX 285 heranzukommen.

wobei natürlich abzuwarten bleibt, wer den ersten Schritt macht.

Spannend wirds jedenfalls :)

AnarchX
2008-12-12, 13:43:42
Die Specs sind eigentlich totaler Blödsinn:
- 48 TMUs -> 12 Cluster mit je 4 TMUs
- 840 SPs aufgeteilt auf 12 Cluster -> 70 SPs pro Cluster ~ 14 5D-ALUs, wo es aber ein Vielfaches von 4 sein muss

Das Highlight ist dann natürlich noch die RV775Pro mit 1.4GHz GDDR4. X-D

Sorkalm
2008-12-12, 14:37:05
AMD streut wohl wieder mal gewaltig Fehlinfos.

w0mbat
2008-12-12, 14:38:47
Wie wahr :)

Gast
2008-12-12, 14:40:13
AMD streut wohl wieder mal gewaltig Fehlinfos.
Wäre es dann aber nicht dumm von amd sowas zu streuen?Immerhin überascht ein unternehmen dann ja mit noch besseren specs.

deekey777
2008-12-12, 14:40:55
R650 anyone?

w0mbat
2008-12-12, 14:47:18
480SP RV770 anyone?

Gast
2008-12-12, 14:54:57
naja, denkt ihr denn, dass überhaupt etwas gegen die gx2 von nv kommt?

derguru
2008-12-12, 15:00:34
naja, denkt ihr denn, dass überhaupt etwas gegen die gx2 von nv kommt?
wozu sollte?
die gx2 soll doch aus 2 260gtx bestehen oder?denn da müsste die 4870x2 sich nicht verstecken.

wichtiger wird sein das amd den anschluß an die 285gtx packt.

Gast
2008-12-12, 15:02:25
Hier eine schöne News, warum diese Spezifikationen sehr wahrscheinlich erlogen und erstunken sind:

http://www.hardware-infos.com/news.php?news=2579

w0mbat
2008-12-12, 15:03:28
Ich denke schon bzw. bin mir sicher dass ein RV770 Refresh auf dem Weg ist, egal ob man den jetzt RV790, RV775 oder RV08/15 nennt. Meine Theorie ist die mit den 2 zusätzlichen SIMDs was zu 960SPs und 48TMUs führen würde. Wenn AMD jetzt noch ein wenig Bugs beseitigt hat und den Chip allg. verbessert können dazu auch noch durchaus höhere Taktraten kommen.

RV7xx PRO - 960SP/48TMU - 256bit@GDDR5 - ~700MHz
RV7xx XT - 960SP/48TMU - 256bit@GDDR5 - ~900MHz

Wäre doch möglich. Und dann steht ja auch noch der RV740 an von dem ich schon vor ganz langer Zeit was gehört habe, der sollte jetzt auch schon sein Tape-out hinter sich haben.

=Floi=
2008-12-12, 15:14:51
gddr5 für die kleine karte ist viel zu teuer und man könnte durch übertakten die karte zu einer vollwertigen 4870er machen...
der chip wird sicherlich nicht breiter

Sorkalm
2008-12-12, 15:28:15
gddr5 für die kleine karte ist viel zu teuer und man könnte durch übertakten die karte zu einer vollwertigen 4870er machen...
der chip wird sicherlich nicht breiter

Na, dass ist nun nicht das Problem. Die Preise für GDDR5 fallen ja einerseits mit der Zeit, andererseits gibts auch unterschiedlichen GDDR5-Speicher.

GeneralHanno
2008-12-12, 15:43:22
und der preisunterschied zwischen der 4870 512 und 1024 zeigt ja, dass GDDR5 nicht mehr soooo teuer sein kann ;)
naja, mann kann ja immer noch eine xx30er version mit GDDR3 bringen ...

reunion
2008-12-12, 15:53:05
der chip wird sicherlich nicht breiter

Und warum nicht? Der Chip ist sehr klein, in die Breite zu gehen wäre sicherlich die logische Variante. Die Taktraten hingegen sind schon sehr hoch.

Gast
2008-12-12, 16:19:19
Und warum nicht? Der Chip ist sehr klein, in die Breite zu gehen wäre sicherlich die logische Variante. Die Taktraten hingegen sind schon sehr hoch.
jop. zusätzlich gibt es beim takt noch das problem der verlustleistung, mit steigender spannung + takt steigt die verlustleistung quadratisch an. wenn man in die breite geht kostet der chip an und für sich zwar mehr, dafür wird die TDP sicher nicht gesprengt.

AnarchX
2008-12-12, 17:21:52
RV775 - Spekulationen zweifelhaft?
[...]
Wir haben nun von einer Insiderquelle erfahren, dass tatsächlich ein Refresh des RV770 geplant ist (Frühere Aussagen wiedersprachen dem). Allerdings soll es sich hierbei nur um eine GPU handeln, welche den Namen RV770XTX getragen haben soll. Zudem ist von einer Markteinführung im Februar 2009 die rede.
http://news.ati-forum.de/index.php/news/34-amdati-grafikkarten/163-rv775-spekulationen-zweifelhaft

horn 12
2008-12-12, 17:24:31
Ich denke schon bzw. bin mir sicher dass ein RV770 Refresh auf dem Weg ist, egal ob man den jetzt RV790, RV775 oder RV08/15 nennt. Meine Theorie ist die mit den 2 zusätzlichen SIMDs was zu 960SPs und 48TMUs führen würde. Wenn AMD jetzt noch ein wenig Bugs beseitigt hat und den Chip allg. verbessert können dazu auch noch durchaus höhere Taktraten kommen.

RV7xx PRO - 960SP/48TMU - 256bit@GDDR5 - ~700MHz
RV7xx XT - 960SP/48TMU - 256bit@GDDR5 - ~900MHz

Wäre doch möglich. Und dann steht ja auch noch der RV740 an von dem ich schon vor ganz langer Zeit was gehört habe, der sollte jetzt auch schon sein Tape-out hinter sich haben.


Würde so ein Chip dann etwa die GTX 285 sogar schlagen können, oder mindestens gleichauf sein?

Sorkalm
2008-12-12, 17:26:32
http://news.ati-forum.de/index.php/news/34-amdati-grafikkarten/163-rv775-spekulationen-zweifelhaft

Hmm, das wäre dann wieder wohl nur eine reine Takterhöhung (RV770XTX klingt jedenfalls so). Was soll die denn großartig bringen?

BlackBirdSR
2008-12-12, 17:26:51
Und warum nicht? Der Chip ist sehr klein, in die Breite zu gehen wäre sicherlich die logische Variante. Die Taktraten hingegen sind schon sehr hoch.

Kostet AMD aber ne Menge an Zeit, Geld, Tests, Entwicklung und und und.
So eine mögliche Grafikkarte wird nicht nur viel Geld für den User kosten, sondern auch für AMD. Dazu kommt eine wahrscheinlich relativ geringe Auflage. Da überlegt man sich schon zweimal, ob man den ganzen Aufwand treibt.

Gekauft wird im High-End, wer die Benchmarks anführt. Mit einem teuer erkauften zweiten Platz erzielt man selten Gewinn.

Nakai
2008-12-12, 17:29:54
Rechne es doch selber nach. Mit 20% mehr Einheiten plus etwas mehr Takt, da kann man schon etwas mehr erwarten. Aber eine GTX285 ist wohl außer Reichweite. Dafür wird ein RV775 sehr billig werden, bei der Herstellung.

Die GTX280 ist etwa 20 bis 30% schneller als eine HD4870. Mit 960SPs und evtl 800Mhz hat man etwa 30% Mehrleistung. Reicht vollkommen um ne GTX280 zu plätten. Ne GTX285 schafft man wohl nicht.



mfg Nakai

€:
Gekauft wird im High-End, wer die Benchmarks anführt. Mit einem teuer erkauften zweiten Platz erzielt man selten Gewinn.

NV wird aber bald wieder die Krone haben. Mit einer RV775 könnte man wieder eine Dualkarte bauen und somit noch etwas länger die Spitze inne haben.

horn 12
2008-12-12, 17:52:30
Denke ca. 850 Mhz können es schon werden und dazu das funktionierende PowerPlay+ 2.0 und somit kännte man der GTX 285 schon gefährlich werden, ebenso der Preis um die 220-250 Euro. Das wäre schon mehr als viele erwarten würden!
Wird wohl Mitte Jänner releast werden, um den 15-20.ten nehme ich mal stark an!

Gaestle
2008-12-12, 20:09:35
Wenn die Ausführungen von Anandtech bezüglich der Entwicklung von RV770 stimmen, wird der Chip IMHO nicht auf HighEnd zielen (GTX285), sondern darunter (GTX 260-216).

w0mbat
2008-12-12, 20:15:42
Ich finde den RV770 XTX viel logischer, einfach der alte "Super-RV770" mit neuem Namen. Vielleicht eine neue Rev/neues Stepping mit niedrigerem TDP dass dann höhere Taktraten erlaubt + gefixtes PP2.0 etc.pp.

LovesuckZ
2008-12-12, 20:28:18
jop. zusätzlich gibt es beim takt noch das problem der verlustleistung, mit steigender spannung + takt steigt die verlustleistung quadratisch an. wenn man in die breite geht kostet der chip an und für sich zwar mehr, dafür wird die TDP sicher nicht gesprengt.

Mehr Transistoren bedeutet auch einen höhreren Stromverbrauch. Die Die-Fläche sagt bezüglich des Stromverbrauchs kaum etwas aus.
Man sieht doch sehr schön, dass trotz 1/3 mehr Transistoren der Stromverbrauch zum rv670 um 2/3 gestiegen ist.

VooDoo7mx
2008-12-12, 20:28:25
RV775... ja ne is klar?!

Alleine wenn man sich nur die Daten bezüglich der technischen Eckpunkte anschaut, ist schon ersichtlich dass sich irgendein gesitig minderbemittelter Mensch komplett ohne Technikverständnis wie Fudo diesen Quark bei einer Toilettensitzung ausgedacht hat.

Die Leute die so einen Dreck im Internet verbreiten, sollte man in eine große Jauchegrube schmeißen. Und wie die ganzen Seiten mitmachen udn kommentarlos diesen Müll als Fakten verkaufen.

Wieso sollte ATi nochmal Unsummen und Monate in die Entwicklung eines neuen Chips stecken, wenn sowieso in weniger als 6 Monaten schon ein 40nm Chip ansteht?
Wo ist da eine Logik? Denkt hier überhaupt noch jemand mit?

Und den RV770 kann man nicht nochmal refreshen. 55nm ist das beste was zur Zeit möglich ist und der RV770 wird zur Zeit fast schon am absoluten Maximum betrieben. Da geht einfach nicht mehr viel.

Außerdem spricht ein RV775 mit nochmal mehr Einheiten ganz deutlich gegen die derzeitige Philisophie von ATi kleine, effiziente und kostengünstige Chips zu bauen.

Gegen die GTX 260 ist doch ATi mit der HD4870 gut aufgestellt, da baruch man nicht mehr. Die Kosten für eine Neuenwicklung eines weiteren Chips zwischen den 40nm Chip in 6 Monaten stehen zu absolut keiner Relation zu den Marktzielen die man damit erreichen kann.

Sorkalm
2008-12-12, 23:54:35
XFX goes ATI (http://www.fudzilla.com/index.php?option=com_content&task=view&id=10918&Itemid=1)

We've managed to confirm that XFX will join the ATI camp at the start of the new year. XFX won't drop Nvidia products either, but obviously, Nvidia won't be thrilled by this turn of events.

Da tröpfeln aber langsam Nvidias Partners mit "guten Namen" davon. Bleibt noch EVGA...

Unyu
2008-12-12, 23:58:47
Da tröpfeln aber langsam Nvidias Partners mit "guten Namen" davon. Bleibt noch EVGA...
Das wissen wir schon lange, das XFX weiterzieht. Nur wurde AMD als neuer Partner nicht abgestritten?

Nebenbei: Was ist XFX an ein guter Name? :confused:
Weil der Hersteller in einen Produktnamen 20 X einfügt ist er besonders gut?

Sorkalm
2008-12-13, 00:06:35
Das wissen wir schon lange, das XFX weiterzieht. Nur wurde AMD als neuer Partner nicht abgestritten?

Seit wann ist das denn bekannt?

Gast
2008-12-13, 00:19:54
Das wissen wir schon lange, das XFX weiterzieht. Nur wurde AMD als neuer Partner nicht abgestritten?

Nebenbei: Was ist XFX an ein guter Name? :confused:
Weil der Hersteller in einen Produktnamen 20 X einfügt ist er besonders gut?
Du bist so lächerlich.XFX haben bis jezt nur Nvidia Karten gekauft.

Unyu
2008-12-13, 00:20:03
Seit wann ist das denn bekannt?
Seit Juli.
http://www.theinquirer.net/inquirer/news/318/1040318/two-nvidia-partners-defect

Du bist so lächerlich.XFX haben bis jezt nur Nvidia Karten gekauft.
Du meinst verkauft. Und weiter?

Sorkalm
2008-12-13, 00:21:26
Seit Juli.
http://www.theinquirer.net/inquirer/news/318/1040318/two-nvidia-partners-defect

Naja, aber das liest sich mehr wie spekulieren nach dem Gainward-Deal vom INQ. Machen die ja gerne. ;)

Gast
2008-12-13, 00:28:54
Das wissen wir schon lange, das XFX weiterzieht. Nur wurde AMD als neuer Partner nicht abgestritten?

Nebenbei: Was ist XFX an ein guter Name? :confused:
Weil der Hersteller in einen Produktnamen 20 X einfügt ist er besonders gut?
Die Firma hat bis jetzt nur Nvidia Karten verkauft.XFX ist dafür bekannt oc modelle zu liefern.Ja XFX ist ein grosser name-.

Unyu
2008-12-13, 00:29:13
Naja, aber das liest sich mehr wie spekulieren nach dem Gainward-Deal vom INQ. Machen die ja gerne. ;)
Macht dich Fuad glücklicher? ;)
http://www.fudzilla.com/index.php?option=com_content&task=view&id=10035&Itemid=34

Nakai
2008-12-13, 11:32:26
Die Firma hat bis jetzt nur Nvidia Karten verkauft.XFX ist dafür bekannt oc modelle zu liefern.Ja XFX ist ein grosser name-.

Noch größer im Asiatischen Raum. Da is XFX wirklich nicht klein.;)


mfg Nakai

Sorkalm
2008-12-13, 12:53:23
Macht dich Fuad glücklicher? ;)
http://www.fudzilla.com/index.php?option=com_content&task=view&id=10035&Itemid=34

Wenns eindeutig ist, ja. Weil Fuad hat vernünftige Quellen.
Außerdem schreibts auch Hexus. Offiziell solls wohl am Dienstag verkündet haben.

aylano
2008-12-13, 14:34:12
Und warum nicht? Der Chip ist sehr klein, in die Breite zu gehen wäre sicherlich die logische Variante. Die Taktraten hingegen sind schon sehr hoch.Kostet AMD aber ne Menge an Zeit, Geld, Tests, Entwicklung und und und.
So eine mögliche Grafikkarte wird nicht nur viel Geld für den User kosten, sondern auch für AMD. Dazu kommt eine wahrscheinlich relativ geringe Auflage. Da überlegt man sich schon zweimal, ob man den ganzen Aufwand treibt.


Ob (Variante 1) ein RV770 mit Höherem Takt & Bug-Fix & PP2.0+ kommt
oder (Variante 2) ein RV775 mit etwas höherem Takt & 960 SP & 48 TMUs & Bug-Fix & PP2.0+ kommt, hängt meiner Meinung davon hab, wie schnell der RV870 mit 40nm & DX11 & Co bzw. der RV740 in 40nm daher kommt und wie leicht man den RV770 +20% Shader & Co dazugeben kann und zuletzt, wie viel Entwicklung & Optimierung davon dann auch in den RV870 hineinfließt.

Wenn wirklich nur ein RV740 (=RV730 in 40nm) daherkommt (=Kostensenkung bei Mainstream und Erste 40nm-Erfahrung) könnte das dafür sprechen, dass an dem RV770 ordentlich weitergearbeitet wurde und auf das Bewährte 55nm setzt.

Zwar sind die Shaders & Co billig (=geringe Die-Fläche), aber +20% macht dann auch ca. 40(-50)mm² aus, wodurch eine ordentliche Weiterentwicklung des RV770-Design nötig ist, um diese 25%-höhere Effizienz bei Shader pro mm² zu erreichen.

Zum Vergleich: RV6x0 (55nm) --> RV7x0 wurden die Shader um 100% kompakter entwickelt.

Ob bei diesem RV770-Design noch so ein Sprung möglich ist bzw. ob ATI für die RV770-Weiterentwicklung noch die Designer dafür hatte a la DX11-GPUs müssen auch mal entwickelt werden???

Warum nicht, als RV770 entwickelt wurde, war ATI am Markt absolut zweitklassig und kaum einer Glaubte "an ATIs naher Zukunft".
Vielleicht haben die Designer in diesem Zeit-Druck die RV770 rauszubringen, eben nicht alle Maßnahmen zur Optimierung (a la mehr Shader pro mm²) umgesetzt, welche noch etwas Zeit brauchten.

Nun ja, beim K10-65nm vs K10-45nm sieht man schön was rauskommt, wenn man die CPU die Ganze Zeit auf Performance & Übertaktbarkeit & Stromverbrauch statt auf Bugs-Entfernung optimiert wird a la Zeitfaktor.

Also, wenn das Design ordentlich weiterentwickelt hat, dann kommen ziehmlich sicher die +20% Shader um die Lücke (freier Platz) zu stopfen. (Siehe RV770)

So eine mögliche Grafikkarte wird nicht nur viel Geld für den User kosten, sondern auch für AMD. Dazu kommt eine wahrscheinlich relativ geringe Auflage. Da überlegt man sich schon zweimal, ob man den ganzen Aufwand treibt.
Mit solchen Zwischenstufen geht man aber auch auf der sicheren Seite, falls sich der Nachfolger verschiebt.
Und AMD hat da mehr als genug Erfahrungen a la non-K8-65nm-Server, non-K10-Dual-Core in 65nm bzw. sehr spät in 45nm, wo dann die Marktanteile ordentlich wegbrachen.

Gast
2008-12-13, 23:52:53
Die Specs sind eigentlich totaler Blödsinn:
- 48 TMUs -> 12 Cluster mit je 4 TMUs
- 840 SPs aufgeteilt auf 12 Cluster -> 70 SPs pro Cluster ~ 14 5D-ALUs, wo es aber ein Vielfaches von 4 sein muss

Das Highlight ist dann natürlich noch die RV775Pro mit 1.4GHz GDDR4. X-D

Mal abgesehen davon, dass ich mir auch sehr sicher bin, dass es sich um einen Fake handelt, würde mich mal interessieren, warum "es aber ein Vielfaches von 4 sein muss". Ich sehe nicht an der Architektur, die so etwas ausschließen würde. Aber lasse mich gerne eines besseren belehren.

KonKorT
2008-12-14, 00:04:41
Es muss auch kein Vielfaches von 4 sein. Es sollte aber, zumindest ist dies am Effizientesten und das steht bei der Entwicklung über allem.
Du hast insofern recht, als dass die 16 Shaderkerne beim RV770 zurzeit Reihe-an-Reihe geschaltet sind und somit prinzipiell auch 14 - oder halt allgemein kein Vielfaches von 4 - möglich sind.

Gast
2008-12-14, 01:03:34
Warum sollte ein Vielfaches von 4 effizienter arbeiten? Die SIMDs bestehen ja aus Vec5-Rechenwerken die jeweils RGBA+eine skalare Operation ausführen können. Oder wird da immer noch auf gleichzeitig auf 4 Pixeln wie früher bei den Quad-Pipelines gearbeitet?

Sorkalm
2008-12-14, 02:06:56
Alles andere als so was "geradem" dürfte wahrscheinlich von der Chipgestaltung, also dem Verhältnis Transistoren/Die-Fläche entgegensprechen.

deekey777
2008-12-14, 02:07:31
Ähm: Es muss immer ein vielfaches von Vier sein, da Quads berechnet werden (also Gruppen von vier Pixeln).

Warum sollte ein Vielfaches von 4 effizienter arbeiten? Die SIMDs bestehen ja aus Vec5-Rechenwerken die jeweils RGBA+eine skalare Operation ausführen können. Oder wird da immer noch auf gleichzeitig auf 4 Pixeln wie früher bei den Quad-Pipelines gearbeitet?

Es sind keine Vec5-Einheiten. Und da es ein Rasterizer ist, sind die Thread-Prozessoren (also eine Gruppe aus 5 Stream-Cores) zu Quads zusammengefasst.
Beim RV770 wird je SIMD-Engine an 16 Pixeln parallel gearbeitet (besser gesagt an 64 Pixeln in 4 Takten). Beim RV730 dagegen an acht.

Es muss auch kein Vielfaches von 4 sein. Es sollte aber, zumindest ist dies am Effizientesten und das steht bei der Entwicklung über allem.
Du hast insofern recht, als dass die 16 Shaderkerne beim RV770 zurzeit Reihe-an-Reihe geschaltet sind und somit prinzipiell auch 14 - oder halt allgemein kein Vielfaches von 4 - möglich sind.

Muss es. Bei jedem Chip, egal ob G80, R520 oder RV770 oder G86.

robbitop@work
2008-12-15, 08:39:06
Es ist Stand der Technik. Aber es ist muss es nicht so sein. GPUs, die quadbasiert rendern, baut man lediglich, um Kontrolllogik zu sparen. Bis zum TNT2/Voodoo3/Rage Pro/G200 etc. baute man wirklich pixelbasierende GPUs.

Coda
2008-12-15, 16:57:00
Das ist so nicht richtig. Man braucht die Quads um die Texturderivate bei dynamischen Texture-Lookups zu berechnen. Es gibt heute gar keine andere Möglichkeit mehr.

w0mbat
2008-12-17, 19:47:48
Ok, wie es aussieht wird der RV740 ja "mehr" als nur ein RV730 Shrink. Und da er sein Tape-out schon hinter sich hat wird es wohl nicht mehr all zulange dauern bis er auf den Markt kommt (wie lange ist denn normalerweise die Zeit zwischen Tape-out und Release?).

Die aktuellen RV740 Engeneering Samples nutzen wohl 900MHz GDDR5. Wenn der RV730 keinen GDDR5 Kontroller hat kann man schon sicher sein dass es kein reiner Shrink ist.

Nun gibt es ja verschiedene Möglichkeiten wie der RV740 aussehen könnte. Was denkt ihr?

Nakai
2008-12-17, 20:43:19
Nun gibt es ja verschiedene Möglichkeiten wie der RV740 aussehen könnte. Was denkt ihr?

Ich denke man hat sich den RV770 zu Herzen genommen und ihn gekürzt.

32 TMUs + 640SPs


mfg Nakai

w0mbat
2008-12-17, 20:51:11
640SP+32TMUs@40nm würden aber dem RV770 gefährlich nahe kommen. Zumal dann das angeblich 128bit breite SI limitieren würde, auch wenn man GDDR5 nutzt.

reunion
2008-12-17, 20:53:37
Naja, eine 4850 hat auch nur 970Mhz GDDR3, da könnte man mit hochgetaktetem GDDR5 durchaus mithalten. Und ein RV770-Ersatz sollte in 40nm auch nicht lange auf sich warten lassen.

Nakai
2008-12-17, 20:55:34
640SP+32TMUs@40nm würden aber dem RV770 gefährlich nahe kommen. Zumal dann das angeblich 128bit breite SI limitieren würde, auch wenn man GDDR5 nutzt.

Der RV730 ist schon sehr klein bei etwa 150mm². Der RV770 liegt bei 256mm².

Ein perfekter Shrink des RV770 bei 40nm wäre dann be 135mm².

IMO braucht man was zwischen RV730 und RV770. Es kann auch weniger sein, aber mit höheren Taktraten.


mfg Nakai

w0mbat
2008-12-17, 21:52:30
Ich hab mal gehört dass ATI den RV770 extra vergrößert hat, weil sie sonst Probleme mit dem 256bit SI auf einem kleinern Chip bekommen hätte. Der R300 hatte doch ein 256bit SI, war aber kleiner, oder?

AnarchX
2008-12-17, 21:54:49
Ich hab mal gehört dass ATI den RV770 extra vergrößert hat, weil sie sonst Probleme mit dem 256bit SI auf einem kleinern Chip bekommen hätte. Der R300 hatte doch ein 256bit SI, war aber kleiner, oder?
Ja, aber an dem war aber auch kein GDDR5 mit >1.8GHz angebunden.

Bei RV740 gab es AFAIK irgendwo etwas über 480SPs bei wohl 32 TMUs, was durchaus Sinn machen würde.

reunion
2008-12-17, 21:55:24
Ich hab mal gehört dass ATI den RV770 extra vergrößert hat, weil sie sonst Probleme mit dem 256bit SI auf einem kleinern Chip bekommen hätte. Der R300 hatte doch ein 256bit SI, war aber kleiner, oder?

R300 hat aber nicht mal annähernd so viel Strom geschluckt. War 218mm² groß AFAIK.

Passt das eigentlich auch hier rein: MSI Notebook mit Mobility Radeon 4850: http://asia.msi.com.tw/index.php?func=prodtmpspec&maincat_no=135&cat2_no=271&cat3_no=&prod_no=1676#menu

Dürfte also nicht mehr allzu lange dauern.

w0mbat
2008-12-17, 21:56:52
Also stimmt es dass man für ein GDDR5 256bit SI min. so um die 250mm² braucht? Ich will eigentlich wissen ob das SI wirklich was mit der Die-size zu tun hat.

@reunion: Hat das was mim Strom zu tun?

reunion
2008-12-17, 22:00:55
@reunion: Hat das was mim Strom zu tun?

Natürlich, oder glaubst du das man fast 100A über eine ~1.3V Leitung in den Chip bläst? Da gibt es natürlich massig Vcc und Masseleitungen. Umso mehr Stromverbrauch umso mehr benötigt man logischerweise davon.

deekey777
2008-12-17, 22:01:23
Wie groß ist nochmal der RV670?

Das mit Die-Größe vs. SI halte ich irgendwie für Quark.

w0mbat
2008-12-17, 22:01:56
193mm² ?

reunion
2008-12-17, 22:08:49
Wie groß ist nochmal der RV670?

Das mit Die-Größe vs. SI halte ich irgendwie für Quark.

RV670 hat auch keinen GDDR5-Support, welcher zusätzliche Pins für die Fehlerkorrektur benötigt, auch ist der Stromverbrauch bedeutend geringer. Ob RV770 tatsächlich Pad-limitiert war, wird dir nur ein Ingenieur bei ATi oder jemand der so verrückt ist und sein Die auf einer RV770-Graka köpft sagen können. Das man auf einem solchem Die nicht unbegrenzt Pads anbringen kann sollte aber auf der Hand liegen.

w0mbat
2008-12-17, 22:12:53
GDDR5 requires more pins than GDDR3, a 32 bit bus for GDDR5 requires 61 pins. Then there is the sideport that also requires some pins, so in essence the RV770 has a quite a bit more pins than R300. If ATI could fit all the pins that were needed for RV770 in a smaller space then RV770 would have simply had fewer SIMDs, the original plan actually asked for 6 SIMDs and they later ended up with 10.
You can't put an endless amount of pins/bump connections in the chip, it's just not physically possible. Then there is the problem that you need more pins to supply the chip with power the bigger and more power hungry it gets. A pin can only sustain a certain amount of current and they have to keep it under that limit to prevent failure. So to solve it you just use a lot of pins to supply the chip with it's required amperage.

Just some simple facts, the smallest die with a 128-bit bus is about 104 mm^2 (RV380 and RV515). NVIDIA's smallest die with a 128-bit bus is 118 mm^2 on their 55 nm. version of G96. I'd say that to have a 128-bit bus you need to be at least 100 mm^2, which would make it impossible for an RV730 shrink to have a 128-bit bus.
http://www.xtremesystems.org/forums/showpost.php?p=3507570&postcount=38

Hier wurde es gerade sehr schon erklärt. Und damit ist auch klar dass der RV740 kein reiner RV730 Shrink sein kann.

KonKorT
2008-12-17, 23:17:23
Zurzeit haben wir beim RV730:
8 SIMD-Einheiten mit jeweils 8 Shaderkernen sowie einem Texturcluster, der dann noch mal vier Textureinheiten bereithält.

Um 480 statt 320 SPs zu erhalten, könnte man jetzt zum einen schlichtweg die Anzahl der Shaderkerne pro SIMD-Einheit von 8 auf 12 aufstocken.
Möglich wäre aber ebenso, die SIMD-Einheiten auf 6 zu reduzieren und 16 Shaderkerne pro SIMD wie beim RV770 zu verbauen. Damit fiel aber auch die Anzahl der TMUs auf 24 - meiner Meinung nach kein Beinbruch, wenn man sich das Skalierverhalten des Chips anguckt.

Folgende Specs halte ich für denkbar:

RV740
- 480 SPs, 24 TMUs, 8 ROPs @ 128 Bit
- XT: ~ 800/900 MHz (GDDR5); PRO: ~ 600/1000 MHz (GDDR3)


@ w0mbat
In der Regel liegen zwischen Tape-Out und Launch gute drei Monate. Wenn es flott läuft, wirste ihn auf der nächsten CeBIT sehen. ;)

w0mbat
2008-12-17, 23:21:31
Damit könnte man HD4810 und HD4830 ersetzten, wobei 128bit@1GHz GDDR3 schon deftig bremsen würde.

KonKorT
2008-12-17, 23:51:17
Die 500 MHz DDR2 bei der HD 4650 (RV730) bremsen da zurzeit verhältnismäßig noch stärker... ;)

aylano
2008-12-18, 00:05:13
Ist es überhaupt schon vorgekommen, dass bei einer neuen kleineren Fertigung statt einem Shrink eine neue Die entworfen wurde???

Genial für ATI wäre überhaupt, wenn ATI die mobile RV7x0er-Serie im 1Q 2009 (=Notebook-Gerneration-Halbzeit und Puma-45nm) in 40nm rausbringen würde/könnte.

Schließlich hat der Stromverbrauch im Notebook-Markt viel mehr Auswirkungen/Einfluss als im Desktop-Markt.
Und bei Halbzeit einer Plattform werden die Notebook-Hersteller nicht mehr bis zur neuen Notebook-Generation warten.

Aber zuerst die Shrinks im Mobilen Markt einzusetzen, ist AFAIK auch bisher unüblich gewesen.

Sorkalm
2008-12-18, 01:15:26
Ist es überhaupt schon vorgekommen, dass bei einer neuen kleineren Fertigung statt einem Shrink eine neue Die entworfen wurde???

Wäre dem nicht so, würden wir immer noch mit einer Voodoo-1-GPU, die wohl verdammt klein wäre, spielen. ;)

Logisch ist das passiert, schon verdammt oft. Worauf wolltest du denn mit der Frage genau hinaus?

aylano
2008-12-18, 03:21:04
Ich meinte Natürlich bei der Einführung einer neuen kleineren Fertigung.
(Natürlich wurden neue Dies entwickelt)


Worauf wolltest du denn mit der Frage genau hinaus?
Ganz einfach, dass zuerst die 7x0er-Serie geschrinkt wird und nicht zuerst eine Sonderkonstruktur a la 480 oder 640 SP gemacht wird

Mal sehen, ob ATI durch die kleine Die-Größe einen Zeitvorsprung in der 40nm-Einführung gegenüber Nvidia haben wird.

Aus wirtschaftlicher Sicht, ist es jetzt (Anfang Feb 2009) sinnvoll die RV7x0-Serie (vorallem 710 & 730) in 45nm rauszubringen.

Denn wie schon erwähnt ist da die Halbzeit der Notebook-Generation, wo wieder viele Notebook-Design entwickelt werden, vorallem, wenn per 45nm-Griffin ein Puma-Refresh stattfinden wird

Und nicht nur bei den Notebooks macht eine jetztige 40nm-Einführung sinn.
Denn AFAIK werden im Februar die AM3-Desktop-Plattform eingeführt, wodurch es wieder einige OEM-Desktop-Systeme geben wird.

Und die RV7x0er-Serie (vorallem 770er) wurden ja nicht umbedingt auf High-Performance, sondern wegen der geringen Die-Größe auf Wirtschaftlichkeit entwickelt.
Dadurch macht es sinn, einen simplen Shrink (=Kostensenkung) zur wirtschaftlichen günstigen Zeit (Feb) einzuführen, damit viele neue GPUs auch schnell in die OEM-Systeme eingebaut werden.
Und da diese neuen GPU durch die 40nm gegenüber Nvidia einen ordentlichen Vorsprung in Sachen Stromverbrauch (40nm) und Performance (RV7x0-Technik) hätten, werden umsomehr dieser GPUs eingebaut


Ich denke, mit so einer Strategie könnte ATI viel mehr Geld machen bzw. Nvidia wieder am Falschen Fuß erwischen, als wenn sie sich jetzt nur auf den GT200b-Nvidia-Konter konzentrieren und irgendwann die RV710/7130-40nm-Shrinks einführen, welche aufgrund der ungünstigen Zeit, dann eher Zögerlich in die OEM-Desktop & Notebook-systeme eingebaut werden. (siehe mobile RV620 & 635, welche praktisch erst mit der neuen Notebook-Plattformen eingebaut wurden und dadurch monatelang kaum verkauft wurden.)


z.B.:Beim GT200b wurde auch lange an einem neuen 192 SP-Chip geglaubt.
Und dann kam eh wieder "nur" ein 55nm-GT200-Shrink.

Ich nehme jetzt mal an, AMD hat bei beim RV710 & 730 & 770-Entwurf auch an zukunftige Shrinks gedacht, weil es einfach normal ist, eine neue Architektur später auch zu shrinken, ohne dabei großartiges ändern zu müssen.

Gast
2008-12-18, 08:39:21
40nm ist aber ein Shrink sondern ein neuer Fertigungsprozess und da muss das DIE auf jeden Fall komplett neu designed werden. Und da dies einen erheblichen Teil des Aufwandes in der Chipentwicklung ausmacht, wurde noch nie ein Chip unveraendert auf einen neuen Fertigungsprozess umgestellt.

deekey777
2008-12-18, 14:24:21
Zurzeit haben wir beim RV730:
8 SIMD-Einheiten mit jeweils 8 Shaderkernen sowie einem Texturcluster, der dann noch mal vier Textureinheiten bereithält.

Um 480 statt 320 SPs zu erhalten, könnte man jetzt zum einen schlichtweg die Anzahl der Shaderkerne pro SIMD-Einheit von 8 auf 12 aufstocken.
Möglich wäre aber ebenso, die SIMD-Einheiten auf 6 zu reduzieren und 16 Shaderkerne pro SIMD wie beim RV770 zu verbauen. Damit fiel aber auch die Anzahl der TMUs auf 24 - meiner Meinung nach kein Beinbruch, wenn man sich das Skalierverhalten des Chips anguckt.

Folgende Specs halte ich für denkbar:

RV740
- 480 SPs, 24 TMUs, 8 ROPs @ 128 Bit
- XT: ~ 800/900 MHz (GDDR5); PRO: ~ 600/1000 MHz (GDDR3)


@ w0mbat
In der Regel liegen zwischen Tape-Out und Launch gute drei Monate. Wenn es flott läuft, wirste ihn auf der nächsten CeBIT sehen. ;)
Ich glaube kaum, dass AMD eine Mainstream-GPU auf den Markt bringt, die weniger TMUs als ihre Vorgängering hat (der RV530 existierte vor so langer Zeit, dass wir sich nicht an ihn erinnern können).
Einfach einen weiteren ALU-Quad pro SIMD reinzuklatschen, sollte keine hohe Kunst sein, die Logikeinheiten sind darauf auch designt. Also: 8 Cluster mit je 3 Shader-Quads und 4 TMUs (vielleicht traut sich AMD ein 192-bit-SI zu nutzen?).

Damit könnte man HD4810 und HD4830 ersetzten, wobei 128bit@1GHz GDDR3 schon deftig bremsen würde.
Die HD4670 scheint es zu überleben.

aylano
2008-12-18, 17:31:03
40nm ist aber ein Shrink sondern ein neuer Fertigungsprozess und da muss das DIE auf jeden Fall komplett neu designed werden. Und da dies einen erheblichen Teil des Aufwandes in der Chipentwicklung ausmacht, wurde noch nie ein Chip unveraendert auf einen neuen Fertigungsprozess umgestellt.
Dafür, dass ein Shrink anscheinend doch etwas aufwendig ist, wurden die Shaders & Co selten, wenn überhaupt, bei der neuen Struktur-Einführung geändert.

Somit würde ich diese Variante auch am Wahrscheinlichsten sehen.

w0mbat
2008-12-18, 19:00:34
Was haltet ihr davon? Hat der RV770 wirklich 900SPs?

http://img139.imageshack.us/img139/8880/rv77010x90sprn5.jpg (http://imageshack.us)
http://img139.imageshack.us/img139/rv77010x90sprn5.jpg/1/w400.png (http://g.imageshack.us/img139/rv77010x90sprn5.jpg/1/)
http://www.xtremesystems.org/forums/showpost.php?p=3509705&postcount=120

Sorkalm
2008-12-18, 19:22:34
Hmm, so sieht das Originalbild von AMD aus:
http://www.computerbase.de/bildstrecke/22061/8/

Wenn man da durchzählt, kommt man auch auf 90 doppelte "Klötzchen" (oben und unten 2, 2, 2, 2, 1 und sonst neun Reihen 4, 4, 4, 4, 1 - das wären 180 Shadereinheiten... :|

w0mbat
2008-12-18, 19:39:17
Also 900SPs anstatt 800SPs und damit könnte AMD einen schnelleren RV770 bringen, wobei die 100 extra Shader wohl nicht viel bringen würden.

horn 12
2008-12-18, 19:43:55
@Nakai

Wann sollte, könnte man Neue Infos zum RV77 Refresh erhalten.
So wie es derzeit scheint könnte der Refresh glatt 2 Shadereinheiten mehr haben und wenn in 40nm Verfahren, dies ist ja der gravierende Punkt!
wohl gar die 900+ Mhz schaffen. Somit wäre man auf GTX 285 Performance und mit einer möglichen 4970 X²+ wohl gar über der GTX295 um wiederum ca. 20%.

Ein ewigen Kommen und Gehen bei der Performance Krone!
Aber was solls, Behalte nun fix meine HD4870 512 MB Force3D gekauft damals um 195 Euro im Juli 2008, der Aufpreis auf 4870 1GB von Sapphire (schwarzer Lüfterdesign) würde mir ca. 65-75 Euro kosten, das spar ich lieber auf den richtigen Refresh!

Coda
2008-12-18, 20:22:29
Was haltet ihr davon? Hat der RV770 wirklich 900SPs?
Könnte aus Redundanzgründen schon sein.

KonKorT
2008-12-18, 20:35:49
Die 100 Shadereinheiten, freizuschalten, hätte keinen praktischen Nutzen in 3D-Applikationen. Wie Coda schon bemerkte, handelt es sich hierbei lediglich um Redundanzgründe - dennoch ein sehr interessantes Detail.

Alles weitere lässt sich hier nachlesen:
http://www.hardware-infos.com/news.php?news=2597

Der_Korken
2008-12-18, 20:38:46
Hier wurde ja auch vor einigen Seiten erst gepostet, dass die Anzahl an Shadereinheiten pro SIMD immer ein Vielfaches von 4 betragen muss. So wären es aber 18 ... das spricht wie schon angemerkt eigentlich nur für die Redundanz. Mich erstaunt da aber, dass ATI in dem kleinen Die noch Platz für 1/8 zusätzliche Redundanz gefunden hat. Das würde auch erklären, wieso ATI bei der 4850 keine Funktionseinheiten deaktivieren musste: Es war einfach genug Reserve frei, sodass die 10SIMDs fast immer vollständig lauffähig waren.

Sorkalm
2008-12-18, 20:41:29
Die Shader sind doch nicht sonderlich groß...

KonKorT
2008-12-18, 20:54:51
Das würde auch erklären, wieso ATI bei der 4850 keine Funktionseinheiten deaktivieren musste: Es war einfach genug Reserve frei, sodass die 10SIMDs fast immer vollständig lauffähig waren.

Richtig, genau das erklärt es. :)
Und HD 4830 hat ja auch nicht weniger Shadereinheiten pro SIMD, sondern nur weniger SIMD-Einheiten allgemein. Sehr geschickt von AMD.

w0mbat
2008-12-18, 20:57:23
Die HD4870 ist aber nicht Shader limitiert, weshalb ein RV770 mit 900SPs wohl nicht arg schneller wäre.

Raff
2008-12-18, 21:25:03
Die HD4870 ist aber nicht Shader limitiert, weshalb ein RV770 mit 900SPs wohl nicht arg schneller wäre.

Och, mehr ALUs würden nicht schaden, speziell beim Einsatz von CFAA (da ist das Ding arg shaderlimitiert) und in Crysis. Netter wären aber mehr TMUs ... gekoppelt mit HQ-AF. :)

MfG,
Raff

reunion
2008-12-18, 21:32:38
Richtig, genau das erklärt es. :)
Und HD 4830 hat ja auch nicht weniger Shadereinheiten pro SIMD, sondern nur weniger SIMD-Einheiten allgemein. Sehr geschickt von AMD.

Die HD 4830 war wohl vorallem eine Reaktion auf die 9800GT.

KonKorT
2008-12-19, 12:14:41
Fudzilla attestiert dem RV740 ein 256-Bit-Speicherinterface. Der gleichzeitige Einsatz von GDDR5 dürfte da gelinde gesagt Overkill sein. Ich bezweifle die Meldung, will sie Euch dennoch nicht vorenthalten:

http://www.fudzilla.com/index.php?option=com_content&task=view&id=11026&Itemid=1

w0mbat
2008-12-19, 12:41:20
Hm, vielleicht ist der RV740 ja ein 640SP/32TMU Monster dass dank 40nm auf 900MHz+ läuft und so die HD4870 überflügelt. Dann wären 256bit + GDDR5 wohl angebracht. Oder gleich ein 40nm RV770, oder vielleicht sogar ein 12 SIMDs RV770+ :)

Sorkalm
2008-12-19, 12:54:58
Hm, vielleicht ist der RV740 ja ein 640SP/32TMU Monster dass dank 40nm auf 900MHz+ läuft und so die HD4870 überflügelt. Dann wären 256bit + GDDR5 wohl angebracht. Oder gleich ein 40nm RV770, oder vielleicht sogar ein 12 SIMDs RV770+ :)

Dann passt der Name RV740 aber nicht mehr.

deekey777
2008-12-19, 13:10:12
Die HD4870 ist aber nicht Shader limitiert, weshalb ein RV770 mit 900SPs wohl nicht arg schneller wäre.
Selbst wenn: Ich weiß nicht, ob das überhaupt funktionieren kann (der Rasterizer bleibt der gleiche, kann der Dispatcher überhaupt größere "Threads" als 64 erstellen?).
Die Wavefronts (das, was wir mal "Threads" bezeichnet haben) bestehen beim RV770/RV670/R600 aus 64 Pixeln oder noch genauer aus 4x4 Pixelquads oder 8x8 Blöcken. Und gerade mit 8x8-Blöcken arbeiten diese am effizientesten.
http://www.beyond3d.com/content/reviews/16/7
Like competing architectures, R600 will scale back the number of threads in flight at any given time when there's severe register pressure, so that there's no thread stalling because the register file would otherwise be full. Branch granularity is 64 pixels, and we measure it to be most performant using our branching test when working on 4x4 blocks of screen-aligned quads (so 8x8 pixels). Testing our branching shader using other tiling arrangements for the texture we're sampling in the shader shows that something like 32x2, or 16x4 (or 2x32, or 4x16) are slower.
Ausgangspunkt für die Erstellung dieser Blöcke ist Rasterization. 16x16-Kacheln lassen sich wunderbar in 4 Blöcke a 8x8 zerlegen, die wiederum auf 4 SIMDs zB des RV670 verteilt werden. Hat man unvollständige 8x8-Blöcke, so füllt die GPU den Rest der Wavefont mit Quads anderer Blöcke, was aber langsamer ist (siehe B3D-Artikel).

Wenn man jetzt annimmt, es kommt ein RV770-Abkömmling mit je 5 Shader-Quads, dann wird man die Wavefronts nicht immer mit aktiven Quads vollkriegen.

Oder auch nicht.

AnarchX
2008-12-19, 21:15:10
VR-Zone: RV740 ~ 32TMUs, 640SPs, 128-Bit (http://vr-zone.com/articles/ati-rv740--a-40nm-rv770-in-disguise/6334.html?doc=6334)

Mit entsprechenden Taktraten - >800MHz?, dürfte da in der Tat 4830 oder gar mehr Performance erreicht werden, wenn auch der Die wohl deutlich jenseits der 100mm² liegen wird.

Sorkalm
2008-12-19, 21:36:36
Mit entsprechenden Taktraten - >800MHz?, dürfte da in der Tat 4830 oder gar mehr Performance erreicht werden, wenn auch der Die wohl deutlich jenseits der 100mm² liegen wird.

Die 4830 taktet mit selben Einheiten bei nur 575 MHz. Auch bei der Speicherbandbreite ist man mit 900 MHz GDDR5 auf gleichem Niveau der 4830, also sollten in etwa 575 MHz auch für deren Performance reichen. Ich würde trotzdem auch mit etwas mehr rechnen. ;)

Die Die-Größe würde ich auch erstmal abwarten, soviel kosten Shader ja nicht. Sind ja aber noch weitere Änderungen dabei (GDDR5-Controller), würde trotzdem erwarten dass der RV740 kleiner als der RV730 wird.

aylano
2008-12-19, 22:15:56
VR-Zone: RV740 ~ 32TMUs, 640SPs, 128-Bit
Angenommen, so ein Ding kommt.
Also, ein per RV740 ein typischer mainstream-GPU mit unter 75Watt-TDP und 128Bit (Letzte ATI-Konzept)
Wie soll dann ein RV770-40nm aussehen???
Ebenfalls 2x so viele Shaders ala 1600???

Nun ja, das Hinzufügen von Shaders & Co soll bei der RV6x0 bzw. RV7x0-Architektur viel leichter gehen gehen, aber dass sie dann gleich 3 neue Dies für einen Zwischen-Schritt bis zu den DX11s designen wäre schon bisschen viel.
(Denn den RV740 bis zum DX11 alleine kann ich mir nicht vorstellen)

Nun ja, es bleibt ja noch die Möglichkeit, dass ATI die Leute wieder so täuscht wie bei der RV770-Einführung (wo schon viele nicht mal an 480-Shader geglaubt haben) und erst wieder im Letzten Moment vor der Einführung die echte Shader-Zahlen ala 800 durchsickern lässt.

Spasstiger
2008-12-19, 23:05:27
VR-Zone: RV740 ~ 32TMUs, 640SPs, 128-Bit (http://vr-zone.com/articles/ati-rv740--a-40nm-rv770-in-disguise/6334.html?doc=6334)
Bei 750 MHz Chiptakt und 900 MHz Speichertakt (GDDR5) würde sich die Karte nach meiner Modellschätzung (650 MiB VRAM-Last) so einsortieren:

http://www.abload.de/img/rv740xto07z.png

/EDIT: Diagramm mit RV740 XT als Referenz eingefügt.

Coda
2008-12-19, 23:23:27
Die Die-Größe würde ich auch erstmal abwarten, soviel kosten Shader ja nicht. Sind ja aber noch weitere Änderungen dabei (GDDR5-Controller), würde trotzdem erwarten dass der RV740 kleiner als der RV730 wird.
Öh, also bei RV770 sind die ALUs+TMUs >50% des Dies.

http://www.elitebastards.com/hanners/ati/rv770/die.jpg - Alles in der Mitte.

AnarchX
2008-12-19, 23:27:19
Mit wieviel ROPs hast du gerechnet?
Die 16 von VRZone stimmen wohl eher nicht, auch bei der RV730 geben sie diese ja falsch an...

Aber dort könnte man die Karte in der Tat vermuten, das wäre wieder ein erheblich Meilenstein in Richtung Effizienz: <=150mm² Die, einfaches 128-Bit PCB, Versorgung über PEG möglich.

Bleibt trotzdem die Frage, was unter 40nm an Taktraten für TMUs und ROPs möglich sein wird, 65nm bzw. 55nm war es ja wie man sah 700-800MHz, eigentlich sollte da doch mal ein nächster Schritt möglich sein.

Spasstiger
2008-12-19, 23:40:08
Mit wieviel ROPs hast du gerechnet?
Meinst du mich? Ich habe ein 128-Bit-SI mit 8 ROPs angenommen (32 Z).

Sorkalm
2008-12-20, 01:05:17
Naja, die ROPs machen nicht viel aus, schätze ich mal. Der Takt liegt ja klar über dem einer RV770LE, davon kann man ausgehen.

Gast
2008-12-20, 07:28:06
einen rv740 mit 750mhz chiptakt wäre auf augenhöhe mit der 4850. ich würde ihn eher als ersatz für die 4830 sehen, evtl. mit leicht höherem chiptakt (~625mhz) und zum geringfügig günstigeren preis. zwischen 4830 und 4850 ist kein platz für ein weiteres produkt, da die beiden auch nicht so weit auseinanderliegen (im schnitt 10%).

AnarchX
2008-12-20, 09:51:54
zwischen 4830 und 4850 ist kein platz für ein weiteres produkt, da die beiden auch nicht so weit auseinanderliegen (im schnitt 10%).
Deshalb sagt man ja auch RV740 nach die kleineren RV770 kostengünstig für AMD und im Endeffekt wohl für den Kunden, zu ersetzen.

Wie du schon sagst, liegen sie doch dicht beieinander, sodass dieser Bereich wohlmöglich in einer SKU verschmelzen wird, die man wohl bei ~$100-149 sehen kann. Darunter kombiniert man dann wohl RV740 mit DDR3 um $79 zu erreichen.

Bleibt die Frage was oberhalb davon passieren wird, bis zum D3D11-Chip im H2 wird man sich wohl bei AMD nicht ausruhen.

KonKorT
2008-12-20, 12:23:53
Wenn der RV740 wirklich so schnell wird, muss auch ein RV790 - oder wie er auch heißen mag - bereitstehen, um den RV770 abzulösen.

PS: VR-Zone hat bei RV730 8 ROPs korrigiert, aber 16 bei RV740 stehen gelassen. Mit ein paar Architekturänderungen (http://www.hardware-infos.com/news.php?news=2600) scheint dies auch möglich - in der Theorie. ;)

reunion
2008-12-20, 12:49:23
VR-Zone: RV740 ~ 32TMUs, 640SPs, 128-Bit (http://vr-zone.com/articles/ati-rv740--a-40nm-rv770-in-disguise/6334.html?doc=6334)

Mit entsprechenden Taktraten - >800MHz?, dürfte da in der Tat 4830 oder gar mehr Performance erreicht werden, wenn auch der Die wohl deutlich jenseits der 100mm² liegen wird.

Mit >800-900Mhz Chiptakt dürfte das Ding fast auf RV770-Niveau liegen. Und zusätzliche Transistoren wird man wohl nicht viele benötigen, da RV730 schon 32 TMUs hat und man nur noch die ALUs skalieren muss. Dazu ist RV730 schon sehr klein und 40nm bietet massiv Spielraum. Ich rechne mit kaum mehr als 100mm². Dank 128-bit SI und vermutlich sehr niedriger Leistungsaufnahme wird der Chip wohl sehr effizient sein. Bin gespannt was NV hier entgegenzusetzen hat.

Wenn der RV740 wirklich so schnell wird, muss auch ein RV790 - oder wie er auch heißen mag - bereitstehen, um den RV770 abzulösen.

Davon ist auszugehen, allerdings kommt wohl zuerst RV740 und erst später das High-End-Pendant.


PS: VR-Zone hat bei RV730 8 ROPs korrigiert, aber 16 bei RV740 stehen gelassen. Mit ein paar Architekturänderungen (http://www.hardware-infos.com/news.php?news=2600) scheint dies auch möglich - in der Theorie. ;)

Eben, bei AMD sind die ROPs nicht an das SI gekoppelt, AMD könnte auch 32 ROPs verbauen wenn sie wollen ohne das SI verbreitern zu müssen. Und bei einem solch schnellen Chip macht es wohl durchaus Sinn mehr als 8 ROPs zu verbauen.

deekey777
2008-12-20, 13:04:41
VR-Zone: RV740 ~ 32TMUs, 640SPs, 128-Bit (http://vr-zone.com/articles/ati-rv740--a-40nm-rv770-in-disguise/6334.html?doc=6334)

Mit entsprechenden Taktraten - >800MHz?, dürfte da in der Tat 4830 oder gar mehr Performance erreicht werden, wenn auch der Die wohl deutlich jenseits der 100mm² liegen wird.
War ja klar, dass es keine 60 "Stream-Cores" pro SIMD-Engine sein werden.

Hier ein Auszug aus dem Stream-SDK:
http://www.abload.de/thumb/streaml4dc.png (http://www.abload.de/image.php?img=streaml4dc.png)

(Thread = Pixel, Wavefront ist Gruppe aus 64 Pixeln (RV670), Thread-Processor ist eine Gruppe aus fünf Stream-Cores)

AnarchX
2008-12-20, 13:28:29
Eben, bei AMD sind die ROPs nicht an das SI gekoppelt, AMD könnte auch 32 ROPs verbauen wenn sie wollen ohne das SI verbreitern zu müssen. Und bei einem solch schnellen Chip macht es wohl durchaus Sinn mehr als 8 ROPs zu verbauen.
Frei skalierbar sind die ROPs aber trotzdem nicht, aber mit 16 ROPs wäre RV740 in der Tat ziemlich mächtig, selbst der aktuelle und im Q2 wohl eher Low-End GDDR5 erreicht ja meist einiges mehr als die Referenz-900MHz.

Aber bei der Die-Size würde ich doch schon etwas mehr als 100mm² erwarten, gerade wenn nur 2 SIMDs und 2 MCs entfernt werden:
http://www.elitebastards.com/hanners/ati/rv770/die.jpg
-> wohl maximal 20% Flächenreduktion

Macht dann im Optimalfall 105mm² auf 40nm und wohl in der Realität wohl doch etwas mehr.

Sorkalm
2008-12-20, 13:30:50
Aber bei der Die-Size würde ich doch schon etwas mehr als 100mm² erwarten, gerade wenn nur 2 SIMDs und 2 MCs entfernt werden:
http://www.elitebastards.com/hanners/ati/rv770/die.jpg
-> wohl maximal 20% Flächenreduktion

Ein bisschen RV770-Schnickschnack (Sideport etc.) braucht man wohl auch nicht.

AnarchX
2008-12-20, 13:35:57
Ein bisschen RV770-Schnickschnack (Sideport etc.) braucht man wohl auch nicht.
In der Tat, damit dürften die 100mm² wirklich greifbar werden.


Schon enorm, was ATi da innerhalb von 2 Jahren an Effizienzsteigerungen erreicht hat.

Von einem 420mm², 160W, 512-Bit Monster, zu einem ~100mm², 50W(?), 128-Bit Leichtgewicht, was ersteres noch in Punkto Leistung teilweise im Faktor 2 übertreffen wird. :up:

reunion
2008-12-20, 13:42:55
Aber bei der Die-Size würde ich doch schon etwas mehr als 100mm² erwarten, gerade wenn nur 2 SIMDs und 2 MCs entfernt werden:
http://www.elitebastards.com/hanners/ati/rv770/die.jpg
-> wohl maximal 20% Flächenreduktion

Macht dann im Optimalfall 105mm² auf 40nm und wohl in der Realität wohl doch etwas mehr.

Ich würde von RV730 ausgehen und nicht von RV770. Denn RV740 hat gleich viele SIMDs, das genau so breite SI, einzig die Anzahl des ALUs pro SIMD wird verdoppelt und womöglich die ROP-Anzahl. RV770 hat noch Dinge wie den Sideport und das breitere SI, welches natürlich auch Die-Fläche kostet. Das man mehr wie 2 MCs bei einem 128-bit SI verbaut glaube ich nicht.

AnarchX
2008-12-20, 13:54:55
Ich würde von RV730 ausgehen und nicht von RV770. Denn RV740 hat gleich viele SIMDs, das genau so breite SI, einzig die Anzahl des ALUs pro SIMD wird verdoppelt und womöglich die ROP-Anzahl. RV770 hat noch Dinge wie den Sideport und das breitere SI, welches natürlich auch Die-Fläche kostet.
Ja, damit würde man mit der 2,43-fachen Packdichte gar unter 100mm² kommen, fragt sich nur ob dass danach für den Pin-Out von (G)DDR2-5 reicht, den VR-Zone erwähnt.

Hmm... wenn man so recht über RV740 nachdenkt, dann spielt er vielleicht gar ein Rolle für die High-End-SKUs. :uponder:

"Side-Port 2", dadurch genügend Die-Size für den Pin-Out und dann eben 2 Chips auf ein MCM.

Bei 64 TMUs, 1280SPs, und 32 ROPs @ >700MHz dürfte es keine so große Rolle spielen, wenn man nicht 100% Skalierung erhält.

Damit hätte man ein schlagkräftige Antwort auf NV und gleichzeitig revolutioniert man die Fertigungseffizienz.

Für D3D11 spielt man dann halt das gleiche Spiel mit mehr SIMDs bzw. einer neuen Architektur und halt dann vielleicht ~150mm² Dies.

Sorkalm
2008-12-20, 14:25:38
Ja, damit würde man mit der 2,43-fachen Packdichte gar unter 100mm² kommen, fragt sich nur ob dass danach für den Pin-Out von (G)DDR2-5 reicht, den VR-Zone erwähnt.

Na, es werden in der Realität schon über 100 mm² werden. Aber trotzdem wird der einer der kleineren Mainstream-Chips der letzten Jahre (wenn man mal bedenkt dass der G86 115 mm² groß war, kann man damit sogar erstmal ohne einen weiteren unteren Chip auskommen ... den RV710 gibts ja solange auch noch ... zumal der neue 40-nm-Prozess noch einen kleinen Tick mehr Kosten wird, jedenfalls anfangs).

Hmm... wenn man so recht über RV740 nachdenkt, dann spielt er vielleicht gar ein Rolle für die High-End-SKUs. :uponder:

"Side-Port 2", dadurch genügend Die-Size für den Pin-Out und dann eben 2 Chips auf ein MCM.

Da bräuchte man aber 2x einen MCM mit 2 Chips (also insgesamt vier) für die High-End-Produkte. Klingt nicht besonders realistisch...

AnarchX
2008-12-20, 14:38:02
Da bräuchte man aber 2x einen MCM mit 2 Chips (also insgesamt vier) für die High-End-Produkte. Klingt nicht besonders realistisch...
2x MCM bei ATi wird doch schon etwas länger diskutiert und auch Ailuros hat dazu schon eine positive Andeutung gemacht.

Bei mehr als 2 GPUs pro MCM wäre es wohl problematisch die ganze Datenströme der anderen GPUs in die Master-GPU zu bekommen und man würde die Die-Size erheblich steigern.

Im Endeffekt hätte AMD doch einen erheblich Vorteil, sie müssten nur noch 2 GPUs fertigen: RVx40 für Mainstream bis High-End und RVx10/20 für Low-End und Chipsätze.

Ausserdem hat mit so kleinen GPUs erheblich weniger Probleme beim Tape-Out.

Natürlich ist die MGPU-Technologie, welche die beiden GPUs auf dem MCM verbindet der entscheidente Faktor, mit dem das Konzept fällt oder steht.

Sorkalm
2008-12-20, 14:44:17
Im Endeffekt hätte AMD doch einen erheblich Vorteil, sie müssten nur noch 2 GPUs fertigen: RVx40 für Mainstream bis High-End und RVx10/20 für Low-End und Chipsätze.

Im Extremfall, RV740 könnte so einer sein, reicht sogar ein Die, weil man damit noch die unteren Bereich mit bedienen könnte (von der Größe her geht das grade noch so, zumal man ja alte Dice auch noch absetzen will). Spart ja Entwicklungskosten. Aber...

Natürlich ist die MGPU-Technologie, welche die beiden GPUs auf dem MCM verbindet der entscheidente Faktor, mit dem das Konzept fällt oder steht.

...dass das schon so funktioniert, darüber wäre ich wirklich überrascht.

AnarchX
2008-12-20, 14:59:28
Vielleicht ist an dieser Meldung doch mehr dran, wenn auch Fuad es nicht richtig deuten konnte:
The main limitation of RV735 was the 128-bit wide bus, but ATI has been working on a new version of the chip, simply codenamed RV740 that will end up with a 256-bit bus.
http://www.fudzilla.com/index.php?option=com_content&task=view&id=11026&Itemid=1

Dann gab es ja noch RV870 und Codenamen Lil Dragon, der offenbar nicht zu ersterem gehören soll.
Zudem sollte RV870 über 1000SPs besitzen, was ja 1280 wären.

w0mbat
2008-12-20, 15:00:46
Oder es wird doch nur ein 55nm RV730 mit 256bit SI --------------- :D

Sorkalm
2008-12-20, 15:17:43
Vielleicht ist an dieser Meldung doch mehr dran, wenn auch Fuad es nicht richtig deuten konnte:

http://www.fudzilla.com/index.php?option=com_content&task=view&id=11026&Itemid=1

Dann gab es ja noch RV870 und Codenamen Lil Dragon, der offenbar nicht zu ersterem gehören soll.
Zudem sollte RV870 über 1000SPs besitzen, was ja 1280 wären.

Hmm, mit ein bisschen Interpretation kann man schon darauf kommen, ja... :|
Über RV870 hat man ja bisher kaum was gehört, von daher ist die Idee schon interessant. Wirklich vorstellen kann ich es mir jedoch trotzdem noch nicht...

Andererseits muss AMD dann auch langsam mal was neues bringen. Denn GT212 tanzt ja auch im zweiten Quartal an.

Oder es wird doch nur ein 55nm RV730 mit 256bit SI --------------- :D

Jaja, und ich bin der Mann im Mond. :tongue:
Das dieser Speicher (http://www.qimonda.com/download.jsp?ref=/qis_docs/Datasheets/Datasheets%20Graphics/IDGV1G-05A1F1C_rev060_www.pdf) (40X) mit RV740 auf aktuellen Test-Systemen läuft, weiß ja nicht nur Nordichhardware und du. ;)

w0mbat
2008-12-22, 15:05:59
First 40nm chip

The RV740 is ATI's first 40nm chip. From what we know, it should be already sampled, while the official launch should be later in 2009, probably Q2 2009.

The chip does have 256-bit memory support, and it does support GDDR5 memory, as well as GDDR3, and it is designed to sit between RV730 and RV770.

It should be close to RV770LE performance, so it will eventually replace Radeon HD4830 parts, and put more pressure of Geforce 9600GT. As far as we know, ATI should be the first with 40nm, while Nvidia will follow.
http://www.fudzilla.com/index.php?option=com_content&task=view&id=11052&Itemid=1

Fudo scheint sich sicher, wobei 256bit + GDDR5 eben nicht zur angeblichen RV770LE Performance passt.

AnarchX
2008-12-22, 15:35:04
Vielleicht doch 2x128-Bit auf 2 Dies, welche wie ein normales 256-Bit SI ohne Speicherredundanz arbeiten können? :D

RV740 vs GT216:
RV740 is a direct competitor to GT216: 512MiB 128-bit 1.8GHz+ GDDR5/16ROPs vs 768MiB 192-bit 1.2GHz GDDR3/12ROPs (and maybe 384MiB for OEMs?) - I don't know the TMU/ALU specs of either however, but ]RV730;RV770] and ]G94;GT200[ seems like a fair bet to me before considering clock speeds; the reason why I say GT200[ instead of G92] is that the absolute maximum I would be willing to seriously consider for GT216 is 32TMUs/160SPs.
http://forum.beyond3d.com/showpost.php?p=1250863&postcount=143

N1truX
2008-12-22, 22:37:34
Fudo scheint sich sicher, wobei 256bit + GDDR5 eben nicht zur angeblichen RV770LE Performance passt.
Hi w0mbat, lang nix mehr voneinander gehört ;)

Das mit den 256Bit halte ich auch für unwahrscheinlich, da man sonst ca. auf HD4850 Niveau wäre - Naja zumindest über HD4830. Was auch denkbar wäre, das sich da schon Gerüchte des RV830 o.ä. mit runtermischen - wir werden sehen.

Die restlichen Daten sind aber soweit Korrekt. Habe grad Infos bekommen und demnach gibt es ein RV740 Sample mit 1GiB 900MHz GDDR5 Speicher.

PS: Kann mir einer mal die Kernspannung von nem RV730 sagen?

KonKorT
2008-12-22, 23:57:07
Die Testmuster liefen zumindest mit 1,26 Volt.

N1truX
2008-12-23, 10:17:27
Die Testmuster liefen zumindest mit 1,26 Volt.
Ja das weiß ich auch, deswegen will ich ja den Vergleich zu einem RV730 wissen^^ Dann könnte man vllt. abschätzen ob 55 oder 40 nm.

Leonidas
2008-12-23, 14:07:40
Vielleicht ist an dieser Meldung doch mehr dran, wenn auch Fuad es nicht richtig deuten konnte:

http://www.fudzilla.com/index.php?option=com_content&task=view&id=11026&Itemid=1.


So ein Bla! Fudo begreift es immer noch nicht, daß man nicht an "Versionen von Chips" arbeitet. Ein Chip ist immer "ein" Ding. Grafikkarten haben Versionen, Chips nicht. Wenn der RV740 mit 256 Bit kommt, dann vollständig in 256 Bit und nicht in einen Versionen so und in anderen so.

Nebenbei reicht GDDR5 auf 1800 MHz doch dicke aus, um auch mit 128 Bit auf die Bandbreite einer 4830 zu kommen. Wozu zur Hölle dann 256 Bit? Es würde geradezu extrem nicht zu dem passen, was ATI in letzter in Punkte Speicherinterface gemacht hat (eher kleine Interface, dafür höhere Taktraten) und dürfte der Karte absolut nichts bringen. Und selbst wenn: Man baut eine Mainstream-Karte definitiv nicht so, daß sie auch HD-Auflösungen bringen kann - wo bleibe dann noch der Platz für HighEnd-Modelle?

GeneralHanno
2008-12-23, 16:21:53
ich hab mal ne frage bzg. ATis revisions politik:
man ließt fast immer von A11, A12 steppings. beginnt ATi bei A1 zu zählen, oder wie ich vermute bei A10 ? weis da jmd näheres?

w0mbat
2008-12-23, 16:24:13
A11 ist A1,1 und A12 ist A1,2 also beides weiterhin A1 Stepping.

deekey777
2008-12-23, 16:28:33
Die erste Zahl ist sehr wichtig. Hier das System dahinter:
http://www.beyond3d.com/content/reviews/27/11
One thing that can be noticed between the XT and XL boards is that the XL uses an R520 chip revision of A14 and the XT appears to have A15 - the first digit after the "A" represents the silicon revision, while the second signifies the metal layer revision number. Here we can see that the boards are using the same base silicon design, but different metal layers; we are also aware of an A23 revision which indicates that a different silicon revision is also out there. Evidently, when ATI thought they had identified the final issue with the R520 chip they sent three different revisions of, with different changes, to see which cures the problem best - the two chip revisions here represent just two different methods of fixing the issue, but ultimately once they have gone through these wafers just one revision is likely to remain as the production silicon
Hier R580:
http://www.beyond3d.com/content/reviews/2/5
-> A22FG
"R580+"
-> A31FG (die einen sagen wegen des GDDR4-Supports für die X1950XTX, die anderen sagen, die gab's schon länger)
Stellt euch vor: Beim R600 war die endgültige Revision A13 und wir warteten sehnsüchtig auf A15. Der RV670 blieb bei A11.

Gast
2008-12-23, 20:02:45
So ein Bla! Fudo begreift es immer noch nicht, daß man nicht an "Versionen von Chips" arbeitet. Ein Chip ist immer "ein" Ding. Grafikkarten haben Versionen, Chips nicht. Wenn der RV740 mit 256 Bit kommt, dann vollständig in 256 Bit und nicht in einen Versionen so und in anderen so.

Nebenbei reicht GDDR5 auf 1800 MHz doch dicke aus, um auch mit 128 Bit auf die Bandbreite einer 4830 zu kommen. Wozu zur Hölle dann 256 Bit? Es würde geradezu extrem nicht zu dem passen, was ATI in letzter in Punkte Speicherinterface gemacht hat (eher kleine Interface, dafür höhere Taktraten) und dürfte der Karte absolut nichts bringen. Und selbst wenn: Man baut eine Mainstream-Karte definitiv nicht so, daß sie auch HD-Auflösungen bringen kann - wo bleibe dann noch der Platz für HighEnd-Modelle?

Falls rv740 wirklich rv740 ist, fullack, 128bit, basta!

Aber was wenn nicht, was wenn AMD uns alle gefoppt hat? Seit der Übernahme ist die Informationspolitik eine andere, wesentlich intirgantere und undurchsichtigere. Wie war es beim rv770, wo wir bis wenige Tage vor erscheinen der Karte noch völlig falsch herumspekulierten?

Was ist, wenn AMD rv790 nun rv740 nennt um nvidia und uns alle zu foppen?

Dann, aber nur dann würde 256bit Sinn machen...

w0mbat
2008-12-23, 20:23:51
Dann passt der Name RV740 aber nicht mehr.

Vielleicht steht RV740 "nur" für RV700er Chip @ 40nm. Ich denke alleine vom Namen sollte man hier nicht viel ableiten.

Gast
2008-12-23, 20:37:02
naja, aber bei Ati (nicht bei Nvdia!) heißt größere zahl auch immer mehr transistoren, also RV770 > RV740 > RV730 > RV710

interessant ist aber die frage, ob ATi auch noch einen "RV790" oder ähnliches bringen wird.

ein RV770@40nm, mit 10-12 SIMD und mind. 80SP je SIMD. der RV870 soll ja frühestens Q4/09 kommen ...

Gast
2008-12-23, 20:49:51
ein chip im bereich des rv740 macht aber so oder so Sinn.

der rv730 ist etwas zu schwach für die 9600GT und der 9800GT kann man lediglich die 4830 entgegensetzen, die eine verschwendung des rv770 darstellt, der durch gute yields und redundante innere auslegung ruhig nur als rv770pro und rv770xt bleiben kann.
der rv770le könnte daher schon mal abgelöst werden imo.
Wenn ATI jetzt groß in 40nm einsteigt würde es mich wundern, wenn man nur rv770 verkleinert. wenn man sich schon mit 40nm beschäftigt wäre eben auch ein rv740 nötig um diese Lücke zu füllen, die für viele gamer gerade der sweet spot ist.

GeneralHanno
2008-12-23, 20:56:20
ein RV770 hat ja 16 Vec5 ALUs je SIMD und der RV730 hat 8 Vec5 ALUs je SIMD. wie ist da eigentlich der architektonische zusammenhang: vielfache von 2 ,4 , oder 8 ?

deekey777
2008-12-23, 21:26:33
An sich ist auch 12 möglich (siehe 2900GT), aber es wird ineffizient, da es sehr schwer sein wird, Wavefronts mit aktiven Quad-Threads voll zu kriegen.
http://ati.amd.com/technology/streamcomputing/Stream_Computing_User_Guide.pdf
Punkt 1.2.4: Thread creation

Da die Erstellung von Wavefronts an die Rasterisierung gekoppelt ist, haben die einzelnen SIMD-Engines "Lieblingsraster" (zB 8x8 beim RV670). Dabei sind 8x8-Raster einfach auf mehrere 8x4-Raster verteilbar (Vermutung: optimal für den RV630). Wenn man aber eine fiktive SIMD-Engine mit 12 Thread-Processors hätte: Was wäre dann die optimale Größe?

Spasstiger
2008-12-23, 21:36:02
ein RV770 hat ja 16 Vec5 ALUs je SIMD und der RV730 hat 8 Vec5 ALUs je SIMD. wie ist da eigentlich der architektonische zusammenhang: vielfache von 2 ,4 , oder 8 ?
Bei der RV7xx-Architektur verwendet man bislang stets mindestens 8 VEC5-ALUs pro SIMD-Einheit, wobei jeder SIMD-Einheit eine Textureinheit zugeordnet ist (mit je 4 TMUs).
Bei weniger als 8 VEC5-ALUs pro SIMD scheint das ALU-TMU-Verhältnis ungünstig zu werden, dann sind nämlich mehr TMUs als nötig vorhanden.
Beim RV7xx scheint also zu gelten: Mindestens 8 VEC5-ALUs pro SIMD.

Die RV6xx-Architektur war da noch anders ausgelegt. Dort waren die Textureinheiten nicht fest an die SIMDs gekoppelt, sondern man ordnete die Textureinheiten vielmehr senkrecht zu den SIMDs an, so dass eine Textureinheit jeweils vier VEC5-Einheiten von allen SIMDs zugeordnet war.
Beim RV6xx war also die Regel: Vielfache von 4 VEC5-ALUs pro SIMD.

Hier noch im Vergleich:
RV610 und RV630:
http://www.hardware.no/tester/skjermkort/ati_radeon_hd_2600_2400/radeon1.jpg

RV710
http://techreport.com/r.x/2008_9_30_AMD_intros_two_sub60_Radeon_HD_4000_cards/rv710.gif

deekey777
2008-12-23, 21:47:00
Man kann RV7x0 auch SIMDs mit je einem Quad bauen (hört bitte mit Vec5-Zeug auf).

davidzo
2008-12-24, 15:21:20
Ho Ho ho, we found some interesting news just before Santa came and visited us. Santa uses Fedex these days and even these guys are working only until 13.00 today.

Anyway we found out some info on a chip that we haven’t mentioned before. Its a mobile chip codenamed M97 and this is the first time we’ve seen it showing up in ATI plans. The chip has just been taped out and it currently runs at 500MHz.

We wouldn’t know how many Shaders and pipes this chip has but we suspect it has a tad less than M98.

We have a feeling that this is actually a 40nm RV740 sibling but its too early to confirm it. This would mean that summer notebooks might have some 40nm inside at minimal clock of 500MHz and GDDR3 memory that would run at 850MHz or faster.

We'll try to dig up some more info on this so stay put.

http://www.fudzilla.com/index.php?option=com_content&task=view&id=11097&Itemid=34

Auch wenn Fudo beim rv740 so einiges durcheinanderbekommen hat, vor allem beim speicherinterface und bei de rperformance, diese News hat wahrscheilich einen hohen Wahrheitsgehalt. Nicht nur kann Fudo den entsprechenden namen des Chips nennen, sondern nach alldem was wir von rv740 wissen macht ein solcher Schritt auch richtig Sinn.

Sieht so aus, als wenn AMD wirklich die kluge Route eingeschlagen hat, die rv7x0 mobilchips erst in 40nm zu bringen. Wenn man mit dem derzeitigen Vorsprung vor nvidia in der Prozesstechnologie und performance/watt (bei den niedrigeren chips, nicht im highend) auch den Mobile-Bereich erobert, scheint mir nur logisch. Denn Nvidia hat da derzeit noch sehr gute Marktanteile und wie wir alle Wissen ist der Mobilebreich von nicht zu unterschätzender Größe und mit sehr guten Margen. M97 ist ein selektierter rv740, den AMD für ein vielfaches loswerden kann als den Desktopchip.
Das M97 nur kurz nach dem desktop rv740 sein tape-out hat bedeutet, dass der Prozess gut funktioniert und die Yields entsprechend gut sind, dass man bereits jetzt mit dem selektieren von lowpower Chips anfangen kann.

Freuen würde ich mich über einen untertakteten untervolteten GDDR5 auf der Karte. Aber da es das ja herstellerspezifisch noch nicht wirklich gibt, denke ich, dass meine hoffnungen enttäuscht werden und es sich um lahmen lowpoer GDDR3 handelt. Dabei müsste GDDR5 bei gleicher Bandbreite doch deutlich weniger Strom verbrauchen... :(

Leistung einer 4830 bei der TDP einer 4670, das wärs (8/20/45W idl/2D/3D).
500mhz Chiptakt klingt schonmal nicht schlecht, das Teil scheint also wirklich auf normale dünne 14-15" Geräte zugeschnitten sein, nicht wie die anderen Chips in der Leistungsklasse auf dicke 17" Monster ohne nennenswerte Akkulaufzeit.

Leonidas
2008-12-24, 17:32:40
Der Punkt ist aber, daß weder ATI noch NV extra Mobile-Chips auflegen. Es kommt da *ein* RV740 aus der Produktion - und ob der danach für Desktop oder Mobile benutzt wird, wird eben erst danach festgelegt. ATI gibt den Mobile-Dingern zwar extra Codenamen, aber produktionstechnisch ist das alles dasselbe.


Vermutlich ist der von Fudzilla genannte Mobile-Chip der RV740.

davidzo
2008-12-24, 23:01:30
Der Punkt ist aber, daß weder ATI noch NV extra Mobile-Chips auflegen. Es kommt da *ein* RV740 aus der Produktion - und ob der danach für Desktop oder Mobile benutzt wird, wird eben erst danach festgelegt. ATI gibt den Mobile-Dingern zwar extra Codenamen, aber produktionstechnisch ist das alles dasselbe.


Vermutlich ist der von Fudzilla genannte Mobile-Chip der RV740.

Achnee, genau das steht doch da auch im Text, sowohl von Fudo als auch in meinem.
AFAIK hat es bisher weder von nv noch von ATI reine Mobilchips gegeben, dass waren immer etwas niedriger getaktete ausgesuchte Desktopchips. Meistens hat es dafür aber dann noch ein neues Stepping gegeben und manchmal ein etwas anderes package (ohne shim z.B.), aber prinzipiell ist der Chip natürlich identisch mit dem Desktopderivat.

Frohe Weihnachten!

Nachdem iSupply den PCmarkt 2008 noch 50/50 auf Desktops und Notebooks verteilt, soll es 2009 bereits anders aussehen.
Da kommt vielmehr die Frage auf, ob denn rv740 wirklich ein Desktopchip ist oder nicht ein von M97 abgezweigter Chip ist. Also das RV770 Erfolgskonzept auf den mobilen Markt optimiert, ein Nebenprodukt ist dann ein neuer 40nm mainstreamchip für den Desktop. Natürlich ist es ein und derselbe Chip, für die Produktion sind das aber schon unterschiedliche Sachen, da sie sich so stark qualitativ unterscheiden, dass man für die mobilvariante einen gepfefferten Aufpreis verlangen kann. Dafür dass es ein und derselbe Chip ist sind die Stromunterschiede dann doch relativ groß, was die andere Namensgebung dann afaik auch völlig rechtfertigt.

deekey777
2008-12-25, 14:21:00
M98, ATI 4850 512M DDR3 listed (http://www.fudzilla.com/index.php?option=com_content&task=view&id=11108&Itemid=1)
The sharp eye of a reader has noticed that the M98, the DDR3 version of ATI's latest mobile GPU is already out and that it might ship in January time.

MSI GT725-074US is the first notebook that we are aware of to feature ATI's new Mobility Radeon HD4850 mobile chip.

The 4850 in the names comes as the chip uses DDR3 memory, while the DDR5 one would be HD4870 and this should launch roughly at the same time.

Das ist der Punkt, der mich misstrauisch macht. Denn es gibt einen Desktop-Grafikchip von ATi, der DDR3 verwendet: RV730 (auf der HD4670). Und auf der anderen Seite bedeutet die gleiche Bezeichnung der Grafikkarte (hier HD4850) nicht, dass die Mobile-Version der Desktopversion entspricht (bestes Beispiel ist die M9700pro).

reunion
2008-12-25, 14:45:34
FUAD weiß doch wohl gar nicht was der Unterschied zwischen DDR3 und GDDR3 ist, denn er schreibt auch DDR5, den es definitiv in nächster Zeit nicht gibt. GDDR5-Support hingegen deutet zweifelsfrei auf RV770 hin.

deekey777
2008-12-25, 14:53:25
FUAD weiß doch wohl gar nicht was der Unterschied zwischen DDR3 und GDDR3 ist, denn er schreibt auch DDR5, den es definitiv in nächster Zeit nicht gibt.
Moment: Das dachte ich auch.
Auf der Homepage von MSI steht auch DDR3. (Vielleicht hat es ihm auch dazu verleitet, DDR5 zu schreiben)

Es wäre nicht undenkbar, dass die Mobilty HD4850 ein RV770LE ist (also HD4830 und niedrigerer Takt), was ein Kompromiss zwischen Wärmeentwicklung (auf den Verbrauch kommt es bei solchen Geräten eher nicht an) und Kühllösung. Aber aus welchen Gründen schreibt MSI dann DDR3? Vielleicht beherrscht der RV770 auch DDR3 (warum eigentlich nicht? man kann damit den Preis ja drücken).

Nakai
2008-12-25, 15:01:48
Auf der Homepage von MSI steht auch DDR3. (Vielleicht hat es ihm auch dazu verleitet, DDR5 zu schreiben)

Wollte AMD nichtmal DDR3 statt GDDR3 einführen?


mfg Nakai

davidzo
2008-12-25, 16:05:24
M98 = rv770m A12 (xt=GDDR5 700mhz lp von quimonda) (pro=lpGDDR3)
M97 = rv740m GDDR5/3 ??? vermutlich wie M98 nur eben 128bit.


Wollte AMD nichtmal DDR3 statt GDDR3 einführen?


mfg Nakai
für rv730 war das mal im Gespräch. derzeit ist DDR2 aber einfach noch soviel billiger und GDDR3 ist nunmal deutlich besser. Für billige SKUs greift man halt zu DDR2, für teurere dann gleich zu GDDR3, DDR3 hat dazwischen kaum eine Berechtigung. rv730 wird mit rv740 vor der tür aber ja auch so ziemlich bald in der Versenkung verschwinden, bevor es solche karten geben wird. Sobald DDR3 mainstream ist und Preise wie derzeit DDR2 erreicht wird AMD den dann paraten lowcostchip ausstatten, ich Tippe mal auf rv810 oder rv720 (40nm rv710)



EDIT: Es ist so wie ich bereits vermutete, dass ATIs 40nm Lineup insbesondere auf Notebooks abziehlt. D.H. die Desktopchips sind eher überbleibsel aus einer Entwicklung von neuen stromsparenden mobilchips.

READ:
M92 = rv710m
M93 = rv720m (rv710 40nm + ??)
We know that ATI plans to release M92, which should be branded Mobility Radeon, 4500 and after that comes a new chip, codenamed M93.

We have some limited information, but we do know that this chip works at 550MHz core speed in its early A11 revision and that it works with GDDR3 memory that can work at 750MHz.

It looks that ATI has a very strong line up for 2009, at least when it comes to the mobile market, and these chips, due to their 55 and even 40nm production process will have many thermal advantages. We are not sure if you can plug a GT200 in a notebook, as this baby tends to get very hot, but with 55nm shift, Nvidia might have a chance to get the mobile performance crown.

M93 is around the corner and if we look in our crystal ball we can estimate that you should see notebooks based on it by middle of the year.
http://www.fudzilla.com/index.php?option=com_content&task=view&id=11109&Itemid=34

passt aber nicht damit zusammen, dass man bisher rv710 für M94 gehalten hat. Naja aber das waren ja auch nur Gerüchte. Fudo scheint da derzeit eine gesprächige und gute Quelle gefunden zu haben. Na mal sehen für was das Bier noch alles ausreicht, wird zeit dass die gesamte 40nm Roadmap von AMD auffliegt.

Es wäre nicht undenkbar, dass die Mobilty HD4850 ein RV770LE ist (also HD4830 und niedrigerer Takt), was ein Kompromiss zwischen Wärmeentwicklung (auf den Verbrauch kommt es bei solchen Geräten eher nicht an) und Kühllösung.
Verbrauch und Wärmeentwicklung sind dasselbe, bei gleicher Kühllösung. Alles was reingeht muss auch wieder raus, so ist das nunmal.

w0mbat
2008-12-25, 18:04:00
[...]
passt aber nicht damit zusammen, dass man bisher rv710 für M94 gehalten hat. Naja aber das waren ja auch nur Gerüchte. Fudo scheint da derzeit eine gesprächige und gute Quelle gefunden zu haben. Na mal sehen für was das Bier noch alles ausreicht, wird zeit dass die gesamte 40nm Roadmap von AMD auffliegt.

Danke :tongue:

Gast
2008-12-27, 16:57:26
Auf AMD.com kann man beim Grafiktreiber-Download jetzt die "Radeon 4675-Serie" wählen. RV740?

-ANON

w0mbat
2008-12-27, 17:13:01
Hm, das wäre komisch wenn die aktuellen Gerüchte auf den RV740 zutreffen, dann wäre mit min. HD47xx zu rechnen. Könnte zB eine schnellere RV730 Version sein.

Oder RV740 ist eben wirklich nur ein geshrinkter RV730 mit 64bit SI + GDDR5...

Nur ein Schreibfehler und auch nur bei Vista64. Ist dort schon seit Mitte Oktober.

Captain Future
2008-12-28, 10:01:17
Man kann RV7x0 auch SIMDs mit je einem Quad bauen (hört bitte mit Vec5-Zeug auf).
Warum? Das ist doch was, was sogar in deinem Link weiter oben steht. Jeder Thread Processor besteht aus 5 ALUs, also Vec5.

Captain Future
2008-12-28, 10:13:02
An sich ist auch 12 möglich (siehe 2900GT), aber es wird ineffizient, da es sehr schwer sein wird, Wavefronts mit aktiven Quad-Threads voll zu kriegen.
http://ati.amd.com/technology/streamcomputing/Stream_Computing_User_Guide.pdf
Punkt 1.2.4: Thread creation

Da die Erstellung von Wavefronts an die Rasterisierung gekoppelt ist, haben die einzelnen SIMD-Engines "Lieblingsraster" (zB 8x8 beim RV670). Dabei sind 8x8-Raster einfach auf mehrere 8x4-Raster verteilbar (Vermutung: optimal für den RV630). Wenn man aber eine fiktive SIMD-Engine mit 12 Thread-Processors hätte: Was wäre dann die optimale Größe?
Wie ich das verstehe, wir bei 12 einfach die Ausführungsdauer um ein drittel höher, da ja weiterhin Quads auf die SIMDs gemapped werden. Problematisch wird es wohl erst, wenn du keiner 4er-Vielfachen (oder 2 bzw. 1) hast.

deekey777
2008-12-28, 13:41:31
Warum? Das ist doch was, was sogar in deinem Link weiter oben steht. Jeder Thread Processor besteht aus 5 ALUs, also Vec5.
Was bedeutet Vec5 und was bedeutet VLIW?

Und da es noch ein "SIMD" ist

CrazyIvan
2009-01-01, 14:53:04
Laut Hardware-Infos besitzt der RV770 900 Streamprozessoren, von denen derzeit aber nur 800 freigeschalten sind. Somit könnte AMD sehr kurzfristig die Leistung anheben, ohne das ganze Brimborium eines Refresh-Chips.

Quelle:
http://www.hardware-infos.com/news.php?news=2597

deekey777
2009-01-01, 15:06:25
Laut Hardware-Infos besitzt der RV770 900 Streamprozessoren, von denen derzeit aber nur 800 freigeschalten sind. Somit könnte AMD sehr kurzfristig die Leistung anheben, ohne das ganze Brimborium eines Refresh-Chips.

Quelle:
http://www.hardware-infos.com/news.php?news=2597
aallllllltttt (einfach nach 900 in diesem Thread suchen).
So oder so: Nein. Und die Schlussfolgerungen aus der News kommen mir sehr bekannt vor.

GeneralHanno
2009-01-01, 15:07:25
die ganze geschichte mit den 900SP ist doch hier schon vor wochen diskutiert worden ;)

CrazyIvan
2009-01-01, 16:30:17
Oh, das hatte ich dann wohl überlesen. Allerdings bringt mir die Suche sowohl dieses als auch des anderen Threads keine relevanten Ergebnisse. Kann mich vielleicht jemand mit einem Link beglücken - scheine jahreswechselbedingt zu blöd zum suchen zu sein ;)

/Edit:
Ha, gerade doch noch gefunden ;)

AnarchX
2009-01-07, 08:50:46
Laut Chiphell kommen wohl RV740 und RV790 im März. (http://translate.google.ch/translate?u=http%3A%2F%2Fbbs.chiphell.com%2Fviewthread.php%3Ftid%3D37831%26extra %3Dpage%253D1&sl=zh-CN&tl=en&hl=de&ie=UTF-8)

Schlammsau
2009-01-07, 09:06:47
Laut Chiphell kommen wohl RV740 und RV790 im März. (http://translate.google.ch/translate?u=http%3A%2F%2Fbbs.chiphell.com%2Fviewthread.php%3Ftid%3D37831%26extra %3Dpage%253D1&sl=zh-CN&tl=en&hl=de&ie=UTF-8)

Das sind doch mal gute News! :)

KonKorT
2009-01-07, 12:37:52
Ob man auf dieses Forenposting bauen kann? RV740 hatte ich auch in etwa in dem Zeitfenster auf der Rechnung, aber RV790 hatte ich für tot geglaubt. Nunja, wenn RV870 wirklich erst in Q4 kommen sollte, wovon ich aber nicht ausgehe, wäre das plausibel, dass man jetzt den RV790 nachschiebt.

derguru
2009-01-07, 14:07:40
die rv790 wird wohl dann gegen die 285gtx antreten,bei der 260gtx hat sich ja in der performance nichts getan.ich glaub die lassen die multi gpu karte diesmal weg,kommt halt drauf an wie groß die zeitspanne zum rv870 ist.

KonKorT
2009-01-07, 14:24:09
Vielleicht tritt hier ja die schon lange spekulierte Lösung mit 960 SPs und 48 TMUs an, also einfach zwölf statt zehn SIMD-Blöcke.
Das wäre in 40 nm in jedem Fall deutlich unter 200 sqmm zu managen.

Spasstiger
2009-01-07, 14:45:32
die rv790 wird wohl dann gegen die 285gtx antreten,bei der 260gtx hat sich ja in der performance nichts getan.ich glaub die lassen die multi gpu karte diesmal weg,kommt halt drauf an groß die die zeitspanne zum rv870 ist.
Nvidia wird auf jeden Fall alles daran setzen, den GT212 entgegenstellen zu können. Der GT200 ist auch in 55 nm ein teurer Monsterchip, mit dem man nur widerwillig gegen den RV770/RV790 antritt.

w0mbat
2009-01-07, 14:53:25
Wenn der RV740 wirklich 8 SIMDs, also 640SPs/32TMUs hat, wären dann 12 SIMDs (960SPs/48TMUs) für den RV790 nicht etwas wenig? Aktuell RV730 (320/32) -> RV770 (800/40).

reunion
2009-01-07, 15:03:25
Ich denke auch das RV790 wesentlich mehr hat, wenn man sich mal die Vergangenheit ansieht. Die 205mm²@40nm scheinen zu stimmen, RV740 wird mit den 32TMus/640ALUs in 40nm aber wenn überhaupt nur knapp über 100mm² liegen. Ich erwarte mindestens 64TMUs/1280ALUs, wenn es nicht zu anderen grundlegenden Änderungen kommt.

Gast
2009-01-07, 15:03:50
ich finde einen doppelten rv740 mit 1280SPs wäre doch nett.^^ Würde so was gehen?

Nakai
2009-01-07, 15:13:55
Naja wie wärs mit 8 SIMDS beim RV740 und 16 SIMDs beim RV790?
Und dann das gleiche TMU:Shader-Verhältnis wie beim RV730?

Damit wäre ein RV790 bei 128 TMUs. Würde ATI nur noch die Filteroptimierungen ausschalten, dann wärs perfekt. Genug Texturleistung hat man ja bei weitem.


mfg Nakai

€: Sieht für mich so aus, als wolle ATI die 2 Teraflop-Marke pro Chip sprengen. Evtl mit einer Singelkarte sogar 4TFlop erreichen.

KonKorT
2009-01-07, 15:16:25
Ja, sollte kein Problem sein. Ist nur fraglich, ob sich soetwas AMD nicht für den RV870 aufbehält, den ich immer noch für diesen Sommer auf der Rechnung hat.

Es ist allerdings nicht abzustreiten, dass AMD rund 1280 SPs nach jetziger Funktionalität benötigte, um wieder gut mit dem "kleinen" GT212 (320 SPs, 80 TMUs, 256 Bit?) zu duellieren.

Spasstiger
2009-01-07, 15:19:24
Einen doppelten RV740 erwarte ich nicht. 12 Cluster klingen eigentlich ganz vernünftig, das Ganze kombiniert mit höheren Taktraten. Für den RV870 muss man sich ja auch noch was aufheben und der wird ebenso in 40 nm gefertigt. D.h. mit mehr Leistung muss der RV870 zwangsläufig größer werden zumal ja auch Direct3D 11 implementiert werden will.

Nakai
2009-01-07, 15:20:14
Es ist allerdings nicht abzustreiten, dass AMD rund 1280 SPs nach jetziger Funktionalität benötigte, um wieder gut mit dem "kleinen" GT212 (320 SPs, 80 TMUs, 256 Bit?) zu duellieren.

ATI würde bei einem perfekten Dieshrink auf 40nm die Größe des RV770 halbieren. Eine Verdopplung der Einheiten wäre somit kein Problem, man würde um die 200mm² sich bewegen. Und das mit 1600SPs.
Ergo würde man eher mit einer GTX295 konkurrieren.


mfg Nakai

derguru
2009-01-07, 15:23:39
Nvidia wird auf jeden Fall alles daran setzen, den GT212 entgegenstellen zu können. Der GT200 ist auch in 55 nm ein teurer Monsterchip, mit dem man nur widerwillig gegen den RV770/RV790 antritt.
klar wird NV alles dran setzen den GT212 raus zubringen aber ich glaub zeitlich wird das nichts.schaumal wie lange die für den 55nm gebraucht haben,der sollte eigentlich im herbst kommen.zur zeit hat in der hinsicht AMD die nase vorn was fertigung angeht.die werden ja nicht überspitzt gesagt seit dem august wo der 4870x² raus kam geschlafen haben.AMD hat viel mehr zeit gehabt,das ist ja schon knapp ein halbes jahr.

LovesuckZ
2009-01-07, 15:32:05
Verspätungen von Chips haben keine Auswirkungen auf folgende. Soviel sollte die Vergangenheit gelehrt haben.

AnarchX
2009-01-07, 15:39:09
Wer sagt denn, dass RV790 in 40nm gefertigt wird?

Sofern in Napoleon @ Chiphell verstanden habe, wird das wohl vorerst nur RV740, der als Testbasis für RV870 dient.

RV790 wird wohl ein 55nm Chip sein, RV770 hat lau CH immerhin ein Yield von 90%. Entweder man erhöht die Taktraten oder man fügt vielleicht doch noch ein paar SIMDs hinzu und wirft den Crossfire-Port raus.

w0mbat
2009-01-07, 15:47:21
Das komische ist eben, dass es bis jetzt noch keinerlei Anzeichen für den RV790 gibt. Der RV740 taucht schon seit einer Weile auf.

Wie groß wäre ein 55nm RV790 mit 12 SIMDs?

derguru
2009-01-07, 15:50:03
Wer sagt denn, dass RV790 in 40nm gefertigt wird?

Sofern in Napoleon @ Chiphell verstanden habe, wird das wohl vorerst nur RV740, der als Testbasis für RV870 dient.

RV790 wird wohl ein 55nm Chip sein, RV770 hat lau CH immerhin ein Yield von 90%. Entweder man erhöht die Taktraten oder man fügt vielleicht doch noch ein paar SIMDs hinzu und wirft den Crossfire-Port raus.

wenn es so wäre wie du sagst dann wäre der RV790 schon jetzt raus gekommen.warum sollten die bis märz warten?kann ich mir nicht vorstellen.naja werden sicherlich bald mehr infos auftauchen.

Sorkalm
2009-01-07, 15:59:18
Und wenn RV790 2x RV740 ist? Dann hat man auch seine 64 TMUs / 1280 SPs. X-D

Gut 200 mm² klängen dann auch gar nicht so schlecht.

reunion
2009-01-07, 16:24:05
Einen doppelten RV740 erwarte ich nicht. 12 Cluster klingen eigentlich ganz vernünftig, das Ganze kombiniert mit höheren Taktraten. Für den RV870 muss man sich ja auch noch was aufheben und der wird ebenso in 40 nm gefertigt. D.h. mit mehr Leistung muss der RV870 zwangsläufig größer werden zumal ja auch Direct3D 11 implementiert werden will.

Ein doppelter RV740 hat in 40nm maximal 200mm², und das ist schon pessimistisch geschätzt. Da wäre noch mehr als genug Spielraum für RV870.

Wer sagt denn, dass RV790 in 40nm gefertigt wird?


Die Logik. Wer 2009 konkurrenzfähig sein will benötigt 40nm. Die Vorteile sind zu groß um darauf verzichten zu können. Performance/Watt wird immer wichtiger und bei den High-End-Monstern limitiert längst die TDP eine höhere Leistung. Auch NV hat deshalb nicht ohne Grund den sehr konservativen Weg in der Vergangenheit verlassen und wird 40nm wohl fast zeitgleich mit AMD einführen. Zumal gerade AMD für ihre riskante Strategie was neue Fertigungsprozesse betrifft bekannt ist. Nach einem RV740 in 40nm wird man wohl kaum noch eine RV790 in 55nm nachschieben.

aylano
2009-01-07, 16:30:16
Und wenn RV790 2x RV740 ist? Dann hat man auch seine 64 TMUs / 1280 SPs.
So kann man es nicht vergleichen.
Denn je größer der Chip ist, desto mehr Shader pro mm² hat er.
ala
710 ... 1 pro mm²
730 ... 2 pro mm²
770 ... 3 pro mm²

Keine Ahnung warum, aber vielleicht wegen UVD 2.0.

RV790 wird wohl ein 55nm Chip sein, RV770 hat lau CH immerhin ein Yield von 90%. Entweder man erhöht die Taktraten oder man fügt vielleicht doch noch ein paar SIMDs hinzu und wirft den Crossfire-Port raus.
Es ist völlig unlögisch, warum der dann erst März und nicht beim GTX285-Start kommen soll.

100mm² & 200 mm² sind schon fast Low-End & mainstream Größen und diese oft gleichzeitig in neue Fertigungen geführt.

Mit 200mm² hatte ich schon immer auf 1600mm² geschätzt. Und wenn der rV740 doppelt soviele Shader hat, warum auch nicht der RV790.

reunion
2009-01-07, 16:32:30
So kann man es nicht vergleichen.
Denn je größer der Chip ist, desto mehr Shader pro mm² hat er.
ala
710 ... 1 pro mm²
730 ... 2 pro mm²
770 ... 3 pro mm²

Keine Ahnung warum, aber vielleicht wegen UVD 2.0.


Ganz einfach: Weil Dinge wie der 2D-Kern und sonstiges nicht oder nicht um selben Umfang mitskaliert werden müssen. Die ALUs/TMUs machen bei RV770 bsw. nur gut 50% der Die-Fläche aus. Deshalb kann ich deren Anzahl verdoppeln und habe trotzdem nur ein 50% größeres Die. Die Effizienz steigt mit der Die-Größe.

Sorkalm
2009-01-07, 16:36:35
So kann man es nicht vergleichen.
Denn je größer der Chip ist, desto mehr Shader pro mm² hat er.

Da hast du meinen (zugegebenermaßen nicht sonderlich realistische) Idee nicht verstanden. Ich sprach wirklich von zwei RV740-Dice in einem RV790. :biggrin: ;)

reunion
2009-01-07, 17:04:57
MSI stellt Notebooks mit Mobility Radeon 4850 und Mobility Radeon 4670 vor:
http://global.msi.com.tw/index.php?func=newsdesc&news_no=713
http://global.msi.com.tw/index.php?func=proddesc&maincat_no=135&cat2_no=271&prod_no=1713
http://global.msi.com.tw/index.php?func=newsdesc&news_no=712

SavageX
2009-01-07, 20:53:54
Dinge wie der 2D-Kern und sonstiges

Gibt es in modernen Designs nicht mehr, läuft alles über die 3D-Funktionseinheiten.

(Ein Hauptgrund, warum z.B. bis jetzt freie Treiber für den R600 und aufwärts bis jetzt keine 2D-Beschleunigung haben: Ohne vorher die 3D-Engine initialisiert zu haben geht schlicht nichts mehr.)

Nur 'ne kleine Anmerkung am Rande =)

Coda
2009-01-07, 22:53:11
Gibt es in modernen Designs nicht mehr, läuft alles über die 3D-Funktionseinheiten.
Gibt's dafür auch eine Quelle? Ich weiß nicht ob das so viel Sinn macht, weil man dann die komplette DOS-Kompatibilität brechen müsste inkl. Standard-VGA-Treiber von Windows, VESA etc.

Ich glaube das nicht so ganz.

deekey777
2009-01-08, 01:14:00
Ich finde die ursprüngliche Aussage nicht mehr (ich weiß nichteinmal, ob sie hier oder im B3DF zu finden ist, aber CarstenS ist da involviert): Es ging um die Frage, on der R600 Einheiten für die 2D-Beschleunigung hat, und das wurde verneint, denn diese Aufgabe übernehmen die "3D-Einheiten", indem in die "3D-Calls" übersetzt wird.

Oder auch nicht.

Coda
2009-01-08, 01:31:38
Gut. Möglich wäre das schon, nur dann hätten sie echt Legacy-Kompatibilität geopfert und würden für alte Sachen nur noch einen reinen Framebuffer anbieten.

reunion
2009-01-09, 07:57:26
ATi präsentiert Mobility Radeon HD 4000: http://www.computerbase.de/news/hardware/grafikkarten/ati/2009/januar/ati_mobility_radeon_hd_4000/

Diese setzt sich ähnlich wie die Desktop-Pendants aus einer Radeon-HD-4800-, Radeon-HD-4600-, Radeon-HD-4500- sowie einer Radeon-HD-4300-Reihe zusammen. Bezüglich der Features gibt es keine Unterschiede zwischen den Mobility- sowie den Desktop-Karten, einzig die Stromsparmechanismen wurden weiter verfeinert. Selbst die Anzahl der Shadereinheiten etc. sind identisch geblieben, einzig bei den Taktraten und teilweise den Modellen gibt es Unterschiede. Darüber hinaus kann die Mobility-Fraktion den 7.1-Audiosound auch über einen DisplayPort-Anschluss ausgeben – bei den Desktop-Karten ist das nur über HDMI möglich. Die Mobility-Radeon-HD-4000-Module entsprechen allesamt dem MXM-Standard.

Spasstiger
2009-01-09, 08:25:48
800 SPs und GDDR5 im Notebook, da bin ich mal auf die Leistungsaufnahme gespannt. Hängt natürlich stark von den Taktraten ab, wenn AMD die auf 75% des Dektopniveaus senkt, kommt man auch mit deutlich weniger Spannung aus und hat immer noch mit Abstand die Leistungskrone.

Tarkin
2009-01-09, 08:26:18
ATi präsentiert Mobility Radeon HD 4000: http://www.computerbase.de/news/hardware/grafikkarten/ati/2009/januar/ati_mobility_radeon_hd_4000/

sehr feines Line-up :)

Schön, dass man sich bei AMD jetzt auch wieder verstärkt dem mobilen Bereich zuwendet!

reunion
2009-01-09, 08:51:26
sehr feines Line-up :)

Schön, dass man sich bei AMD jetzt auch wieder verstärkt dem mobilen Bereich zuwendet!

Das ist auch dringend nötig nachdem man aus dem IPG-Bereich für Intel-CPUs ausgestiegen ist.

AnarchX
2009-01-09, 08:58:27
2. Requires dual ATI Mobility Radeon™ HD 4870 or ATI Mobility Radeon™ HD 4850 graphics processors with ATI CrossFireX™technology to break the one teraflop barrier for single precision performance.

3. The ATI Mobility Radeon™ HD 4870 (680e/700m GDDR5, 1GB) has up to 1.8x faster performance over ATI Mobility Radeon™ HD 3870 (660e/850m GDDR3, 512MB). Performance measurements based on Puma reference platform (780 mobile), 2.4GHz Turion™ Ultra CPU, 2GB DDR-2 Ram, Windows Vista Ultimate 32-bit SP1, ATI Driver: 8.53 RC3.

7. The ATI Mobility Radeon™ HD 4870 (550e/700m, GDDR3, 1GB) delivers more than 60% performance per watt improvement over the ATI Mobility Radeon™ HD 3870: Performance measurements based on 3DMark Vantage (P) scores – on Puma platform, Turion™ Ultra 2.4 GHz, 2GB DDR2-800, Windows Vista SP1 32-bit.

http://www.finanzen.net/nachricht/AMD_Launches_ATI_Mobility_Radeon_HD_4000_Series_Graphics_for_Notebooks_Deliverin g_Up_to_Twice_the_Gaming_Performance_of_Previous_Generation1_830630

Leicht undurchsichtiger Pressrelease. :|

Imo könnte es wohl so sein:
- HD 4850 (550e/700m, GDDR3, 1GB)
- HD 4870 (680e/700m GDDR5, 1GB)
- Requires dual ATI Mobility Radeon™ HD 4850 or ATI Mobility Radeon™ HD 4870 graphics processors with ATI CrossFireX™technology to break the one teraflop barrier for single precision performance.

So würde es doch deutlich mehr Sinn machen, wobei 680MHz doch ziemlich heftig für eine Notebookvariante wäre.

reunion
2009-01-09, 09:03:09
Naja, man könnte genau so gut die 4870 mit der 4850 verwechselt haben, da hier explizit von GDDR3/GDDR5 gesprochen wird.

Spasstiger
2009-01-09, 09:13:55
Naja, man könnte genau so gut die 4870 mit der 4850 verwechselt haben, da hier explizit von GDDR3/GDDR5 gesprochen wird.
Vermute ich auch.
Einfach ein Tippfehler, kann auch bei einer Pressemitteilung mal passieren.

Auf jeden Fall sind die Taktraten damit gar nicht mal so niedrig wie ich gedacht hätte, 9% weniger Chiptakt und 22% weniger Speichertakt bei der HD 4870.

KonKorT
2009-01-09, 15:04:07
Wie ist das mit der Mobility HD 4750? Die wird in der Pressemitteilung auch geführt, aber ohne nähere Angaben. Bei Computerbase taucht sie beispielsweise gar nicht auf.

Gast
2009-01-09, 22:17:11
Die Pressemitteilung erwähnt nirgends eine 4850, also wohl doch kein Tippfehler.

http://www.amd.com/us-en/Corporate/VirtualPressRoom/0,,51_104_543_15944~129750,00.html

Sorkalm
2009-01-11, 00:17:54
Zumindest GDDR4 scheint der Speichercontroller des RV730 zu unterstützen, denn Sapphire will in den nächsten 2 Wochen eine HD 4670 mit GDDR4 auf den (US-) Markt gebracht haben:
http://www.computerbase.de/news/hardware/grafikkarten/ati/2009/januar/sapphire_hd_4670_gddr4-speicher/

Insgesamt aber wohl eher als Lagerräumungsaktion des 3870-Speichers zu betrachten, denn man kommt auf gerade mal 1100 MHz Speichertakt - toll, das kriegt man auch mit GDDR3 hin. ;D

KonKorT
2009-01-11, 15:25:28
RV740 und RV790 also wohl im März 2009. Zur Cebit?

Jedenfalls auch RV790 in 40 nm. Das lässt Handlungsspielraum für die Anzahl der SPs. :)


AMD RV790 und RV740 ab März 2009 in 40 nm (http://www.hardware-infos.com/news.php?news=2649)

LovesuckZ
2009-01-11, 15:27:54
Ist es vielleicht möglich, dass du nicht dauernd Werbung für deine Seite und deine Spekulationen machst?

KonKorT
2009-01-11, 15:52:11
Zum einen betrachte ich das nicht als Werbung für meine Seite - stände es woanders, würde ich gerne dorthin verlinken - und zum anderen sind es nicht meine persönlichen Spekulationen.

horn 12
2009-01-11, 16:03:43
Also vielleicht doch ein Doppelter RV740 mit halt mehr Takt, dann könnte gar die GTX 295 angegriffen werden, bei nicht mal einer Dual GPU Karte in diesem Sinne... :eek:

Der_Korken
2009-01-11, 16:25:32
Wenn der RV790 tatsächlich in 40nm gefertigt wird und weiterhin auf GDDR5@256bit setzen will, kann man durchaus damit rechnen, dass die Anzahl der Einheiten deutlich erhöht wurde. Keiner weiß zwar genau, wieviel Die-Size man für ein 256-bit Speicherinterface braucht, aber nachdem was ATI zum RV770 gesagt hat, wird der Chip wohl kaum kleiner als 200mm² sein können. 16 SIMDs mit 1280 ALUs und 64 TMUs sind durchaus möglich. Fraglich ist nur, wie gut das Design mit so vielen ALUs noch skaliert. Der RV770 konnte bei 150% Einheitenzuwachs gerademal 100% mehr Leistung pro Einheit erzielen.

KonKorT
2009-01-11, 16:29:25
16 SIMDs klingen gut und dann bitte auch noch 8 ROPs pro 64-Bit-Controller. Sollte alles in allem in unter 250 mm² machbar sein.

Fetza
2009-01-13, 03:39:50
16 SIMDs klingen gut und dann bitte auch noch 8 ROPs pro 64-Bit-Controller. Sollte alles in allem in unter 250 mm² machbar sein.

Müsste so ein chip nicht unterm strich deutlich schneller als eine gtx 285 sein?

Gast
2009-01-13, 11:44:28
Wenn man die Größe eines RV 770 mit einem Shrink fast halbiert werd ich mehr als 960 Alus brauchen um wieder an die Mindesgröße von ca. 250mm^2 zu kommen. Wenn man bedenkt dass die ALUs samt den TMUs nur etwas 53% eines Chips beim RV 770 ausrechnen, dann müsste man ja wenn man den Chip um fast die Hälfte kleiner macht die Alus samt TMUs und TAUs min. verdrefachen, wenn ich jetzt richtig gerechnet habe, um in etwa wieder auf die Größe zu kommen die der RV 770 hat.
Ich würde daher auf folgende Specs tippen :

2000 ALUs
100 TMUs
32 Rops.
256 bit SI mit GDDR5

Gast
2009-01-13, 11:51:18
ich glaub da eher an 2 ~120mm2 chips, mit 128bit interface

Spasstiger
2009-01-13, 12:10:44
Müsste so ein chip nicht unterm strich deutlich schneller als eine gtx 285 sein?
Ja, mit diesen Specs auf jeden Fall. Aber NV kontert ja mit dem GT212, das könnte wieder ein spannendes Duell geben.

Der_Korken
2009-01-13, 13:20:33
Ich würde daher auf folgende Specs tippen :

2000 ALUs
100 TMUs
32 Rops.
256 bit SI mit GDDR5

Das halte ich für Unsinn. Ich glaube kaum, dass die Architektur mit so vielen Shadern noch was anfangen kann. 16 SIMDs find ich schon sehr wahrscheinlich, mehr ALUs aber nicht.

Gast
2009-01-13, 13:32:32
Es macht auch keinen Sinn, eine so ineffiziente Architektur immer weiter zu verbreitern, es muss dringend eine neue Architektur her, welche die theoretischen Flops auch praktisch in Leistung umsetzt.

Spasstiger
2009-01-13, 14:37:07
Es macht auch keinen Sinn, eine so ineffiziente Architektur immer weiter zu verbreitern, es muss dringend eine neue Architektur her, welche die theoretischen Flops auch praktisch in Leistung umsetzt.
Was heißt hier ineffiziente Architektur? ATI bekommt in 55 nm auf 260 mm² rund 80% der Rechenleistung eines GT200b in 55 nm mit 470 mm² unter.
Du kannst nicht einfach hergehen und sagen: Oh, ATI ist mit 800 Shadereinheiten langsamer als Nvidia mit 240 Shadereinheiten. Denn die Shadereinheiten sind unterschiedlich aufgebaut. Die Shadereinheiten von ATI sind wesentlich kompakter, können dafür aber auch nur 1 MADD statt 1 MADD + 1 MUL wie bei Nvidia. Zudem vertragen die Shadereinheiten des RV770 nicht so hohe Taktraten wie beim GT200b.
Sowohl der RV770 als auch der GT200b besitzen 10 Shadercluster und diese Shadercluster setzen auch jeweils ungefähr dieselbe Shaderleistung um. Allerdings benötigen alle Shadereinheiten (ohne TMUs) des GT200b zusammen soviel Fläche wie der gesamte RV770, obwohl beide Chips auf dieselbe Fertigungstechnologie setzen.

Alles in allem würde ich den RV770 als effizienter als den GT200b bezeichnen.

Was die pure Shaderleistung des RV770 angeht, schau mal hier die Rightmark3D-Ergebnisse am Ende der Seite an:
http://www.computerbase.de/artikel/hardware/grafikkarten/2009/test_nvidia_geforce_gtx_295/5/#abschnitt_theoretische_benchmarks
Bei den Pixel- und Vertexshadertests schlägt sogar die Radeon HD4850 eine GeForce GTX 280.

Fetza
2009-01-13, 14:46:58
Ja, mit diesen Specs auf jeden Fall. Aber NV kontert ja mit dem GT212, das könnte wieder ein spannendes Duell geben.

Ja, aber wenn der rv790 wirklich im märz verfügbar sein sollte, wäre es klasse, denn ich bräuchte dringen ne neue graka. :)

Zumal nv ja warscheinlich erst 3- frühestens 2 monate später kontern wird.

Gast
2009-01-13, 15:21:08
Was heißt hier ineffiziente Architektur?

Kannst du nicht lesen? Von der theoretischen Rechenleistung bekommt AMD nur einen Bruchteil in die Praxis umgesetzt, das ist das Problem.

Spasstiger
2009-01-13, 15:30:30
Kannst du nicht lesen? Von der theoretischen Rechenleistung bekommt AMD nur einen Bruchteil in die Praxis umgesetzt, das ist das Problem.
Rightmark3D zeigt aber, dass die HD4850 ist bei den Pixel- und Vertexshadertests schneller ist als eine GTX 280. Somit ist die Shaderleistung keine Schwäche der RV770-Architektur, zumal die 800 Shadereinheiten des RV770 ja sehr platzsparend sind und fast nur halb soviel Fläche belegen wie die 240 Shadereinheiten beim GT200b.
Zudem: Keine aktuelle GPU setzt bei realen Anwendungen tatsächlich ~1 Teraflops an Rechenleistung um.

Dass das Gesamtpaket RV770 langsamer als der GT200b ist, ist angesichts der deutlich kleineren Chipfläche (260 mm² statt 470 mm²) wohl verschmerzbar.

Und wenn du einen RV770 verdoppelst, kommt auch die doppelte Spieleleistung raus. Wenn man nur doppelt soviele Shadereinheiten und doppelt soviele TMUs verbaut und den Rest gleich lässt, ist die Leistungssteigerung natürlich weit geringer. Aber das ist auch bei Nvidia so, siehe GeForce 9600 GT v. GeForce 8800 GTS 512 MiB.

reunion
2009-01-13, 15:42:39
Kannst du nicht lesen? Von der theoretischen Rechenleistung bekommt AMD nur einen Bruchteil in die Praxis umgesetzt, das ist das Problem.

Und das interessiert wen genau? Was zählt ist was hinten raus kommt. Und da ist AMD momentan erheblich effizienter.

deekey777
2009-01-13, 15:59:34
Kannst du nicht lesen? Von der theoretischen Rechenleistung bekommt AMD nur einen Bruchteil in die Praxis umgesetzt, das ist das Problem.
Bitte belegen.

Coda
2009-01-13, 16:02:48
Es gibt sogar ATI-Slides dazu. Von den Vec5 ALUs werden im Durchschnitt pro Takt nur 3-4 ausgenützt.

Aber ich gebe Reunion recht, solange der Durchsatz, Energieeffizienz und der Die-Space passt ist das eigentlich auch egal. Das einzige Problem das ich sehe ist nur, dass die Leistung je nach Spiel stark schnwanken kann, während NVIDIA mit ihrer Architektur immer ziemlich konstante Leistung knapp am Maximum hat.

deekey777
2009-01-13, 16:05:37
Es gibt sogar ATI-Slides dazu. Von den Vec5 ALUs werden im Durchschnitt pro Takt nur 3-4 ausgenützt.
Ich habe diese auch hier gepostet (und sie ist veraltet).
Dass die Auslastung niemals 5.0 ist, war klar (selbst in GPGPU-Zeug, da Brook+ höchstens float4 kennt, was die VLIW-Auslastung bzw. die Optimierung dafür erschwert).
Aber "ein Bruchteil" ist es nicht.

Coda
2009-01-13, 16:15:55
Ich habe diese auch hier gepostet (und sie ist veraltet).
Da hat sich nichts wesentliches getan. Wenn ich meine eigenen Shader mit AMD ShaderAnalyser lade sehe ich auch so 3-4 rum.

dass die Auslastung niemals 5.0 ist, war klar (selbst in GPGPU-Zeug, da Brook+ höchstens float4 kennt, was die VLIW-Auslastung bzw. die Optimierung dafür erschwert).
Auch in Direct3D gibt's kein float5.

Aber "ein Bruchteil" ist es nicht.
Das ist jetzt wieder so eine Frage wie jeder subjektiv "Bruchteil" versteht. Ungenauigkeit der Sprache.

Nur mal ein Beispiel in der Praxis:
9 x: ADD R1.x, R6.z, R5.z VEC_102
y: ADD R1.y, R6.z, -R5.z VEC_102
z: ADD R1.z, R6.w, -R5.w
w: ADD R1.w, R6.w, R5.w
t: MUL_e R2.z, R6.z, R6.z
10 x: MUL_e R2.x, PV9.x, (0x3F3504F3, 0.7071067691f).x
y: MUL_e R2.y, PV9.y, (0x3F3504F3, 0.7071067691f).x
z: MUL_e R1.z, PV9.z, (0x3F3504F3, 0.7071067691f).x
w: MUL_e R2.w, PV9.w, (0x3F3504F3, 0.7071067691f).x
t: MUL_e R1.w, R5.z, R5.z
11 x: MUL_e R1.x, PV10.x, PV10.x
y: MUL_e R1.y, PV10.y, PV10.y
z: MULADD_e R2.z, R6.w, R6.w, R2.z
w: MULADD_e R1.w, R5.w, R5.w, PS10 VEC_120
t: ADD R3.z, R6.x, -R5.x
12 x: MULADD_e R1.x, R1.z, R1.z, PV11.y
y: ADD R1.y, R6.y, -R5.y
z: ADD R1.z, R6.x, R5.x
w: MULADD_e R3.w, R2.w, R2.w, PV11.x
t: SQRT_e R3.x, PV11.z
13 x: MUL_e R2.x, PV12.y, (0x3F3504F3, 0.7071067691f).x
y: ADD R3.y, R6.y, R5.y
z: MUL_e R3.z, R3.z, (0x3F3504F3, 0.7071067691f).x
w: MUL_e R1.w, PV12.z, (0x3F3504F3, 0.7071067691f).x
t: SQRT_e R1.y, R1.w
14 y: MUL_e R1.y, PV13.y, (0x3F3504F3, 0.7071067691f).x
z: MAX_DX10 R0.z, R3.x, PS13
w: MIN_DX10 R0.w, R3.x, PS13
t: SQRT_e R1.z, R3.w
15 t: SQRT_e R2.w, R1.x
16 y: MIN_DX10 R2.y, R1.z, PS15
z: MAX_DX10 R1.z, R1.z, PS15
t: RCP_e R1.x, R0.w
17 w: MUL_e R2.w, R0.z, PS16
t: RCP_e R2.z, PV16.y
18 y: MUL_e R3.y, R1.z, PS17
19 x: SETGT_DX10 R1.x, PV18.y, R2.w
20 x: CNDE_INT R3.x, PV19.x, R0.z, R1.z
y: CNDE_INT R2.y, PV19.x, R5.x, R3.z VEC_120
z: CNDE_INT R0.z, PV19.x, R5.y, R2.x VEC_120
w: CNDE_INT R0.w, PV19.x, R0.w, R2.y VEC_021
t: CNDE_INT R6.x, PV19.x, R6.x, R1.w
21 y: CNDE_INT R6.y, R1.x, R6.y, R1.y
z: MOV R3.z, PV20.y
w: MOV R3.w, PV20.z

Auf 12 Instruction Slots kommen 45 Ops, die Auslastung ist also 3,75. Das ist üblich.

reunion
2009-01-13, 17:03:57
Nur mal ein Beispiel in der Praxis:
Auf 12 Instruction Slots kommen 45 Ops, die Auslastung ist also 3,75. Das ist üblich.


Bei der Auslastung wie in deinem Beispiel sind das dann in der Praxis genau 900 Giga FL Operations per Second. Eine GTX 280 schafft das selbst mit MUL gerade mal knapp in der Theorie.

Coda
2009-01-13, 17:05:49
Hab ich was anderes behauptet?

Derzeit hat AMD tatsächlich mehr Arithmetikleistung im Durchschnitt. Bei der R6xx-Generation war das noch nicht der Fall.

aylano
2009-01-13, 18:12:52
Es gibt sogar ATI-Slides dazu. Von den Vec5 ALUs werden im Durchschnitt pro Takt nur 3-4 ausgenützt.
Weiß Jemand warum ATI dann Vec5 und nicht Vec4 eingebaut hat, wenn eh fast nur 3-4 genutzt werden???

Gast
2009-01-13, 18:17:10
Ich denke Vec5 ist nicht wirklich größer als Vec4 und hat vielleicht Vorteile bei GPGPU.

reunion
2009-01-13, 18:22:48
Weiß Jemand warum ATI dann Vec5 und nicht Vec4 eingebaut hat, wenn eh fast nur 3-4 genutzt werden???

Das ist ein Durchschnittswert. Mit einer Vec4-ALU würdest du natürlich nicht auf 3.75 kommen. Vertexshader benötigen bsw. oft Vec5. Und auch sonst werden sicher oft alle 5 Vektoren ausgelastet, sonst würde man im Schnitt nicht fast auf 4 kommen. Nur kann es eben auch zu Abhängigkeiten kommen, so dass nur ein Vektor von 5 verwendet werden kann.

Coda
2009-01-13, 18:47:07
Ich wüsste nicht wieso Vertexshader öfter Vec5 brauchen würden.

reunion
2009-01-13, 18:52:56
Ich wüsste nicht wieso Vertexshader öfter Vec5 brauchen würden.

Vec4+1 um genau zu sein. Sie lasten eine Vec5 ALU eben gut aus.

Nakai
2009-01-13, 18:53:05
Ich wüsste nicht wieso Vertexshader öfter Vec5 brauchen würden.

Naja eher Vec4+1, wenn man sich die alten Vertexshader anschaut.


mfg Nakai

€: zu spät

Gast
2009-01-13, 23:59:28
wird sich denn, außer der fertigungsgröße, beim rv790 noch etwas ändern?