PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : AMD/ATI - Kaveri: 28nm, 2-4 Steamroller Kerne, GCN GPU - Ende 2013


Seiten : 1 2 [3] 4

R.I.P.
2013-09-22, 17:06:16
Was immer noch meilenweit von Intel weg wäre...bin ein ziemlich großer AMD Fan um ehrlich zu sein; brauche jedoch jetzt einen neuen PC. Geplant war ein FM2+ Board inkl. Richland, um dann im Frühjahr auf Kaveri umzusteigen. Da ich sowieso eine R9-290X kaufen möchte, glaube ich, dass Kaveri doch wieder zu schwachbrustig wäre, oder zumindest beim Spielen mit dGPU Leistung brach liegen würde....
Ich meine es Ernst: Kosten sind egal, also besser jetzt nen 4770k mit R9 und später bei DDR4 Zeiten auf Carizo als CPU umsteigen (wenn Excavator gut werden sollte), was glaubt ihr?

S940
2013-09-22, 17:25:16
AMD hat sich ziemlich sicher aus dem Performance/High-End-Segment verabschiedet. Um ernsthaft interessant zu sein bräuchten sie wenigstens noch nen 6core Kaveri, aber davon hört man auch nix mehr.

Carizo soll auch noch 28nm sein, da würde ich dann nur DDR4+Feintuning (wie bei Richland) vermuten nicht mehr. Glaube kaum, dass das Ding nem Haswell gefährlich werden könnte.

Mit nem 4770K machste nichts falsch, wenn Du Geld sparen willst, dann nimm den Xeon 1230v3 und ein H87-Board von Asrock. Damit bekommt man 3,7 Ghz, die restlichen ~500 Mhz die bei Haswell im Schnitt noch drin wären rentieren sich mMn nicht.

Huma .. tja .. da ist die PS4 ne große Unbekannte ... 100% ausschließen kann mans nicht, das deswegen auch Huma-Code in den PC-Bereich rüberschwappen könnte. Aber mal ehrlich, AMD hat ~15% MArktanteil und davon haben im Moment 0% nen Kaveri ... also deswegen Kaveri zu nehmen wäre blöd, noch blöder als Haswell nur wg. AVX2 zu kaufen.

Ravenhearth
2013-09-23, 00:32:09
Kurz zu Carizo: Wenn AMD die TDP der APUs von 100/65W auf 65/45W reduzieren und gleichzeitig die Leistung wenigstens leicht steigern möchte, halte ich 28nm für fast ausgeschlossen.

AnarchX
2013-09-23, 09:52:49
Bei 28nm gibt es diverse Prozessvarianten und auf der Ebene des Designs könnte es auch Optimierungspotential, ähnlich wie bei Richland, geben.
Überraschungen sind da wohl unwahrscheinlich, aber einen Stillstand sollte es auch nicht geben.

S940
2013-09-23, 10:15:51
Jupp ... 45W gibts außerdem jetzt - in 32nm - auch schon:
AMD A10-6700T vorbestellbar | Planet 3DNow! (http://www.planet3dnow.de/cms/2909-amd-a10-6700t-vorbestellbar/).

Duplex
2013-09-23, 10:26:12
Kurz zu Carizo: Wenn AMD die TDP der APUs von 100/65W auf 65/45W reduzieren und gleichzeitig die Leistung wenigstens leicht steigern möchte, halte ich 28nm für fast ausgeschlossen.
Wenn Frontend, Cache System & Pipeline verbessert werden, dann sollte das Design effizienter werden und weniger verbrauchen.

Liszca
2013-09-29, 05:20:55
Wäre es nicht möglich dass wir vor DDR4 noch ein "double" dualchannel DDR3 Interface sehen? Wären bei DDR 1866 fast 60GB/s gepaart mit 512 CUs wäre das eine durchaus potente iGPU (vorrausgesetzt sie erhöhen die TDP auf 125 Watt).
Wenn dann noch Mantle und hUMA dazu kommen ist das in meinen Augen ein rundes Paket.

Undertaker
2013-09-29, 10:05:09
4 Speichermodule lassen sich im non-High-End schlecht verkaufen, dass wird schlicht zu teuer. Für Notebooks wäre ein solcher Chip zudem gar nicht zu gebrauchen bzw. könnte nur kastriert verwendet werden, man verschenkt also Die-Fläche usw.

HOT
2013-09-29, 11:04:04
Da die FM2+-Boards offenbar auf 125W-Tauglichkeit ausgebaut wurden gehe ich davon aus, dass es zu den 65W Carizos auch ne Ergänzung nach oben Richtung 125W geben wird. Carizo wird mMn auch DDR4 können, aber das dürfte so ähnlich ablaufen wie bei AM2+ und AM3.

Liszca
2013-09-30, 11:33:20
4 Speichermodule lassen sich im non-High-End schlecht verkaufen, dass wird schlicht zu teuer. Für Notebooks wäre ein solcher Chip zudem gar nicht zu gebrauchen bzw. könnte nur kastriert verwendet werden, man verschenkt also Die-Fläche usw.

Da magst du ja recht haben, aber warum dann eben nicht ein kleineres model für das mobile segment verwenden.

Undertaker
2013-09-30, 11:41:54
Auch das dürfte eine Kostenfrage sein. Obwohl die aktuellen A4- und A6-Modelle nur 1 Modul besitzen, gibt es dafür keinen eigenen Die, sondern nur den kastrierten Chip mit 2 Modulen. Ein extra Ableger mit schmälerem Speicherinterface würde da kaum lohnen.

Außerdem: Auch im Desktop halte ich ein solches Modell für überflüssig. Typische OEM-Boards haben idR nur zwei Speicherslots, von denen zum Teil sogar nur einer bestückt ist. Und selbst wenn ein teureres Board verbaut wird: Welcher Hersteller bestückt einen < 500 Euro PC dann mit 4 Modulen à 1 oder 2 GB?

Liszca
2013-09-30, 12:16:18
Es müssen ja nicht zwangsläufig alle bänke von vorneherein bestückt werden.

ndrs
2013-09-30, 13:18:51
Dann bliebe aber immernoch das Platinenlayout des Mainboards. Vier Speicherkanäle sind deutlich schwieriger zu routen und erfordern höchstwahrscheinlich mehr PCB-Lagen. Boards für unter 100€ sind damit nur schwer möglich.

S940
2013-09-30, 13:33:06
Dann bliebe aber immernoch das Platinenlayout des Mainboards. Vier Speicherkanäle sind deutlich schwieriger zu routen und erfordern höchstwahrscheinlich mehr PCB-Lagen. Boards für unter 100€ sind damit nur schwer möglich.
Das sollte so wie bei Intel gehen, 2 Kanäle rechts, 2 Kanäle links .. da kommt sich dann nichts in die Quere.
Das teure bei den 2011er Boards ist der Chipsatz x79, Intel will 40-50 Dollar dafür.

ndrs
2013-09-30, 14:27:58
Das sollte so wie bei Intel gehen, 2 Kanäle rechts, 2 Kanäle links .. da kommt sich dann nichts in die Quere.
Naja, einfacher wird es aber sicher nicht. Und du willst ja sicher nicht behaupten, dass bei nem Zweikanal-Board die Seite links vom Sockel komplett leer ist.
Das teure bei den 2011er Boards ist der Chipsatz x79, Intel will 40-50 Dollar dafür.
Wenn ich vom billigsten 2011-Board großzügig 50€ abziehe, bin ich immernoch über 100€ und AMD wird den Chipsatz sicher nicht verschenken.

Undertaker
2013-09-30, 14:43:41
Exakt. Mehr als zwei Kanäle sind bei einem Mainstream-Produkt einfach in mehrfacher Hinsicht zu teuer... Chip, Mainboard, Speicherbestückung hatten wir nun jetzt schon genannt. Den Spaß gönnt sich nicht einmal Intel bei der Iris Pro, obwohl der Quad + GT3 ein eigener Die ist (das also keine Auswirkungen auf den Rest der Produktpalette hätte).

Liszca
2013-09-30, 16:21:14
Also ich verstehe nicht warum es denn soviel mehr kosten beim mainboard verursacht wenn vier speicherbänke verbaut werden.

http://geizhals.de/?cat=mbfm2p&xf=493_4x+DDR3#xf_top

AnarchX
2013-09-30, 16:26:46
Für 4 Speicherkanäle (deine Boards haben nur 2), braucht man mehr PCB-Schichten.

Aber vielleicht gibt es später noch Bewegung bei GDDR5M, immerhin produziert Hynix diese wohl im Q3.

S940
2013-09-30, 16:53:50
Naja, einfacher wird es aber sicher nicht. Und du willst ja sicher nicht behaupten, dass bei nem Zweikanal-Board die Seite links vom Sockel komplett leer ist.
Komplett leer nicht, aber schau mal was da zu den Speichersockeln geroutet wird, das sind mäandernde Leiterbahn-Autobahnen. Sowas gibts auf der anderen Seite nicht.Mit DDR4 fiele das Mäandern auch weg, könnte schon klappen. Kommt dann wohl auf PCIe an .. da hat der Sockel 2011 ja auch massig Pins, die geroutet werden wollen
Wenn ich vom billigsten 2011-Board großzügig 50€ abziehe, bin ich immernoch über 100€ und AMD wird den Chipsatz sicher nicht verschenken.Ja, das Default-Design hat 8 Layer. BIlde mir ein, dass irgendwo mal vor längerem ne Meldung war, dass AsRock 4 Layer schafft, aber das könnte dann auch noch bei Socket 1366 gewesen sein.

Botcruscher
2013-09-30, 17:01:15
Ich hab einen Alternativvorschlag. Von den 4 Kanälen verlötet man einfach 2 fest in sockelnähe mit jeweils 2GB.

Undertaker
2013-09-30, 17:19:09
Ich hab einen Alternativvorschlag. Von den 4 Kanälen verlötet man einfach 2 fest in sockelnähe mit jeweils 2GB.

Den fetten 4-Kanal-Speichercontroller brauchst du dafür trotzdem, die zusätzlichen Layer und Verdrahtungen auf dem Board ebenso. Man muss sich dazu auch immer wieder vor Augen halten, von welcher Preisklasse wir reden – etwas über 100 Euro bei den schnellsten Richland-Modellen aktuell. Intel hat es ja sogar für günstiger (oder effektiver) gehalten, statt zusätzlicher Speicherkanäle gleich einen EDRAM zu verbauen. Und auch den gibt es nur bei einigen teuren High-End-Versionen.

S940
2013-09-30, 17:29:56
Ich hab einen Alternativvorschlag. Von den 4 Kanälen verlötet man einfach 2 fest in sockelnähe mit jeweils 2GB.
Ich hab nen besseren, man packt gleich 8 GB ondie und bindet die mit 1024 bit an ^^

StefanV
2013-09-30, 17:49:07
Ja, das denke ich auch, dass wir in Konsequenz irgendwann einen 'second level Memory' haben werden :ugly:

ndrs
2013-09-30, 17:51:05
Komplett leer nicht, aber schau mal was da zu den Speichersockeln geroutet wird, das sind mäandernde Leiterbahn-Autobahnen. Sowas gibts auf der anderen Seite nicht.
Schon richtig, aber der Rest der da langläuft (wie die Controller fürs Backpanel, usw) braucht auch Platz, der dann fürs Mäandern fehlt. Der übliche Weg zu den Bänken ist ja komplett frei von anderen Bauteilen, weil einfach kein Platz ist und die Leitungen höchst störanfällig sind.

Mit DDR4 fiele das Mäandern auch weg, könnte schon klappen.
Schon klar, es ging aber um DDR3 :)

Ja, das Default-Design hat 8 Layer. Gut zu wissen. Dabei muss man auch noch bedenken, dass die Kosten exponentiell mit jedem Layer steigen, da die Defektrate beim Zusammenkleben ja gleichbleibt.

Egal. Für ein Mainstream-Design ist das jedenfalls momentan total utopisch.

Edit:
Ja, das denke ich auch, dass wir in Konsequenz irgendwann einen 'second level Memory' haben werden :ugly:
Hör ich da ein leises HMC? :D

Liszca
2013-09-30, 22:21:31
Auch wenn DDR4 schon etwas off-topic ist würde mich interessieren ob rambusdram physikalisch günstigere mainboards machen könnte?

Würde da nicht noch mehr bandbreite bei rüber kommen?

ndrs
2013-09-30, 22:30:34
Was genau meinst du mit rambusdram?
Und was ist "physikalisch günstiger"? ;)

Liszca
2013-10-01, 00:46:06
Was genau meinst du mit rambusdram?
Und was ist "physikalisch günstiger"? ;)

Naja wenn man nur die kosten für mainboard sieht nicht eben den teueren RAM riegel an sich:rolleyes:

ndrs
2013-10-01, 09:32:29
Meine zweite Frage war eher scherzhaft gemeint. Die erste solltest du aber beantworten, wenn mit deiner Frage jemand was anfangen soll :)

Liszca
2013-10-02, 00:40:49
Ich weiß:biggrin:

Ravenhearth
2013-10-02, 12:46:58
XDR2, wie? :freak:

Ronny145
2013-10-05, 17:24:42
http://beyond3d.com/showpost.php?p=1792130&postcount=761


Dualchannel DDR3 wie erwartet.

Locuza
2013-10-05, 17:27:27
Gerade noch das hier gefunden:

http://1.bp.blogspot.com/-AXBc57ku98s/Uk_NjnegL3I/AAAAAAAABcw/8k3872bAC5E/s1600/Kaveri+Onion+++.jpg

Aber nur diese Folie.
Onion + Bus, also FCL + , wie bei der PS4.

Edit:
Wie schön das die ganze Präsentation oben in der Originalquelle zu finden ist:

http://share.csdn.net/uploads/5232b691522ba/5232b691522ba.pdf

Undertaker
2013-10-05, 17:28:32
Imo keine große Überraschung. Mit ein bisschen Glück gibt es bei einigen Modellen vielleicht noch einen schnelleren Maximaltakt (z.B. DDR3-1866 endlich für das gesamte Mobile-Lineup), aber das wird es dann auch gewesen sein. In Spielen dürfte man damit Ähnliches beobachten wir auch bei Haswell abseits der Iris Pro: Nahezu Stagnation.

Die Lücke zu dedizierten GPUs wächst damit weiter an – wir sind wieder im absoluten Low-End-Bereich.

Ronny145
2013-10-05, 17:37:17
GCN soll effizienter mit der Bandbreite umgehen, da besteht auch immer noch Verbesserungsspielraum. In Notebooks, wo praktisch immer nur DDR3-1600 CL11 zum Einsatz kommt, ist das sicherlich noch ein größeres Problem neben der beengten TDP.

AnarchX
2013-10-06, 12:00:03
There are 4 DCTs (DRAM ConTrollers) in some 15h Models 30h-3Fh SKUs
http://forum.beyond3d.com/showpost.php?p=1792347&postcount=774
... fragt sich nur ob das jemals in Silizium erscheinen wird.

Wenn man aus dem mobilen Kaveri möglichst viel Leistung pro Watt holen will, wäre vielleicht auch ein breites Front-End interessant, sodass man mit ~600MHz vielleicht die vergleichbare Leistung einer 384SPs 1GHz Lösung erreicht.

S940
2013-10-06, 12:36:34
http://forum.beyond3d.com/showpost.php?p=1792347&postcount=774
... fragt sich nur ob das jemals in Silizium erscheinen wird.
In Silizium bestimmt, aber obs auch nen Sockel dafür geben wird ... das ist die Frage.

Vermutlich ist das nur für den (Grafik-)Kartenbetrieb vorgesehen. Da kann man das Ding dann auf ne FirePro-Karte mit 8 GB GDDR5 @256bit löten und hat nen netten HSA-Client.

Aber Quad-Channel für den Mainstreammarkt kann man ausschließen. Aufgrund der nötigen Mainboardlayer zu teuer, das Thema hatten wir ja erst.

Frag mich nur, ob man vielleicht mit DDR4 Leiterbahnen einsparen könnte. Zumindest erinnere ich mich daran, dass man keine Mäanderkurven mehr braucht, da das Timing automatisch abgeglichen wird. Das sparte sicherlich auch Platz bei der Routenplanung.

In dem Fall stellte sich die Frage, ob es reicht um gleich doppelt soviel Kanäle anzubinden. Nen 3. könnte ich mir gerade noch vorstellen, aber 4?

Edit:
Weiss jemand, was es für nen Sinn hat, dass Kanal 0 und 3 aktiv sind und nicht 0 und 1? Sieht irgendwie schräg aus ...

Skysnake
2013-10-06, 15:07:21
DDR4 hat autotraining. Du musst die Leitungslängen also nicht mehr physisch angleichen.

S940
2013-10-06, 15:46:55
DDR4 hat autotraining. Du musst die Leitungslängen also nicht mehr physisch angleichen.
Ja das mein ich, traust Du Dir ne unwürdige Pi*Daumenschätzung zu, ob man damit Platinenfläche einsparen könnte und somit weniger Lagen bräuchte?

Skysnake
2013-10-06, 16:22:15
Na klar kann man damit die Leitungen dichter packen :ugly: Man kann die Leitungen halt ziemlich geradlienig ziehen. Mehr kannste dazu aber allgemein nicht sagen. Alles andere hängt von zu vielen Faktoren ab. Es gibt ja nicht EIN PCB, sondern ganz ganz viele unterschiedliche.

ndrs
2013-10-06, 16:44:00
Wieviele Lagen haben denn übliche GPU PCBs mit 256 bit? Ich mein, soviel mehr wird ja dann bei ner CPU auch nicht benötigt. Beide hätten dann 4x64 bit SI, 1x PCIe x16 Display-Out, ... Wenn man jetzt noch die Spannungsversorgung als vergleichbar unterstellt, bleiben als einzige nennenswerte Unterschiede die paar PCIe Lanes zur Southbridge und der Unterschied BGA <-> Sockel.
Zumindest wenn ich nix grobes Vergessen hab :)

S940
2013-10-06, 17:00:33
Na klar kann man damit die Leitungen dichter packen :ugly: Man kann die Leitungen halt ziemlich geradlienig ziehen. Mehr kannste dazu aber allgemein nicht sagen. Alles andere hängt von zu vielen Faktoren ab. Es gibt ja nicht EIN PCB, sondern ganz ganz viele unterschiedliche.Ja sicherlich, aber bei eigentlich allen ist der CPU-Sockel mittig oben und der Speicher rechts davon. Aber naja, wird man abwarten müssen. Vielleicht reichts so gerade noch wenn AMD weniger PCIe-Lanes als bei Intels 2011er Sockel unterstützt.
Wieviele Lagen haben denn übliche GPU PCBs mit 256 bit? Ich mein, soviel mehr wird ja dann bei ner CPU auch nicht benötigt. Beide hätten dann 4x64 bit SI, 1x PCIe x16 Display-Out, ... Wenn man jetzt noch die Spannungsversorgung als vergleichbar unterstellt, bleiben als einzige nennenswerte Unterschiede die paar PCIe Lanes zur Southbridge und der Unterschied BGA <-> Sockel.
Naja doch ... bei ner GPU hast Du ja die Speicherchips schön runderherum um den Sockel gruppiert, während bei nem Mainboard 100-200 Leitungen pro Speicherkanal in eine einzige Richtung geroutet werden.

S940
2013-10-06, 18:14:06
Eventuell des Rätsels simple Lösung:

We were able to take a peek at AMD NDA information (aimed at engineers) that details the technical features of the Kaveri APU. According to this information, Kaveri features a GDDR5 memory interface consisting of four 32-bit memory channels.http://www.brightsideofnews.com/news/2013/3/5/amd-kaveri-unveiled-pc-architecture-gets-gddr5.aspx

Damit wär dann nicht wirklich viel gewonnen.

ndrs
2013-10-06, 18:17:19
Naja doch ... bei ner GPU hast Du ja die Speicherchips schön runderherum um den Sockel gruppiert, während bei nem Mainboard 100-200 Leitungen pro Speicherkanal in eine einzige Richtung geroutet werden.
Ich seh den Unterschied jetzt nicht so kritisch. Als Beispiel ne HD7870: http://images.ht4u.net/reviews/2012/amd_radeon_hd_7870_pitcairn_xt_im_test//board_big.jpg
Ganz vereinfacht beschrieben: 128 bit SI rechts, 128 bit SI oben, Vcc links, PCIe unten.
Bei nem Mainboard wäre dann nur eine Kante auszutauschen: 128 bit SI rechts, Vcc oben, 128 bit SI links, PCIe unten.

Edit:
Eventuell des Rätsels simple Lösung:

Das wär ja ganz neu, dass außerhalb vom Handybereich 32bit pro Controller gezählt werden. Oder gäbe es einen technischen Grund einen 64bittigen in zwei 32bittige zu zerlegen?

S940
2013-10-06, 18:33:31
Ich seh den Unterschied jetzt nicht so kritisch. Als Beispiel ne HD7870: http://images.ht4u.net/reviews/2012/amd_radeon_hd_7870_pitcairn_xt_im_test//board_big.jpg
Ganz vereinfacht beschrieben: 128 bit SI rechts, 128 bit SI oben, Vcc links, PCIe unten.
Bei nem Mainboard wäre dann nur eine Kante auszutauschen: 128 bit SI rechts, Vcc oben, 128 bit SI links, PCIe unten.
Ja ne links-rechts Aufteilung wie auch bei einigen S2011 Boards hülfe sicherlich auch etwas. Aber obs reicht ...

Edit: So wies ausschaut sind 256bit Grafikkarten auch mind. 6 Layerdesigns, war zumindest so bei der 6870, die 5870 hatte gar 8:

because while Barts can make do with a 6-layer PCB, close to every existing Cypress PCB is an 8-layer onehttp://www.techpowerup.com/132802/radeon-hd-6870-pcb-and-gpu-pictured.html

Das wär ja ganz neu, dass außerhalb vom Handybereich 32bit pro Controller gezählt werden. Oder gäbe es einen technischen Grund einen 64bittigen in zwei 32bittige zu zerlegen?Ja, das ist Standard bei GDDR5. Jeder Chip in Deinem obigen Foto hat da z.B. ne eigene 32bit-Anbindung.

ndrs
2013-10-06, 19:10:24
Ja, das ist Standard bei GDDR5. Jeder Chip in Deinem obigen Foto hat da z.B. ne eigene 32bit-Anbindung.
Letzteres ist klar. Ich meine nur immer davon gelesen zu haben, dass eine CPU/GPU n 64bit-Controller hat.

S940
2013-10-06, 21:22:08
Letzteres ist klar. Ich meine nur immer davon gelesen zu haben, dass eine CPU/GPU n 64bit-Controller hat.

AMD hat bei seinen Grafikkarten in der Tat 64bit Kontroller, aber das zählt dann als Dual-Channel.

Schau z.B. die Tahiti Grafik an, ganz unten sind die Speicherkontroller:
http://images.anandtech.com/doci/5261/Tahiti.jpg

ndrs
2013-10-06, 21:23:49
Tatsache, wieder was gelernt :)

Ronny145
2013-10-27, 16:36:31
http://www.computerbase.de/news/2013-10/amds-kaveri-vorstellung-am-5.-dezember-erwartet/

Produktion und paper Vorstellung im Dezember, launch Februar.


AMDs Angabe von der CES war rückblickend eine Punktlandung.


AMD expects to start shipping Kaveri in a late Q4 timeframe this year. These parts will be desktop at first and will transition to mobile in 2014.

Duplex
2013-10-27, 16:40:22
"SteamrollerB Core" ist anscheinend neu, kann mich nicht errinern das der bereits erwähnt wurde.

http://abload.de/img/kaveribmrja.jpg

Produktion erst im Q4, der 28nm Prozess lief vorher bestimmt nicht so gut, der kommt recht spät, deshalb jetzt auch SteamrollerB, die Kerne hat man wahrscheinlich nochmal überarbeitet, so ein Übergang wie Zambezi>Vishera kann man sich damit sparen.

mboeller
2013-10-27, 17:09:24
Kaveri scheint ja auch TrueAudio zu haben. Das "Console Class gaming audio and movie Theater surround processing" lese ich zumindest so.

Skysnake
2013-10-27, 17:18:24
DIto

M4xw0lf
2013-10-27, 17:25:37
Auf Kaveri bin ich echt gespannt.

MamaRooster
2013-10-27, 18:52:43
kann man schon ungefähr abschätzen wieviel mehr-performance der gpu part hat im vergleich zu richland?

S940
2013-10-27, 19:00:46
Kaveri scheint ja auch TrueAudio zu haben. Das "Console Class gaming audio and movie Theater surround processing" lese ich zumindest so.
Ich entnehme das dem "New Audio Co-Processor" :biggrin:

@Duplex: SteamrollerB hatte Fuad schon vor ein paar Monaten genannt und es als Grund der Verzögerung angegeben.

mboeller
2013-10-29, 07:28:29
http://www.overclock.net/t/1437732/amdfx-amd-steamroller-ipc-leaked-cosmology-benchmark

Wenn's stimmt; mehr als 30% schneller im Integer-Benchmark. Kann das sein?
Die FPU ist aber langsamer geworden...schade.

Ach ja, gefunden habe ich es im semiaccurate-forum. Die Original-Quelle scheint die Website zu sein: http://amdfx.blogspot.cz/ kann ich mir aber momentan nicht anschauen.

Coda
2013-10-29, 09:16:37
Würde mich nicht überraschen. Bulldozer sah auf dem Papier schneller aus als er dann war. Vermutlich gab es etliche "low hanging fruit".

Lowkey
2013-10-29, 09:46:33
Es würde mich nicht wundern, wenn der x87 Patch von Stilt funktionieren würde :>

Gipsel
2013-10-29, 10:06:23
http://www.overclock.net/t/1437732/amdfx-amd-steamroller-ipc-leaked-cosmology-benchmark

Wenn's stimmt; mehr als 30% schneller im Integer-Benchmark. Kann das sein?
Die FPU ist aber langsamer geworden...schade.Den komischen integrierten BOINC-Benchmark kannst Du komplett in die Tonne hauen.

Skysnake
2013-10-29, 11:07:57
/sign

Der ist viel zu kurz und anfällig. Da streuen die Ergebnisse viel zu stark.

Gipsel
2013-10-29, 11:49:25
/sign

Der ist viel zu kurz und anfällig. Da streuen die Ergebnisse viel zu stark.Vor allem ist er unempfindlich gegen die meisten Architekturänderungen, sprich, er bietet typischerweise keinen Eindruck der echten Performance. :rolleyes:

S940
2013-10-29, 14:56:23
/sign

Der ist viel zu kurz und anfällig. Da streuen die Ergebnisse viel zu stark.
Vor allem ist er unempfindlich gegen die meisten Architekturänderungen, sprich, er bietet typischerweise keinen Eindruck der echten Performance. :rolleyes:
Das Ding ist Opensource, ihr könntet da gerne Euren Favoriten-Code einschleusen ;-)

Hauptproblem des Ganzen ist mMn der, dass der eine Teil-Bench mutlithreaded ist, der andre aber nicht.

mczak
2013-10-29, 19:54:50
http://www.overclock.net/t/1437732/amdfx-amd-steamroller-ipc-leaked-cosmology-benchmark

Wenn's stimmt; mehr als 30% schneller im Integer-Benchmark. Kann das sein?
Die FPU ist aber langsamer geworden...schade.

Also 30% bessere Int-Performance wäre schon sehr nett (und eigentlich auch notwendig um halbwegs kompetitiv zu sein).
Die FPU könnte durchaus langsamer sein, zumindest in gewissen Benchmarks - BD hat ja 2xINT + 2xFP Execution Pipes und SR bloss noch 3. Dass man da allerdings überall 10% verliert glaube ich nicht. Auch abgesehen davon ist natürlich die SIMD-Einheit schon ziemlich schwach gegenüber den intel Chips die nicht nur doppelt so viele SIMD-Einheiten (pro "Kern") haben sondern die zudem noch doppelt so breit sind. Da sieht man selbst gegen Haswell Pentiums (die ja "dank" der Deaktivierung von AVX/AVX2 nichts von den doppelt breiten Einheiten haben) wohl ziemlich alt aus. Aber da setzt AMD wohl auf HSA um das zu kompensieren...

Duplex
2013-10-29, 20:14:28
Ich erwarte 15-20% IPC Verbesserungen, mehr L1 Cache und 4 Decoder für 4 Threads, ob man durch 28nm halfnode dann höher als 32nm takten kann bleibt abzuwarten, vielleicht sind 4,5Ghz Basistakt bei 100w TDP möglich. >1/4 mehr Performance als Richland liegt im grünen Bereich.

Knuddelbearli
2013-10-29, 20:27:18
Kaveri ist doch weiterhin 32nm?

Ronny145
2013-10-29, 20:37:41
Seit wann ist Kaveri in 32nm geplant?

Duplex
2013-10-29, 20:50:44
Das wüsste ich auch gerne.

fondness
2013-10-29, 21:01:17
Es gibt doch schon längst eine offizielle Aussage von Lisa Su, die von 10-20% mehr CPU-Performance sprach.

Schaffe89
2013-10-29, 22:13:18
Echt? Wann denn das?

fondness
2013-10-29, 22:53:11
Echt? Wann denn das?

Als sie Kaveri vorstellte vor ein paar Monaten fragte ein Journalist nach der CPU-Performance, worauf sie nur kurz mit 10-20% mehr antwortete.

mboeller
2013-10-30, 10:50:58
http://translate.google.com/translate?sl=auto&tl=en&prev=_t&hl=en&ie=UTF-8&u=http://www.bitsandchips.it/9-hardware/3567-kaveri-avra-una-igpu-gcn-2-0-con-512-stream-processor


stimmt hoffentlich nicht. 2.9GHz für die Top-Version wäre schon ziemlich langsam. Gefunden wieder mal im semiaccurate-forum.

Skysnake
2013-10-30, 10:54:35
Das wäre in der Tat wirklich sehr niedrig getaktet im Vergleich.

robbitop
2013-10-30, 11:02:42
Vieleicht machen sie es ja so, dass sie den Basetakt senken und den Turbotakt sehr hoch setzen?

Skysnake
2013-10-30, 11:13:37
Der Turbo soll bei 3,2 GHz liegen ;)

Lest ihr eigentlich die Links? :biggrin:

robbitop
2013-10-30, 11:16:47
Das wäre schlecht. :(

Ephiriel
2013-10-30, 11:20:41
Wieso? Wenn dabei 10-20% mehr CPU-Performance rauskommen würde, wäre das doch eine (zu?) gewaltige IPC-Steigerung :|
Allerdings wäre auch seltsam, wenn der direkte Nachfolger (7800K) langsamer wäre als der Vorgänger (6800K).

robbitop
2013-10-30, 11:22:56
Wieso? Wenn dabei 10-20% mehr CPU-Performance rauskommen würde, wäre das doch eine gewaltige IPC-Steigerung :|
Ich bin von einer IPC-Steigerung von 10-20 % ausgegangen. Eine Performancesteigerung von +10-20 % trotz einer Reduktion der Taktrate von 25...30 % halte ich für sehr unwahrscheinlich. Das wären dann 40...50 % IPC Steigerung. (und morgen kommt der Osterhase... :D)

Duplex
2013-10-30, 11:23:54
Das wäre in der Tat wirklich sehr niedrig getaktet im Vergleich.
Vielleicht noch keine Finale Revision.
Von B2> C0 Stepping hat AMD schon 400MHz rausgeholt und das ohne Clock Mesh.

Ephiriel
2013-10-30, 11:29:43
Oder sie haben 4 Module reingepackt, und mussten den Takt wegen der Leistungsaufnahme reduzieren.

robbitop
2013-10-30, 11:40:36
Das hilft aber bezüglich der Singlethread IPC nicht viel.

Duplex
2013-10-30, 11:42:14
@Ephiriel
Kaveri ist der Nachfolger von Trinity/Richland, offiziell sind 2 Module / 4 Kerne geplant.

Ephiriel
2013-10-30, 12:21:33
Ok, ich habe Ankündigungen diesbezüglich nicht so mitverfolgt, war ja eh mehr ins Blaue geraten als sonst etwas :redface:
Ja, bei Singlethread IPC hilft das nichts, aber man kann dick 8 Kerne auf die Schachtel schreiben :freak:

Duplex
2013-10-30, 12:53:17
8 Kerne ohne iGPU gibt es weiterhin, nächstes Jahr gibt es eine neue Revision von Piledriver, >10% schneller als Vishera sollte möglich sein.

grobi
2013-10-30, 15:59:27
8 Kerne ohne iGPU gibt es weiterhin, nächstes Jahr gibt es eine neue Revision von Piledriver, >10% schneller als Vishera sollte möglich sein.


10% klingen eher mau :confused:

maximus_hertus
2013-10-30, 16:22:59
Selbst die 10% halte ich für fast zu optimistisch. Es ändert sich ja quasi nix, es ist ja wohl nur ein "Fertigungsoptimierter" Vishera. Ergo könnte ich mir 4,1-4,2 GHz Basistakt vorstellen (125W TDP).

Ich bin echt gespannt auf Kaveri, wenngleich meine Erwartungen nicht zu hoch sind. Erst eine neue µArch könnte / wird deutliche Besserung bringen (rechne aber nicht vor Ende 2015 damit).

Duplex
2013-10-30, 19:58:27
Kaveri ist doch weiterhin 32nm?
28nm
http://abload.de/thumb/amd-kaveri-2014-0185qbq.png (http://abload.de/image.php?img=amd-kaveri-2014-0185qbq.png)

Vielleicht wird Kaveri garnicht bei Globalfoundries produziert, sondern bei TSMC (28nm bulk), vielleicht deshalb auch nur 3Ghz+.
Möglicherweise läuft der Prozess von GF nicht einwandfrei. Kabini ist ja auch 28nm bulk TSMC.

Locuza
2013-10-30, 20:16:20
Vielleicht wird Kaveri garnicht bei Globalfoundries produziert, sondern bei TSMC (28nm bulk), vielleicht deshalb auch nur 3Ghz+.
Möglicherweise läuft der Prozess von GF nicht einwandfrei. Kabini ist ja auch 28nm bulk TSMC.
Ich schenke dem ganzen bisher nicht so viel Aufmerksamkeit.
Was bedeutet 28nm Bulk bei GloFo?
HP? HPP? Welcher Prozess ist das genau?
Ich habe mich da schon eher an 28nm SHP lehnen wollen, also 28nm PD-SOI.

Wenn AMD nicht bei GloFo fertigt, dann darf man wohl noch mehr Strafe zahlen.

TSMC fertigt übrigens den T5 Sparc von Oracle, 16 CPU Cores @ 28nm mit bis zu 3,6 Ghz.
Also ich denke da sollten 4 Steamroller Cores kaum Probleme haben über 3Ghz zu kommen.

Aber Kaveri wird definitiv bei GloFo vom Band laufen.

Duplex
2013-10-30, 20:37:38
HP? HPP? Welcher Prozess ist das genau?


Aber Kaveri wird definitiv bei GloFo vom Band laufen.

http://www.pcgameshardware.de/CPU-Hardware-154106/News/Kaveri-Fertigung-28-nm-SHP-1054374/

fondness
2013-10-30, 20:38:43
http://www.pcgameshardware.de/CPU-Hardware-154106/News/Kaveri-Fertigung-28-nm-SHP-1054374/

Der Artikel ist uralt.

Duplex
2013-10-30, 20:39:59
Der Artikel ist uralt.
Logisch, Locuza wollte wissen welcher Prozess geplant ist.

Duplex
2013-10-30, 20:44:09
3 Jahre 32nm CPUs...
http://abload.de/thumb/amd-kaveri-2014-03a6fjs.png (http://abload.de/image.php?img=amd-kaveri-2014-03a6fjs.png)
2H/2014 noch immer 32nm CPUs, scheint so als ob man vom 28nm Prozess nicht überzeugt ist, sonst hätte man auf Steamroller und nicht auf Piledriver gesetzt.

Locuza
2013-10-30, 20:54:33
Logisch, Locuza wollte wissen welcher Prozess geplant ist.
Worauf ich und viele andere erst ihre Antwort bekommen werden, wenn Kaveri erscheint.
SHP sollte mit SOI kommen, ist also kein Bulk Prozess.

GloFos Roadmap hat sich häufig geändert, gerade zeigen sie auf ihrer Page auch nur drei 28nm Prozesse an, alte Roadmaps zeigen dagegen auch noch 28nm HP und SHP. AMD meinte häufiger auf 28nm Bulk Prozesse zu setzen.

Duplex
2013-10-30, 21:00:13
Die Prozesse von TSMC sind alle Bulk.

Locuza
2013-10-30, 21:05:50
Also ich spiele bei der TSMC Annahme nicht mit ;)

Pentium M
2013-10-30, 21:56:13
Duplex ein bisschen Baldrian würde dir manchmal gut tun.

S940
2013-11-02, 03:28:02
Möglicherweise läuft der Prozess von GF nicht einwandfrei.
Der läuft seit Anfang 2013 optimal.
Kabini ist ja auch 28nm bulk TSMC.
Ja und dafür darf AMD gut zahlen ... gerüchteweise ist das Bima-Update 2014 nur ein Kabini@GF.

Blediator16
2013-11-02, 05:14:41
Auf der APU13 wird sicher über Kaveri gesprochen und was ihn so schnell machen soll. Auch wird da über Cuda 2 OpenCL geredet. Bin ich gespannt was damit genau gemeint ist.

Automated CUDA-to-OpenCL™ Translation with CU2C(Tues 2:45 – 3:30)

Da gibt es noch viele andere Dinge, die sich interessant anhören gehören aber eigentlich in einen APU13 Beitrag.

M4xw0lf
2013-11-02, 11:45:29
Cuda to OpenCL... das klingt nach einer Kriegserklärung :freak:

HOT
2013-11-02, 11:59:30
Kaveri ist offenbar die letzte CPU, die mit IBM-Fertigungstechnik läuft. AMD hat 16nm SOI bzw. 20nm SHP gecancelt, aber eben nicht 28nm SHP. Also bleibt der TSMC-Kaveri ein feuchter Wunschtraum von Duplex ;). Auch wenn es offenbar noch einen Orochi C1 geben wird für G34-Server, so ist doch unbestreitbar, dass GloFo seine 32nm Fertigung auf fortschrittliche Fertigungsformen umstellen wird und die Menge hergestellte Produkte in diesem Fertigungsprozess sicherlich nicht mehr dazu ausreichen werden, weiterhin den Desktop-Bereich mit zu füttern; mal ganz davon abgesehen, dass bei weiterer 32nm-Fertigung die Konkurrenzfähigkeit völlig verloren geht in 2014.
Es wird sicher einen Ersatz für den FX geben aber der wird zu 99% eine APU sein und weiterhin in 28nm SHP bei GloFo gefertigt werden. Die Technik für eine größere APU ist da, machbar ist das. Stellt sich eben nur die Frage, ob man frühzeitig mit der Entwicklung begonnen hat. Es gab aber auch schon Gerüchte über 3-Moduler, ob das was dran ist, wird sich zeigen.
Bereits bei Excavator könnte AMD aber tatsächlich die SOI-Produktion komplett hinter sich lassen und hier wären auch TSMC-APUs denkbar. Rory Reads erklärtes Ziel war ja auch, dass möglichst alle Produkte sowohl bei TSMC als auch bei GloFo vom Band laufen können mit möglichst geringen Konvertierungskosten. Bei Excavator ist das sicherlich umsetzbar, nicht jedoch bei Kaveri, das ist einfach zu früh. Die Entwicklung von Kaveri/SR läuft ja schon seit Dirk Meyer-zeiten und die Entwicklung des passenden Fertigungsprozesses für die CPU läuft sicherlich seit vor 2008. Es ist immer zuerst der Fertigungsprozess da und dann das CPU-Design. Die Entwicklung von Excavator auf SOI-freier Fertigung ist sicherlich die erste strategische Entscheidung der neuen AMD-Führung gewesen, das würd auch zeitlich relativ gut passen und ist ja Teil des großen Kosten-senkungs-Programms der neuen AMD-Führung. Man möchte nach Möglichkeit genau 2 Fertigungsprozesse (+ Äquivalent des jeweilig anderen Fertigers) nutzen und nicht 6 oder 7 unterschiedliche wie bisher.

Skysnake
2013-11-02, 13:26:01
Cuda to OpenCL... das klingt nach einer Kriegserklärung :freak:
Naja, eigentlich sollte das nur eine Compilergeschichte sein, die die Synthax entsprechend mapped.

OpenCL ist ja aus CUDA hervorgegangen.

Wenns aber wirklich brauchbar ist, also einfach zu handhaben, könnte das die Bereitschaft von CUDA auf OpenCL umzuschwenken deutlich erhöhen.

Nakai
2013-11-02, 14:38:52
Also ich bin ziemlich auf Kaveri gespannt. Ein HSA-Notebookgerät mit einem Kaveri-Quad wäre sehr interessant. Laut alten Folien soll Kaverie 30% weniger Platz und Strom verbrauchen(neue Libraries) und der Durchsatz sollte schon drastisch werden. Was SteamrollerB alles bringt, bleibt abzusehen. Sieht eher danach aus, dass Stromspar-und Boostfeatures hinzugefügt wurden.

Weiß einer, wie das Decoding genau aufgeblasen wurde? Bulldozer/Piledriver hat einen 4fach Decoder. Steamroller? 2*3fach Decoder?

Locuza
2013-11-02, 14:54:56
Also ich bin ziemlich auf Kaveri gespannt. Ein HSA-Notebookgerät mit einem Kaveri-Quad wäre sehr interessant. Laut alten Folien soll Kaverie 30% weniger Platz und Strom verbrauchen(neue Libraries) und der Durchsatz sollte schon drastisch werden. Was SteamrollerB alles bringt, bleibt abzusehen. Sieht eher danach aus, dass Stromspar-und Boostfeatures hinzugefügt wurden.

Weiß einer, wie das Decoding genau aufgeblasen wurde? Bulldozer/Piledriver hat einen 4fach Decoder. Steamroller? 2*3fach Decoder?
Die High Density Libraries sollen erst nach Steamroller zum Einsatz kommen, jedenfalls war das der Stand, als Steamroller präsentiert wurde.

Bei den Decodern sollte es 2x4 sein.

fondness
2013-11-03, 16:15:53
Damit ist Globalfoundries als Foundry von Kaveri wohl bestätigt:
http://chinese.vr-zone.com/89139/amd-kaveri-seem-will-launch-at-ces-2014-jan-7th-and-vr-zone-show-kaveri-es-apu-first-time-11032013/

"Diffused in Germany"

S940
2013-11-03, 17:26:10
Damit ist Globalfoundries als Foundry von Kaveri wohl bestätigt:
http://chinese.vr-zone.com/89139/amd-kaveri-seem-will-launch-at-ces-2014-jan-7th-and-vr-zone-show-kaveri-es-apu-first-time-11032013/

"Diffused in Germany"

Jupp .. viel wichtiger ist aber der Anfang der OPN. ZD35 -> 3,5 GHz Basistakt ;-)
Für ein Sample nicht schlecht :)

Mehr Text dazu:
Kaveri-Sample mit 3,5 Ghz aufgetaucht | Planet 3DNow! (http://www.planet3dnow.de/cms/5168-kaveri-sample-mit-35-ghz-aufgetaucht/).

Edit:
Die High Density Libraries sollen erst nach Steamroller zum Einsatz kommen, jedenfalls war das der Stand, als Steamroller präsentiert wurde.
Ja aber der Stand war damals auch, dass Steamroller Anfang 2013 kommt ... würde mich zumindest nicht groß wundern, wenn Steamroller das jetzt doch schon hätte.

Locuza
2013-11-03, 17:40:49
Jupp .. viel wichtiger ist aber der Anfang der OPN. ZD35 -> 3,5 GHz Basistakt ;-)
Für ein Sample nicht schlecht :)
Was haben denn die ersten Trinity-Samples geschafft?
Also ich habe mal 3,2 Ghz und 3,7 Ghz mit Turbo gefunden:
http://wccftech.com/amd-trinity-a8-es-pitted-llano-a83850-apu-3dmark-11-benchmark/

http://www.3dcenter.org/news/weitere-vorab-benchmarks-amd-trinity-ca-15-vor-llano

Da gab es doch noch vor ewig langer Zeit mal EG Samples von Kaveri mit SteamrollerA und total wenig Takt, wenn ich mich recht entsinne.

Ja aber der Stand war damals auch, dass Steamroller Anfang 2013 kommt ... würde mich zumindest nicht groß wundern, wenn Steamroller das jetzt doch schon hätte.
Ach das Leben als Optimist ist super, wenn es bloß jemals auch so eintreffen würde.

fondness
2013-11-03, 17:53:40
Kaveri kommt sogut wie sicher in 28SHP, also weiterhin SOI, deshalb verwundert der Takt wenig. Ansonsten würde der 28SHP-Prozess von GF keinen Sinn machen.

Felixxz2
2013-11-03, 18:51:19
Kurz OT: Kann man da noch GPUs erwarten, bis 20nm bzw. finfets? Bringt SOI überhaupt was bei ~1Ghz?

S940
2013-11-03, 19:20:03
Kaveri kommt sogut wie sicher in 28SHP, also weiterhin SOI, deshalb verwundert der Takt wenig. Ansonsten würde der 28SHP-Prozess von GF keinen Sinn machen.
Ja aber die offiziellen Quellen zu 28SHP sind halt immer noch recht dürftig.
Kurz OT: Kann man da noch GPUs erwarten, bis 20nm bzw. finfets? Bringt SOI überhaupt was bei ~1Ghz?
Du meinst GPUs mit 28nm SOI?
Schließ ich eher aus, GPUs darf AMD bei TSMC fertigen und fährt damit ziemlich gut. Höchstens mal irgendeinen Mittelklasse-Testchip. Aber wozu wenn 2014 20nm angefahren wird...

Locuza
2013-11-12, 01:20:29
Kaveri hat zuerst einmal nur 856 GFLOPs.
47% des die-space geht für die GPU "drauf".
512 ALUs.

time_me
2013-11-12, 02:21:56
Damit läge man CPU-seitig wohl fast genau auf Richland-Niveau bzgl. GFLOPs.

Locuza
2013-11-12, 02:33:59
Das vermeintliche Flaggschiff A10-7850K hat 3,7 Ghz bei der CPU Taktung und auch nur 720 Mhz auf der GPU.

Trinity kam zuerst mit 3,8 Ghz Basis und 4,2 Ghz im Turbo. Die Taktraten bei der GPU gingen bis zu 800 Mhz.
Richland hat da auf beiden Seiten noch bisschen Takt drauf gepackt.

Also Kaveri ist etwas dürr geraten, falls da in naher Zukunft kein neues Modell darüber angesiedelt wird.
Von den 1050 GFLOPs die man früher auf die Folien geschrieben hat, ist man dann doch ein gutes Stück entfernt, auch wenn die 800 GFLOPs auch bei Trinity nicht gestimmt haben.

Entweder AMD setzt auf eine höhere Energie-Effizienz oder Bulk schlägt rein oder beides.

dildo4u
2013-11-12, 03:05:24
BF4 Benches vs GT630.

http://hothardware.com/News/AMD-Announces-New-Tools-Development-Capabilities-at-APU13-Confirms-Kaveri-is-A-512Core-Part/

y33H@
2013-11-12, 07:38:15
Wenn der A10-7850K nur 65W hat bei 856 GFlops, dann wäre das ziemlich schick.

Loeschzwerg
2013-11-12, 08:47:18
Richland ist von Seiten der GPU ca. 25-30% schneller als eine GT630. Kommen also vermutlich im Schnitt >30% Mehrleistung bei der Grafik mit Kaveri.

Ob 100Watt oder 65Watt TDP dürfte wie bei Richland vom CPU Teil abhängen.

mironicus
2013-11-12, 11:25:51
Wenn der Takt geringer ist, dürfte die IPC umso besser sein im Vergleich zum Vorgänger.

fondness
2013-11-12, 12:30:01
Hier noch ein paar offizielle Folien:
http://www.planet3dnow.de/cms/5452-apu13-kaveri-mit-856-gflops-laut-amd-ab-14-januar-im-laden-erhaeltlich/

Auch True-Audio wurde für Kaveri bestätigt.
Ab 14. Januar soll Kaveri im Laden erhältlich sein.

StefanV
2013-11-12, 12:49:43
Wäre interessant zu wissen, ob TrueAudio auch bei deaktivierter IGP nutzbar ist...

AffenJack
2013-11-12, 12:49:47
Könnte es irgendwie möglich sein, trueaudio über Kaveri oder andere APUs in der Zukunft abzuwickeln, während man zb mit ner NV Karte spielt? Das wäre auf jeden Fall nen Argument für AMD statt Intelcpu.

HOT
2013-11-12, 13:10:00
Damit läge man CPU-seitig wohl fast genau auf Richland-Niveau bzgl. GFLOPs.

Kein Wunder, er hat die gleichen Recheneinheiten und ähnliche Taktraten. Um theoretische CPU-Leistung zu erhöhen müsste er 3 ALUs pro Kern haben oder doppelt so breite FPUs. Die Leistung von Kaveri kommt aber ausschließlich aus der Effizienzsteigerung des Frontends und des I/O-Bereichs. Erst Excavator bringt offenbar auch bei den Recheneinheiten mehr Leistung mit.

Skysnake
2013-11-12, 14:01:03
Wäre interessant zu wissen, ob TrueAudio auch bei deaktivierter IGP nutzbar ist...
Also soweit ich das mit TrueAudio verstanden habe, will/soll man ja die Geometriedaten der 3D-Grafik nutzen. Das würde eigentlich nahelegen, dass das nicht geht.

Aber ich kann das auch total falsch verstanden habe! Viel gibt es zu TrueAudio und der Funktionsweise bisher noch nicht. Muss man also noch etwas warten.

ndrs
2013-11-12, 15:07:35
Also soweit ich das mit TrueAudio verstanden habe, will/soll man ja die Geometriedaten der 3D-Grafik nutzen. Das würde eigentlich nahelegen, dass das nicht geht.
Sehe ich auch so. Andernfalls wäre es ja nur "irgendeine Soundkarte die zufällig in der GPU sitzt"

Schaffe89
2013-11-12, 17:41:42
Wenn der A10-7850K nur 65W hat bei 856 GFlops, dann wäre das ziemlich schick.

Ich tippe da mal eher auf 80 Watt TDP.

reaperrr
2013-11-12, 22:26:14
Ich tippe da mal eher auf 80 Watt TDP.
Für den 7850K tippe ich eher auf 95-100W (K-Modelle haben eigentlich immer eine höhere TDP), aber es wird sicherlich einen unwesentlich niedriger getakteten A10-6700-Nachfolger mit 65W geben.

Nakai
2013-11-12, 22:53:53
Und so ein Kaveri wäre toll in einem Notebook. 13,3 ~ 14,0", Kaveri 2M/4Cs ~2,50 GHz Boost, GCN 512SPs ~600-800Mhz,...

Wär eine interessante Sache...

M4xw0lf
2013-11-13, 09:44:02
Heise haut hier mal ordentlich drauf: http://www.heise.de/newsticker/meldung/APU13-AMD-verfehlt-Performance-Ziel-fuer-Kaveri-deutlich-2044473.html

Käsetoast
2013-11-13, 15:10:22
Heise haut hier mal ordentlich drauf: http://www.heise.de/newsticker/meldung/APU13-AMD-verfehlt-Performance-Ziel-fuer-Kaveri-deutlich-2044473.html
Was mich mal interessieren würde: Wir haben da ja jetzt GFlops Werte von CPU- und GPU-Aspekt des Prozessors. Primär würde mich eigentlich die Entwicklung der CPU-Leistung interessieren - hat da jemand Werte der Vorgängergenerationen parat? Für mich relativiert sich das was Heise da ankreidet nämlich, wenn vorrangig die GPU nicht so stark ausgefallen ist wie geplant, zumal man auch damit noch die stärkste APU-Grafik bieten können wird. So gesehen wären die fehlenden GFlops schade, aber geschenkt. Wichtig für mich wäre, inwiefern sich an der CPU-Leistung was tut und in wie weit man sich die Werte mit der GPU zurecht frisiert und einzig dort echter Fortschritt stattfindet...

ndrs
2013-11-13, 15:30:16
Da sich an der Zahl der Recheneinheiten nichts geändert hat, haben sich auch die GFlops/MHz nicht geändert. Du musst also nur mit dem Takt skalieren. Da Richland höher taktet als Kaveri gibt es hier also einen Rückschritt.

Allerdings ist es reihclich sinnfrei von den GFlops auf die reale Leistung schließen zu wollen.

HOT
2013-11-13, 15:38:05
für die Grafikeinheit geht das schon. Offenbar gibts bei dem letzten SOI-Prozess immer noch Probleme mit der Grafikeinheit, denn diese taktet offenbar statt wie ursprünglich geplant nicht mit 900MHz-1GHz sondern nur mit 600-700MHz. Das macht dann eben den Unterschied in der theoretischen Rohleistung aus. Aber das Problem wird sich in der Excavator-Generation hoffentlich entgültig erledigen, wenn man von den offenbar völlig ungeeigneten IBM-SOI-Prozessen auf FinFET-bulk-Prozesse umsteigt. Carizo wird sicherlich noch FM2+ und 28nm SHP mit weiterhin 512 Shadern, aber alles was danach kommt wird besser. AMD soll ja ein bevorstehendes Tapeout eines 14XM-Prozessor haben. Mal sehen, welcher das ist.

ndrs
2013-11-13, 16:02:43
Excavator-Generation [...] FinFET-bulk-Prozesse
[...]
Carizo [...] FM2+ und 28nm SHP
Carizo hat nach aktuellem Stand Excavator-Kerne. Falls es doch eher Steamroller+-Kerne sind, dann kommt Excavator spätestens auf 20nm-planar aber auf keinen Fall erst auf 14xm.

Käsetoast
2013-11-13, 16:15:40
Da sich an der Zahl der Recheneinheiten nichts geändert hat, haben sich auch die GFlops/MHz nicht geändert. Du musst also nur mit dem Takt skalieren. Da Richland höher taktet als Kaveri gibt es hier also einen Rückschritt.

Allerdings ist es reihclich sinnfrei von den GFlops auf die reale Leistung schließen zu wollen.
Ah ok - ich dachte in die Werte würden Abschätzungen was Auslastung & Co angeht mit einfließen und da meiner Kenntnis nach ja z.B. die Zahl der Decoder steigt dachte ich, dass sich das auch irgendwo in den Werten niederschlägt. Wenn das aber wirklich nur die rohe, unrealistische Maximalleistung ist, dann sieht man davon natürlich nix...

fondness
2013-11-13, 16:52:25
für die Grafikeinheit geht das schon. Offenbar gibts bei dem letzten SOI-Prozess immer noch Probleme mit der Grafikeinheit, denn diese taktet offenbar statt wie ursprünglich geplant nicht mit 900MHz-1GHz sondern nur mit 600-700MHz. Das macht dann eben den Unterschied in der theoretischen Rohleistung aus. Aber das Problem wird sich in der Excavator-Generation hoffentlich entgültig erledigen, wenn man von den offenbar völlig ungeeigneten IBM-SOI-Prozessen auf FinFET-bulk-Prozesse umsteigt. Carizo wird sicherlich noch FM2+ und 28nm SHP mit weiterhin 512 Shadern, aber alles was danach kommt wird besser. AMD soll ja ein bevorstehendes Tapeout eines 14XM-Prozessor haben. Mal sehen, welcher das ist.

Vielleicht macht es auch ganz einfach keinen Sinn die GPU bei der Bandbreite höher zu takten, außer Strom zu verschwenden.

VooDoo7mx
2013-11-13, 17:21:27
Für mich relativiert sich das was Heise da ankreidet nämlich, wenn vorrangig die GPU nicht so stark ausgefallen ist wie geplant, zumal man auch damit noch die stärkste APU-Grafik bieten können wird.
Nö, Intel GT3 hat beim i7 4770R und i5 4670R 832 GFlops beide haben 65W TDP. Die Kaveri Top Desktop SKU kommt 737 Gflops warscheinlich bei 100W TDP. Was Compute Leistung angeht bleibt Intel weiterhin vorn.

Zumal Intel ab 2. Halbjahr im nächsten Jahr mit Broadwell GT4 noch einmal eine Grafikeinheit mit doppelter Einheitenazahl (40 EU, 640 Shader Cores) bieten wird. Da wird Kaveri in facto Compute Leistung um den Faktor 2 überboten werden.

Blediator16
2013-11-13, 17:32:54
Nö Intel GT3 hat bei 1,3GHz 4770R 832 GFlops und Kaveri Top Desktop SKU 737 Gflops. Was Compute Leistung angeht bleibt Intel weiterhin vorn.

Zumal Intel ab 2. Halbjahr im nächsten Jahr mit Broadwell GT4 noch einmal eine Grafikeinheit mit doppelter Einheitenazahl (40 EU, 640 Shader Cores) bieten wird. Da wird Kaveri in facto Compute Leistung um den Faktor 2 überboten werden.

Wird man GT4 dann auch kaufen können und das bezahlbar :freak:

fondness
2013-11-13, 17:54:55
Nö, Intel GT3 hat beim i7 4770R und i5 4670R 832 GFlops beide haben 65W TDP. Die Kaveri Top Desktop SKU kommt 737 Gflops warscheinlich bei 100W TDP. Was Compute Leistung angeht bleibt Intel weiterhin vorn.


Würde mich nicht wundern wenn AMD ebenfalls ausschließelich 65W TDP bringt. Immerhin gab es schon bei Trinity eine kaum niedriger getaktete Version mit 65W. Und das Topmodell soll diesmla ja nur mit 3,7Ghz takten.

ndrs
2013-11-13, 20:24:41
A10-7850K mit 95W TDP
APU13: 3D-Performance des Kaveri-Spitzenmodells mit 95 Watt in Battlefield 4 (http://www.heise.de/newsticker/meldung/APU13-3D-Performance-des-Kaveri-Spitzenmodells-mit-95-Watt-in-Battlefield-4-2045382.html?wt_mc=rss.ho.beitrag.rdf)

Lowkey
2013-11-13, 20:39:50
30-35 ist nett,aber damit ist BF4 im Multiplayer nicht spielbar :/

Blediator16
2013-11-13, 21:08:31
30-35 ist nett,aber damit ist BF4 im Multiplayer nicht spielbar :/

Vielleicht bringt Mantle ja etwas.

SavageX
2013-11-13, 22:02:28
Hmmm... ich würde ja annehmen, dass man mit 720p auch im Multiplayer zu spielbaren Ergebnissen kommt...

Aber ich sitze hier ja seit jeher vor einem 19" TFT mit 1280x1024 und freue mich wie schön niedrig die Anforderungen an die GraKa sind ;)

CyLord
2013-11-13, 22:36:42
Nö, Intel GT3 hat beim i7 4770R und i5 4670R 832 GFlops beide haben 65W TDP. Die Kaveri Top Desktop SKU kommt 737 Gflops warscheinlich bei 100W TDP. Was Compute Leistung angeht bleibt Intel weiterhin vorn.

Zumal Intel ab 2. Halbjahr im nächsten Jahr mit Broadwell GT4 noch einmal eine Grafikeinheit mit doppelter Einheitenazahl (40 EU, 640 Shader Cores) bieten wird. Da wird Kaveri in facto Compute Leistung um den Faktor 2 überboten werden.

Die 40 EUs existieren doch schon als Iris Pro. Bisher wurden ja auch nur AMDs VLIW-Ableger gegen Intels neue Serie getestet. So kann man davon ausgehen, dass sich das Bild noch ändern wird. Von Faktor 2 würde ich auch nicht ausgehen.

reaperrr
2013-11-14, 13:49:04
Die 40 EUs existieren doch schon als Iris Pro.
Richtig, das ist GT3 und Broadwell wird bei GT3 "nur" 8 EUs draufpacken.

Die GT4 wird dann aber satte 96 EUs auffahren.

Bisher wurden ja auch nur AMDs VLIW-Ableger gegen Intels neue Serie getestet. So kann man davon ausgehen, dass sich das Bild noch ändern wird. Von Faktor 2 würde ich auch nicht ausgehen.
Allerdings soll die Broadwell IGP der größte Architektur-Sprung Intels seit Integration der IGP in die CPU sein. Wer weiß, wieviel das bringt.

ndrs
2013-11-14, 14:26:41
Allerdings soll die Broadwell IGP der größte Architektur-Sprung Intels seit Integration der IGP in die CPU sein. Wer weiß, wieviel das bringt.
Wird die Behauptung nicht jedes Jahr für die kommende Generation wieder aufgewärmt?

mrt
2013-11-14, 15:33:22
Carizo hat nach aktuellem Stand Excavator-Kerne. Falls es doch eher Steamroller+-Kerne sind, dann kommt Excavator spätestens auf 20nm-planar aber auf keinen Fall erst auf 14xm.
Excavator ist eh ein Steamroller-Refresh mit unter anderem AVX2, wird vermutlich im ersten Halbjahr 2015 kommen. Carrizo wird IMO in 20nm GloFo kommen und der Nachfolger in 20nm FinFET 2016, alles andere wäre dann doch überraschend (und sinnlos²).

ndrs
2013-11-14, 16:00:13
Excavator ist eh ein Steamroller-Refresh mit unter anderem AVX2, wird vermutlich im ersten Halbjahr 2015 kommen.
Mit Steamroller+ meinte ich auch eher sowas wie Trinity->Richland, also ein absolutes Minimal-Update.

robbitop
2013-11-14, 17:01:31
Excavator ist eh ein Steamroller-Refresh
Der (immer noch fragliche) geleakte die-Shot sah aber dramatisch anders aus...

mrt
2013-11-14, 17:24:55
Auf der GCC-Patches Mailingliste (http://gcc.gnu.org/ml/gcc-patches/2013-11/msg01237.html) ist von AMD inzwischen ein Patch aufgetaucht, der klar dem Shot widerspricht.

Elkinator
2013-11-17, 01:23:14
Heise haut hier mal ordentlich drauf: http://www.heise.de/newsticker/meldung/APU13-AMD-verfehlt-Performance-Ziel-fuer-Kaveri-deutlich-2044473.html
das macht heise doch bei AMD immer, hätten sie auch bei 1000Gflops gemacht

Excavator ist eh ein Steamroller-Refresh mit unter anderem AVX2
wie kommst du darauf?
du widersprichst dir ja selbst^^

wenn man die FPU auf 2x 256bit verbreitet kann man das nicht mehr refresh nennen...

y33H@
2013-11-17, 11:35:05
c't nennt Fakten direkt in der Headline. Wie üblich passt das aber einigen nicht.

Nakai
2013-11-17, 11:43:22
Auf der GCC-Patches Mailingliste (http://gcc.gnu.org/ml/gcc-patches/2013-11/msg01237.html) ist von AMD inzwischen ein Patch aufgetaucht, der klar dem Shot widerspricht.

+;; The bdver3 and bdver4 contains three pipelined FP units and two integer
+;; units. ;; Fetching and decoding logic is different from previous fam15
+;; processors. Fetching is done every two cycles rather than every cycle
+;; and two decode units are available. The decode units therefore decode
;; four instructions in two cycles.
;;

+/* BDVER4 has optimized REP instruction for medium sized blocks, but for
+ very small blocks it is better to use loop. For large blocks, libcall
+ can do nontemporary accesses and beat inline considerably.

Ansonsten wird bdver4 so ziemlich als bdver3 eingestuft. Naja zu Testzwecken ist das vollkommen in Ordnung....sagt zur Architektur relativ wenig aus. Mal gucken was sich ändert, wenn die Zeit fortschreitet.

mczak
2013-11-17, 15:01:23
wenn man die FPU auf 2x 256bit verbreitet kann man das nicht mehr refresh nennen...
So wie AMD AVX implementiert, nämlich dass die 256bit Float AVX-Befehle im Decoder zu 2x128bit zerlegt werden, ist die Implementierung von AVX2 extrem einfach (man macht genau dasselbe mit den 256bit Int AVX2-Befehlen), ich habe mich schon gefragt wieso Steamroller das nicht können soll, der Aufwand wäre minimal. Auch z.B. den echten Vektorshift den intel endlich endlich mit AVX2 einführt kann selbst Bulldozer schon (als XOP-Befehl), es wäre also nur ein bisschen Dekoder-Logik gefragt.
Ich vermute eher die Herausforderung liegt beim gather Befehl, das ist ja keine eigene Erweiterung sondern gehört fix zu AVX2 (obwohl gather imho durchaus eine eigene Erweiterung verdient hätte, hat so gut wie gar nichts mit dem sonstigen AVX2-Kram zu tun). Wobei eine nicht-performante Implementierung nicht allzu schwierig sein dürfte (und AMD hat auch in der Vergangenheit nicht vor solchen Dingen zurückgeschreckt, man nehme bloss den sse41 dot-product DPPS-Befehl als Beispiel, der ist eine Riesenkatastrophe bei BD), aber möglicherweise ist das auch nicht ganz einfach weil ja die Load/Store Einheiten nicht im SIMD-Cluster sitzen sondern in den Int-Cores, und die Kommunikation zwischen diesen beiden scheint nicht gerade schnell zu sein.
Wobei ich nicht sagen will dass Excavator keine echte 256bit SIMD-Einheit hat, da habe ich keine Ahnung - nur dass das zur Unterstützung von AVX2 mitnichten nötig ist.

Elkinator
2013-11-17, 18:38:31
hab ja auch nicht behauptet das es nötig ist, trotzdem wird die FPU aber breiter werden...

mczak
2013-11-17, 19:53:02
hab ja auch nicht behauptet das es nötig ist, trotzdem wird die FPU aber breiter werden...
Also davon habe ich noch nichts gehört, jedenfalls nichts was man zumindest als "halb-offiziell" bezeichnen könnte. AMD hat zwar ein neues "FPU256" bit definiert irgendwo in den extended features flag bei cpuid (das eben anzeigen soll ob die CPU die Instruktionn native als 256bit ausführt), aber das heisst jetzt nicht unbedingt dass Excavator das schon hat.
Das wäre schon ein grösseres Architekturupdate, denn damit das Sinn ergibt braucht man eben auch breitere L/S Einheiten, das hat dann auch Auswirkungen auf die Caches usw. Mit einer 128bit SIMD-Einheit pro 2 Kerne würde man allerdings gegen die 512bit AVX-512 Einheiten pro Kern der Intel CPUs extrem steinalt aussehen (gut mit etwas Glück kommen die erst etwas später aber selbstverständlich würde das auch schon gegen bloss Haswell extrem mies aussehen).

Skysnake
2013-11-17, 21:22:02
nur kommt das eben nicht mit haswell-e

Elkinator
2013-11-18, 17:57:06
sicher, excavator ist ein kleines update...
http://www.phoronix.com/scan.php?page=news_item&px=MTUxNzk

mrt
2013-11-19, 02:23:05
Phoronix ;D
Davon ab ist das noch immer dieselbe Bulldozer Architektur (Architektur, nicht Intels Marketingarchitekturblaschmarn), dabei macht es keinen Unterschied ob 128 oder 256 Bit breite FPUs oder ob zusätzliche Befehle unterstütz werden.

Elkinator
2013-11-19, 02:43:13
und trotzdem ist es kein kleines update...

ein kleines update war es von bulldozer auf piledriver, das war nur eine neue revision.
piledriver auf steamroller war ein großes update, da würde sehr viel geändert.

HOT
2013-11-19, 13:28:19
SR löst das Frontend-Problem, Excavator das Backend-Problem. Es gibt sicherlich dickere und/oder mehr FPUs, größeren L1D$ usw. im Excavator. Was sich bei den eigentlichen Kernen tut, wird sich zeigen.

2009/2010 45nm ULK HKMG BD-A - Testarchitektur im originalen Planungszustand (K10-Featureset + SSE5) (Nicht konkurrenzfähig und kein HKMG, daher vorzeitiges Projektende)
2010/2011 32nm BD-B - Grundarchitektur mit verbesserter FPU
2010-2012 32nm PD-A - RCM-Design, tiefere BD-Korrekturen (plus Einbau in Orochi)
2010-2012 32nm PD-B - Cancel der Server-CPU mangels Plattform
2012/2013 28nm SR-A - komplette Neustrukturierung des Frontends (Massive Taktprobleme, deshalb Projektende)
2013 28nm SR-B - Aufbohren der Flaschenhälse und Fehlerkorrektur (Cancel der Server-CPU mangels Plattform)
2013-2015 28nm EC-A - Neustrukturierung des Backends inclusive komplett neuer FPU als Ersatz für die provisorische BD-FPU
2011-2015 28nm EC-B - Cancel mangels Plattform und Ersatz im neuen Prozess
2013-2016 14XM EC-B - Performancesteigerung und Fehlerkorrektur der finalen BD-Architektur und Nutzung als APU-SoC-CashCow in allen Varianten (Groß/Mittel/Klein) (Beginn der Wirkung durch die Neuausrichtung der Read-Ära; ein Fertigungsprozess, viele Masken)
2017 14XM neue Architektur - BD-Nachfolger (Entwicklungsbeginn 2011) (Kaum absehbar, was das wird. Sicher keine Nachahmung der Intel-Strategie. Der Erfolg von GCN wird dem sicher Rechnung tragen und auch Erfahrungen aus K7/8/10 und BD werden dort einfließen. Man wird versuchen, die Grenzen der Kerne komplett zu entfernen, sodass es nur noch Threads gibt und man wird versuchen die Begrenzung zwischen CPU und GPU zu entfernen; das wird ein vollintegrierter HSA-Schaltkreis mit x86(und ARM?)-Kompatibilität).

Nur mal ein Einblick wie viel Arbeit und Geld da hineingeflossen ist, für diejenigen, die absurderweise glauben da kommen keine großen CPUs mehr.

Schaffe89
2013-11-21, 02:30:48
c't nennt Fakten direkt in der Headline. Wie üblich passt das aber einigen nicht.

Andreas Stiller in der C´T nennt ebenfalls die Fakten.
Und dass Heise hier spekuliert, ist ebenfalls kein Bashing.

So wie es derzeit aussieht, steht AMD weit unter den Erwartungen, welche sie sich selbst vorgelegt haben.
Der Prozess ist wahrscheinlich mies und hat ein eheres Aufschlagen von Kaveri verhindert.

AMD würde wohl am liebsten alle Prozesse bei Globalfoundries komplett streiche, wenn da nicht die Abkommen wären.
Man zahlt lieber Strafen, als Kaveri Q4 in ordentlichen Stückzahlen zu fertigen.

AMD hat bei Dickschiffen überhaupt keine Chance mehr gegen Intel, die sollen sich mal lieber auf den Low Power Markt und HSA konzentrieren.

Mittlerweile denke ich ebenfalls, dass es keine High Performance CPU´s mehr geben wird, dafür fehlt einfach das Geld.

HOT
2013-11-21, 10:38:37
Auf der GCC-Patches Mailingliste (http://gcc.gnu.org/ml/gcc-patches/2013-11/msg01237.html) ist von AMD inzwischen ein Patch aufgetaucht, der klar dem Shot widerspricht.
Da sich das Frontend kaum ändert und nur das Backend grundlegend, ist das auch kein Wunder. Diese Info ist also äußerst trügerisch.
Excavator ist eh ein Steamroller-Refresh mit unter anderem AVX2, wird vermutlich im ersten Halbjahr 2015 kommen. Carrizo wird IMO in 20nm GloFo kommen und der Nachfolger in 20nm FinFET 2016, alles andere wäre dann doch überraschend (und sinnlos²).
20nm wäre zu spät, da AMD ja jetzt erst sein erstes 20nm Tapeout hatte (ich geht mal von einem TSMC-Grafikchip aus). Das wär einfach zu knapp für eine große CPU, wenn der Januar 2015 erscheinen soll. Viel wahrscheinlicher ist, dass Carizo in 28nm kommt. Das würde auch der Aussage Rechnung tragen, dass es schon Testchips gibt (was auch sehr wahrscheinlich ist). AMD plant aber in Kürze den ersten "14nm FinFET"-Tapeout eines Chips, das kann nur ein 14XM-GloFo-Prozessor sein, da TSMC seinen 20nm FinFET-Prozess "16nm" nennt. Ich bleibe dabei, einen 20nm planar-Prozessor werden von AMD nicht sehen. Nur Grafikchips. Alles weitere ist FinFETs. Ich geh davon aus, dass Excavator-B 14XM ist aber Excavator-A noch 28nm.

mrt
2013-11-21, 13:08:24
Die Anzahl der Pipelines bleibt die selbe, auf dem besagten Die-Shot sah man verdoppelte Ausführungsresourcen, dem ist aber nicht so.
Zur Fertigung, gut möglich, dass AMD 20nm planar überspringt, allerdings kann AMD mit einer 28nm APU in 2015 nicht viel erreichen.
und trotzdem ist es kein kleines update...
Schrieb ich ja auch nicht und nein, Refresh bedeutet nicht zwangsläufig keine/kaum Änderungen.

S940
2013-11-21, 13:24:23
Die Anzahl der Pipelines bleibt die selbe, auf dem besagten Die-Shot sah man verdoppelte Ausführungsresourcen, dem ist aber nicht so.Ich trau dem einen Die-Foto auch nicht über den Weg, aber anhand der GCC-Sourcen kannst Du das nicht folgern. Da steht im Kommentar z.B., dass es erstmal nur copy/paste des Steamrollercodes ist.

S940
2013-11-21, 13:32:10
Andreas Stiller in der C´T nennt ebenfalls die Fakten.Stiller hat letztens gemeint, dass es "fraglich" wäre, ob Kaveri schon hQ bekäme. 2-3 Wochen später auf der APU13 wurde das dann bestätigt.

Seine NDA-Quellen scheinen wohl auch nicht mehr so gut zu sprudeln.

mrt
2013-11-21, 13:34:59
Ich trau dem einen Die-Foto auch nicht über den Weg, aber anhand der GCC-Sourcen kannst Du das nicht folgern. Da steht im Kommentar z.B., dass es erstmal nur copy/paste des Steamrollercodes ist.
Na die Piplines sind fix, lies dir das ganze besser nochmal durch ;) (oder zumindest #647)

Edit:
@S940 hab ich natürlich gelesen bevor ich den Code angeschaut hab.

S940
2013-11-21, 14:18:25
Na die Piplines sind fix, lies dir das ganze besser nochmal durch ;) (oder zumindest #647)

Les Du mal besser die Beschreibung des Patches ;-)

The attached patch (bd4-enablement.patch) enables the next version of AMD's core. New addition to the ISA (AVX2 and BMI2) are enabled for the new core. Presently, the tuning is mostly copied from bdver3. This includes the pipeline modeling too. X86_TUNE_REASSOC_FP_TO_PARALLEL is not enabled (which might be a work in future).

reaperrr
2013-11-22, 14:20:41
Zur Fertigung, gut möglich, dass AMD 20nm planar überspringt, allerdings kann AMD mit einer 28nm APU in 2015 nicht viel erreichen.

Würde mich nicht wundern, wenn bei XV/Carizo erstmals High Density Libraries zum Einsatz kommen.

Gegenüber einem 20nm-Shrink ohne HDL hätte das mindestens zwei gravierende Vorteile:
- Viel niedrigere Wafer-Preise, da älterer Prozess
- viel bessere Yields, da ausgereifter Prozess

Einziger voraussichtlicher Nachteil:
- Niedrigeres Taktpotential durch die dichter gepackten Transistoren.

Ergo, wäre ungleich günstiger herzustellen, wahrscheinlich so viel günstiger, dass wohl selbst bei etwas niedrigeren Verkaufspreisen durch etwas niedrigere Performance noch mehr Marge übrig bliebe.


Würde auch erklären, warum Carizo laut Roadmap-Leaks selbst für Desktop nur in 45W und 65W-Varianten kommen soll. Hohe Taktraten schafft man eh nicht und konzentriert sich deshalb auf Perf./Watt.

Liszca
2013-11-22, 18:47:46
Hohe Taktraten schafft man eh nicht und
konzentriert sich deshalb auf Perf./Watt.

Wurde auch mal Zeit dass sie das MHz rennen aufgeben, habe eh nicht verstanden warum sie wieder damit angefangen haben, schließlich hat Intel es mit dem Pentium 4 auch nicht hinbekommen.

S940
2013-11-23, 05:21:38
Einziger voraussichtlicher Nachteil:
- Niedrigeres Taktpotential durch die dichter gepackten Transistoren.
Wäre fast egal, das Taktpotential von BD kratzt an der 5 GHz Marke. Wenn sie das auf 4,5 GHz senken und dass dafür mit 95W schaffen wäre wohl jeder zufrieden ;-)

OBrian
2013-11-23, 09:48:00
Das Taktpotenzial ist ja auch egal, BD wäre sogar für 8 GHz gut, darum geht es nicht. Sondern es geht um Performance pro Watt. Dieser bescheuerte 9590 zeigt ja, daß die Performance durchaus da wäre, aber leider nur mit untolerierbarem Verbrauch. Man muß also unbedingt Performance pro Watt steigern. Wo der Takt oder die IPC interher landen, ist wirklich nebensächlich. Wenn die nächste CPU nur mit 6,5-7,0 GHz eine ordentliche Performance erreicht, soll es mir egal sein, aber der Vollast-Verbrauch muß um (besser unter) 100 W liegen.

fondness
2013-11-24, 14:34:14
20% mehr CPU-, 30% mehr GPU-Leistung. Die IPC dürfte also deutlich steigen, da die Taktraten ggü. Richland doch um einiges sinken:

http://img27.imageshack.us/img27/3698/hb5c.png (http://imageshack.us/photo/my-images/27/hb5c.png/)

http://wccftech.com/amd-kaveri-apu-steamrollerb-core-features-20-cpu-30-gpu-performance-uplift-richland-platform-details-unveiled/

boxleitnerb
2013-11-24, 14:42:50
Da steht "up to" und es sind auch keine Messwerte. Ich wäre also vorsichtig.

Skysnake
2013-11-24, 14:47:20
16kx16k Max Auflösung? :ugly:

WTF?

Wie soll man das bitte erreichen, das wären ja 8x16 Bildschirme bei max Auflösung/Display von 4096x2160

Undertaker
2013-11-24, 14:55:39
Da steht "up to" und es sind auch keine Messwerte. Ich wäre also vorsichtig.

Es steht vor allem nicht da beim Vergleich zwischen welchen Modellen. Bzgl. IPC kann man da noch nichts herauslesen, evtl. gilt das ja auch für ein ULV-Modell mit deutlich höherem (bzw. besser ausgereiztem) Single Core Turbo.

DinosaurusRex
2013-11-24, 15:36:33
Warum nennt AMD das auf der Folie AMD "Kaveri" 2.0 Platform? Gilt das nicht für den Kaveri der im Januar erscheinen soll?

fondness
2013-11-24, 15:41:53
AMD spricht auch von SteamrollerB-Kernen. Es ist offensichtlich, dass der ursprüngliche Kaveri, der laut alter Roadmap in Q2 erscheinen sollen noch mal überarbeitet wurde und deshalb die Verschiebung stattfand.

DinosaurusRex
2013-11-24, 15:47:25
AMD spricht auch von SteamrollerB-Kernen. Es ist offensichtlich, dass der ursprüngliche Kaveri, der laut ursprünglicher Roadmap in Q2 erscheinen sollen noch mal überarbeitet wurde.

Okay danke.

Das mit dem SteamrollerB würde von der Bezeichnung her aber auch Sinn machen, da AMD für die APUs ja den L3 Cache weglässt. Das man den Kaveri in Kaveri 2.0 umbenennt, nur weil man ihn verschoben hat, finde ich dann eher verwirrend als hilfreich.

Ich wollte mir nämlich eigentlich so einen Kaveri holen im Januar und zwar den Nachfolger des A10-6700.

Schaffe89
2013-11-24, 16:27:33
20% mehr CPU-, 30% mehr GPU-Leistung.

Das up to bedeutet nichts gutes, würde mich nicht wundern, wenn bei der CPU Performance das ein oder andere mal ne +0 da stehen wird, bei Trinity vs, Llano war von up to 25% die Rede wenn ich mich richtig erinnere, da warens am Schluss nur knapp 10% bei einem Mix aus Spielen und Anwendungen.

http://www.sweclockers.com/nyhet/15255-amd-trinity-slapps-den-15-maj

Es waren sogar 29%, wenn man den gleichen Maßstab ansetzt wie AMD damals, dann wird das ein krasser Flop, aber vielleicht ist das maue Marketing mal auf die Idee gekommen nicht immer den Verbraucher täuschen zu wollen.

Lowkey
2013-11-24, 16:59:52
Das Problem bei Trinity war die Serienstreuung. Die Mehrheit der CPUs wollte mehr Spannung als AMD es geplant hatte. Dann hatten sie die Fertigung im Griff und schon gab es mit dem Richland mehr Takt bei gleichem Stromverbrauch bzw. deutlich weniger Spannung bei Trinity Taktraten.
Das zweite Problem ist die Kombination von Quadcpu und Onboard APU. Die Grafik ist einfach zu schwach für einen Quadcore. Kaveri geht das Problem an und verbessert die Grafikleistung, wobei die CPU-Leistung eher stagniert.
Die dritte, aktuelle Lösung für das Speicherproblem ist die Tatsache, dass aktuell 2400er Speicher kaum teurer als 1600er Speicher ist. Kaveri wird dahingehend in Sachen P/L günstiger als Trinity im Gesamtpaket.


Ein neues A88er Board mit Onboard Msata im ITX Faktor + 3 Ghz Dualcore-Kaveri wird wahrscheinlich HTPC Board Nummer1. Ich bin gespannt wie sich die Rechenleistung mit SVP auswirkt. Ich hoffe schwerst auf sichtbare Unterschiede beim Abspielen von Videos in Sachen Stromverbrauch.

Schaffe89
2013-11-24, 17:18:21
Das zweite Problem ist die Kombination von Quadcpu und Onboard APU. Die Grafik ist einfach zu schwach für einen Quadcore. Kaveri geht das Problem an und verbessert die Grafikleistung, wobei die CPU-Leistung eher stagniert. .

Mit Verlaub, ich hab noch nie so einen Blödsinn gelesen, da war nie ein Problem. Das Problem ist eher die langsame CPU und die dort fehlende Effizienz, das ist das was AMD den Absatz verhagelt.

Die dritte, aktuelle Lösung für das Speicherproblem ist die Tatsache, dass aktuell 2400er Speicher kaum teurer als 1600er Speicher ist.

Das ist keine Lösung, sondern ein rumdoktern an den Symptomen. Speicherbandbreite ist ist immernoch eine deutlich Bremse, warum AMD die Pläne von GDDR5 verworfen hat versteh ich nicht, das wäre eine gute Lösung gewesen, vermutlich ist denen aber das Geld für die Umsetzung ausgegangen.

Nakai
2013-11-24, 17:24:10
Es waren sogar 29%, wenn man den gleichen Maßstab ansetzt wie AMD damals, dann wird das ein krasser Flop, aber vielleicht ist das maue Marketing mal auf die Idee gekommen nicht immer den Verbraucher täuschen zu wollen.

Ich glaube, die Meisten interpretieren die Folie falsch. Kaveri 2.0 ist wohl eine sehr stark fürs Mobile-Segment ausgelegte APU. Die gesamte Folie geizt nicht mit Seitenhiebe fürs Mobile-Segment.

35W bis 15W
Angabe von Notebook-Laufzeit
Temperaturabhängige Taktung
Dual GPU-Support mit Crystal-Series(Mobility Serie)
Lightning-Bolt Docking Station
PCIe SSD Interface


Man sieht immer mehr, wie AMD versucht Intels HighEnd-Boliden aus dem Weg zu gehen. Finde ich gut. Wenn das wirklich so kommt, finde ich das gut. So eine 35W APU in einem 14" Notebook wär doch interessant. Mal gucken, ob AMD es besser macht als bei Kabini...

Schaffe89
2013-11-24, 17:29:34
Den Dual GPU Unsinn können die schön langsam mal komplett streichen.
Eine dedizierte GPU ins Notebook zu bauen ist völlig unsinnig, vor allem für AMD´s verkorkstes Dual GPU mit µrucklern.

robbitop
2013-11-24, 17:35:52
Mit Mantle würde es Sinn ergeben (da kein AFR).

AnarchX
2013-11-24, 17:37:39
Selbst mit Mantle wäre wohl AFR sinnvoll, wenn auch die Frameverteilung wohl bessser steuerbar sein sollte.

Knuddelbearli
2013-11-24, 19:20:11
Naja wenn AMD die APU voll auf Mobile auslegt müssen sie sich mal auch um den vertrieb / Ihre Partner kümmern.

AMD hatte schon öfters sehr gute Mobile produkte. Aber kein Schwein / Partner baut damit irgendwas, geschweige den sinnvolles

das_Apo
2013-11-24, 19:21:08
...

Ich wollte mir nämlich eigentlich so einen Kaveri holen im Januar und zwar den Nachfolger des A10-6700.

Ich habe die Befürchtung, dass du ein wenig zu optimistisch bist, was die Verfügbarkeit anbelangt. Denn irgendwie bezweifel ich, dass AMD seine Kaveri APUs pünktlich im Januar oder Februar in den Handel schafft. Wünschen würde ich es mir, weil ich auch momentan am grübeln bin, welche Plattform die Grundlage meines zukünftigen HTPCs bilden wird und Kaveri könnte da ein sehr interessanter Kandidat sein.

robbitop
2013-11-24, 20:21:23
Selbst mit Mantle wäre wohl AFR sinnvoll, wenn auch die Frameverteilung wohl bessser steuerbar sein sollte.

AFR führt bekanntermaßen zu einer ungleichen Verteilung der Frames auf der Zeitachse. Außerdem ist asymmetrisches CF/SLI damit noch anfälliger dafür.

fondness
2013-11-30, 12:39:55
http://img13.imageshack.us/img13/531/tryc.png (http://imageshack.us/photo/my-images/13/tryc.png/)

http://prohardver.hu/teszt/mit_tudhat_a_kaveri_gpu-ja/hd_7750-bol_kaveri_igp-t.html

Effe
2013-11-30, 13:13:35
Bei P3DN gibts ne News dazu mit noch mehr Folien: http://www.planet3dnow.de/cms/6335-amd-kaveri-geleakte-folie-enthuellt-turbo-taktfrequenzen-fuer-a10-7850k-und-a10-7700k/

OBrian
2013-11-30, 14:01:19
http://prohardver.hu/teszt/mit_tudhat_a_kaveri_gpu-ja/hd_7750-bol_kaveri_igp-t.htmlnur bevor irgendwer total hibbelig wird: Die Benchmarks auf Seiten 2 und 3 sind nur theoretische Projektionen, was man wohl erwarten darf. Nicht daß noch irgendwer glaubt, die hätte da tatsächlich ein echtes Sample getestet.

Duplex
2013-11-30, 14:14:56
Kaveri hat ca. >15% mehr CPU & >30% mehr GPU Performance als Richland, ist doch nichts spannendes was AMD dort ankündigt, viel zu spät!
AMD verwendet im Vergleich zu Intel alte billige Prozesse, dadurch werden die Zahlen nicht besser, AMD kann sich nur noch mit Konsolenchips von TSMC (MS & Sony) halten.

boxleitnerb
2013-11-30, 14:16:57
Bei der GPU-Leistung wird man schon vor Haswell liegen, und das sehr ordentlich. Eben weil Intel zu geizig ist, IrisPro außer bei zwei (?) Modellen im Desktop zu verbauen, die nichtmal erhältlich sind.

Duplex
2013-11-30, 14:30:15
Intel kann mehr Chips als AMD ausliefern, die paar % mehr GPU Performance bei AMD sind nicht relevant, dafür hat Intel bessere CPU Performance.

robbitop
2013-11-30, 14:31:45
Kaveri hat ca. >15% mehr CPU & >30% mehr GPU Performance als Richland, ist doch nichts spannendes was AMD dort ankündigt, viel zu spät!
AMD verwendet im Vergleich zu Intel alte billige Prozesse, dadurch werden die Zahlen nicht besser, AMD kann sich nur noch mit Konsolenchips von TSMC (MS & Sony) halten.

Danke Captain Obvious... Intel ist bekanntermaßen mit übermenschlcihen Ressourcen ausgestattet, die AMD nicht hat. AMD wird Intel vermutlich nicht mehr überholen können - aber vieleicht können sie den Rückstand verkürzen. Technisch interessant und gut, dass es (noch) kein Monopol gibt. Wenn du keine Lust auf eine AMD Diskussion hast und dich das Thema anödet, wäre es sinnvoll, solvhen Threads fernzubleiben. ;)

Effe
2013-11-30, 14:33:56
Hauptsache AMD liefert pünktlich im Januar bzw Februar, mein FM2+ -Board ist schon im Warenkorb.

@Duplex: Wolltest Du nicht in den Urlaub?

Schaffe89
2013-12-01, 09:06:18
Intel kann mehr Chips als AMD ausliefern, die paar % mehr GPU Performance bei AMD sind nicht relevant, dafür hat Intel bessere CPU Performance.


Die paar Prozent bessere CPU Leistung sind dafür relevant? Ich kann ja verstehen dass Kaveri nicht besonders schnell wird, aber für den Preisbereich ist die CPU Performance absolut konkurrenzfähig, rede doch nicht immer sonen Unsinn.
Angenommen deine absoluten Aussagen würden stimmen, dann liegt ein 95 Watt Kaveri was CPU Performance angeht im Mittel vor allen Intel 4Threadern, deutlich vor den kleinen i3´s und etwas vor dem i5 "i3" mit Turbo.

Die GPU Performance wird wohl ebenso recht ordentlich sein. Wahrscheinlich duelliert man sich @ mobil mit einer Iris Pro und @ Desktop zieht man an der etwas vorbei. (20%)
Das ist für AMD sehr ordentlich und das nichtmal mit dem erreichen der Zielvorgaben, ergo könnte da noch ein recht solides Update kommen.

Kaveri hat ca. >15% mehr CPU & >30% mehr GPU Performance als Richland, ist doch nichts spannendes was AMD dort ankündigt, viel zu spät!

Woher hast du diese Performancedaten? Quelle? Wieso is das viel zu spät? Intel wird an seiner Iris Pro mit Broadwell auch nichts verändern, kostet ja schon genug in der Herstellung.
GPU seitig verliert man also nicht das Performancerennen, CPU seitig auch nicht, zumindest nicht im angestrebten Performancesegment. ~120 Euro.

Undertaker
2013-12-01, 10:52:26
Die GPU Performance wird wohl ebenso recht ordentlich sein. Wahrscheinlich duelliert man sich @ mobil mit einer Iris Pro und @ Desktop zieht man an der etwas vorbei. (20%)

Eine Konkurrenz zur Iris Pro ist imo auszuschließen – dafür ist der Rückstand einfach viel zu groß:

7660G vs. Iris Pro (http://www.notebookcheck.com/Welche-Spiele-laufen-auf-Notebook-Grafikkarten-fluessig.13827.0.html?type=&sort=&deskornote=0&or=0&search=&month=&benchmark_values=&gpubenchmarks=0&professional=0&archive=1&dx=0&multiplegpus=0&showClassDescription=0&itemselect_4457=4457&itemselect_2891=2891&condensed=0&showCount=0&showBars=0&gameselect%5B%5D=257&gameselect%5B%5D=255&gameselect%5B%5D=251&gameselect%5B%5D=249&gameselect%5B%5D=247&gameselect%5B%5D=245&gameselect%5B%5D=242&gameselect%5B%5D=236&gameselect%5B%5D=232&gameselect%5B%5D=228&gameselect%5B%5D=230&gameselect%5B%5D=225&gameselect%5B%5D=223&gameselect%5B%5D=220&gameselect%5B%5D=217&gameselect%5B%5D=214&gameselect%5B%5D=212&gameselect%5B%5D=210&gameselect%5B%5D=208&gameselect%5B%5D=204&gameselect%5B%5D=202&gameselect%5B%5D=193&gameselect%5B%5D=191&gameselect%5B%5D=188&gameselect%5B%5D=186&gameselect%5B%5D=182&gameselect%5B%5D=180&gameselect%5B%5D=176&gameselect%5B%5D=174&gameselect%5B%5D=170&gameselect%5B%5D=168&gameselect%5B%5D=166&gameselect%5B%5D=172&gameselect%5B%5D=162&gameselect%5B%5D=160&gameselect%5B%5D=158&gameselect%5B%5D=156&gameselect%5B%5D=150&gameselect%5B%5D=152&gameselect%5B%5D=148&gameselect%5B%5D=144&gameselect%5B%5D=142&gameselect%5B%5D=138&gameselect%5B%5D=120&gameselect%5B%5D=129&gameselect%5B%5D=115&gameselect%5B%5D=110&gameselect%5B%5D=112&gameselect%5B%5D=131&gameselect%5B%5D=105&gameselect%5B%5D=114&gameselect%5B%5D=94&gameselect%5B%5D=95&gameselect%5B%5D=86&gameselect%5B%5D=82&gameselect%5B%5D=87&gameselect%5B%5D=79&gameselect%5B%5D=84&gameselect%5B%5D=72&gameselect%5B%5D=71&gameselect%5B%5D=90&gameselect%5B%5D=68&gameselect%5B%5D=67&gameselect%5B%5D=88&gameselect%5B%5D=66&gameselect%5B%5D=83&gameselect%5B%5D=64&gameselect%5B%5D=61&gameselect%5B%5D=58&gameselect%5B%5D=56&gameselect%5B%5D=65&gameselect%5B%5D=55&gameselect%5B%5D=60&gameselect%5B%5D=54&gameselect%5B%5D=89&gameselect%5B%5D=52&gameselect%5B%5D=47&gameselect%5B%5D=44&gameselect%5B%5D=51&gameselect%5B%5D=40&gameselect%5B%5D=39&gameselect%5B%5D=48&gameselect%5B%5D=63&gameselect%5B%5D=45&gameselect%5B%5D=42&gameselect%5B%5D=21&gameselect%5B%5D=18&gameselect%5B%5D=19&gameselect%5B%5D=25&gameselect%5B%5D=41&gameselect%5B%5D=43&gameselect%5B%5D=27&gameselect%5B%5D=26&gameselect%5B%5D=49&gameselect%5B%5D=53&gameselect%5B%5D=28&gameselect%5B%5D=24&gpu_fullname=1&codename=0&architecture=0&pixelshaders=0&vertexshaders=0&corespeed=0&shaderspeed=0&memoryspeed=0&memorybus=0&directx=0&technology=0&daysold=0) (zwar nur Trinity, dafür aber auch nur der 4750HQ)

Hinzu kommt, das jegliche Rohleistungsverbesserung bei Kaveri limitiert durch die Speicheranbindung in der Realität (abseits von 3DMark & Co.) nur sehr bedingt skalieren kann. Das gleiche hat man schon bei der Iris Graphics gesehen.

Duplex
2013-12-01, 12:33:07
Angenommen deine absoluten Aussagen würden stimmen, dann liegt ein 95 Watt Kaveri was CPU Performance angeht im Mittel vor allen Intel 4Threadern, deutlich vor den kleinen i3´s und etwas vor dem i5 "i3" mit Turbo.
Nein, ein i5-4570T ist bereits 15-20% schneller als ein 6800k, dabei hat der i5-4570T nur 35W TDP, Kaveri wird wenn überhaupt nur mit Haswell 2C/4T bei der Performance gleichziehen, bei der Leistungsaufnahme ist Intel weiterhin natürlich vorreiter.
Wenn Intel soviel Strom wie die AMD APUs benötigen würde, dann könnte man CPU & GPU Part deutlich höher takten, Ergebniss wäre dann nochmal deutlich mehr Performance.

Die GPU Performance wird wohl ebenso recht ordentlich sein. Wahrscheinlich duelliert man sich @ mobil mit einer Iris Pro und @ Desktop zieht man an der etwas vorbei. (20%)
Das ist für AMD sehr ordentlich und das nichtmal mit dem erreichen der Zielvorgaben, ergo könnte da noch ein recht solides Update kommen.
Kaveri hat lediglich 1/3 mehr Shader als Richland und nur 720 MHz GPU Takt, ursprünglich hat AMD 1.050 GFLOPS in Aussicht gestellt, jetzt sind es nur noch 856 GFLOPs, realistisch sind 30% mehr GPU Performance als Richland.


Woher hast du diese Performancedaten? Quelle? Wieso is das viel zu spät? Intel wird an seiner Iris Pro mit Broadwell auch nichts verändern, kostet ja schon genug in der Herstellung.
GPU seitig verliert man also nicht das Performancerennen, CPU seitig auch nicht, zumindest nicht im angestrebten Performancesegment. ~120 Euro.
Intel wird bei Broadwell dank 14nm die Anzahl der EUs verdoppeln.

Duplex
2013-12-01, 12:35:11
http://abload.de/img/944x531dkcn5.jpg

Duplex
2013-12-01, 12:37:50
Steamroller B ist nichts anderes außer Excavator A, halt nur in 28nm, ich will garnicht wissen wie Performanceseitig "SR A" ausgesehen hat, vermutlich ein Flop oder ursprünglich für anderen Prozess entwickelt worden.

YfOrU
2013-12-01, 12:51:34
Eine Konkurrenz zur Iris Pro ist imo auszuschließen – dafür ist der Rückstand einfach viel zu groß:
....


Wobei es nicht das wirkliche Dilemma zeigt. Gegenüber den mobilen Haswell mit 20EUs ist nur noch Trinity/Richland (A10) im Vollausbau (384SPs) konkurrenzfähig.
Die Masse an Geräten kommt aber mit A8 und A6 APUs und damit 256SPs. Dagegen ziehen sich HD4400 und HD4600 bei Intel praktisch durch das gesamte Line-up.

fondness
2013-12-01, 13:03:57
Eine Konkurrenz zur Iris Pro ist imo auszuschließen – dafür ist der Rückstand einfach viel zu groß:

7660G vs. Iris Pro (http://www.notebookcheck.com/Welche-Spiele-laufen-auf-Notebook-Grafikkarten-fluessig.13827.0.html?type=&sort=&deskornote=0&or=0&search=&month=&benchmark_values=&gpubenchmarks=0&professional=0&archive=1&dx=0&multiplegpus=0&showClassDescription=0&itemselect_4457=4457&itemselect_2891=2891&condensed=0&showCount=0&showBars=0&gameselect%5B%5D=257&gameselect%5B%5D=255&gameselect%5B%5D=251&gameselect%5B%5D=249&gameselect%5B%5D=247&gameselect%5B%5D=245&gameselect%5B%5D=242&gameselect%5B%5D=236&gameselect%5B%5D=232&gameselect%5B%5D=228&gameselect%5B%5D=230&gameselect%5B%5D=225&gameselect%5B%5D=223&gameselect%5B%5D=220&gameselect%5B%5D=217&gameselect%5B%5D=214&gameselect%5B%5D=212&gameselect%5B%5D=210&gameselect%5B%5D=208&gameselect%5B%5D=204&gameselect%5B%5D=202&gameselect%5B%5D=193&gameselect%5B%5D=191&gameselect%5B%5D=188&gameselect%5B%5D=186&gameselect%5B%5D=182&gameselect%5B%5D=180&gameselect%5B%5D=176&gameselect%5B%5D=174&gameselect%5B%5D=170&gameselect%5B%5D=168&gameselect%5B%5D=166&gameselect%5B%5D=172&gameselect%5B%5D=162&gameselect%5B%5D=160&gameselect%5B%5D=158&gameselect%5B%5D=156&gameselect%5B%5D=150&gameselect%5B%5D=152&gameselect%5B%5D=148&gameselect%5B%5D=144&gameselect%5B%5D=142&gameselect%5B%5D=138&gameselect%5B%5D=120&gameselect%5B%5D=129&gameselect%5B%5D=115&gameselect%5B%5D=110&gameselect%5B%5D=112&gameselect%5B%5D=131&gameselect%5B%5D=105&gameselect%5B%5D=114&gameselect%5B%5D=94&gameselect%5B%5D=95&gameselect%5B%5D=86&gameselect%5B%5D=82&gameselect%5B%5D=87&gameselect%5B%5D=79&gameselect%5B%5D=84&gameselect%5B%5D=72&gameselect%5B%5D=71&gameselect%5B%5D=90&gameselect%5B%5D=68&gameselect%5B%5D=67&gameselect%5B%5D=88&gameselect%5B%5D=66&gameselect%5B%5D=83&gameselect%5B%5D=64&gameselect%5B%5D=61&gameselect%5B%5D=58&gameselect%5B%5D=56&gameselect%5B%5D=65&gameselect%5B%5D=55&gameselect%5B%5D=60&gameselect%5B%5D=54&gameselect%5B%5D=89&gameselect%5B%5D=52&gameselect%5B%5D=47&gameselect%5B%5D=44&gameselect%5B%5D=51&gameselect%5B%5D=40&gameselect%5B%5D=39&gameselect%5B%5D=48&gameselect%5B%5D=63&gameselect%5B%5D=45&gameselect%5B%5D=42&gameselect%5B%5D=21&gameselect%5B%5D=18&gameselect%5B%5D=19&gameselect%5B%5D=25&gameselect%5B%5D=41&gameselect%5B%5D=43&gameselect%5B%5D=27&gameselect%5B%5D=26&gameselect%5B%5D=49&gameselect%5B%5D=53&gameselect%5B%5D=28&gameselect%5B%5D=24&gpu_fullname=1&codename=0&architecture=0&pixelshaders=0&vertexshaders=0&corespeed=0&shaderspeed=0&memoryspeed=0&memorybus=0&directx=0&technology=0&daysold=0) (zwar nur Trinity, dafür aber auch nur der 4750HQ)

Hinzu kommt, das jegliche Rohleistungsverbesserung bei Kaveri limitiert durch die Speicheranbindung in der Realität (abseits von 3DMark & Co.) nur sehr bedingt skalieren kann. Das gleiche hat man schon bei der Iris Graphics gesehen.

Auch nur weil Intel dank überlegenen Fertigungsprozess ganz andere TDP-Spielräume im mobilen Bereich hat. Am Desktop wird die GPU durchaus mit Iris PRO gleichziehen - und das ohne dickem Speicher auf dem Package.

YfOrU
2013-12-01, 13:14:53
Natürlich. Allerdings ist die IGP bei stationären Systemen grundsätzlich weniger relevant und bezogen auf den Bereich wo es wirklich das Optimum darstellt landet man eher wieder bei den mobilen SKUs (kompakte Geräteformate abseits von ATX/ITX).

Undertaker
2013-12-01, 15:08:46
Wobei es nicht das wirkliche Dilemma zeigt. Gegenüber den mobilen Haswell mit 20EUs ist nur noch Trinity/Richland (A10) im Vollausbau (384SPs) konkurrenzfähig.
Die Masse an Geräten kommt aber mit A8 und A6 APUs und damit 256SPs. Dagegen ziehen sich HD4400 und HD4600 bei Intel praktisch durch das gesamte Line-up.

Da hast du natürlich Recht, allerdings zielt ja selbst der A10 nur auf Core-i3-Notebooks – A8 (256 SPs), A6 (192 SPs) und A4 (128 SPs) müssen darum auch nur gegen die HD Graphics mit 10 EUs antreten. Sonst würde es wirklich düster aussehen...

Auch nur weil Intel dank überlegenen Fertigungsprozess ganz andere TDP-Spielräume im mobilen Bereich hat. Am Desktop wird die GPU durchaus mit Iris PRO gleichziehen - und das ohne dickem Speicher auf dem Package.

Statt Speicher auf dem Package gibt es bei AMD dafür "dicken" DDR3-2133, während die Iris Pro nur mit DDR3-1600 antritt. Desktop halte ich aber sowieso für irrelevant, hier sind dedizierte Grafikkarten einfach zu günstig und im Vergleich zu jeder IGP viel zu stark, zudem stört ein möglicher Mehrverbrauch im Leerlauf oder der zusätzliche Platzbedarf idR kaum. Da kauf ich doch eher einen kleinen Xeon + GPU oder einen Athlon/FX + billigen Speicher + GPU. Gerade Intel behandelt den Desktop-Markt diesbezüglich ja sehr stiefmüttlerlich: Weder wird das zusätzliche TDP-Potential eines Desktops ausgenutzt noch gibt es non-OEM-Modelle mit Sockel.

robbitop
2013-12-01, 15:35:44
Steamroller B ist nichts anderes außer Excavator A, halt nur in 28nm, ich will garnicht wissen wie Performanceseitig "SR A" ausgesehen hat, vermutlich ein Flop oder ursprünglich für anderen Prozess entwickelt worden.

Quelle?

Nakai
2013-12-01, 16:48:23
Quelle?

Gibt es nicht. Es ist wohl nur ein erweiterter Steamroller, welcher für das mobile Segment optimiert wurde. Besserer Turbo, hier und da einige Optimierungen, etc.
Im Ernst, man wird nicht Steamroller durch Excavator ersetzt haben. Zum einen wird Excavator noch nicht so weit sein und zum anderen wird man nicht den gesamten Aufwand für Kaveri einfach so canceln.

Solche Entwicklungen wie der ACP, ein dediziertes PCIe SSD-Interface, etc. kostet natürlich Zeit ist aber einfacher hinzuzufügen. So eine Chipentwicklung ist ein höchst iterativer Prozess, welche sich mehrere Jahre hinzieht. Die VHDL/Verilog-Implementierung unterscheidet sich dabei nicht so sehr von einer generellen Software-Entwicklung. Sicherlich gibt es hier andere Entwicklungparadigmen, aber im Grunde wird nichts anderes getan, als ein festgelegtes und geplantes Featureset mit einer Hardwarebeschreibungssprache zu implementieren.

Kaveris CPU-Design wurde wohl schon vor einiger Zeit implementiert, größere Änderungen sind da nicht so ohne weiteres mehr möglich, ohne dass ein riesiger Rattenschwanz hinterhergezogen wird. Da wird wirklich draufgeguckt, welche Verbesserungen welchen Vorteil bringen. Im Grunde ist eine Chipentwicklung nichts anderes als ein Kompromiss, bei dem ermittelt wird, was nun auf Hardware und was in Software läuft. Eine CPU tut ja nichts anderes als Software auszuführen. Je nach Fall wird überlegt, wie es in Hardware gegossen werden kann und welche Vorteile es bringt.

Das wird kein ExcavatorA sein, sondern nur ein leicht optimierter Steamroller.
Die ganzen anderen Features machen eher Kaveri 2.0 aus. Es ist einfacher komplette zusätzliche Funktionalitäten hinzuzufügen als bestehende Funktionalitäten zu erweitern/verbessern.

Locuza
2013-12-01, 17:34:54
Edit: Der Quatsch hier verwirrt mich schon.

robbitop
2013-12-02, 09:29:15
Gibt es nicht.

Eben. Dann braucht man nämlich nicht so einen Unfug schreiben und dadurch falsche Dinge verbreiten. Wenn dann hätte er es als persönliche Mutmaßung kennzeichnen können.

Zum Rest: Zustimmung

YfOrU
2013-12-02, 10:32:32
Da hast du natürlich Recht, allerdings zielt ja selbst der A10 nur auf Core-i3-Notebooks – A8 (256 SPs), A6 (192 SPs) und A4 (128 SPs) müssen darum auch nur gegen die HD Graphics mit 10 EUs antreten. Sonst würde es wirklich düster aussehen...

Der Markt bzw. genaugenommen Intel spielt dabei nicht mit:
http://geizhals.at/de/?cat=nb&xf=2379_13~29_AMD+A4-3M~29_AMD+A4-4M~29_AMD+A6-3M~29_AMD+A6-4M~29_AMD+A6-5M~29_AMD+A8-3M~29_AMD+A8-4M~29_AMD+A8-5M~29_AMD+A10-4M~29_AMD+A10-5M~29_Core+i3-3~29_Core+i3-4~29_Core+i5-3~29_Core+i5-4#xf_top
Wie jedes Jahr wieder drückt Intel die Vorgängergeneration (IB/IB ULV-> HD4000) brutal in den Markt und selbst neue Geräte mit i5-4200U bzw. i3-4000M oder i3-4010U sind für 400 bis 500€ zu haben. Es gibt deshalb kaum Trinity/Richland Notebooks welche entsprechend zum Gesamtprodukt einen attraktiven Preis haben. Die alte HD4000 ist von den mobilen 256SP AMD IGPs auch nicht weit entfernt.

Schon fast obligatorische Kuriosität: Ein Intel Haswell Notebook mit dedizierter AMD Radeon 8750M hat die höchste 3D Performance unter 500€:
http://geizhals.at/de/acer-aspire-e1-572g-54204g50dnkk-nx-m8jeg-018-a1021421.html
Gibt es als Aspire V5 (ebenfalls 8750M) zum gleichen Preis (~470€) auch mit AMD APU. Allerdings nur mit A6-5357M (2C) und der ist einem i5 ULT Haswell in jeder Hinsicht unterlegen.

Die Produktauswahl ist zu gering, die Konfigurationen sind oft fragwürdig (günstigstes A10 Notebook mit dedizierter GPU) und der Preis ist abseits von vielleicht zwei Ausnahmen im Schnitt zu hoch. Bezogen auf das Portfolio an mobilen APUs sehe ich auch den seltenen Vollausbau als problematisch an. Um sich wenigstens hier vernünftig gegenüber Intel positionieren zu können muss sich das mit Kaveri ändern.

HOT
2013-12-02, 12:32:37
Vielleicht gibts immer noch zu viel Ausschuss bei der 32nm-Grafikeinheit. AFAIK wurde das Problem nie ganz gelöst.

YfOrU
2013-12-02, 13:15:25
Davon ist eigentlich auszugehen. Allerdings zieht sich das inzwischen über Jahre seit Llano mit VLIW5 GPU wie ein roter Faden durch das Portfolio. Neben dem Prozess dürfte wohl auch eine geringe Redundanz eine Rolle spielen. Die Die Shots (Trinity) sehen nicht so aus als wäre nennenswerter Spielraum bei den SIMD Engines vorhanden.

Duplex
2013-12-02, 13:56:33
Quelle?
Seit Bulldozer "Zambezi" > Piledriver "Vishera" sollte man doch wissen das die Architektur Bezeichnung nicht mehr viel taugen, Bulldozer & Piledriver sind die selbe Architektur, Vishera hat zu 100% kein Clock Mesh, beide unterscheiden sich nur bei der Revision, B2 > C0 Stepping.

Bei Steamroller hat AMD das Frontend verbessert, Excavator wird vermutlich wie Zambezi > Vishera nur noch weiter optimiert, Kaveri A wurde gecancelt, stattdessen kam Richland als Ersatz, ich bin mir sicher das AMD als Basis ExcavatorA genommen hat, Anfang 2015 sollte Excavator B dann ausreichend optimiert worden sein, deshalb auch niedrige TDPs (45-65W).

Gipsel
2013-12-02, 14:34:09
Neben dem Prozess dürfte wohl auch eine geringe Redundanz eine Rolle spielen. Die Die Shots (Trinity) sehen nicht so aus als wäre nennenswerter Spielraum bei den SIMD Engines vorhanden.Woran siehst Du das denn? Und was ist bei Pitcairn (R270 kommt z.B. genauso wie R270X nur noch voll aktiviert mit allen 20 CUs, gibt kein Salvage-Modell mit deaktivierten Einheiten mehr in der Linie), Tahiti oder Hawaii anders?

HOT
2013-12-02, 16:13:51
Seit Bulldozer "Zambezi" > Piledriver "Vishera" sollte man doch wissen das die Architektur Bezeichnung nicht mehr viel taugen, Bulldozer & Piledriver sind die selbe Architektur, Vishera hat zu 100% kein Clock Mesh, beide unterscheiden sich nur bei der Revision, B2 > C0 Stepping.

Was wohl in erster Linie daran liegt, dass die "C0" für den Orochi gelten, also nicht viel mit den Piledriver-Kernen zu tun hat. Es gab wohl mal einen B3 und einen C0-Bulldozer. Man hat 1/2 Jahr mehr da drauf gelegt und stattdessen Piledriver in die vorhandene Infrastruktur eingesetzt. Ergo ist das immer noch ein Orochi C0, aber mit Piledriver-Modulen. Bereiche, die von der Infrastruktur abhängig sind, also auch RCM, funktionieren natürlich mit Orochi nicht, das hat man einfach weggelassen. Aber Piledriver ist schon eine starke Veränderung ggü. Bulldozer, eben wegen RCM. Das war sicher recht aufwändig, das zu implementieren, das würd ich nicht unterschätzen. Ist zwar das gleiche Featureset, aber eben doch ein ganz anderes Modul.

-BD-A = 45nm BD (war nix)
-BD-B = 32nm BD (nicht fertig, wahrscheinlich Provisorium für 32nm ULK)
-PD-A = Trinity/Vishera (Provisorium)/Richland (Provisorium)
-PD-B = Komodo+Terramar+Sepang (war nix)/Warsaw? (Provisorium)
-SR-A = Kaveri A (Fiel aus)
-SR-B = Kaveri B (Provisorium)/Dublin+Macau (war nix)
-EC-A = Carrizo
-EC-B = 14XM-Excavator für Groß und Klein?


Bei Steamroller hat AMD das Frontend verbessert, Excavator wird vermutlich wie Zambezi > Vishera nur noch weiter optimiert, Kaveri A wurde gecancelt, stattdessen kam Richland als Ersatz, ich bin mir sicher das AMD als Basis ExcavatorA genommen hat, Anfang 2015 sollte Excavator B dann ausreichend optimiert worden sein, deshalb auch niedrige TDPs (45-65W).
In dem Punkt der Integration in die Infrastruktur geb ich dir recht, das ist wie Vishera oder Kaveri-B. Aber in Sachen Module war der Sprung von BD zu PD heftig, wenn man RCM bedenkt. Es wird schon einige Änderungen geben.

S940
2013-12-02, 16:17:29
Ergo ist das immer noch ein Orochi C0, aber mit Piledriver-Modulen.
Gegen die Sichtweise spricht die CPUID, das Teil meldet sich als Model 3h, Piledriver müsste aber irgendwas zw. 10h und 19h sein.

Alles ziemlich verworren bei dem Teil, halt mit heißer Nadel gestrickt.

robbitop
2013-12-02, 16:33:38
Seit Bulldozer "Zambezi" > Piledriver "Vishera" sollte man doch wissen das die Architektur Bezeichnung nicht mehr viel taugen, Bulldozer & Piledriver sind die selbe Architektur, Vishera hat zu 100% kein Clock Mesh, beide unterscheiden sich nur bei der Revision, B2 > C0 Stepping.

Bei Steamroller hat AMD das Frontend verbessert, Excavator wird vermutlich wie Zambezi > Vishera nur noch weiter optimiert, Kaveri A wurde gecancelt, stattdessen kam Richland als Ersatz, ich bin mir sicher das AMD als Basis ExcavatorA genommen hat, Anfang 2015 sollte Excavator B dann ausreichend optimiert worden sein, deshalb auch niedrige TDPs (45-65W).
Also pure Spekulation. Dann stelle es auch so dar.

HOT
2013-12-02, 16:50:37
Gegen die Sichtweise spricht die CPUID, das Teil meldet sich als Model 3h, Piledriver müsste aber irgendwas zw. 10h und 19h sein.

Alles ziemlich verworren bei dem Teil, halt mit heißer Nadel gestrickt.
Jup und man strickt ja weiter. Bennenung ist aber bei dem Teil eher Schall und Rauch, spricht also nicht wirklich dagegen. Entscheidend ist der minimale Kostenaufwand. Es geht nur um Detailverbesserungen vor allem um die Yields zu optimieren. Richland ist das was ähnliches. Bloss keine Kosten in irgend einer Form erzeugen mit dem 28/32nm Mist. Während Trinity sicherlich nah an Llano dran ist im Uncore bringt Kaveri-B seit langem eine erneuerte uncore-Infastruktur mit, die wird beim Carrizo übernommen. Erst was danach kommt ist nicht mehr provisorisch. Man erinnere sich, dass Excavator in 20nm SHP oder 16nm kommen sollte, sicher mit neuer Sockel-Infrastruktur!
Bis 2016 ist Durststrecke bei AMD. Es sieht eben für mich so aus, als würde man alles auf eine neue µArch setzen für 2016.

Duplex
2013-12-02, 17:13:00
Ergo ist das immer noch ein Orochi C0, aber mit Piledriver-Modulen.
Ursprünglich gab es Piledriver nicht.

Bulldozer > Enhanced Bulldozer > Next Generation Bulldozer

45nm High K > 32nm > 22nm

Steamroller war mal ursprünglich in 22nm SOI geplant, eig. ist SR die 2. BD Generation, irgendwo im Netz sollte es noch Folien geben.

YfOrU
2013-12-02, 17:18:00
Woran siehst Du das denn? Und was ist bei Pitcairn (R270 kommt z.B. genauso wie R270X nur noch voll aktiviert mit allen 20 CUs, gibt kein Salvage-Modell mit deaktivierten Einheiten mehr in der Linie), Tahiti oder Hawaii anders?

Nur noch bei Hawaii mit 2816/176/64 bzw. 2560/160/64. Meine Vermutung ist das GCN aufgrund der größeren Flexibilität eine höhere Ausbeute ermöglicht (Redundanzen kostengünstiger zu integrieren).

HOT
2013-12-02, 17:22:05
Ursprünglich gab es Piledriver nicht.

Bulldozer > Enhanced Bulldozer > Next Generation Bulldozer

45nm High K > 32nm > 22nm

Steamroller war mal ursprünglich in 22nm SOI geplant, eig. ist SR die 2. BD Generation, irgendwo im Netz sollte es noch Folien geben.
- 2010 Ur-BD = BD Gen.1 SSE5+AMD-FMA3 in 45nm PDSOI GF-HKMG+ULK mit K10-Uncore
- 2011 32nm-BD = BD Gen.1 AVX+AMD-FMA4 in 32nm PDSOI GF-HKMG Gen.2+ULK mit Orochi-Uncore
- 2012 Enhanced-BD = Piledriver, also BD+RCM und Flaschenhalsaufweitung mit Komodo-Uncore in 32nm PDSOI GF-HKMG Gen.2+ULK
- 2013 BD-Ver.2 = SR, also Neudesign Frontend mit Komodo-Uncore in 22nm PDSOI GF-HKMG + ULK + HDLibs
- 2015 BD-Ver.3 = EC, also Neudesign Backend mit neue uncore-Infrastruktur (DDR4 usw) in 16nm PDSOI GF-HKMG + ULK + HDLibs

Alles nur umbenannt. Dirk Meyer wollte da richtig Geld versenken um den Abstand aufzuholen. Das machten die Eigentümer nicht mit. Die ULK-Katastrophe in 32nm, die gescheiterten GloFo SOI-Grafikchips und der Adreno-Verkauf gab Meyer den Rest. Die Geschichte gab den Eigentümern Recht, denn IBM hat es Anfang 2014 erst auf 22nm geschafft und von 16nm ist nichts zu sehen, stattdessen denkt IBM über sein ETSOI nach, das ist also ein echter Wunschtraum gewesen. Read kehrte IBM komplett den Rücken und bastelte zig Provisorien mit dem was man hat und gab was komplett Neues in Auftrag.

Akkarin
2013-12-02, 17:33:38
Könnte wer so nett sein und nochmal erklären was Orochi ist (ich nehme an der ganze uncore kram ?) und wie genau sich das mit den h-modulen (also beispielweise 3h) einteilt ?

Gipsel
2013-12-02, 17:41:45
Nur noch bei Hawaii mit 2816/176/64 bzw. 2560/160/64. Meine Vermutung ist das GCN aufgrund der größeren Flexibilität eine höhere Ausbeute ermöglicht (Redundanzen kostengünstiger zu integrieren).Also siehst Du gar nichts auf den Dieshots. :rolleyes:

HOT
2013-12-02, 17:52:44
Könnte wer so nett sein und nochmal erklären was Orochi ist (ich nehme an der ganze uncore kram ?) und wie genau sich das mit den h-modulen (also beispielweise 3h) einteilt ?
Orochi ist der Uncore-Bereich, richtig. Ich nehme an, dass man ein PD-Modul etwas umbauen musste, um es kompatibel zu machen. Das nannte man 3h. Wahrscheinlich war einfach die Nummer noch frei...

Nakai
2013-12-02, 18:36:19
Wurde das schon gepostet?

http://browser.primatelabs.com/geekbench3/compare/223722?baseline=243265
http://browser.primatelabs.com/geekbench3/compare/223722?baseline=243278
http://browser.primatelabs.com/geekbench3/compare/223722?baseline=243287

Kaveri ist schon nicht schwach. Die etwas miesere Memory-Performance lässt sich auf den fehlenden L3-Cache zurückführen. Ansonsten ist SRB etwa 10-30% flotter als Piledriver.

S940
2013-12-02, 18:41:51
Orochi ist der Uncore-Bereich, richtig.
Was wie wo? Ne Orochi ist der letzte Nicht-Marketingcodename fürs komplette Bulldozer Die mit 4 Modulen, 4xHypertransport und 8 MB L3.
Ich nehme an, dass man ein PD-Modul etwas umbauen musste, um es kompatibel zu machen. Das nannte man 3h. Wahrscheinlich war einfach die Nummer noch frei...
Ne, es gibt ja auch Architekturunterschiede zw. beiden Piledrivern. Dann ist da noch die Sache mit der IDIV-Einheit, die zwar seit den ersten BD vorhanden ist, aber noch deaktiviert war.
Würde mich wirklich nicht wundern, wenn der OR-C0 nur ein Bugfix ist/war. Freie Nummern zw. 10 und 19 hätts auch noch zu genüge gegeben ;-)

Nakai
2013-12-02, 18:52:26
Bis 2016 ist Durststrecke bei AMD. Es sieht eben für mich so aus, als würde man alles auf eine neue µArch setzen für 2016.

IMO wird man auf die Katzenschiene gehen.

www.agner.org/optimize/microarchitecture.pdf

Bobcat und Jaguar sind anscheinend ziemlich gut ausgeglichene Architekturen. Das Design ist so ziemlich auf 2fach-Skalarität ausgelegt. Würde man darauf aufbauen und das gesamte konsequent verbreitern und das Frontend verbessern(Branchprediction, Decoder, etc.), wäre das eine ziemlich gute Architektur...imo.

YfOrU
2013-12-02, 18:53:16
Also siehst Du gar nichts auf den Dieshots. :rolleyes:

Es sind nicht mehr SIMD Cores zu sehen als der Vollausbau hat. Bei den GCN basierten APUs der Konsolen geht AMD zum Beispiel einen andren Weg und hat zusätzliche CUs integriert. Bei Intel sieht es wohl ähnlich aus.
http://www.anandtech.com/show/6355/intels-haswell-architecture/12

HOT
2013-12-02, 19:17:12
Was wie wo? Ne Orochi ist der letzte Nicht-Marketingcodename fürs komplette Bulldozer Die mit 4 Modulen, 4xHypertransport und 8 MB L3.

Ne, es gibt ja auch Architekturunterschiede zw. beiden Piledrivern. Dann ist da noch die Sache mit der IDIV-Einheit, die zwar seit den ersten BD vorhanden ist, aber noch deaktiviert war.
Würde mich wirklich nicht wundern, wenn der OR-C0 nur ein Bugfix ist/war. Freie Nummern zw. 10 und 19 hätts auch noch zu genüge gegeben ;-)
So gesehen ist das dann so.

disap.ed
2013-12-02, 23:23:54
Wurde das schon gepostet?

http://browser.primatelabs.com/geekbench3/compare/223722?baseline=243265
http://browser.primatelabs.com/geekbench3/compare/223722?baseline=243278
http://browser.primatelabs.com/geekbench3/compare/223722?baseline=243287

Kaveri ist schon nicht schwach. Die etwas miesere Memory-Performance lässt sich auf den fehlenden L3-Cache zurückführen. Ansonsten ist SRB etwa 10-30% flotter als Piledriver.

Warum steht da "1 processor, 2 cores, 4 threads " EDIT: Achso, der 8350 wurde wahrscheinlich für die Vergleichbarkeit "geköpft"
Kommt die schlechtere AES und Dijkstra performance auch vom fehlenden L3-Cache?

Nakai
2013-12-02, 23:32:35
Warum steht da "1 processor, 2 cores, 4 threads " EDIT: Achso, der 8350 wurde wahrscheinlich für die Vergleichbarkeit "geköpft"
Kommt die schlechtere AES und Dijkstra performance auch vom fehlenden L3-Cache?

Mhh, keine Ahnung. Womöglich brauchen die Benches soviel Speicher und Speicherzugriffe, welche durch einen globalen L3-Cache gut gecacht werden. Kaveri hat keinen L3-Cache, Piledriver schon. Vll kann jemand anderes mehr dazu sagen.

S940
2013-12-02, 23:56:12
Kommt die schlechtere AES und Dijkstra performance auch vom fehlenden L3-Cache?
Könnte auch an der reorganisierten FPU liegen. Die hat nur noch 3 statt 4 Ports, da wirds also ein größeres "Verstopfungsrisiko" geben.

Schaffe89
2013-12-03, 22:30:29
Klar ist der Schwach, im Mittel sind das ~10% mehr IPC, das wird ein Flop.

robbitop
2013-12-04, 11:19:17
AMD gab ja IIRC an, dass jeder Architektursprung bis Excavator 10...15 % bringt. Ist der 28 nm Prozess von Kaveri nun eigentlich noch PD-SOI oder bereits bulk?

HOT
2013-12-04, 12:43:18
Es gibt drei Möglichkeiten:
1.) Es ist ein anderer Name für 22nm SOI ohne ULK (28nm SHP)
2.) Es ist ein Bulk-HP-Prozess, der für die Fab in Dresden entwickelt wurde, vielleicht mit ULK 2.0 (28nm SHP)
3.) Es ist ein FDSOI-HP-Prozess für Dresden (28nm SHP)

Nakai
2013-12-04, 15:53:54
Klar ist der Schwach, im Mittel sind das ~10% mehr IPC, das wird ein Flop.

Wieso? Die CPU-Performance ist endlich so weit, dass ich hier kein schlechtes Bauchgefühl hab. Ebenso ist die GPU auf einem ordentlichen Techlevel. Wenn die ein Notebook bringen, mit allen SPs, allen geworbenen Features und genug CPU-Takt, dann würde ich mir sowas sofort kaufen. Maximal 14" natürlich. ;)

Ich will auf jeden Fall mal etwas mit HSA rumspielen...

Könnte auch an der reorganisierten FPU liegen. Die hat nur noch 3 statt 4 Ports, da wirds also ein größeres "Verstopfungsrisiko" geben.

Ist auch ne Möglichkeit. Man sieht schön, wie die FPU-Performance etwas einbricht, wenn man auf Multicore geht. Anscheinend verstopft hier und da doch etwas. ;)
Aber im Schnitt ist man 10-20% vor einem gleichgetakteten Piledriver.

Was mir bei so einer APU einfach fehlt ist ein vollkommener globaler L3-Cache für GPU und CPU. Der müsste dann so groß sein um Speicherzugriffe effektiv für GPU und CPU zu cachen. Damit würde man dem Bottleneck der mickrigen Speicherbandbreite etwas umgehen. Intel baut ja schon einen EDRAM rein...
...womöglich warten die auf HMC...

Gipsel
2013-12-04, 18:34:48
Die 128MB als DRAM ausgeführtem L4-Cache bei IrisPro ist ein extra Die. insofern wird das nicht wirklich integriert, sondern nur mit auf Package gepackt (auf dem dann schlicht zwei Dies nebeneinander sitzen).

Liszca
2013-12-05, 00:32:40
Die 128MB als DRAM ausgeführtem L4-Cache bei IrisPro ist ein extra Die. insofern wird das nicht wirklich integriert, sondern nur mit auf Package gepackt (auf dem dann schlicht zwei Dies nebeneinander sitzen).

würde man 128mb dram in jedemfall mit einem kühlkörper versehen müssen?

AnarchX
2013-12-05, 09:40:11
würde man 128mb dram in jedemfall mit einem kühlkörper versehen müssen?
At idle, simply refreshing whatever data is stored within, the Crystalwell die will consume between 0.5W and 1W. Under load, operating at full bandwidth, the power usage is 3.5 - 4.5W.
http://www.anandtech.com/show/6993/intel-iris-pro-5200-graphics-review-core-i74950hq-tested/3
Nicht wirklich.
Die Package-Lage bedingt sich aus dem geringeren Aufwand für Leiterbahnen und Interfaces. Bei Mobo-Lage wäre das deutlich aufwendiger.

Skysnake
2013-12-05, 13:20:08
/sign

Auch wäre das Interface an sich viel komplexer und Energiehungrig, was bei dem Hintergedanke Energie sparen zu wollen natürlich ein schuss ins eigene Knie wäre.

Schaffe89
2013-12-05, 16:15:55
Wieso? Die CPU-Performance ist endlich so weit, dass ich hier kein schlechtes Bauchgefühl hab. Ebenso ist die GPU auf einem ordentlichen Techlevel. Wenn die ein Notebook bringen, mit allen SPs, allen geworbenen Features und genug CPU-Takt, dann würde ich mir sowas sofort kaufen. Maximal 14" natürlich.

Ich hab ein schlechtes Bauchgefühl, weil 10% Takt fehlen, was man wahrscheinlich nicht eingeplant hat.

Nakai
2013-12-05, 16:41:45
Ich hab ein schlechtes Bauchgefühl, weil 10% Takt fehlen, was man wahrscheinlich nicht eingeplant hat.

Die Taktraten kommen schon noch irgendwann. Das Problem ist einfach, man wollte/will weniger Strom verbrauchen, als mit Richland/Trinity. Es sieht einfach so aus, dass nicht sehr viele Chips gut genug sind, die Taktraten bei einem guten Stromverbrauch zu erreichen. Das sind aber nur Yieldsachen und könnte in einem halben Jahr anders aussehen. Der original Kaveri wurde gecancelt, ergo könnten viele Probleme auch damit zu tun haben. Zusätzliche Features kosten eben Transistoren und Energie. Diese Features sehe ich im mobilen Bereich teilweise als notwendig an. Ahja, das Problem des Fertigungsprozesses könnte auch bestehen. GF ist doch irgendwie unerprobt.

...ich sehe es eh nur bei AMD bergaufgehen. Die Konsolen stabilisieren das Unternehmen. Wenn die Verkaufszahlen wirklich die prognostizierten 8 Mill im H1 2014 erreichen, ist das ein riesen Erfolg.

Skysnake
2013-12-05, 16:58:40
Naja, Sie haben ja auch viel Luft nach oben, aber nur wenig nach unten ;)

Nakai
2013-12-05, 18:54:37
Die 128MB als DRAM ausgeführtem L4-Cache bei IrisPro ist ein extra Die. insofern wird das nicht wirklich integriert, sondern nur mit auf Package gepackt (auf dem dann schlicht zwei Dies nebeneinander sitzen).

Ich finde das Konzept ziemlich gut. Für den L4-Cache muss wohl ein extra Interface bereitgestellt werden.

Warum AMD das nicht tut, finde ich irgendwie fraglich. Sicherlich kostet es nicht wenig R&D und so einfach kann es nicht integriert werden. Würde es mit HSA in Konflikt gehen?

AMDs APUs brauchen Bandbreite.

Naja, Sie haben ja auch viel Luft nach oben, aber nur wenig nach unten

Naja Bulldozer & Co. hat AMD beinahe das Knick gebrochen. Man sieht jedoch gut, dass sie sehr progressiv in neue Märkte vordringen wollen. Einen richtigen Durchbruch wird man wohl nie schaffen. Wie schonmal von jemand anders gesagt worden, bis 2016 wird es für AMD schwierig werden...bis Bulldozer endlich abgelöst wird. Ich denke, die werden eine neue CPU-Architektur entwickeln welche auf den Wildkatzen basiert.

Skysnake
2013-12-05, 20:58:44
AMD arbeitet durchaus daran. GF hat ja soweit ich mich erinnere in Zusammenarbeit mit AMD ja schon vor längerer Zeit MCM mit DRAM onPackage bzw stacked DRAM on Package gezeigt.

Das ist wohl eher weniger eine Frage des wollens, als auch des Prinzipiell könnens, als viel mehr des wirtschaftlich umsetzbaren.

Man sieht ja sehr gut an Intel, wie teuer und schwierig die Fertigung sein muss. Intel bedient nicht ohne Grund nur einen so kleinen Markt mit der entsprechenden Lösung.

Schaffe89
2013-12-05, 23:33:29
ie Taktraten kommen schon noch irgendwann.

Inwiefern ist das ein Argument, oder relevant? Dass die irgenwann mal kommen mögen, ist höchstens nen kleinen Lacher wert.

Das Problem ist einfach, man wollte/will weniger Strom verbrauchen, als mit Richland/Trinity.

Ne das Problem ist Globalfoundries unzureichender Prozess der es nichtmal möglich macht, endlich auf eine zeitgemäße TDP zu wechseln ( 55 oder 65 Watt ) und zudem, wo will AMD weniger Strom verbrauchen? Ich sehe da nichts was darauf hindeutet.

Es sieht einfach so aus, dass nicht sehr viele Chips gut genug sind, die Taktraten bei einem guten Stromverbrauch zu erreichen. Das sind aber nur Yieldsachen und könnte in einem halben Jahr anders aussehen.

Nein das sind ganz und gar nicht nur Yieldsachen, sondern ganz normale Limitationen durch den Prozess oder das Design.
AMD hat bei Richland gegenüber TRinity im laufe der Zeit 5% Takt hinzugegeben, bei llano waren es 2 bis 3%, das ist doch recht wenig im Vergleich zum fehlenden Takt zu Richland, der Takt kommt ganz sicher eher nicht.

Zusätzliche Features kosten eben Transistoren und Energie.

Welche Features sind da gemeint, die KAveri 1.0 nicht hatte?

ich sehe es eh nur bei AMD bergaufgehen.

Konsolen ja, Desktop + mobile nein, ganz und gar nicht, das geht stetig bergab und würde sagen, dass AMD den Trend nicht mehr rumreißen kann, völlig unmöglich angesichts des Starken Gegners.
AMD hat sich zudem mit dem wegwerfen des ATI Brands keinen Gefallen getan, AMD mögen halt nicht viele, alleine schon weil sie mit der Marke langsame, stromhungrige Prozessoren verbinden und das dann mit den Grafikkarten vermischen.

Pirx
2013-12-06, 09:09:00
Ich hab ein schlechtes Bauchgefühl, weil 10% Takt fehlen, was man wahrscheinlich nicht eingeplant hat.
Inwiefern ist alleine die Taktrate ein Argument?:rolleyes:
Wann wird deine AMD=Negativ-Phase endlich beendet sein? Ist ja nicht zum aushalten.*kopfschüttel*

Zero-11
2013-12-06, 21:18:19
AMD hat sich zudem mit dem wegwerfen des ATI Brands keinen Gefallen getan, AMD mögen halt nicht viele, alleine schon weil sie mit der Marke langsame, stromhungrige Prozessoren verbinden und das dann mit den Grafikkarten vermischen.

Da geht es mir anders Ich habe Intel und ATI Grafik gemieden wie die Pest aber so seit der 5000er Serie machen die sich ganz gut bzw. sehe ich hier eine Verbesserung. AMD hat hier die Treiberentwicklung schon vorrangebracht.

robbitop
2013-12-07, 00:35:07
Natürlich ist GF, wie alle anderen auch, meilenweit von Intels Fertigung entfernt. Der große Rückstand in Punkto Leistung und Effizienz geht aber ebenfalls auch großteils (IMO sogar zum größeren Teil) auf das Design zurück. Man schaue sich mal an, wo Intel mit SB bei 32 nm war. Da kann AMD nur von träumen. Es würde mich auch nicht überraschen, wenn sie selbst mit 14xn dort noch nicht angekommen sind (insbesondere Effizienz im mobilen Bereich).

HarryHirsch
2013-12-07, 01:09:39
Gegen Intel ist bekanntlich kein Kraut gewachsen. Aber ich denke nicht das das Design das Problem ist.
Die Effizienz bleibt irgendwo auf der Strecke.

robbitop
2013-12-07, 10:12:18
Gegen Intel ist bekanntlich kein Kraut gewachsen. Aber ich denke nicht das das Design das Problem ist.
Die Effizienz bleibt irgendwo auf der Strecke.
Wenn es nicht das Design wäre, sondern der Fertigungsprozess, hätte wäre man längst in Sandy Bridge Regionen. Ist man aber nicht. Davon kann AMD nur träumen...

Knuddelbearli
2013-12-07, 10:20:50
wer sagt das TSMCs /GloFos 32nm vergleichbar mit Intels 32nm ist?

Gerade aktuell sind es doch komplett andere Prozesse mit SOI gegen Bulk.

Duplex
2013-12-07, 11:38:34
Natürlich ist GF, wie alle anderen auch, meilenweit von Intels Fertigung entfernt. Der große Rückstand in Punkto Leistung und Effizienz geht aber ebenfalls auch großteils (IMO sogar zum größeren Teil) auf das Design zurück. Man schaue sich mal an, wo Intel mit SB bei 32 nm war. Da kann AMD nur von träumen. Es würde mich auch nicht überraschen, wenn sie selbst mit 14xn dort noch nicht angekommen sind (insbesondere Effizienz im mobilen Bereich).
sign

grobi
2013-12-07, 11:38:37
wer sagt das TSMCs /GloFos 32nm vergleichbar mit Intels 32nm ist?

Gerade aktuell sind es doch komplett andere Prozesse mit SOI gegen Bulk.


Nur ist Intel ohne SOI ausgekommen was ja mal ein Vorteil sein sollte.


gruß grobi

Knuddelbearli
2013-12-07, 13:25:38
Naja sollte andererseits schwenkt GF nicht umsonst auf Bulk um, Fertigung damit ist halt teurer und schwerer.

Dazu noch gate first vs gate last usw

einfach zu sagen das es an der Architektur liegt das AMD trotz selber Strukturbreite lahmer ist einfach vermessen da Fertigung absolut nicht vergleichbar