PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : AMD - AMDs Bulldozer - neue CPU-Architektur für Q2 2011


Seiten : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 [21] 22 23 24 25

MiamiNice
2011-09-23, 13:24:19
Kann ich mir irgendwie nicht vorstellen. Wen es so sein sollte gehe ich davon aus das Intel das auch wüsste. In dem Fall wäre AMD schon lange weg vom Fenster. Intel spielt doch seit jahren imho nur mit AMD. Intel könnte massiv schnellere CPU an den Markt bringen und die Preise so in den Keller fahren das selbst AMD als Günstigkrauter nicht mehr nach kommt. Das ganze für 1 - 2 Jahre und AMD wäre sowas von Geschichte.

Kurz: AMD lebt aktuell nur noch weil Intel recht AMD freundlich ist. Glaube nicht das Intel so freundlich wäre wen sie von den Wettbewerbshüter nichts zu fürchten hätten.

boxleitnerb
2011-09-23, 13:30:38
Dass sie was massiv Schnelleres bringen könnten glaub ich nicht, wir kommst du darauf?

Sie müssen schon innerhalb von ca. 130W TDP bleiben, sonst kaufts keiner. Klar könnten sie selektieren und nur die besten Chips verkaufen, aber dann bricht der Gewinn ein und das ist in einem börsennotierten Unternehmen keine Option.

foenfrisur
2011-09-23, 13:35:13
das traurige ist doch, das menschen im computersektor so kleinkariert denken, das eine firma versagt hat, wenn sie mal nicht das schnellste produkt auf dem markt haben.

und es deswegen auch nicht kaufen...obwohl das produkt vielleicht gut ist.

mfg

Ronny145
2011-09-23, 13:35:27
Dass sie was massiv Schnelleres bringen könnten glaub ich nicht, wir kommst du darauf?


Sie könnten einen nativen 6 Kerner ohne IGP in den Mainstream bringen wenn sie wollten.

Sir Integral Wingate Hellsing
2011-09-23, 13:37:21
Kann ich mir irgendwie nicht vorstellen. Wen es so sein sollte gehe ich davon aus das Intel das auch wüsste. In dem Fall wäre AMD schon lange weg vom Fenster. Intel spielt doch seit jahren imho nur mit AMD. Intel könnte massiv schnellere CPU an den Markt bringen und die Preise so in den Keller fahren das selbst AMD als Günstigkrauter nicht mehr nach kommt. Das ganze für 1 - 2 Jahre und AMD wäre sowas von Geschichte.

Kurz: AMD lebt aktuell nur noch weil Intel recht AMD freundlich ist. Glaube nicht das Intel so freundlich wäre wen sie von den Wettbewerbshüter nichts zu fürchten hätten.

http://ht4u.net//news2/news_images/amd_quartalsvergleich_q2_2011.png

AMD hatte schon schlechtere Zahlen in der Vergangenheit und hat überlebt.
Btw: Auch AMD hat Intel schon in der Vergangenheit Schwierigkeiten gemacht (K7/K8). Und selbst wenn sie mit BD Miese machen, mit BD2/Trinity wirds wieder laufen - Pleite gehen werden sie nicht, egal ob mit oder ohne Intels Segen ;)

LovesuckZ
2011-09-23, 13:39:59
http://ht4u.net//news2/news_images/amd_quartalsvergleich_q2_2011.png

AMD hatte schon schlechtere Zahlen in der Vergangenheit und hat überlebt.
Btw: Auch AMD hat Intel schon in der Vergangenheit Schwierigkeiten gemacht (K7/K8). Und selbst wenn sie mit BD Miese machen, mit BD2/Trinity wirds wieder laufen - Pleite gehen werden sie nicht, egal ob mit oder ohne Intels Segen ;)

Schau dir den netto Gewinn an. Das sind gerade mal 4,5% vom Umsatz. Das ist Nokia-Niveau. ;)

boxleitnerb
2011-09-23, 13:40:08
Sie könnten einen nativen 6 Kerner ohne IGP in den Mainstream bringen wenn sie wollten.

Das wäre aber vermutlich nicht massiv schneller wie Sandy-E. Und da die meiste Software immer noch 4 Threads und weniger benutzt, würde das den meisten nicht wirklich nutzen. Eine 4C-Sandy mit 4 GHz stock wär mir da lieber.

Sir Integral Wingate Hellsing
2011-09-23, 13:42:24
Schau dir den netto Gewinn an. Das sind gerade mal 4,5% vom Umsatz. Das ist Nokia-Niveau. ;)

Wayne? Es ging darum, dass sie nicht gleich Pleite gehen.

Ronny145
2011-09-23, 13:46:13
Das wäre aber vermutlich nicht massiv schneller wie Sandy-E. Und da die meiste Software immer noch 4 Threads und weniger benutzt, würde das den meisten nicht wirklich nutzen. Eine 4C-Sandy mit 4 GHz stock wär mir da lieber.


Unter Singlethread ist Intel auch so klar schneller. Ein Lichtblick ist multithreading wo AMD mit mehr Kernen die geringere Kernleistung ausgleicht. Mit Mainstream sixcores von Intel wäre der Vorteil dahin.

LovesuckZ
2011-09-23, 13:48:31
Wayne? Es ging darum, dass sie nicht gleich Pleite gehen.

Gleich bestimmt nicht. Aber fakt ist, wenn die Premium-Produkte nicht einschlagen, wird es sehr ungemütlich.

Brazos muss gegen ARM-SoCs ran, Trinity sich mit Intel's CPU in 22nm rumschlagen und Bulldozer in Version 1 scheint wohl ein Flop zu werden. Es kann sehr schnell passieren, dass man auch mit dem Netto-Gewinn ins Minus rutscht. Und dann kann man die Fertigung nicht mehr als Grund vorschieben.

Es ist daher wichtig für AMD, dass Bulldozer überzeugt.

MiamiNice
2011-09-23, 13:51:39
Wayne? Es ging darum, dass sie nicht gleich Pleite gehen.

Nope, es ging darum das L233 behauptet Intel hätte nix zu befürchten wen AMD pleite gehen sollte. Dem kann einfach nicht so sein, sonst wäre AMD schon weg, behaupte ich.

Intel bräuchte nur massiv an der Preisschraube drehen für 1 - 2 Jahre und könnte dazu noch die Taktreserver von Sandy ausnutzen. Wie gesagt ich glaube nicht daran was L233 schreibt.

Sir Integral Wingate Hellsing
2011-09-23, 14:01:18
Gleich bestimmt nicht. Aber fakt ist, wenn die Premium-Produkte nicht einschlagen, wird es sehr ungemütlich.

Brazos muss gegen ARM-SoCs ran, Trinity sich mit Intel's CPU in 22nm rumschlagen und Bulldozer in Version 1 scheint wohl ein Flop zu werden. Es kann sehr schnell passieren, dass man auch mit dem Netto-Gewinn ins Minus rutscht. Und dann kann man die Fertigung nicht mehr als Grund vorschieben.

Es ist daher wichtig für AMD, dass Bulldozer überzeugt.


Mit Premiumprodukten verdient man kein Geld (so lange man nicht Mercedes oder Ferrari heisst)! Glaubst du Intel verdient dick am 2700k oder damals am P4 EE?

Brazos und ARM vergleichen ist sinnlos (da verliert ARM in Sachen Leistung und gewinnt in Sachen Leistungsaufnahme).

Falls es dir (bei deiner eigenen Argumentation) nicht aufgefallen ist: Reine CPU-Leistung juckt heutzutage die wenigsten!
Wir waren vor Jahren schon bei 2-3 GHz+, heutzutage wird nur noch am IPC bzw an der Core-Anzahl gedreht...

Wir sind im Intel HD2000/3000 bzw AMD Llano Zeitalter, die Kombi aus CPU/GPU ist die Zukunft. In Sachen CPU liegt Intel vorne, in Sachen GPU AMD - so what?

LZ und ich sind seit gut 9 Jahren hier gereggt, ich glaube wir (und natürlich viele andere) haben in dieser Zeit mindestens schon 3x wenn nicht 4-5x über den Untergang von AMD diskutiert...

Coda
2011-09-23, 14:37:34
Sind halt seine feuchten Träume.

L233
2011-09-23, 15:25:41
Selten so ein Quark gelesen. Und die Quelle ist ja auch sehr seriös...
Aktuelles Bsp.: Fusion von AT&T + T-Mobile USA - Klagen von Bundesstaaten etc.
Dein "aktuelles Beispiel" taugt nichts und Du hast keine Ahnung, wovon Du redest. Man sollte sich ein wenig kundig machen, bevor man so dick aufträgt .

1. Eine Fusion zu unterbinden ist etwas anderes, als ein bestehendes Unternehmen zu zerschlagen oder bestehende Strukturen zu entflechten - schon allein aus juristischer Sicht. Zumal die Fusion ja NOCH LANGE NICHT vom Tisch ist und wohl gerichtlich entschieden wird - was mein Zitat dann wieder Relevant macht.

2. Der zitierte Adam Levitin (http://www.law.georgetown.edu/faculty/levitin/) ist ein Professor für Rechtswissenschaften an der Georgetown University und wird in Washinton bei diversen Sentate Committee Hearings oft und gerne als Sachverständiger hinzugezogen. Wenn so jemand sagt "the US pretty much does not do antitrust any more", dann hat das für mich mehr Gewicht als das "Selten so ein Quark gelesen." von jemandem wie Dir.

3. Das Blog NakedCapitalism (http://en.wikipedia.org/wiki/Naked_Capitalism) ist eines der meistbesuchten Wirtschaftsblogs überhaupt und ist auf der Liste der 25 Wichtigsten Finanzblogs des Time Magazine. Es wird betrieben von Yves Smith (http://www.politico.com/arena/bio/yves_smith.html), einer langjährigen Wall Street Insiderin. Dort findet man Analysen in einer Tiefe und Breite, die Du in keiner vermeintlich "serösen" Quelle findest, wo bestenfalls halbkomptente Ressortjournalisten über Dinge flachwichsen, die Sie selbst nur aus dritter oder vierter Hand kennen.

4. Die Kartellwächter in den USA sind schon seit längerer Zeit extrem unternehmensfreundlich. Selbst die spektakulären Fälle die letzten 2 Jahrzehnte endeten in der Regel in einem Vergleich mit kaum spürbaren Auswirkungen auf die Unternehmen. Der sprichwörtliche Klaps auf den Handrücken eben.

5. Glaubst Du ernsthaft, dass Intel als Konzern zerlegt wird, wenn AMD aufgrund der eigenen Inkompetenz Hops geht? Inwiefern würde es AMD helfen, technologisch konkurrenzfähiger zu werden, wenn Intel als Konzern entflochten wird? Das würde die CPUs von Intel nicht schlechter und die von AMD nicht besser machen und letztendlich entscheidet der Markt über Erfolg und Miserfolg.

Skysnake
2011-09-23, 15:51:54
Das wäre aber vermutlich nicht massiv schneller wie Sandy-E. Und da die meiste Software immer noch 4 Threads und weniger benutzt, würde das den meisten nicht wirklich nutzen. Eine 4C-Sandy mit 4 GHz stock wär mir da lieber.
Das IST dann praktisch SBE wie er für den Desktop kommt... :rolleyes:

Das Quadchannelinterface mal raus genommen. Das macht den Kohl aber auch nicht mehr fett.

Ronny145
2011-09-23, 15:53:48
Das IST dann praktisch SBE wie er für den Desktop kommt... :rolleyes:



Das ist wahrscheinlich ein nativer 8 Kerner.

boxleitnerb
2011-09-23, 15:56:05
Das IST dann praktisch SBE wie er für den Desktop kommt... :rolleyes:

Das Quadchannelinterface mal raus genommen. Das macht den Kohl aber auch nicht mehr fett.

Nein ist er nicht, oder taktet der mit 4 GHz (nicht Turbo)? Was MiamiNice behauptet hat, ist nicht haltbar, nicht in der Realität, in der ein Unternehmen Gewinne machen will. Man würde sich nicht nur die Marge kaputtmachen mit Selektion sondern auch den Markt für die nächste Generation kannibalisieren.

Skysnake
2011-09-23, 15:56:17
Ja, bei dem halt 1/4 der Kerne putt sind und? Ist trotzdem die CPU, die als SB-E für den Desktop kommt als Topmodell. Du unterscheidest doch auch nicht alle unterschiedlich kaputten CPUs, die es so am Markt gibt.

Gut hier ist das Topmodell teilweise kaputt, aber was bessers gibt es halt nicht. Man unterscheidet ja auch zwischen GF100 und GF110.

Ronny145
2011-09-23, 16:09:07
Ja, bei dem halt 1/4 der Kerne putt sind und? Ist trotzdem die CPU, die als SB-E für den Desktop kommt als Topmodell.


Mit der Die Größe wäre das High-End. Ein nativer sixcore wäre wirtschaftlicher, günstiger anzubieten.

boxleitnerb
2011-09-23, 16:16:51
Ja, bei dem halt 1/4 der Kerne putt sind und? Ist trotzdem die CPU, die als SB-E für den Desktop kommt als Topmodell. Du unterscheidest doch auch nicht alle unterschiedlich kaputten CPUs, die es so am Markt gibt.

Gut hier ist das Topmodell teilweise kaputt, aber was bessers gibt es halt nicht. Man unterscheidet ja auch zwischen GF100 und GF110.

Was willst du mit den kaputten Modellen? Meine Aussage ist doch ganz klar gewesen. Man kann keine "massiv schnelleren" CPUs anbieten als man es jetzt schon tut bzw. mit Sandy-E tun wird. Sei es aus technischen (TDP) oder wirtschaftlichen (Marge) Gründen.

Wie man es dreht und wendet, es geht nicht. Kleine Stückzahl, sehr gut selektierte CPUs: Hoher Preis - keiner kaufts. Niedriger Preis - keiner kauft die Modelle darunter. So oder so kann man mit selektierten Chips auch nicht den ganzen Markt bedienen.

Skysnake
2011-09-23, 16:20:46
Und was hab ich dagegen gesagt?

Ich sagte nur, das es die so angedachte CPU eben gibt, nämlich SB-E

Wenn Intel AMD aus dem Markt drängen wollen würde, würden Sie einfach ihre CPUs zu den Herstellungskosten oder etwas darunter verramschen. Das hält Intel locker 2-5 Jahre durch. AMD ist aber sicherlich nach einem weg vom Fester.

Wenn Intel das aber macht, dann stehen die Wettbewerbshüter schneller auf dem Teppich als die "Bye Bye AMD" sagen können.

Spike2
2011-09-23, 16:59:17
das traurige ist doch, das menschen im computersektor so kleinkariert denken, das eine firma versagt hat, wenn sie mal nicht das schnellste produkt auf dem markt haben.

und es deswegen auch nicht kaufen...obwohl das produkt vielleicht gut ist.

mfg
Aber das ist ja das Problem: Das Produkt scheint nicht gut zu werden. Wenn ich Benchmarks sehe, wo ein PhenomII X6 mit dem BD den Boden wischt, dann kaufe ich mir doch lieber noch schnell einen solchen PhenomII, bevor er vom Markt verschwindet, und mache einen großen Bogen um den BD - oder man wechselt zu intel.


Sie könnten einen nativen 6 Kerner ohne IGP in den Mainstream bringen wenn sie wollten.
Hat AMD schon getan :) Wo wäre da also die große Sensation, wenn intel dies täte?

Quaker
2011-09-23, 17:10:59
Aber das ist ja das Problem: Das Produkt scheint nicht gut zu werden. Wenn ich Benchmarks sehe, wo ein PhenomII X6 mit dem BD den Boden wischt, dann kaufe ich mir doch lieber noch schnell einen solchen PhenomII, bevor er vom Markt verschwindet, und mache einen großen Bogen um den BD - oder man wechselt zu intel.



Hat AMD schon getan :) Wo wäre da also die große Sensation, wenn intel dies täte?
Deiner Denkweise nach sind also z.bsp. auch alle Autos die nicht 320km/h fahren alle schlecht? Warum also ein langsameres kaufen wenn es doch schnellere gibt...

foenfrisur
2011-09-23, 17:14:35
OT:
was bringen dir 320km/h, wenn du nur in der stadt unterwegs bist ;)

mfg

_flx
2011-09-23, 17:15:48
Deiner Denkweise nach sind also z.bsp. auch alle Autos die nicht 320km/h fahren alle schlecht? Warum also ein langsameres kaufen wenn es doch schnellere gibt...


um in der Metapher zu bleiben; wir wollen hier Rennen fahren, was bringt mir also ein Golf wenn ich auch einen 911er haben kann?

Soll ja nicht heißen das ein Golf RS ein langsames Auto ist... aber im vergleich zum 911er sieht er halt kein Land ;)

Quaker
2011-09-23, 17:15:55
OT:
was bringen dir 320km/h, wenn du nur in der stadt unterwegs bist ;)

mfg
Was bringen Dir schnelle Benches wenn es Dir in der Praxis doch nix bringt?

Ronny145
2011-09-23, 17:23:22
Hat AMD schon getan :) Wo wäre da also die große Sensation, wenn intel dies täte?

Du hast den Zusammenhang nicht verstanden. AMD kann froh sein, dass Intel kein Bedarf an sixcores im Mainstream hat. Es ging darum, dass Intel sie anbieten könnte. Im Gegensatz zu AMD muss Intel jedoch momentan die Kernzahl im Mainstream nicht steigern. Ein nativer sixcore SB ohne IGP wäre mit Sicherheit auch um einiges kleiner als Bulldozer mit seinen 315 mm².

Spike2
2011-09-23, 17:28:14
Deiner Denkweise nach sind also z.bsp. auch alle Autos die nicht 320km/h fahren alle schlecht? Warum also ein langsameres kaufen wenn es doch schnellere gibt...
Anders als bei einem Auto, wo es noch Aspekte wie Sicherheit, Komfort und Design gibt, ist bei einer CPU nun einmal primär die Geschwindigkeit entscheidend. Und wenn da ein Nachfolgemodell in einigen Benches vom Vorgänger (mit weniger Kernen!) abgehängt wird, dann kann man nicht von einem guten Produkt sprechen.


Du hast den Zusammenhang nicht verstanden. (...)
Hatte ich offenbar tatsächlich nicht. Danke für Deine Ausführungen, jetzt ist's klarer, wie es gemeint war.

S940
2011-09-23, 17:47:20
Wie immer muss man sich aber eigentlich nur einen Screen ansehen, und man weiß, dass das auch absolut kein Wunder ist. AIDA64 Sreen halt :rolleyes:

Ich frag mich echt, warum er das immer dazu postet. Da sieht doch jeder, das man auf die Werte absolut nichts geben kann.

HALLO! L1 Write Wert gerade mal 1/3 vom X6. Ja ne is klar. :ugly: Es ist ja nicht so, das man nicht ständig Werte in den L1 schreiben müsste :ugly:
Naja anstatt Write Back gibts bei BD nur nen Write Thrugh L1. Dass der Wert also geringer ausfällt ist glasklar, da (auch) in den L2 geschrieben werden muss. Allerdings sind die L2 und L3 Werte schon komisch. Möglich, das damit dann auch der L1 Write steigen würde, wenn der L2 entsprechend schneller werden würde.

Mal abwarten. Im Hinterkopf klingelt noch ne komplizierte Cache Kohärenzsache, eventuell verursacht die irgendwelche Probleme:
While the L1D is mostly included in the L2, there are some situations where lines can reside in the L1D without being present in the L2. As a result, the L1D may need to be snooped when another core misses in the L3 cache. This is extremely undesirable, since there will be substantial snoop traffic in a Bulldozer system which will cost both power and performance if the L1D caches must always be snooped by remote cache misses. http://www.realworldtech.com/page.cfm?ArticleID=RWT082610181333&p=9

Falls das die Achillesferse sein sollte, könnte der FX4 richtig gut werden, je weniger Kerne, desto weniger Snoops *g*

foenfrisur
2011-09-23, 18:00:24
was aber schon ziemlich blöde wäre, wenn amd auf mehrere kerne setzt und alles darauf auslegt, aber man dann insgesamt mit leistungsverlust leben muss, wenn es mehr kerne werden.

mfg

Spasstiger
2011-09-23, 18:05:54
AMD bringt dafür ein Design, was es wieder erlaubt, ein wenig an der Taktschraube zu drehen. Vielleicht sehen wir in 32 nm ja noch 5,0 GHz @ Turbocore ab Werk.

foenfrisur
2011-09-23, 18:08:48
da könnte intel nur leider problemlos gegenhalten ;)
und da ist es heute schon nichtmal mehr ein "vielleicht", denn sie haben schon das potential.

na mal sehen, obs ein BD wird...mein x6 reicht mir auch noch ;)

mfg

S940
2011-09-23, 18:10:34
was aber schon ziemlich blöde wäre, wenn amd auf mehrere kerne setzt und alles darauf auslegt, aber man dann insgesamt mit leistungsverlust leben muss, wenn es mehr kerne werden.

Naja, ist halt die Frage, was das kleinere Übel ist.
Es kommen ja auch relativ kurzfristig 2 Updates raus, da kann man für die erste Generation schon ein paar "dicke Hunde" erwarten :freak:
na mal sehen, obs ein BD wird...mein x6 reicht mir auch noch
Da kannst Du schön auf die Piledriver Generation warten, vielleicht kommt die ja wirklich noch für AM3+.

Ronny145
2011-09-23, 19:54:52
http://www.abload.de/img/198jb.jpg

http://www.abload.de/img/3r8mt.jpg

http://www.abload.de/img/4y8ge.jpg
http://obrovsky.blogspot.com/2011/09/bulldozer-is-crap-ive-told-you-proof.html


Ich hoffe zum Launch gibt es genauere Infos woran es hapert. Man kann nur hoffen, dass sich in einer C-Revision Bremsklötze lösen lassen.

dildo4u
2011-09-23, 20:00:08
Praktisch 1 zu 1 die 1100T Score? Autsch.

http://www.computerbase.de/artikel/prozessoren/2011/test-intel-core-i3-2100t/16/#abschnitt_cinebench_r115

Ronny145
2011-09-23, 20:01:38
Praktisch 1 zu 1 die 1100T Score? Autsch.

http://www.computerbase.de/artikel/prozessoren/2011/test-intel-core-i3-2100t/16/#abschnitt_cinebench_r115


Der Wert ist ohne Turbo. (corescn 3,6 Ghz= 5,93).

...Oder der Turbo geht nicht auf 3,9 Ghz in CB 11.5.

Knuddelbearli
2011-09-23, 20:03:55
hmm 30% oc? hoffe mal unter luft unter ohne selektion dann ists nichtmal schlecht ( auf jedenfall viel besser als phenom2 zuletzt )

zumindest etwas ^^

Felixxz2
2011-09-23, 20:09:00
Hey immerhin 0,06 Punkte mehr, er ist auf jeden Fall mal nicht langsamer :freak:

S940
2011-09-23, 20:10:24
Wieso zeigt der Cinebench screen nen Intel Rechner unter OSX ??
Naja, wird wohl der übliche AMD Fehler sein ^^

dildo4u
2011-09-23, 20:13:16
Wieso zeigt der Cinebench screen nen Intel Rechner unter OSX ??
Naja, wird wohl der übliche AMD Fehler sein ^^
Die haben einfach den Screen von der Cinebench Producktseite genommen.

Ganz unten.
http://www.maxon.net/de/downloads/cinebench.html

Ronny145
2011-09-23, 20:13:32
Wieso zeigt der Cinebench screen nen Intel Rechner unter OSX ??
Naja, wird wohl der übliche AMD Fehler sein ^^


Hab ich auch schon gesehen. Na ich denke mal wenn er vor hatte das zu faken, hätte er gleich einen FX-8150 genommen für den Slide. So spricht das eher noch für die Korrektheit.

Die haben einfach den Screen von der Cinebench Producktseite genommen.

Ganz unten.
http://www.maxon.net/de/downloads/cinebench.html


Ah ok das ist einleuchtend.

S940
2011-09-23, 20:22:14
Die haben einfach den Screen von der Cinebench Producktseite genommen.

Ganz unten.
http://www.maxon.net/de/downloads/cinebench.html
Thx, irgendwie trotzdem komisch, aber naja, sieht dann eher plausibel aus.

Ansonsten: 2-2,2GHz L3 Takt .. ist ja auch nicht gerade die Welt. Das haben wir doch jetzt schon *g*
Naja, sollte dann wenigstens schöne OC Reserven geben ^^

fondness
2011-09-23, 20:35:47
http://www.abload.de/img/198jb.jpg

http://www.abload.de/img/3r8mt.jpg

http://www.abload.de/img/4y8ge.jpg
http://obrovsky.blogspot.com/2011/09/bulldozer-is-crap-ive-told-you-proof.html


Ich hoffe zum Launch gibt es genauere Infos woran es hapert. Man kann nur hoffen, dass sich in einer C-Revision Bremsklötze lösen lassen.

Damit ist die Single-Thread-Leistung deutlich unter einem Phenom II und selbst Multi-Threading nur minimal höher. Ich frage mich warum man so einen Chip überhaupt veröffentlicht. Ein schneller Shrink der bestehenden Architektur wäre da die deutlich bessere Lösung gewesen. Ähnlich wie schon Sandtiger hätte man einen solchen Chip eigentlich einstampfen müssen und ihn erst veröffentlichen dürfen wenn die Architektur auch ein entsprechend Potential hat gut zu werden.

S940
2011-09-23, 20:44:07
Damit ist die Single-Thread-Leistung deutlich unter einem Phenom II und selbst Multi-Threading nur minimal höher. Ich frage mich warum man so einen Chip überhaupt veröffentlicht. Ein schneller Shrink der bestehenden Architektur wäre da die deutlich bessere Lösung gewesen.
Das Thema hatten wir doch schon:
- SSE4.1,2 AVX
- PowerGating
- Turbo 2.0
- Llano taktet auch nicht so toll.

Außerdem stehen ja schon Bdv2 und 3 vor der Türe. Was immer da aktuell bremst, könnte ziemlich schnell behoben sein.

Das widerum wäre jetzt auch ein Grund für nen 32nm X6, anstatt des aktuellen FX. Wenn der Nachfolger eh so schnell kommt, hätte man sich die erste Version sparen können. Aber dagegen spricht die Zusatzarbeit und übermäßig langsamer ist so ein FX8 gegenüber einem X6 schließlich auch nicht.

Also was solls. Trotzdem ist das mit der IPC nicht schön, von wegen "IPC steigt" :(

fondness
2011-09-23, 20:49:59
Das Thema hatten wir doch schon:
- SSE4.1,2 AVX
- PowerGating
- Turbo 2.0
- Llano taktet auch nicht so toll.

Außerdem stehen ja schon Bdv2 und 3 vor der Türe. Was immer da aktuell bremst, könnte ziemlich schnell behoben sein.

Das widerum wäre jetzt auch ein Grund für nen 32nm X6, anstatt des aktuellen FX. Wenn der Nachfolger eh so schnell kommt, hätte man sich die erste Version sparen können. Aber dagegen spricht die Zusatzarbeit und übermäßig langsamer ist so ein FX8 gegenüber einem X6 schließlich auch nicht.

Also was solls. Trotzdem ist das mit der IPC nicht schön, von wegen "IPC steigt" :(

Zumindest PowerGating und Turbo 2.0 hat auch Llano, das hat man also ohnehin implementiert. Alles was fehlen würde wären die neuen SSE-Befehle, IMO verschmerzbar. Dafür hätte man in einem 32nm gate-first Prozess reichlich Platz gehabt für acht Kernen und einen größeren Cache. Aber was solls, es bringt eh nichts darüber zu spekulieren, AMD wird schon ihre Gründe gehabt haben. Und vielleicht steckt im Design ja wirklich ein schwerwiegender Bug mit dem AMD nicht gerechnet hatte.

S940
2011-09-23, 20:53:00
Zumindest PowerGating und Turbo 2.0 hat auch Llano, das hat man also ohnehin implementiert. Alles was fehlen würde wären die neuen SSE-Befehle, IMO verschmerzbar.
Ne der BD Turbo ist deutlich feiner, sieht man ja am mittleren Turbo Mode, das sollte der@8cores unter Teillast sein. Das kann Llano nicht. Auf der ISSCC meinten sie auch, dass es viel komplizierter ist ein bestehendes Design nachträglich "schön" mit power gates auszustatten.
Dafür hätte man in einem 32nm gate-first Prozess reichlich Platz gehabt für acht Kernen und einen größeren Cache. Aber was solls, es bringt eh nichts darüber zu spekulieren, AMD wird schon ihre Gründe gehabt haben. Und vielleicht steckt im Design ja wirklich ein schwerwiegender Bug mit dem AMD nicht gerechnet hatte.
Immerhin gibts schon 2 pos. Stimmen zur nächsten Revision (charlie und der UK Type), ich nehme an, dass sind die Piledriver Cores.

Ronny145
2011-09-23, 20:53:54
Naja mit der Multithread Leistung könnte man noch gut leben, auch wenn das deutlich unten den frühen Prognosen liegt. In Cinebench 11.5 müsste man sich den Turbo dazu denken. In Spielen muss man froh sein wenn 6 Kerne vernünftig ausgelastet werden. Hier ist abzuwarten ob für Spieler Thuban nicht die bessere Wahl wäre.

Duplex
2011-09-23, 20:56:37
Immerhin gibts schon 2 pos. Stimmen zur nächsten Revision (charlie und der UK Type), ich nehme an, dass sind die Piledriver Cores.Oder es wird nur der Bug von BD1 beseitigt der evtl. für die geringe IPC gegenüber K10 verantwortlich ist...stell dir vor die nächste Rev. erreicht 15-20% mehr IPC, dann geht BD mit seinem Turbo erst richtig ab.

dildo4u
2011-09-23, 21:05:23
Oder es wird nur der Bug von BD1 beseitigt der evtl. für die geringe IPC gegenüber K10 verantwortlich ist...stell dir vor die nächste Rev. erreicht 15-20% mehr IPC, dann geht BD mit seinem Turbo erst richtig ab.
Oder die 80%Leistung von "echten" 2 Cores haben sich immer auf K10 bezogen.

Undertaker
2011-09-23, 21:08:15
Naja mit der Multithread Leistung könnte man noch gut leben, auch wenn das deutlich unten den frühen Prognosen liegt. In Cinebench 11.5 müsste man sich den Turbo dazu denken. In Spielen muss man froh sein wenn 6 Kerne vernünftig ausgelastet werden. Hier ist abzuwarten ob für Spieler Thuban nicht die bessere Wahl wäre.

In Spielen könnte man hoffen, dass die großen Caches etwas stärker anschlagen. Durchgängig so miese Ergebnisse wie im Cinebench kann ich mir kaum vorstellen, die Publicity zum Launch wäre doch vernichtend.

S940
2011-09-23, 21:10:07
Oder es wird nur der Bug von BD1 beseitigt der evtl. für die geringe IPC gegenüber K10 verantwortlich ist...stell dir vor die nächste Rev. erreicht 15-20% mehr IPC, dann geht BD mit seinem Turbo erst richtig ab. Naja, nachdem Piledriver schon bald kommt, glaube ich eher nicht an ein entbuggtes BDv1 Kerne, aber schauen wir mal.

Ich hoffe zum Launch gibt es genauere Infos woran es hapert. Man kann nur hoffen, dass sich in einer C-Revision Bremsklötze lösen lassen.
Laut Optimierungs PDF werden die L1D TLBs vergrößert, von 32-> 64 entries. Weiß jemand wie wichtig die sind? Werden die bei nem write-through Design vielleicht besonders stark gebraucht? K10 hatte 48, Intel hat 96 (westmere) bzw. 100(sandy).

mapel110
2011-09-23, 21:11:09
In Spielen könnte man hoffen, dass die großen Caches etwas stärker anschlagen. Durchgängig so miese Ergebnisse wie im Cinebench kann ich mir kaum vorstellen, die Publicity zum Launch wäre doch vernichtend.
Die ist auch jetzt schon vernichtend.Einen Vorteil hats für uns Kunden. AMD wird noch stärker über den Preis gehen müssen.

Dural
2011-09-23, 21:11:15
Hier ist abzuwarten ob für Spieler Thuban nicht die bessere Wahl wäre.

Tuban in 32nm würde Bulldozer wohl schlagen, in jedem bereich...

Die Bulldozer Benchmarks sind einfach nur schlimm :freak:

Ronny145
2011-09-23, 21:15:44
In Spielen könnte man hoffen, dass die großen Caches etwas stärker anschlagen. Durchgängig so miese Ergebnisse wie im Cinebench kann ich mir kaum vorstellen, die Publicity zum Launch wäre doch vernichtend.


Ein paar Spielbenchmarks gibt es ja schon hier (http://obrovsky.blogspot.com/2011/09/amd-fx-vs-p-ii-x6-clock-clock.html). Entweder GPU Limit oder langsamer (LP2, RES5, ARMA2). Natürlich gilt es zu bedenken, dass hier mit gleichem Takt verglichen wurde. Vielleicht reicht der Taktvorsprung gegenüber Thuban aus in manchen Spielen, muss man abwarten.

Knuddelbearli
2011-09-23, 21:18:04
dem Phenom 2 weitere kerne einfach so anflanschen ist nicht da müsste schon deutlich was geändert werden

Skysnake
2011-09-23, 21:19:06
Naja anstatt Write Back gibts bei BD nur nen Write Thrugh L1. Dass der Wert also geringer ausfällt ist glasklar, da (auch) in den L2 geschrieben werden muss. Allerdings sind die L2 und L3 Werte schon komisch. Möglich, das damit dann auch der L1 Write steigen würde, wenn der L2 entsprechend schneller werden würde.

Mal abwarten. Im Hinterkopf klingelt noch ne komplizierte Cache Kohärenzsache, eventuell verursacht die irgendwelche Probleme: http://www.realworldtech.com/page.cfm?ArticleID=RWT082610181333&p=9

Falls das die Achillesferse sein sollte, könnte der FX4 richtig gut werden, je weniger Kerne, desto weniger Snoops *g*

Bei nem Write Thrugh sind die Writes aber unabhängig. Der Schreibvorgang in den L2 beeinflusst nicht den in den L1, bzw. Lesevorgänge von selbigen. Es geht ja nur darum, das Ergebnis auch für andere Kerne verfügbar zu machen, damit möglichst nicht in den L1 gesnooped werden muss.

Ich war aber der Meinung, dass der L2 als write thrugh ausgelegt ist und nicht der L1D Cache. Da muss ich mich wohl geirrt haben :uponder:

So und nun noch was zu den Folien, also irgendwie kommt mir die Sache spanisch vor, jetzt mal ganz unabhängig davon, das es von OBR kommt, was einen dann noch mehr daran zweifeln lässt. Wäre ja nicht sein erster Fake.... :down:

Warum schreibt AMD da etwas von OC? Also 1. wären die Werte halt mal mega schlecht, und würde man nicht in eine offizielle Folie packen, wo man schlechter ist als das eigene Produkt, und zusätzlich, WARUM wird da von OC gequatscht. Das ist doch für die Leute, die solche Folien bekommen absolut fürn poppes und interessiert keine SAU!

EDIT:

Ok, hab mir das mit den Caches im Software Optimization Guide angeschaut. Sind doch beide Write thrugh. Ist auch logisch. Ich hatte das mit exklusive und inklusive verwechselt. Es ist ja aber möglich Daten direkt in den L1 am L2 vorbei zu laden. Damit liegen Sie auch nicht im L2, oder man schiebt halt ausm L2 in L1. Wie auch immer, sind ja nicht inclusive Designs vom Cache her, zumindest keine richtigen. Ergo macht das mit dem Write thrugh schon sinn, ich habs wie gesagt nur verpeilt. Stimmt also so.

Das es keine Auswirkung auf den L1 hat, passt soweit aber auch, man hat ja einen extra Buffer dafür. Paar FlipFlops/FiFos halt. Nur wenn die voll laufen, hat es Auswirkungen auf die L1 Performance. Das sollte aber nicht all zu oft passieren.

S940
2011-09-23, 21:24:14
Bei nem Write Thrugh sind die Writes aber unabhängig. Der Schreibvorgang in den L2 beeinflusst nicht den in den L1, bzw. Lesevorgänge von selbigen. Es geht ja nur darum, das Ergebnis auch für andere Kerne verfügbar zu machen, damit möglichst nicht in den L1 gesnooped werden muss.
Na die Leserate ist doch topp, geht ja nur um die L1 Schreibrate und die muss wg. WT auf alle Fälle schlechter sein.

Ich war aber der Meinung, dass der L2 als write thrugh ausgelegt ist und nicht der L1D Cache. Da muss ich mich wohl geirrt haben :uponder:

Ja, das ist ganz sicher der L1D, nicht der L2.

Warum schreibt AMD da etwas von OC? Also 1. wären die Werte halt mal mega schlecht, und würde man nicht in eine offizielle Folie packen, wo man schlechter ist als das eigene Produkt, und zusätzlich, WARUM wird da von OC gequatscht. Das ist doch für die Leute, die solche Folien bekommen absolut fürn poppes und interessiert keine SAU!
Einfach: Sie haben nix anderes. Für mich als FX4 Käufer ist das auf alle Fälle ein Argument. Hätte gerne nen dualcore i3 gehabt, aber da gibts ja kein K Modell, von daher interessiert sowas schon. Ich persönlich weiß das zwar eh, aber es wird viele geben, die das nicht wissen.
Außerdem ist der freie Multi und damit OC von Anfang an *das* "FX" Kriterium.

Ist also schon ok, dass sie das so in den Vordergrund rücken, "Enthusiasten" Marketing halt, geht ja nicht um Opterons.

dem Phenom 2 weitere kerne einfach so anflanschen ist nicht da müsste schon deutlich was geändert werden
Dachte ich bis vor Kurzem auch, aber jemand hatte hier nen Link gepostet, in dem Stand, dass die K10 NB bis zu 8Kerne schafft. War wohl schon auf Sandtiger ausgelegt.

Ein paar Spielbenchmarks gibt es ja schon hier. Entweder GPU Limit oder langsamer (LP2, RES5, ARMA2). Natürlich gilt es zu bedenken, dass hier mit gleichem Takt verglichen wurde. Vielleicht reicht der Taktvorsprung gegenüber Thuban aus in manchen Spielen, muss man abwarten.
Das waren außerdem Tests mit 15GB/s Read aus dem L2, da kann man also schon noch hoffen, schleißlich gibts ja auch Screens mit den doppelten Werten.
Außer es ist nur ein AIDA Anzeige Bug *g*

Duplex
2011-09-23, 21:31:10
Oder die 80%Leistung von "echten" 2 Cores haben sich immer auf K10 bezogen.
Nein die 80% beziehen sich auf CMP, bei CMP hat jeder Integer Core ein eigenes Frontend/Ressourcen http://www.abload.de/img/bulldozer-5kbl9umgq8fxb.jpg, so wie die aktuellen Dual Cores.
CMT erreicht 80% Leistung von CMP.

http://www.abload.de/img/bulldozer-6s9vr88umh1rh.jpg

Naja, nachdem Piledriver schon bald kommt, glaube ich eher nicht an ein entbuggtes BDv1 Kerne, aber schauen wir mal.
Nach dem AMD Analyst Day im November sollten wir schlauer werden...

fdk
2011-09-23, 21:34:22
Warum schreibt AMD da etwas von OC? Also 1. wären die Werte halt mal mega schlecht, und würde man nicht in eine offizielle Folie packen, wo man schlechter ist als das eigene Produkt, und zusätzlich, WARUM wird da von OC gequatscht. Das ist doch für die Leute, die solche Folien bekommen absolut fürn poppes und interessiert keine SAU!

Weil es marketingmaterial ist und geschildert wird was am eigenen Produkt besonders Toll ist. Und wenn man hervorheben will das das gesamte Lineup übertaktbar ist dann landet das mit einem Beispiel entsprechend akzentuiert auch drin. Wenn man Intel in Perf/Watt etc schlagen würde hätte man das entsprechend ausgeschlachtet. So muss eben das OC herhalten.

Skysnake
2011-09-23, 21:34:30
Ja, das ist ganz sicher der L1D, nicht der L2.

Es sind beide ;)


The AMD Family 15h processor contains a 16-Kbyte, 4-way predicted L1 data cache with two 128-
bit ports. This is a write-through cache that supports up to two 128 Byte loads per cycle.....

...The L2 is a write-through cache...

S. 33 Software Optimization Guide

Ronny145
2011-09-23, 21:41:08
Das waren außerdem Tests mit 15GB/s Read aus dem L2, da kann man also schon noch hoffen, schleißlich gibts ja auch Screens mit den doppelten Werten.
Außer es ist nur ein AIDA Anzeige Bug *g*


Dann müssten die Cinebench Wert besser aussehen bzw. nach oben skalieren. Wie gesagt, bislang hat sich das nicht ausgewirkt. Ob schlechte L3 Werte oder bessere Werte, die scores blieben gleich. Das gleiche beim L2.



Nach dem AMD Analyst Day im November sollten wir schlauer werden...


Der fällt offenbar ins Wasser.

http://www.anandtech.com/show/4860/amd-announces-next-financial-analyst-day-february-2012


BTW: http://1.bp.blogspot.com/-TlcmyqpJlg8/TnzhUmcIzNI/AAAAAAAABIQ/Fmz9l_bRYic/s1600/komplet.png

On Sale starting in mid-October.

S940
2011-09-23, 21:44:39
Es sind beide ;)
Hmm stümmt, war mir noch gar nicht aufgefallen. Aaaber:

Dann macht die Erklärung dort keinen Sinn:
Every time a store is performed in a core, that address is written into both the L1 data cache of the core the store belongs to and the L2 cache (which is shared between the two cores).

Wenn der L2 auch noch write through wäre, dann müßte ein Store sogar noch in den L3 durchgereicht werden.

Skysnake
2011-09-23, 21:48:13
klar, wird er auch.

Dort wird dann aber halt geschaut, ob der Wert vorhanden ist, wenn ja, wird geschrieben, wenn nein, dann wird er in einen neuen Platz geschrieben. So reichst du die Schreibvorgänge durch. Nach einer gewissen Zeitspanne sind also alle Writes im L3 angelangt. Daher kann man sich überlegen, ob man in den L2/L1 snooped oder eben nur x Takte wartet und dann nochmals nachschaut, oder halt eine von drölf Millionen anderen Möglichkeiten, wie man die Kohärenz bewerkstelligt ;)

Sind Cachestufen sind deswegen aber noch nicht inclusive. Das wären Sie erst, wenn auch Reads die im L1 durchgeführt werden, in den anderen Cachestufen enthalten wären.

Ist schon ganz ok so. In den RAM muss das Ergebnis ja eh mal, und andere Cores wollen ja das Ergebnis auch mal haben, oder man hat Produce-Consumer Threads, die übern L3 gehen, da ist es auch praktisch, das einfach als Write-Trough zu haben. Ansonsten brüchte man ja auch wieder Sidechannels zum Memory-Controller, oder müsste halt Reads/Writes über die selbe Leitung laufen lassen, was wohl auch nicht gerade geschickt ist.

Duplex
2011-09-23, 21:48:19
Der fällt offenbar ins Wasser.
http://www.anandtech.com/show/4860/amd-announces-next-financial-analyst-day-february-2012
Thx, also wird jetzt auch der Analyst Day wegen den neuen CEO verschoben...

Coda
2011-09-23, 21:53:13
dem Phenom 2 weitere kerne einfach so anflanschen ist nicht da müsste schon deutlich was geändert werden
Eigentlich nicht.

S940
2011-09-23, 22:03:11
klar, wird er auch.
Wieso stehts dann nicht da?
Dort wird dann aber halt geschaut, ob der Wert vorhanden ist, wenn ja, wird geschrieben, wenn nein, dann wird er in einen neuen Platz geschrieben. So reichst du die Schreibvorgänge durch. Nach einer gewissen Zeitspanne sind also alle Writes im L3 angelangt. Daher kann man sich überlegen, ob man in den L2/L1 snooped oder eben nur x Takte wartet und dann nochmals nachschaut, oder halt eine von drölf Millionen anderen Möglichkeiten, wie man die Kohärenz bewerkstelligt ;)

Sind Cachestufen sind deswegen aber noch nicht inclusive. Das wären Sie erst, wenn auch Reads die im L1 durchgeführt werden, in den anderen Cachestufen enthalten wären.

Ist schon ganz ok so. In den RAM muss das Ergebnis ja eh mal, und andere Cores wollen ja das Ergebnis auch mal haben, oder man hat Produce-Consumer Threads, die übern L3 gehen, da ist es auch praktisch, das einfach als Write-Trough zu haben. Ansonsten brüchte man ja auch wieder Sidechannels zum Memory-Controller, oder müsste halt Reads/Writes über die selbe Leitung laufen lassen, was wohl auch nicht gerade geschickt ist.

Weiß nicht, ein L2 WT würde mir nicht sonderlich behagen. Beim L1 ist das bei der Größe ok, aber beim 2MB L2 sollte der schon WB sein.

Hier steht auch WB:

The L1 data cache is write-through and is backed by a unified L2 write-back cache. This L2 cache is coupled tightly to the module and shared between ...
http://dl.acm.org/citation.cfm?id=1978275

Authors:
Michael Butler (http://dl.acm.org/author_page.cfm?id=81484644530&coll=DL&dl=ACM&trk=0&cfid=44341747&cftoken=45213047) Advanced Micro Devices (http://dl.acm.org/inst_page.cfm?id=1000451&CFID=44341747&CFTOKEN=45213047)
Leslie Barnes (http://dl.acm.org/author_page.cfm?id=81484640440&coll=DL&dl=ACM&trk=0&cfid=44341747&cftoken=45213047) Advanced Micro Devices (http://dl.acm.org/inst_page.cfm?id=1000451&CFID=44341747&CFTOKEN=45213047)
Debjit Das Sarma (http://dl.acm.org/author_page.cfm?id=81484644856&coll=DL&dl=ACM&trk=0&cfid=44341747&cftoken=45213047) Advanced Micro Devices (http://dl.acm.org/inst_page.cfm?id=1000451&CFID=44341747&CFTOKEN=45213047)
Bob Gelinas (http://dl.acm.org/author_page.cfm?id=81484652957&coll=DL&dl=ACM&trk=0&cfid=44341747&cftoken=45213047) Advanced Micro Devices (http://dl.acm.org/inst_page.cfm?id=1000451&CFID=44341747&CFTOKEN=45213047)

Diese Authoren sollten es eigentlich wirklich wissen :cool:

Skysnake
2011-09-23, 22:20:28
Naja, im Optimization Guide steht halt, es sei ein Write-Through, was ja auch ok ist.

Mit der Größe hat das ja auch nichts zu tun, sondern rein mit der Häufigkeit solcher Write-Throughs. Wenn man viele hat, brauch man halt einen größeren Buffer und die Sache ist geritzt.

Es sind halt unterschiedliche Herangehensweißen. Mit dem Write-Back, haste halt das Problem, dass du einen Wert lesen kannst, der Dirty ist, dann musst du erst mal den anderen holen, invalidieren etc. etc. etc. Da ist Write-Through meiner Meinung nach schon teilweise geschickter. Beim L3 wird Write-Back genutzt. Das sollte klar sein, der Memory-Controller ist zu langsam, und über den L3 erfolgt auch die Cohärenz zu den anderen CPUs. Also von daher gar nicht so dumm.

S940
2011-09-23, 22:23:58
Hast Du das letzte Zitat gesehen?
Drück ggf auf neu laden.

Skysnake
2011-09-23, 22:48:24
Im Link steht dazu nichts. Daher kann ich das nicht nachvollziehen, und der Software Optimization Guide ist halt offiziell von AMD, das wird wohl schon passen :ugly:

Wie gesagt, ich kann halt nicht drauf zugreifen, ansonsten könnte ich dazu mehr sagen.

S940
2011-09-23, 22:50:06
Im Link steht dazu nichts. Daher kann ich das nicht nachvollziehen, und der Software Optimization Guide ist halt offiziell von AMD, das wird wohl schon passen :ugly:
Schau mal nach, wer die Authoren sind ^^

Skysnake
2011-09-23, 22:58:17
Ganz doof bin ich auch nicht :rolleyes: Nur weil du mir sagst, was da drin steht, kann ich nicht einfach ignorieren, was im Software Optimization Guide drin steht. DAS ist nämlich offiziell für K15.

Die können ja gern was schreiben, aber wie gesagt, bevor ich das nicht gelesen habe, kann ich nicht beurteilen, was ich davon halten kann, wie es gemeint ist, und ob das überhaupt auf die aktuelle BD Generation zutrifft mit Orochni.

S940
2011-09-23, 23:05:26
Ganz doof bin ich auch nicht :rolleyes: Nur weil du mir sagst, was da drin steht, kann ich nicht einfach ignorieren, was im Software Optimization Guide drin steht. DAS ist nämlich offiziell für K15.

Die können ja gern was schreiben, aber wie gesagt, bevor ich das nicht gelesen habe, kann ich nicht beurteilen, was ich davon halten kann, wie es gemeint ist, und ob das überhaupt auf die aktuelle BD Generation zutrifft mit Orochni.

Lol ok, sorry, aber wenns um ein Paper des BD Chefarchitekten geht, das "BULLDOZER: AN APPROACH TO MULTITHREADED COMPUTE PERFORMANCE" [sorry für CAPS, so aus der Quelle]
heißt, dann is mir das mit fehlernübersäte 15h Guide, das anscheinend irgendein Praktikant per copy/paste aus dem K10 Guide angefrickelt hat, ziemlich Wurst. ;-)

Felixxz2
2011-09-23, 23:13:26
Hey kann jemand die Folien die Ronny gepostet hat nochmal in groß posten? Das sind nähmlich die Releasefolien :D

boxleitnerb
2011-09-23, 23:18:38
Gibts die in groß? Gibt ja noch mehr von OBR.

S940
2011-09-23, 23:18:43
Hey kann jemand die Folien die Ronny gepostet hat nochmal in groß posten? Das sind nähmlich die Releasefolien :D
Klein und fein:

http://www.abload.de/thumb/slajd1o8cj.jpg (http://www.abload.de/image.php?img=slajd1o8cj.jpg) http://www.abload.de/thumb/slajd2fkbv.jpg (http://www.abload.de/image.php?img=slajd2fkbv.jpg) http://www.abload.de/thumb/slajd3yjow.jpg (http://www.abload.de/image.php?img=slajd3yjow.jpg) http://www.abload.de/thumb/slajd4x8m5.jpg (http://www.abload.de/image.php?img=slajd4x8m5.jpg) http://www.abload.de/thumb/slajd5a8mv.jpg (http://www.abload.de/image.php?img=slajd5a8mv.jpg)

Ronny145
2011-09-23, 23:25:04
Er meint die restlichen: http://1.bp.blogspot.com/-TlcmyqpJlg8/TnzhUmcIzNI/AAAAAAAABIQ/Fmz9l_bRYic/s1600/komplet.png


Vielleicht gibt es von Donanimhaber in ein paar Tagen mehr.

Coda
2011-09-23, 23:26:27
Ich hab das von S940 zitierte Paper mal angeschaut. Die AGLUs machen tatsächlich die Stores und Address Generation und können sonst nur noch INC/DEC.

Was zur Hölle hat sich AMD dabei gedacht? Ein 2-Way-Design in 2011? Ich versteh's einfach nicht.

Neon3D
2011-09-23, 23:33:11
Oder die 80%Leistung von "echten" 2 Cores haben sich immer auf K10 bezogen.

jupp, hab ich auch vor über 50+ seiten geschrieben, aber das kann ja laut duplex nicht möglich sein.

Sir Integral Wingate Hellsing
2011-09-23, 23:37:45
Ich hab das von S940 zitierte Paper mal angeschaut. Die AGLUs machen tatsächlich die Stores und Address Generation und können sonst nur noch INC/DEC.

Was zur Hölle hat sich AMD dabei gedacht? Ein 2-Way-Design in 2011? Ich versteh's einfach nicht.



Kannst du das für Normalsterbliche erklären? ;) thx!
Btw: Lt. Folien taktet BD wohl nicht schlecht...

Coda
2011-09-23, 23:39:31
Die Anzahl der Ausführungseinheiten pro Integer-Core ist vom Gefühl her sehr knapp bemessen.

Wobei ich nicht sicher bin, ob das wirklich ein Problem ist, wenn der Rest vom Chip auf Intel-Niveau funktionieren würde.

Ich bin derzeit noch nicht sicher, ob die derzeitige Performance wirklich das Design wiederspiegelt, oder es sich um Bugs handelt. Letztere Theorie wird durch die komischen Cache-Werte gestützt.

S940
2011-09-23, 23:43:25
Was zur Hölle hat sich AMD dabei gedacht? Ein 2-Way-Design in 2011? Ich versteh's einfach nicht.

Steht doch am Anfang:
Several basic observations motivated AMD’s design of the module microarchitecture. First, future SoCs would always support
multiple execution threads.
(...)
The second observation was that the core would always operate in a power-constrained environment. This significantly impacted the
project goals a nd the Bulldozer module’s characteristics. Power efficiency was a critical design characteristic from Bulldozer’s inception. The module employs various power-reduction techniques—
Außerdem ist da doch die uralte Storie, das CPUs bei den üblichen Programme eher sehr, sehr selten IPC > 2 schaffen. Rentiert sich nicht, lieber mehr Takt. IPC ist anscheinend jetzt bei BDv1 wirklich mieß,aber warten wir mal v2 ab.

Coda
2011-09-23, 23:46:16
Sich auf Multithreading in Software zu verlassen ist aber wirklich sehr gewagt.

Vor allem, da die Skalierung auf zwei Cores noch simpel war, vier ist schon deutlich schwerer und die auf acht oftmals nicht erreichbar. Amdahl's a bitch.

Ich hoffe es sind Bugs. Das würde auch das "IPC will increase"-Mantra erklären, das jetzt ja wohl nicht gehalten werden kann. An sich würde das auch mit zwei ALUs pro Core mit dem verbesserten Scheduling ggü. K10 eindeutig möglich sein. Daran scheitert es nicht.

Ronny145
2011-09-23, 23:55:16
Sich auf Multithreading in Software zu verlassen ist aber wirklich sehr gewagt.



Vor allem kann Trinity mit seinen 2 Modulen unabhängig von der Software gar nicht darauf setzen. Die IPC muss mit Piledriver zum BDv1 stark ansteigen, sonst ist Llano mit seinen 4 traditionellen Kernen womöglich schneller in multithreading. Wenn es wirklich nur Bugs sind, gibt es immerhin Hoffnung für eine fehlerbereinigte C-Revision.

Coda
2011-09-23, 23:56:38
Ich denke es ist so. Das würde auch den rollenden Kopf von Bergman erklären.

Edit: Selbst Charlie sieht das aber sehr negativ http://semiaccurate.com/2011/09/23/analysis-rick-bergman-leaving-amd-has-no-up-side/comment-page-1/

dildo4u
2011-09-24, 00:04:04
Trinity wird wahrscheinlich wie Llano Vorrang bei der Producktion haben,so bald würde ich nicht mit der neuen BD Revision rechnen.

Coda
2011-09-24, 00:07:17
Die "Producktion" hat damit nichts zu tun. Für ein Tape-Out braucht man erstmal keine großen Kapazitäten und die Fabs sind darauf ausgelegt verschiedene Wafer gleichzeitig zu bearbeiten.

Ronny145
2011-09-24, 00:15:42
Trinity wird wahrscheinlich wie Llano Vorrang bei der Producktion haben,so bald würde ich nicht mit der neuen BD Revision rechnen.


Trinitys CPU Kerne sind die von Piledriver. Am wahrscheinlichsten gilt, dass es sich dabei um eine neue Revision handelt.

Felixxz2
2011-09-24, 00:27:57
Ich find das mit den 2 ALUs auch irgendwie sehr komisch. Auf der einen Seite sagt AMD, eine Fette Einheit ist besser als 2 kleine und setzt das bei der FPU auch so um. Auf der anderen Seite zerstückeln sie dann aber die Integer Units, anstatt vielleicht einfach eine Int Einheit mit 4 ALUs und 4-fach SMT zu bauen. Wäre vom theoretischen Durchsatz das selbe, wenn der Rest gleichbleibt.

Dazu dann ne normale 128 Bit FMAD FPU, die weniger Platz braucht und ja auch schon 4 SP Floatingpoint Threads bearbeiten kann. Dann den Cache von 2 MB auf 512 oder 256 KB kürzen, LO Trace Cache und 64 KB L1 Data. Gemixt mit einem dicken Frontend wäre das zwar ein schon größerer Kern als K10, aber auch deutlich, deutlich performanter, wenn die Versorgung stimmt. Immerhin kann 1 Kern dann entweder 1 Thread mit bis zu 4 ALUs, 4 Threads mit je 1 ALU oder Mischformen versorgen.

Bin natürlich kein wirklicher Experte, aber ich sehe den Sinn nicht so ganz, warum man 2 so rechenschwache Int einheiten verbaut anstatt wie vorher oder bei Intel 1 Starke Unit.

Coda
2011-09-24, 00:35:17
Was SMT angeht haben sie ja gesagt, dass das extrem schwierig zu verifizieren sei. Evtl. fehlt ihnen dazu einfach die Manpower.

Felixxz2
2011-09-24, 00:41:20
Was genau meinst du mit verifizieren?

S940
2011-09-24, 00:48:25
Bin natürlich kein wirklicher Experte, aber ich sehe den Sinn nicht so ganz, warum man 2 so rechenschwache Int einheiten verbaut anstatt wie vorher oder bei Intel 1 Starke Unit.
Na das ist doch wieder die alte SMT +30% und CMT+80% Geschichte.
Da gibts mit SMT wohl doch zuviel Wehwehchen, sodass nur 30% rausschauen. Halt nur blöd, wenn die single-thread Performance bei BDv1 jetzt wirklich (grotten) schlecht ist, sodass Intel trotz nur +30% immer noch schneller ist :freak: Dann hilft einem das natürlich auch nicht groß weiter.

Aber mal schauen was BDv2 macht, kann gut sein, dass BDv1 eher ne Art Prototypen Testvehikel ist, um den CMT Ansatz und die FlexFPU zum laufen zu bringen, und für den Rest außenrum nur Standardware ist.
Was SMT angeht haben sie ja gesagt, dass das extrem schwierig zu verifizieren sei. Echt, wo & wann ?

Felixxz2
2011-09-24, 00:54:04
@S940

In meiner Beschreibung pfeif ich auf die Prozentwerte von AMD. Ein Chip mit einer Integereinheit und 4 Pipes und einer 128 Bit FPU hätte einfach nur weniger FPU Leistung im Verhältnis zur Integerleistung, was aber OK wäre.

Die 80% mehr durch CMT basieren ja auf der Annahme, dass man die Integereinheiten gleich groß belässt. Das hat AMD jedoch nicht getan, wie man an den 2 Pipes sieht (K10 3 Pipes).

Wäre also gleich schnell und mit 4 fachem SMT vielleicht sogar noch schneller, weil man die einzelnen Pipes direkt mit einem Thread ansteuern kann.

Sir Integral Wingate Hellsing
2011-09-24, 01:15:58
Immerhin wäre der FX-4170 mit 4,2 GHz (TC: 4,3 GHz) die schnellste Serien-CPU der Welt (vom reinen Takt her bzw wenn die Folien stimmen).
Hat auch lang genug gedauert die 4 GHz serienmässig zu knacken...

Felixxz2
2011-09-24, 01:23:03
Vorher wars der P4 3,8GHz, wir wissen alle wie das Taktargument damals aufgenommen wurde :freak:

Pentium M
2011-09-24, 02:24:32
Die meisten sehen wahrschlich SMT und CMT als ganz lockere Technologie.Da ich AMD Jünger bin sage ich einfachmal wer glaubt das Intel mit ein paar Registern mehr 8 threads erzeugt .Na dann herzichen Glückwunsch.

R.I.P.
2011-09-24, 08:28:04
Finde es im Moment relativ simple:

Variante 1: In den ES von BD gibt es Bremsen, unabsichtlich wegen Bugs im Prefetch, Cache, etc., oder absichtlich durch AGESA, ominösen Win7 patch, bla, bla, bla und das release stepping wird eindeutig besser als die ES. Dann wird BD etwas Neues und Ordentliches mit einer rosigen Zukunft wenn mit BD2 die IPC nochmals verbessert wird.

Variante 2: die ES spiegeln die realen Leistungswerte des BD wider. :freak: dann wird wohl der Rest der Spieler wahrscheinlich auf Intel umsteigen. Ich warte seit November 2010 auf BD (weil er angeblich in April 2011 auf den Markt kommen hätte sollen). Jedoch glaube ich nicht, daß ich auf BD2 warten werde, sollte BD1 so mies werden

Skysnake
2011-09-24, 10:14:41
Lol ok, sorry, aber wenns um ein Paper des BD Chefarchitekten geht, das "BULLDOZER: AN APPROACH TO MULTITHREADED COMPUTE PERFORMANCE" [sorry für CAPS, so aus der Quelle]
heißt, dann is mir das mit fehlernübersäte 15h Guide, das anscheinend irgendein Praktikant per copy/paste aus dem K10 Guide angefrickelt hat, ziemlich Wurst. ;-)
Du kannst mir viel erzählen, wenn ichs jetzt mal bösartig auslegen darf. Schick mir doch einfach kurz das Paper per PM whot ever, dann schau ichs mir mal an ;)

Aber über was reden, was ich nicht gelesen/gesehen habe, kann ich nicht. Das sollte man auch verstehen können :freak:

Das mit dem Fehler im Guide ist möglich, genau so ist es aber auch möglich, das man es sich irgendwann anders überlegt hat, keine Ahnung von wann das Paper ist. Genau so ist es auch möglich, das man sich in dem Paper auf BD2 bezieht. Who knows? Ich nicht, da ich es nicht gelesen! habe.

Sich auf Multithreading in Software zu verlassen ist aber wirklich sehr gewagt.

Vor allem, da die Skalierung auf zwei Cores noch simpel war, vier ist schon deutlich schwerer und die auf acht oftmals nicht erreichbar. Amdahl's a bitch.

Ich hoffe es sind Bugs. Das würde auch das "IPC will increase"-Mantra erklären, das jetzt ja wohl nicht gehalten werden kann. An sich würde das auch mit zwei ALUs pro Core mit dem verbesserten Scheduling ggü. K10 eindeutig möglich sein. Daran scheitert es nicht.
Naja, Für 8 Cores erreicht man eigentlich schon sehr sehr sehr leicht eine sehr gute Skalierung. Man hat ja sehr oft Datenparrallelität. Das sollte man echt nicht vergessen. Oder was meinst du warum viele Programme selbst auf GPUs ganz gut skalieren, die hunderte bis zu über tausend Kernen haben?

Amdahl hört sich echt immer sehr sehr sehr schlimm an, aber real ist es das gar nicht, da die Parrallelität dort eben gegeben ist aus der Natur des Problems heraus, wo man wirklich viel Rechenleistung braucht. Das Einzige was halt bestehen bleibt ist halt der maximale Speedup, wobei man Superskalarität nie vergessen sollte ;)


Was genau meinst du mit verifizieren?
Dass das Ding, das du unter der Haube hat auch richtig rechnet ;)

Das ist schon so nicht ganz trivial mit dem ganzen ooO Gedönze und dem Multicore-Design. Dazu dann noch ein SMP-Design, wo man auch noch auf andere Prozessoren achten muss. Wenn man dann noch SMT mit dazu packt, wird es wirklich eklig. Du hast ja dann auch noch innerhalb des Cores im Takt unterschiedliche Threads. Die Komplexität steigt einfach nochmals um ein ganz gutes Stück an. Und da musst du halt im Prinzip alle Möglichkeiten die es gibt durchgehen und schauen ob dort richtig gerechnet wird, also auch die Ergebnisse richtig verwendet werden etc.

Naja, und jetzt denk mal nur dran, was passiert, wenn du bei einer spekulativen Berechnung Mist gebaut hast, und du das wieder killen musst, dir aber ein zweiter Thread da noch mit rein funkt. EKLIG sag ich da nur:freak:

Ronny145
2011-09-24, 10:17:16
Vielleicht gibt es von Donanimhaber in ein paar Tagen mehr.


Es ist so weit: http://www.donanimhaber.com/islemci/haberleri/AMD-Bulldozer-hakkinda-her-sey-islemciler-teknik-ozellikler-test-sonuclari.htm


Der Cinebenchmark wirkt noch am aussagekräftigsten. Alles andere sieht stark nach Marketing Rosinenpickerei aus.

Skysnake
2011-09-24, 10:31:12
Also was ich überhaupt nicht verstehe ist folgende Folie:

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=40722&stc=1&d=1316852983

Das macht doch irgendwie keinen Sinn, das man bei der Auflösung durch ne andere CPU so viel dazu gewinnen soll, und dann auch noch bei nem 2500k, der ja wirklich keine mikrige CPU ist :ugly:

Oder wie muss man das verstehen?

Die Folie sieht ganz nett aus, aber das wird wohl nur im Serverbereich auch durchschlagen, und es ist halt die Frage, wie große die Nachteile sind....

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=40723&stc=1&d=1316853171

Müsste doch über den Compiler laufen oder? Wenn ja, besteht auch ne Chance, dass davon auch Gamer profitieren. Wenn nicht, dann gn8. Für HPC aber ganz nett.

Ich glaub BD geht echt in die Extremen. Auf der einen Seite extrem stark, auf der anderen aber auch wieder "grottig schlecht" :ugly:

Ich hoffe die Mischung passt....

foenfrisur
2011-09-24, 10:32:17
tolle folien...
er hat von allem mehr, als intel,
ist aber scheinbar nicht schneller und hat einen höheren verbrauch. :freak:

diese folien wirken immer wie billiges verkaufsfernsehen auf dem shoppingkanal.

mfg

boxleitnerb
2011-09-24, 10:33:03
Wie man auf bis zu 40% Vorsprung in extrem hohen Auflösungen (10+ MP) kommt, erschließt sich mir nicht (Folie 12).

Edit:
Lol, zwei Dumme, ein Gedanke ;)

Skysnake
2011-09-24, 10:38:58
Ja, mir auch nicht. :biggrin:

Wenn das natürlich WIRKLICH stimmen würde, dann würde BD was Multimonitor angeht, alles in der Luft zerfetzen, was es zu kaufen gibt. Für Multimonitor-Gamer würde es praktisch keine Alternative geben, und genau die sind ja eigentlich diejenigen, die sich 2+ GraKas ins Gehäuse packen und deswegen eben NICHT auf den 1155er setzen, sondern auf nen 1366er oder 2011er warten.

Sollte das wirklich stimmen, siehts für Intel in dem Marktsegment echt böse aus, denn dann gibt es keinen Grund einen 2011er fürs zocken zu kaufen, sondern wirklich nur fürs arbeiten, da kann man dann aber auch nen Opteron mit 16Threads sich holen, oder nen Xeon.

Naja, und für die ganzen Mainstream-User wäre ein kleinerer FX auch nicht so schlecht, oder man holt sich da dann halt doch den 1155er, aber nicht den 2600er sondern was kleineres.

Also irgendwie verwirren mich die Folien grad :ugly:

LovesuckZ
2011-09-24, 10:43:02
Es ist so weit: http://www.donanimhaber.com/islemci/haberleri/AMD-Bulldozer-hakkinda-her-sey-islemciler-teknik-ozellikler-test-sonuclari.htm


Der Cinebenchmark wirkt noch am aussagekräftigsten. Alles andere sieht stark nach Marketing Rosinenpickerei aus.

Beim Systemvergleich kann man echt nur mit so antworten:
:facepalm:

Vorallem, weil man sich sonst immer auf Sandy Bridge bezieht. Aber da würde der Systemvergleich auch keinen Sinn mehr machen...

Ansonsten ist diese Folie auch noch interessant:
http://img.donanimhaber.com/images/haber/amdfxpressdeck_12a_dh_fx57.jpg

Aber das zeigt schon, wie schlecht die Pro-Kern-Leistung wirklich ist, wenn man mit "8 Cores" + höhreren Takt gerade mal 20% schneller als ein i5-2500 ist...

boxleitnerb
2011-09-24, 10:43:06
Das kann ja nur an der PCIe-Anbindung liegen. In den hohen Auflösungen kann CF/SLI schonmal 10-15% verlieren. Aber 40%...ich weiß ja nicht.

Was mich auch verwirrt:
Einerseits pocht man auf P/L und dann will man den Leuten Vorteile bei 2 Highendkarten + 3 Monitoren weismachen. Das passt nicht zusammen.

foenfrisur
2011-09-24, 10:46:00
gibt es denn soo viele, die mit multimonitoring spielen?
ich denke nicht. wäre also eine extrem kleine zielgruppe.

komisch, das kein 3dmark dabei ist. oder kann das kein multimonitoring?

und wieso setzt man den i5 auf 110%? damit man beim BD 140% schreiben kann, weil sieht größer aus??
schrecklich solche folien.

mfg

Skysnake
2011-09-24, 10:46:43
Man will wohl eher sagen: "Hey kauf unsere CPU, dann hast du noch genug Geld um dir ne dicke fette GraKa zu kaufen, die dir mehr bringt als eine teure CPU"

Was ja so auch nicht ganz falsch ist ;)

boxleitnerb
2011-09-24, 10:48:47
und wieso setzt man den i5 auf 110%? damit man beim BD 140% schreiben kann, weil sieht größer aus??
schrecklich solche folien.

mfg

Ja das ist echt mal :freak:
Aber hey, vielleicht ist der helle Pfeil der BD und der graue Balken der 2500K ;D

foenfrisur
2011-09-24, 10:48:55
und dann aber benchmarks verwenden, die eigentlich nvidia-affin sind...
ganz großes kino...

mfg

LovesuckZ
2011-09-24, 10:49:52
Man will wohl eher sagen: "Hey kauf unsere CPU, dann hast du noch genug Geld um dir ne dicke fette GraKa zu kaufen, die dir mehr bringt als eine teure CPU"

Was ja so auch nicht ganz falsch ist ;)

Klar, weil man den Systemvergleich mit dem 6 Kerner macht, aber den Multi-Monitor-Vergleich mit dem i5 mit 2x8 PCIe Lanes. :rolleyes:

Konami
2011-09-24, 10:50:05
und wieso setzt man den i5 auf 110%? damit man beim BD 140% schreiben kann, weil sieht größer aus??
schrecklich solche folien.

mfg
Ich geh jetzt mal stark davon aus, dass die Pfeile einfach nur Designelemente sind...

Ja das ist echt mal :freak:
Aber hey, vielleicht ist der helle Pfeil der BD und der graue Balken der 2500K ;D
Aber das wär natürlich auch möglich X-D

Ronny145
2011-09-24, 10:52:00
Im X264 Benchmark liegt er dann wohl auch hinter SB 4/8. Das hätte ich vor ein paar Monaten nie und nimmer erwartet.

anddill
2011-09-24, 10:54:37
Hatten wir doch schon öfter, dass die AMD-Systeme bei extremer Grafiklast etwas mehr Leistung als die Intels abliefern. Da muss irgend was auf der Strecke PCIe-CPU-RAM besser flutschen.
Nichts neues also.

HOT
2011-09-24, 11:01:02
Beim Systemvergleich kann man echt nur mit so antworten:
:facepalm:

Vorallem, weil man sich sonst immer auf Sandy Bridge bezieht. Aber da würde der Systemvergleich auch keinen Sinn mehr machen...

Ansonsten ist diese Folie auch noch interessant:
http://img.donanimhaber.com/images/haber/amdfxpressdeck_12a_dh_fx57.jpg

Aber das zeigt schon, wie schlecht die Pro-Kern-Leistung wirklich ist, wenn man mit "8 Cores" + höhreren Takt gerade mal 20% schneller als ein i5-2500 ist...



Du hast zwar versucht es möglichst negativ dastehen zu lassen für AMD, jedoch zeigt das Bildchen viel eher in welche Richtung die Performance des FX wirklich geht und das weist vor allen Dinge nach, dass alle anderen Benchmarks bisher einfach nur Schrott sind... Grade der wprime-Wert ist da sehr auffällig. Natürlich sind diese Benches Rosinenpickerei, aber das sind sie doch fast immer, wenn man eine CPU direkt bei Release benchen muss, da es immer Vorgaben gibt.
Es war niemals anders erwartet worden, dass ein AMD 4-Module-Prozessor einen 4-Kern-SMT-Prozessor von Intel wirklich abhängt, sondern dass es Schwankungen bei SingleCore in einen kleinen Rückstand und bei Multicore in einen kleinen Vorsprung mündet und etwas ähnliches sehen wir hier. Man muss grade bei Cinebench bedenken, dass dieser Benchmark noch kein BD-optimiertes Profil beinhaltet, sondern nur Core2, Nehalem und K8/10. Rosinenpickerei fällt bei einem so neuen Design wie dieses Modulkonzept übrigens garnicht mal so leicht ;).

AffenJack
2011-09-24, 11:04:28
Du hast zwar versucht es möglichst negativ darstehen zu lassen für AMD, jedoch zeigt das Bildchen viel eher in welche Richtung die Performance des FX wirklich geht und das weist vor allen Dinge nach, dass alle anderen Benchmarks bisher einfach nur Schrott sind...

Weil es negativ ist, wenn man nicht AMD Fanboy ist. Das sind alles Multithreaded Apps in den BD den 2600K plattmachen sollte. Mehr Takt plus CMT statt SMT sollte für nen 2600K schon ausreichen, wie schlecht siehts erst in Anwendungen aus die nur wenige Threads nutzen? So wies im Moment aussieht wäre nen K10 8Kerner in 32nm oftmals schneller als BD und würde dazu deutlich kleiner sein. Das ist nicht gerade das was man sich von einer neuen Architektur verspricht.

foenfrisur
2011-09-24, 11:04:44
naja, es sind multithreaded benchmarks oder?

singlethreaded kann (wird?) er grottenschlecht aussehen.....

mfg

boxleitnerb
2011-09-24, 11:11:31
Hatten wir doch schon öfter, dass die AMD-Systeme bei extremer Grafiklast etwas mehr Leistung als die Intels abliefern. Da muss irgend was auf der Strecke PCIe-CPU-RAM besser flutschen.
Nichts neues also.

Quelle? Ich kenne das nur von Anno 1404, ansonsten hab ich das noch nie gesehen.

fondness
2011-09-24, 11:14:41
Das kommt eben dabei raus, wenn über Jahre hinweg Top-Leute das Unternehmen verlassen. Und mit Rick Bergmann, IMO ein absoluter Top-Manager (dem sicher viele Vertraute Leute gerade von Ex-Ati folgen werden) geht das ganze ja munter weiter. Ich bin ja gespannt wie diese groß angekündigte Graphics Core Next Architektur wird, vermutlich ein ähnlicher Papiertiger wie Bulldozer. Auf dem Papier eine gute Architektur zu entwerfen ist einfach, die Kunst liegt wie so oft im Detail, und hier fehlt es offensichtlich mittlerweile an allen Ecken und Enden.

foenfrisur
2011-09-24, 11:15:47
also wenn man hier mal reinschaut und er wirklich zwischen den "beiden längsten" liegt...

http://www.computerbase.de/artikel/prozessoren/2011/test-amd-a6-3650-vs.-intel-core-i3-2100/9/#abschnitt_gesamt

dann sieht das eigentl. gar nicht sooo schlecht aus finde ich.

WENN er denn da liegt^^

mfg

Duplex
2011-09-24, 11:19:33
jupp, hab ich auch vor über 50+ seiten geschrieben, aber das kann ja laut duplex nicht möglich sein.
Man sollte es jetzt so sehen
CMP & K10 haben eine ähnliche IPC
CMT erreicht 80% Leistung von CMP & K10

Vorher hieß es Bulldozer hat mehr IPC als K10, jetzt ist die IPC genau wie Pentium3 > Netburst gesunken :freak: muhaha

Kurz gesagt Bulldozer & Bobcat haben fast die gleiche IPC pro Core :eek: Die Pipelines sind sogar ähnlich...

Wie soll jetzt AMD die IPC bei der nächsten Generation deutlich steigern, es geht nicht um lächerliche 10%...sondern AMD braucht genau 30% damit Bulldozer über 10% mehr IPC als ein K10 Core erreicht.

Auch möglich das die 2 ALUs / 2 AGUs & 4 FPUs doch limitieren...Gerade in Cinebench ist BD ein FLOP.

Zambezi
4 FPUs
16KB L1D
80% K10 IPC
Schlechtes Cache Design mit evtl. Bugs
2 Fach OoO limitiert

Thuban
6 FPUs
64 KB L1D
100% IPC
ausreichendes Cache Design
3Fach OoO Design

S940
2011-09-24, 11:21:36
@S940

In meiner Beschreibung pfeif ich auf die Prozentwerte von AMD. Ein Chip mit einer Integereinheit und 4 Pipes und einer 128 Bit FPU hätte einfach nur weniger FPU Leistung im Verhältnis zur Integerleistung, was aber OK wäre.
Der Unterschied ist nur der, dass Du die Int Leistung nicht auf die Straße bringst. SMT ist eigentlich nur dazu da, die überflüssige Leistung wieder brauchbar zu machen. Bei den Intels gibts +30% SMT Aufschlag im Mittel, ergo, ~30% der INT Abteilung liegt im 1Thread Betrieb brach. Die Int Pipes sind bei Intel 3issue. So nun rechne mal 3issue minus 30%, was gibt das? Richtig, 2issue :biggrin: Das reicht also im Normalbetrieb aus. Zumindest solange man intels Front/Back-End hätte. Hat AMD aber nicht. Da wird also dann die Leistung liegen bleiben. Patente gibts zu nem µOp Cache und fetten Decodern, aber die scheinen zumindest nicht den Weg in BDv1 gefunden zu haben. Ist auch logisch, für irgendwas müssen BD2/3 schließlich auch gut sein.
Insgesamt hatten wir das 2fach gegen 4fach Problem schon langwierig und ausführlich auf P3D vor ca. nem Jahr oder noch länger besprochen, als Dresdenboy die ersten Patente mit 2issue Clustern fand. CMT 2issue ist wirklich besser, dazu gibts auch Papers, in denen man alle mögl. Konfigs untersuchte. Gewinnder war da 2issue CMT mit 2fach SMT auf den INT Clustern, aber das wird dann halt schön komplex und steht sicherlich wieder dem Takt im Weg.

Mehr als 2 issue kann man aus Wald und Wiesencode bei INT nicht rausquetschen, selbst Intel nicht, und selbst wenn sies könnten, dann würde ihr SMT SPeedUp geringer ausfallen, so wies schon bei Sandy der Fall ist. Klar - man könnte dann auf 4issue gehen, aber damit bekommt man wieder nen Strauß mehr Probleme, allen voran leakage und längere interne Laufzeiten -> geringerer Takt.
2 issue ist wirklich das Optimum für die Rechenleistung, eingegrenzt durch Stromverbrauch, Takt und IPC.
Die FPU nützt man nun gemeinsam, da deren singlethread Auslastung deutlich schlechter. Das Thema hatten wir ja erst vor Kurzem, bei Spielecode max. ~30%, da bleibt sehr, sehr viel Platz für nen 2ten Thread.

Die 80% mehr durch CMT basieren ja auf der Annahme, dass man die Integereinheiten gleich groß belässt. Das hat AMD jedoch nicht getan, wie man an den 2 Pipes sieht (K10 3 Pipes).
Ja, mit 3 issue gewinnt man ~5%, zufrieden? ;-)
Hat mal ein ehem. AMD Entwickler in ner news group gepostet. Nicht die Welt, viel Arbeit wenig Gewinn.
Wäre also gleich schnell und mit 4 fachem SMT vielleicht sogar noch schneller, weil man die einzelnen Pipes direkt mit einem Thread ansteuern kann.
Dann sinkt aber wieder die singlethread IPC, wenn Du 4 Threads auf 4 pipes verteilen willst. Wie oben gesagt, Optimum ist 2issue, d.h. 2pipes für einen Thread. Wenn Du 1pipe pro thread rechnest, wirst Du ne unterirdische singleT IPC bekommen.
Du kannst mir viel erzählen, wenn ichs jetzt mal bösartig auslegen darf. Schick mir doch einfach kurz das Paper per PM whot ever, dann schau ichs mir mal an ;)

Aber über was reden, was ich nicht gelesen/gesehen habe, kann ich nicht. Das sollte man auch verstehen können :freak:

Das mit dem Fehler im Guide ist möglich, genau so ist es aber auch möglich, das man es sich irgendwann anders überlegt hat, keine Ahnung von wann das Paper ist. Genau so ist es auch möglich, das man sich in dem Paper auf BD2 bezieht. Who knows? Ich nicht, da ich es nicht gelesen! habe.

Das Datum steht im Link:
IEEE Micro archive (http://dl.acm.org/citation.cfm?id=J344&picked=prox&cfid=44341747&cftoken=45213047) Volume 31 Issue 2, March 2011
War quasi der ausführliche Artikel zur letzten ISSCC Präsentation.
Aber kein Problem, bin auch oft recht pingelig und kritisch. Dachte halt es sollte reichen, wenn write-back & L2 dasteht ;-) Ich lass mir was einfallen. Das Paper ist auch definitiv für BD1, da stehen nur 32 Einträge beim L1TLB. Außerdem heißt es Bulldozer und nicht Bulldozer2 oder Piledriver.


Also was ich überhaupt nicht verstehe ist folgende Folie:

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=40722&stc=1&d=1316852983

Das macht doch irgendwie keinen Sinn, das man bei der Auflösung durch ne andere CPU so viel dazu gewinnen soll, und dann auch noch bei nem 2500k, der ja wirklich keine mikrige CPU ist :ugly:

Oder wie muss man das verstehen?

Schließe mich da ganz anddil an:
Hatten wir doch schon öfter, dass die AMD-Systeme bei extremer Grafiklast etwas mehr Leistung als die Intels abliefern. Da muss irgend was auf der Strecke PCIe-CPU-RAM besser flutschen.
Nichts neues also.
Viele blöken immer nur GPU Limit, GPU Limit und verdrängen dabei, dass die GPU nicht direkt an der CPU hängt, sondern PCIe dazwischen ist. Dass das bei 800x600 nicht limitiert ist klar :freak:
Intels LGA1155 hat bekannterweise nur 2xPCIe8, allein das könnte es schon erklären. LGA2011 sollte das dann aber wieder gerade rücken. Hab zwar im Hinterkopf noch irgendwelche Problemchen bei LGA1366 und hohen Auflösungen, aber ich glaube Intel hats behoben, nachdem sie den QPI Takt angehoben hatten.
Ein Verdächtiger wären noch die Caches, bei den Auflösungen wird sicherlich viel ins RAM ausgelagert. Eventuell hilft da der dicke L3, sodass die längeren RAM Latenzen für die CPU durch häufige GPU Zugriffe nicht ins Gewicht fallen.

Aaber: Erstmal sollte man die Folie verstehen. Was ist der weiße Pfeil und der graue Balken, und wieso ist das einmal ein Pfeil?
Wenn weißer Pfeil = Intel und Balken = AMD, dann versteh ich nicht, wieso der Pfeil bis auf 105% bzw. 110% geht. Was ist dann 100% ?? Vielleicht auch nur komisches Diagrammtuning.
Edit:
Aufgefallen beim 2ten Anschauen:
a) Der Pfeil ist auch früher auf anderen Folien, ist wohl nur ein "dynamisches Element", dann sollte der Intel einfach @100% anliegen.
b) Es ist nur ein 2500K, kein 2600K, da spielt also auch noch der 8 vs. 4 Threads Unterschied mit rein.

Die Folie sieht ganz nett aus, aber das wird wohl nur im Serverbereich auch durchschlagen, und es ist halt die Frage, wie große die Nachteile sind....

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=40723&stc=1&d=1316853171

Müsste doch über den Compiler laufen oder? Wenn ja, besteht auch ne Chance, dass davon auch Gamer profitieren. Wenn nicht, dann gn8. Für HPC aber ganz nett.
Na Nachteile gibts dafür nicht, aber ohne Neucompilierung mit nem nicht-intel Compiler halt auch keine Vorteile :freak:
Da sehe ich deshalb eher schwarz, abgesehen AMD sponsort da ein paar Titel. Vielleicht gibts auch nen netten Effekt, wenn AMD es bei seinen eigenen Grafiktreibern nützt. Da sehe ich noch am meisten Potential, wobei ich ganz ehrlich nicht weiß, ob man FMA dabei gebrauchen kann ^^

Ich glaub BD geht echt in die Extremen. Auf der einen Seite extrem stark, auf der anderen aber auch wieder "grottig schlecht" :ugly:
Ich hoffe die Mischung passt....
Spätestens mit BD2 sollte es passen, bis dahin muss AMD über den Preis gehen, was für den Verbraucher auch nicht verkehrt ist.
Wie ich immer predige: Trau keiner AMD Revision unter Rev.C ;-)

Aber immerhin ein AMD Prozessor zw. 2500K und 2600K, besser als der status-quo und solange der Preis passt und OC gut geht ...

LovesuckZ
2011-09-24, 11:22:33
Du hast zwar versucht es möglichst negativ dastehen zu lassen für AMD, jedoch zeigt das Bildchen viel eher in welche Richtung die Performance des FX wirklich geht und das weist vor allen Dinge nach, dass alle anderen Benchmarks bisher einfach nur Schrott sind... Grade der wprime-Wert ist da sehr auffällig. Natürlich sind diese Benches Rosinenpickerei, aber das sind sie doch fast immer, wenn man eine CPU direkt bei Release benchen muss, da es immer Vorgaben gibt.

TDP des 8150P liegt bei 125 Watt, die des 2500k bei 95 Watt. Dazu kommt, dass es auch Anwendungen gibt, die nicht alle voll auslasten - z.B. Mafia 2 mit GPU-PhysX, wo die Cloth-Simulation nur in einem Thread auf einem Kern läuft: http://www.techspot.com/review/312-mafia2-performance/page8.html


Es war niemals anders erwartet worden, dass ein AMD 4-Module-Prozessor einen 4-Kern-SMT-Prozessor von Intel wirklich abhängt, sondern dass es Schwankungen bei SingleCore in einen kleinen Rückstand und bei Multicore in einen kleinen Vorsprung mündet und etwas ähnliches sehen wir hier. Man muss grade bei Cinebench bedenken, dass dieser Benchmark noch kein BD-optimiertes Profil beinhaltet, sondern nur Core2, Nehalem und K8/10. Rosinenpickerei fällt bei einem so neuen Design wie dieses Modulkonzept übrigens garnicht mal so leicht ;).

Nein? Es wurde also nicht erwartet, dass ein 320mm^2 Bulldozer einen 220mm^2 SB Prozessor mit IGP in Multithreadanwendungen abhängt? Wow...
Die Konsequenz aus dem Ergebnis ist nämlich, dass ein i3-Prozessor mit 2C/4T in wohl 80% aller Spiele das bessere Paket aus Leistung/Watt abliefert als ein 4 Modul Bulldozer. Und wenn man das auf die 4K-SB Prozessoren überträgt, dann zeigt es schon, wohin die Reise wirklich geht.

Ronny145
2011-09-24, 11:24:10
also wenn man hier mal reinschaut und er wirklich zwischen den "beiden längsten" liegt...

http://www.computerbase.de/artikel/prozessoren/2011/test-amd-a6-3650-vs.-intel-core-i3-2100/9/#abschnitt_gesamt

dann sieht das eigentl. gar nicht sooo schlecht aus finde ich.

WENN er denn da liegt^^

mfg


Das ist der richtige Test: http://www.computerbase.de/artikel/prozessoren/2011/test-intel-sandy-bridge/46/#abschnitt_performancerating


Glaube nicht, dass er dazwischen liegt. Man schaue sich doch den Thuban an. Bei weniger Kernauslastung könnte der in einigen Benchmarks vor Bulldozer liegen. In ausgewählten Multithread Benchmarks liegt der 1100T bereits vor dem 2500k, in der Gesamtwertung jedoch weit zurück. Im x264 Pass2 Benchmark liegt das Flaggschiff nur 10-12% vorm schnellsten Thuban.

HOT
2011-09-24, 11:39:27
TDP des 8150P liegt bei 125 Watt, die des 2500k bei 95 Watt. Dazu kommt, dass es auch Anwendungen gibt, die nicht alle voll auslasten - z.B. Mafia 2 mit GPU-PhysX, wo die Cloth-Simulation nur in einem Thread auf einem Kern läuft: http://www.techspot.com/review/312-mafia2-performance/page8.html

TDP heißt erstmal nichts, schon garnicht bei einer CPU die C6 kann. Das weiss man spätestens seit Lynnfield oder?
Sicher gibt es 1-Thread-Sachen, aber die sind bei 3,6GHz größtenteils wohl kein Problem mehr. Selbst Paradox-Titel wie Hearts of Iron 3 sind mittlerweile massiv MT.

Nein? Es wurde also nicht erwartet, dass ein 320mm^2 Bulldozer einen 220mm^2 SB Prozessor mit IGP in Multithreadanwendungen abhängt? Wow...

Toll, da kannste dir nen Eis für Backen. Als Kunde kann es einem Furzegal sein, wie groß das Die ist. Es ist ne Sache der Produktion, aber solange AMD in den Schwarzen Zahlen bleibt, gibts doch keine Probleme oder? Wie der Unterschied zustande kommt ist doch klar: Intel hatte länger Zeit und erheblich mehr Geld. Der 32nm-Prozess war ein gutes Jahr früher verfügbar z.B. Hätte AMD diese Zeit gehabt, hätte man auch den ganzen "verschwendeten" Platz auf dem Orochi eliminieren können - und davon gibts ne Menge, aber es ist halt nicht so. An Preis/Leistung des Prozessors heißt das aber erstmal nichts. Es sind halt höhere Kosten, die den Abstand zwischen AMD und Intel weiter vergrößern könnten.

Die Konsequenz aus dem Ergebnis ist nämlich, dass ein i3-Prozessor mit 2C/4T in wohl 80% aller Spiele das bessere Paket aus Leistung/Watt abliefert als ein 4 Modul Bulldozer. Und wenn man das auf die 4K-SB Prozessoren überträgt, dann zeigt es schon, wohin die Reise wirklich geht.
Ist ja schön, dann kauf dir doch einen I3. Dann brauchst ja auch keinen I5 oder I7 ;). Du bist nicht gezwungen einen BD zu kaufen. Als SpieleCPU könnte auch der 4,2GHz 2-Moduler ganz cool sein.

Dural
2011-09-24, 11:45:40
komische folien die da AMD gemacht hat, wenn man schon bei einer neuen cpu architekur die vorteile zwischen 2x8 PCI-E gegenüber 2x16 PCI-E aufzeigen muss... ich glaub tiefer kanns nicht mehr gehen ;)


mal auf 22nm von intel warten...

MR2
2011-09-24, 12:04:04
Wer spielt heute nicht mit 1920x1080, wenn er da auf 980x Niveau liegt ist das zumindest n Stück über 1100T und wäre OK. Nicht überragend aber für den Preis in Ordnung.

Undertaker
2011-09-24, 12:23:16
Hatten wir doch schon öfter, dass die AMD-Systeme bei extremer Grafiklast etwas mehr Leistung als die Intels abliefern. Da muss irgend was auf der Strecke PCIe-CPU-RAM besser flutschen.
Nichts neues also.

Wir hatten mal arg widersprüchliche Anno-Benchmarks zu LGA1156-Zeiten, sonst ist mir da aber nicht viel in Erinnerung - und schon gar nicht unter Sandy Bridge und in derartigen Prozentbereichen.
Ich behaupte mal, hier wurde schlicht ganz geschickt getrickst (kleiner Hinweis auf die Vergangenheit: Hier (http://www.hardware-infos.com/img/startseite/klein/phenom_ii_x4_940_games.jpg)wurde z.B. für einen CPU-Vergleich mit IGPs gemessen, um entsprechende Vorsprünge präsentieren zu können - natürlich ohne das es am Graphen dransteht). Möglich wäre z.B. die Verwendung einer in der Speichermenge beschnittenen GPU, z.B. einer HD6950 1GB (/CF), die zusammen mit extrem hohen Auflösungen (und AA?) erheblich am PCIe hängt - was bei nur 8 PCIe-Lanes pro Karte dann schon ordentlich Leistung kosten dürfte. Die absoluten fps kann man ebenfalls nicht erkennen, bei 4fps zu 6fps sind wir auch ganz schnell bei 50% Mehrleistung.

Skysnake
2011-09-24, 12:39:36
Das stimmt allerdings, und würde die ganze Sache auch sehr gut erklären.

EDIT: @S940 jetzt schick mir doch endlich das dumme PDF :P

S940
2011-09-24, 12:52:25
EDIT: @S940 jetzt schick mir doch endlich das dumme PDF :P

Lol, entgegen der landläufigen Gerüchte schau ich nicht jede Sekunde nach meiner PM, außerdem ist ein guter Mittagsschmaus um 12 Pflicht, sorry, aber da hattest Du nur Sekundärpriorität ;-)

So und nun viel Spass beim lesen, auch wenn ich nichts geschickt hab :biggrin:

anddill
2011-09-24, 12:59:00
Quelle? Ich kenne das nur von Anno 1404, ansonsten hab ich das noch nie gesehen.
3Dcenter. Wir hatten da schon vor einiger Zeit wiederholt hitzige Diskussionen darüber, ob und warum AMD-Systeme im GPU-Limit ein paar Prozentchen schneller schneller sind. War allerdings so wenig, dass es mit den 20-40% aus der Bulldozer-Folie nicht vergleichbar ist.

Spasstiger
2011-09-24, 13:35:46
Der Begriff IPC wird hier imo falsch verwendet. Wenn hier so absurde Schlüsse gezogen werden wie, dass Bulldozer um 30% pro Takt durch interne Verbesserungen zulegen müsste, um den Phenom II X6 um 10% zu übertrumpfen. :freak:
Vorweg: Ein FX-8150 scheint einem Phenom II X6 1100T wenigstens ebenbürtig zu sein.
In Cinebench gibts einen Gleichstand, dort liegt die IPC des Bulldozers entsprechend dem Taktunterschied um 8% niedriger als die des Phenom II X6 1100T. IPC heißt nicht Instructions per Core, sondern Instructions per Cycle. Und natürlich kann man durch mehr parallele Ausführungseinheiten die IPC steigern.
Was hier vielen auf den Fingern brennt und fälschlicherweise als IPC bezeichnet wird, ist die Single-Thread-Performance pro Takt. Aufgrund der Architekturbesonderheiten kann man nicht von der Performance in Multithreading-Benchmarks auf die Single-Thread-Performance zurückschließen.

Skysnake
2011-09-24, 13:36:24
Ok, ich hab das jetzt fast alles gelesen. Soweit so klar. Da steht wirklich, dass der L2 ein Write-Back Cache sei. Dann müsste das im Software Optimization Guide ein Fehler sein, wobei das schon ein ziemlicher Bock wäre...

Coda
2011-09-24, 13:39:59
IPC heißt nicht Instructions per Core, sondern Instructions per Cycle. Und natürlich kann man durch mehr parallele Ausführungseinheiten die IPC steigern.
Prinzipiell hast du recht, aber i.d.R. wird das aber auf einen einzigen Core bezogen.

Twodee
2011-09-24, 13:40:39
[...]
Es war niemals anders erwartet worden, dass ein AMD 4-Module-Prozessor einen 4-Kern-SMT-Prozessor von Intel wirklich abhängt, sondern dass es Schwankungen bei SingleCore in einen kleinen Rückstand und bei Multicore in einen kleinen Vorsprung mündet und etwas ähnliches sehen wir hier. Man muss grade bei Cinebench bedenken, dass dieser Benchmark noch kein BD-optimiertes Profil beinhaltet, sondern nur Core2, Nehalem und K8/10. Rosinenpickerei fällt bei einem so neuen Design wie dieses Modulkonzept übrigens garnicht mal so leicht ;).
Nein, es wurde anhand der Transistormenge von vielen erwartet, dass ein 4 Modul BD mit einem Westmere 6Core gleichzieht! Den i7 2600 zu schlagen galt als Selbstverständlichkeit!

Skysnake
2011-09-24, 13:50:24
Btw. ich hab das hier noch in dem Paper gefunden:

It’s
mostly inclusive with the L1 data caches
and has an 18-cycle load-use latency for the
1-Mbyte variant and 20 cycles for the
2-Mbyte variant.


bezieht sich auf den L2 Cache. Wo sind denn 1MB L2 Cache-Varianten geplant?

dildo4u
2011-09-24, 13:52:30
3Dcenter. Wir hatten da schon vor einiger Zeit wiederholt hitzige Diskussionen darüber, ob und warum AMD-Systeme im GPU-Limit ein paar Prozentchen schneller schneller sind. War allerdings so wenig, dass es mit den 20-40% aus der Bulldozer-Folie nicht vergleichbar ist.
AMD sieht selbst ein dicken Vorteil gegenüber dem X6 mit Crossfire bin sehr auf unabhängige Benches gespannt.

http://www.donanimhaber.com/islemci/galerileri/AMD-Bulldozer-FX-resmi-test-sonuclari_23.htm

Wahrscheinlich hat man bei den Intel und X6 System die mickrigsten Boards/Chipsätze genutzt wo z.b nicht alle Karten 8 Lanes bekommen.Bei Intel bringt's z.b was wenn auf einem Z68 zusätzlich ein NF200 verbaut wird.

Duplex
2011-09-24, 13:52:59
Besonders in Multithreading hätte ich 20% mehr Leistung als i7-2600 erwartet...
Wie gesagt schuld ist die IPC pro Core, früher wurde von JF-AMD behauptet die IPC steigt gegenüber K10, dann wäre der FX auch schneller als ein i7-2600 geworden...
Bei Cayman gabs vor dem lauch auch immer Folien von Donanimhaber mit 1920SPs und später waren es nur 1536...jetzt ist die IPC von Bulldozer genau wie Netburst niedriger als der Vorgänger...

fdk
2011-09-24, 14:00:40
Toll, da kannste dir nen Eis für Backen. Als Kunde kann es einem Furzegal sein, wie groß das Die ist. Es ist ne Sache der Produktion, aber solange AMD in den Schwarzen Zahlen bleibt, gibts doch keine Probleme oder?
Wenn die Marge so schmal wird das die schwarzen Zahlen nur durch Einsparungen beim r&d, marketing (just kidding da gibts nichts zu sparen), etc. zustandekommen ist das sehr wohl ein Problem.

Wer weiß vieleicht kommt der Eiertanz beim Launchtermin auch einfach daher das die Llano-wafer einfach profitabler waren (trotz miesem yield).

S940
2011-09-24, 14:42:53
Ok, ich hab das jetzt fast alles gelesen. Soweit so klar. Da steht wirklich, dass der L2 ein Write-Back Cache sei. Dann müsste das im Software Optimization Guide ein Fehler sein, wobei das schon ein ziemlicher Bock wäre...Da sind noch ganz andere Böcke drin, von daher nicht soo verwunderlich.
Btw. ich hab das hier noch in dem Paper gefunden:

It’s
mostly inclusive with the L1 data caches
and has an 18-cycle load-use latency for the
1-Mbyte variant and 20 cycles for the
2-Mbyte variant.


bezieht sich auf den L2 Cache. Wo sind denn 1MB L2 Cache-Varianten geplant?
Hab ich glaube ich schon 2-3x hier gepostet, aber hat anscheinend keinen interessiert. Meine Spekulation dazu ist Trinity, um für die GPU mehr Platz zu haben.

V2.0
2011-09-24, 14:44:46
Die Gamebenches sehen schelcht aus. Wenn man Eyefintiy nimmt und wahrscheinlich Crossfire mit 2x16 vs 2x8, dann sagt das wenig über die reine CPU-Leistung aus. Für mich sehen die ganzen Benches sehr ungewöhnlich aus.

Coda
2011-09-24, 14:48:00
In der Tat. Die Benchmarks sehen sehr nach Verschleierungstaktik aus.

Duplex
2011-09-24, 15:10:09
@S940
Wann rechnest du mit einem Nachfolger für Zambezi?
Du hast mehrmals gesagt der Nachfolger steht vor der Tür?

Superheld
2011-09-24, 15:42:22
die schnellste Grafikkarte hat doch AMD garnicht:rolleyes:

http://www.abload.de/img/amdfxpressdeck_1a_dh_fwj97.jpg (http://www.abload.de/image.php?img=amdfxpressdeck_1a_dh_fwj97.jpg)

Duplex
2011-09-24, 15:44:54
die schnellste Grafikkarte hat doch AMD garnicht:rolleyes:

Erst ab Auflösung 2560x1600 ist die 6990 etwas schneller, hat aber AF & Tesselation als Nachteil ;)
http://www.computerbase.de/artikel/grafikkarten/2011/test-nvidia-geforce-gtx-590/4/#abschnitt_leistung_mit_aaaf

LovesuckZ
2011-09-24, 15:46:56
die schnellste Grafikkarte hat doch AMD garnicht:rolleyes:

http://www.abload.de/img/amdfxpressdeck_1a_dh_fwj97.jpg (http://www.abload.de/image.php?img=amdfxpressdeck_1a_dh_fwj97.jpg)

In 3DMark11 schon. ;)

Such mal deren Blog ab, die haben ja die Herausforderung an nVidia gestellt. Und 3DMark11 war da das Spielfeld.


We combed through their announcement to understand how it was that such a claim could be made and why there was no substantiation based on industry-standard benchmarks, similar to what AMD did with industry benchmark 3DMark 11, the latest DirectX® 11 benchmark from FutureMark.
http://blogs.amd.com/play/2011/03/25/2056/

Knuddelbearli
2011-09-24, 15:50:18
und auch sonst überall wo man solche grakas braucht ( unter ssaa ( wo es halt möglich ist naja ... ) extreme auflösungen usw )

aber täuscht es mich oder war es nicht vor 4-5 jahren genau umgekehrt ? die ati jungs haben 3dmark verteufelt und die nv fanboys haben ihn beschworen

Coda
2011-09-24, 15:54:30
Jetzt sind wir schon beim Takt als Werbung.. Srsly AMD?

G 80
2011-09-24, 15:58:57
Wie ich solche Marketingfolien liebe. :freak:

Das weckt dann immer die Zynische Ader bei mir:


Warum das Teil Orochi heißt? Weil man den Namensvetter (http://www.scythe-eu.com/produkte/cpu-kuehler/orochi.html) samt 2 Hochleistungs 140er Lüfter braucht um mit OC auf Intellleistung eines 2600K mit gemächlichen 4 Ghz zu kommen.
Die Metall-Boxen mit denen die Teile ausgeliefert werden ersetzten dann die Behelfe der LN 2 owaklocker zum einfüllen des Stickstoffs um auf SBE Leistung zu kommen. Vorrausschauend AMD .....


Tja die 6990 ist wie die 2900 XT die schnellste Grafikkarte ....... im 3D Mark ... und hat sogar fast das idente AF. Tradition carries on .......



Ich verstehe nur nicht warum es nicht schon erste Leaks von den verschickten Server-Prozessoren gibt ..... da fällt doch schnell mal einer vom Schiff oder ausm Flugzeug; für ein paar Benches zumindest.

boxleitnerb
2011-09-24, 16:00:16
Jetzt sind wir schon beim Takt als Werbung.. Srsly AMD?

Was meinst du? Den Standardtakt? Der OC-Rekord könnte suggerieren sollen, dass man die Dinger besonders gut übertakten kann.

Coda
2011-09-24, 16:05:03
Schon den OC-Rekord. Das ist doch lächerlich. Als ob Takt etwas aussagt.

Konami
2011-09-24, 16:10:43
Schon den OC-Rekord. Das ist doch lächerlich. Als ob Takt etwas aussagt.
Du siehst das aus der falschen Perspektive... 8 Kerne und drölfzig GHz, was will der DAU mehr? :D

boxleitnerb
2011-09-24, 16:12:19
Wie gesagt, mit dem Bulldozer zielt man wohl stark auf Gamer, wenn man sich den Schwerpunkt der Folien anschaut. Und Gamer übertakten auch gerne mal - warum soll man das OC-Potential nicht bewerben? Gut, es wird sich zeigen müssen, ob man unter Standardbedingungen prozentual besser übertakten kann als die Konkurrenz, aber ein Eyecatcher ist es allemal. Zudem man unter 170 Euro bei Intel ja gar nicht mehr übertakten kann.

S940
2011-09-24, 16:50:57
Du siehst das aus der falschen Perspektive... 8 Kerne und drölfzig GHz, was will der DAU mehr? :D
Genau ;D
@S940
Wann rechnest du mit einem Nachfolger für Zambezi?
Mitte 2012, Juni - August, das ist mein pers. Horoskop ^^
Du hast mehrmals gesagt der Nachfolger steht vor der Tür?In Form von BDver2 ist das nächste Trinity, und der kommt ca. Februar. Das ist weniger als ein halbes Jahr und somit CPU-Architekturtechnisch "vor der Türe".

Spasstiger
2011-09-24, 16:56:13
Prinzipiell hast du recht, aber i.d.R. wird das aber auf einen einzigen Core bezogen.
Was wenig Sinn macht, da man nicht einfach die Multithreading-Performance durch 8 teilen kann, um auf die Single-Threading-Performance zu schließen. Insbesondere bei Bulldozer mit seiner neuartigen Architektur macht das wenig Sinn.
Um die IPC für einen bestimmten Workload, der auch Singlethreaded sein kann, zu bestimmen, teilt man die Anzahl an pro Sekunde ausgeführten Instruktionen nur durch die Taktfrequenz und nicht auch noch durch die Anzahl von Core. Die Art des Workloads bestimmt dann, von welcher Art von IPC man spricht. Ohne weitere Angaben würde ich unter IPC den Peak-IPC verstehen und den erreicht man nunmal bei Auslastung aller Cores.

S940
2011-09-24, 17:09:30
Was wenig Sinn macht, da man nicht einfach die Multithreading-Performance durch 8 teilen kann, um auf die Single-Threading-Performance zu schließen. Insbesondere bei Bulldozer mit seiner neuartigen Architektur macht das wenig Sinn.
Um die IPC für einen bestimmten Workload, der auch Singlethreaded sein kann, zu bestimmen, teilt man die Anzahl an pro Sekunde ausgeführten Instruktionen nur durch die Taktfrequenz und nicht auch noch durch die Anzahl von Core. Die Art des Workloads bestimmt dann, von welcher Art von IPC man spricht. Ohne weitere Angaben würde ich unter IPC den Peak-IPC verstehen und den erreicht man nunmal bei Auslastung aller Cores.
Ich stimme da zu, bin eigentlich der gleichen Meinung, aber das ist ein Kampf gegen Windmühlen, ich habs aufgegeben ^^

Für alle die hier nur ab und zu reinschauen:

Ich hab den AMD Foliensatz mal bei P3D zu ner User-News zusammengefasst und kommentiert:
http://www.planet3dnow.de/vbulletin/showthread.php?t=398606

Ronny145
2011-09-24, 17:12:55
In Form von BDver2 ist das nächste Trinity, und der kommt ca. Februar. Das ist weniger als ein halbes Jahr und somit CPU-Architekturtechnisch "vor der Türe".


Wie so oft zu optimistisch. Intel geht Dezember in Massenproduktion und ist launch ready ab März. AMD geht ab Januar in Massenproduktion und launcht im Februar, na sicher doch. Das ging weder bei Brazos noch Llano noch Bulldozer so zügig.

S940
2011-09-24, 17:26:11
Wie so oft zu optimistisch. Intel geht Dezember in Massenproduktion und ist launch ready ab März.
Normal, bei denen ist bei der Produktion schließlich auch die Zeit in der Fab mit dabei, bei AMD nicht mehr, da AMD keine Wafer mehr produziert.
AMD geht ab Januar in Massenproduktion und launcht im Februar, na sicher doch. Das ging weder bei Brazos noch Llano noch Bulldozer so zügig.
Doch, da bist Du auf dem Holzweg das ging bisher immer in 1-2 Monat(en) über die Bühne, die Fabs sind weg, Production ist bei AMD nurmehr DIE ins Gehäuse kleben und Eintüten.

Brazos war Production Ready im Nov10 -> Launch Anfang Januar
LLano war Prod. Ready im Juni -> Lauch im Juli
und BD war in Production (nach der Verschiebung von Q2->Q3/4) im August -> Launch jetzt Mitte Oktober

Quellen:
http://www.abload.de/img/amd_0039qvv.jpg

Das mit Zambezi ging bekanntlich schief, aber da gabs dann ja auch nen neuen Zeitplan:
http://www.abload.de/img/amd_bulldozer_launchhrnw.jpg

Zambezi hat sich mMn nur wg. den Opterons auf Oktober verspätet, die Kunden dort haben Priorität.
Deswegen erwarte ich Trinity im Februar, aber gut, um einen Monat lass ich gerne mit mir Handeln, von mir aus auch März. So genau weiß mans sicher nicht ;-)

Aber 3 Monate garantiert nicht.

fdk
2011-09-24, 17:40:56
Die OC-Ergebnisse sind schön und Gut. Was allerdings interessanter wird ist wie die bd-Architektur nach unten skaliert. Markttechnisch sind Notebooks und APUs ja um "einiges" Wichtiger als OC-Fähige CPUs für Enthusiasten.
Mit 45w TDP-Budget für die APU wird sich zeigen wie viel von dem zweifellos vorhandenen Taktpotential bei niedrigen Spannungen abrufbar ist. Auch von der Diegröße her: Um einigermaßen in der Region von Llano zu bleiben und gleichzeitig die Ehrgeizigen Flop-Ziele zu erreichen wird man am Cache wohl den Rotstift ansetzen (was ebenfalls wieder IPC kostet die es erst einmal Wett zu machen gilt). Allerdings wären das dort ja ebenfalls nur 3,9mm² / mb. Alternativ beschneidet man die FPU wieder wie bei einigen "stars" mobile CPUs. Für klassische Endanwender-mobil workloads wäre das sicher Überlegenswert wenn auch kritisch da man sich einen zusätzlichen Flaschenhals schafft (Nur eine beschnittene FPU/Modul).
Spannend wie AMD das managen wird. Ich denke aber die Folie mit den Flopzielen war nur "Powerpoint-Arithmetik" und kommt nur in realitätsfernen Settings mit der neuen FPU/GPU zustande.

S940
2011-09-24, 17:48:43
Die OC-Ergebnisse sind schön und Gut. Was allerdings interessanter wird ist wie die bd-Architektur nach unten skaliert. Markttechnisch sind Notebooks und APUs ja um "einiges" Wichtiger als OC-Fähige CPUs für Enthusiasten.
Mit 45w TDP-Budget für die APU wird sich zeigen wie viel von dem zweifellos vorhandenen Taktpotential bei niedrigen Spannungen abrufbar ist. Auch von der Diegröße her: Um einigermaßen in der Region von Llano zu bleiben und gleichzeitig die Ehrgeizigen Flop-Ziele zu erreichen wird man am Cache wohl den Rotstift ansetzen (was ebenfalls wieder IPC kostet die es erst einmal Wett zu machen gilt). Allerdings wären das dort ja ebenfalls nur 3,9mm² / mb. Alternativ beschneidet man die FPU wieder wie bei einigen "stars" mobile CPUs. Für klassische Endanwender-mobil workloads wäre das sicher Überlegenswert wenn auch kritisch da man sich einen zusätzlichen Flaschenhals schafft (Nur eine beschnittene FPU/Modul).
Spannend wie AMD das managen wird. Ich denke aber die Folie mit den Flopzielen war nur "Powerpoint-Arithmetik" und kommt nur in realitätsfernen Settings mit der neuen FPU/GPU zustande.

CPU Leistung ist nicht so schlimm im Notebookformat, sogar Atom wurde gekauft ...
Da würde sich dank Turbo sicherlich auch ein Trinity ohne L3 und nur mit 2x1MB L2 gut machen. Hauptsache der Grafikteil ist hübsch :)

An der FPU wird sicherlich nichts mehr herumgedoktort, dafür hat man ja jetzt die FlexFPU im SMT Betrieb.
Bin mir auch sicher, dass selbst bei den 64b FPU K10s die Schaltkreise auf dem DIE waren, und sie nur deaktiviert wurden. Das war sicher keine extra Maske.

Ronny145
2011-09-24, 18:05:41
Doch, da bist Du auf dem Holzweg das ging bisher immer in 1-2 Monat(en) über die Bühne, die Fabs sind weg, Production ist bei AMD nurmehr DIE ins Gehäuse kleben und Eintüten.


Anfang April (http://blogs.amd.com/fusion/2011/04/04/%E2%80%9Cllano%E2%80%9D-apu-is-shipping/) Auslieferung bis zum launch Mitte Juni sind 2,5 Monate. 2-3 Monate sind hier passender. Zumal der offizielle Verkaufsstart vom Desktop Llano erst am 1. Juli erfolgte und Notebooks im Juni so weit ich mich erinnern kann noch keine verfügbar waren.


Brazos war Production Ready im Nov10 -> Launch Anfang Januar


November 9 nach dieser Quelle (http://hothardware.com/News/AMD-Announces-Brazos-Shipments-Sheds-Light-On-2012-Roadmaps/). Erstens wären das 2 Monate abzüglich einer Woche und zweitens war das quasi ein paper launch. Die paar Zacates im Desktop waren sofort ausverkauft und Notebooks mit Brazos zogen sich lange hin. Deswegen wäre März eher der optimistische Fall. Anbieten würde sich die Cebit vom 6. bis 10. März. Ob das eingehalten kann, bleibt natürlich abzuwarten. Auf den geleakten Roadmaps gab es ja noch keinen Launch Monat zu sehen.


Das mit Zambezi ging bekanntlich schief, aber da gabs dann ja auch nen neuen Zeitplan:
[URL]http://www.abload.de/img/amd_bulldozer_launchhrnw.jpg

Das ist die alte Folie. Neue sieht so aus:

http://s1.directupload.net/images/110924/u7zjb5hi.jpg

S940
2011-09-24, 18:23:21
Anfang April (http://blogs.amd.com/fusion/2011/04/04/%E2%80%9Cllano%E2%80%9D-apu-is-shipping/) Auslieferung bis zum launch Mitte Juni sind 2,5 Monate. 2-3 Monate sind hier passender. Zumal der offizielle Verkaufsstart vom Desktop Llano erst am 1. Juli erfolgte und Notebooks im Juni so weit ich mich erinnern kann noch keine verfügbar waren.
Hmm, ok Auslieferung schon im April .. arg zeitig und früher als im Plan :freak:

Irgendwie ist da unklar, was mit "production" nun gemeint ist. Sie beschreiben es hier zwar:

the next question I inevitably get asked is how does AMD define “production”? Fortunately, much like the title of this blog, the answer is simple. When we talk about production here at AMD, it refers to the units that will ultimately be in the systems that our OEM partners will ship to retailers or end-customers.
Aber was ist "ultimatly be" ? Sofort bei den OEMs? Dann wäre Ihre Production definition eher die Production bei der OEMs, also AMDs Auslieferung.


November 9 nach dieser Quelle (http://hothardware.com/News/AMD-Announces-Brazos-Shipments-Sheds-Light-On-2012-Roadmaps/).
Lol, ich meinte mit "im Nov10" eigentlich "im November 2010", so genau gehts doch eh nicht ^^
Erstens wären das 2 Monate abzüglich einer Woche und zweitens war das quasi ein paper launch. Die paar Zacates im Desktop waren sofort ausverkauft und Notebooks mit Brazos zogen sich lange hin. Deswegen wäre März eher der optimistische Fall.Wenn die jetzt wirklich die Production der OEMs meinen, dann stimme ich zu, dann wirds eher später als Februar, bei Notebooks dauert das wirklich länger.

Das ist die alte Folie. Neue sieht so aus:
Darauf ging ich schon oben ein, Stichwort Vorfahrt für Opterons.

Zusammenfassung:
AMD Production = Auslieferung und Produktion der OEMs.
Bei Desktop CPUs -> 1-2 Monate bis Verkaufsstart,
bei mobile CPUs eher 2-3.

ok?

Ronny145
2011-09-24, 18:27:56
Zusammenfassung:
AMD Production = Auslieferung und Produktion der OEMs.
Bei Desktop CPUs -> 1-2 Monate bis Verkaufsstart,
bei mobile CPUs eher 2-3.

ok?


Das kommt hin. Nur würde ich tippen, dass der Desktop keine Vorfahrt bekommt, also höchstens gleichzeitig launcht oder wieder 2 Wochen später wie beim Llano. Dann ist März wahrscheinlicher wenn nichts mehr schief geht. Cebit wäre sehr passend.

Neon3D
2011-09-24, 19:14:08
Der Begriff IPC wird hier imo falsch verwendet. Wenn hier so absurde Schlüsse gezogen werden wie, dass Bulldozer um 30% pro Takt durch interne Verbesserungen zulegen müsste, um den Phenom II X6 um 10% zu übertrumpfen. :freak:
Vorweg: Ein FX-8150 scheint einem Phenom II X6 1100T wenigstens ebenbürtig zu sein.
In Cinebench gibts einen Gleichstand, dort liegt die IPC des Bulldozers entsprechend dem Taktunterschied um 8% niedriger als die des Phenom II X6 1100T. IPC heißt nicht Instructions per Core, sondern Instructions per Cycle. Und natürlich kann man durch mehr parallele Ausführungseinheiten die IPC steigern.
Was hier vielen auf den Fingern brennt und fälschlicherweise als IPC bezeichnet wird, ist die Single-Thread-Performance pro Takt. Aufgrund der Architekturbesonderheiten kann man nicht von der Performance in Multithreading-Benchmarks auf die Single-Thread-Performance zurückschließen.

du hast vollkommen recht spasstiger! wenn man von instructions per core redet, dann darf man das nicht mit instructions per cycle gleichsetzten. es mag sein, das in bestimmten fällen die trennung nicht so einfach ist, aber damit dieser fehler nicht immer wieder auftritt, bin ich für die einführung der bezeichung IPCO = instructions per core :biggrin:

S940
2011-09-24, 19:29:58
Das kommt hin. Nur würde ich tippen, dass der Desktop keine Vorfahrt bekommt, also höchstens gleichzeitig launcht oder wieder 2 Wochen später wie beim Llano. Dann ist März wahrscheinlicher wenn nichts mehr schief geht. Cebit wäre sehr passend.
Naja, fürn Desktop sollte es dann ja eigene Pläne geben, die das von Dir gesagte reflektieren.
Könnte man auch gut als Überprüfung, falls die Produkte zum gleichen Zeitpunkt Stapellauf haben, nutzen ^^

Neon3D
2011-09-24, 19:31:05
AMD sieht selbst ein dicken Vorteil gegenüber dem X6 mit Crossfire bin sehr auf unabhängige Benches gespannt.

http://www.donanimhaber.com/islemci/galerileri/AMD-Bulldozer-FX-resmi-test-sonuclari_23.htm

Wahrscheinlich hat man bei den Intel und X6 System die mickrigsten Boards/Chipsätze genutzt wo z.b nicht alle Karten 8 Lanes bekommen.Bei Intel bringt's z.b was wenn auf einem Z68 zusätzlich ein NF200 verbaut wird.

lol, dann wäre selbst intel auf die gigabyte verarschung reingefallen "unser board macht pcie 3.0", nur das 16 lanes in 80% der fälle gar nicht anliegen und man hauptsächlich nur auf pcie 2.0 beschränkt wird. aber das wird natürlich verschwiegen. ich fand gigabyte mal gut, aber bei so was ist :down:

Spike2
2011-09-24, 20:28:22
Mit OC-Takt Werbung zu machen...als ob diese Zahl irgendeine Bedeutung hätte. Wenn ich mich jetzt hinstelle und einen 8086-Klon entwickle, der spielend die 12GHz knackt, dann wäre das immer noch eine Shice-langsame Krücke. Also was genau sollen uns die 8,irgendwas jetzt sagen?

Blediator16
2011-09-24, 20:33:44
Ich bin sehr auf die 4kerner + OC gespannt. Die scheinen billig zu werden und wohl auch schön übertaktbar.

Sir Integral Wingate Hellsing
2011-09-24, 20:41:26
Ich bin sehr auf die 4kerner + OC gespannt. Die scheinen billig zu werden und wohl auch schön übertaktbar.

Genau, den hab ich auch im Auge (FX-4170) ;)

Da sollte man mit LuKü locker 5 GHz packen, 12 MB Cache sind auch dabei.
Naja, wird mit OC dann wohl 140-150W werden :freak:
Aber für ca 125-150 EUR ist das doch ok :wink:

Heelix01
2011-09-24, 20:48:34
Mag sein das AMD im Bereich 200€+ nichts gegen Intel machen kann, letztlich kauft die Mehrheit halt doch P/L im Bereich 100€ bis 200€ und da kann AMD vermutlich über den Preis einiges machen. Zumindest die Mehrheit der nicht OEM PC Käufer :) .
Für die OEM Kunden haben sie ja: 8*4.2GHZ ^^ .

S940
2011-09-24, 20:48:48
Genau, den hab ich auch im Auge (FX-4170) ;)

Da sollte man mit LuKü locker 5 GHz packen, 12 MB Cache sind auch dabei.
Naja, wird mit OC dann wohl 140-150W werden :freak:
Aber für ca 125-150 EUR ist das doch ok :wink:
Dito, das sollten richtige Kracher werden ^^

Sir Integral Wingate Hellsing
2011-09-24, 21:13:12
Dito, das sollten richtige Kracher werden ^^

Schön wäre es die 5 GHz mit dem Vieh zu knacken ;)
Mein Ziel wäre ~5,2 GHz bei ~1,4-1,45V (dann ist er bestimmt schon fast bei 200W+) :freak::freak::freak:

Duplex
2011-09-24, 21:21:31
Was sagt ihr dazu
Andreas Stiller / ct
Zudem sind einige Performance-fressende Bugs bekannt, die sich möglicherweise durch einen Prozessortreiber noch beheben lassen, bevor [Stepping*] B3 oder C0 ihnen später wohl ganz den Garaus macht. Für Linux existiert jedenfalls seit Ende Juli ein Kernel-Patch (noch nicht bei den Distributionen), der das häufige gegenseitige Herausschmeißen von Cache-Lines (Thrashing) wegen eines Aliasing-Problems im L1-Instruktionscache vermeidet. Er wird unter "[PATCH]x86.AMD:Correct F15h IC aliasing issue" auf gmane.org diskutiert, unter anderem auch von Linus Torwalds. Vor allem einige SPEC-CPU2006-Benchmarks sollen unter diesem Aliasing-Problem leiden.
http://www.planet3dnow.de/vbulletin/showpost.php?p=4497702&postcount=365

Probleme im Cache Design / Frontend?

Und das hier
The first one is that there is a new stepping coming, SemiAccurate is hearing mid- to late Q1/2012 for the next rev.That rev is said to bump performance, specifically integer performance, up by quite a bit, and possibly improve clocks too.
Mehr Integer Leistung mit neuer Rev.

http://semiaccurate.com/2011/09/07/bulldozer-finally-shipped-last-week/

Wenn das Design mehere Bugs hat, dann wird bestimmt die IPC darunter leiden, dann ist das mit den niedrigen Preisen klar, hoffentlich wird man mit der neuen Rev. die Leistung pro Takt steigern können damit man den i7-2600 später noch abziehen kann...ursprünglich hieß es ja das die IPC höher als K10 ausfallen soll, da muss sich also ein BUG eingeschlichen haben....
hm auf der anderen Seite hat doch irgendein AMD Mitarbeiter behauptet das es keine technischen Probleme gäbe...Aber nach Barcelona will natürlich keiner ein 2. TLB Bug bekannt geben :freak:

dildo4u
2011-09-24, 21:23:57
AMD sollte solche Gerüchte sofort erschlagen oder der Launch wird Katastrophal.

Skysnake
2011-09-24, 21:32:15
Was sagt ihr dazu
Andreas Stiller / ct

http://www.planet3dnow.de/vbulletin/showpost.php?p=4497702&postcount=365

Probleme im Cache Design / Frontend?

Und das hier

Mehr Integer Leistung mit neuer Rev.

http://semiaccurate.com/2011/09/07/bulldozer-finally-shipped-last-week/

Wenn das Design mehere Bugs hat, dann wird bestimmt die IPC darunter leiden, dann ist das mit den niedrigen Preisen klar, hoffentlich wird man mit der neuen Rev. die Leistung pro Takt steigern können damit man den i7-2600 später noch abziehen kann...ursprünglich hieß es ja das die IPC höher als K10 ausfallen soll, da muss sich also ein BUG eingeschlichen haben....
hm auf der anderen Seite hat doch irgendein AMD Mitarbeiter behauptet das es keine technischen Probleme gäbe...Aber niemand will freilwillig zugeben ein 2. TLB Bug bekannt geben :freak:
so etwas in der Art musste man schon die ganze Zeit befürchten. Wäre natürlich kacke, wenn es ein Phenom 1 reloaded geben würde und sie ex erst mit bd2 oder einer zweiten rev Anfang 2012 schaffen würden dies zu fixen.

Duplex
2011-09-24, 21:39:36
Edit: kann gelöscht werden...
Die Mitarbeiter von Intel lachen bestimmt wenn Sie diese negativen Sachen alle lesen...

Skysnake
2011-09-24, 21:44:02
? Was bringt nichts?

Duplex
2011-09-24, 21:50:11
so etwas in der Art musste man schon die ganze Zeit befürchten. Wäre natürlich kacke, wenn es ein Phenom 1 reloaded geben würde und sie ex erst mit bd2 oder einer zweiten rev Anfang 2012 schaffen würden dies zu fixen.
Hoffen wir das es dann mit ne neuen Rev. gelingen wird...
P1 reloaded wird nicht werden, diesmal kann man wenigstens OC Potential mitbringen, den Kunden wirds freuen wenn das ding dann mit 5Ghz läuft...Wird ja sowieso günstiger als nen i7-2600

Sir Integral Wingate Hellsing
2011-09-24, 21:50:53
Edit: kann gelöscht werden...
Die Mitarbeiter von Intel lachen bestimmt wenn Sie diese negativen Sachen alle lesen...

Sicher nicht. CPU-Design/-Produktion ist nen hartes Geschäft, ich denke sie werden nen schadenfrohes Grinsen haben - aber Intel hat schon zuviel in Vergangenheit verbockt um jetzt laut lachen zu können!
AMD hatte mit dem Phenom I nen grösseres Prob: Bugs in der CPU, keine hohen Taktraten, hoher Verbrauch - immerhin der Takt stimmt diesmal ;)

Spike2
2011-09-24, 21:58:55
Man kann echt nur hoffen, daß AMD die Bugs dann mit der nächsten Revision fixen kann. Problematisch dürften nur die Gerüchte sein, denn wer möchte sich einen verbuggten BD kaufen, wenn er auch schon kurze Zeit später die bugfreie neue Revision haben kann?

fdk
2011-09-24, 22:05:01
Falls sich das bewahrheitet kann man das Ganze auch zum OEM-Launch umfunktionieren. Wenn die nächste Revision schon ansteht wird bd(1) im Retailmarkt keinen Blumentopf gewinnen. Es sei denn AMD würde ein Austauschprogramm anbieten ähnlich dem b2 chipsatzbug bei Intel. Allerdings wäre das bei einer CPU ein etwas teures Unterfangen. Immerhin kann man die anders als die Rückläufer bei den Mainboards nur noch für die (OEM-)Halde verwenden.

FeuerHoden
2011-09-24, 22:05:43
Ich hoffe dass es Bugs sind die in der nächsten Revision nicht mehr vorhanden sind. Schlimmer wäre doch wenn es sich nicht um einen oder mehrere Bugs handelt und das Design als Ganzes nichts taugt. ;)

Botcruscher
2011-09-24, 22:09:15
TLB-Bug die Zweite. Na mal sehen.

Sir Integral Wingate Hellsing
2011-09-24, 22:10:39
Ich hoffe dass es Bugs sind die in der nächsten Revision nicht mehr vorhanden sind. Schlimmer wäre doch wenn es sich nicht um einen oder mehrere Bugs handelt und das Design als Ganzes nichts taugt. ;)

BD2/Piledriver wird min genauso brauchbar sein wie der Phenom II, beim Phenom I gab es auch Unkenrufe das AMD platt geht und der Phenom II wurde gut verkauft :)

Ronny145
2011-09-24, 22:15:39
Den Artikel von Andreas Stiller gibt es auch online: http://www.heise.de/ct/artikel/Prozessorgefluester-1347034.html

Er fasst bekannte Dinge zusammen.

Übrigens kann ich mich an einen älteren Artikel erinnern wo er verringerte IPC prognostiziert hat. Offenbar lag er doch nicht so schlecht mit seiner damaligen Einschätzung.


Da müssen Takt und Turbo Core schon um einiges zulegen, um das wieder auszugleichen. In der viel diskutierten IPC-Frage jedenfalls – Instruktionen pro Takt – wird Bulldozer trotz einiger Architekturverbesserungen wohl kaum mit seinem Vorgänger mithalten können, zumal die Kerne sich ja auch zu zweit das Frontend mit den Decodern und die FPU teilen müssen.
http://www.heise.de/ct/artikel/Prozessorgefluester-1229930.html

FeuerHoden
2011-09-24, 22:30:23
Beim TLB-Bug war die Sache aber leicht anders gelagert. Der Bug führte dazu dass die CPU in Ausnahmesituationen Fehler verursachte die schlimmsten Falls einen Systemabsturz zur Folge hatten, ein Problem das 99,99% der Gamer und Firmen nie getroffen hätte, wohl aber die großen Clustersysteme und deren Zulieferer wo das dicke Geld gemacht wird. Da wäre ein Absturz auch nicht so das Problem, aber die unbemerkten Fehler wären eine Katastrophe.
Das Drama war dann der Bugfix der nur per BIOS Update möglich war (für 70% der Gamer und Firmen ein KO Kriterium) und ~30% Leistung kostete, eine Katastrophe.

In diesem Fall ist es so dass der Bug lediglich Leistung kostet und bereits ein Treiberupdate scheinbar Linderung schaffen könnte. In dem Fall könnte man durch einen OS-seitigen Bugfix den Bug komplett beseitigen ohne anderweitig einen Nachteil zu haben. Das war beim TLB-Bug GANZ anders.

Das kommt eben davon wenn man ein Produkt gezwungenermaßen 2 Monate schneller in den Markt prügeln muss als der direkte Konkurrent der von allen Ressourcen mindestens 10x soviel hat. Jeder Hersteller der unter so einem Druck steht macht solche Fehler, das ist ganz normal da ist keiner von uns besser oder schlechter, deswegen nehme ich (kleiner Fisch) das AMD auch nicht krumm die ja selbst den größten Nachteil davon haben wenn sie solche Fehler machen, der Servermarkt ist da gnadenlos.

mboeller
2011-09-24, 22:46:20
ich weiß ja nicht was ihr hier alle habt.
Zumindest bei Spielen ist der Bulldozer anscheinend wesentlich schneller geworden. +50% - +70% im Vergleich zu einem PhenomII X4 980 oder auch X6 1100T:

[aus dem xtremesystems.org "geliehen"]

http://tof.canardpc.com/view/4bd57988-51a7-4153-84e1-15da62539221.jpg

F1 2010 in der Auflösung 1980 x 1080:
http://media.bestofmicro.com/5/Q/274958/original/F1%202010%201920.png

Civ5 in der Auflösung 1680 x 1050:
http://images.anandtech.com/graphs/graph4310/37380.png

und hier der Link zu den anandtech Spieletests des X4 980:
http://www.anandtech.com/show/4310/amd-phenom-ii-x4-980-black-edition-review/7

Der Bulldozer ist zwar nicht schneller als ein 980X od. 2600K, aber zumindest bei den Spielebenchmarks auf der AMD-Folie IMHO wesentlich schneller als die alte CPU-Garde von AMD.

PS: ich hoffe die Bilder sind nicht zu groß.

Ronny145
2011-09-24, 22:53:49
Das sind vermutlich stark GPU limitierende Benchmarkwerte mit ein wenig Messungenauigkeit. Die Ergebnisse sind einfach zu eng beisammen. Daraus Spieleleistung abzulesen halte ich für vermessen. AMD wird schon extra Benchmarks gewählt haben, die nicht zu stark CPU fordernd sind. Mit der richtigen GPU Limitierung ist der K10.5 auch nicht langsamer. Würde schon reichen eine langsame Grafikkarte zu verwenden.

FeuerHoden
2011-09-24, 23:23:17
Auch geil von AMD. Aus dem Performancemangel des einen Produkts (CPU) ein Verkaufsargument für ein anderes Produkt (GPU) aus dem eigenen Hause schaffen. :D

Botcruscher
2011-09-24, 23:43:46
Zu schnell wäre auch nicht gut. Da würde man ja das GPU-limit verlassen. Werbebildchen sind echt so Banane.

S940
2011-09-25, 00:54:41
so etwas in der Art musste man schon die ganze Zeit befürchten. Wäre natürlich kacke, wenn es ein Phenom 1 reloaded geben würde und sie ex erst mit bd2 oder einer zweiten rev Anfang 2012 schaffen würden dies zu fixen.
Naja, es gibt da ja auch noch die Möglichkeit eines Windows Patches. Ansonsten ist die Leistung auch so schon nicht schlecht. Immerhin ca. 2600K Niveau, allemal besser als bisher. Das eine erste Generation bzw. eine B-Revision nie perfekt ist, war von vornherien klar.

@Duplex:
Intel wird da eher nicht lachen, sondern Schweißperlen auf die Stirn bekommen, wenn sie kalkulieren, wie schnell BD ohne die ganzen Bremsfallschirme und mit Zusatzoptimierungen werden könnte :freak:

@mboeller:
Was besonders auffällt ist Civ5, da solls laut früherem Posting hier im Thread ja nen AMD Bug geben, aufgrunddessen das Spiel nur 2 Threads benützt. 95% oder (etwas mehr) Abstand zu nem 980X, der schneller als ein 2600K in dem Spiel ist, sind da fast schon fantastisch, da liegt wohl der volle Turbo Takt an ^^

Skysnake
2011-09-25, 01:11:43
Naja, ich bin da etwas skeptisch, was den Windows patch angeht. Wobei wenn da was für Linux kommt, ist es vielleicht doch möglich. Keine Ahnung, was ich davon halten soll.

Für mich klingt das eher nach einem Bug im Cohärenzprotokoll, wobei ich mir das eigentlich NICHT vorstellen kann. Das wird ja rauf und runter getestet, und vor allem ist das ja eigentlich von der theoretischen Seite her ja alles schon 10 mal abgeklopft. Wenn kann es also nur ein Implementierungsfehler sein.

Per Macro-Code ließe sich dort aber sicherlich alles wieder ausbügeln. Eventuell ist dies aber auch der Grund für die schlechten L1/L2 Werte. Das es eben so ist, das Sie mit Macro-Code das Problem notdürftig gefixed haben. Dann kann ich mir aber nicht recht vorstellen, was sie in den letzten 3-6 Monaten gemacht haben, die sich BD verspätet hat. So was findet man ja nicht erst jetzt heraus....

Fatal wäre es natürlich, wenn 1-2 Fehler einen anderen Fehler verdeckt haben. So etwas passiert ja, und wirft einen dann weit zurück.

Ich kanns aber wirklich nicht verstehen, dass die das Problem wohl noch nicht endgültig gefixed haben (hoffentlich, da die Performance sonst hinter den Erwartungen zurück bleibt).

Also wie man es dreht und wendet, es ist beides nicht gut... Naja, und das es diese Folien gibt, spricht eigentlich dagegen, dass die Probleme noch mit einem Windows patch gefixed werden. Das sind wahrscheinlich schon die Werte mit Patch, falls es denn einen gibt.

Also ganz ehrlich. Ich versteh das grad echt nicht mehr. Macht einfach keinen Sinn..

dildo4u
2011-09-25, 01:15:12
@Duplex:
Intel wird da eher nicht lachen, sondern Schweißperlen auf die Stirn bekommen, wenn sie kalkulieren, wie schnell BD ohne die ganzen Bremsfallschirme und Zusatzoptimierungen werden könnte :freak:

Weiter am Hypen oh man wie viele Jahre willste,das Vertrösten jetzt noch aufrechterhalten?Wahrscheinlich noch nach dem Launch werden weiter Märchen erzählt,das ist schon ne Kunst.

merfu
2011-09-25, 02:42:11
Vielleicht gibt es aufgrund der Bugs die Gerüchte um ein Windows Update. Ob das ähnlich läuft wie beim phenom I?

MfG

Gipsel
2011-09-25, 05:10:53
Den Artikel von Andreas Stiller gibt es auch online: http://www.heise.de/ct/artikel/Prozessorgefluester-1347034.html
Zu der Heise-Meldung:
Wie dem auch sei, Obrovsky veröffentlichte in seinem Blog auch Ergebnisse mit Nominaltakt und eingeschaltetem Turbo, so wie die Prozessoren üblicherweise gefahren werden. Und da sieht es erheblich besser für den FX-8150 mit 3,6 GHz im Vergleich zum Phenom II X6 1100T mit 3,3 GHz aus. Dank Turbo schafft der FX weiterhin 6,93 Punkte bei Cinebench 11.5, der Phenom II X2 sackt hingegen auf 5,92 ab. Auch beim Großteil der anderen Benchmarks hängt der FX den alten Phenom ab, liefert sich eher Gefechte mit dem Core i7 2600K und zuweilen auch mit dem Core i7 990x. Bei TrueCrypt AES, das offenbar die neuen AES-Befehle unterstützt, ist die Bandbreite fast fünfmal so hoch wie beim Phenom. Viel Verwirrung also höchste Zeit, dass wir mal selbst Hand anlegen können.Genau.

MR2
2011-09-25, 09:29:39
Das liest sich ja schon mal gar nicht so schlecht. Bin schon auf enhanced und nextgen BD gespannt.

Und gleich muß ich wieder an die gestrige CB-News denken. Intel sieht sich 4 Jahre vor der Konkurenz, fertigungstechnisch. Wo würde der BD stehen, gefertigt und optimiert auf Intels eigenem Prozeß? Was AMD da leistet, von der Öffentlichkeitsarbeit abgesehen, ist schon sehr gut. Mehr war sicher in den letzten schwierigen Jahren nicht möglich.

MFG MR2

Ronny145
2011-09-25, 10:08:05
Corescn hat einen B2G Bulldozer. Hab ihn ein Link zum 0811 Bios (AGESA 1.1.0.0) zukommen lassen. Gibt es im Asus Rog Forum (http://www.asusrog.com/forums/showthread.php?4380-Crosshait-V-Formula-Bulldozer-UEFI-0081). Vielleicht fallen die Ergebnisse damit ein wenig besser aus.

Zu den Game Benchmarks mit 980x, es kam folgendes System zum Einsatz:

AMD System using AMD FX-8150 Processor with AMD 990FX, AMD Radeon(tm) HD
6870, 8GB DDR1600, Windows(R) 7 64bit. Intel System using Intel Core
i7-980X
with Gigabyte EX58-UD5 motherboard, AMD Radeon(tm) HD 6870, 6GB DDR1600,
Windows(R) 7 64bit.

http://img.donanimhaber.com/images/haber/amdfxpressdeck_22a_dh_fx57.jpg

In allen anderen Benchmark Slides ist es eine HD6970 oder HD6950 (einige mit Crossfire). Es ist somit recht eindeutig, dass ein GPU Limit in der 980x Folie absichtlich provoziert wurde.

boxleitnerb
2011-09-25, 10:12:40
Soviel Cherrypicking hab ich echt noch nie erlebt. Benchmarks, Gegner, Komponenten...da bleibt ja überhaupt nichts konstant.

Edit:
Ronny woher hast du die Info? Ich hab das im Forum von hardware.fr gefunden, aber da wird von Slide 26 gesprochen, dabei sind es nur 23.

Twodee
2011-09-25, 10:13:46
Wenn das stimmt, dann ist das eine ganz schwache Vorstellung von AMD!
Setzt AMD neuerdings auf besonders dumme Käufer? ;D

Ronny145
2011-09-25, 10:41:11
Edit:
Ronny woher hast du die Info? Ich hab das im Forum von hardware.fr gefunden, aber da wird von Slide 26 gesprochen, dabei sind es nur 23.


Eigene Quelle. Slide 26 ist für die 980x Folie richtig. Auf Donanimhaber sind nicht alle Slides komplett.

/OBR hat es jetzt auf seinem Blog.

DDR3-1866 kam nirgends zum Einsatz. Bulldozer müsste eigentlich mit nativen 1866 im ein oder anderen Benchmarks besser abschneiden. In 7zip oder Winrar wirkt sich das doch aus.

Reneeeeeee
2011-09-25, 10:50:02
Auf Benchmarks vor dem Release gebe ich gar nichts, ich gehe dann nach den aktuellen Tests und entscheide dann.

Ich mache mich da jetzt noch nicht heiß.

S940
2011-09-25, 11:53:29
DDR3-1866 kam nirgends zum Einsatz. Bulldozer müsste eigentlich mit nativen 1866 im ein oder anderen Benchmarks besser abschneiden. In 7zip oder Winrar wirkt sich das doch aus.Wie doof ist das denn, zuerst preisen sie es in der Übersicht dick und fett 1866 an, und dann verwenden sie nur 1600?

Und der 980X ist von Intel nur bis 1066 (http://ark.intel.com/products/47932/Intel-Core-i7-980X-Processor-Extreme-Edition-%2812M-Cache-3_33-GHz-6_40-GTs-Intel-QPI%29) freigegeben, der wird damit tüchtig übertaktet, anstatt mit 2,1GHz rennt der L3 dann mit 3,2GHz :freak:
Bei der ganzen Handauswahl verwundert mich das jetzt schon, v.a. hätten sie beim RAM ja die "Ausrede", dass Intel nicht mehr unterstützt.
AMD: Zu bl*d zum Rosinenpicken ^^


Edit:
@Ronny145:
Gibts da noch nen Thread bei Corescn, oder bist Du privat mit Ihm im Kontakt?

boxleitnerb
2011-09-25, 12:01:11
Vielleicht gibt es doch noch Hoffnung, dass die Folien falsch sind? Ich mein, so inkompetent können die ja net sein oder?

M4xw0lf
2011-09-25, 12:14:43
Vielleicht gibt es doch noch Hoffnung, dass die Folien falsch sind? Ich mein, so inkompetent können die ja net sein oder?

Die Folien sehen leider unheimlich echt aus und sind auch verdammt viele... wenn die jemand gefaked hat, war das eine Mammutleistung ^^

Duplex
2011-09-25, 12:19:29
Die Folien wurden erst veröffentlicht nachdem einige Shops vorher die FX CPUs im Sortiment mit Preise gelistet hatten, woher soll OBR & Donanimhaber sonst die Preise der FX CPUs kennen? Von AMD ganz bestimmt nicht.

Dann noch diese billigen vergleiche mit einem i7-980x & 6870 :rolleyes:

Wenn sowas von AMD kommt, dann wäre das eine Katastrophe!

dildo4u
2011-09-25, 12:24:01
Die Folien wurden erst veröffentlicht nachdem einige Shops vorher die FX CPUs im Sortiment mit Preise gelistet hatten, woher soll OBR & Donanimhaber sonst die Preise der FX CPUs kennen? Von AMD ganz bestimmt nicht.

Dann noch diese billigen vergleiche mit einem i7-980x & 6870 :rolleyes:

Wenn sowas von AMD kommt, dann wäre das eine Katastrophe!
Es wurden Preise um 264$-300$ geleakt,die 245$ sind neu und wohl korrekt.

http://www.forum-3dcenter.org/vbulletin/showpost.php?p=8932197&postcount=4682

Skysnake
2011-09-25, 12:51:53
Die Folien sehen leider unheimlich echt aus und sind auch verdammt viele... wenn die jemand gefaked hat, war das eine Mammutleistung ^^

Ähm, da gab es aber auch schon GANZ andere Fakes! Ich erinnere nur mal an die Fakes einer Präsentation für die HD6k glaub ich wars. Da wurde nicht einfach nur ne Folie gefaked, sondern die komplette Präsentation.

Da hattest du eine (oder waren es 2-5?) Folie, die präsentiert wurde auf einer Veranstaltung, und von dem Beamer-Bild wurde ein Foto geschossen, wo dann das Publikum auch zu sehen war, aber die Folie war gefaked, und das sogar aus zwei unterschiedlichen Perspektiven :freak:

Also von daher, das kann hier locker ein Fake sein. Es gab wie gesagt schon krassere Fakes.

UND man sollte bedenken, das es von OBR kommt. Donanimhaber hat die Folien erst später gezeigt.... Es gibt also 2 Möglichkeiten. Donanimhaber hat die Folien von OBR, dann wären Sie aber schon blöd... (ok, es sei denn Sie wissen nicht das die Folien von ihm sind, weil Sie sie über einen dritten bekommen haben...) oder OBR hat die Folien von Donanimhaber bekommen im Tausch gegen seine tollen "Benchmarks" (FAKES :ufinger:)

Wie rum es auch sein mag, da die Dinger zu erst bei OBR zu sehen war, stinkt das Ding irgendwie wie ne Jauchegrube.... Ich glaub NICHTS mehr, was von dem Typen kommt....

boxleitnerb
2011-09-25, 13:00:24
Ronny, hast du Folie 30 und 32 in groß? Ich wüsste gerne, was für ein System für den Eyefinity-Vergleich benutzt wurde.

Ronny145
2011-09-25, 13:40:47
UND man sollte bedenken, das es von OBR kommt. Donanimhaber hat die Folien erst später gezeigt

Na so stimmt das nicht. Donanimhaber hat die Folien vorher angekündigt mit den Preisen von 245 USD usw. D.h. er hat vorher davon gewusst bevor OBR irgendwas auf seinem Blog veröffentlich hat.

Ronny, hast du Folie 30 und 32 in groß? Ich wüsste gerne, was für ein System für den Eyefinity-Vergleich benutzt wurde.

Nein, ich frage nachher nach. Ich hab ja die Systemangaben von allen mit Slide Nummern, nur die Slides an sich bzw. Nummern davon nicht (die sind leider bei Donanimhaber abgeschnitten)...könnte man sich davon vielleicht schon ableiten. Kann das erst später nachsehen.

Felixxz2
2011-09-25, 14:05:16
So viele Folien kannst du garnicht faken. Jede Folie ist relativ aufwändig gestaltet, endhält Benchmarks, Grafik, teilweise echte Fotos und es sind bei Donanimhaber immerhin 23 Stück!

Das sieht eindeutig nach proffesioneller AMD Arbeit aus, auch weil die Folien ähnlich aussehen wie frühere AMD Slides.

Die Leistung die dort gezeigt wird ist aber leider ziemlich schlecht. Zwar kann der FX in manchen Anwendungen ganz gut performen, aber hier handelt es sich wohl um Cherrypicking. Der einzig aussagekräftige Wert, CB 11.5, schaut weiterhin ziemlich schlecht aus.

Zumindest einen 2600K hätte ein Bulli schlagen müssen, denn die knappen 6 Punkte erreicht auch ein 1100T. Und wieder stellt sich mir die Frage warum so viel Cache? Man haut Kapazitäten, reales Geld und Leistungsaufnahme für NICHTS raus.
Ich mein der Bulldozer 4 Kerner mit 12 MB Cache ist ja schon fast ne Lachnummer. Scheitert wahrscheinlich am i3 mit 3 MB Cache, aber auf jeden Fall am i5 mit 6 MB Cache. Aber Hauptsache die Zahl ist größer.....

S940
2011-09-25, 14:23:07
Ich mein der Bulldozer 4 Kerner mit 12 MB Cache ist ja schon fast ne Lachnummer. Scheitert wahrscheinlich am i3 mit 3 MB Cache, aber auf jeden Fall am i5 mit 6 MB Cache. Aber Hauptsache die Zahl ist größer.....Das wird sicher spannend, Starcraft 2 mag eigentlich viel Cache, Spiele ansich eigentlich auch.
In jedem Fall ist mir der Standardbetrieb aber eh egal, das FX- Dingends hat nen freien Multi und der L3 ist Standardmäßig auch nur bei mickrigen 2-2,2GHz ;-)

Felixxz2
2011-09-25, 14:24:41
Aber warum ist dann ein 2600K bei gleichem Takt und ohne SMT nur 2% schneller als ein 2500K?

S940
2011-09-25, 14:36:09
Aber warum ist dann ein 2600K bei gleichem Takt und ohne SMT nur 2% schneller als ein 2500K?
Link?

Undertaker
2011-09-25, 14:56:41
Und wieder stellt sich mir die Frage warum so viel Cache? Man haut Kapazitäten, reales Geld und Leistungsaufnahme für NICHTS raus.

Gute Frage. In Packern oder Spielen bringt es vielleicht ein paar Prozent (gegenüber halber Cacheausstattung vermutlich aber auch weit unter 10%), in jedem Fall ist es aber höllisch ineffizient was die Fläche betrifft. An der Core-Architektur sieht man ja sehr schön, dass ein kleiner, dafür aber sehr schneller Cache die deutlich bessere Lösung zu sein scheint...

SavageX
2011-09-25, 15:15:47
Und wieder stellt sich mir die Frage warum so viel Cache? Man haut Kapazitäten, reales Geld und Leistungsaufnahme für NICHTS raus.



Weil AMD hier ein Die für den Server-Markt im Consumer-Bereich verkauft. Mit voraussichtlich eher geringen Stückzahlen. Die Bulldozer-APU kommt mit guter Wahrscheinlichkeit mit weniger Cache und geringerer Diegröße.

MR2
2011-09-25, 15:25:16
StarcraftII nutzt ja nur 2 Kerne, mal schauen was der hohe Takt dann bringt. Interessant wäre mal Battlefield3.

=Floi=
2011-09-25, 15:26:19
eher spart intel beim cache. gerade der L2 könnte da erheblich größer sein.

Felixxz2
2011-09-25, 15:39:19
Link?

http://www.computerbase.de/artikel/prozessoren/2011/test-intel-sandy-bridge/46/#abschnitt_performancerating

Beide mit 4C/4T und 2,8 GHz. 2600K ist zwischen 0% und 2% schneller.

Weil AMD hier ein Die für den Server-Markt im Consumer-Bereich verkauft. Mit voraussichtlich eher geringen Stückzahlen. Die Bulldozer-APU kommt mit guter Wahrscheinlichkeit mit weniger Cache und geringerer Diegröße.

Das mag durchaus sein, aber da ist ein SBE trotzdem interessanter. Leistet mehr in Sachen Rechnen und hat auch viel Cache (12-20MB). Ich glaube kaum, dass Bulli eine gute Server CPU wird, nur weil viel Cache drauf ist. Vielleicht ist das ein oder andere MB vorteilhaft, aber das Verhältnis zwischen Rechenleistung und Cache muss schon stimmen. Und das tuts beim Bulli ja mal garnicht.


@Undertaker

So ist es. Und das mit inklusivem Design, als (semi) exlusiv könnte der L3 Cache nochmal bisl kleiner sein.

@Floi

Der reicht aber locker aus. Ist ja inklusiv, d.h. dir bleibt dann weniger L3 Cache und da der mit Kerntakt arbeitet ist er ja auch gut schnell.

S940
2011-09-25, 16:09:19
http://www.computerbase.de/artikel/prozessoren/2011/test-intel-sandy-bridge/46/#abschnitt_performancerating

Beide mit 4C/4T und 2,8 GHz. 2600K ist zwischen 0% und 2% schneller.

Lol, ja wenns Dur nur um den Durchschnitt geht, klar, bzw. Abhängig von der Gameauswahl. Aber ich redete ja insbesondere von Starcraft 2, da sind das keine 0-2%:

Second point: More cache boosts the framerate. The Phenom II X3 720 BE with 2.80 GHz and 6 MiByte of L3 cache is around 13 percent faster then the Athlon II X4 635 with 2.90 GHz and no L3. Also the Core i3 540 (2.93 GHz) can't outperform the Core i5 750 (2.67 GHz) cause last one can utilize 8 MiByte L3 and the i3 only 4 MiByte.http://www.pcgameshardware.com/aid,766589/Starcraft-2-CPU-benchmarks-Intel-on-top-quads-without-performance-benefit/Practice/
Bin wirklich gespannt, ob das noch weiter auf die 12MB Cache des FX4 skaliert, und wies dann im Vergleich zum i3-2xxx ausgeht, der nur 3MB hat.

SavageX
2011-09-25, 16:11:49
Das mag durchaus sein, aber da ist ein SBE trotzdem interessanter. Leistet mehr in Sachen Rechnen und hat auch viel Cache (12-20MB). Ich glaube kaum, dass Bulli eine gute Server CPU wird, nur weil viel Cache drauf ist.

Keine CPU wird nur aufgrund von Cache zur guten Server CPU, aber klar ist, dass sich im Rechenzentrum schonmal gut parallelisierbare Aufgaben mit großen Worksets finden lassen, und da riecht die Bulldozer-Architektur gar nicht mal so verkehrt.


Vielleicht ist das ein oder andere MB vorteilhaft, aber das Verhältnis zwischen Rechenleistung und Cache muss schon stimmen. Und das tuts beim Bulli ja mal garnicht.


Ich glaube diese Abwägung können Leute wie wir, die ihr Brot nicht gerade mit CPU-Design verdienen, gar nicht abschließend beurteilen. Eine reine Desktop-CPU würde man aber vermutlich anders einstimmen.

mboeller
2011-09-25, 16:48:59
Das sind vermutlich stark GPU limitierende Benchmarkwerte mit ein wenig Messungenauigkeit. Die Ergebnisse sind einfach zu eng beisammen. Daraus Spieleleistung abzulesen halte ich für vermessen. AMD wird schon extra Benchmarks gewählt haben, die nicht zu stark CPU fordernd sind. Mit der richtigen GPU Limitierung ist der K10.5 auch nicht langsamer. Würde schon reichen eine langsame Grafikkarte zu verwenden.

ja, stimmt! Leider!

Die Folie mit der Konfiguration kannte ich noch nicht als ich meinen Beitrag gepostet hatte.

HD6870....witzig oder besser blamabel!! :(

Blediator16
2011-09-25, 16:52:59
Herrlich wie manche sich so aufregen :D

Coda
2011-09-25, 17:02:11
Der große L3 wird auch als Snoop-Filter in Multiprozessor-Umgebungen gebraucht.

Extra sonst ein Consumer-Die mit weniger L3 zu produzieren lohnt wohl einfach nicht. Mal abgesehen davon, dass es auch On-Die als Shared-Storage mit geringer Latenz zwischen den Cores fungiert.

Ronny145
2011-09-25, 17:04:04
Ronny, hast du Folie 30 und 32 in groß? Ich wüsste gerne, was für ein System für den Eyefinity-Vergleich benutzt wurde.


Slides 12 and 13:
AMD System using AMD FX-8150 Processor with AMD 990FX, AMD Radeon(tm) HD
6970, 8GB DDR1333, Windows(R) 7 64bit. Intel System using Intel Core
i5-2500K with
Asus P67 Deluxe motherboard, AMD Radeon(tm) HD 6970, 8GB DDR1333, Windows(R) 7 64bit.
Slides 14, 18, 20 and 21:
AMD System using AMD FX-8150 Processor with AMD 990FX, 2xAMD Radeon(tm)
HD 6970, 8GB DDR1600, Windows(R) 7 64bit.

Slides 15 and 19:
AMD System using AMD FX-8150 Processor or AMD Phenom(tm) II X6 1100T
Processor with AMD 990FX, AMD Radeon(tm) HD 6950, 8GB DDR1333, Windows(R) 7
64bit.
Slide 16:
AMD System using AMD FX-8150 Processor with AMD 990FX, 2xAMD Radeon(tm)
HD 6970, 8GB DDR1333, Windows(R) 7 64bit. Intel System using Intel Core
i7-
2600K with Asus P67 Deluxe motherboard, 2xAMD Radeon(tm) HD 6970, 8GB
DDR1333, Windows(R) 7 64bit.
Slide 17
AMD System using AMD FX-8150 Processor or AMD Phenom(tm) II X6 1090T
Processor with AMD 990FX, AMD Radeon(tm) HD 6970 in CrossFireX(tm) (x2), 8GB
DDR1333, Windows(R) 7 64bit.
Slides 24:
Pricing determined from Pricewatch.com as of 8/25/2011. AMD system
includes: AMD FX-8150 Processor ($245), AMD 990FX ($190), AMD Radeon(tm)
HD 6970
($320), AMD Black Memory Edition ($50). Intel system includes Intel
Core i7-980X ($999), Intel X58 ($220), AMD Radeon(tm) HD 6970 ($320),
DDR3-1600 Kit
Memory ($100). For both systems: SAMSUNG B2430H Monitor ($199), Razer
Deathadder Mouse ($47), MS Keyboard ($20), Thermaltake - TR-800P
Bronze80Plus
800 Powersupply ($109), Cooler Master - Elite Mid Tower Case RC-310
($40), Western Digital - Western Digital Caviar Blue ($66)
Slide 26:
AMD System using AMD FX-8150 Processor with AMD 990FX, AMD Radeon(tm) HD
6870, 8GB DDR1600, Windows(R) 7 64bit. Intel System using Intel Core
i7-980X
with Gigabyte EX58-UD5 motherboard, AMD Radeon(tm) HD 6870, 6GB DDR1600,
Windows(R) 7 64bit.


Vielleicht lässt sich das auch so einordnen. Hmm 2500k gibt es nur einmal, müsste Slide 12 oder 13 sein.



Edit:
@Ronny145:
Gibts da noch nen Thread bei Corescn, oder bist Du privat mit Ihm im Kontakt?

Mail Kontakt. Thread mit Ergebnissen wird er sicher noch erstellen.

So viele Folien kannst du garnicht faken. Jede Folie ist relativ aufwändig gestaltet, endhält Benchmarks, Grafik, teilweise echte Fotos und es sind bei Donanimhaber immerhin 23 Stück!


Es könnte höchstens jemand aus der AMD Marketingabteilung gefälscht und an die altbekannten Leaker (OBR, Donanimhaber, corescn usw.) verteilt haben. Dann wär's möglich.

Undertaker
2011-09-25, 17:09:01
Lol, ja wenns Dur nur um den Durchschnitt geht, klar, bzw. Abhängig von der Gameauswahl. Aber ich redete ja insbesondere von Starcraft 2, da sind das keine 0-2%:
http://www.pcgameshardware.com/aid,766589/Starcraft-2-CPU-benchmarks-Intel-on-top-quads-without-performance-benefit/Practice/
Bin wirklich gespannt, ob das noch weiter auf die 12MB Cache des FX4 skaliert, und wies dann im Vergleich zum i3-2xxx ausgeht, der nur 3MB hat.

Ich habs dir vor Ewigkeiten schonmal erklärt, die schlechte Clarkdale-Performance hängt an der grottigen Latenz des Off-Die IMC und nicht an der absoluten Cachemenge. Siehe hier, grob 1/3 Mehrleistung durch Sandy Bridge!

http://www.tomshardware.de/Gaming-CPU-core-i3-2100-phenom-ii-x6-1075t,testberichte-240746-8.html

Edit: Und der Clarkdale i3 hatte sogar 1MB L3-Cache mehr. Auch bei AMD sind die Profite z.B. durch den größeren L2 von Regor und den kleineren L3 der (alten) Phenom II 800 doch sehr im Rahmen. Man kann in Spielen oder Packern zwar oftmals Differenzen messen, richtig schmerzhaft wird es aber erst, wenn der L3 komplett gestrichen wird (und auch das nicht immer bzw. mit schnellerem DDR3 abnehmen).

LovesuckZ
2011-09-25, 17:17:27
Es könnte höchstens jemand aus der AMD Marketingabteilung gefälscht und an die altbekannten Leaker (OBR, Donanimhaber, corescn usw.) verteilt haben. Dann wär's möglich.

Wenn ich Cheffe von AMD wäre und würde dies stimmen, würde die komplette PR-Abteilung neu besetzt werden.

Wenn "Hype"-Informationen geleakt werden, dann ist es verständlich. Aber solches Material erzeugt nur negative Stimmung. Und das kann man wohl kaum wollen.

S940
2011-09-25, 17:33:50
Slides 12 and 13:
AMD System using AMD FX-8150 Processor with AMD 990FX, AMD Radeon(tm) HD
6970, 8GB DDR1333, Windows(R) 7 64bit. Intel System using Intel Core
i5-2500K with
Asus P67 Deluxe motherboard, AMD Radeon(tm) HD 6970, 8GB DDR1333, Windows(R) 7 64bit.
Slides 14, 18, 20 and 21:
AMD System using AMD FX-8150 Processor with AMD 990FX, 2xAMD Radeon(tm)
HD 6970, 8GB DDR1600, Windows(R) 7 64bit.

Slides 15 and 19:
AMD System using AMD FX-8150 Processor or AMD Phenom(tm) II X6 1100T
Processor with AMD 990FX, AMD Radeon(tm) HD 6950, 8GB DDR1333, Windows(R) 7
64bit.
Slide 16:
AMD System using AMD FX-8150 Processor with AMD 990FX, 2xAMD Radeon(tm)
HD 6970, 8GB DDR1333, Windows(R) 7 64bit. Intel System using Intel Core
i7-
2600K with Asus P67 Deluxe motherboard, 2xAMD Radeon(tm) HD 6970, 8GB
DDR1333, Windows(R) 7 64bit.
Slide 17
AMD System using AMD FX-8150 Processor or AMD Phenom(tm) II X6 1090T
Processor with AMD 990FX, AMD Radeon(tm) HD 6970 in CrossFireX(tm) (x2), 8GB
DDR1333, Windows(R) 7 64bit.
Slides 24:
Pricing determined from Pricewatch.com as of 8/25/2011. AMD system
includes: AMD FX-8150 Processor ($245), AMD 990FX ($190), AMD Radeon(tm)
HD 6970
($320), AMD Black Memory Edition ($50). Intel system includes Intel
Core i7-980X ($999), Intel X58 ($220), AMD Radeon(tm) HD 6970 ($320),
DDR3-1600 Kit
Memory ($100). For both systems: SAMSUNG B2430H Monitor ($199), Razer
Deathadder Mouse ($47), MS Keyboard ($20), Thermaltake - TR-800P
Bronze80Plus
800 Powersupply ($109), Cooler Master - Elite Mid Tower Case RC-310
($40), Western Digital - Western Digital Caviar Blue ($66)
Slide 26:
AMD System using AMD FX-8150 Processor with AMD 990FX, AMD Radeon(tm) HD
6870, 8GB DDR1600, Windows(R) 7 64bit. Intel System using Intel Core
i7-980X
with Gigabyte EX58-UD5 motherboard, AMD Radeon(tm) HD 6870, 6GB DDR1600,
Windows(R) 7 64bit.

Thx.

Mail Kontakt. Thread mit Ergebnissen wird er sicher noch erstellen.
Danke (Die Frage war von mir), na dann beobachte ich den Thread mal wieder, hab gesehen, dass er wieder offen ist, wenn mich nicht alles täuscht.

fondness
2011-09-25, 17:36:43
Wenn ich Cheffe von AMD wäre und würde dies stimmen, würde die komplette PR-Abteilung neu besetzt werden.

Wenn "Hype"-Informationen geleakt werden, dann ist es verständlich. Aber solches Material erzeugt nur negative Stimmung. Und das kann man wohl kaum wollen.

Ich weiß nicht obs dir aufgefallen ist, aber das sollen "Hype"-Informationen sein. :ugly:
Ist ja nicht so als würden dort die eigenen Chips irgendwie in schlechtes Licht gerückt, mehr ist eben nicht drinnen.

boxleitnerb
2011-09-25, 17:49:47
Slides 12 and 13:
AMD System using AMD FX-8150 Processor with AMD 990FX, AMD Radeon(tm) HD
6970, 8GB DDR1333, Windows(R) 7 64bit. Intel System using Intel Core
i5-2500K with
Asus P67 Deluxe motherboard, AMD Radeon(tm) HD 6970, 8GB DDR1333, Windows(R) 7 64bit.
Slides 14, 18, 20 and 21:
AMD System using AMD FX-8150 Processor with AMD 990FX, 2xAMD Radeon(tm)
HD 6970, 8GB DDR1600, Windows(R) 7 64bit.

Slides 15 and 19:
AMD System using AMD FX-8150 Processor or AMD Phenom(tm) II X6 1100T
Processor with AMD 990FX, AMD Radeon(tm) HD 6950, 8GB DDR1333, Windows(R) 7
64bit.
Slide 16:
AMD System using AMD FX-8150 Processor with AMD 990FX, 2xAMD Radeon(tm)
HD 6970, 8GB DDR1333, Windows(R) 7 64bit. Intel System using Intel Core
i7-
2600K with Asus P67 Deluxe motherboard, 2xAMD Radeon(tm) HD 6970, 8GB
DDR1333, Windows(R) 7 64bit.
Slide 17
AMD System using AMD FX-8150 Processor or AMD Phenom(tm) II X6 1090T
Processor with AMD 990FX, AMD Radeon(tm) HD 6970 in CrossFireX(tm) (x2), 8GB
DDR1333, Windows(R) 7 64bit.
Slides 24:
Pricing determined from Pricewatch.com as of 8/25/2011. AMD system
includes: AMD FX-8150 Processor ($245), AMD 990FX ($190), AMD Radeon(tm)
HD 6970
($320), AMD Black Memory Edition ($50). Intel system includes Intel
Core i7-980X ($999), Intel X58 ($220), AMD Radeon(tm) HD 6970 ($320),
DDR3-1600 Kit
Memory ($100). For both systems: SAMSUNG B2430H Monitor ($199), Razer
Deathadder Mouse ($47), MS Keyboard ($20), Thermaltake - TR-800P
Bronze80Plus
800 Powersupply ($109), Cooler Master - Elite Mid Tower Case RC-310
($40), Western Digital - Western Digital Caviar Blue ($66)
Slide 26:
AMD System using AMD FX-8150 Processor with AMD 990FX, AMD Radeon(tm) HD
6870, 8GB DDR1600, Windows(R) 7 64bit. Intel System using Intel Core
i7-980X
with Gigabyte EX58-UD5 motherboard, AMD Radeon(tm) HD 6870, 6GB DDR1600,
Windows(R) 7 64bit.


Vielleicht lässt sich das auch so einordnen. Hmm 2500k gibt es nur einmal, müsste Slide 12 oder 13 sein.


Na super, ausgerechnet für Slide 11 steht keine Konfiguration dabei!
http://1.bp.blogspot.com/-TlcmyqpJlg8/TnzhUmcIzNI/AAAAAAAABIQ/Fmz9l_bRYic/s1600/komplet.png

Das ist ja die PCIe-Geschichte.

S940
2011-09-25, 17:52:57
Wenn ich Cheffe von AMD wäre und würde dies stimmen, würde die komplette PR-Abteilung neu besetzt werden.

Wenn "Hype"-Informationen geleakt werden, dann ist es verständlich. Aber solches Material erzeugt nur negative Stimmung. Und das kann man wohl kaum wollen.
Hmm .. weil jemand nen negativen Hype erzeugen will?

Hab gerade bemerkt, dass DH und OBR die Battlefield 3 Folie zurückhalten. In der Übersicht sieht mans hier:
http://1.bp.blogspot.com/-TlcmyqpJlg8/TnzhUmcIzNI/AAAAAAAABIQ/Fmz9l_bRYic/s1600/komplet.png

Das Spiel ist bekanntermaßen sehr gut mutlicoreoptimiert, und sollte wirklich gut auf BD laufen.

Wieso hält man das zurück, wenn man den Rest leakt? Hält man sich ans Releasedatum des Spiels, oder wie ? :freak:

Skysnake
2011-09-25, 17:55:48
Ja, das ist mir auch schon aufgefallen, dass da Folien zurückgehalten werden, aus welchem Grund auch immer. Das geilste ist ja OBR postet ne Übersicht mit der Folie, nur erkennt man nichts :rolleyes:

Da ist halt auch mal wieder Stimmungsmache dahinter. Und eben weil Donanimhaber die auch nicht postet, aber sonst alle Folien, befürchte ich, dass da OBR dahinter steckt...

dildo4u
2011-09-25, 17:55:50
Hmm .. weil jemand nen negativen Hype erzeugen will?

Hab gerade bemerkt, dass DH und OBR die Battlefield 3 Folie zurückhalten. In der Übersicht sieht mans hier:
http://1.bp.blogspot.com/-TlcmyqpJlg8/TnzhUmcIzNI/AAAAAAAABIQ/Fmz9l_bRYic/s1600/komplet.png

Das Spiel ist bekanntermaßen sehr gut mutlicoreoptimiert, und sollte wirklich gut auf BD laufen.

Wieso hält man das zurück, wenn man den Rest leakt? Hält man sich ans Releasedatum des Spiels, oder wie ? :freak:
Weil da keine Ergebnisse drauf sind sondern man will mit dem Taskmanager die tolle Auslastung zeigen.:uclap:

Ronny145
2011-09-25, 18:00:15
Na super, ausgerechnet für Slide 11 steht keine Konfiguration dabei!
http://1.bp.blogspot.com/-TlcmyqpJlg8/TnzhUmcIzNI/AAAAAAAABIQ/Fmz9l_bRYic/s1600/komplet.png



Die Reihenfolge in der Thumbnail Übersicht kann nicht stimmen. Nummer 24 müsste die 980x Folie mit dem Systempreis sein, das ist definitiv nicht so. In der Thumbnail wäre das Nummer 22.

/AMD hat die Nummerierung angeblich verbockt, also teilweise falsch angegeben. Eyefinity Benchmarks offenbar mit AMD Radeon(tm) HD 6970 (x2) durchgeführt.

S940
2011-09-25, 18:29:41
Da ist halt auch mal wieder Stimmungsmache dahinter. Und eben weil Donanimhaber die auch nicht postet, aber sonst alle Folien, befürchte ich, dass da OBR dahinter steckt...
Jo, kommt mir jetzt auch wieder etwas spanisch vor. Wenn Obr seine Spielchen treibt, ok, aber DH ... komisch.
Obr würde ichs auch durchaus zutrauen alle Folien zu fälschen :freak:
Weil da keine Ergebnisse drauf sind sondern man will mit dem Taskmanager die tolle Auslastung zeigen.:uclap:
Wenns so harmlos wäre, erst recht kein Grund fürs zurückhalten ...

dildo4u
2011-09-25, 18:34:28
Wenns so harmlos wäre, erst recht kein Grund fürs zurückhalten ...
Guck dir die Folie doch an,man erkennt doch das dort kein Diagramm sondern nur Screens mit Taskmanger sind,einfach mit der Dirt 3 Folie vergleichen

S940
2011-09-25, 18:41:15
Guck dir die Folie doch an,man erkennt doch das dort kein Diagramm sondern nur Screens mit Taskmanger sind,einfach mit der Dirt 3 Folie vergleichen
Kann schon stimmen, aber wieso sollte man harmlose Folien zurückhalten? Die ThankYou Folie braucht man sicherlich nicht, die würde ich auch weglassen, aber ne BenchFolie? So unwichtig kann das gar nicht sein.

Knuddelbearli
2011-09-25, 18:51:34
eben weill da bd wohl ziemlich gut abschneidet


OBR halt

Twodee
2011-09-25, 18:52:53
eben weill da bd wohl ziemlich gut abschneidet


OBR halt
seit wann hat der tastmanager eine benchmarkfunktion? :rolleyes:

MR2
2011-09-25, 18:57:18
DonaminHaber wird die Folien wohl von OBR haben, die hat er eben noch nicht rausgerückt:-)

Skysnake
2011-09-25, 19:40:29
Jo, kommt mir jetzt auch wieder etwas spanisch vor. Wenn Obr seine Spielchen treibt, ok, aber DH ... komisch.
Obr würde ichs auch durchaus zutrauen alle Folien zu fälschen :freak:

Wenns so harmlos wäre, erst recht kein Grund fürs zurückhalten ...

/sign absolut /sign. Dem Menschen ist einfach alles zu zutrauen.

mboeller
2011-09-25, 20:50:35
DonaminHaber wird die Folien wohl von OBR haben, die hat er eben noch nicht rausgerückt:-)


....wenn es so wäre, würde ich persönlich alle Folien für einen FAKE halten.

Duplex
2011-09-25, 20:52:01
Hoffentlich sind es Fakes.

http://obrovsky.blogspot.com/

Angeblich soll der FX8150 jetzt günstiger als 245$ werden...

foenfrisur
2011-09-25, 21:10:37
mal ne andere sache.
dachte bisher, die samples, die im umlauf sind (B2?) seien definitiv nicht die finalen. beschnitten, verbuggt oder sonst was.
die finalen hat nur amd z.zt. ?

was auch immer dann an den "folgenden" revisionen verändert worden ist, dürfte ja vermutlich den folien nach zu urteilen keine performanceverbesserung mitbringen, wenn die folien von amd sind.

denn die folien scheinen ja zu bestätigen, was die vorserienexemplare bisher an speed gezeigt haben.

oder kann man das so noch nicht wirklich sagen?

mfg

edit:
mal nebenbei.
netter test mal wieder bei CB:
wieviel CPU braucht eine GPU.

http://www.computerbase.de/artikel/grafikkarten/2011/bericht-gpu-braucht-cpu/3/#abschnitt_auf_geforce_gtx_460

Blediator16
2011-09-25, 21:58:23
mal ne andere sache.
dachte bisher, die samples, die im umlauf sind (B2?) seien definitiv nicht die finalen. beschnitten, verbuggt oder sonst was.
die finalen hat nur amd z.zt. ?

was auch immer dann an den "folgenden" revisionen verändert worden ist, dürfte ja vermutlich den folien nach zu urteilen keine performanceverbesserung mitbringen, wenn die folien von amd sind.

denn die folien scheinen ja zu bestätigen, was die vorserienexemplare bisher an speed gezeigt haben.

oder kann man das so noch nicht wirklich sagen?

mfg

edit:
mal nebenbei.
netter test mal wieder bei CB:
wieviel CPU braucht eine GPU.

http://www.computerbase.de/artikel/grafikkarten/2011/bericht-gpu-braucht-cpu/3/#abschnitt_auf_geforce_gtx_460

Einige Seiten zuvor wurde gemunkelt bzw gesagt, dass der BD in der Rev B2G(scheinbar finalrev) noch etwas verbuggt sein soll und man durch irgendwelche Treiber diese etwas eindämmen könne und in nächsten Revisionen ganz rausbekommt und somit die Leistung steigt.

Bösewicht
2011-09-25, 23:01:46
Einige Seiten zuvor wurde gemunkelt bzw gesagt, dass der BD in der Rev B2G(scheinbar finalrev) noch etwas verbuggt sein soll und man durch irgendwelche Treiber diese etwas eindämmen könne und in nächsten Revisionen ganz rausbekommt und somit die Leistung steigt.
Das leben ist aber kein wunschkonzert!
Verlassen würde ich mich auf solche vermutungen nicht und es könnte auch genau so gut sein das AMD es mit der tackt keule probieren wird.

Skysnake
2011-09-25, 23:07:50
obr verzapft schon wieder etwas. Der quasselt etwas von ages 1100.

S940
2011-09-25, 23:19:19
obr verzapft schon wieder etwas. Der quasselt etwas von ages 1100.
Nix Neues, das hatten wir hier doch schon vor ner Woche bei ASRock und Ronny145 hats heute den Chinesen von Corescn auch gesagt, da Asus auch eins draußen hat und sie das Board haben. Windhund hatte außerdem schon ein paar Release Notes von MSI gepostet:

- Fixed CPU/DRAM voltage over spec +/-3%.
- Fixed AM3+ CPU OC fail.
- Fixed L2 cache incorrect when used AM3+ CPU.
- Fixed HT Frequency to 2600 when used AM3+ CPU.
http://www.planet3dnow.de/vbulletin/showthread.php?p=4497552#post4497552

bezog sich allerdings schon auf ein Agesa 0900 BIOS. Außerdem ist nicht klar, was bei L2 "inkorrekt" war, nur die Anzeige im BIOS, oder der Betrieb?

Skysnake
2011-09-25, 23:43:37
Also hier gibts den kompletten Chancelog:



E7640AMS.B20 ---> E7640AMS.B40

- Update to AMD AGESA Orochi 0.0.9.0 and AMI 4.6.3.7_Agesa_Orochi_015.
- Hidden HT Ratio option item when CPU-NB Ratio change.
- Fixed DDR1866 compatibility.
- Update Fixed Boot Order emodule.
- Update CSM module to 4.6.3.1_CSM.7.65_76.
--> A S4 resume fail happens on UEFI Windows 7 with 4.6.3.1_CSM.7.65_76.
--> Remove override of amilegacy16.bin, for new CSM eModule has update then no need to override it now.
- Update SB module to 4.6.3.7_AMD_SB800_034.
- Update NB module to 4.6.3.5_SR5690_1017.
-->AMD SR5690 project need IOMMU support as default
- Update USB mdoule 4.6.3_USB_08.10.14.
- Modify for IOMMU APIC ID.
- BD/DVD Can not be played fluently after resuming from S3 on Angelica(v2.10BIOS) with IDT Audio.
- modify PCIDEVICE "NB Root PCI Bridge (D24, F0)" : PCIBusSize = 64bit to PCIBusSize = PciEx, ref EIP:59759
- Add MSI GSEII function.
- Enhance mouse functiion in setup menu.
- Update to AMD AGESA Orochi 0.0.9.1 and AMI 4.6.3.7_Agesa_Orochi_016.
- Fixed reset under dos hung 19 sometimes.
- When overclocking CPU ratio using AMD 555BE with MS-7640 V30, it only works with Core-1 and Core-2 can only run with default CPU ratio. They also try to unlock the 555BE to 4-Core, and the Core-2,3,4 are not able to overclock either.
- F10 Save Exit Hang FFh
- Change PCB version to 2.2 to fix control center can't open.
- Fix RAZER USB Mouse issue.
- Enhance KB numlock LED function.
- Fixed plug many USB device hung 0d issue.
- Add ukey function support USB3.0 device.
- Fix cpu or memory change show when core leveling mode change.
- Clear password when clear cmos.
- Add three mode support.
- Adjust some string follow BIOS spec.
- Fixed CPU/DRAM voltage over spec +/-3%.
- Fix system hang on 50h issue when used AM3+ CPU and installed only one memory at DIMM1 or DIMM3.
- Fixed under AHCI mode HDD string not fit spec.
- Hidden "High-Speed USB Link" item.
- Fixed has unknow PCI device under XP or VISTA.
- Fix plug PCI/PCIE lan card can't boot issue when the "Lan Option ROM" item set disabled.
- Remove "Core Leveling Mode" item.
- Fixed OC Genie enable DRAM,NB,CPU,CPU-NB voltage not fit the request.
- Change audio table for front panel.
- Fix memory-z part string issue for some memory.
- Patch CPU temperature too high in setup menu.
- Fixed plug PCI/PCIE lan card can't boot issue when the "onboard Lan controller" item set disabled.
- Fixed AM3+ CPU OC fail.
- Patch some oc memory which test fail.
- Hidden OC GENIE II item.
- Add patch for adjust memory frequency fail hung 19.
- Add the solution for CPU Fan Speed Control.
- Change the solution of remove "Core Leveling Mode" item to fix hung post.
- Fixed L2 cache incorrect when used AM3+ CPU.
- Fixed HT Frequency to 2600 when used AM3+ CPU.

... und von hier aus geht es dann weiter mit: E7640AMS.B51, E7640AMS.B52 und aktuell E7640AMS.B53:

E7640AMS.B40 ---> E7640AMS.B53

- Fixed miss "Adjust PCI-E Frequency" item.
- Fixed use SCEWIN tool "Adjust CPU FSB Frequency" and "Adjust PCI-E Frequency (MHz)" no function.
- Update ukey function support USB3.0 device.
- Adjust memory voltage range to 1.2V.
- Fixed default DRAM voltage incorrect issue when used low voltage memory.
- Modify the OC memory patch code DRAM voltage setting.
- Update to AMD AGESA Orochi 1.1.0.0 and AMI 4.6.3.7_Agesa_Orochi_019.
- Update raid option rom to 3.3.1540.14.
- Change CPU fan speed to auto line mode.

Quelle: http://msi-forum.de/index.php?page=Thread&threadID=99597&pageNo=2

Die ganzen dick markierten Sachen verstehe ich nicht ganz, bzw. sind halt meiner Meinung nach die wichtigen Sachen.

Aber was will OBR uns mit seinem seltsamen Post sagen? Ich versteh das wirklich nicht.

Ronny145
2011-09-26, 00:03:19
Er will bestimmt seiner Freude Ausdruck verleihen weil sein Board ein Agesa 1.x Bios erhielt.


Finde es löblich von MSI ihre Changelogs ausgiebig zu halten. Bei den anderen Herstellern sind die changelogs lange nicht so auskunftsfreudig.

Beim Crosshair V mit Agesa 1100 gibt es von Asus nur dieses.

Changed LLC rule-> Regular on BD if @ Auto, Ultra High if user keys in voltage
Fixed overclocking Fail, save exit, hang issue


Hat auch mit Thuban 2 neue Einstellungen erhalten.


Tried both with a 1100T, both have some new options:
- HTPET enable/disable option
- new menu under the memory timmings tab for auto setting the memory timmings
http://www.asusrog.com/forums/showthread.php?4380-Crosshait-V-Formula-Bulldozer-UEFI-0081

Skysnake
2011-09-26, 01:51:50
Btw. hier noch was aus dem ZOL.com.cn Forum. Keine Ahnung, was man davon halten soll. Leider kann ich mich da nicht registrieren, weil ich keine Mail bekomme -.- Naja und die meisten Inhalte sieht man ja nur, wenn man sich registriert....

Server Edition G34 16-Core-Opteron 6200 zum Verkauf im Ausland (http://translate.googleusercontent.com/translate_c?hl=de&ie=UTF8&prev=_t&rurl=translate.google.de&sl=zh-CN&tl=de&u=http://diybbs.zol.com.cn/11/11_100627.html&usg=ALkJrhhP8kZllAA4ySXyF3TqzhPM5EVL7Q)
Wenn Probleme wie Probleme

AMD Opteron 6276 2,3 GHz OS6276WKTGGGU - 16 Kern-
Unser Preis: $ 1.075,00 (935,25 €)


SKU OS6276WKTGGGU
Gewicht £ 0,20
Module Descripqion 16-Core-
Buchse Sockel G34
CPU Modellnummer 6276
CPU OEM-Teilenummer OS6276WKTGGGU
Frequenz 2300MHz
Paket 1944-Land organischen LGA
[B]Core-Stepping D1
Level 1 Cache 16 x 64 KB Befehls-Caches 16 x 64 KB Daten-Cache
Level 2 Cache 16 x 512 KB

Produkt descripqion
AMD Opteron 6276 2,3 GHz OS6276WKTGGGU 16-Core Server CPU

Seien Sie der Erste, der AMDs nächste Generation 16-Core-Serie 6200-Prozessoren besitzen.
Auf Lager, kann versandfertig.


Das wichtige hab ich mal fett markiert ;)

D1 Stepping :ugly: Zählen die beim Interlagos anders als bei Zambezi???? Wenn nein, dann wissen wir ja jetzt, was AMD die ganze Zeit gemacht hat, seit dem B2 Stepping. Damit kann man aber nen feuchten Furz auf das geben, was OBR da verzapft und wie Sie alle heißen.

Was meint ihr dazu?

Btw. hier noch zwei Benchmarks zu Server BDs. Kann damit aber nicht wirklich etwas anfangen, vielleicht sagt einem von das etwas.

http://translate.googleusercontent.com/translate_c?hl=de&rurl=translate.google.de&sl=it&tl=de&u=http://browse.geekbench.ca/geekbench2/view/484217&usg=ALkJrhiucPBjUQejRnWDKVz--DgEMbT-kQ

http://translate.googleusercontent.com/translate_c?hl=de&rurl=translate.google.de&sl=it&tl=de&u=http://browse.geekbench.ca/geekbench2/view/483705&usg=ALkJrhiZfT6pUE3QXox-cjLPAPibQr0TSA

Das Einzige was mir aufgefallen ist, ist das man im Vergleich zu Opteron Systemen der Vorgängergeneration fast das doppelte an Bandbreite beim RAM hat. Weiß aber nicht, ob das jetzt repräsentativ ist. Schauts euch mal an ;)

S940
2011-09-26, 02:03:39
@Skysnake:
Das hatten wir schon mal vor ca. 4 Wochen, schau genau hin, insbesondere auf die Cachegrößen, das ist nur copy/paste von nem Magny Cours/ Opteron 6100.
Ansonsten wird natürlich gleich gezählt, solange es das gleiche DIE ist ;-) Und bisher gibts da nur Orochi.

Skysnake
2011-09-26, 02:29:22
Gut, das hatte mich nämlich auch etwas gestört mit der Cache-Größe, aber man weiß ja nie, was die an beschnittenen Versionen raus hauen.

Das das vor 4 Wochen schon mal gepostet wurde, hab ich leider nicht mitbekommen, wobei es ja eher nur 3 sein können ;P

-.- Need endlich echte verlässliche Benches.....