AMD - AMDs Bulldozer - neue CPU-Architektur für Q2 2011 [Archiv] - Seite 14

robbitop

2011-07-09, 13:06:14

Ne mit abschätzen wird das nichts. Entweder exakte Werte oder gar nicht. Dann müsste mindestens eine Vergleichs CPU mit der gleichen GPU und dem gleichen Treiber mit im Test sein. Und dann kommt im schlimmsten Fall sowas raus wie im OBR Test, ein kaum aussagekräftiger Test. Theoretisch ist es nicht schwer, viele Seiten beweisen nur leider immer wieder das Gegenteil.
Du hast mich falsch verstanden. Das abschätzen bezieht sich nicht auf den Vergleich - sondern wenn ich als Privatperson wissen möchte, wie sich der BD in etwa in einem Game verhält, kann ich das in einer gewissen Größenordnung tun.

Exakte Werte als Referenz kommen ja dann bereits aus den 3-4x Messwerten. Damit sollte man die Performance gut genug beurteilen können, wenn die Spiele gut ausgesucht sind.

Natürlich sind mehr Daten immer besser. Aber bisher wissen wir mangels solcher Tests nichts über die Spieleperformance von dem Ding. Wir wissen immernoch nicht, wie gut das neue Frontend ist.

Na so trivial ist das nicht.

Man braucht wie du schon sagtest hat die gleichen Einstellungen, das gleiche System, das gleich "zugemüllte" System, aber mit sauberen Treibern. Sprich am Besten zwei komplett identisch frisch aufgesetzten OSs.

Ja und? Wo ist das Problem?

Und dann gibt es noch immer das Problem, dass man praktisch ein Skript braucht, denn einfach so nen Game anwerfen ist auch nicht, da man ansonsten immer irgendwelche Variationen drin hat.

Das kriegt man je nach Spiel und Situation sehr gut ohne Script hin. Es gibt Savegames, wo man keinen Einfluss nehmen muss, weil ohne einen die Action für eine gewisse Zeit abläuft. Stopp-Uhr und FRAP. Das macht man für 3 Durchläufe und lässt sich in Excel die Verläufe grafisch darstellen. Die Durchläufe müssen ziemlich gleich aussehen, dann sind die Werte ok. Ich habe das ziemlich reproduzierbar hinbekommen.
Und genau das macht man mit beiden Systemen.

Naja, und dann ganz zum Schluss hat man noch das Problem, dass man die Werte nicht eindeutig reproduzieren kann, sprich die Aussagekraft ist halt immer deutlich geringer.
Siehe oben, ich habe das immer hinbekommen. Man muss halt das Hirn anlassen und muss Werte hinterfragen und doppelchecken.

Fetter Fettsack

2011-07-09, 15:09:05

@ Skysnake

Nunja, deswegen macht man ja auch mehrere Durchläufe. So völlig unbrauchbar sind Spieletests auch wieder nicht.

Skysnake

2011-07-09, 15:32:31

Sag ich ja nicht. Sie sind aber halt nicht reproduzierbar, und ohne breite Vergleichsmöglichkeit daher fürn Poppes.

y33H@

2011-07-09, 15:33:57

Natürlich sind Spiele-Benchmarks reproduzierbar. Man muss halt sehr penibel arbeiten und ein passendes Savegame nutzen - da ist halt die Kunst, die lange nicht jeder beherrscht.

robbitop

2011-07-09, 15:52:08

Und man muss natürlich auch beide Kontrahenten da haben und gleich benchen. Aber das sollte das geringste Problem sein, wenn man schon als einer der wenigen so ein Teil hat. (ich wette für anständige Untersuchungen würden genügend Forenuser bereit sein, dem Typen einen SB zu leihen...)

Skysnake

2011-07-09, 15:57:52

seaFs

2011-07-09, 16:07:23

Es geht aber vor allem darum, dass auch ANDERE diese Benches reproduzieren können, und das ist bei Spielebenches eben nur sehr schwer möglich, da die genaue Auswahl der Szene etc. eben schwer ist.

Das ist wirklich sehr schwer für einen User, dann Vergleiche zum eigenen System her zu stellen.

Zwar total OT, aber trotzdem: Savegames kann man auch verschicken. Siehe Gothic2 Khorinis Stadtbenchmark. Die 2 Savegames sind für jedermann zugänglich, Benchmarkdetails sind dazugeschrieben. Somit ist es wohl doch reproduzierbar.

y33H@

2011-07-09, 16:08:11

PCGH etwa hat ein FAQ (http://www.pcgameshardware.de/aid,744422/FAQ-So-bencht-PCGH-Spiele-How-to-Benches-inside-Update-mit-Call-of-Duty-Black-Ops-Crysis-2-und-Dragon-Age-2/Spiele/Test/) samt Anleitung, Video und Spielständen - die werden zB von einigen Usern auch für Foren-Reviews genutzt.

Skysnake

2011-07-09, 17:34:52

Ich sag ja auch nicht, dass es nicht geht, es ist nur mit deutlich mehr Aufwand verbunden, und man kann sehr schnell Fehler machen.

Ich für meinen Teil bin mit den "Syntethischen" Benchmarks zufrieden. Bei Games limitiert eh zu 90% der Zeit die GPU :ugly:

mrt

2011-07-09, 18:52:44

Synthetische Benchmarks haben aber eher weniger bis gar keine Aussagekraft. Wenn ein Prozessor für Spiele gesucht ist, dann sollte man sich auch Spielebenchmarks ansehen und keine Cinebench- oder SuperPi-Werte.

Ronny145

2011-07-09, 19:05:29

Fritzchess basiert auf dem Schachprogramm und Cinebench auf Cinema 4D. Synthetisch sieht für mich anders aus.

Skysnake

2011-07-09, 19:07:09

Naja, es gibt diese und jene synthetischen Benchmarks.

Linpack ist z.B. auch einer, passt aber doch für eine ganze Reihe an Problemen.

Man muss sich halt nicht auf nur einen versteifen, sondern auf eine Vielzahl.

Es gibt ja welche, die lasten eher die FPU aus, dann welche die Integerkerne, dann profitieren welche von schnellen/großen Caches, oder vielen Kernen, andere nur von ner hohen IPC und wieder andere testen halt I/O.

Also ich seh da kaum ein Problem drin. Man muss halt nur wissen, wie man die Benches genau deuten muss, und worauf Sie abziehlen.

Knuddelbearli

2011-07-09, 20:26:07

wenn man jetzt noch wüsste welches programm eher auf fpu welche auf Int kerne und welche auf L3 usw hängen könnte man sogar was da raus lesen

OgrEGT

2011-07-10, 09:56:30

Was kann man den bezüglich der Skalierung der Geschwindigkeit mit dem Speichertakt sagen? So in etwas DDR3/1866 bringt Performance X und DDR3/1333 x - y% ? :)

Wenn die Performance vernachlässigbar ist eine nicht so unwichtige Information, da ich überlege, meinen schon gekauften 4GB Speicher OVP wieder zu verhöckern :D und fürs gleiche Geld 8GB zu holen (sind 1333er anstatt der 4GB 1600er).

Ich vermute, dass die Frequenz der Speichermodule (die am gleichen Speichercontroller betrieben werden) eine eher untergeordnete Rolle spielen wird. Bisher wars auch immer so, dass sich der Leistungsunterschied im einstellig prozentualen Bereich bewegt hat.

Mehr (oder weniger) wird eher der Unterschied im Vergleich der Speichercontroller-Generationen ins Gewicht fallen.

Edit: Hier ein Auszug aus dem SB-Review von ht4u bzgl. Speichertakt (DDR3 1333 vs DDR3 2133):

Die Ergebnisse zeigen dabei sehr deutlich, dass kaum eine Applikation von der gesteigerten Speicherbandbreite profitiert. Lediglich zwei der drei Packer (Anm OGrEGT: 7-Zip und Winrar) reagieren positiv auf die zusätzliche Speicherbandbreite. Somit kann man für Anwender, die alltägliche Aufgaben mit ihrem Rechner absolvieren, Entwarnung geben. DDR3-1333 reicht nach wie vor aus. Wer jedoch im High-Performance-Computing-Umfeld arbeitet, könnte durchaus mit dem schnelleren Speicher besser bedient sein.
http://ht4u.net/reviews/2011/intel_sandy_bridge_sockel_1155_quadcore/index37.php

The_Outlaw

2011-07-10, 10:41:13

OgrEGT

2011-07-10, 11:32:42

Kann jemand den neuesen Blogeintrag besser übersetzen als es Google kann?

http://obrovsky.blogspot.com/

Er nimmt Stellung zu den Werten von Donanimhaber (ich les immer Domaininhaber), die den neuen AMD FX doch sehr positiv darstehen lassen und schließt aus den hohen Stromverbrauchswerten des Liano auf Probleme im 32nm Prozess, so wie es einige hier auch tun.

(Ambesten man übersetzt ins Englische. Funktioniert meist besser)

Kurz gesagt, hält er nicht viel vom Test und meint immer noch dass der BD dem i7-2600 nicht das Wasser reichen kann (Zit.: PS. Even if the numbers were right BTA, so they Bulldozer long not slaughter Core i7-2600 km, perhaps only in two tests of several ... elsewhere on the contrary quite lost).

Weiter unten kommt dann die "detaillierte" Analyse des Donanimhaber Tests:

Er meint, dass alles gefaked ist und wir uns alle im September darüber totlachen werden...
(Zit.: Everything is otherwise tricked and Stach is an interesting quirk. Hehe, that he breaks his neck and we'll laugh even in September.)

Bzgl der Aussagen zum Fertigungsprozess meint er zu wissen, dass der 32-nm Prozess eine Tragödie ist, sehr schlechte yields (Llano ein paar wenige %) auch benötigt BD sehr hohe Vcore und hat immensen (brutalen) Verbrauch.
(Zit.: Absolute lies, 32nm production at AMD's absolute tragedy. The yield is only a few percent for Llano, much less for BD. Tension is very high, consumption is brutal.)

Zum Fazit, dass BD leistungstärker sei als SB meint er wir werden uns alle wundern.
(Zit.: hehe, it will be disappointing to come out true.)

Meine Meinung dazu:
OBR hört sich sehr negativ an, fast sogar ein wenig arrogant, als ob nur er die Wahrheit kenne. Sein anmaßender und beleidigender (schadenfroher) Stil, in dem er das zum Ausdruck bringt, macht ihn für mich eher unglaubwürdig. Eine Sachliche Auseinandersetzung sieht anders aus, zumal er keine Fakten bringt um die Aussagen von Donanimhaber zu widerlegen.

M4xw0lf

2011-07-10, 11:38:52

(Ambesten man übersetzt ins Englische. Funktioniert meist besser)

Kurz gesagt, hält er nicht viel vom Test und meint immer noch dass der BD dem i7-2600 nicht das Wasser reichen kann (Zit.: PS. Even if the numbers were right BTA, so they Bulldozer long not slaughter Core i7-2600 km, perhaps only in two tests of several ... elsewhere on the contrary quite lost).

Weiter unten kommt dann die "detaillierte" Analyse des Donanimhaber Tests:

Er meint, dass alles gefaked ist und wir uns alle im September darüber totlachen werden...
(Zit.: Everything is otherwise tricked and Stach is an interesting quirk. Hehe, that he breaks his neck and we'll laugh even in September.)

Bzgl der Aussagen zum Fertigungsprozess meint er zu wissen, dass der 32-nm Prozess eine Tragödie ist, sehr schlechte yields (Llano ein paar wenige %) auch benötigt BD sehr hohe Vcore und hat immensen (brutalen) Verbrauch.
(Zit.: Absolute lies, 32nm production at AMD's absolute tragedy. The yield is only a few percent for Llano, much less for BD. Tension is very high, consumption is brutal.)

Zum Fazit, dass BD leistungstärker sei als SB meint er wir werden uns alle wundern.
(Zit.: hehe, it will be disappointing to come out true.)

Meine Meinung dazu:
OBR hört sich sehr negativ an, fast sogar ein wenig arrogant, als ob nur er die Wahrheit kenne. Sein anmaßender und beleidigender (schadenfroher) Stil, in dem er das zum Ausdruck bringt, macht ihn für mich eher unglaubwürdig. Eine Sachliche Auseinandersetzung sieht anders aus, zumal er keine Fakten bringt um die Aussagen von Donanimhaber zu widerlegen.

Ich hab auch das Gefühl, dass es ihm ein wenig zu viel Spaß macht, Schlechtes über BD zu verbreiten, als dass man das ganze so für bare Münze nehmen sollte.

Ronny145

2011-07-10, 11:46:20

Ich lese das ein bisschen anders raus. Die performance kritisiert er nicht.

However, always keep in mind that this is not a final product and especially the support of the motherboard is not quite 100% but it is early tunes. Even so, however, are the results of this processor at 3.2 GHz only, very solid.

Surely you remember how I told you several months ago, said that the performance of the new AMD processors do not have to worry about and certainly will not be disappointed. I said that in certain areas Bulldozer is indeed a remarkable performance in other areas it is worse

However, the main competition Bulldozer AMD FX-8xxx processors are Core i5/7-2000 the LGA 1155th And in many tests can the new AMD FX-8130P (3.2 GHz), which is directed directly against the Core i7-2600 km (3.4 GHz), to defeat this competitive model!

As I wrote earlier, the performance of the new AMD processors will not be disappointed, of course, if you do not expect a 50% higher power: D.

OgrEGT

2011-07-10, 12:00:32

Ich lese das ein bisschen anders raus. Die performance kritisiert er nicht.

Für mich sah das aus, als wäre nur der fett formatierte Text der Kommentar von OBR zum nicht fett formatierten Text welcher von Donanimhaber stammt.
Mea culpa falls ich OBR Unrecht getan habe :)

Ronny145

2011-07-10, 12:12:50

Für mich sah das aus, als wäre nur der fett formatierte Text der Kommentar von OBR zum nicht fett formatierten Text welcher von Donanimhaber stammt.
Mea culpa falls ich OBR Unrecht getan habe :)

Hmm manche Textstellen sind anscheinend wirklich nur eine grobe Übersetzung der Türken wo er sein Senf dazu gibt. Ist halt schwer verständlich die google Übersetzung. Für mich ist Donanimhaber jedoch glaubwürdiger, was nicht ausschließt, dass deren Sample mit eingeschränkter Leistung lief. OBR hat bislang fast nur Screenshots mit unkenntlich gemachten Ergebnissen gezeigt.

OgrEGT

2011-07-10, 12:14:24

Für mich sah das aus, als wäre nur der fett formatierte Text der Kommentar von OBR zum nicht fett formatierten Text welcher von Donanimhaber stammt.
Mea culpa falls ich OBR Unrecht getan habe :)

Obwohl ich mir nicht mehr so sicher bin, ob OBR den Artikel von Donanimhaber kommentiert, da ich die Aussagen, auf die er sich mMn bezieht im Text von Donanimhaber (http://translate.google.de/translate?hl=de&sl=tr&tl=en&u=http%3A%2F%2Fwww.donanimhaber.com%2Fislemci%2Fhaberleri%2FOn-inceleme-AMDnin-8-cekirdekli-Bulldozer-FX-islemci-ve-test-sonuclari.htm) so nicht wiederfinden kann.

Der Text scheint eher von einem gewissen "Stach" zu stammen, ist aber nicht verlinkt. Vlt. eine blöde Frage, aber wer ist Stach?

OgrEGT

2011-07-10, 12:15:51

Hmm manche Textstellen sind anscheinend wirklich nur eine grobe Übersetzung der Türken wo er sein Senf dazu gibt. Ist halt schwer verständlich die google Übersetzung. Für mich ist Donanimhaber jedoch glaubwürdiger, was nicht ausschließt, dass deren Sample mit eingeschränkter Leistung lief. OBR hat bislang fast nur Screenshots mit unkenntlich gemachten Ergebnissen gezeigt.

Hihi... vielleicht hat OBR auch google-Translate verwendet, und den Artikel von Donaimhaber falsch verstanden ;D

Schnitzl

2011-07-10, 12:36:41

Hihi... vielleicht hat OBR auch google-Translate verwendet, und den Artikel von Donaimhaber falsch verstanden ;D
hahaha das ist gar nicht mal so abwegig, jedenfalls wird man aus dem Text nicht wirklich schlau.

Aber ich denke auch, der fette Text ist ein Kommentar zu den 'normalen' Text.

Der neueste Eintrag ganz oben handelt davon dass in ein paar Tagen neue Ergebnisse/Test präsentiert werden?
Na da bin ich ja mal gespannt :D

redfirediablo

2011-07-10, 13:47:36

donanimhaber hatte doch in letzter Zeit immer die richtigen Folien vor Launch, warum sollte er nicht auch ein richtiges Sample haben?

Glaubwürdigkeit ist meiner Meinung nach somit klar höher einzuschätzen. OBR verbreitet imho nur FUD

Duke Nukem

2011-07-11, 12:11:37

Fuds Kommentar
Bulldozer Outpaces Sandy Bridge in early tests
http://www.fudzilla.com/processors/item/23381-bulldozer-performance-figures-are-in

Undertaker

2011-07-11, 12:29:49

Haben die von 3DCenter abgeschrieben? Der gleiche Fehler bei den x264-Werten wie hier auf der Startseite... ;)

Duke Nukem

2011-07-11, 13:04:49

Mal sehn mit welchem stepping der Bulldozer dann in den Verkauf kommt. Wenn dieser noch nicht richtig funzt.

Duplex

2011-07-11, 14:23:50

Es ist auf jeden fall spannend, hoffentlich wird es kein Bx Stepping.

S940

2011-07-11, 14:49:44

Es ist auf jeden fall spannend, hoffentlich wird es kein Bx Stepping.
Ist mir egal, bis ich BD kaufe, gibts C0 ;-)

john carmack

2011-07-13, 09:05:12

Was ist den mit BD los? Wann kommt der endlich?

S940

2011-07-13, 10:23:09

Was ist den mit BD los? Wann kommt der endlich?
Wenn er fertig ist ;-)
Solltest Du bei dem Nick doch wissen ^^

boxleitnerb

2011-07-13, 10:31:24

Also dann in 14 Jahren? SCNR :biggrin:

Twodee

2011-07-13, 12:29:47

Also dann in 14 Jahren? SCNR :biggrin:
...da kann man gleich noch die paar monate auf Ivy warten :rolleyes:

Duplex

2011-07-13, 13:13:27

...da kann man gleich noch die paar monate auf Ivy warten :rolleyes:
Ach wirklich dann kann man gleich auf Komodo oder Trinity warten :eek:
Kein plan was hier Ivy zu suchen hat :rolleyes:

Ronny145

2011-07-13, 21:05:58

But except the GPU is only 175 mm. About 68 percents smaller then Orochi die ... but performance is not 68 percent under ... you will see. Core i7-2600K is far better a stronger ... all DH results were Fakes ... you will see tomorrow here!
http://obrovsky.blogspot.com/

Hmm...

DeadMeat

2011-07-13, 21:19:47

Ronny145

2011-07-13, 21:24:20

Wie man bei sovielen Problemen mit den Boards und unterschiedlichen Samples da jemanden als Faker hinstellen kann.....interessant wirds sicher trotzdem, so oder so.

Vielleicht hat er die Fakes erstellt und Donanimhaber geschickt? :freak:

Mal sehen was morgen rauskommt.

Skysnake

2011-07-13, 22:32:13

Diesmal gibts sicher sogar das Komma zu sehen vorm Zensur Balken !:ucatch:

Wie man bei sovielen Problemen mit den Boards und unterschiedlichen Samples da jemanden als Faker hinstellen kann.....interessant wirds sicher trotzdem, so oder so.

Ja das frage ich mich auch...

Am interessantesten wird aber sein, was er als Begründung dafür liefert, dass es ein Fake sein soll.

Wenn er damit kommt, dass die Leistung zu gut sei, dann hat er schon mal gefailed, weil ihm auffallen hätte müssen, dass die Cache-Bandbreite bis auf den L2 Read-Wert massiv höher ist als bei seinem Sample, ergro sein Sample kann gar nicht die volle Leistung ausfahren, da die CPU nicht genug Daten geliefert bekommt...:rolleyes:

Triskaine

2011-07-13, 23:20:41

OBR ist etwa so glaubwürdig wie Walter Ulbricht. Eine Woche vor dem Launch hat er noch behauptet die HD 4870 hätte nur 480 SPs, alle anderen wären nur Faker und er der einzige mit einer vertrauenswürdigen Quelle bei AMD. :hammer:

Ronny145

2011-07-13, 23:33:27

Der Text scheint eher von einem gewissen "Stach" zu stammen, ist aber nicht verlinkt. Vlt. eine blöde Frage, aber wer ist Stach?

Habe nochmal nachgeschaut, gemeint sein könnte Jan Stach. Der hat früher für PCTuning.cz Artikel geschrieben. Aber warum wird er in so vielen Artikeln erwähnt? Ein paar Auszüge

I waited for it and become:) Another victim is caught in hilarious test appeared to Donanihaber ... hehehe. Really nice bunch - Stach, Fiala ... Who comes next? - Waiting on CDR and still go out with the truth ... so sup sup guys degrees.

a few days will show you the truth ... and Stacho zmehne

We made a little joke like that Turkama and the only one who has caught them Stach. In a few days will show evidence as to the "trusted" server and a test that was sanctified AMD:):):):) This time it nerozdejchá Stach, hehehe ...

I grab the ball Stach ... :) And really

Did a tour de force, I tricked Stach and made him an absolute idiot. Know very well where are the numbers that published the Turks:)

Everything is otherwise tricked and Stach is an interesting quirk.
Hehe, again Stach did not even know they have the turbo and the CPU at 3.2 GHz running basically never. If you let OBRBNOUT well you did, because he knows Stach again as always shit.

Aus dem Translator Kauderwelsch ist nicht viel zu verstehen.

Ah das kommt dem näher. Jan Stach hatte sich hier zum Donanimhaber Test geäußert: http://www.ddworld.cz/aktuality/procesory-cpu/procesor-amd-bulldozer-fx-8130p-otestovan-prekonava-konkurencni-intel-core-i7-2600k-2.html

Also war doch nur die Fettschrift im OBR Blog von OBR selber. Der hat den Artikel von Jan Stach kommentiert.

mboeller

2011-07-14, 08:05:16

soviel zu OBR:

However, AMD to prevent further spread of misinformation and rubbish, so, of course, happen;), got a fully functional sample magazine into the hands of trusted DonanimHaber. He probably got permission from AMD show some actual numbers, what really competitive against the new processor i7-2600 km, but also a Core i7-990X, can do.

I said that in certain areas Bulldozer is indeed a remarkable performance in other areas it is worse, but overall has it that one of the top models sought for the position of most powerful processor on the market, even against the Core i7-9xx processors, although only just because it has the advantage three channel memory controller.

Übersetzung des Stach-Artikels in English:

http://translate.google.de/translate?hl=de&ie=UTF8&prev=_t&sl=cs&tl=en&u=http://www.ddworld.cz/aktuality/procesory-cpu/procesor-amd-bulldozer-fx-8130p-otestovan-prekonava-konkurencni-intel-core-i7-2600k-2.html

AnarchX

2011-07-14, 12:27:22

http://img.donanimhaber.com//images/haber/27697/amdbulldozersaathizi_dh_fx57.jpg

http://www.donanimhaber.com/islemci/haberleri/AMDnin-Bulldozer-FX-islemcileri-detaylandi-Saat-hizlari-ve-diger-bilgiler.htm

V2.0

2011-07-14, 12:31:09

Der FX-8100 sieht lecker aus.

Soul

2011-07-14, 12:39:44

Ich finde den FX-8120 @95W lecker. :biggrin:

Ronny145

2011-07-14, 12:48:18

Verglichen mit der letzten Roadmap (http://www.abload.de/img/bulldozerrnn5.jpg) hat sich an den Modellnamen nichts geändert. Die wichtige Info ist die Taktrate.

FX-8130P= 3,2 Ghz Basis/Turbo 3,6 Ghz bis 4,2 Ghz maximal
FX-8150= 3,6 Ghz Basis/Turbo 4,2 Ghz

Der 3,6 Ghz Turbo ist offenbar zum Basistakt geworden, der maximale Turbo unverändert.

mironicus

2011-07-14, 12:51:32

Wie hoch ist wohl der Anschaffungswiderstand? Wenn der i5 der Konkurrent ist, dürfte es wohl schon so ab 120 Euro losgehen, oder...?

Sieht aber schon lecker aus, vor allem das es auch normale 95 Watt-Versionen geben wird. Für meine H264-Enkodierungsarbeiten kommt mir so Teil demnächst ins Haus. :)

Ronny145

2011-07-14, 13:09:19

Kann jemand Türkisch?

Haziran ayında başında Bulldozer FX işlemcilerinin 60-90 gün içerisinde çıkacağını açıklayan AMD şimdi süreyiz biraz uzatıyor ve lansmanın Ekim ayında olacağını belirtiyor.

Google:

FX processors will come in 60-90 days beginning in June, the Bulldozer, AMD announced the launch in October and will now extend the continuum says little.

Was ist mit Oktober gemeint? Ob sich der launch in den Oktober hinein verschoben hat?

y33H@

2011-07-14, 13:13:47

Sagte OBR auch schon. Vll Paperlaunch im September und verfügbar einen Monate später - siehe Brazos und Lynx.

Ronny145

2011-07-14, 13:17:56

Sagte OBR auch schon. Vll Paperlaunch im September und verfügbar einen Monate später - siehe Brazos und Lynx.

In der Übersetzung steht aber launch. Ich glaube nicht, dass AMD auf einer Folie einen paper launch voraussagt. Da steht normalerweise nur das launch Datum.

y33H@

2011-07-14, 13:24:58

Bisher sprach AMD von "announcement".

Ronny145

2011-07-14, 13:27:34

Bisher sprach AMD von "announcement".

Aber nicht in internen Folien, die Donanimhaber bekommen haben könnte.

Beispiel: http://www.abload.de/img/septembercnne.png

AMD is now slightly extend the continuum and will launch in October, said.

Würde ich als weitere Verschiebung intepretieren. Im ersten Teil wird von den 60-90 Tagen gesprochen.

y33H@

2011-07-14, 13:34:39

Wenn du diese meinst, dann hast du freilich Recht.

V2.0

2011-07-14, 13:41:09

Von Ende Juni ausgehend 60-90 Tage also im September.

Ronny145

2011-07-14, 13:56:28

Von Ende Juni ausgehend 60-90 Tage also im September.

Das ist klar. So hieß es Anfang Juni seitens AMD.

Noch zwei andere Übersetzungsmöglichkeiten:

AMD is now slightly extend the continuum and will launch in October, said.

AMD vor kurzem einen zeitraum etwas Verlängerung und starten Oktober in wird sagt.

y33H@

2011-07-14, 13:57:36

01. Juni + 60T ist bei mir der 31. Juli, + 90T der 31. August :biggrin: Hab ich mich verzählt?

Screemer

2011-07-14, 14:02:04

ja ;)

M.(to_the)K.

2011-07-14, 14:07:06

http://www.hardwareluxx.de/index.php/news/hardware/prozessoren/19219-taktraten-und-weitere-details-zu-amds-bulldozer-prozessoren-aufgetaucht.html

wird zum Start vllt. doch ein paar Modelle mehr geben.

http://s.taobao.com/search?q=amd+fx-8130p&from=rs&navlog=rs-1-q-amd+fx-8130pKlick

und hier gibts mal erste preise

Screemer

2011-07-14, 14:20:03

die preise sind neu. das vom luxx gibts ne seite weiter vorne.

2000 Yuan sind ca. 220€. liegt also etwas unter einem i5-2600k, welche bei 2200 Yuan liegt.

€dit: also doch nicht neu. siehe unten. mit den bezeichnungen aus den letzten folien ist nichts zu finden

Ronny145

2011-07-14, 14:22:42

http://s.taobao.com/search?q=amd+fx-8130p&from=rs&navlog=rs-1-q-amd+fx-8130pKlick

und hier gibts mal erste preise

Die Preise kann man vergessen. Das ist die gleiche Seite, die seit Mai den FX-8130P gelistet hat, also seit Monaten schon. Außerdem wird es dieses Modell nicht geben und deren Produkbeschreibung passt nicht zusammen.

V2.0

2011-07-14, 14:24:39

01. Juni + 60T ist bei mir der 31. Juli, + 90T der 31. August :biggrin: Hab ich mich verzählt?

Ende Juni ist nicht der 1. :D

Ronny145

2011-07-14, 14:28:20

Ende Juni ist nicht der 1. :D

Du musst vom 1. Juni rechnen. Die 60-90 Tage Angabe wurde an dem Datum veröffentlicht.

V2.0

2011-07-14, 17:09:56

Da haben sie nur gesagt, dass sich der für Juni geplante Launch um 60-90 Tage verschiebt, nicht dass er am1. geplant war. ;)

Ronny145

2011-07-14, 17:25:51

Da haben sie nur gesagt, dass sich der für Juni geplante Launch um 60-90 Tage verschiebt, nicht dass er am1. geplant war. ;)

Das stimmt nicht. Am besten schaust Du dir die Folie an. Dort steht drauf 60-90 Days from Today, dem 1. Juni.

y33H@

2011-07-14, 18:08:19

Einmal Folie, das Datum steht unten:

http://www.abload.de/thumb/2011-07-14_180733vvxi.png (http://www.abload.de/image.php?img=2011-07-14_180733vvxi.png)

Screemer

2011-07-14, 18:14:38

kommen die dinger jetzt wirklich in den kaffesdosen? :cool:

Brillus

2011-07-14, 18:34:52

kommen die dinger jetzt wirklich in den kaffesdosen? :cool:
Hätte doch Style,(wenn die Wirklich aus blech sind)

Ronny145

2011-07-14, 19:30:53

http://obrovsky.blogspot.com/2011/07/you-were-punkd.html

So wie vermutet behauptet OBR nun, er hätte die Fakes selber erstellt und Donanimhaber geschickt. Ich fasse mal zusammen was er noch schreibt (so weit ich die google Übersetzung verstehe)

- IPC enttäuschend (schlechter als Phenom II) und Leistung insgesamt eine Tragödie
- Yield ist tragisch, schlechter als erste Fermi Chips
- Leistung ist so wie Sandy Bridge ohne SMT, besonders Singlethread tragisch
- i7-2600 10% schneller als FX-8150
- FX-8150 als Gegner von i5-2500k
- sehr schlechte Effizienz
- Verbrauch so hoch wie i7-990X unter Last
- Launch Datum Oktober
- sehr niedrige Preise

robbitop

2011-07-14, 20:01:31

IPC enttäuschend (schlechter als Phenom II) und Leistung insgesamt eine Tragödie

Bei seinem Sample auch nicht verwunderlich - wenn der L2 einen ordentlichen Fehler hatte ... was war dann noch defekt.
Wenn die IPC niedriger als beim Phenom 2 ist, scheint er kein vollständig funktionsfähiges Sample zu haben, da John Frühe eine eindeutig höhere IPC bereits mehrfach bestätigt hat.

- Yield ist tragisch, schlechter als erste Fermi Chips
Unwahrscheinlich, dass er Yields aus der Fab 1 kennt.

- Leistung ist so wie Sandy Bridge ohne SMT, besonders Singlethread tragisch
- i7-2600 10% schneller als FX-8150
- FX-8150 als Gegner von i5-2500k

Was denn nun OBR - schneller oder langsamer als Ph2? :-D
Gleich schnell wie i5 wäre ja schneller als Ph2.

IMO nicht so das Wahre. Wenn er ein Sample hat, funktioniert es wohl nicht, wie es soll. Oder er macht sich nur wichtig, oder ihm wurden Fehlinfos gesteckt. Oder er hat keinen Kopf zum Denken, um diesen Prozessor korrekt zu benchen und sogar Bottlenecks und ggf. durch Fehlfunktionen entstehende Bottlenecks zu finden.

Ergo: Nicht die beste Quelle...

y33H@

2011-07-14, 20:05:08

Gleich schnell wie i5 wäre ja schneller als Ph2.Ich zitiere ja nur ungerne Stückchen, aber ein X6 1100T liegt vor einem i5-2500(K). Mit Multithreading versteht sich. Damit wäre das neue Flaggschiff so schnell wie das alte Flaggschiff - was kurios klingt. Gut, der Phenom I X4 sah auch nur bei Multithreading Land gegen den X2 6400+, aber heute ist die Parallelisierung deutlich weiter bzw. Standard.

Ronny145

2011-07-14, 20:07:43

Was denn nun OBR - schneller oder langsamer als Ph2? :-D

Das ist leicht zu beantworten. Das eine handelt von der IPC und das andere von der Leistung insgesamt. Übrigens nehme ich das auch nicht ernst alles, vielleicht stimmt manches, aber sicherlich nicht alles von dem. Was viel wichtiger jedoch ist, seine Behauptung die Benchmarks von Donanimhaber wären von ihm erstellt wurden. Wenn das so ist kann man den ganzen Test von Donanimhaber vergessen.

Ich habe bei den Türken mal nachgefragt wegen der Übersetzung des einen Satzes.

It means "AMD said that Bulldozer FX processor will be launch within 2-3 months in June; but now, AMD is saying that the processors' launch will be in October."

Ich zitiere ja nur ungerne Stückchen, aber ein X6 1100T liegt vor einem i5-2500(K). Mit Multithreading versteht sich. Damit wäre das neue Flaggschiff so schnell wie das alte Flaggschiff - was kurios klingt. Gut, der Phenom I X4 sah auch nur bei Multithreading Land gegen den X2 6400+, aber heute ist die Parallelisierung deutlich weiter bzw. Standard.

Das stimmt, das wäre echt nur auf Höhe des Thubans. So schlecht kann Bulldozer gar nicht werden, das wäre sehr unrealistisch. Oder sein Testparcour besteht hauptsächlich aus SuperPi und ähnlichem.

y33H@

2011-07-14, 20:11:04

Hast du per Mail angefragt und diesen Satz als Antwort erhalten?

Ronny145

2011-07-14, 20:12:36

Hast du per Mail angefragt und diesen Satz als Antwort erhalten?

Ja ich hatte nach einer Übersetzung gefragt. Das ist die Antwort von denen.

y33H@

2011-07-14, 20:13:22

Hast du auch gefragt, ob die Benchmarks von ihnen angefertigt wurden? :biggrin:

Ronny145

2011-07-14, 20:14:25

Hast du auch gefragt, ob die Benchmarks von ihnen angefertigt wurden? :biggrin:

Nein, der Blog Eintrag kam erst später. :freak: Aber ich kann es mal versuchen.

DeadMeat

2011-07-14, 20:16:27

OF Course, all results was FAKEs, i know it, ive faked them :) No real numbers before NDA :)

Hatte er nicht vor einiger Zeit großartig erzählt wie er nicht unter NDA liegt?

Advice for this day: DONT trust everything on internet! You all were PUNKD! Maybe this whole text is next hoax, maybe not ... :) But you will see ... who is right in October.

So oder so man sollte den OBR Blog als Wertlose Klickfang Geschichte abtun

V2.0

2011-07-14, 20:19:04

Naja, die Theorie dass 6 volle Kerne 8 BD Einheiten entsprechen könnten halte ich für nicht unwahrscheinlich.

Botcruscher

2011-07-14, 20:20:07

Sandkastenkinder spielen nichts genaueres weiß man nicht und ihr seid alle doof.
Die sollen die Schnabel halten und brauchbare Werte posten.
Naja, die Theorie dass 6 volle Kerne 8 BD Einheiten entsprechen könnten halte ich für nicht unwahrscheinlich.
Selbst dann muss die zusätzliche Chipgröße irgendwo hin geflossen sein.

robbitop

2011-07-14, 20:53:12

Ich zitiere ja nur ungerne Stückchen, aber ein X6 1100T liegt vor einem i5-2500(K). Mit Multithreading versteht sich. Damit wäre das neue Flaggschiff so schnell wie das alte Flaggschiff - was kurios klingt. Gut, der Phenom I X4 sah auch nur bei Multithreading Land gegen den X2 6400+, aber heute ist die Parallelisierung deutlich weiter bzw. Standard.
Jaaa....aber fast kein RL Bench ist so multithreaded, dass es im Gesamtklassment für einen Sieg reichen würde.

Nur beim Encodieren und beim Rendern...und in dämlichen Synthies...

y33H@

2011-07-14, 21:07:38

Klar, je weniger Multithreading, desto weiter fällt der X6 zurück - besonders fies wird's bei Singlthread samt Turbo.

Skysnake

2011-07-14, 21:15:21

Ganz im Ernst?

OBR ist ein ganz schön dummes kleines Kind vom Verhalten her. Ansonsten ein geldgeiles Stück....

Sorry aber wie assozial kann man denn bitte sein, nur um klicks zu generieren, und sich über andere lustig zu machen... Total lächerlich der Typ

darkcrawler

2011-07-14, 21:31:22

jopp, wasn dummkopp ;(

Ronny145

2011-07-14, 22:25:01

Hast du auch gefragt, ob die Benchmarks von ihnen angefertigt wurden? :biggrin:

Noch keine Antwort bekommen. Jedoch gab es ein Update im Test. Schwer verständlich der google Kauderwelsch wie immer.

OBR abroad - Obrovsky-named person / publication Bulldozer processor is an example of an engineering sample, closely followed by those who already have sites abroad. If your contact with him I already had one. Bulldozer in the hands of an instance when we started to talk about, I asked the editor could provide us with the processor as a reflex. Of the response of the CPU in order to achieve a significant payment, but I was wondering the details and I want to provide to me was that the test results.

After several discussions Obrovsky, recently shared with me some test results. I am eagerly waiting for test results to the time everyone got ready for turning the publication and I shared with you. But here is a trap set up a Obrovsky'nin, I was not aware of falling into this trap. Because of this friend, a Turkish site to publish documents kabullenemeyen first time, did not understand what the intention is bad, perhaps the biggest mistake I made here.

Obviously we wanted to emphasize that we publish as its own test results or even withdrawn if a video processor that includes the opinion, said that the part in the news, but the name does not exceed verebileceğimizi asked specifically.
http://www.donanimhaber.com/islemci/haberleri/AMDnin-8-cekirdekli-Bulldozer-FX-islemcisi-ve-test-sonuclari.htm

Ich werde zwar nicht ganz schlau aus dem Text, hört sich aber schwer danach an, als wenn OBR die Türken reingelegt hat. Echt miese Nummer, da meiner Einschätzung nach Donanimhaber sehr gute Quellen besitzt und sonst als seriös einzustufen ist.

y33H@

2011-07-14, 22:30:44

Ich verstehe das auch so, als hätte OBR den Jungs von Donanim Haber Fakes geschickt, die die veröffentlicht haben ;( Krasse Nummer ...

Skysnake

2011-07-14, 22:48:10

Und die ham ihm noch Geld dafür gezahlt oder versteh ich das jetzt falsch? :ugly:

Wenn ja, verklagen, bis er schwarz wird....

Das wäre dann nämlich Betrug.

Blediator16

2011-07-14, 22:50:10

Der Typ hat das Teil sicher selbst gekauft für viel Geld^^Dem Vogel würde AMD doch kein ES anvertrauen

Schaffe89

2011-07-15, 01:37:52

Warum sollte er sich soviel Mühe machen? Ich denke nach wie vor dass die Benches ech sind und er einfach nur von AMD Schelte bekommen hat.

Ronny145

2011-07-15, 10:48:26

Warum sollte er sich soviel Mühe machen? Ich denke nach wie vor dass die Benches ech sind und er einfach nur von AMD Schelte bekommen hat.

Warum sollte er Schelte bekommen wenn eine völlig andere Seite die Benchmarks veröffentlicht? Dann wäre es doch jetzt umso schlimmer. AMD wüsste nun, dass die Benchmarks ursprünglich von ihm stammen. (erübrigt sich vermutlich sollten die Benchmarks weitab der Realität sein)

Den Gedankengank halte ich aber eh nicht für naheliegend. Erstens wird der nicht unter NDA stehen und zweitens hat er sich so viel schon gelistet, um davon auszugehen, dass er sich keinerlei Gedanken über Schelten von AMD macht. In diesem Fall würde sein Verhalten ganz anders aussehen. Übrigens ist viel Mühe nicht dabei. Es reicht schon die CPU auf 5 Ghz zu übertakten und die Benchmarks als default performance zu verkaufen. So würde sich die Arbeit sehr in Grenzen halten.

V2.0

2011-07-15, 11:05:02

Selbst dann muss die zusätzliche Chipgröße irgendwo hin geflossen sein.

Das würde man erst sehen wenn man eine Menge unterschiedlicher Benchmarks hätte. Man darf hier nicht Cache, Turbomode etc. vergessen, so dass es durchaus möglich ist, dass der relative Gleichstand im Schnitt eher eine Einzelfall ist, wenn eine Anwendung eine bestimmte Last auf alle Cores packt. Ich würde es aber auf keinen Fall für unmöglich halten - schon gar nicht wenn man mit ES und unfertigen BIOS-Versionen bencht.

Ronny145

2011-07-16, 00:01:57

Im PCGH Forum hat jemand netterweise eine Übersetzung des Donanimhaber Statements angefertigt. Also bezahlt hat er wohl doch nichts.

Den wichtigsten Teil rauskopiert:

Aber dabei war ich mir noch nicht im Klaren, dass Obrovsky eine Falle gestellt hatte und ich darauf reingefallen war. Denn ich wusste nicht, dass dieser Kollege eine Person ist, die sich nicht damit abfinden kann, dass zum ersten Mal eine türkische Website solche Dokumente veröffentlicht und mir war auch nicht bewusst, dass seine Absichten so böse sind. Womöglich war dies der größte Fehler, den ich in dieser Angelegenheit getan habe. Dass Obrovsky versucht hat, durch uns zu profitieren (Bekanntheit vermutlich), hat er in seinem Blogeintrag eindeutig bewiesen. Dass die von uns bisher veröffentlichten Dokumente weltweit einen Einfluss hatten, ist klar, und bei allen bis zum heutigen Tag veröffentlichten Dokumenten, die Bestandteil unserer Special-News (Bulldozer und andere Architekturen) waren, handelt es sich 100%'ig, und damit meine ich wirklich 100%'ig, um offizielles Material

Obrovsky, der sich dieser Tatsache bewusst war, hat in seinem heutigen Artikel zugegeben, dass er selbst Donanimhaber.com die Ergebnisse gegeben hat und ihnen (uns) bewusst falsche Angaben lieferte, um unsere Vertrauenswürdigkeit in den Schmutz zu ziehen.

Wie ich bei der Aufklärung auch angedeutet habe waren der Rest unserer veröffentlichten Bulldozer-Dokumente bisher Originale.

http://extreme.pcgameshardware.de/kommentare-zu-prozessoren/163696-amds-bulldozer-unzensierte-und-beeindruckende-benchmarks-eines-fx-8130p-35.html#post3209946

Donanimhaber soll sich nicht abbringen lassen weiterhin Originaldokumente zu veröffentlichen.

Leonidas

2011-07-16, 06:03:40

Ronny145

2011-07-16, 09:41:24

OgrEGT

2011-07-16, 11:35:07

Wie man aber (sofern zutreffend) an SNB-E sehen kann, scheint auch Intel prozesstechnisch (MHz/Watt) nicht zaubern zu können.
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=8818664&postcount=1400

SNB-E 6C/12T 3.3/3.9 GHz 130W TDP
BD 8C/8T 3.6/4.2 GHz 125W TDP

Man hat ja schon gehört, dass der BD super viel Strom verbrauchen soll, dass das Design prozesstechnisch bereits ausgereizt sein soll...

Wenn man beide Spekulationen bzgl. Takt/Turbotakt/TDP anschaut, dann scheinen beide Kontrahenten bzgl. MHz/Watt recht ähnlich zu sein.

Wie es dann Perf/MHz oder Perf/Watt dann auschaut wird sich erst noch zeigen müssen.

Ronny145

2011-07-16, 11:43:15

OgrEGT

2011-07-16, 12:01:33

Na wenn du danach gehst, also beide nur 5W TDP getrennt, müsste Bulldozer die Leistung eines SB-E mit 6 Kernen erreichen. Glaubst Du daran? Oder hast Du etwa SB-E 6/12 mit TDP 95W erwartet? SB 4/8 ohne GPU kommt auf 80W TDP, 2 zusätzliche Kerne in zusätzlichen 15W unterbringen, könnte eng werden, oder?

Mhz sind übrigens egal, Leistung zählt.

Wie schon gesagt, bzgl. Leistung werden wir noch abwarten müssen. Persönlich galube ich schon, dass der SNB-E dem BD voraus sein wird. Mir gings nur darum mal darauf hinzuweisen, dass Intel auch nur mit Wasser kocht was vergleichbare Fertigungsprozesse betrifft. Der Unterschied/Vorteil von Intel zu AMD ist schlicht der, dass man einen Prozessschritt voraus ist, dies aber mit sehr hohen Kosten erkauft. Die Zukunft wird zeigen, wie lange das noch in Bezug auf den Umsatz/Gewinn so weitergetrieben werden kann, da jeder neue Prozessschritt immer aufwendiger (auch länger braucht bis serientauglich) und teurer wird im Vergleich zum vorhergehenden.

Natürlich hast Du recht, Leistung zählt. Allerdings ist die Frage für wen und zu welchem Preis?

Ist doch schon heute so, dass für die Spielergemeinde die GPU weit wichtiger ist als CPU Leistung. Bei Otto-Normal-Verbraucher spielt beides keine Rolle, bleiben also nur wissenschaftliche Anwendungen / Serverkunden. Auch hier will sich das Geld erst mal verdienen lassen um mit jeder neuen Generation an CPUs mitzugehen.

mironicus

2011-07-16, 12:31:46

Es soll ja auch 95 Watt-Versionen vom BD geben. Mal schauen, wie viel Performance da noch übrig bleibt, bzw. die Leistung pro Watt ist hier interessant.

y33H@

2011-07-16, 12:41:52

idR haben die Flaggschiffe eine schlechtere perf/watt ratio, da sie auf Leistung getrimmt sind. Wird vermutlich beim BD nicht anders sein.

Duplex

2011-07-16, 12:50:58

Der CPU Takt von Bulldozer wird trotz neuen Stepping/Respin wahrscheinlich nicht den geplanten Taktraten von AMD entsprechen. Die 45nm CPUs aka X4 645 haben bei 5W weniger TDP 200Mhz mehr Takt als ein A8-3850, Llano müsste alleine durch 32nm + High K trotz IGP ca. 3.4-3.6 Ghz Takt erreichen, da sieht man das 32nm noch große Schwierigkeiten hat, mich würde es nicht wundern wenn AMD als erstes Interlagos vermarktet, der braucht garnicht so hohe Taktraten.

Bulldozer (Zambezi) muss in
Multithread 20-30% schneller als der i7-2600 sein,
Singlethread max. 10% langsamer als der i7-2600 sein,

wenn das nicht erreicht wird, man bedenke Sandy Bridge gibt es seit Anfang 2011, dann bedeutet das Totschlag Nr.1 für AMD

Außerdem gibt es nächstes Jahr schon Ivy Bridge, der kommt mit 4 Kernen & IGP nur noch auf 160mm², 10 Kerne ohne IGP = 400mm²

Fragman

2011-07-16, 12:57:43

an einen sb mit 6 kernen wird der 8 core bd doch nie rankommen denn dazu muesste er mal eben 50 prozent schneller sein als der aktuelle 4core sb. glaubt das hier tatsaechlich jemand? dafuer waere ja der echte 8core bd mit 16 modulen interessant, aber der kommt ja erst "irgendwann" und dann nicht als desktop, oder hat sich das geaendert (waere naemlich fuer mich der interessanteste bd)?

Duplex

2011-07-16, 12:59:39

@Fragman
Nie rankommen würde ich nicht sagen ;)

Wenn Bulldozer z.b. mit Westmere auf Augenhöhe liegt, dann ist ein SB-E mit 6 Kernen bei Integer Leistung nur 15% vor Bulldozer, wenn die Fertigung verbessert wird und Bulldozer mit mehr Takt kommt kann das noch was werden!

Was ist besser

Ein FX8000 Prozesser für 320$ der mit Westmere i7-990x gleichauf ist

oder

Ein SB-E 6C/12T der 15% schneller als ein FX8000 Prozessor ist und 800-1000$ kostet?

Für das gesparte Geld bekommt man beim AMD System noch 2-3 GTX570 Karten dazu!!!

AM3+ hat sogar eine SLI Lizens!!!

Fragman

2011-07-16, 13:02:57

Duplex

2011-07-16, 13:05:14

Was glaubst du den?
i5 Leistung für 320$ geht sowieso nicht, für 320$ muss Bulldozer gegenüber den i7-2600 Vorteile bieten können, warum kostet sonst ein Thuban nicht das gleiche wie ein i5-2500? Weil er langsamer ist kostet er weniger und AMD hat gesagt das Top Modell soll 320$ kosten, also muss er schneller als ein i7-2600 werden, sonst wird man solche Preise niemals ansetzen können.

FX8xxx
4,2Ghz
8 Kerne

33% mehr Kerne & 27% mehr Takt als ein X6-1100T, JF-AMD hat bestätigt das Bulldozer mehr IPC hat, also kann es eig. kein Flop werden, was nur klar ist das Bulldozer wegen Globalfoundries Probleme hat, das sieht man schon bei Llanos Taktraten!!!

mapel110

2011-07-16, 13:07:51

Ich glaub, dass er nur bei Multi-Core-Anwendungen schneller sein wird. Er hat ja schließlich "echtere Kerne" als Sandy mit HTT.

Duplex

2011-07-16, 13:22:35

Ich glaub, dass er nur bei Multi-Core-Anwendungen schneller sein wird. Er hat ja schließlich "echtere Kerne" als Sandy mit HTT.
Nein hat er nicht, Bulldozer hat nach Entwickler gesehen auch nur 4 Kerne

Es sind 4 Physische Cores, pro Core 2 Cluster die geteilte Ressourcen nutzen

CMT = Bulldozer Core
CMP = Dual Core Modul (gibt es nur auf dem Papier)

Bulldozer hat 4 FPUs, 4x L2 Cache
Bulldozer hat 4 Physiche Kerne
Bulldozer hat 2 ALUs & 2 AGUs

Phenom2 X6 hat 6 FPUs, 6x L2 Cache
Phenom2 X6 hat 6 Physische Kerne
Phenom2 X6 hat 3 ALUs & 3 AGUs

8 Kerne bei Bulldozer sind nur Marketing

Zambezi ist genauso wie der i7-2600 ein Quad Core nicht mehr und nicht weniger, er hat genauso wie der i7-2600 8 Logische Prozessoren.
Nur weil ihn das Marketing als 8 Kern CPU verkauft muss es noch lange kein echter sein, CMT ist nur eine bessere Alternative zu Intels SMT oder eine leichtere Aufgabe als IPC Logik.

SavageX

2011-07-16, 13:32:53

Trap

2011-07-16, 13:34:16

Nein hat er nicht, Bulldozer hat nach Entwickler gesehen auch nur 4 Kerne
Wer ist Entwickler?

robbitop

2011-07-16, 13:34:55

Ronny145

2011-07-16, 13:37:21

Was glaubst du den?
i5 Leistung für 320$ geht sowieso nicht, für 320$ muss Bulldozer gegenüber den i7-2600 Vorteile bieten können, warum kostet sonst ein Thuban nicht das gleiche wie ein i5-2500? Weil er langsamer ist kostet er weniger und AMD hat gesagt das Top Modell soll 320$ kosten, also muss er schneller als ein i7-2600 werden, sonst wird man solche Preise niemals ansetzen können.!

Wenn wir die Preise wüsste, ja. Wenn ich mir anschaue wie weit die Preisgerüchte um Llano daneben lagen, sollte man hier abwarten.

Duplex

2011-07-16, 13:38:20

@SavageX
Dann guck mal wieviele FPUs ein CMP Dual Core hat

CMP (Hier sind Ressourcen doppelt vorhancen) Echter Dual Core
2x Fetch
2x Decode
2x 256Bit FPU / 4x 128Bit
2x L2 Cache

http://www.abload.de/img/bulldozer-5kbl9kmxr.jpg

Verkaufsversion
CMT (Hier müssen Ressourcen geteilt werden) Ein Physicher Core :)
1x Fetch
1x Decode
1x 256Bit FPU / 2x 128Bit
1x L2 Cache
http://www.abload.de/img/bulldozer-6s9vrjmwl.jpg

@Trap
AMDs Entwickler ;)

@robbitop
Unabhängig von der GPU war Llano ursprünglich mit 3Ghz+ angekündigt, wenn du Folien möchtest, dann kann ich diese auffinden.

Trap

2011-07-16, 13:43:35

Deiner Definition nach ist ein 386 eine 0-Kern CPU weil die FPU fehlt?

SavageX

2011-07-16, 13:47:18

Duplex, Dir ist schon bekannt dass die obere Folie nur ein verschwenderisches Planspiel ist? Der aktuelle Phenom hat weniger Ressourcen als dieses Luftschloss.

S940

2011-07-16, 14:01:09

Zitat von mapel110 http://www.forum-3dcenter.org/vbulletin/images/3dc/insanedruid/buttons/viewpost.gif (http://www.forum-3dcenter.org/vbulletin/showthread.php?p=8838601#post8838601)
Ich glaub, dass er nur bei Multi-Core-Anwendungen schneller sein wird. Er hat ja schließlich "echtere Kerne" als Sandy mit HTT.

Nein hat er nicht, Bulldozer hat nach Entwickler gesehen auch nur 4 Kerne

Es sind 4 Physische Cores, pro Core 2 Cluster die geteilte Ressourcen nutzen

Das kann man schon so wie Mapel sehen, CMT ist auf alle Fälle "echter" als SMT. Wieviel es am Ende mehr bringt, wie groß das IPC Nachteil der kleineren CMT INT Cluster ist, und ob das durch mehr Takt wieder ausgeglichen werden kann, wird man wissen, wenn BD draußen ist.

mrt

2011-07-16, 14:30:57

Beispiel FPU: Die ist zwar geteilt, aber sie lässt sich als zwei konventionelle 128 bit FPUs auffassen, die man zu einer 256 bit FPU zusammenschalten kann. Deshalb hat jeder Kern bei SSE Code "seine eigene" FPU zur Verfügung - oder sogar zwei (!), wenn der andere Kern gerade "seine" FPU nicht braucht.
Ein 128Bit-FMAC is aber schon was anderes als das was K10 als FPU (ADD, MUL, MISC bzw L/S) hat.

Leonidas

2011-07-16, 18:15:31

Falls es noch Unklarheiten bezüglich des tschechischen Textes von OBR geben sollte, kann ich das von einem Muttersprachler mit exzellenten Deutschkenntnissen übersetzen lassen. Sagt einfach, welche Passage interessant wäre.

Interessant wären die folgenden. Man kann es mit dem Translator erahnen was gemeint ist, eine richtige Übersetzung wäre natürlich um einiges klarer.

Protože Stach opravdový výkon nezná, tak stále neví, že problém s výkonem mají. IPC takt-takt s Phenomem kleslo a výkon celkově je naprostá tragédie.

Im ersten Satz geht es nur um seinen Streit mit dem anderen tschechischen Blogger, hat also keine Relevanz. Im zweiten Satz sagt er, daß die IPC niedriger als beim Phenom II liegen und eine Tragödie sein soll.

Svolení od AMD nedostali, ale výsledky dostali ode mě :) A nyní se dostáváme konečně k meritu věci - k těm skutečným číslům. Všechny jsou špatné. Ani jeden z publikovaných výsledků není pravý a
autentický, všechny jsem upravil a nebo jej získal s masivně přetaktovaným procesorem!

So, hier die Übersetzung des Muttersprachlers:

Einverstaendnis von AMD bekamen sie nicht (der Tuerkische Verlag), aber die Ergebnisse bekamen sie von mir. Und jetzt kommen wir zum Kern (Merit) der Sache - zu den wirklichen (tatsaechlichen) Zahlen. Alle sind schlecht (falsch). Kein einziger der publizierten Ergebnisse ist echt (richtig, wahr) und authentisch, ich habe alle zurecht gemacht (frisiert) oder habe diese mit einem massiv uebertacktetem Prozessor erreicht!

Fakta o Bulldozeru - Výtěžnost je doslova tragická, horší než měly první čipy Fermi (Yields are only in percents).
Výkon odpovídá procesorům Sandy Bridge s vypnutým Hyper-Threadingem! A to si nedělám legraci! Procesor Core i7-2600K je o desítky procent v průměru výkonnější ... (FX-8150 is competitor for Core i5-2500K).

IPC takt-takt s Phenom II se snížílo (YES, IPC decreased!) Výkon v single-thread a efektivita je naprosto tristní ... (Single thread performance is tragic ..)

Spotřeba je stejně vysoká jako Core i7-990X v zátěži, výkonově ale Bulldozer ztrácí desítky procent. (Power consumption is +/- as Core i7-990X but performance +/- as Ci5-2500K).

Muß nicht übersetzt werden, weil OBR sinngemäße englische Übersetzungen selber mitliefert.

Ronny145

2011-07-16, 18:23:48

So, hier die Übersetzung des Muttersprachlers:

Einverstaendnis von AMD bekamen sie nicht (der Tuerkische Verlag), aber die Ergebnisse bekamen sie von mir. Und jetzt kommen wir zum Kern (Merit) der Sache - zu den wirklichen (tatsaechlichen) Zahlen. Alle sind schlecht (falsch). Kein einziger der publizierten Ergebnisse ist echt (richtig, wahr) und authentisch, ich habe alle zurecht gemacht (frisiert) oder habe diese mit einem massiv uebertacktetem Prozessor erreicht!

Massiv übertakteter Prozessor. Das hatte ich auch schon erwähnt. Zu Fälschen wäre das ein Kinderspiel. CPU übertakten und als default verkaufen. Allerdings ist keineswegs gesagt, dass seine CPU/Mainboard Kombination die volle Leistung entfaltet. Selbst wenn er in dem Punkt die Wahrheit sagt, muss es keine Bedeutung haben.

Sorkalm

2011-07-16, 18:31:22

Vorallem wenn die IPC schlechter als ein Phenom II sein soll - das hat ja CJ im Xtremesystem-Forum mehrmals dementiert (und ist auch unlogisch - dann hätte man gleich einen K10 auf acht Kerne bringen können, Taktbarkeit ist bei K10 inzwischen auch nicht so schlecht). Eine IPC kaum besser als K10 würde ich ja als Aussage noch akzeptieren, aber so?

Aber mit der Aktion hat sich OBR eh selbst disqualifiziert.

aylano

2011-07-16, 19:07:49

Viel wichtiger ist, ob Bulldozer die out-of-order Schwächen der derzeitigen Kerne behebt.
Was gab es da für eine??

Coda

2011-07-16, 19:19:24

Intel kann wesentlich mehr Arbeit pro Takt erledigen. Das ist derzeit das Hauptproblem der AMD-CPUs.

SavageX

2011-07-16, 19:19:40

Was gab es da für eine??

Jede Integer-Pipeline beim K7/K8/... hat einen eigenen Scheduler. Wenn eine Instruktion einer der Pipelines zugewiesen wurde, dann verbleibt sie auch dort, wenn eine andere Pipeline eigentlich die Ressourcen hätte, die Instruktion ebenfalls auszuführen. Dadurch laufen Einheiten gelegentlich leer. AMD kompensiert dies, indem jede Pipeline über vergleichsweise viele Ausführungsressourcen verfügt (an Ausführungseinheiten hapert es bei AMD nicht).

Intel benutzt seit dem P6 einen Scheduler, der alle Pipelines verwaltet. Dieser ist natürlich aufwändiger, kann aber die Einheiten besser auslasten, weshalb man hier ein bisschen sparen kann. AMD geht mit Bulldozer ebenfalls in diese Richtung.

Triskaine

2011-07-16, 19:21:20

Was gab es da für eine??

- unflexibles Scheduling
- kleines Instruktion Window
- schwache Sprungvorhersage
- kein Memory Disambiguation
- keine Branch Fusion

aylano

2011-07-16, 19:45:18

Interessant,
welche Andeutungen von Integer-Scheduler-Verbesserungen gabs beim Bulldozer schon?

Bisher hatte ich die Aufmerksamkeit bei den aufgefetteten 4-Fach-Front-End.

S940

2011-07-16, 20:33:33

Interessant,
welche Andeutungen von Integer-Scheduler-Verbesserungen gabs beim Bulldozer schon?

Bisher hatte ich die Aufmerksamkeit bei den aufgefetteten 4-Fach-Front-End.

Einiges, erstens unified, zweitens größer. Ist aber schon lange bekannt, wundert mich jetzt etwas, dass Du das bisher übersehen hast:
http://www.realworldtech.com/page.cfm?ArticleID=RWT082610181333&p=6
INT: Antatt 3x8 gibts 40 Plätze
FP: Anstatt 3x14 gibts 60 Plätze

Das ist einer der "Hauptattraktionen" ;-)

(del)

2011-07-17, 00:15:54

Aber mit der Aktion hat sich OBR eh selbst disqualifiziert.Vielleicht ging es ihm gehörig auf die Hoden, daß dauernd jemand eigene Wasserzeichenlogos auf seine Ergebnisse schmiert? Ich kanns verstehen :ulol: Ist "sich disqualifizieren" immenoch so eine Killerphrase wie früher? :| =)

Schaffe89

2011-07-17, 13:06:24

Naja er verarscht halt gern, aber trotzdem glaube ich dass einige Benchmarks zumindest echt sind.

Twodee

2011-07-17, 13:08:11

Naja er verarscht halt gern, aber trotzdem glaube ich dass einige Benchmarks zumindest echt sind.
Jupp, ich tippe da auf SuperPI.

OgrEGT

2011-07-17, 19:40:06

Wie genau wird BD eigentlich genannt werden?

Phenom III FX-xyz0
Phenom FX-xyz0

P-III fänd ich irgendwie cool :freak:

S940

2011-07-17, 19:44:40

Wie genau wird BD eigentlich genannt werden?

Phenom III FX-xyz0
Phenom FX-xyz0

P-III fänd ich irgendwie cool :freak:
Na nur "AMD FX Processor". Dahinter die Modellnummer. Die Webseite dazu ist doch schon freigeschalten und es gibt auch schon Logos.

http://sites.amd.com/us/promo/processors/Pages/fx-processor.aspx

Botcruscher

2011-07-17, 21:13:37

8 "Kern". Da reizt AMD das Marketing aus. Gut, besser als nichts.

y33H@

2011-07-17, 21:25:57

Die zählen halt klassisch Integer *Schulter zuck*

Nakai

2011-07-17, 22:43:35

Die zählen halt klassisch Integer *Schulter zuck*

Was andres gabs früher aned.;D

OgrEGT

2011-07-17, 23:28:00

Na nur "AMD FX Processor". Dahinter die Modellnummer. Die Webseite dazu ist doch schon freigeschalten und es gibt auch schon Logos.

http://sites.amd.com/us/promo/processors/Pages/fx-processor.aspx

Ich dachte da müsste noch was vor das FX...
FX ist eigentlich nur ein Suffix.
Egal. Hauptsache der wird gut.

OgrEGT

2011-07-17, 23:42:41

Die zählen halt klassisch Integer *Schulter zuck*
Wie würdest Du denn zählen?

][immy

2011-07-17, 23:47:46

Wie würdest Du denn zählen?
naja, auch wenn ich nicht gemeint war, die kerne sind aus meiner sicht eher ein verbessertes hyperthreading. nicht das ich es negativ finde (es dürfte wohl insgesamt effizienter sein als nur 4 "echte" kerne) aber so ein richtiger 8-kerner ist es dann ja doch nicht. ich könnte mir vorstellen, das dies in einigen benchmarks später gegen 6-/8-Kern Intel CPUs als ziemlicher nachteil entpuppen dürfte (und viele seiten/Zeitschriften werden wohl bei den vergleichen um einiges teurere Intel-Modelle heranziehen (6Kern + HT)). dies ließe sich marketingtechnisch von intel wohl ganz gut ausschlachten.

Ich dachte da müsste noch was vor das FX...
FX ist eigentlich nur ein Suffix.
Egal. Hauptsache der wird gut.
da steht ja noch AMD vor ;)

OgrEGT

2011-07-18, 00:09:27

[immy;8840501']naja, auch wenn ich nicht gemeint war, die kerne sind aus meiner sicht eher ein verbessertes hyperthreading. nicht das ich es negativ finde (es dürfte wohl insgesamt effizienter sein als nur 4 "echte" kerne) aber so ein richtiger 8-kerner ist es dann ja doch nicht. ich könnte mir vorstellen, das dies in einigen benchmarks später gegen 6-/8-Kern Intel CPUs als ziemlicher nachteil entpuppen dürfte (und viele seiten/Zeitschriften werden wohl bei den vergleichen um einiges teurere Intel-Modelle heranziehen (6Kern + HT)). dies ließe sich marketingtechnisch von intel wohl ganz gut ausschlachten.

Naja aber nur Quadcore trifft es aber auch nicht, und wäre unnötiges marketingtechnisches Understatement...
4C/8T wäre eine Möglichkeit gewesen... aber das haben wir ja schon. Und man will ja auch nicht den Eindruck erwecken, man hätte einfach das Intel SMT Hyperthreading kopiert.

[immy;8840501']da steht ja noch AMD vor ;)
:freak:

Skysnake

2011-07-18, 00:46:55

Das wurde schon gaaaaanz oft durchgekaut, aber so einfach ist das nicht.

Beispiel FPU: Die ist zwar geteilt, aber sie lässt sich als zwei konventionelle 128 bit FPUs auffassen, die man zu einer 256 bit FPU zusammenschalten kann. Deshalb hat jeder Kern bei SSE Code "seine eigene" FPU zur Verfügung - oder sogar zwei (!), wenn der andere Kern gerade "seine" FPU nicht braucht.

Ebenso kann man nicht pauschal ALUs und AGUs zusammenrechnen. Viel wichtiger ist, ob Bulldozer die out-of-order Schwächen der derzeitigen Kerne behebt.
Dir ist schon bewusst, was ein Prozessorkern ausmacht? Ich glaube nicht.

Eine FPU ist kein zwingender Bestandteil eines CPU-Kerns. Um genau zu sein sind dies folgende: (guckst du in ein gescheites Buch über Hardware-Architekturen, oder der Einfachheit halber einfach auf Wikipedia (http://de.wikipedia.org/wiki/Prozessorkern))

Adress-Decoder
Instruction-Decoder
ALU( OHNE s!)
Akkumulator
Register

Eine FPU gehört damit nicht zu einem Prozessorkern, genau so wenig wie Caches....

Deiner Definition nach ist ein 386 eine 0-Kern CPU weil die FPU fehlt?
Nein, siehe oben....

Brillus

2011-07-18, 02:31:32

Adress-Decoder
Instruction-Decoder
ALU( OHNE s!)
Akkumulator
Register

Kommt auch auf die ISA an hatte schon mit Rechenkernen gearbeitet die auser Akku kein Register hatten.

Coda

2011-07-18, 10:19:15

[immy;8840501']naja, auch wenn ich nicht gemeint war, die kerne sind aus meiner sicht eher ein verbessertes hyperthreading.
Überhaupt nicht. Solange kein AVX läuft, sind es praktisch 8 vollwertige Kerne.

Skysnake

2011-07-18, 11:10:13

Kommt auch auf die ISA an hatte schon mit Rechenkernen gearbeitet die auser Akku kein Register hatten.

Was für ne kranke Architektur war denn das bitte? Damit kannst du ja keine Load/Stores vornehmen, also im Voraus :freak:

Das war dann aber nur irgend ein Mikrochip. Selbst die 16 Bit CPU, die wir in der Uni aufm PFGA gebaut haben in ner Vorlesung hatte weitere Register,

Ronny145

2011-07-18, 13:20:07

http://www.abload.de/img/a5326089u782.jpg

http://www.abload.de/img/steppingso73w.png
http://diybbs.zol.com.cn/10/11_99971.html

Der scheint Zugriff auf verschiedene Steppings zu haben.

M4xw0lf

2011-07-18, 13:47:30

Interessant, aber die automatische Übersetzung hat wohl ihre Probleme - Cofee table? Cup?? :freak:

Ronny145

2011-07-18, 13:51:26

Die deutsche Übersetzung ist leider auch nicht besser. X-D

http://www.abload.de/img/steppings_2au8g.png

robbitop

2011-07-18, 13:52:05

Sehr schön ... die Tabelle fasst nochmal zusammen, was auch der bisherige Eindruck war. Vor B3 ist also noch keine korrekte Aussage machbar. C0 wird sicher noch an der Takt/Verbrauchscharakteristik machen. 0-3 waren ja nur Metallayer Respins.

aylano

2011-07-18, 15:51:03

Einiges, erstens unified, zweitens größer. Ist aber schon lange bekannt, wundert mich jetzt etwas, dass Du das bisher übersehen hast:
http://www.realworldtech.com/page.cfm?ArticleID=RWT082610181333&p=6
INT: Antatt 3x8 gibts 40 Plätze
FP: Anstatt 3x14 gibts 60 Plätze

Das ist einer der "Hauptattraktionen" ;-)
Ich dachte, die Hauptattraktion bzw. Schwäche von OoO ist das unflexible Front-End.

Die Steigerung von 3x8 auf 40 ist ja verdammt groß (+66%) (,vorallem wenn nebenbei die "Pipelines von 3 auf 2 reduziert" werden.)
Das Front-End wurde neben der Auffettung "nur" um 33% von 3 auf 4-Fach gesteigert.

Wie kommt das?
Ist das wegen den Unified?? oder wegen einen eventuellen deutlichen IPC-Steigerung, weil der Sheduler früher zu stark bremste?

Brillus

2011-07-18, 15:58:29

Was für ne kranke Architektur war denn das bitte? Damit kannst du ja keine Load/Stores vornehmen, also im Voraus :freak:

Das war dann aber nur irgend ein Mikrochip. Selbst die 16 Bit CPU, die wir in der Uni aufm PFGA gebaut haben in ner Vorlesung hatte weitere Register,
eine 4Bit Arichtectur(d.h Byte größe 4 Bit, 256 Speicherplätze a 4 Bit). 4 Bit Opcode und dann je nach befehle 8Bit Operand(load store jump) oder 4 bit Operand (alle andern). Hat aber gereicht um eine Springbrunnen stuerung draus zu machen.

Wobei mir nochmal eingefallen ist er hatte noch einen Overflow flag, (alos wenn du so willst doch noch ein 1 Bit breites Prozessor status register)

Coda

2011-07-18, 15:59:56

Wie kommt das?
Die Reservation Stages brauchen durch das physical register file viel weniger Platz, daher wohl der deutliche Anstieg an Plätzen. Das war bei Sandy Bridge nicht anders gegenüber Westmere.

Skysnake

2011-07-18, 16:14:36

eine 4Bit Arichtectur(d.h Byte größe 4 Bit, 256 Speicherplätze a 4 Bit). 4 Bit Opcode und dann je nach befehle 8Bit Operand(load store jump) oder 4 bit Operand (alle andern). Hat aber gereicht um eine Springbrunnen stuerung draus zu machen.

Wobei mir nochmal eingefallen ist er hatte noch einen Overflow flag, (alos wenn du so willst doch noch ein 1 Bit breites Prozessor status register)

Oha, das ist natürlich wirklich sehr sparsam, wobei 2 Register für die beiden Opperanten hast du dann wohl auch gehabt, wenn du ein Load machen konntest. Zumindest wäre es ansonsten schon verdammt ineffektiv...

So btT. Sehr interessant mit der Tabelle, war aber so ab zu sehen. Ich bin mal gespannt was jetzt am Ende wirklich bei rum kommt.

Was ihr da ansprecht mit den vergrößerten Windows für die Sprungvorhersage etc. ist wirklich sehr cool. Ich denke da lässt sich wirklich einiges heraus holen.

Was ich allerdings nicht mehr verstehe, seit dem mir bekannt wurde, dass die Superskalarität reduziert wurde der Int-ALUs. SingleThread reduziert das halt die theoretische Rechenleistung...

Summa summarum wäre es mir wirklich lieber gewesen, wenn man die zwei Integer-Cluster zusammen gefasst hätte und noch immer 2 Threads drauf laufen lassen hätte. Also SMT, bei dem man parallel die unterschiedlichen Pipelines mit Befehlen der beiden Threads beliebig füttern kann. Da wäre die SingleThread-Performance auch kein Problem.

Naja, vielleicht kommt es ja mit BD2. Wäre auf jeden Fall besser als die reduzierten IntegerALUs

Coda

2011-07-18, 16:28:49

SingleThread reduziert das halt die theoretische Rechenleistung...
Tut es nicht, BD hat höhere IPC. Wurde schon 100x gesagt.

Theoretische Ausführungsresourcen und tatsächliche Leistungsfähigkeit haben relativ wenig miteinander zu tun.

aylano

2011-07-18, 16:37:27

Die Reservation Stages brauchen durch das physical register file viel weniger Platz, daher wohl der deutliche Anstieg an Plätzen. Das war bei Sandy Bridge nicht anders gegenüber Westmere.
Kann man einschätzen, umwieviel der Integer-Core effektiv gesteigert wurde?

Welchen Einfluss hat die ALU-Rekution von 3 auf 2 auf den Integer-Scheduler?

Skysnake

2011-07-18, 16:40:51

Sie haben aber halt die ALUs reduziert, und soweit ich das überblicken konnte hat sich damit der theoretische Durchsatz reduziert, korrigiere mich falls Sie entsprechend die Leistung gesteigert haben. Spielt aber im Prinzip keine Rolle, wären die Integer-ALUs genau so wie die Flex-FPU zusammengefasst, wären mehr Ressourcen für jeden Thread verfügbar.

Und was die IPC angeht, mir wurde von verschiedenen Stellen schon durch die Blume mitgeteilt von Leuten, die sehr sicher ein ES hatten, dass BD teils hinter einem PhenomII landet. Ist halt nur die Frage, welche Revision die verwendet hatten. Das ist halt immer die große Frage.....

S940

2011-07-18, 17:00:36

Ich dachte, die Hauptattraktion bzw. Schwäche von OoO ist das unflexible Front-End.
Ne, das Front-End ist meistens immer in-order.
Gab jetzt AMD Patente, die auch ein OoO FrontEnd beschrieben, aber ob das wirklich kommt ... das ist die große Frage. Ansonsten ist im FrontEnd noch die Vorhersagelogik untergebracht, die ist auch immer wichtig, klar.

Die Steigerung von 3x8 auf 40 ist ja verdammt groß (+66%) (,vorallem wenn nebenbei die "Pipelines von 3 auf 2 reduziert" werden.)
Siehe Codas Erklärung. Bisher war doppelte Buchführung nötig, das fällt mit dem phy. Registern jetzt weg, im Endeffekt hat man also grob doppelte soviele Einträge bei ähnlichem gleichem Transistorenverbrauch. Dazu kommt dann halt auch noch, dass es bisher nicht soviele Einträge waren, zumindest im Vergleich zu Intel.
Das Front-End wurde neben der Auffettung "nur" um 33% von 3 auf 4-Fach gesteigert.Naja, reicht doch, zusammen mit OpFusion ist das ganz sicher genug für 2x2 Pipes ;-)

Edit:
Welchen Einfluss hat die ALU-Rekution von 3 auf 2 auf den Integer-Scheduler?
Naja, der Scheduler wird weniger belastet, ist ja eine ALU weniger. D.h. die restlichen 2 Pipes bekommen effektiv mehr Schedulerplätze ab. Aber nachdem das ganze Schedulerkonzept komplett geändert wurde, ist das mühselig zu diskutieren. Zuvor gabs ne Aussage von nem ehemaligen AMD Mitarbeiter, dass die 3Pipe nicht wirklich viel brachte.

ciao

Alex

p.S: Nicht vergessen sollte man bei der OoO Geschichte auch noch die Memory Disambiguation Geschichte, die ist anscheinend auch wichtig. Man könnte es Load/Story OoO nennen.

Coda

2011-07-18, 17:17:40

Sie haben aber halt die ALUs reduziert, und soweit ich das überblicken konnte hat sich damit der theoretische Durchsatz reduziert, korrigiere mich falls Sie entsprechend die Leistung gesteigert haben.
Nochmal: Der theoretische Durchsatz spielt keine große Rolle. Viel wichtiger ist wieviel davon auch genutzt werden kann.

Ne, das Front-End ist meistens immer in-order.
Selbstverständlich immer.

S940

2011-07-18, 17:26:26

Selbstverständlich immer.
Bisher ja, aber wie gesagt gabs da ein AMD Patent. Ob das nun in BD einfließt oder nicht, mal schauen.

Skysnake

2011-07-18, 17:33:46

Nochmal: Der theoretische Durchsatz spielt keine große Rolle. Viel wichtiger ist wieviel davon auch genutzt werden kann.

Klar spielt er schon eine Rolle, wenn die theoretische Leistung geringer ist als die praktisch anzutreffende des Konkurrenten, dann hat man schon verloren....

Und ja, klar sieht man oft totalen Murks-Code, der alles andere als performant ist, aber man kann ja auch optimieren bis zum Erbrechen, und da bekommt man aus einer CPU schon oft sehr viel raus, wenn man sich über Loopunrolling, geschickte komplexe Datentypen etc macht.

Also von daher muss man schauen, was am Ende bei rum kommt. Wenn die 2 Pipelines genau so viel Leistung bringen wie theoretischer BD mit 3 Pipelines, dann passt alles. Selbst wenn es nur 80% sind, passt es, es sei denn man ist halt extrem abhängig von der SingleThread-Performance.

Am Ende ist es eben wie immer. Das Gesamtkonzept muss stimmen ;)

Coda

2011-07-18, 17:33:54

Bisher ja, aber wie gesagt gabs da ein AMD Patent. Ob das nun in BD einfließt oder nicht, mal schauen.
Es ist immer In-Order, der Programmfluss muss eingehalten werden. Du hast da wohl das Patent falsch verstanden.

Klar spielt er schon eine Rolle, wenn die theoretische Leistung geringer ist als die praktisch anzutreffende des Konkurrenten, dann hat man schon verloren....
Nö, eben nicht.

Außerdem unterschlagt ihr ständig, das es neben den zwei vollen ALUs auch noch zwei Address-Generation-Pipelines pro Core gibt, deren Aufgabe bei Intel von den normalen ALUs getragen wird.

Skysnake

2011-07-18, 17:44:20

ähm...

Kann es sein, dass du grad auf dem Schlauch stehst, oder nicht richtig gelesen hast? :D

Wenn die theoretische! Leistung niedriger ist als die praktische eines anderen Produktes, dann kann das nicht ne bessere praktische Leistung haben.

Dann würde nämlich gelten theoretische<praktische Leistung, und dann würde ich mir schon SEHR große Gedanken über meine Theorie machen :lol:

Coda

2011-07-18, 17:47:26

Wenn die theoretische! Leistung niedriger ist als die praktische eines anderen Produktes
Das ist aber nichtmal annähernd der Fall. IPC bei Durchschnittscode mit FPU ist derzeit bei ~1.5 - wenn's gut läuft.

S940

2011-07-18, 17:48:54

Es ist immer In-Order, der Programmfluss muss eingehalten werden. Du hast da wohl das Patent falsch verstanden.

Deutlich wahrscheinlich ist, dass Du das Patent mit dem Titel:
Using multiple decoders and a reorder queue to decode instructions out of order
nicht gelesen hast :wink:

Wenn die theoretische! Leistung niedriger ist als die praktische eines anderen Produktes, dann kann das nicht ne bessere praktische Leistung haben.
Doch das geht, nämlich dann, wenn in der Praxis deutlich weniger benutzt worden war.
Beispiel:

Bisherige IPC mit Wald und Wiesen Code z.B.: =1, trotz 3 Pipelines.
BD IPC = 1,5 bis 2, bei 2 Pipelines.

Selbst Nehalem schafft bei 08/15 Code maximal so IPC=1,75, Sandy kratzt jetzt vielleicht an 2. Wie auch immer, 2 Pipes reichen da schon, wenn man kein SMT einbauen will, mehr als IPC=2 ist selten drin.
3 Pipes war früher bei single-core CPUs mit geringen Leckströmen sinnvoll, aber jetzt schauts anders aus.

Coda

2011-07-18, 17:50:14

Deutlich wahrscheinlich ist, dass Du das Patent mit dem Titel:

nicht gelesen hast :wink:
Nö. Das Front-End an sich bleibt auch bei so einem Konstrukt In-Order.

Skysnake

2011-07-18, 18:03:59

Deutlich wahrscheinlich ist, dass Du das Patent mit dem Titel:

nicht gelesen hast :wink:

Doch das geht, nämlich dann, wenn in der Praxis deutlich weniger benutzt worden war.
Beispiel:

Bisherige IPC mit Wald und Wiesen Code z.B.: =1, trotz 3 Pipelines.
BD IPC = 1,5 bis 2, bei 2 Pipelines.

Selbst Nehalem schafft bei 08/15 Code maximal so IPC=1,75, Sandy kratzt jetzt vielleicht an 2. Wie auch immer, 2 Pipes reichen da schon, wenn man kein SMT einbauen will, mehr als IPC=2 ist selten drin.
3 Pipes war früher bei single-core CPUs mit geringen Leckströmen sinnvoll, aber jetzt schauts anders aus.

Ja bei nem 0815 Code ist das zutreffend, aber den hat man ja nicht überall.

Und an meine Aussage ist halt trotzdem 100% korrekt. theoretisch und praxis sind die zwei Schlüsselworte.

Zudem muss man ja schauen, das nicht alle ALUs alles konnten. Weder beim Phenom II noch beim BD, noch bei SB oder sonst ne CPU.

2 Reichen wahrscheinlich aus, und werden besser ausgelastet als die 3 vorher, aber 4 zu haben wenn man es nutzen kann wäre halt schon schicker, oder widersprichst du mir da ;)

Man muss halt echt mal schauen, was AMD da hin bekommen hat mit dem Frontend. Mit der Zeit kommt aber sicherlich wieder mal ne Pipe oder 2 dazu.

Ein Downgrade sieht man halt eher selten bei neuer Hardware :biggrin:

S940

2011-07-18, 18:26:59

Nö. Das Front-End an sich bleibt auch bei so einem Konstrukt In-Order.
Ah lol, hatte Decoder mit Front-End gleichgesetzt, mein Fehler, Du hast recht ;-)
Ja bei nem 0815 Code ist das zutreffend, aber den hat man ja nicht überall.
Naja käme auf ne Untersuchung an, mehr als 2 hat man auf alle Fälle sehr, sehr selten.

2 Reichen wahrscheinlich aus, und werden besser ausgelastet als die 3 vorher, aber 4 zu haben wenn man es nutzen kann wäre halt schon schicker, oder widersprichst du mir da ;)
Schicker im Sinne von, wenns das für umsonst gäbe, natürlich.
Aber das ist halt nicht so, da gibts viele, negative Seiteneffekte.

Hauptaugenmerk war bei AMD ja auch der Takt, je simpler der ganze INT Cluster, desto einfacher.
Dresdenboy hatte dazu auch mal ein Paper verlinkt, da haben Forscher untersucht, was am besten wäre, 2x2issue, 1x4, 1x4 mit SMT, oder 2x2 mit SMT. Gewonnen hat 2x2 mit SMT, wobei 2x2 schneller war als 1x4 mit SMT. Unberücksichtigt war dabei der maximale Takt, der wird mit SMT ja etwas schlechter, weil der Cluster dann wieder komplexer wird. Aber soo genau erinnere ich mich jetzt nicht mehr daran ^^

Man muss halt echt mal schauen, was AMD da hin bekommen hat mit dem Frontend. Mit der Zeit kommt aber sicherlich wieder mal ne Pipe oder 2 dazu. Ich glaubs eher nicht, die Leckstromproblematik wird immer schlimmer, da machen schlanke Designs viel mehr Sinn, den Luxus einer 3ten, fast nie ausgelasteten Pipeline kann man sich nicht mehr leisten. Dafür gibts außerdem ja als Bonus, ordentlich Takt oben drauf, damit sollte dann jeder zufrieden sein.
In Zukunft könnte man sich eher ein 8fach Frontend mit vier 2issue INT Clustern und vier 128b FMACs vorstellen, aber ob man die ausreichend gut an einen einzigen L2 anschließen kann, keine Ahnung.
Ein Downgrade sieht man halt eher selten bei neuer Hardware :biggrin:Naja, so schlimm wie beim P4 wirds beim BD sicher nicht ;-)

Undertaker

2011-07-18, 18:28:04

Nur weil man heute mit 3 Pipelines im Schnitt um die 1,5 IPC erreicht bedeutet das aber nicht, dass 2 Pipelines die IPC nicht senken. Stellenweise werden sich auch sehr wohl 3 Pipelines (oder mehr) auslasten lassen.
Das andere Optimierungen diesen Nachteil wiederum aufwiegen können, ist natürlich gut möglich. Ich bin da eher Skysnake's Ansicht, dass die aktuelle Lösung eher ein Tribut an den Herstellungsprozess ist - und in Zukunft womöglich wieder verbreitert wird.

fondness

2011-07-18, 19:02:02

Ich bin da eher Skysnake's Ansicht, dass die aktuelle Lösung eher ein Tribut an den Herstellungsprozess ist - und in Zukunft womöglich wieder verbreitert wird.

Der Platzbedarf dafür ist lächerlich gering, das kann man hundert prozentig ausschließen. BD ist eindeutig für eine möglichst hohe Auslastung designt, die Load/Store-Units, Prefetch, etc. sind im Vergleich zu restlichen Kern gigantisch groß. Ich glaube allerdings auch dass das Problem beim Herstellungsprozess liegt, allerdings an anderer Stelle. Ich vermute dasselbe Problem wie bei Llano. Die Pipeline wurde deutlich verlängert, die Latenzen deutlich erhöht, die Taktraten tragen dem nicht Rechnung, der Stromverbrauch ist dafür zu hoch.

Undertaker

2011-07-18, 19:04:47

Mit dem Stichwort Prozess wollte ich ebenfalls in erster Linie Leistungsaufnahme (die Taktrate steht damit ja in direkter Verbindung) sagen. :)

Twodee

2011-07-18, 19:32:26

.... Die Pipeline wurde deutlich verlängert, die Latenzen deutlich erhöht, die Taktraten tragen dem nicht Rechnung, der Stromverbrauch ist dafür zu hoch.
das kenne ich doch irgendwoher..:rolleyes:

Skysnake

2011-07-18, 19:43:39

Naja, spätestens in 10 Jahren haben wir mit stacked Chips eh für jeden C/C++ Befehl oder whot ever sicherlich ne eigene Execution Unit :ugly:

IBM geht ja selbst in Ihrer Entwicklung davon aus, dass das einzige Problem für die Zukunft eigentlich nur noch ist, genug Strom in nen Chip zu pressen :D

Pin-Limitierung (Daten) wird mit Glasfaser umgangen, mit Wasserkühlung im Chip ist das Wärmeproblem gelöst und durch das stapeln der Chips hat man kaum noch Probleme mit dem Transistorenbudget ^^

Nur die Laufzeiten und halt die massive Stromaufnahme limitieren da dann noch

Coda

2011-07-18, 20:45:59

Naja, spätestens in 10 Jahren haben wir mit stacked Chips eh für jeden C/C++ Befehl oder whot ever sicherlich ne eigene Execution Unit :ugly:
:facepalm:

Skysnake

2011-07-18, 22:26:00

Du brauchst gar nicht mit nem FacePalm kommen.... Das Powerbudget wird in Zukunft der limitierende Faktor sein, also so >10 Jahre.

Deswegen werden die "GPUs" (wohl eher Vektorrechner) auch in die Highend CPUs wandern, da Sie manche Aufgaben einfach viel Effizienter lösen können als der x86 Part einer CPU/APU.

Und btw. Falls du jetzt meinst, man hat ja eigentlich jetzt schon für alles seine Ausführungseinheiten: Ja, aber eben nicht spezialisiert. Ich denke es sollte klar gewesen sein, dass ich damit meinte, dass man halt genug Transistoren hat, um alles mögliche in Hardware zu gießen. Angefangen bei Sqrt, über Sinus/Cosinus, also die ganzen Transzendenten Funktionen bla blub bis hin zu so Sachen wie Zufallszahlengeneratoren in Hardware und eben keine Mycro-Ops mehr, sondern direkte Hardware-Funktionen. Oder denken wir an so gängige Modulo Operationen.

Dazu noch nen schönen dicken FPGA neben den CPU/GPU Part und komplexe Datentypen etc. sind auch kein Ding mehr. Hoffentlich werden nur die Bibliotheken bis dahin gut genug ^^

Ronny145

2011-07-19, 00:28:42

B2 silicon is just now getting into the hands of the board manufacturers. We are still a little ways from seeing anything more concerete on Bulldozer / Zambezi.
http://hardforum.com/showpost.php?p=1037524317&postcount=58

Das ist der Mainboard Tester von Hardocp. Es geht langsam voran.

Skysnake

2011-07-19, 00:51:57

Damit sollte dann wohl auch klar sein, dass OBR wohl ein B0/B1 Stepping hat. Ich tippe aber am ehesten auf B0, wenn man sich die Caches so anschaut.

Ronny145

2011-07-19, 01:03:17

Damit sollte dann wohl auch klar sein, dass OBR wohl ein B0/B1 Stepping hat. Ich tippe aber am ehesten auf B0, wenn man sich die Caches so anschaut.

Ich tippe auf B1. Bei den B0 Samples von anderen Leaks gab es 0 MB in AIDA zu sehen (L3 war's glaube). Wäre dann ja auch einfacher für OBR, hätte er AIDA nicht faken müssen.

Skysnake

2011-07-19, 01:38:18

Lokadamus - nixBock

2011-07-19, 07:37:17

Du brauchst gar nicht mit nem FacePalm kommen.... Das Powerbudget wird in Zukunft der limitierende Faktor sein, also so >10 Jahre....mmm...

Du beschäftigst dich erst seit kurzem mit CPUs, oder?

fondness

2011-07-19, 09:03:31

http://hardforum.com/showpost.php?p=1037524317&postcount=58

Das ist der Mainboard Tester von Hardocp. Es geht langsam voran.

Laut der Tabelle vorne ist bei B2 allerdings noch immer der Turbo im Arsch und erst B3/C0 weitgehend fehlerfrei.

Ronny145

2011-07-19, 10:41:49

Welche Version hatte denn AIDA in dem entsprechenden Benchmark von einem B0 Sample?

Ich hatte die Tage eine nette Unterhaltung mit einem der AIDA64 Entwickler/Mitarbeiter. Erst die AIDA64 Version von OBR/Donanimhaber unterstützen Bulldozer zu 100%.

Wenn 0 dasteht, kann es laut diesem Mitarbeiter daran liegen, dass die CPU noch nicht unterstützt wird. ;)

Die 0 MB werden schon stimmen. Die Ergebnisse im Fritzchess sind sauchschlecht gewesen wenn ich vom chipchell Sample spreche. Und auch die anderen Memory Werte in AIDA, also nicht nur L2 und L3 Cache wo AIDA 0 MB anzeigt. B1 klingt für am logischsten.

Skysnake

2011-07-19, 12:39:10

mmm...

Du beschäftigst dich erst seit kurzem mit CPUs, oder?

Nein eher nicht....

Aber ich seh jetzt auch nicht den Sinn darüber jetzt den EPen-Vergleich an zu stellen.

Wir können uns aber gern über Pinlimitierung und Hotspots etc. unterhalten.

Falls du die Beiträge zuvor aber auch gelesen hast, wirst du sehen, dass die Hitzeentwicklung gelöst ist und kein beschränkender Faktor mehr ist, I/O mit Fibre to Chip etc auch nicht und das Transistorenbudget durch stacked Chips massiv nach oben geht und faktisch auch keinen limitierenden Faktor mehr darstellt. Bleibt unterm Strich noch die Stromversorgung. Und nein ich mein da jetzt keine Probleme aufgrund von Elektromigration bei steigender Spannung, sondern allein wie viel Ampere man über einen Pin jagen kann bevor er dir wegbruzelt....

Und bitte jetzt nicht auf der Aussage mit jedem C/C++ Befehl rumreiten... Du weist wie das gemeint war. Eben keine MycroOps mehr sondern dass jeder Befehl in einem Takt ausgeführt werden kann und eben gerade solche Sachen wie alle möglichen Transzendenten Funktionen oder auch FFT direkt in Hardware zu haben. Am meisten Potenzial hat wohl die Integration riesiger FPGAs die man dann auch während der Laufzeit neu programmieren kann. Beliebige FP-Genauigkeiten in Hardware implementieren ist halt schon schick.

Lokadamus

2011-07-19, 16:40:48

Du weist wie das gemeint war. Eben keine MycroOps mehr sondern dass jeder Befehl in einem Takt ausgeführt werden kann und eben gerade solche Sachen wie alle möglichen Transzendenten Funktionen oder auch FFT direkt in Hardware zu haben....mmm...

Genau das meine ich. RISC/ CISC sind hier die Schlagwörter. Es lohnt sich einfach nicht, alles in einem Takt realisieren zu wollen. Das Problem hierbei ist die Idee hinter der CPU, die des Allrounders. Man könnte es versuchen, aber der Aufwand steht in keinem Verhältnis (Anzahl Transistoren gegenüber Nutzen), zumindest, wenn wir von der CPU alleine reden. Hier taucht aber auch gleich das Problem von spezialisierten Chips auf. Die Idee, alles auf einem Mainboard zu packen ist nicht neu, aber sehr teuer. Erst recht dadurch, dass die Entwicklung dauernd weitergeht. Was nützt es dir, wenn du in diesem Jahr den besten Chip für was auch immer hast, in 2 Jahren aber kannst du den nur noch zum Dumpingpreis loswerden. Schlimmer ist es eher, wenn die CPU alleine auf einmal diese Berechnung mitmachen kann.
Deine anderen Ideen wie ein Hardware- Zufallsgenerator wurde, wenn ich es richtig mitbekommen habe, schon von VIA gemacht, hat aber keinen Interessiert.
Hier tritt auch gleich das nächste Problem auf: Fehlerhafte oder veraltete Implementierungen lassen sich nicht einfach korrigieren. Die Transistoren sind in diesem Sinne unbrauchbar, weil sie entweder mehr Zeit benötigen oder gar nicht mehr genutzt werden können.
Edit: Sie müssten rekonfigurierbar sein und das wird wohl noch einige Zeit dauern, bis so eine Technik kommt.

Skysnake

2011-07-19, 16:54:13

Ja da gebe ich dir im Moment/Vergangenheit absolut recht.

Ich sprach aber von >10Jahre. Stacked Chips werden da wohl sehr normal sein, und wir an der finalen Grenze der Strukturgröße angelangt sein.

Du stehst dann also vor folgenden Problemen:

Pin Limitation (noch immer ^^): Für I/O mehr oder weniger gelöst durch Glasfaser direkt aus dem Chip, hat IBM ja schon Prototypen gezeigt.
Bleibt die Pin Limitation für die Stromversorgung bestehen

Kühlung von stacked Chips: Ist auch gelöst durch Wasserkühlung durch die einzelnen Lagen des Chips. Damit hat man auch kein echtes Problem mehr mit HotSpots etc.

Transistorbudget: Naja, durch die stacked Chips auch mehr oder weniger gelöst. Ein 3cm hoher Chip, bei dem die Laufzeiten noch nicht relevant werden, wird mehr als genug Transistoren haben um jeden Mist zu implementieren.

Da lohnen sich dann auch mal die >=400mm Wafer ;)

Aktuell macht es wirklich keinen Sinn, aber in Zukunft schon, denn die spezialisierten Einheiten machen die Aufgaben eben effizienter, und wenn eben wie oben ausgeführt eigentlich alle anderen Probleme gelöst sind bis auf die Leistungsaufnahme, dann bleibt eigentlich nur noch die Effizientsverbesserung übrig um weiter die Leistung zu steigern. Netter Nebeneffekt dabei ist natürlich, dass die Stromkosten sinken ;)

Coda

2011-07-19, 17:25:43

Angefangen bei Sqrt, über Sinus/Cosinus, also die ganzen Transzendenten Funktionen bla blub bis hin zu so Sachen wie Zufallszahlengeneratoren in Hardware und eben keine Mycro-Ops mehr, sondern direkte Hardware-Funktionen. Oder denken wir an so gängige Modulo Operationen.
Das gibt's alles schon bei x86.

Lokadamus

2011-07-19, 17:30:46

Ja da gebe ich dir im Moment/Vergangenheit absolut recht.

Ich sprach aber von >10Jahre. Stacked Chips werden da wohl sehr normal sein, und wir an der finalen Grenze der Strukturgröße angelangt sein.mmm...

Zuerst hast du von spätestens 10 Jahren geredet, danach mehr als 10 Jahre, was hier wieder den Spielraum auf 1000 Jahre und mehr erweitert und damit sinnlos ist. Quanten lassen grüßen, in 1000 Jahren dürfte wohl eine andere Technik dran sein als was heute verwendet wird. ;)
Biomasse könnte das Transistorproblem von alleine lösen, dürfte aber nicht die Geschwindigkeit wie Glasfaser erreichen.

Skysnake

2011-07-19, 17:39:15

Bis ich rede von ~2020. Wenn wir "Glück" haben, kommen in 2-3 Jahren schon die ersten stacked CPUs. Da ist dann auch der Weg nicht mehr weit. Zwischen 2020 und 2030 kommt es auf jeden Fall, denn bis dahin ist dann spätestens Schluss mit Strukturbreitenverkleinerung. Wir wollen ja weiterhin Moor´s law einhalten ;)

@Coda:

Es gibt die wenigsten Sachen direkt als Hardware-Funktionen. Mit Sqrt kann man vielleicht noch Glück haben, Cos/Sin etc. wäre mir aber absolut neu, das es das bei x86 CPUs als Hardwareimplementierung gibt. Das wird ja normal über Näherung gemacht und gut is.

Brillus

2011-07-19, 17:46:32

Skysnake

2011-07-19, 18:18:37

Als Hardwareimplementierung oder als Mycrocode?

OgrEGT

2011-07-19, 18:46:09

Bei den Chinesen hier gibt es einen Artikel zum BD
http://translate.google.de/translate?hl=de&sl=zh-CN&tl=en&u=http%3A%2F%2Ftech.hexun.com%2F2011-07-19%2F131543250.html

Original-Quelle: PcPop

Interessant die Grafik zur Produktpositionierung (war bisher nur spekuliert?)

FX 81xx (Topmodell?) gegen 2600K

y33H@

2011-07-19, 18:54:57

Die Produktpositionierung-Slide ist ziemlich alt, aber wohl immer noch gültig.

OgrEGT

2011-07-19, 18:57:37

Die Produktpositionierung-Slide ist ziemlich alt, aber wohl immer noch gültig.

Wo/wann gabs das denn schon?

Edit: Habs gefunden...
z.B Hardware-infos vom 14.03.2011 :redface:
Original: xbitlabs vom 13.03.2011 :redface: :redface:

Coda

2011-07-19, 19:13:40

Als Hardwareimplementierung oder als Mycrocode?
Es hat seinen guten Grund warum das Microcode ist, und nein es wäre auch sonst nicht schneller.

Mal ganz abgesehen davon, das es kompletter Schwachsinn ist die Performance von fsin/fcos groß zu optimieren, wenn das in keinem Programm der Welt ein Bottleneck ist.

Ronny145

2011-07-19, 21:50:50

OBR meldet sich zu Wort :freak:

I am out of my cave now, but THIS WEEKEND you will see complete Review of AMD FX (Bulldozer) CPU with comparision to Phenom II X6! Clock-to-clock ... Eye-to eye :)

20+ benchmarks, games, tests ... 3,3 GHz (+ Turbo) Phenom II X4 vs AMD FX at 3,3 (3,6 GHz) + Turbo!

No more secrets, everything will be published THIS WEEKEND! No Fakes, no edited screenshots! Be ready!

Simulated FX-8150 in ACTION!

Finch

2011-07-19, 22:10:26

hat OBR den noch noch ein veraltetes Sample? Wenn ja, dann kann man den "test" ja in die Tonne kloppen.

OgrEGT

2011-07-19, 22:17:38

hat OBR den noch noch ein veraltetes Sample? Wenn ja, dann kann man den "test" ja in die Tonne kloppen.

Find ich auch. Wenn er die Revision nicht angibt, kann er sich den Test in die Haare schmieren. Vor allem da alle vermuten dass er ein B1 oder B0 ES hat, kann ich auf seine Kommentare verzichten... Von wegen "Leistung tragisch" und "Verbrauch katastrophal" etc. Nur Stimmungsmache und Klick-Hascherei.

Sofern hier was drüber geschrieben wird, OK, jedenfalls bekommt er von mir keine klicks.

DeadMeat

2011-07-19, 22:27:15

Einer muss halt nur kurz auf die Cache Werte schauen ob es noch wirklich das gleiche ES ist.
Falls ja wie gesagt, Wertlos.

Ronny145

2011-07-19, 22:39:15

B1 braucht er mindestens. Für den Vergleich mit gleichen Takt gegen den Thuban wäre es eh besser auf 3,3 Ghz zu takten und den Turbo zu deaktivieren. Das würde einen buggy Turbomodus aus dem Weg gehen und wäre aussagekräftiger.

Skysnake

2011-07-19, 22:42:58

Es hat seinen guten Grund warum das Microcode ist, und nein es wäre auch sonst nicht schneller.

Mal ganz abgesehen davon, das es kompletter Schwachsinn ist die Performance von fsin/fcos groß zu optimieren, wenn das in keinem Programm der Welt ein Bottleneck ist.

Och es gibt da schon manche Anwendungen, die da recht viel Gebrauch von machen. Manchmal ist es schon ganz schick so etwas zu haben ;)

Du verstehst auch nicht was ich sagen will. Wenn es so ziemlich wayne ist, wieviele Transistoren du verbräst, da du eben stacked Chips hast, und damit mal fluffig das 10-100 fache Transistor-Budget hast wie aktuell, aber maximal 50% des Chips mit Strom versorgen kannst, dann kommt es halt darauf an, die Arbeit mit minimalen Stromverbrauch zu realisieren, und da sind spezial Funktion Units immer eine GANZ interessante Sache.

So btt.

Die Benches kann sich OBR da hin schieben wo keine Sonne scheint....

Coda

2011-07-19, 23:30:13

Es wird aber nicht "wayne" werden. Die Transistoren verbraucht man sehr viel eher für einfach mehr Cores.

Und auch mit unendlich viel Transistoren wird sich an sinus/cosinus nicht viel ändern, weil man den kritischen Pfad dadurch nicht limitieren wird. Deshalb wird es immer in Richtung ~100 Takte brauchen, weshalb es auch keine Architektur außer x86 implementiert (es wurde sogar mit scalar SSE2 wieder abgeschafft, da ist das ganze wieder eine normale Funktion).

Och es gibt da schon manche Anwendungen, die da recht viel Gebrauch von machen.
Die wären?

S940

2011-07-20, 01:03:38

hat OBR den noch noch ein veraltetes Sample? Wenn ja, dann kann man den "test" ja in die Tonne kloppen.
Jupp, sag ich schon von Anfang an. Ein Bx Sample Test sagt was über die Leistung des Bx Samples aus, sonst nichts.
Bezeichnet war ja auch mal, als er sich wie ein Schneekönig über ein neues BIOS freute, da damit alles gut lief. Zuvor hat er aber gut herumgestänkert, dass alles total schlecht wäre ... doll ...
Find ich auch. Wenn er die Revision nicht angibt, kann er sich den Test in die Haare schmieren. Vor allem da alle vermuten dass er ein B1 oder B0 ES hat, kann ich auf seine Kommentare verzichten... Von wegen "Leistung tragisch" und "Verbrauch katastrophal" etc. Nur Stimmungsmache und Klick-Hascherei.

Ich glaube er hat(te) beide. Zuerst B0, dann B1, Zwischendurch hat er eine CPu mal verkauft und gemeint die neue ist ne bessere Revision. B1 kommt auch wg. den türkischen Screenshots hin, glaube kaum, dass er das photoshopped hat.

Knuddelbearli

2011-07-20, 01:20:54

Duke Nukem

2011-07-20, 17:05:05

Neues Fake?:smile:
http://obrovsky.blogspot.com/2011/07/this-weekend-will-be-bulldo-magical.html

Skysnake

2011-07-20, 17:05:22

Ja, zumal mir googles Translator am Ende ausgespuckt hat, dass es zwar keine Fakes seien, aber vielleicht bearbeitete Screen :ugly:

Keine Geheimnisse mehr, alles wird veröffentlicht an diesem Wochenende! Keine Fakes, aber bearbeitet Screenshots! Seien Sie bereit!

Ganz im Ernst?

Die drecks Benches kann er sich sonst wo hin schieben, als ob ihm noch jemand etwas glauben würde.....

Ronny145

2011-07-20, 17:06:49

Das übersetzt der Translator falsch. Ist aber schon bekannt.

Skysnake

2011-07-20, 17:27:59

Wie lautet dann die richtige Übersetzung? Bin in Slowakisch etc. nicht bewandert :ugly:

Btw.: Auf Englisch kommt mehr oder weniger der selbe Sinn rüber, eben dass es keine Fakes sind, die Benches aber bearbeitet sein können. Also wohl wieder so ein Witz wie mit dem SuperPI "Bench", bei dem man die wichtigste Zahl nicht gesehen hat... -.-

Ronny145

2011-07-20, 17:30:15

Hä? Den Text hat er Original in Englisch geschrieben, schon gestern zitiert wurden. Da brauchst du nichts übersetzen. (außer für Leute ohne jegliche Englischkenntnisse)

Skysnake

2011-07-20, 18:15:29

Ups ^^

Hab halt gleich google Translate genommen und es daher nicht gesehen

Tarkin

2011-07-21, 07:52:18

Neues von Chiphell (http://www.chiphell.com/thread-232657-1-1.html)

http://news.mydrivers.com/Img/20110720/S03192123.jpg

http://news.mydrivers.com/Img/20110720/03192134.jpg

http://news.mydrivers.com/Img/20110720/03192145.jpg

also wenn die Frequenzen stimmen... dürfte selbst ein Six-Core Sandybridge ES kein Problem mehr sein

OgrEGT

2011-07-21, 08:09:55

Hammer. Scheint wohl, dass C0 endlich die erhofften Frequenzen von +4GHz ermöglicht. Der 4.0GHz FX-8150P sieht fein aus :cool:

Fabian_HT4U

2011-07-21, 08:12:46

Die Daten passen leider gar nicht zu denen die donanimhaber letzte Woche veröffentlicht hat. Da sprach man beispielsweise beim 8150 von 3,6 bis 4,2 GHz was sich mit dem Screenshot von OBR deckt. Imho kann man über donanimhaber sagen was man will, aber meistens lagen sie doch richtig, daher würde ich jetzt eher mal die Werte von Chiphell als weniger glaubwürdig einstufen. Hinzu kommt, dass xbitlabs die Daten von donanimhaber bestätigt (angeblich mit eigener Quelle). Wie sagt man so schön: "Zu schön um wahr zu sein"...

grüße
Fabian

OgrEGT

2011-07-21, 08:16:33

Wie immer... Take it with a grain of salt :freak:

Ronny145

2011-07-21, 10:24:42

Das kann man in die Tonne treten, kann hinten und vorne nicht stimmen. Bestimmt wieder so ein selbst zusammengestellter Müll, das hatten wir schon oft. Die Tabelle stammt im Original ja auch nicht von chiphell, am Wasserzeichen erkennbar.

AnarchX

2011-07-21, 10:30:40

Vor allem der reduzierte L3-Cache macht keinen Sinn, wenn alle SKUs auf einem Die basieren.

Skysnake

2011-07-21, 11:34:41

mironicus

2011-07-21, 12:47:26

Hm... vielleicht sollte mir ja doch noch ein AM3+ Board holen... :D

S940

2011-07-21, 13:32:15

Warum?

Je nach dem wie der Cache angesprochen wird, funktioniert das halt nicht, wenn ein Kern futsch ist (was ich nicht glaube). Oder aber man macht dies schlicht um die Yeald-Raten zu erhöhen.

Der L3 ist ja auch in Cluster zu je 2MB aufgeteilt. Klingt also durchaus realistisch.
Nee, der L3 ist eigenständig. Natürlich könnte man trotzdem den L3 mit deaktivieren, möglich ist das. Aber das ist im Endeffekt ne Marketingentscheidung - wenn man davon ausgeht, dass der L3 wie üblich genügend Reservezellen hat, und deshalb recht selten komplett defekt ist.

Was an der Liste auch nicht stimmt ist der 6100/6110. Wieso sollte der 6100er Rev. C0 sein, und bereits in Q3 kommen? Und der "Nachfolger" im Q4, der 6110 ist dann nur B2? :freak:

Skysnake

2011-07-21, 13:43:25

Ich sag ja nicht, dass die Folie echt sein soll, ich halte die auch für nen Fake...

Aber dass der L3 bei den kleineren Modellen kleiner sein soll, ist doch schon sehr lange im Gespräch.

S940

2011-07-21, 13:53:33

Aber dass der L3 bei den kleineren Modellen kleiner sein soll, ist doch schon sehr lange im Gespräch.
Das variiert von Gerücht zu Gerücht, treffend wird die Folie gewesen sein, auf der 4-8MB stand.
Man kanns halt machen, muss es aber nicht ;-)
Nachdem die 4000er auch die alten X6 beerben sollen, gehen ich eher von den vollen 8MB aus, sonst wirds zu langsam. Yields sind wie besagt nicht das Problem.
Der letzte Satz im letzten Posting war nicht direkt an Dich gerichtet, sondern allgemein.

Skysnake

2011-07-21, 14:01:09

Naja, wie auch immer, denkbar ist alles, und wird es sicherlich als superdupermega "Spar"-Version für die OEMs auch mal zu haben sein :rolleyes:

Der_Korken

2011-07-21, 14:16:40

y33H@

2011-07-21, 14:19:16

Die OPN-Liste spricht auch nur von 8M oder kein L3.

Ronny145

2011-07-21, 22:57:54

Es gibt ein neues Video. Links unten den 19. September (November und Dezember schließe ich mal aus) könnte man theoretisch als Launch Hinweis deuten, Donanimhaber hat allerdings nochmal bekräftigt, dass die neue Roadmap Bulldozer für Oktober ausgibt. Die abgeschnittene 600 könnte für 3600 Mhz stehen, also der Basistakt vom FX-8150.

http://www.abload.de/img/september2aj6c.png
http://www.youtube.com/watch?v=uRYvfhk7xcs&feature=youtu.be&hd=1

Knuddelbearli

2011-07-21, 23:41:29

hmm heißt für mich wohl bis Frühjahr warten muss ich meine X3 halt weiter mit 15+ volllast Threads quälen

die Liste sieht an sich sehr stimmig aus, der gleichgroße L3 hat mich schon lange gestört da keinerlei L3 restverwertung stattfindet.

S940

2011-07-22, 01:46:30

95W TDP fände ich für die 2-Modul-CPUs aber irgendwie ziemlich hoch, wenn man mal den 4-Modulern vergleicht. Da muss AMD unbedingt einen nativen 2-Moduler mit max. 65W besser 45W nachlegen, um da konkurrenzfähig zu sein.
Käse. Wer 4 Stromsparthreads haben will, kann sich gefälligst nen (mobile) Llano holen. Wenns doch ein Bulldozer sein muss, dann weiß man, was man tut und kann schlecht über den Verbrauch lästern. Wer 4Ghz++ und 8MB L3 braucht, denkt nicht an den Stromverbrauch.
Abgesehen davon, Business as usual, die aktuellen X2 Phenom2 5xx sind ähnlich.
Und zuguterletzt muss man erstmal abwarten, was die Teile wirklich verbrauchen. Gut möglich, dass die teildeaktivierten Orochis durch den ganzen Stromsparfeatures ebenfalls ganz gut dastehen, und die 95W TDP eher ne theoretische Größe ist.

Skysnake

2011-07-22, 10:30:57

Ja ne hohe TDP erlaubt halt einen agressiveren Turbo.

Gauß

2011-07-22, 13:43:23

Und auch mit unendlich viel Transistoren wird sich an sinus/cosinus nicht viel ändern, weil man den kritischen Pfad dadurch nicht limitieren wird. Deshalb wird es immer in Richtung ~100 Takte brauchen,Wie kommst du auf diese Behauptung? Selbst uralt-GPUs liefern trigonometrische Funktionsergebnisse mit nur einen Taktzyklus.

weshalb es auch keine Architektur außer x86 implementiert (es wurde sogar mit scalar SSE2 wieder abgeschafft, da ist das ganze wieder eine normale Funktion).Das ist genauso Unsinn. Es wurde für SSE nie eingeführt weil es einfach kaum Anwendungen gibt wozu man trigonometrische SIMD-Operationen bräuchte.

y33H@

2011-07-22, 14:04:56

"Well, Bulldozer is the x86 core. So it's actually utilized in several different products. There's Interlagos, which is our server-based products, which will begin shipping initial production next month. Likewise, there is a desktop version called the Zambezi, which is geared more towards the desktop enthusiast market. That will also begin initial production and shipments next month."
http://www.pcgameshardware.de/aid,835233/AMD-Auslieferung-der-Bulldozer-FX-Chips-im-dritten-Quartal-2011/CPU/News/

Ronny145

2011-07-22, 14:23:31

S940

2011-07-22, 14:38:02

Das stimmt mit der älteren Folie überein. Massenproduktion im August. Intel plant so 3 Monate ein vom Start der Massenproduktion bis zum Launch. AMD wird weniger einplanen um den launch im September oder Oktober unterbringen zu können.

Können sie nicht, man braucht für die Produktion immer mind. 3 Monate, solange schippern die Wafer in der FAB durch den Reinraum.

Hintergrund der ganzen Textstelle:
Der Kollege hatte sich zuerst versprochen, hat in der Nervosität zuerst Production gesagt dann kam eine kleine Stotter/Denkpause äh äh ...and Shipment.

Würde die Productionaussage deshalb nicht auf die Goldwage legen ;-)

Ronny145

2011-07-22, 14:41:18

Können sie nicht, man braucht für die Produktion immer mind. 3 Monate, solange schippern die Wafer in der FAB durch den Reinraum.

Laut der älteren Folie können sie das schon.

Hintergrund der ganzen Textstelle:
Der Kollege hatte sich zuerst versprochen, hat in der Nervosität zuerst Production gesagt dann kam eine kleine Stotter/Denkpause äh äh ...and Shipment.

Na dann würde ich dem gar keine Bedeutung zukommen lassen.

S940

2011-07-22, 15:01:10

Laut der älteren Folie können sie das schon.
Welche?
Auf Folien stehen doch nur immer Launch Daten, keine Produktion?

Ronny145

2011-07-22, 15:05:40

Welche?
Auf Folien stehen doch nur immer Launch Daten, keine Produktion?

http://cpu.zol.com.cn/231/2310866.html

S940

2011-07-22, 15:26:04

http://cpu.zol.com.cn/231/2310866.html
Hm ok, kannte ich noch nicht;danke. Laut der Folie würde dann ja die Aussage des AMD Sprechers passen.
Ist nur die Frage, was für die "Production" bedeutet.
Möglicherweise meint das nur das Verpacken & Testen der DIEs ins AM3+ Gehäuse.
Ein Monat ist sonst wirklich zu kurz

Ronny145

2011-07-22, 15:32:15

Hm ok, kannte ich noch nicht;danke. Laut der Folie würde dann ja die Aussage des AMD Sprechers passen.
Ist nur die Frage, was für die "Production" bedeutet.
Möglicherweise meint das nur das Verpacken & Testen der DIEs ins AM3+ Gehäuse.
Ein Monat ist sonst wirklich zu kurz

Ich würde es als Start der Massenproduktion interpretieren. Hätte auch Sinn ergeben, wenn AMD gestern von Produktion next month gesprochen hätte. Erste Auslieferungen können dann kurz später erfolgen, nur dauert das seine Zeit bis genügend CPUs für einen weltweiten hard launch produziert sind.

S940

2011-07-22, 15:48:11

Ich würde es als Start der Massenproduktion interpretieren. Hätte auch Sinn ergeben, wenn AMD gestern von Produktion next month gesprochen hätte. Erste Auslieferungen können dann kurz später erfolgen, nur dauert das seine Zeit bis genügend CPUs für einen weltweiten hard launch produziert sind.
Ja, aber was wird produziert.
Meinen die inkl. Silizium DIE aus DD, oder meinen sie nur das packing ins AM3+ Gehäuse?
Nachdem AMD das Werk in DD ausgegliedert hat, und damit offiziell nichts mehr am Hut haben, sollte die Produktion bei AMD, eigentlich exklusive der Waferherstellung sein.

Ronny145

2011-07-22, 15:55:25

Ja, aber was wird produziert.
Meinen die inkl. Silizium DIE aus DD, oder meinen sie nur das packing ins AM3+ Gehäuse?
Nachdem AMD das Werk in DD ausgegliedert hat, und damit offiziell nichts mehr am Hut haben, sollte die Produktion bei AMD, eigentlich exklusive der Waferherstellung sein.

Keine Ahnung. Gibt es keine Erfahrungswerte aus früheren Launches?

darkcrawler

2011-07-22, 16:45:00

AnarchX

2011-07-23, 18:06:21

HPVD

2011-07-23, 18:51:01

35% Mehrleistung mit 33% mehr Kernen?
Und die 2% dann vielleicht auch noch erreicht mit einer höheren Frequenz?
(die 12kern Magny Cours gibts ja nur bis 12x 2.3GHz)

das ist für ne neue Generation ja nur so mittel...

dildo4u

2011-07-23, 18:59:49

DeadMeat

2011-07-23, 19:01:15

Nagut die 33% mehr Kerne wären ja nur "80%" Kerne (oder wurde das berücksichtigt?) dennoch nicht berauschend, aber wenigstens ein real wirkender Wert.

fondness

2011-07-23, 19:03:42

Aus 50% wurden 35%: http://www.brightsideofnews.com/news/2011/7/22/amd-lowers-performance-projections-for-bulldozer-opteron.aspx

HKEPC mit FX-Specs (Source : PC Manufacturers , Complied by HKEPC Hardware , July 2011): http://www.hkepc.com/6810

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=40287&stc=1&d=1311437646

Triple-Core FX 3000 für OEMs.

Damit wäre die IPC pro Thread wohl klar unter einem Phenom II, und das obwohl der L2-Cache pro Thread verdoppelt wurde. Den Rest erreicht man durch den höheren Takt. Passt aber zu den Aussagen eines AMD-Ing bei BSN der von einer Leistung nur knapp über Llano sprach.

Ronny145

2011-07-23, 19:05:39

Das ist besser als Intel's Sprung von 45 auf 32nm und damit am oberen Ende und endlich mal ein realistischer Wert.

Das wäre abzuwarten. Bis zu 35% kann alles mögliche bedeuten. Das sagt nicht viel aus. Deine Grafik zeigt Durchschnittswerte, das kanst Du schlecht mit Maximalwerten vergleichen.

AnarchX

2011-07-23, 19:06:17

Das ist besser als Intel's Sprung von 45 auf 32nm und damit am oberen Ende und endlich mal ein realistischer Wert.
Im Serverumfeld sind wohl die 50% mehr Kerne/Cache eines Gulftowns deutlicher angekommen, als im Desktop.

boxleitnerb

2011-07-23, 19:45:38

Das ist deutlich besser als Intel's Sprung von 45(Nehalem) auf 32nm(SB) und damit am oberen Ende und endlich mal ein realistischer Wert.

http://www.abload.de/img/sanda8vl2.jpg

http://www.computerbase.de/artikel/prozessoren/2011/test-intel-sandy-bridge/46/#abschnitt_performancerating

Wie kommst du darauf?
Es gibt noch keinen SB 6-Kerner, wo du das vergleichen könntest.

Edit:
Wenn du Nehalem/Lynnfield vs. Westmere meinst, musst du bedenken, dass der Parcour nicht gerade vor Multicore-Anwendungen strotzt. BD würde sich hier auch nicht so gut schlagen wie es auf der Folie steht.

Duplex

2011-07-23, 19:48:59

Wenn Sandy Bridge gegenüber Nehalem kein großes OC Potential hätte, dann würde sich kein Arsch dafür interessieren, wir wissen das SB gegenüber Nehalem im 10-15% mehr Leistung pro Takt hat, der Rest kommt durch mehr Takt.

boxleitnerb

2011-07-23, 19:52:25

Damit wäre die IPC pro Thread wohl klar unter einem Phenom II, und das obwohl der L2-Cache pro Thread verdoppelt wurde. Den Rest erreicht man durch den höheren Takt. Passt aber zu den Aussagen eines AMD-Ing bei BSN der von einer Leistung nur knapp über Llano sprach.

Wie kann das sein? Irgendso ein AMD-Fritze hat bei XtremeSystems vehement behauptet, die IPC sei höher. Glaub es war sogar John Frühe?

Duplex

2011-07-23, 19:55:05

Genau JF-AMD hat behauptet Bulldozer hat mehr IPC & Singlethread Leistung gegenüber den K10

boxleitnerb

2011-07-23, 19:56:05

Singlethread sicher...wegen dem Takt. IPC...bleibt weiter unklar.

Duplex

2011-07-23, 20:02:09

Der Vorteil bei Singlethread muss nicht umbedingt durch mehr takt kommen,

2 Threads haben je 1MB L2

Wenn das Modul mit 1 Thread eigenständig arbeiten könnte, dann hätte 1 Thread 2MB L2, größere FPU & Breiteres Frontend, also 1 Thread hätte mehr IPC als 2 Threads.

Das ist interessant, hoffen wir das BD Vers.1 bzgl. Singelthread nicht nur auf Takt angewiesen ist sondern auch das Modul Konzept ausreizen kann, aber bei AMD läuft nicht immer alles nach Plan...

Skysnake

2011-07-23, 20:48:43

Es wird wohl darauf ankommen. Wie immer halt...

Bei FP lastigen Anwendungen wird die Singlethread-Leistung wohl deutlich ansteigen. Bei Integer lastigen Sachen eventuell etwas zurückfallen. Man wird halt schauen müssen, wie die Skalierung in den jeweiligen Fällen halt ist.

S940

2011-07-23, 23:41:01

Singlethread sicher...wegen dem Takt. IPC...bleibt weiter unklar.

Mann, wie oft denn noch:

AMD Architects : IPC increases (Anand article commenting on the 2 ALUs an 16KB L1)

terrace215 post: IPC decreases, because of the 2 ALUs..
terrace215 post: IPC decreases, because of the 16KB caches
terrace215 post: IPC decreases, AMD presentation sheet no.X tells us so.
terrace215 post: IPC decreases, AMD presentation sheet no.Y confesses this.

JF-AMD posting: IPC increases!! instead of getting worse.

terrace215 post: IPC decreases, the marketing guy isn't talking about IPC
terrace215 post: IPC decreases, don't trust marketing guys.
terrace215 post: IPC decreases, Bulldozer is only optimized for server workloads.
terrace215 post: IPC decreases, AMD presentation sheet no.Y confesses this.

JF-AMD posting: IPC increases!!!! You are spreading FUD

terrace215 post: IPC decreases, AMD presentation sheet no.X tells us so.
terrace215 post: IPC decreases, The AMD architect says it decreases by 5%
terrace215 post: IPC decreases, because of the 2 ALUs..
terrace215 post: IPC decreases, AMD has given up improving IPC.

JF-AMD posting: IPC increases!!!!!!! How many times did I tell you!!!

forever{
terrace215 post: IPC decreases, because .....
terrace215 post: IPC decreases, says .... of AMD
terrace215 post: IPC decreases, according to AMD's presentation.
terrace215 post: IPC decreases, don't trust marketing guys.
terrace215 post: IPC decreases, because of the 2 ALUs..
terrace215 post: IPC decreases, the marketing guy isn't talking about IPC
terrace215 post: IPC decreases, because of the 16KB caches
terrace215 post: IPC decreases, AMD has given up improving IPC.
terrace215 post: IPC decreases, The AMD architect says it decreases by 5%
terrace215 post: IPC decreases, Bulldozer is only optimized for server workloads.
terrace215 post: IPC decreases, AMD presentation sheet no.X tells us so.
terrace215 post: IPC decreases, The more I post the more it decreases.
terrace215 post: IPC decreases, The more I post the more it decreases.
terrace215 post: IPC decreases, The more I post the more it decreases.
.....}
until (interrupt by Movieman)

http://www.xtremesystems.org/forums/showpost.php?p=4531936&postcount=667

Zu den 35%:
Die tragen den Namen BullS.News wirklich zu recht ...
AMD hat gesagt +35% bei HPC. HPC steht für High performance Computing.
Die rechnen dort hochoptimierten FP Code dass die FPUs qualmen.

Und genau das ist das Stichwort, FPU. Ein Interlagos hat 8FPUs, ein MagnyCours 12.

Wenn jetzt einer über +35%,trotz 4 FPUs weniger enttäuscht ist, dann weiß ich auch nicht mehr weiter.

Einzige Frage ist höchstens, ob das nun schon mit optimierten FMA Code ist, oder noch mit normalen, alten legacy.