Archiv verlassen und diese Seite im Standarddesign anzeigen : AMD - AMDs Bulldozer - neue CPU-Architektur für Q2 2011
Dural
2011-09-26, 09:04:26
für was "verlässliche" Benchmarks?
AMD hat den besten Benchmark ja schon verraten, nämlich der Preis ;)
setzt die Intel Preise dagegen und du weist wo die CPUs +/- liegen werden
mboeller
2011-09-26, 09:48:27
mal nebenbei.
netter test mal wieder bei CB:
wieviel CPU braucht eine GPU.
http://www.computerbase.de/artikel/grafikkarten/2011/bericht-gpu-braucht-cpu/3/#abschnitt_auf_geforce_gtx_460
Ja, witzig!
Die CPU ist beim Spielen völlig irrelevant. Ob Phenom II X4 965 [ca. 100 Euro] oder Intel Core i7-2600K [ca. 240 Euro]; die FPS liegen bei einer Auflösung von 1920 x 1080 selbst ohne AF und AA im Mittel immer im Bereich von +/- 5% [=90-100%]. Wenn man dann AF und AA benutzt liegen die CPUs noch näher beieinander.
Die +/-5% stimmen für alle Karten mit Ausnahme der Dual-GPUs GTX590 und HD6990. Nur die Ultra-Highend-GPUs brauchen also mehr CPU-Leistung. Und da verleiden die Microruckler anscheinend ja einigen den Spielspaß.
Mal sehen wie das bei der nächsten Generation aussieht. Die neuen Karten sollen ja fast so schnell sein wie bisher die Dual-GPUs.
boxleitnerb
2011-09-26, 09:52:11
Vorsicht mit solchen Pauschalaussagen. Es war jeweils nur eine Szene und es waren vorrangig Shooter dabei. Nur ein RTS war dabei, da haut es gut rein und ein Rennspiel, dafür mit integrierter Benchmarkfunktion und kein Savegame.
YfOrU
2011-09-26, 10:31:56
Der Ansatz bei CB war gut, die Ausführung ist aber höchstens mittelmäßig weil die Auswahl der Benchmarks sehr einseitig ist und zusätzlich keine einzige günstige GPU wie GTS450/6670/6750 vertreten ist. Das ist inkonsequent denn eine entsprechende CPU ist mit dem Athlon II X2 vertreten ;)
mboeller
2011-09-26, 15:12:33
Der Ansatz bei CB war gut, die Ausführung ist aber höchstens mittelmäßig weil die Auswahl der Benchmarks sehr einseitig ist und zusätzlich keine einzige günstige GPU wie GTS450/6670/6750 vertreten ist. Das ist inkonsequent denn eine entsprechende CPU ist mit dem Athlon II X2 vertreten ;)
Ich habe mit dem Ansatz von CB kein Problem. Sie haben sich auf "richtige" Gamerkarten beschränkt.
Ich denke, das jeder der auf dem PC (nicht Notebook) richtig spielen will sich min. eine GTX460 [ab 120,- Euro] od. HD6850 [ab 120,- Euro] kaufen wird bzw. gekauft hat. Kleinere Karten eignen sich dann meistens nur noch für Gelegenheitsspieler. Auch die Auflösung von 1920x1080 ist aus meiner Sicht gerechtfertigt. TFTs mit der Auflösung gibt es ja auch schon für >120,- Euro.
redfirediablo
2011-09-26, 15:28:04
Vorsicht mit solchen Pauschalaussagen... Nur ein RTS war dabei, da haut es gut rein...
SC2 ist nun wirklich nicht repräsentativ für RTS
So gut das Spiel vom Gameplay ist, so schlecht ist es gecoded. Vor allem die Kernskalierung ist miserabel für heutige Maßstäbe.
Ronny145
2011-09-26, 15:28:58
http://s7.directupload.net/images/110926/vxm289cj.jpg
http://www.techpowerup.com/152653/Vishera-and-Trinity-to-Take-Over-AMD-Processor-Lineup-in-3Q-2012.html%5DTechpowerup%5B/url%5D,%20%5Burl%20href=
Das stammt von Donanimhaber, die Folie wurde wieder entfernt warum auch immer. Vielleicht kommt das in einer späteren news nochmal. Sieht für mich schlüssig aus.
http://s7.directupload.net/images/110926/vxm289cj.jpg
http://www.techpowerup.com/152653/Vishera-and-Trinity-to-Take-Over-AMD-Processor-Lineup-in-3Q-2012.html%5DTechpowerup%5B/url%5D,%20%5Burl%20href=
Das stammt von Donanimhaber, die Folie wurde wieder entfernt warum auch immer. Vielleicht kommt das in einer späteren news nochmal. Sieht für mich schlüssig aus.
Jo, passt in den Erwartungshorizont, allerdings sieht die ziemlich basic aus, die Scherzgefahr ist eher groß ^^
Ronny145
2011-09-26, 16:34:43
Jo, passt in den Erwartungshorizont, allerdings sieht die ziemlich basic aus, die Scherzgefahr ist eher groß ^^
Immerhin gibt es einige Parallelen zu der einen Folie im Trinity Thread. Ähnliche Hintergrundfarben und Trinitys Farbe passt mit der von Comal. Donanimhaber schneidet ja leider manchmal wichtige Sachen der Folie ab. Wenn man die ungeschnittene Version hätte, könnte man das leichter einordnen. Der Typ muss sowieso ein Folien Fetischist sein btw. Hab den einmal eine Frage gestellt, da wurde der gleich gierig nach neuem Material.
Felixxz2
2011-09-26, 17:06:21
An der Folie verwundert mich aber eines: Warum soll man denn in Q2 2012 den FX-4000 UND Trinity am Markt haben? Macht doch gar keinen Sinn, denn beide haben 2 Module und 4 Kerne und sind in 32nm gefertigt, aber Trinity hat ja die klar bessere CPU-Leistung weil er Piledriver Kerne benutzt UND er hat noch eine sehr potente VLIW4/GCN GPU an Bord.
Macht für mich nicht wirklich Sinn, denn die Einordung, FX-4000 High End und Trinity Multimedia, würde dann ja garnicht mit der CPU-Leistung zusammenpassen, weil ein Trinity ja auch von der reinen CPU her schneller wär obwohl eben in der niedrigeren Leistungsklasse.
Zusammen mit dem schlichten Design schaut das für mich eher nach Fake aus.
Konami
2011-09-26, 17:08:35
An der Folie verwundert mich aber eines: Warum soll man denn in Q2 2012 den FX-4000 UND Trinity am Markt haben? Macht doch gar keinen Sinn, denn beide haben 2 Module und 4 Kerne und sind in 32nm gefertigt, aber Trinity hat ja die klar bessere CPU-Leistung weil er Piledriver Kerne benutzt UND er hat noch eine sehr potente VLIW4/GCN GPU an Bord.
Macht für mich nicht wirklich Sinn, denn die Einordung, FX-4000 High End und Trinity Multimedia, würde dann ja garnicht mit der CPU-Leistung zusammenpassen, weil ein Trinity ja auch von der reinen CPU her schneller wär obwohl eben in der niedrigeren Leistungsklasse.
Zusammen mit dem schlichten Design schaut das für mich eher nach Fake aus.
Das sind zwei grundverschiedene Sockel.
deekey777
2011-09-26, 17:09:54
FX-4000 ist eine teildeaktivierte CPU mit freiem Multi, wenn man den Folien trauen darf.
Ronny145
2011-09-26, 17:11:24
An der Folie verwundert mich aber eines: Warum soll man denn in Q2 2012 den FX-4000 UND Trinity am Markt haben? Macht doch gar keinen Sinn, denn beide haben 2 Module und 4 Kerne und sind in 32nm gefertigt, aber Trinity hat ja die klar bessere CPU-Leistung weil er Piledriver Kerne benutzt UND er hat noch eine sehr potente VLIW4/GCN GPU an Bord.
Macht für mich nicht wirklich Sinn, denn die Einordung, FX-4000 High End und Trinity Multimedia, würde dann ja garnicht mit der CPU-Leistung zusammenpassen, weil ein Trinity ja auch von der reinen CPU her schneller wär obwohl eben in der niedrigeren Leistungsklasse.
Zusammen mit dem schlichten Design schaut das für mich eher nach Fake aus.
Wenn der FX-4000 weniger kostet, warum nicht? 2 Moduler sind schon die ganze Zeit geplant gewesen. Muss natürlich AMD entscheiden ob sich das lohnt oder nicht. Noch wissen wir auch gar nicht wie stark sich Piledriver abhebt. Zumal der FX4000 ohne GPU möglicherweise deutlich höher taktet als Trinity mit seiner GPU. Das bleibt abzuwarten. Verschiedene Plattformen außerdem.
Ronny145
2011-09-26, 17:35:09
http://obrovsky.blogspot.com/2011/09/amd-fx-power-consumption.html
Verbrauchsmessung mit Retail Chip angeblich. Hätte ich schlimmer befürchtet. Zwar nicht ganz SB Niveau, aber immerhin deutlich besser als AMDs 45nm Chips. (wenn das kein Fake ist)
Undertaker
2011-09-26, 17:40:08
Sollte das stimmen, wär das eine äußerst positive Überraschung - mit solchen Werten hab ich nicht gerechnet. Da könnte man glatt wieder spekulieren, warum dann nicht noch höhere Taktraten? Bzw. hätten 95W TDP nicht fast gereicht? Möglich natürlich, dass der Cinebench Bulldozer nicht wirklich gut auslastet, oder aber der Turbo war inaktiv(?). Sieht aber auf jeden Fall mal recht gut aus. :)
Twodee
2011-09-26, 17:45:22
Sollte das stimmen, wär das eine äußerst positive Überraschung - mit solchen Werten hab ich nicht gerechnet. Da könnte man glatt wieder spekulieren, warum dann nicht noch höhere Taktraten? Bzw. hätten 95W TDP nicht fast gereicht? Möglich natürlich, dass der Cinebench Bulldozer nicht wirklich gut auslastet, oder aber der Turbo war inaktiv(?). Sieht aber auf jeden Fall mal recht gut aus. :)
Hat er da Idle mit Load verwechselt?
Die Sandy-Werte erscheinen mir viel zu hoch. IdR. liegen die bei 60/160 [z.B. bei HT4U] (Bei mir 55/130Watt).
boxleitnerb
2011-09-26, 17:48:47
Was soll dann der andere Wert sein? Es ist außerdem schon realistisch, dass ein 2600K mehr verbraucht als ein 2500K - genau das, was die Folien zeigen. Wer weiß, was für Grafikkarten (oder wieviele) er drin hatte.
fondness
2011-09-26, 17:49:36
Sollte das stimmen, wär das eine äußerst positive Überraschung - mit solchen Werten hab ich nicht gerechnet. Da könnte man glatt wieder spekulieren, warum dann nicht noch höhere Taktraten?
Mehr als 4,2Ghz scheint mit der aktuellen Revision nicht drin zu sein, selbst der FX-4xxx taktet maximal damit und bekommt dann nur noch einen 100Mhz Turbo. Vielleicht erlauben zukünftige Revisionen oder ein fortgeschrittener 32nm Prozess deutlich mehr Takt. Wenn die Werte stimmen scheint zumindest bei der Leistungsaufnahmen noch Luft zu sein.
Twodee
2011-09-26, 17:49:57
@boxleitnerb
Einmal Idle, und der andere Load mit CB11.5
Ronny145
2011-09-26, 17:52:27
Die anderen Werte sind von hier: http://pctuning.tyden.cz/hardware/procesory-pameti/21085-mame-novou-metodiku-test-prvnich-7-procesoru?start=10
Die verwendete GTX 480 ist nicht die sparsamte GPU. Das MSI Big Bang kein sparsames Board.
boxleitnerb
2011-09-26, 17:54:17
@boxleitnerb
Einmal Idle, und der ander Load mit CB11.5
Ja ich weiß. Ich sagte das nur weil gesagt wurde, die Werte wurden möglicherweise verwechselt.
Twodee
2011-09-26, 17:55:22
Ja load mit Idle, schau doch mal auf die Legende bzw. Farbe.
boxleitnerb
2011-09-26, 17:59:02
Achso das. Naja, die Farbe hat mich nicht interessiert, es ist ja klar, was was ist ;)
An der Folie verwundert mich aber eines: Warum soll man denn in Q2 2012 den FX-4000 UND Trinity am Markt haben? Macht doch gar keinen Sinn, denn beide haben 2 Module und 4 Kerne und sind in 32nm gefertigt, aber Trinity hat ja die klar bessere CPU-Leistung weil er Piledriver Kerne benutzt UND er hat noch eine sehr potente VLIW4/GCN GPU an Bord.
Macht für mich nicht wirklich Sinn, denn die Einordung, FX-4000 High End und Trinity Multimedia, würde dann ja garnicht mit der CPU-Leistung zusammenpassen, weil ein Trinity ja auch von der reinen CPU her schneller wär obwohl eben in der niedrigeren Leistungsklasse.
Ist doch nichts Neues, die DIEs sind einfach da, Abfallprodukt von den 8Kernern. Was sollen sie sonst damit machen, wegwerfen?
War bisher doch auch schon so, trotz dualcore X2, gabs auch nen Phenom2 5xx mit 2 abgeschalteten Kernen, und das Propus DIE mit 4 Kernen, zeitgleich mit den Quad Phenom2.
Die Kerne/Threads mögen ähnlich sein, aber Cache und Taktfrequenz sind es nicht. Einen 4 GHz Trinity wirds sicher nicht geben ;)
http://obrovsky.blogspot.com/2011/09/amd-fx-power-consumption.html
Verbrauchsmessung mit Retail Chip angeblich. Hätte ich schlimmer befürchtet. Zwar nicht ganz SB Niveau, aber immerhin deutlich besser als AMDs 45nm Chips. (wenn das kein Fake ist)
Hübsch, das läßt doch auf gute OC Resultate hoffen, zumindest sollten die Spannungswandler kein Primärproblem werden :biggrin:
Wobei Cinebench wohl nicht am Anschlag läuft.
Gipsel
2011-09-26, 18:25:06
Trinity hat ja die klar bessere CPU-Leistung weil er Piledriver Kerne benutzt UND er hat noch eine sehr potente VLIW4/GCN GPU an Bord.VLIW4, nicht GCN. Das kommt erst beim Nachfolger.
Die Kerne/Threads mögen ähnlich sein, aber Cache und Taktfrequenz sind es nicht. Einen 4 GHz Trinity wirds sicher nicht geben ;)Also wetten würde ich darauf nicht. ;)
Thunder99
2011-09-26, 18:30:31
Wieso verlinkt ihr noch Ergebnisse von diesem Fake-Typ? Habt ihr euch denn Blog von Leo net gelesen? :nono::deal:
Zu FX4xxx und Trinity wird der direkte Vergleich interessant ob die "neuen" Kerne wirklich besser sind und dann wie viel.
Bin da auch der Meinung, dass das Bulldozer Design noch sehr viel Potential hat und einiges leisten kann wenn die Umgebung angepasst wird (siehe Anpassungen an Intels Architektur)
boxleitnerb
2011-09-26, 18:40:52
Weil es sonst kaum was gibt. Wenn es dich nicht interessiert, überlese es doch einfach. Ich finde es vermessen, anderen vorschreiben zu wollen, was sie posten dürfen und was nicht. Ist immer noch ein freies Forum und jeder Leser hat (hoffentlich) einen Verstand, den er zur ganz persönlichen Analyse von Ergebnissen einschalten kann.
Wenn das Verkaufs-Stepping wirklich D1 ist, dann halte ich die Folien inzwischen auch nicht mehr für unbedingt glaubwürdig.
Also wetten würde ich darauf nicht. ;)
Stimmt, der Turbo kann ja schon bei den neueren Zacates die GPU abschalten, müßte Trinity dann eigentlich auch können. Daran hab ich nicht gedacht. In dem Fall stünden 4GHz dann nichts im Wege ;-)
Wenn das Verkaufs-Stepping wirklich D1 ist, dann halte ich die Folien inzwischen auch nicht mehr für unbedingt glaubwürdig.Traust Du wirklich einer obskuren Chinaseite, auf der die Interlgos 16Core Chips 16x 512kB L2, 16x64kB L1D und 16x64kb L1I haben, mehr, als ner 30 seitigen Präsentation? Da sind 3 Fehler bei den 3 Cacheangaben, das ist ganz klar und deutlich copy/paste von nem Magny Cours, nur die Kernanzahl haben sie ausgebessert.
Ronny145
2011-09-26, 19:08:05
Wenn das Verkaufs-Stepping wirklich D1 ist, dann halte ich die Folien inzwischen auch nicht mehr für unbedingt glaubwürdig.
B2 ist gesichert von genügend Quellen.
Hätte im Falle eines Fakes längst einen großen Aufschrei gegeben. Gibt genügend Redakteure und Mitwisser davon, das wäre längst bekannt.
Thunder99
2011-09-26, 19:28:24
Weil es sonst kaum was gibt. Wenn es dich nicht interessiert, überlese es doch einfach. Ich finde es vermessen, anderen vorschreiben zu wollen, was sie posten dürfen und was nicht. Ist immer noch ein freies Forum und jeder Leser hat (hoffentlich) einen Verstand, den er zur ganz persönlichen Analyse von Ergebnissen einschalten kann.
Das mit Sicherheit :) . Ich möchte damit nur aufmerksam machen, dass man so was nicht unterstützen sollte.
@Toppic:
Hat nicht AMD bei dem "MagnyCoar" auch eine neue Rev. angegeben im Vergleich zu "Istanbul" :confused: ?
Knuddelbearli
2011-09-26, 19:33:37
Weil es sonst kaum was gibt. Wenn es dich nicht interessiert, überlese es doch einfach. Ich finde es vermessen, anderen vorschreiben zu wollen, was sie posten dürfen und was nicht. Ist immer noch ein freies Forum und jeder Leser hat (hoffentlich) einen Verstand, den er zur ganz persönlichen Analyse von Ergebnissen einschalten kann.
macht einen screen und postet ihn hier wenn es was neues von obr gibt
boxleitnerb
2011-09-26, 19:56:00
Jetzt seid mal net so zimperlich, meine Güte :)
HMm, PCGH bestätigt die Echtheit der DH Folien mehr oder weniger:
Dass AMD den Bulldozer-FX Mitte Oktober starten wird, dürfte mittlerweile kein Geheimnis mehr sein. Die Webseite Donanim Haber hat am Wochenende passend dazu wieder einmal diverse AMD-Folien zu Bulldozer veröffentlicht, die die Benchmark-Performance und Preisgestaltung näher zeigen. Aufgrund eines unterschriebenen NDA werden wir diese aber nicht zeigen und nur den Inhalt kurz schriftlich in den wichtigsten Punkten wiedergeben.
http://www.pcgameshardware.de/aid,846680/Bulldozer-AMD-Folien-zeigen-Benchmark-Performance-und-Preisgestaltung-News-des-Tages/CPU/News/
Wobei ich mich frage, ob sich das NDA wirklich nur auf die Folien und nicht auch auf den Inhalt bezieht ^^
Ronny145
2011-09-26, 21:18:03
Update CPU code, support AM3 + B2-F / B2-G stepping CPU
http://www.biostar.cn/app/en-us/t-series/bios.php?S_ID=554
AGESA V1.1.0.0
Eigentlich nicht besonders erwähnenswert. Für die Zweifler eventuell.
anddill
2011-09-26, 21:54:26
Interessant ist hier evtl. die Information, dass es B2-A bis B2-G Steppings gibt (erwähnt die c´t auch). Und wir wissen ja nicht, mit welcher Variante die bisherigen Benchmarks gemacht wurden.
TB1333
2011-09-26, 21:55:48
Wobei ich mich frage, ob sich das NDA wirklich nur auf die Folien und nicht auch auf den Inhalt bezieht ^^
Wenn der Inhalt erläutert werden dürfte, fände ich das NDA doch eher sinnbefreit :freak:
Felixxz2
2011-09-26, 22:30:08
Begrabt doch mal eure Hoffnungen und Theorien zu den Steppings. AMD hat die Werte doch selber bestätigt. In den Slides zum Launch wird ein CB 11.5 Score von 5.95 genannt und das deckt sich doch mit den Werten der Leaks. Die Benches aus der Fusion Zone, auch offiz. von AMD, waren auch nicht so dolle.
Also nehmt es so wies ist und hofft auf BD2. BD1 ist wirklich so schlecht.
Knuddelbearli
2011-09-26, 22:55:18
na falls die Gerüchte wirklich stimmen kann ja C0 schon gut abhilfe schaffen
ma gucken ich habe mir jetzt eh nen 2600K gekauft der die 5 Ghz packt ^^
ma gucken was ich mit meinem AM3 Board anstell
Lawmachine79
2011-09-27, 10:18:47
Au weh...nachdem ich hier mal die letzten Seiten gelesen habe, habe ich mich innerlich drauf eingestellt, auf Intel wechseln zu müssen. Wer nach dem 12.10. für 160€ die beste Gameperformance bietet - incl. Overclocking - der wird es. Und ich tippe, das wird ein 2500k sein.
Au weh...nachdem ich hier mal die letzten Seiten gelesen habe, habe ich mich innerlich drauf eingestellt, auf Intel wechseln zu müssen. Wer nach dem 12.10. für 160€ die beste Gameperformance bietet - incl. Overclocking - der wird es. Und ich tippe, das wird ein 2500k sein.
Stark anzunehmen, einzige offene Frage sind die nagelneuesten Spiele, die 8 Threads nutzen können. Soviele gibts da aber bekanntermaßen auch noch nicht, Anno und BF2/3, der Rest sind irgendwie Konsolenports mit ca. 6 Treads. (Falls ich was vergessen haben sollte, bitte hinzufügen ;-)
Naja, egal, warten wir mal die Tests ab und was es da für 160 Euro gibt ^^
Wenn man die etail Preise von AMDs Folien mit den newegg Preisen vergleicht, gibts zum 2500K Preis nen FX-8120.
Twodee
2011-09-27, 11:41:33
Au weh...nachdem ich hier mal die letzten Seiten gelesen habe, habe ich mich innerlich drauf eingestellt, auf Intel wechseln zu müssen. Wer nach dem 12.10. für 160€ die beste Gameperformance bietet - incl. Overclocking - der wird es. Und ich tippe, das wird ein 2500k sein.
Und letzteres gibt es schon seit 9 Monaten zu Kaufen.
Ein jammer wer so lange umsonst gewartet hat :biggrin:
Und letzteres gibt es schon seit 9 Monaten zu Kaufen.
Ein jammer wer so lange umsonst gewartet hat :biggrin:
Kann man (bei Spielen) echt so sehen, vermutlich wirds nichtmal nen Preisnachlass bei intel geben :freak:
Bei Rechenapps hab ich noch die Hoffnung, dass irgendwie dann doch was von 8 Threads Vorsprung übrig bleibt, zumindest gegen den 2500K.
Duplex
2011-09-27, 11:50:52
Der X6-1055T hatte gegenüber den i5-750/760 auch ein etwas günstigeres Preis, ca. 20 € Unterschied, aber die Lynnfield CPUs wurden wegen Games / 4 Threads fast immer vorgezogen, ich denke es wird diesmal nicht anders sein.
Wenn die IPC bei Bulldozer höher ausgefallen wäre, z.b. Nehalem IPC, dann wären 4 Kerne mit 4,2Ghz sehr gut geworden, aber leider hat AMD bzgl. IPC diesmal verschissen...kann mich noch errinern das einige vorher von Nehalem IPC + Turbo geträumt haben...Ist immer noch die Frage warum die IPC nur auf Bobcat Niveau ist?
MiamiNice
2011-09-27, 11:57:40
Ist den jetzt endgültig klar das BD eher ein pushcart den ein bulldozer wird?
Iht hört euch schon ziemlich endgültig an aber ich habe bisher nur Benches mit angezogender Bremse gesehen.
Ronny145
2011-09-27, 12:02:47
Ist den jetzt endgültig klar das BD eher ein pushcart den ein bulldozer wird?
Iht hört euch schon ziemlich endgültig an aber ich habe bisher nur Benches mit angezogender Bremse gesehen.
Die Indizienlage spricht sehr stark dafür. Es gibt sicher ein paar Anwendungen wo Bulldozer sehr gut auftrumpfen kann (winrar, truecrypt oder 7zip). Problem scheint die schwache IPC zu sein. Damit hat vor ein paar Monaten niemand gerechnet.
Twodee
2011-09-27, 12:04:09
Kann man (bei Spielen) echt so sehen, vermutlich wirds nichtmal nen Preisnachlass bei intel geben :freak:
Bei Rechenapps hab ich noch die Hoffnung, dass irgendwie dann doch was von 8 Threads Vorsprung übrig bleibt, zumindest gegen den 2500K.
Ich erwarte mit sehr großer Wahrscheinlichkeit das in Anwendungen >4 Threads BD den 2500K locker schlagen wird. Wenn auch nur knapp.
Was mich noch interessieren würde, ist der Vergleich mit CF und den +40% von BD. Und ob es mit NV SLI auch 40% sind....
boxleitnerb
2011-09-27, 12:11:31
Diese 40% glaube ich keinen Meter, nicht im Durchschnitt. Das wird irgendwas mit absichtlich herbeigeführter PCIe-Limitierung gewesen sein.
BD wird an Bobcat relativ nah dran sein, was die Integer-Cores angeht. Eigentlich ist der Weg doch auch sehr verständlich? Man opfert die Integer-Standard-Leistung zugunsten der neuen Befehlssätze. Rendering, Videobearbeitung usw deckt man ja eigentlich mit AVX und FMA4(3) ab, Spiele brauchen eh keine hohe IPC und Datenbanken genausowenig. Einzig die Standardanwendung, die aber eh schnell genug läuft profitieren von einer höheren Integer-IPC und natürlich alle Anwendungen, die nicht für AVX oder SSE4 optimiert sind, was aber weniger werden wird. Man kann dem BD so sicherlich eine Integer-Schwäche attestieren und die FPU muss richtig optimiert sein. Ergo sind die Ergebnisse wenig überraschend. AMD muss jetzt vor allem eines tun: Möglichst Überall AVX forcieren, wo Rechenleistung wirklich gefragt ist.
Mal sehen, wie sich BD im Gesamtpaket schlägt, das wissen wir ja bisher noch nicht. Wenn er bei Spielen mitreden kann, weil Caches und I/O gut mitspielen, siehts doch eigentlich ganz gut aus. Gibts hingegen ausgerechnet im Cache-Bereich noch Probleme, siehts düster aus bei Spielen.
MMn wird auch Piledriver und Steamroller nichts an der Integer-"Misere" ändern. Die Integer-Cores werden genauso aufgebaut sein, was das angeht, aber man wird Änderungen im FPU-Bereich mitbringen (allein schon wegen FMA3) und vielleicht noch Probleme mit dem Cachesystem beseitigen, falls sich das bestätigt.
LovesuckZ
2011-09-27, 12:29:38
Auch Spiele brauchen eine hohe IPC. Es ist wesentlich aufwendiger Spiele multithreadfähig zu machen als bestimmte Anwendungen. Und die Bereiche, die von mehreren Kernen profitieren, werden in Zukunft sowieso auf die bzw. eine GPU-Karte ausgelagert: Effektphysik und KI (Schwarmverhalten) als Beispiele.
fondness
2011-09-27, 12:40:29
BD wird an Bobcat relativ nah dran sein, was die Integer-Cores angeht. Eigentlich ist der Weg doch auch sehr verständlich?
Achja? Für hoch parallelisierbare Aufgaben werden in naher Zukunft spezielle Streamprozessoren zu Verfügung stehen. Ein CPU-Core muss vor allem möglichst schnell bei seriellen Aufgaben arbeiten, die Integerleistung ist nach wie vor das A und O einer CPU. Ich kann mir bei besten Willen nicht vorstellen das Bulldozer ursprünglich so geplant war. Never.
Ich erwarte mit sehr großer Wahrscheinlichkeit das in Anwendungen >4 Threads BD den 2500K locker schlagen wird. Wenn auch nur knapp.
Was mich noch interessieren würde, ist der Vergleich mit CF und den +40% von BD. Und ob es mit NV SLI auch 40% sind....
Hast Du den Link von Dr@ im P3D gesehen? Ich verlink ihn mal unten nochmal für boxleitnerb.
Ist den jetzt endgültig klar das BD eher ein pushcart den ein bulldozer wird?
Iht hört euch schon ziemlich endgültig an aber ich habe bisher nur Benches mit angezogender Bremse gesehen.
Sieht so aus, als letzter Rettungsanker fungiert noch ein noch nicht vorhandene Windows Patch, der könnte noch für ein paar Prozent Plus sorgen. Aber mehr als 5% ganz sicher nicht.
Die Indizienlage spricht sehr stark dafür. Es gibt sicher ein paar Anwendungen wo Bulldozer sehr gut auftrumpfen kann (winrar, truecrypt oder 7zip). Problem scheint die schwache IPC zu sein. Damit hat vor ein paar Monaten niemand gerechnet.
Jo ist echt ein bisschen langsam, mann muss sich bei 4 Threads dann auf den Turbo verlassen. Solange man nen 2500K nicht übertaktet, hilft das vielleicht sogar, aber wer kauft sich nen "K" und übertaktet dann nicht :freak:
Naja, vielleicht wenigstens was für die Review Seiten die nur @stock benchen.
Diese 40% glaube ich keinen Meter, nicht im Durchschnitt. Das wird irgendwas mit absichtlich herbeigeführter PCIe-Limitierung gewesen sein.
Wie oben schon gesagt, Dr@ hatte da mal nen Link parat:
http://hardocp.com/article/2011/04/28/nvidia_geforce_3way_sli_radeon_trifire_review/
http://hardocp.com/article/2011/05/03/nvidia_3way_sli_amd_trifire_redux/
Die tauschten nen 3,6G Nehalem gegen nen 4,8G Sandy und waren überrascht, dass es da doch ein CPU Limit gab.
Von daher könnte es bei "nur" nem 2500K schon auch ein CPU Limit sein. Allerdings glaub ich auch auf nen großen Anteil an die PCIe Bremse. Vielleicht so halbe/halbe, 20% vom PCIe, 20% vom CPU/Threadnachteil.
Möglicherweise wäre BD immerhin dann ne gute Nische für Crossfire & SLi Fanatiker, 990FX sei dank ;-)
Komsicherweise maßen sie die größten Unterschiede aber beim SLi Setup, also mit nVidia Karten, das Ati Setup hatte nur so ~10%. Aber vielleicht hängen die Atis stärker am PCIe. Der Test dort war mit nf200 Zusatzchip.
Ich kann mir bei besten Willen nicht vorstellen das Bulldozer ursprünglich so geplant war. Never.
Doch, BD2 und BD3 sitzen ja schon in den Startlöchern, BD2 kommt sogar noch im gleichen Herstellungsprozess, das war von langer Hand geplant. Da wurde BD1 sicherlich um irgendwas abgespeckt, mit dem man sich anfangs nicht herumschlagen wollte. Ist eh schon so schlimm genug ne FlexFPU mit SSE41,2 AES, AVX,XOP zu debuggen ^^
Dann noch ein paar Bugs dazu (zB der, der bei Linux beschrieben wird, mit dem gemeinsamen L1I$) und schon hat man Bobcat IPC.
Auch Spiele brauchen eine hohe IPC. Es ist wesentlich aufwendiger Spiele multithreadfähig zu machen als bestimmte Anwendungen. Und die Bereiche, die von mehreren Kernen profitieren, werden in Zukunft sowieso auf die bzw. eine GPU-Karte ausgelagert: Effektphysik und KI (Schwarmverhalten) als Beispiele.
Naja, Anno und die Frostbite Engine scheinen das schon ganz gut hinzubekommen, das wird in Zukunft eher mehr bzw. besser.
ciao
Alex
boxleitnerb
2011-09-27, 13:08:49
Danke für die Links. Glaubst du aber wirklich, dass die getesteten Anwendungen von besagter Folie threadlimitiert sind? F1 2010 und Dirt 3 ok, aber der Rest? Unigine gleich 40%? Oder AvP. Ich kenne keinen Benchmark davon, der einen X6 bedeutend vor einem X4 sieht.
LovesuckZ
2011-09-27, 13:13:00
Naja, Anno und die Frostbite Engine scheinen das schon ganz gut hinzubekommen, das wird in Zukunft eher mehr bzw. besser.
ciao
Alex
Und andere Spiele kommen gut mit 2-4 Threads aus. Anwendungen sollten nicht Threadspamming betreiben, um diese "Multithread"-Sache als Marketing zu missbrauchen.
Danke für die Links. Glaubst du aber wirklich, dass die getesteten Anwendungen von besagter Folie threadlimitiert sind? F1 2010 und Dirt 3 ok, aber der Rest? Unigine gleich 40%? Oder AvP. Ich kenne keinen Benchmark davon, der einen X6 bedeutend vor einem X4 sieht.
Hab keinen Schimmer was Unigine da genau treibt, aber wieso nicht?
Eventuell ist ein GraKa-Treiberproblem, wenn der wg. des ganzen SLi/CFs mehr Last (Threads) verursacht, wäre die App dahinter ziemlich egal, da das Problem vorher entstünde.
Und andere Spiele kommen gut mit 2-4 Threads aus. Anwendungen sollten nicht Threadspamming betreiben, um diese "Multithread"-Sache als Marketing zu missbrauchen.
Früher gabs auch 1 Thread Spiele, wen interessiert das jetzt noch?
Jetzt ist halt gerade Übergangszeit, da sind 2-4 Threads noch interessant, aber BD ist ne nagelneue Architektur, die muss die nächsten 10 Jahre halten. Vo daher passt das schon. Immerhin gibts nen extra-Turbo für 4 Threads, wenn da mal das OS keinen Strich durch die Rechnung macht.
Von "Spamming würde ich auch nicht reden. Solange man nen Nutzen davon hat ist es sinnvoll. Wenn AMD dann nur mit sowas wirbt, ist es selbstverständlich Schokoseitenmarketing, aber das ist AMDs Problem, nicht das der Spieleprogrammierer. Die halten sich vielmehr an die Aussagen der CPU Hersteller, und da heißt es immer: Mehr Kerne, mehr Kerne. Also die wären schön blöde, wenn sie sich nicht was basteln würden, um die Kerne auch auszunutzen.
Danke für die Links. Glaubst du aber wirklich, dass die getesteten Anwendungen von besagter Folie threadlimitiert sind? F1 2010 und Dirt 3 ok, aber der Rest? Unigine gleich 40%? Oder AvP. Ich kenne keinen Benchmark davon, der einen X6 bedeutend vor einem X4 sieht.
Da bei den Links von S940 die Nvidiakarten besser skalieren, hab ich da deren Treiber in Verdacht, allerdings kann ich mir 40% Vorteil nicht wirklich vorstellen. (außer wegen Bugs)
Duplex
2011-09-27, 14:10:09
Ich glaube nicht das AMD den BD so geplant hat
BD hat weniger IPC & weniger Singlethread Leistung als K8 2003!
Sandy Bridge wird ca. 60% mehr IPC als Bulldozer haben und der nächste Tock wird wieder etwas drauflegen, schätze zwischen 10-20%.
8 Stars Kerne von Llano mit 8x1MB L2, 8MB L3 Cache, Turbo 2.0 & SSE4.1/4.2 in 32nm wäre sinnvoller gewesen.
8 Stars Kerne in 32nm hätte ich dann als Phenom3-XP oder so vermarktet.
Auch wenn dann AVX fehlen würde, das ist garnicht so wichtig, hätte man ja für einen Phenom4 im Jahr 2012 nachschieben können...
Erstmal muss das produkt mit lange balken gegenüber der Konkurrenz überzeugen, Instructionen kann ich dann immer noch mit einem Refresh / Tick nachschieben... Nehalem > Westmere "AES"
LovesuckZ
2011-09-27, 14:14:59
Früher gabs auch 1 Thread Spiele, wen interessiert das jetzt noch?
Und bietet genauso "viel" wie heutige Spiele. Vergleich dochmal die Spielmechanik von Quake 3 und Bad Company 2. Ist alles gleich geblieben, aber das eine Spiel läuft perfekt auf einem Single-Core, beim anderen benötigt man wohl schon einen QuadCore.
Jetzt ist halt gerade Übergangszeit, da sind 2-4 Threads noch interessant, aber BD ist ne nagelneue Architektur, die muss die nächsten 10 Jahre halten. Vo daher passt das schon. Immerhin gibts nen extra-Turbo für 4 Threads, wenn da mal das OS keinen Strich durch die Rechnung macht.
AMD promotet auch GPGPU. Viele Aufgaben in Spielen, die von mehreren Kernen profitieren, lassen sich locker auf die GPU auslagern. Alle anderen Aufgaben sind so kritisich, dass man sicherstellt, dass ein Großteil des Marktes nicht Probleme bekommt. Deswegen ist eine bessere Kernleistung für Spiele wesentlich sinnvoller.
Von "Spamming würde ich auch nicht reden. Solange man nen Nutzen davon hat ist es sinnvoll.
Vieles ging zurück auf die CPU (z.B. Soundberechnungen). Jedoch zeigt der ARM-Markt, dass dedizierte Lösungen wesentlich sinnvoller sind. Der Nutzen von Mehrkern-CPUs für Spiele wird daher deutlich überschätzt.
Nakai
2011-09-27, 14:21:56
Vieles ging zurück auf die CPU (z.B. Soundberechnungen). Jedoch zeigt der ARM-Markt, dass dedizierte Lösungen wesentlich sinnvoller sind. Der Nutzen von Mehrkern-CPUs für Spiele wird daher deutlich überschätzt.
Natürlich, da dedizierte Lösungen immer weniger Strom verbrauchen als Softwarelösungen. Soundberechnungen zum Beispiel, sind eben nicht sonderlich aufwändig(im Vergleich zu anderen Sachen), weswegen man zur Softwarelösung überging(eben auch weil eine akzeptabele Qualität schnell erreichbar ist).
boxleitnerb
2011-09-27, 14:24:10
Na dann zerschieß mal in Quake 3 irgendwelche Gebäude. Ganz so platt würde ich es nicht sehen. Während GPUs für manche Dinge gut geeignet sind, finde ich es nicht gut, hier Ressourcen zu "verschwenden" während dann Leistung für (SS)AA, Downsampling usw. fehlt - und 3 von 6/8 Threads nichts zu tun haben. Für Physik/KI und (SS)AA haben aktuelle Grafiklösungen idR nicht genug Performance. Da Dinge auf der CPU lassen, wo dies performancetechnisch Sinn macht, finde ich nicht grundverkehrt.
robbitop
2011-09-27, 14:27:47
BD war garantiert nicht mit geringerer IPC als K10 geplant. Falls es sich als solches erweisen sollte, hat das eher ungewollte Ursachen.
Mit IPC meine ich hier Singlethread IPC. Also 1 K10 oder SB Kern ggü 1x BD Modul.
Und bietet genauso "viel" wie heutige Spiele. Vergleich dochmal die Spielmechanik von Quake 3 und Bad Company 2. Ist alles gleich geblieben, aber das eine Spiel läuft perfekt auf einem Single-Core, beim anderen benötigt man wohl schon einen QuadCore.
Dat kan ick och: Vergleich mal Anno 1503 mit 1404 :D
@robbitop:
Welchen BD meinst Du? Bd1,2 oder 3? ;-)
LovesuckZ
2011-09-27, 14:31:26
Na dann zerschieß mal in Quake 3 irgendwelche Gebäude.
Das Gebäudezerschießen in BC2 ist ein Triggersystem, das aktiviert wird, wenn entsprechende Kollisionen entstehen. Kollisionsabfrage gibt es auch in Quake 3 - sogar mit Splashdamage und, ich glaube, Hitpointverlust durch Fall von einer entsprechenden Höhe. In Red Faction 1 konntest du auch Gebäude zerschießen und das Spiel läuft ebenfalls auf einem Single-Core Prozessor ohne Probleme.
Da mit iGPUs und immer mehr weiteren PCIe-Slots mehr Möglichkeiten von weiteren Prozessoren gegeben ist, kann man sehr einfach eine zweite Karte dazustecken bzw. die iGPU verwenden.
boxleitnerb
2011-09-27, 14:42:26
Das Gebäudezerschießen in BC2 ist ein Triggersystem, das aktiviert wird, wenn entsprechende Kollisionen entstehen. Kollisionsabfrage gibt es auch in Quake 3 - sogar mit Splashdamage und, ich glaube, Hitpointverlust durch Fall von einer entsprechenden Höhe. In Red Faction 1 konntest du auch Gebäude zerschießen und das Spiel läuft ebenfalls auf einem Single-Core Prozessor ohne Probleme.
Da mit iGPUs und immer mehr weiteren PCIe-Slots mehr Möglichkeiten von weiteren Prozessoren gegeben ist, kann man sehr einfach eine zweite Karte dazustecken bzw. die iGPU verwenden.
Du willst jetzt nicht das Schadensmodell von BC2 mit den vielen Partikeln mit der rudimentären Geomod-Engine aus RF1 vergleichen? Das hab ich damals auch gespielt, und während es ein neues und spannendes Feature war, gibt es kaum irgendwelche Partikel. BC2 ist da wesentlich ansehnlicher und realistischer - das kostet Rechenleistung.
Ich würde eher solche Sachen auslagern, die richtige Performancekiller sind. Gas- und Fluidsimulation mit Hunderttausenden Partikeln. Das packt imo keine CPU. Aber so "Kleinkram" schon.
Auch Spiele brauchen eine hohe IPC. Es ist wesentlich aufwendiger Spiele multithreadfähig zu machen als bestimmte Anwendungen. Und die Bereiche, die von mehreren Kernen profitieren, werden in Zukunft sowieso auf die bzw. eine GPU-Karte ausgelagert: Effektphysik und KI (Schwarmverhalten) als Beispiele.
Wo brauchen Spiele ne hohe IPC? Was Spiele vor allem machen sind ne Menge Daten verwalten und herumzuschieben. Grade bei Multithreading ist doch die Synchonisation der Threads das große Problem, da spielt IPC noch ne geringere Rolle. Spiele und IPC passen einfach nicht zusammen.
Das Problem beim Auslagern ist, dass es nichts zum Auslagern gibt. Das was sinnvoll ist und sehr viel Rechenlast erzeugt ist die Grafik und die wurde schon weitestgehend ausgelagert.
robbitop
2011-09-27, 14:48:12
@robbitop:
Welchen BD meinst Du? Bd1,2 oder 3? ;-)
BD2 und BD3 sind nur Forumsnomenklaturen. ;-)
Schau dir an, wie sich K7, K8 und K10 im Laufe ihrer Evolution bezogen auf die Grundarchitekturen und die IPC änderten. Nämlich kaum. Hier ein Shrink, dort ein wenig mehr Cache, mehr Kerne, mehr Takt, ein paar klitzekleine IPC-Steigerungen. Erst die Nachfolge-µ-Arch brachte wieder einen brauchbaren IPC-Sprung.
Wenn man jetzt BD als K15-µ-Arch ansieht, dann wird der uns eine Weile begleiten, eh sich wieder groß was ändert. Und auch erst wieder in der nächsten Familie (20h??).
Signifikante Single-Thread-IPC-Sprünge, die nicht aus Bugfixing resultieren, würde ich nicht erwarten. Zumindest zeigte das die Vergangenheit.
Mal ehrlich: Warum sollte AMD eine komplett neue µ-Arch mit den ganzen Tricks von Intels Erfolgsarchitekturen entwickeln, wenn die IPC geringer wäre? Aus dem Taktdebakel von Intel zum P4 hat AMD sicher auch gelernt.
Auf Bugfixing-IPC-Steigerungen kann man natürlich noch setzen.
Andererseits (worst case!!): Möglicherweise ist irgendwas schon viel früher schief gegangen. Die langen Verzögerungen bei BD sprechen ja Bände. Insgesamt sinds nun seit Sandtiger veröffentlicht werden sollte schon ca. 2 Jahre.
Vieleicht hat sich schon bei den ersten Tests dieser µ-Arch im Simulator gezeigt, dass die Architektur nicht so aufging, wie man sich das vorgestellt hat. Immerhin ist AMD das wohl schon mit mehreren µ-Archs so ergangen, die man dann stornierte.
K7 (oder war es K8?) sollte ja ursprünglich eine total mächtige aber komplexe FPU bekommen. K9 war angeblich als Hochtaktdesign entwickelt worden. Und es gab wohl auch noch eine Art K10, die auch storniert wurde.
Zumindest waren das Rumors auf aceshardware vor Jahren.
Dass nach K8 hinsichtlich µ-Arch nicht mehr viel bei AMD passierte, ist ein starkes Indiz.
Möglicherweise konnte man BD nun nicht auch noch stornieren.
Viele Möglichkeiten, keine Antworten...
Wo brauchen Spiele ne hohe IPC? Was Spiele vor allem machen sind ne Menge Daten verwalten und herumzuschieben. Grade bei Multithreading ist doch die Synchonisation der Threads das große Problem, da spielt IPC noch ne geringere Rolle. Spiele und IPC passen einfach nicht zusammen.
Ganz im Gegenteil. Spiele sind extrem schwierig zu parallelisieren. Was so aussieht, wie eine gute Skalierung über mehrere Kerne ist wohl auch ein sehr parasitärer Effekt fauler Programmierung. Wenn ein Spiel für mehr Threads entwickelt wurde, als Kerne vorhanden sind, switchen die Threads immer hin und her. Da werden ständig Caches geleert und gefüllt und damit bleibt die CPU auch ständig stehen. Das können Intels Core i3s übrigens dank superschnellem Cache besser ab als z.B. ein Dualcore K10. Aber auch die i3s werden damit ausgebremst.
Würden Spiele sowohl für Single, Dual, Quad und Octacores optimiert werden, würde man sicher keine so starke Skalierung sehen.
Vieles ist serieller Integercode der auch noch herrlich unsortiert ist. Zumindest der Hauptthread. Und sobald genügend Kerne vorhanden sind, dass das o.g. Switchen nicht mehr vorkommt, spielt die IPC des Kerns mit der Hauptlast absolut eine Rolle. Dort kann sich dann ein Integerstarker Core i von Intel ggü einem nicht so integerstarken K10 so richtig schön absetzen. Mit reinspielen tun natürlich Cache und Front-End Geschwindigkeit, da sie den Durchsatz (bzw den Wirkungsgrad des Durchsatzes) stark beeinträchtigen.
Bösewicht
2011-09-27, 14:54:54
Und bietet genauso "viel" wie heutige Spiele. Vergleich dochmal die Spielmechanik von Quake 3 und Bad Company 2. Ist alles gleich geblieben, aber das eine Spiel läuft perfekt auf einem Single-Core, beim anderen benötigt man wohl schon einen QuadCore.
*Hust* *Hust*
Es sind auch gleich mal doppelt und dreimal so viele spiekler am start...
Mal davon abgesehen ist der Sound von BFBC2 absolute spitzenklasse und ich bin mir fast sicher da wird viel von der CPU berechnet und nicht einfach samples abgespielt!
Audioberechnung ist nicht ohne.
Die karten sind auch um ein vielfaches größer es passiert viel mehr usw.
BD2 und BD3 sind nur Forumsnomenklaturen. ;-)
Ne, Bdver2 ist semioffizieller Compilerbauerjargon ;-)
Hi,
This patch does the basic enablement for AMD's upcoming bdver2 processor.
It defines -march=bdver2 and -mtune=bdver2, and lets -march=native correctly
recognizes bdver2. At the moment the tuning is mostly a copy of bdver1.
The patch passed bootstrap and the x86 tests.
Is it OK to commit to trunk?
http://old.nabble.com/AMD-bdver2-enablement.-td32040151.html
Nenns von mir aus Piledriver oder "enhanced Bulldozer", alles das gleiche, Bdver2 ist halt am kürzesten ;-)
Schau dir an, wie sich K7, K8 und K10 im Laufe ihrer Evolution bezogen auf die Grundarchitekturen und die IPC änderten. Nämlich kaum. Hier ein Shrink, dort ein wenig mehr Cache, mehr Kerne, mehr Takt, ein paar klitzekleine IPC-Steigerungen. Erst die Nachfolge-µ-Arch brachte wieder einen brauchbaren IPC-Sprung.
Jo, aber wann war da schon jemals eine v2 oder gar v3 Version von Anfang an geplant? Das gabs nie, mit Wohlwollen kann man höchstens noch die Shrinks aufzählen.
Wenn man jetzt BD als K15-µ-Arch ansieht, dann wird der uns eine Weile begleiten, eh sich wieder groß was ändert. Und auch erst wieder in der nächsten Familie (20h??).
Signifikante Single-Thread-IPC-Sprünge, die nicht aus Bugfixing resultieren, würde ich nicht erwarten. Zumindest zeigte das die Vergangenheit.
Hmm ist halt die Frage, was man unter "groß" und "signifikant" verstehen will. Sagen wir mal alles bis 10% wäre nicht signifikant? Wäre das ok?
Bei 28nm hoffe ich auf eventuell 32kB L1 Cache oder 16kB WB, irgendwann muss man da von WT wegkommen ^^
Mal ehrlich: Warum sollte AMD eine komplett neue µ-Arch mit den ganzen Tricks von Intels Erfolgsarchitekturen entwickeln, wenn die IPC geringer wäre? Aus dem Taktdebakel von Intel zum P4 hat AMD sicher auch gelernt.
Einfach: Weil noch nicht alle Tricks mit an Bord sind ;) Ansonsten müßte die IPC ja eben besser sein :)
Auf Bugfixing-IPC-Steigerungen kann man natürlich noch setzen. Klar, vielleicht sogar per OS Update ;-)
Andererseits (worst case!!): Möglicherweise ist irgendwas schon viel früher schief gegangen. Die langen Verzögerungen bei BD sprechen ja Bände. Insgesamt sinds nun seit Sandtiger veröffentlicht werden sollte schon ca. 2 Jahre.
Vieleicht hat sich schon bei den ersten Tests dieser µ-Arch im Simulator gezeigt, dass die Architektur nicht so aufging, wie man sich das vorgestellt hat. Immerhin ist AMD das wohl schon mit mehreren µ-Archs so ergangen, die man dann stornierte.
Huu .. Sandtiger .. das war mMn nur ne SSE5 CPU mit 2x64b FMACs. Nachdem Intel SSE5 nicht wollte hat mans halt gelassen, oder der Grund war der Verzicht auf high-k bei 45nm. Wenn man ne Architektur mit höherem Taktpotential entwirft, sollte man die Verlustleistung utner Kontrolle haben, soviel weiß man vom P4 *g*
Aber was da genau passiert, weiß man nicht.
K7 (oder war es K8?) sollte ja ursprünglich eine total mächtige aber komplexe FPU bekommen. Das war der K8, da war mal ne TFP im Gespräch (http://arstechnica.com/civis/viewtopic.php?f=8&t=530111). Das wurde dann für SSE2 gestrichen. SSE5 war dann quasi TFP 2.0, bzw. die aufgewärmte Version und Intel hats diesmal mit AVX endlich geschluckt.
K9 war angeblich als Hochtaktdesign entwickelt worden. Und es gab wohl auch noch eine Art K10, die auch storniert wurde.
Naja, K9 hatte nen 16kB L1 Cache ... vielleicht haben wir den ja jetzt *g* (zumindest gabs da mal ein altes Patent aus der Zeit mit langer Pipe, sollte K9 gewesen sein).
Der alte K10 war mMn dann eigentlich nur das Teil für Sandtiger,also quasi Bulldozer v0.5. CLuster based Multithreading ist ja schon alt bei AMD, erste Folie dazu gabs schon 2005, du kennst sie sicher schon:
http://data5.blog.de/media/732/3663732_9bc35365d1_l.png
Dass nach K8 hinsichtlich µ-Arch nicht mehr viel bei AMD passierte, ist ein starkes Indiz.
Möglicherweise konnte man BD nun nicht auch noch stornieren.
Glaub ich nicht, µArch mäßig passierte ja viel, zumindest forschungsmäßig, aber Produkte kamen halt keine. Grund war multicore, anstatt ne neue Arch. zu entwickeln, nahm man einfach die alte und pappte 2 davon aufs DIE, weniger Risiko, mehr Profit. Hat auch F. Glew so ähnlich mal geschrieben, als sie seinen ursprünglichen Bulldozervorschlag ablehnten.
Viele Möglichkeiten, keine Antworten...
Jo, aber nachdem noch Version 2 und 3 in relativ kurzen Abständen folgen mach ich mir erstmal keine großen Sorgen.
BD2 und BD3 sind nur Forumsnomenklaturen. ;-)
Schau dir an, wie sich K7, K8 und K10 im Laufe ihrer Evolution bezogen auf die Grundarchitekturen und die IPC änderten. Nämlich kaum. Hier ein Shrink, dort ein wenig mehr Cache, mehr Kerne, mehr Takt, ein paar klitzekleine IPC-Steigerungen. Erst die Nachfolge-µ-Arch brachte wieder einen brauchbaren IPC-Sprung.
Wenn man jetzt BD als K15-µ-Arch ansieht, dann wird der uns eine Weile begleiten, eh sich wieder groß was ändert. Und auch erst wieder in der nächsten Familie (20h??).
K7 hat sich nicht schlecht entwickelt von Pluto zu Barton, natürlich wegen der K8-Verschiebung.
BD Version 2 ist Piledriver und wird auch von AMD so genannt, das ist keine Forumserfindung.
AMDs Entwicklungsmodell bzw Strategie zielt natürlich auf den Mitbewerber ab, es ist also nicht gesagt, dass es bei BD so ähnlich ablaufen wird als wie bei K8/K10. Ganz im Gegenteil, es ist anzunehmen, dass AMD auf Intel Tick-Tock-Strategie reagiert hat (sagten sie in einem Interview sogar mal, war so um die Nehalemeinführung AFAIR) und BD mit schnelleren und kleineren Entwicklungsschritten weiterführt und eben nicht wie die K7-Architektur (K7->K8->K10 dauerte fast 9 Jahre).
Ich vermute deshalb, dass das scheinbar fehlende L2->L1-Prefetching erst mit Piledriver kommt.
aylano
2011-09-27, 15:21:00
BD wird an Bobcat relativ nah dran sein, was die Integer-Cores angeht. Eigentlich ist der Weg doch auch sehr verständlich?
Sehe ich nicht so, sonst hätte man das schon viel früher angesprochen und nicht nur bei 5 vor 12.
Gerade in diesem Forum hörte ich, dass der Umstieg von 3 auf 2 Alus nur so 5%-Performance einbüßt
Andererseits (worst case!!): Möglicherweise ist irgendwas schon viel früher schief gegangen. Die langen Verzögerungen bei BD sprechen ja Bände. Insgesamt sinds nun seit Sandtiger veröffentlicht werden sollte schon ca. 2 Jahre.
Vieleicht hat sich schon bei den ersten Tests dieser µ-Arch im Simulator gezeigt, dass die Architektur nicht so aufging, wie man sich das vorgestellt hat.
....
Viele Möglichkeiten, keine Antworten...
Das erklärt aber auch nicht, warum dann der Core so groß ist.
Logisch wäre, wenn das "Schiefgelaufene" dann in BD1 (&BD2) noch deaktiviert ist.
Aber wenn vieles schief gegangen sein mag, dann wird da auch kaum mehr Logik dahinter sein.
Mit den Launch von Bulldozer, wird es in den nächsten Monaten sowieso interessant, wie die Entwicklung von Bulldozer in den letzten Jahren abgelaufen ist.
Ich war lange der Meinung, dass Bulldozer aufgrund der Core-Größe sowieso eine Überraschung wird. Entweder durch die Performance (positiv) oder des hohen Stromverbrauchs (= geringerIPC & Takt) (Negativ)
Gerade in diesem Forum hörte ich, dass der Umstieg von 3 auf 2 Alus nur so 5%-Performance einbüßt
Im Falle von K10 zu BD haben wir 3 ALU/AGU-Paare mit jeweils eigenen Schedulern zu 2 ALUs und 2 AGUs mit eigenen Ports an einem gemeinsamen Scheduler, das ist eigentlich nicht langsamer wenn der Rest passt.
Gerade in diesem Forum hörte ich, dass der Umstieg von 3 auf 2 Alus nur so 5%-Performance einbüßt
Jupp ... wenn der Rest gleich bleibt ^^
Im Moment hab ich den write through 16kB L1 etwas in Verdacht, und der L1I verschwendet noch Platz, aber eigentlichsollte der Scheduler besser sein .... naja wie auch immer, ich bleib meinem Spruch treu: Trau keiner Rev unter Rev.C
Da sind dann alle Kinderkrankheiten entwanzt, dann wird man sehen :-)
aylano
2011-09-27, 15:43:40
@mrt
Wenn der Rest nicht gepasst hätte, wäre darauf entsprechend hingewiesen worden.
Ich wüsste noch immer nicht, wo im Rest der Engpass sein sollte, da der Rest ja auch nicht unwesentlich gewachsen ist.
Na ja, auf alle Falle sehe ich momentan keine Logik und warte erstmals die Ergebnisse ab.
Da gibts aber schon ein paar Anhaltspunkte was nicht so ganz passen könnte oder anders fomuliert, was Leistung kosten könnte. Das wäre zum einen L2->L1-Prefetching das scheinbar nicht funktioniert, aber auch sonst empfind ich die Latenzzeiten, sofern die AIDA-Screenshots stimmen, nicht sonderlich berauschend. Die Prefetcher scheinen kaum besser als bei K10 zu sein, schau dir mal die Latenzzeiten von SB bei Speicherzugriffen an. ;)
aylano
2011-09-27, 17:47:50
Die Prefetcher scheinen kaum besser als bei K10 zu sein, schau dir mal die Latenzzeiten von SB bei Speicherzugriffen an. ;)
Erzähl bitte nicht einen "Architektur-Noob", wo er schauen sollte und sich da irgendwelche Performance-Steigerungen hineininterpretieren soll.:freak:
Natürlich erscheint das komisch, aber ich bin nicht fähig auch nur abzuschätzen, welchen Einfluss das auf IPC haben könnte.
Soweit bin ich noch nicht.
Es gab ja auch Tests mit unterschiedlichen Multis in Northbridge, was erhebliche Unterschiede im AIDA-Tests lieferte, aber kaum/keine Änderungen in Realen bzw. üblich syntetischen Tests.
Ich wäre mir nicht 100% sicher, ob die AIDA-Tests immer richtig auslesen.
Ich will ja die Möglichkeit nicht abstreiten, dass "der Rest" doch passt.
Nur bleib ich der Meinung.
Die Bulldozer-IPC nahe Bobcat-IPC war nicht lange Verständlich, da dies hier nicht entsprechend angemerkt wurde.
Schließlich ist (wenn Transistor-Größe ... 32nm-SOI = 40nm-Bulk) ein Bobcat-Core mit 4,6mm² mehr als halb so klein wie ein angeblicher 20mm²-Bulldozer.
Und SSE 4.1 (& 4.2) & AVX können kaum so viel ausmachen (wie doppelte Diefläche), wenn Intel das mit kaum/keine Core-Vergrößerungen einführen konnte.
Bei den Tests mit den Multis änderte sich ja nur die Bandbreite und nicht die Latenzen, letztere sind aber nicht unwichtig, insbesondere bei L2, da BD in den schreibt und nicht in den L1 wie K10.
Hohe Zugriffszeiten beim Lesen mit leicht erkennbarem Muster wie bei AIDA spricht für nicht so gute Prefetcher und das sollte AIDA noch richtig hinbekommen, bei den Cachewerten mag es auch einen Bug in AIDA geben.
Spätestens mit Piledriver werden wir sehen was alles Fehler sind und was Architekturschwächen. Wenn Trinity trotz vermutlich weniger Cache bei 4 Threads und gleichen Takt schneller ist, dann lief bei bdver1 einiges falsch.
Ronny145
2011-09-27, 18:06:14
http://obrovsky.blogspot.com/2011/09/amd-fx-turbo-core-20-unveiled-by-obr.html
Bei 4 Threads keine 4,2 Ghz? Ich bin davon ausgegangen, dass es bis zu 4 Threads 4,2 Ghz gibt.
deekey777
2011-09-27, 18:28:39
Naive Frage: Werden vier Threads dann auf vier Module verteilt oder auf zwei?
john carmack
2011-09-27, 18:50:01
auf 2 würd ich sagen...
boxleitnerb
2011-09-27, 19:02:04
http://obrovsky.blogspot.com/2011/09/amd-fx-turbo-core-20-unveiled-by-obr.html
Bei 4 Threads keine 4,2 Ghz? Ich bin davon ausgegangen, dass es bis zu 4 Threads 4,2 Ghz gibt.
Ich auch, so wurde es in den Folien dazu ja suggeriert. Bis zu 500 MHz, und jetzt praktisch nix (mostly 3,6 GHz) bei 6+ Threads. Bitter.
Ronny145
2011-09-27, 19:05:06
Ich auch, so wurde es in den Folien dazu ja suggeriert. Bis zu 500 MHz, und jetzt praktisch nix (mostly 3,6 GHz) bei 6+ Threads. Bitter.
Könnte auch ein Scheduler Problem sein. Man müsste 2 Module deaktivieren und dann schauen ob es auf 4,2 Ghz geht.
Könnte auch ein Scheduler Problem sein. Man müsste 2 Module deaktivieren und dann schauen ob es auf 4,2 Ghz geht.
Jupp so siehts aus, ich schrieb doch immer schon dazu, dass der Turbo helfen würde - wenn der Scheduler keinen Mist baut - tut er aber anscheinend, auf den AMD Folien hieß es doch, dass für den vollen Turbo die anderen Kerne im C6 Modus sein müssen. Davon sieht man aber nichts.
Der Windows-Scheduler ist da ziemlich daneben... alle 10ms den Thread auf einen anderen Kern verschieben is eigentlich schon mehr als daneben... passierte bei mir mit einem Phenom II.
Naive Frage: Werden vier Threads dann auf vier Module verteilt oder auf zwei?
Wenn sich die Kerne eines Moduls als Siblings melden, dann auf meist 4 Module, sofern der Scheduler mit SMT was anfangen kann.
Twodee
2011-09-27, 19:51:22
Der Windows-Scheduler ist da ziemlich daneben... alle 10ms den Thread auf einen anderen Kern verschieben is eigentlich schon mehr als daneben... passierte bei mir mit einem Phenom II.
Das ist auch völlig normal. Durch den Wechsel wird einerseits garantiert das auch andere Prozesse drankommen und andererseits alle Cores thermisch gleich belastet werden.
Botcruscher
2011-09-27, 20:20:28
Auch Spiele brauchen eine hohe IPC. Es ist wesentlich aufwendiger Spiele multithreadfähig zu machen als bestimmte Anwendungen. Und die Bereiche, die von mehreren Kernen profitieren, werden in Zukunft sowieso auf die bzw. eine GPU-Karte ausgelagert: Effektphysik und KI (Schwarmverhalten) als Beispiele.
Mal sehen was die neuen Konsolen bringen. Ansonsten bleibt nur OpenCL und Bullet. Alles Hersteller abhängige kann man bei Multiplattformtiteln vergessen. Bis da eine einheitliche Grundlage existiert wird(von den Spieleentwicklern selbst) nichts kritisches ausgelagert. Damit bleibt es bis auf weiteres bedeutungslos.
Das ist auch völlig normal. Durch den Wechsel wird einerseits garantiert das auch andere Prozesse drankommen und andererseits alle Cores thermisch gleich belastet werden.
Wozu sollte man bitte alle Kerne thermisch gleich belasten und dafür Leistungsverlust akzeptieren? Das ist doch hochgradig bescheuert.[gerade wenn der Rest abgeschaltet werden könnte] PS: Schön wenn es noch ein dual Dualcore wie ein C2Q ist. FSB ahoi.
@Twodee
Das ist für Windows normal, aber nicht generell.
Edit: Aus thermischen Gründen muss man NICHT so schnell Theads verschieben.
Twodee
2011-09-27, 20:30:27
Ich empfehle euch das hier: http://de.wikipedia.org/wiki/Prozess-Scheduler
Mir ist klar was ein Scheduler ist und was seine Aufgabe ist :rolleyes:
Was ich meine, ist, dass ich zum prüfen meiner Queue (der zur Abarbeitung anstehenden Threads) nicht einen Thread unterbrechen muss wenn 3 von 4 Kernen nichts zu tun haben.
Es reicht übrigens wenn alle 2 Sekunden ein Thread auf einen anderen Kern verschoben wird.
Botcruscher
2011-09-27, 20:43:41
Ja und? Wenn ein Interrupt kommt und gerade auf einem anderen Kern Kapazitäten(eher) frei sind lohnt sich der Wechsel. Bei freien Kapazitäten(im Extremfall ist ein Kern unbenutzt) "auf verdacht" zu springen kostet aber schon bei der Cache-Verwaltung.(mrt war schneller)
Twodee
2011-09-27, 20:54:28
@MRT
Kerne frei? Wo gibts das?
Auf meinem Win7 System laufen selbst im Leerlauf bis zu 100 Prozesse, die sich um 8 Kerne streiten. Wenn jeder dieser Prozesse einen Kern für 2 Sekunden für sich alleine (egal ob er kritische Sachen macht oder auf Ereignisse wartet) beanspruchen darf, würde jeder Thread alle ~24 Sekunden für 2 Sekunden laufen. Na prost Mahlzeit!
btw. Bei P3D wurde das auch schon vor langer Zeit durchgekaut: http://www.planet3dnow.de/vbulletin/showthread.php?p=4456812#post4456812
Es geht hier um den Fall, dass weniger "fully loaded" Threads aktiv sind als Kerne zur Verfügung sind. Lies nochmal von oben, Stichwort TurboCore ;)
Wenn man einen Thread unterbricht muss man ihn nicht zwangsläufig verschieben, hängt davon ab wo er in der Queue ist (Priorität) und wie es mit den anderen Kernen aussieht, meistens wird man ihn aber verschieben.
Wenn du wissen willst wie es besser geht, dann schau über den Tellerand (=anderes OS).
@Botcrusher
Hardwareinterrupts sind nicht das Problem, APIC kann diese auf bis zu 8 Kerne verteilen (wenns das OS nutzt).
LieberAal
2011-09-27, 21:16:55
@MRT
Kerne frei? Wo gibts das?
Auf meinem Win7 System laufen selbst im Leerlauf bis zu 100 Prozesse, die sich um 8 Kerne streiten.
Vielleicht solltest du die Wikipedia-Artikel, die du so großzügig verlinkst, auch mal selber lesen. Im Leerlauf streiten sich genau 0 Threads um die CPU.
Twodee
2011-09-27, 21:17:00
Es geht hier um den Fall, dass weniger "fully loaded" Threads aktiv sind als Kerne zur Verfügung sind. Lies nochmal von oben, Stichwort TurboCore ;)
Wenn man einen Thread unterbricht muss man ihn nicht zwangsläufig verschieben, hängt davon ab wo er in der Queue ist (Priorität) und wie es mit den anderen Kernen aussieht, meistens wird man ihn aber verschieben.
Soweit ich weiß, hat der Scheduler keine Ahnung über "fully loaded" Threads, da er weder spekuliert, noch Messungen darüber anstellt. Er Verteilt und weißt Zeitscheiben zu, zu mehr hat er gar nicht Zeit.
Würde man Threads nicht routieren lassen, könnten zwei "fully loaded" Treads auf den selben Core landen, nur das einer der beider später zum "fully loaded" Thread wird. Dann wäre ein Kernwechsel wünschenswert :rolleyes:
Twodee
2011-09-27, 21:17:52
Vielleicht solltest du die Wikipedia-Artikel, die du so großzügig verlinkst, auch mal selber lesen. Im Leerlauf streiten sich genau 0 Threads um die CPU.
Du glaubst ernsthaft das im "leerlauf" die CPU nix zu tun hat? Und jeder Thread stillsteht? :rolleyes:
LieberAal
2011-09-27, 21:22:37
Was glaubst du denn? Dass die alle busy wait machen und der Task Manager (oder jedes andere beliebige LAstmesstool deines Vertrauens) dich dreist anlügt?!!? :D
Edit, vlt. wird es so verständlicher, dass du von einem unsinnigen Zustand ausgehst: Denn wenn die CPU vor sich hin idlet und gleichzeitig prügeln sich Dutzdende, wenn nicht Hunderte Threads darum, endlich auf die CPU gelassen zu werden - tjo, dann würd ich mir aber echt Gedanken machen. Schläft der Scheduler grad, ist der Dispatcher wieder in Urlaub gefahren ohne einen Antrag auszufüllen, oder was ist hier wieder los?
Ich empfehle euch das hier: http://de.wikipedia.org/wiki/Prozess-Scheduler
Ist klar, aber das hier ist mittlerweile von größerem Interesse:
The 2.6 kernel introduced the new O(1) scheduler that included better support for SMP systems. The key was the ability to load balance work across the available CPUs while maintaining some affinity for cache efficiency. For cache efficiency, recall from Figure 4 that when a task is associated with a single CPU, moving it to another CPU requires the cache to be flushed for the task. This increases the latency of the task's memory access until its data is in the cache of the new CPU.http://www.ibm.com/developerworks/library/l-linux-smp/
Hört sich für mich so an, als ob Intel mit den inklusiv, kleinen L2 nen dicken Vorteil mit der alten Methode hatte. Wenn man bei AMD nen Thread von Kern 1 auf 2 verschiebt, dann gute Nacht, bzw. Hoffen und Bangen, dass was vom alten L2 irgendwie auch im L3 ist. X-D
Edit, hier ist noch ein Bildchen wie das im Kernel 2.4 und dann unter 2.6 mit dem O(1) Scheduler lief lief:
http://www.abload.de/img/linuxxschedz70x.png
Sieht so aus, als obs da bei 2.6 mehrere, unabhängige queues gibt. Mittlerweile ist zwar CFS angesagt, aber dessen Hauptinfoquelle (PDF in Japan), ist gerade wg. maintenance offline. Ansonsten, wer Polnisch kann:
http://students.mimuw.edu.pl/SR/SR-MONO/cfs-scheduler/cfs-scheduler.pdf
Preisefrage ist jetzt, wie das unter Win geht, dazu gibts noch ne einstündige Vorlesung:
http://channel9.msdn.com/Shows/Going+Deep/Dave-Probert-Inside-Windows-7-User-Mode-Scheduler-UMS?format=html5
Hab jetzt aber keine Zeit das anzuschauen, morgen dann.
Edit2:
HMm was ist das:
"Logical Processor ideling:
Improve server efficiency when under budget by allowing firmware to provide input to Core Parking algorithm"
http://msftkitchen.com/wp-content/uploads/2010/06/Windows-8-Energy-Efficiency-Development-Areas-of-Focus-02.png
Klingt ja spannend, mal schauen, was Win8 da so alles treibt ^^
Soweit ich weiß, hat der Scheduler keine Ahnung über "fully loaded" Threads, da er weder spekuliert, noch Messungen darüber anstellt. Er Verteilt und weißt Zeitscheiben zu, zu mehr hat er gar nicht Zeit.
Würde man Threads nicht routieren lassen, könnten zwei "fully loaded" Treads auf den selben Core landen, nur das einer der beider später zum "fully loaded" Thread wird. Dann wäre ein Kernwechsel wünschenswert :rolleyes:
Natürlich, denn nur dann ist er immer aktiv, ein Thread, der gerade mal 10% Last verursacht ist auch nur entsprechnde Zeit akitv, wie soll es denn sonst sein deiner Mainung nach? Mit aktiv mein ich in dem Zusammenhang, dass er zur Ausführung ansteht. Man lässt nicht alle Threads rotieren, sondern nur die, die auch was zu arbeiten haben.
Zeitscheiben gibts nicht bei jedem Scheduler, nicht jeder ist ein Round-Robin-Scheduler.
Skysnake
2011-09-27, 23:22:53
so sieht's aus. Die Os sheduler haben erst mal 2-x ques. Da wird dann erst mal unterschieden nach unterschiedlichen priorisierungen. Ein Task steigt auf, wenn platz frei ist, oder wenn er Zeitspanne x gewartet hat auf der stufe. Damit ist gewährleistet, das jeder dran kommt.
nur in der letzten que geht es entweder per round-Robin rum und/oder es wird noch zwischen i/o und compute limitierten threads unterschieden.
wobei Prozesse da besser ist. Threads werden einem Prozess ja zugeordnet bzgl. Der genutzten Zeit.
man muss halt immer bedenken, das ein Prozess sozial sein kann und wenn er nichts zu tun hat stalled, oder assozial sein und busy-waiting machen.
Ronny145
2011-09-27, 23:42:30
http://s7.directupload.net/images/110927/8dqvzcjb.jpg
http://www.cpu-world.com/news_2011/2011092701_New_AMD_Opteron_6200_models_sighted.html
Sind das die Server Modelle?
Skysnake
2011-09-27, 23:59:33
Da steht Opteron, also ja ;)
Die Dinger takten btw. ganz schön hoch. Ok der normale Takt ist auch nicht viel höher als aktuell, wenn überhaupt, aber durch den Turbo zieht das schon ganz schön an. Nicht schlecht Herr Specht.
Pentium M
2011-09-28, 01:07:38
@ Opteron : Klingt ja spannend, mal schauen, was Win8 da so alles treibt. Entschuldigung Skysnake : Sagte nicht OBR selbst das Win 8 4C/8T anzeigt.Link (http://obrovsky.blogspot.com/2011/09/must-have-for-bulldozer-crap.html)
Sir Integral Wingate Hellsing
2011-09-28, 03:19:45
Der Windows-Scheduler ist da ziemlich daneben... alle 10ms den Thread auf einen anderen Kern verschieben is eigentlich schon mehr als daneben... passierte bei mir mit einem Phenom II.
Das ist auch völlig normal. Durch den Wechsel wird einerseits garantiert das auch andere Prozesse drankommen und andererseits alle Cores thermisch gleich belastet werden.
AFAIK wg besserer Ausnutzung der einzelnen Caches?
http://www.cpu-world.com/news_2011/2011092701_New_AMD_Opteron_6200_models_sighted.html
Sind das die Server Modelle?
Model********Cores* Frequency**Turbo Frequency
Opteron 6212*** 8*** 2.8 GHz*** 3.7 GHz / 3.7 GHz
Opteron 6238*** 12** 2.5 GHz*** 3.1 GHz / 3.3 GHz
Opteron 6274*** 16** 2.2 GHz*** 2.8 GHz / 3.2 GHz
Opteron 6282SE**16**2.5 GHz***3.1 GHz / 3.5 GHz
nett, nett :freak:
Skysnake
2011-09-28, 09:33:42
Jo son 6274 oder vielleicht auch der 6272 würden mir als Desktop CPU wohl voll reichen. Wenn da bis zu 2,8/3,2 GHz Turbo sollte das auch reichen für Desktopanwendungen, die nicht so viele Threads nutzen.
Screemer
2011-09-28, 10:06:48
was solln so ein 8 moduler kosten?
Skysnake
2011-09-28, 10:13:02
1000€+ sicherlich.
EDIT:
Ich hab mir mal das Video von OBR wohl angeschaut, wo man sieht, wie der Turbo funktioniert http://www.youtube.com/watch?feature=player_profilepage&v=Aale7YSvhJk#t=2s
VIEL Interessanter ist aber der Task-Manager, wo man sieht, wie die Auslastung sich ständig ändert. Also das ist mal GANZ großer Blödsinn. So kann man auch Leistung verpulvern wie blöd :ugly: Also so was hab ich echt noch nicht gesehen. Es ist ja ok, das ein Prozess alle 10S oder so den Core wechselt, aber doch nicht am laufenden Band -.-
Sorry, dafür hab ich echt kein Verständnis. Wenn das jetzt auch noch der Fall ist, wenn alle Cores ausgelastet sind, dann stellt das OS BD aber SOOOOOOOOOOO ein riesiges Bein, das es nicht mehr feierlich ist. Also da muss definitiv nachgearbeitet werden beim OS. Zumindelst bei wenigen Threads könnte das wirklich einen guten Leistungsschub nochmals geben. Bei 8 Threads kommt es halt drauf an, ob da der OS-Sheduler son Mist auch macht.
Ich sehs schon kommen, um die volle Leistung von BD abrufen zu können, muss man Prozesse fest an "Cores" pinnen :ugly:
BlackBirdSR
2011-09-28, 10:50:34
1000€+ sicherlich.
EDIT:
Ich hab mir mal das Video von OBR wohl angeschaut, wo man sieht, wie der Turbo funktioniert http://www.youtube.com/watch?feature=player_profilepage&v=Aale7YSvhJk#t=2s
VIEL Interessanter ist aber der Task-Manager, wo man sieht, wie die Auslastung sich ständig ändert. Also das ist mal GANZ großer Blödsinn. So kann man auch Leistung verpulvern wie blöd :ugly: Also so was hab ich echt noch nicht gesehen. Es ist ja ok, das ein Prozess alle 10S oder so den Core wechselt, aber doch nicht am laufenden Band -.-
Sorry, dafür hab ich echt kein Verständnis. Wenn das jetzt auch noch der Fall ist, wenn alle Cores ausgelastet sind, dann stellt das OS BD aber SOOOOOOOOOOO ein riesiges Bein, das es nicht mehr feierlich ist. Also da muss definitiv nachgearbeitet werden beim OS. Zumindelst bei wenigen Threads könnte das wirklich einen guten Leistungsschub nochmals geben. Bei 8 Threads kommt es halt drauf an, ob da der OS-Sheduler son Mist auch macht.
Ich sehs schon kommen, um die volle Leistung von BD abrufen zu können, muss man Prozesse fest an "Cores" pinnen :ugly:
Ist doch bei den bisherigen Prozessoren genau so. Es gibt halt nunmal feste Slices und die sind keine 10s lang.
Und was stellt man fest, wenn man die Threads dann an die Kerne bindet? Es ändert sich nichts ;)
Außerdem kommt das Ganze der thermischen Verlustleistung sehr entgegen ;)
Je nach Anwendung und Prozessor kostet das seh wohl Leistung. Miss mal auf einem Athlon II. Affinität bringt übrigens nichts, wenn der Prozess trotzdem Unterbrochen wird und etwas anderes gerechnet wird.
AFAIK wg besserer Ausnutzung der einzelnen Caches?
Genau dann lass ich einen Thread länger auf einem Kern laufen und unterbrech ihn nicht so oft und verschieb ihn nicht ständig auf einen anderen Kern.
Ist doch bei den bisherigen Prozessoren genau so. Es gibt halt nunmal feste Slices und die sind keine 10s lang.
Und was stellt man fest, wenn man die Threads dann an die Kerne bindet? Es ändert sich nichts ;)
Jemand in nem Boinc Forum hat mal gepostet, dass er mit Festpinnen bei nem AMD X6 +15% erzielt hätte. Link hab ich leider nicht mehr bei der Hand.
Wie schon mal kurz angedeutet ist das eventuell eher ein AMD Problem. Intel hat durch die kleineren, L3 inclusiv, L2 sicherlich weniger Probleme als AMD mit nem doppelt so großen L2, der nicht vollständig im L3 gespiegelt ist.
Ansonsten, schau Dir mal nochmal das Bild an (dachte es wäre groß genug ^^):
http://www.abload.de/img/linuxxschedz70x.png
Das macht man sicher nicht, wenns nichts bringen würde.
Skysnake
2011-09-28, 12:03:49
Ist doch bei den bisherigen Prozessoren genau so. Es gibt halt nunmal feste Slices und die sind keine 10s lang.
Und was stellt man fest, wenn man die Threads dann an die Kerne bindet? Es ändert sich nichts ;)
Außerdem kommt das Ganze der thermischen Verlustleistung sehr entgegen ;)
Wenn ich auf meinem DualCore Sachen rechnen lasse, die nur einen Prozess auslasten, dann wandert das auch MAL hin und her, aber 99% der Zeit befindet sich der Prozess auf einem Core und fertig. Hin und wieder wird mal ein Wechsel zwischen den Cores vorgenommen, aber das passiert halt sehr sehr sehr selten. Da gibt es schon abschnitte von 5 min wo kein Wechsel stattfindet.
Klar hast du Slices, aber deswegen wechsel ich nicht den Core. Das dauert schnell länger, als einfach zu warten. Zudem wenn ich 100% Auslastung habe, dann kann ich die anderen Prozesse auch einfach auf die anderen Cores verteilen. Die müssen dadurch ja nicht warten. Also so lange es freie Cores gibt, macht es keinen Sinn einen Prozess zu wechseln. Wenn wird er mal kurz unterbrochen, das wars dann aber auch, und in der Zeit bleibt er dann wo er ist, weil er gleich wieder dran kommt. Das sind glaub maximal so 100 ms wo ein Prozess ohne Unterbrechung ausgeführt wird (oder 10 kann auch sein), dann wird gewechselt. Wenn aber der andere Prozess nichts zu tun hat, und nach 0,01 ms schon fertig ist, und die Ressourcen wieder frei gibt, dann kann der andere Prozess wieder seine 100/10 ms abarbeiten. Du hast ja hier z.B. 7 andere Cores, die nur darauf warten, das Sie mal etwas zu tun bekommen. Den einen Core dann mit anderen kurzen Sachen voll zu müllen und den Prozess dann sogar das MODUL! Wechseln zu lassen, wo nicht nur L1 sondern auch noch der L2 mit kopiert werden müssen ist halt total Banane...
Twodee
2011-09-28, 12:06:30
Bedank dich bei AMD. Der Windows-Sheduler war vor AMDs-Modulbauweise da :P
Ronny145
2011-09-28, 12:16:53
Ich bin mal gespannt ob die PCGH mit Turbo testet. Es wäre endlich an der Zeit die CPUs so zu testen, wie sie default bei den Nutzern laufen.
Ich bin mal gespannt ob die PCGH mit Turbo testet. Es wäre endlich an der Zeit die CPUs so zu testen, wie sie default bei den Nutzern laufen.
Naja, wenn der Turbo nicht 100% läuft ... :(
Wär mal interessant, ob Win8 schon stabil genug fürs benchen wäre. Wenn das stimmt, was Obr sagt (dass sich ein BD als 4 Kerner/8 Threads meldet), klappt das eventuell besser dort - solange nicht der SMT Algo benützt wird ^^
Wobei - der SMT Algo könnte vielleicht schon ne Verbesserung sein ;)
Bedank dich bei AMD. Der Windows-Sheduler war vor AMDs-Modulbauweise da
Eventuell ist das der Pudels Kern des Gerüchts, dass da noch ein Win Update kommt, das die Leistung steigert ? So mal schnell ein Scheduler Update in Windows einzupatchen geht sicher nicht. Das braucht ausführliche Testläufe, würde erklären, wieso es noch nicht fertig wäre.
LieberAal
2011-09-28, 12:55:49
Den einen Core dann mit anderen kurzen Sachen voll zu müllen und den Prozess dann sogar das MODUL! Wechseln zu lassen, wo nicht nur L1 sondern auch noch der L2 mit kopiert werden müssen ist halt total Banane...
Kopiert wird da sicher nichts, die Cache-Inhalte müssten dafür ja mit in den TSS / PCB aufgenommen werden, kann man eigentlich nicht machen. Ich schätze, der Prozess sammelt auf sienem "neuen" Kern nach dem Wechsel erstmal einen Cache Miss nach dem anderen. Und wenn er wieder zurück darf auf seinen alten, hat ein anderer Prozess in der Zwischenzeit dort auch schon schön den Cache geflusht ;D
Was denkt man sich in Redmond nur bei sowas...
Edit:
Eventuell ist das der Pudels Kern des Gerüchts, dass da noch ein Win Update kommt, das die Leistung steigert ? So mal schnell ein Scheduler Update in Windows einzupatchen geht sicher nicht. Das braucht ausführliche Testläufe, würde erklären, wieso es noch nicht fertig wäre.
Denke nicht dass das so sonderlich kompliziert ist, Änderungen daran muss man nichtmal unbedingt testen, die werden das formal verifizieren & schauen ob der neue Build in den Desktop bootet ;). Änderungen am Dispatcher wären wahrscheinlich unangenehmer.
Zudem kann man das Update ja optional machen, nur für BD-Rechner.
BlackBirdSR
2011-09-28, 15:35:57
Tut jetzt (wieder) jeder so, als wäre der Schuduler schuld und BD mit angepasstem Hotfix durch Microsoft mindestens 15% in jeder Situation zulegen?
Da werden einige enttäuscht sein denke ich :(
R.I.P.
2011-09-28, 16:05:57
Tut jetzt (wieder) jeder so, als wäre der Schuduler schuld und BD mit angepasstem Hotfix durch Microsoft mindestens 15% in jeder Situation zulegen?
Da werden einige enttäuscht sein denke ich :(
Das nicht alleine, aber eine neue Revision (Latenz-Probleme, Bug??, im Cache), höhere Taktraten (FX8170 z.B.), Scheduler update (der ominöse Win7 patch der also doch existiert) werden diese 15% sicherlich aufwiegen und den sehr guten Start, mMn, einer neuen Architektur darstellen. Sollte mit BD2 auch die IPC steigen, dann siehts mit AMD gut aus :biggrin:
Tut jetzt (wieder) jeder so, als wäre der Schuduler schuld und BD mit angepasstem Hotfix durch Microsoft mindestens 15% in jeder Situation zulegen?
Da werden einige enttäuscht sein denke ich :(
Gute Frage, was würdest Du abschätzen wieviel Prozent es kostet, wenn ein 2MB großer L2 Cache andauernd falsche Daten des vorher darauf gelaufenen Threads hat?
Bestcase = ?
Worstcase = 0 (gibt ja Anwendungen denen Cache fast total egal ist).
Knuddelbearli
2011-09-28, 17:40:31
was solln so ein 8 moduler kosten?
ab 700€ für den kleinsten vermutlich
Undertaker
2011-09-28, 18:18:52
Der kleinste 12-Kerner kostet atm etwas über 600€. Je nach Performance, die ja immernoch etwas in den Sternen steht, wird man sicherlich 700-800€ für den Einstieg rechnen müssen.
y33H@
2011-09-28, 20:02:14
Ich bin mal gespannt ob die PCGH mit Turbo testet. Es wäre endlich an der Zeit die CPUs so zu testen, wie sie default bei den Nutzern laufen.Bei Launch-Reviews mit wie ohne ... zudem kommt früher oder später eh ein neuer Parcours [BF3 und so] =)
R.I.P.
2011-09-28, 20:29:35
Bei Launch-Reviews mit wie ohne ... zudem kommt früher oder später eh ein neuer Parcours [BF3 und so] =)
Wilkommen zurück vom Urlaub :tongue: und wann können wir mit dem launch Review rechnen? Na los, lehn dich doch ein wenig aus dem Fenster!
Duplex
2011-09-28, 20:32:15
Haben einige Redaktionen von AMD schon Zambezi Samples erhalten oder wird es ähnlich wie Cayman 1 Woche vor launch ablaufen?
Was mich stört ist die "Bobcat IPC", macht keinen sinn von Thuban auf FX wechseln, nur wenn es um OC geht wird es interessanter als die 45nm CPUs.
achwas Bobcat IPC kann einfach nicht sein bei dem Frontend
y33H@
2011-09-28, 20:45:35
Wilkommen zurück vom Urlaub :tongue: und wann können wir mit dem launch Review rechnen? Na los, lehn dich doch ein wenig aus dem Fenster!Wenn ich mich rauslehne, falle ich aus der Lounge in den Pool ;D [komme erst Montagnacht zurück] Die Slides sind doch geleakt ...
Ich hab nur wegen BF3 mal geschaut und denke, FX-8150 plus GTX 580 (so mein Plan) ist eine gute Kombi.
Duplex
2011-09-28, 20:55:01
Das ist ein shared Frontend, 2 Integer teilen sich das Frontend...ist also nichts ganzes bei 2 Threads pro Modul.
Schau dir einfach Cinebench an, mit OC auf 4Ghz ist mein Thuban über 30% schneller als ein Nehalem i7-960, der Bulldozer ist trotz mehr Takt langsamer als ein Thuban & Nehalem in Cinebench, hier hat man weniger IPC pro Core, etwas weniger als ein K8.
Außerdem Core Größen oder Frontend sind nur Papiertiger...das muss nicht hochwertiger als ein K10 Core werden...
Woher will man wissen ob tatsächlich alles im Chip funktioniert...
Die Ingeneure sagen STOP, das dauert uns zu lange, das ging muss 2011 im Markt ankommen, aber die anderen sagen wir sind noch garnicht fertig, die Instructionen sind mangelhaft, das muss nochmal überarbeitet werden, wir müssen den rest deaktvieren, 2 Teams teilen sich hier die arbeit, der rest wird dann erst ab BD2 kommen...was meint ihr warum das ding so riesig ist, freie Flächen im DIE usw. Es fehlt Zeit!
Bei einer neuen Architektur dauert es lange wenn man will das alles wie geplant läuft, zwischendurch kann man Bugs entdecken, dann gehts los... sowas kann die IPC teilweise vernichten dann ist man auf dem Stand 2003 mit K8 IPC...man braucht Takt Takt und noch mehr Takt...vielleicht ist da auch nichts mehr zu holen? Irgendwann wird das Design ineffizient wie Netburst und was dann :freak: Ich sage euch da ist etwas schlimmes passiert und deshalb ist der D. Meyer auch weg...Orochi sollte mehr IPC als K10 erreichen, hat er aber nicht! Da kommen irgendwelche Geldgeber Chefs und sagen wie schnell ist Interlagos gegenüber Magny Cours, der Chef sagt nur 20%, die anderen sagen was? 5 Jahre Entwicklung für 20%? gute Nacht ;D
"SCNR"
Die Ingenieure arbeiten dort nun seit Jahren dran und werden doch recht genau wissen, wie z.B. dieses Frontend zu dimensionieren ist, gedulden wir uns einfach noch die 14 Tage und bleiben jaaaanzzz ruuuuuhich
Ronny145
2011-09-28, 21:07:45
Precisely. Too many people get caught up in IPC. To turn up the contrast a bit, what if IPC went up by 2X but the clock speed was only 800MHz?
http://hardforum.com/showpost.php?p=1037805318&postcount=15
IPC ist halt nicht sooo wichtig. :rolleyes:
Savay
2011-09-28, 21:13:42
achwas Bobcat IPC kann einfach nicht sein bei dem Frontend
ist eh eine pauschalisierende übertreibung basierend auf den CB11.5 zahlen...die restlichen leaks sind entweder nicht besonders aussagekräftig (AMD werte in irgendwelchen limits :lol:) oder schwanken zwischen "deutlich besser als K10" und "etwas schlechter als K10".
man muss sich doch nur mal unter vorbehalt die OBR werte ansehen...grade das zeug das viel singlethread workload drin hat lief da erstaunlicherweise besser als beim K10.
wer weiß wo es beim durchsatz unter CB11 wirklich klemmt...bei 6 vs. "8" FPUs sollte da jedenfalls theoretisch etwas mehr rausspringen. nochdazu ist die FPU leistung bei den meisten anwendungen(spielen) im heimbereich garnichtmehr so wichtig wie früher...
aber für manche gibts ja eh nur top oder flop...insofern :freak:
Der Windows-Scheduler ist da ziemlich daneben... alle 10ms den Thread auf einen anderen Kern verschieben is eigentlich schon mehr als daneben... passierte bei mir mit einem Phenom II.
Dir ist schon klar, dass das 30 Mio. Cycles sind bei 3 Ghz? Nehmen wir mal großzügig ~10k Cycles für den Switch an, dann sind wir bei 0,03% der Zeit.
Duplex
2011-09-28, 21:34:18
Der FX8150 erreicht mit 4,2Ghz nur 6.9 Points... ;(
http://obrovsky.blogspot.com/search?q=cinebench
http://s7.directupload.net/images/110928/temp/dl9mfokw.png (http://s7.directupload.net/file/d/2661/dl9mfokw_png.htm)
Mein 1055T @4,2Ghz erreicht 7.41 Points
http://s1.directupload.net/images/110928/temp/c6qrxxbq.jpg (http://s1.directupload.net/file/d/2661/c6qrxxbq_jpg.htm)
Nakai
2011-09-28, 21:35:31
http://hardforum.com/showpost.php?p=1037805318&postcount=15
IPC ist halt nicht sooo wichtig. :rolleyes:
Er hat auch recht. Das Gesamtpaket muss stimmen.
Und es wird wohl anfangs nicht, aber darum gehts es hier auch nicht. AMD hat endlich ne neue ARchitektur aus dem Boden gestampft... die muss etz mal ein paar Jahre reichen.
Ich werde mir Bulldozer holen...aba nicht jetzt. Leistung ist mittlerweile egal...aba mal guckn.
mfg
Ronny145
2011-09-28, 21:38:32
Er hat auch recht. Das Gesamtpaket muss stimmen.
Das Gesamtpaket scheint nicht zu stimmen. Diese völlig übertriebenen Taktvergleiche sind daneben, Sandy Bridge und K10.5 takten mit über 3 Ghz. So viel Taktvorsprung hat Bulldozer nicht, um schwächere IPC ausgleichen zu können.
Duplex
2011-09-28, 21:43:47
Das Gesamtpaket scheint nicht zu stimmen. Diese völlig übertriebenen Taktvergleiche sind daneben, Sandy Bridge und K10.5 takten mit über 3 Ghz. So viel Taktvorsprung hat Bulldozer nicht, um schwächere IPC ausgleichen zu können.
Genau der hat nur 6-9% mehr Takt
i7-2600 3,4Ghz
X6-1100T 3,3Ghz
FX8150 3,6Ghz
Blediator16
2011-09-28, 21:51:56
Oder man sieht es von der Seite, dass die erste CPU der neuen Architektur bereits mit den "alteingesessenen" konkurieren kann^^
Knuddelbearli
2011-09-28, 22:17:00
was solln so ein 8 moduler kosten?
Dir ist schon klar, dass das 30 Mio. Cycles sind bei 3 Ghz? Nehmen wir mal großzügig ~10k Cycles für den Switch an, dann sind wir bei 0,03% der Zeit.
geht weniger um die zeit sondern um die ganzen cache misses wenn der thread auf ein anderes modul wechselt
da ist halt intel mit dem inkl dicke im vorteil
davor hat ja einer geschrieben das eine fixierte Zuweisung bei seinem Phenom 2 X6 15% mehr Leistung bringt ( dürfte aber wohl ne extrem cache abhängiges Programm gewesen sein CB R11 dürfte kaum reagieren )
geht weniger um die zeit sondern um die ganzen cache misses wenn der thread auf ein anderes modul wechselt
Das ist bei den 10k Cycles dabei.
Dir ist schon klar, dass das 30 Mio. Cycles sind bei 3 Ghz? Nehmen wir mal großzügig ~10k Cycles für den Switch an, dann sind wir bei 0,03% der Zeit.
Es geht um die Cach-Flushes bzw um die Cache-Misses beim Verschieben... :rolleyes:
Das ist ein Problem, lies dich bitte ein.
Mir ist das Problem schon bewusst, aber ihr überschätzt es halt.
Dir ist schon klar, dass du mehr als 10k Zyklen brauchst um einen Kern aus einem Sleep-State aufzuwecken, Threadverschieben (voller context-switch, HW wohl um die 2000 Zyklen + Scheduler Overhead, der is mehr als die 2000 der HW). Dann noch Cache-Misses... Das ganze dann alle <= 10ms. Ich würd sagen du unterschätzt das, das kann schlimmstenfalls in Richtung 10% weniger Durchsatz gehen.
Das war bisher auch nie ein Problem, ich sehe nicht warum das bei Bulldozer anders sein sollte.
Und ja, ich geh auch selbst in dem Fall von 10k Cycles aus. Und 2000 Zyklen für Scheduling sind auch viel zu viel. 10% never ever. Das wären ja 3 Mio. Zyklen. Willst du mich verarschen?
Lawmachine79
2011-09-28, 23:25:46
Oder man sieht es von der Seite, dass die erste CPU der neuen Architektur bereits mit den "alteingesessenen" konkurieren kann^^
K7 und K8 waren "BAM in your face motherfucker". So wie es aussieht wird Bulldozer eine CPU, die, wenn sie genug Taktvorsprung hat, Anwendungen hat, die für sie optimiert wurden, in einer Multicorefreundlichen Umgebung, vielleicht ggf. eventuell mal die Nase vorn hat. Nach dem Phenom kann AMD sich sowas einfach nicht leisten. Der Phenom II hat sie überhaupt erst wieder KAUFBAR gemacht.
Das ist bei den 10k Cycles dabei.
Wenn man innerhalb von 10k Takten 2MB Cache verschieben will, wäre dazu eine 1600Bit breite Verbindung notwendig :) (wenn ich mich da nicht grob verrechnet habe)
Skysnake
2011-09-29, 00:01:24
Dir ist schon klar, dass das 30 Mio. Cycles sind bei 3 Ghz? Nehmen wir mal großzügig ~10k Cycles für den Switch an, dann sind wir bei 0,03% der Zeit.
Also Coda, du unterschätzt das wirklich extrem. Selbst wenn es NUR ein rum kopieren wäre, würde das nicht klappen in 10k Takten. Das passt einfach nicht.
Wenn man innerhalb von 10k Takten 2MB Cache verschieben will, wäre dazu eine 1600Bit breite Verbindung notwendig :) (wenn ich mich da nicht grob verrechnet habe)
~1677 sogar ;)
Gut, das wäre jetzt worst-Case, dass der komplette L2 Cache belegt ist, aber gehen wir mal von der Hälfte aus, dann wären das aber noch immer ~850Bit. dabei müsste dann auch noch jeden Takt eben 850 Bit von einem L2 in den anderen L2. Wenn ich mich jetzt aber nicht GANZ arg täusche, dann geht das gar nicht. Ein Core kann ja nur auf den L2 seines Moduls zugreifen. Alle andere Kommunikation erfolgt über den L3. Das heißt, es müsste erst mal in den L3 und vom L3 dann in den L1/L2.
So dann noch bzgl LiberAal. Das ist halt die Frage, ob er kopieren kann, also den Kontextswitch schafft und weiß, welche Daten zu dem Thread gehören und die einfach rüber kopiert, oder ob es wirklich über Cache misses läuft. Ich befürchte allerdings auch, das es über Cache-Misses läuft. Ob jetzt ein echtes kopieren, oder "kopieren" über Cache-Misses erfolgt, hatte ich mit meiner Aussage gar nicht gemeint.
Wenn man dann noch die Cache-Misses ran nimmt, dann gute Nacht um 6. Das ist dann wirklich ein ellen langer Prozess, bis da alle Daten wieder bereit liegen.
Also 1Mio Takte würde ich schon so ca. einplanen einen kompletten Core-Wechsel über die Modulgrenze zu vollziehen. Allein ein Kontextswitch kostet ja schon einige tausend Takte, wenn ich mich recht erinnere.
BlackBirdSR
2011-09-29, 08:02:59
Also Coda, du unterschätzt das wirklich extrem. Selbst wenn es NUR ein rum kopieren wäre, würde das nicht klappen in 10k Takten. Das passt einfach nicht.
~1677 sogar ;)
Gut, das wäre jetzt worst-Case, dass der komplette L2 Cache belegt ist, aber gehen wir mal von der Hälfte aus, dann wären das aber noch immer ~850Bit. dabei müsste dann auch noch jeden Takt eben 850 Bit von einem L2 in den anderen L2. Wenn ich mich jetzt aber nicht GANZ arg täusche, dann geht das gar nicht. Ein Core kann ja nur auf den L2 seines Moduls zugreifen. Alle andere Kommunikation erfolgt über den L3. Das heißt, es müsste erst mal in den L3 und vom L3 dann in den L1/L2.
Und darum ist das der L3 auch ein Victim-Cache.
Thread Slice endet, L2 Inhalt für diesen Thread wird in den L3 geschoben und vom anderen Modul wieder vom L3 über die Prediction in den L2/L1 des anderen geladen. An 512K Workload möchte ich dabei gar nicht denken.
So große Workloads haben dann immer auch mehr Arbeit zu Folge und höhere Latenzen. Wenn ein Thread wirklich 512K bis 1MB L2-Cache Platz benötigen würde, dann wären alle anderen Thread slices genau so langsam wie der jetzt vorgeschlagene Modulwechsel. Locality!
Ich hab das gestern mal bei Sandy Bridge probiert... da springt ein einzelner Thread auch ständig über die 4(8) Kerne hin und her (lässt dabei aber schön immer einen aus, um nicht in die SMT Falle zu stolpern.
Ronny145
2011-09-29, 09:02:28
http://store.onsale.com/p/Advanced-Micro-Devices-Processors-and-Accelerators/product~dpno~8885880~pdp.gjbcbjh
http://www.shopblt.com/cgi-bin/shop/shop.cgi?action=thispage&thispage=011003000503_BLA5679P.shtml&order_id=!ORDERID!
http://www.provantage.com/amd-fd4100wmw4kgu~7AAMD2MC.htm
FX-4100 (FD4100WMW4KGU) gelistet.
https://sp.ts.fujitsu.com/dmsp/docs/ds_esprimo_p705_e85_cz.pdf
Hier in der CPU Auswahl.
Also Coda, du unterschätzt das wirklich extrem.
Nö. 10k ist vielleicht etwas tief gegriffen, wenn der Core auch noch aus dem Sleep State aufwacht, aber es sind sicher keine 3 Mio. Cycles.
100k wäre schon sehr viel.
Spasstiger
2011-09-29, 12:16:25
https://sp.ts.fujitsu.com/dmsp/docs/ds_esprimo_p705_e85_cz.pdf
Hier in der CPU Auswahl.
Etwas gewagt, den FX-4100 über den Phenom II X4 960T zu stellen. Auf den ersten Blick sieht es natürlich so aus (4 Kerne mit 3,6 GHz gegen 4 Kerne mit 3,0 GHz). Ob das auch in der Praxis so sein wird? Der 960T erlaubt Turbo Core bis 3,4 GHz, der FX-4100 bis 3,8 GHz. Und der 960T hat etwas mächtigere Cores als der FX-4100. Am Ende könnte es auf einen Gleichstand hinauslaufen.
infinity
2011-09-29, 12:32:32
Etwas gewagt, den FX-4100 über den Phenom II X4 960T zu stellen. Auf den ersten Blick sieht es natürlich so aus (4 Kerne mit 3,6 GHz gegen 4 Kerne mit 3,0 GHz). Ob das auch in der Praxis so sein wird? Der 960T erlaubt Turbo Core bis 3,4 GHz, der FX-4100 bis 3,8 GHz. Und der 960T hat etwas mächtigere Cores als der FX-4100. Am Ende könnte es auf einen Gleichstand hinauslaufen.
Nun... das ist aber ein von AMD selbst erzeugtes Problem. Sie hätten dafür dann ein Modul nicht als 2-Core vermarkten sollen. Die schaufeln sich ihr grad selbst indem sie die Module vollmundig als Dualcores anpreisen. Hätten sie es entweder als 1 Core oder mit Aufklärung als einfach was "Neues" vermarktet, gäbe es weniger Enttäuschung, was die Leistung angeht.
Laut AMD es ist also nicht gewagt den FX-4100 mit dem X4 960T zu vergleichen, sondern durchaus so gewollt.
Skysnake
2011-09-29, 12:40:19
Nö. 10k ist vielleicht etwas tief gegriffen, wenn der Core auch noch aus dem Sleep State aufwacht, aber es sind sicher keine 3 Mio. Cycles.
100k wäre schon sehr viel.
Damit seid ihr beide um eine Größenordnung weit weg vom realen Wert :rolleyes:
Ich würde sagen so etwas zwischen 200k und 500k Takte wird es wohl brauchen. Damit wird man sicherlich recht gut in die Nähe des realen Wertes kommen. Das sind halt bei 3GHz auch knapp 0,1 ms, also nicht mehr wirklich zu vernachlässigen wie ich meine. Ich halte es schon für möglich, dass da zwischen 1-10% an Leistungsunterschied realisiert werden können.
@Blackbird: das ist nicht wirklich dein Ernst mit den 512kB-1MB. Die verwendeten Daten landen eigentlich alle mal im L2. Welches Programm kennst du denn, das ein workingset von kleiner 1MB hat? :ugly: Also das wirst du nicht wirklich finden. So kleine Programme sind wirklich sehr sehr selten. Mit dem L3 haste da schon eher Aussicht auf Erfolg, dass da die Daten drin bleiben trotz Thread-Wechsel. Bei so was wie Cinebench fliegt dir das Sach aber wohl selbst aus dem L3 raus, und da ist es dann halt schon kacke, wenn du den kompletten Cache neu laden musst, statt nur einem Teil.
Ich würde sagen so etwas zwischen 200k und 500k Takte wird es wohl brauchen.
Sorry, aber nö.
Wofür denn bitte? Der Scheduler braucht ~100 Takte, schon allein das überschätzt du völlig. Das ist nur ein Lookup in einem ausbalancierten Binärbaum.
Und darum ist das der L3 auch ein Victim-Cache.
Jo, das bedeutet, dass Sachen, die aus dem jeweiligen L2 wg. Überbelegung fliegen, im L3 landen, richtig?
Thread Slice endet, L2 Inhalt für diesen Thread wird in den L3 geschoben
Was genau ist "geschoben" ? Geht das automatisch, oder dauert es nach obiger Victim Manier erstmal wieder bis ein anderer Thread den L2 "reinigt" und die Daten in den L3 abschiebt. Meines Wissens nach gibts da keine Automatik, d.h. man kann wieder ein paar Takte obendrauf rechnen, bis alles aus nem 2MB L2 in den L3 abgeschoben ist. Bis dahin hats vermutlich der alte Thread auf dem anderen Kern schon neu aus dem RAM geladen.
Alles wohlgemerkt im AMD Fall - wie schon oft erwähnt ist Intel mit dem L3 inklusiven L2 fein raus.
Ich hab das gestern mal bei Sandy Bridge probiert... da springt ein einzelner Thread auch ständig über die 4(8) Kerne hin und her (lässt dabei aber schön immer einen aus, um nicht in die SMT Falle zu stolpern.
Hm, und was hast Du da nun "probiert" ? Dass die Threads unter Windows Ringelpietz spielen wissen wir doch schon seit mehreren Seiten, darum und auf die Auswirkung auf einen dicken Brocken von 2MB exklusiv - also nicht automatisch im L3 vorliegenden - L2 Cache gehts doch in der Diskussion.
Hard data:
http://www.cs.rochester.edu/u/cli/research/switch.pdf
Kommt wohl auch auf das Working-Set an. Da braucht's über den Bus (!) maximal 200k Takte bei 2 Ghz Xeons. Der reine Context-Switch ist dort bei 7600 Takten.
Tja dann das ganze 100 Mal die Sekunde und du bist schon bei 20 Millionen.
Und ja, ich geh auch selbst in dem Fall von 10k Cycles aus. Und 2000 Zyklen für Scheduling sind auch viel zu viel. 10% never ever. Das wären ja 3 Mio. Zyklen. Willst du mich verarschen?
Nein ich will dich nicht "verarschen".
BlackBirdSR
2011-09-29, 13:52:04
Damit seid ihr beide um eine Größenordnung weit weg vom realen Wert :rolleyes:
@Blackbird: das ist nicht wirklich dein Ernst mit den 512kB-1MB. Die verwendeten Daten landen eigentlich alle mal im L2. Welches Programm kennst du denn, das ein workingset von kleiner 1MB hat? :ugly: Also das wirst du nicht wirklich finden. So kleine Programme sind wirklich sehr sehr selten. Mit dem L3 haste da schon eher Aussicht auf Erfolg, dass da die Daten drin bleiben trotz Thread-Wechsel. Bei so was wie Cinebench fliegt dir das Sach aber wohl selbst aus dem L3 raus, und da ist es dann halt schon kacke, wenn du den kompletten Cache neu laden musst, statt nur einem Teil.
Du gehst doch nicht etwa davon aus, dass ein Working set komplett ganz im L2+L3 Cache liegt? Das sind gerade benötigte Speicherbereiche + umgebende damit die Cacheline voll ist.
Die gerade benötigten Cachelines ja, der Rest wird evicted und alles andere ständig per Prefetch vorgeladen. Dabei wäre es tödlich, wenn der (dann rießige) Cache nur immer für einen Thread alle Daten fassen müsste und der Rest ganz rausgeworfen und neu geladen wird. Dann hättest Du ja genau das Problembei jedem Slice, was BD gerade beim Modulwechsel haben sollte.
Wenn BD wie K10 arbeitet, wird in den L3 Cache sowieso nichts geladen, da dieser nicht am Prefetcher hängt. Stattdessen fliegt der letzte Datenbereich aus dem L2 in den L3, wird dort wieder in den L1D des anderen Moduls/Kerns geladen und der L2 macht beim Prefetching da weiter, wo vorher aufgehört wurde. Das Ganze kommt sicher nicht auf 10-15% raus---- wobei wir ja jetzt schon Angaben mit 1% haben. Bei 1-3% sag ich ok. Dazu brauch ich aber keinen Windows Patch.
Ronny145
2011-09-29, 14:00:34
Etwas gewagt, den FX-4100 über den Phenom II X4 960T zu stellen. Auf den ersten Blick sieht es natürlich so aus (4 Kerne mit 3,6 GHz gegen 4 Kerne mit 3,0 GHz). Ob das auch in der Praxis so sein wird? Der 960T erlaubt Turbo Core bis 3,4 GHz, der FX-4100 bis 3,8 GHz. Und der 960T hat etwas mächtigere Cores als der FX-4100. Am Ende könnte es auf einen Gleichstand hinauslaufen.
Eigentlich müsste der X4 960T klar vorne liegen. Bessere IPC und bessere multithread Skalierung mit 4 Kernen. Das bisschen mehr Takt beim 2 Moduler wird das wohl kaum kompensieren können.
Skysnake
2011-09-29, 14:36:19
Hard data:
http://www.cs.rochester.edu/u/cli/research/switch.pdf
Kommt wohl auch auf das Working-Set an. Da braucht's über den Bus (!) maximal 200k Takte bei 2 Ghz Xeons. Der reine Context-Switch ist dort bei 7600 Takten.
Das ein Context-Switch teuer ist, ist ja wohl hoffentlich allgemein bekannt. Mit >7k Takte hätte ich jetzt nicht gerechnet, aber so ~1k hatte ich auch rum im Kopf. Wenn ich das aber jetzt beim schnellen überfliegen richtig verstanden habe, sind die ~39 µs bei einem Contextswitch betrachtet, wo alle Daten in den L2 passen. Bei Programmen wie SuperPi und Cinebench ist dies aber nicht der Fall. Für diesen Fall, wo das nicht rein passt, schnellt die Zeit hoch auf ~203µs, und das bei einem Cache von gerade mal 512kB. Der L2 vom BD ist aber 4 mal so groß. Jetzt mal dir mal aus, wie lange das dauert. Bei 2 GHz sind die ~200 µs ja rund 406k Takte...
GENAU aus diesem Grund nutzt man ja innerhalb eines Programms auch Threads statt komplett eigener Prozesse, weil eben ein Thread-Wechsel VIEL schneller geht als der Wechsel eines Prozesses.
@BlackBirdSR:Es ist halt die Frage, wie groß das Workingset ist. Gerade bei Benches wie Cinebench, wo die Datenlokalität wohl relativ grottig sein wird, wird der L2 ziemlich voll sein mit Prefetches.
Bei SuperPi müsste man sich mal anschauen, wie groß das Workingset bei 1M und 32M ist. Es kann schon sein, das für die Genauigkeit der Datensatz zu groß wird. Kann das mal jemand kurz überschlagen, wie viele Bytes man braucht um eine Millionen Nachkommastellen als FP darstellen zu können? Bin da grad überfragt. Jaja, ich weiß, eigentlich sollte ich es wissen -.-
Wenn BD wie K10 arbeitet,
.. was nicht der Fall ist:
So wars beim K10:
Hardware Prefetcher Optimizations
Previous AMD64 processors prefetched data into the L2 cache[Das war der K8]. In AMD Family 10h processors, the data hardware prefetcher loads data into the L1 cache. This hides the L2 cache access latency and offers significant performance improvement. However, this slightly increases the risk of thrashing and cache pollution, as discussed later in Section 5.5.
Neue Version für K15:
Hardware Prefetcher Optimizations
In AMD Family 15h processors, the data hardware prefetches data into either the L1 or L2 cache. The L1 hardware prefetcher in AMD Family 15h processors is a stride prefetcher that is triggered by L1 cache misses and received training data from the L2 prefetcher. Stride of up to ±504 bytes accessed from the same RIP will be detected and this data is used to start the stride prefetcher. Stride prefetching will propagate as long as requests continue at the same stride, or until a 4K page boundary is encountered. Up to 12 different stride patterns can be active at one time.
Region Prefetcher loads into L2
The L2 prefetcher provides high-performance prefetch for both strided and non-strided access patterns. The L2 strided prefetcher works in cooperation with the L1 strided prefetcher to prefetch a large number of streams and to prefetch further ahead in the data stream. The L2 non-strided prefetcher captures correlated data accesses that don’t have fixed stride relationship. The L2 prefetcher can capture up to 4096 independent streams or correlated data patterns. Loads, stores, L1 hardware prefetch, and software prefetch other than NT prefetches or loads, to/from addresses currently not cached, are all tracked by the L2 prefetchers.
Bei 1-3% sag ich ok.
Inwieweit würdest Du das nun ändern?
Ronny145
2011-09-29, 14:54:00
CanardPC hat Bulldozer bereits getestet, eine Preview vom Heft gibt es online.
"In the more upscale, FX processors based on the Bulldozer architecture we also disappointed: while they are still generally more efficient than their predecessors and allow AMD to approach much of the last Core i5 and i7 but their performance remains below expectations. Besides, as we announced already in our previous issue, if they can sometimes compete with Sandy Bridge in the applications of rough calculations, the results are in video games very far behind. Only overclockers (and fanboys) will find them a great interest given their predisposition in this area. "
"Offered at a price slightly lower than the Core i7-2600K Intel, the FX-8150 is currently the most powerful model from the new architecture" Bulldozer "for AMD. Unfortunately, he fails, at best, that to match its direct competitor in some media processing applications and is always behind in games. "
http://translate.google.com/translate?hl=en&sl=fr&tl=en&u=http%3A%2F%2Fwww.pcworld.fr%2F2011%2F09%2F28%2Fmateriel%2Fcpu%2Fcpu-bulldozer-fx-8150-amd%2F519649%2F
http://translate.googleusercontent.com/translate_c?act=url&hl=de&ie=UTF8&prev=_t&rurl=translate.google.de&sl=fr&tl=en&twu=1&u=http://www.comptoir-hardware.com/actus/processeurs/15546-canardpc-livre-son-verdict-sur-les-bulldozer-fx.html&usg=ALkJrhjKxpDRi0FkyZLTMjs5j3f2Na1PJw
Im hardware.fr (http://forum.hardware.fr/hfr/Hardware/Processeur/processeurs-bulldozer-octobre-sujet_856847_686.htm) Forum gibt es ein paar Kommentare von Doc_TB.
That said, given the specifics of this architecture, it can clearly be told what you want to benchmarks. Depending on the benches we select, we will perform diametrically opposed. Take SuperPi, you will have terrible perfs with a FX-8150 under a Core 2 E6700 2006. Take WPrime32, you will have an FX-8150 to a Core i7 2600K. And it's the same in all types of applications. In short, it's a nightmare to test this processor.
No. The diagram of is that of the Alpha. And that's the whole problem. In my (subjective mode, but still based on internal sources) is that AMD has tried to do in Bulldozer. But for one reason or another, even if the hardware is, it does not work in practice. That's why we have seen the projections of AMD in terms of performance fall between mid-2010 and mid-2011. The inter-cluster communication is not working as it was planned the design of the architecture.
It depends on why AMD could not activate in time, but if they arrive in a new stepping, it would be a coup. The hardware of the HT was present from the P4 Willamette in 2000. However, it has been activated until much later, when Intel managed to make it work (almost) correctly. It is quite possible that AMD will succeed as a "Enhanced Bulldozer" ... I said nothing
Gipsel
2011-09-29, 14:59:50
@S940:
Und wenn ich das gerade nicht durcheinander bringe, gibt es noch einen dritten Prefetcher im Speichercontroller, der die Speicherzugriffe analysiert und versucht, demnächst benötigte Daten in einen speziellen Prefetch-Buffer zu laden (also nicht in den L3, der ist ja ein Victim-Cache). Kommt dann die Speicheranforderung wie erwartet, wird sie direkt aus diesem Puffer bedient, man spart sich also die Latenz des DRAMs (nur die interne des Speichercontrollers).
BlackBirdSR
2011-09-29, 15:00:12
.. was nicht der Fall ist:
So wars beim K10:
Neue Version für K15:
Inwieweit würdest Du das nun ändern?
Sorry Gerhin-mismatch! Danke.
Ich würde das gar nicht ändern, es ging nur darum, dass der L3 ein reiner Victim-Cache ist.
Übrigens: Glaubt Ihr nicht auch, dass AMD und Microsoft einen inoffiziellen Windows-Patch für Tester bereitgestellt hätten, wäre dies wirklich die Lösung des Problems?
Ich würde jetzt gerne sagen, dass es eine neue Generation ist und diese zwar Anfangs etwas Probleme hat, dafür aber auf Jahre hin Potential und Marktchancen nach oben bestehen - allerdings habe ich mir da bei IA64 schon die Finger verbrannt.
LovesuckZ
2011-09-29, 15:16:23
CanardPC hat Bulldozer bereits getestet, eine Preview vom Heft gibt es online.
http://translate.google.com/translate?hl=en&sl=fr&tl=en&u=http%3A%2F%2Fwww.pcworld.fr%2F2011%2F09%2F28%2Fmateriel%2Fcpu%2Fcpu-bulldozer-fx-8150-amd%2F519649%2F
http://translate.googleusercontent.com/translate_c?act=url&hl=de&ie=UTF8&prev=_t&rurl=translate.google.de&sl=fr&tl=en&twu=1&u=http://www.comptoir-hardware.com/actus/processeurs/15546-canardpc-livre-son-verdict-sur-les-bulldozer-fx.html&usg=ALkJrhjKxpDRi0FkyZLTMjs5j3f2Na1PJw
Im hardware.fr (http://forum.hardware.fr/hfr/Hardware/Processeur/processeurs-bulldozer-octobre-sujet_856847_686.htm) Forum gibt es ein paar Kommentare von Doc_TB.
Deckt sich mit den geleakten Folien. Schlechte IPC pro Modul, resultiert in Gleichstand bei Anwendungen, deren Aufgaben vernünftig auf mehrere Threads aufgeteilt werden kann.
Ich will garnicht wissen, hinter welchen Prozessoren Bulldozer in Mafia 2 mit der Cloth-Simulation liegt...
Übrigens: Glaubt Ihr nicht auch, dass AMD und Microsoft einen inoffiziellen Windows-Patch für Tester bereitgestellt hätten, wäre dies wirklich die Lösung des Problems?
Die Hersteller selbst sind sich dessen bewusst, niemand designt einen Prozessor der bei Conextswitches elendig lang braucht. Darum gehts (zumindest mir) gar nicht.
Skysnake
2011-09-29, 16:40:25
Sorry Gerhin-mismatch! Danke.
Ich würde das gar nicht ändern, es ging nur darum, dass der L3 ein reiner Victim-Cache ist.
ja?
Übrigens: Glaubt Ihr nicht auch, dass AMD und Microsoft einen inoffiziellen Windows-Patch für Tester bereitgestellt hätten, wäre dies wirklich die Lösung des Problems?
Ich würde jetzt gerne sagen, dass es eine neue Generation ist und diese zwar Anfangs etwas Probleme hat, dafür aber auf Jahre hin Potential und Marktchancen nach oben bestehen - allerdings habe ich mir da bei IA64 schon die Finger verbrannt.
Das geht aber nur, wenn das Ding durch die Qualitätssicherung durch ist, bzw. überhaupt fertig ist. Der SMT-Support hat ja doch auch etwas länger gedauert. Es ist zwar davon aus zu gehen, dass das bei CMT schneller geht, aber eine Garantie gibt es dafür nicht.
Ronny145
2011-09-30, 09:56:38
Latest ETA update from my supplier is now early November. This uncertainty is why I'm not quite ready to take actual orders yet - I don't want to tie up people's money until I can be more definitive
http://www.overclock.net/15112120-post95.html
Ein Paperlaunch hätte uns jetzt noch gefehlt.
Lawmachine79
2011-09-30, 09:59:16
http://www.overclock.net/15112120-post95.html
Ein Paperlaunch hätte uns jetzt noch gefehlt.
Wenn die CPU performt wie es absehbar ist, kauft sie eh keiner.
Spasstiger
2011-09-30, 10:29:14
Wenn die CPU performt wie es absehbar ist, kauft sie eh keiner.
Kommt auf die Preise an. Eine CPU mit 32 PEG-2.0-Lanes für SLI/Crossfire/PCIe-SSDs und OC-Potential bis 5 GHz mit LuKü (und 8,4 GHz mit exotischer Kühlung) für unter 200€ könnte schon ihre Anhänger finden. Intel wird die Sockel-2011-CPUs sicher nicht so günstig anbieten.
/EDIT: Die PEG -Lanes sitzen natürlich im Chipsatz (AMD 990 FX). Es ist bei AMD aber halt möglich, mit einer Desktop-Mainstreamplattform volle 32 PEG-Lanes zu bekommen, wohingegen bei Intel dafür eine teure Workstation-Plattform nötig ist.
Für jemanden der sich flüssiges He zur Kühlung, 2 Enthusiasten-GPUs oder SSDs die normale SATA-Controller überfordern kauft spielt der Preis einer CPU mit Sicherheit keine Rolle.
Lawmachine79
2011-09-30, 10:35:33
Kommt auf die Preise an. Eine CPU mit 32 PEG-2.0-Lanes für SLI/Crossfire/PCIe-SSDs und OC-Potential bis 5 GHz mit LuKü (und 8,4 GHz mit exotischer Kühlung) für unter 200€ könnte schon ihre Anhänger finden. Intel wird die Sockel-2011-CPUs sicher nicht so günstig anbieten.
Ja, wenn man genug "Wenns" und "Abers" reinpackt passt es für den einen oder anderen. Bei mir wird sich viel über die OC-Fähigkeit entscheiden. Damit meine ich aber das "einfache" OC, Luftkühlung, moderate Spannungserhöhung und dann Multiplikator erhöhen. Bin ja mal gespannt ob der Bulldozer sich "Out-of-the-Box" besser übertakten lässt als ein SB.
Spasstiger
2011-09-30, 10:49:29
Bulldozer wird für vergleichbare Performance auf jeden Fall eine weit stärkere Kühlung benötigen als Sandy Bridge.
Aber Übertakter mit LN2 dürften ihre Freude haben. Sandy Bridge macht spätestens bei 5,7 GHz dicht und LN2 bringt dort nur geringe Vorteile gegenüber einer starken WaKü. Mit Bulldozer kann so mancher wieder seine LN2-Pötte auspacken. ;)
Ich gehe davon aus, dass es den einen oder anderen synthetischen Benchmark geben wird, wo ein Bulldozer in den Bestenlisten ganz oben steht. Dass davon der Otto-Normal-Übertakter mit Tower-Luftkühler was hat, bezweifle ich.
Lawmachine79
2011-09-30, 10:54:57
Mit Bulldozer kann so mancher wieder seine LN2-Pötte auspacken. ;)
Irgendwie finde ich meine zahlreichen LN2-Pötte aber nicht ;).
Dass davon der Otto-Normal-Übertakter mit Tower-Luftkühler was hat, bezweifle ich.
That's me ;).
Ehrlich gesagt bin ich da schon am Hadern. Ich hatte bisher nur AMD-CPUs, auch in meinem ersten Selbstbau-PC von 1994 (der hatte zuerst noch einen SGS Thompson DX2-80). Ich will auch keinen Intel. Aber so wie es aussieht, lässt AMD sogar den "Fanboys" keine Wahl.
Ehrlich gesagt bin ich da schon am Hadern. Ich hatte bisher nur AMD-CPUs, auch in meinem ersten Selbstbau-PC von 1994 (der hatte zuerst noch einen SGS Thompson DX2-80). Ich will auch keinen Intel. Aber so wie es aussieht, lässt AMD sogar den "Fanboys" keine Wahl.
Naja, mit OC seh ichs entspannter, da reicht die Leistung wieder in jedem Fall und zukünftige Spielchen werden mehr und mehr von 8 Threads profitieren. Canard schreibt ja auch, dass der 8120 (mit OC) der P/L Sieger werden soll. $205 eTail Preis sehen nach ein paar Dollar weniger als der 2500K aus, wäre doch ok. Wenigstens (bei dichtem Getümmel) in BF3 & Anno sollte der 8120+OC (deutlich) vorne liegen, bei Rendersachen sowieso.
Kommt dann darauf an, welche Spielepräferenzen man so pflegt. Immerhin kann man sagen, dass es besser als beim Barcelona Start läuft, immerhin liegt man in ein paar Apps gleichauf mit Intels Spitzenmodell.
Aber ähnlich wie beim Phenom2 wird wohl auch für Bulldozer die BDv2 Version die Kastanien aus dem Feuer holen müssen. Der dicke Knaller wirds sich nicht, weswegen AMD das Preisfeuerwerk zündet.
dllfreak2001
2011-09-30, 11:42:06
Hast Recht, der BD ist so wie er sich jetzt gibt ein Griff ins Klo.
Gibt es eigentlich praxisrelevante Situationen in denen die CPU einen deutlichen Vorteil gegenüber den Phenom2-Prozessoren hat.
Lawmachine79
2011-09-30, 11:53:09
Aber ähnlich wie beim Phenom2 wird wohl auch für Bulldozer die BDv2 Version die Kastanien aus dem Feuer holen müssen. Der dicke Knaller wirds sich nicht, weswegen AMD das Preisfeuerwerk zündet.
Joar, für Intelhardware bekommt man immer gute Gebrauchtpreise, vielleicht komme ich sogar (naja, fast ;) ) bei 0 raus, wenn ich mir jetzt SB kaufe und dann BDv2.
R.I.P.
2011-09-30, 11:54:34
Hast Recht, der BD ist so wie er sich jetzt gibt ein Griff ins Klo.
Gibt es eigentlich praxisrelevante Situationen in denen die CPU einen deutlichen Vorteil gegenüber den Phenom2-Prozessoren hat.
Klar, beim Stromsparen! :freak: Sorry, konnte ich mir nicht verkneifen. Aber wie oben gesagt: auf nächstes stepping warten und mMn wird es besser werden. Mit Vishera (BD2) sowieso
Hast Recht, der BD ist so wie er sich jetzt gibt ein Griff ins Klo.
Gibt es eigentlich praxisrelevante Situationen in denen die CPU einen deutlichen Vorteil gegenüber den Phenom2-Prozessoren hat.
Muss man das immer so überdramatisieren? AMD hat mit Llano viel mehr ins Klo gegriffen, weil die die Fertigung bei dem Ding nicht in den Griff bekommen. BD wird nicht so schnell - gut - dann wird er halt billig, so wie Thuban. Man hält sich so über Wasser und gut.
Jetzt schon den schwarzen Peter an die Wand zu malen find ich echt zum heulen, man weiss doch garnicht was da kommt. Man kennt ja nichtmal BD und seine Stärken und Schwächen.
anddill
2011-09-30, 12:05:11
Sehts doch positiv. Begrenze CPU-Leistung verringert oder verhindert die Microruckler bei Multi-GPU-Systemen.
:devil:
boxleitnerb
2011-09-30, 12:07:57
Das stimmt zwar, habs selbst getestet, aber davon hast du auch nichts, wenn in besonders fordernden Szenen dann plötzlich doch die CPU limitiert und du einen fps Einbruch hast ;)
Ich hoffe, BD2 wird richtig reinhauen, dann sehen wir vielleicht auch von Intel 6-Kerner in 22nm für den Mainstreammarkt. Sonst haben die doch keinen Anreiz.
@S940:
Und wenn ich das gerade nicht durcheinander bringe, gibt es noch einen dritten Prefetcher im Speichercontroller, der die Speicherzugriffe analysiert und versucht, demnächst benötigte Daten in einen speziellen Prefetch-Buffer zu laden (also nicht in den L3, der ist ja ein Victim-Cache). Kommt dann die Speicheranforderung wie erwartet, wird sie direkt aus diesem Puffer bedient, man spart sich also die Latenz des DRAMs (nur die interne des Speichercontrollers).
Jo, der kam in meinem Zitat gleich danach, aber da es nur um die Caches ging, hab ich den weggelassen.
Übrigens: Glaubt Ihr nicht auch, dass AMD und Microsoft einen inoffiziellen Windows-Patch für Tester bereitgestellt hätten, wäre dies wirklich die Lösung des Problems?
Ich würde jetzt gerne sagen, dass es eine neue Generation ist und diese zwar Anfangs etwas Probleme hat, dafür aber auf Jahre hin Potential und Marktchancen nach oben bestehen - allerdings habe ich mir da bei IA64 schon die Finger verbrannt.
Naja, IA64 ... Potential hatten die wirklich, aber ohne Software und mit nur putziger x86 Kompatibilität kann mans vergessen. Ich sehe da schon Potential für BD nach oben. Neben dem potentiellen WindowsPatch (den sehe ich bei ~5%, wer brachte da 10-15% ins Spiel?), noch den L1I$ (laut Linux Leuten ja max. 3%, in MicroBenches deutlich mehr), plus Krimskrams (größerer L1 TLB, etc.~2%) wären wir bei grob +10%. Dazu dann noch IPC Plus oben drauf. So wies ausschaut ist der µOp Cache bei BDv1 nicht an Bord, wenn der dann mal kommt (gibt immerhin Patente), sollte das schon nen netten Effekt haben. Für Bdv3 könnte man sogar an die Speculative Sache mit dem HelperThread auf dem 2ten Cluster denken, der in den gemeinsamen L2 prefetcht.
Aber gut, Ende der Märchenstunde - vielleicht kommt auch *nur* Kleinkram, wir reden ja über AMD :freak:
http://www.overclock.net/15112120-post95.html
Ein Paperlaunch hätte uns jetzt noch gefehlt.Lol, wäre wirklich "witzig" ... man kann nur hoffen, dass der Kollege dort eher ein kleines Händlerlicht wäre. Klar, dass er die Teile dann als Letzter bekäme, wenn er nur 5-10Stück ordert. Solange newegg oder alternate hierzulande nicht klagen .. ok ;-)
Joar, für Intelhardware bekommt man immer gute Gebrauchtpreise, vielleicht komme ich sogar (naja, fast ) bei 0 raus, wenn ich mir jetzt SB kaufe und dann BDv2.
Wird diesmal wohl ausnahmsweise nichts, da Intel mit der neuen Gen. sockelkompatibel bleibt. Damit sollte ein 1155er Sandy eigentlich billiger werden, wenn die 1155er Ivys kommen. Außer Intel setz die oben drauf, und läßt die Preisliste sonst gleich, quasi wie bei Westmere Ivy erstmal im Extreme-Preissegment. Aber wenn ich mich recht erinnere gibts da schon Roadmaps, die dagegen sprechen.
dllfreak2001
2011-09-30, 12:25:39
Muss man das immer so überdramatisieren? AMD hat mit Llano viel mehr ins Klo gegriffen, weil die die Fertigung bei dem Ding nicht in den Griff bekommen. BD wird nicht so schnell - gut - dann wird er halt billig, so wie Thuban. Man hält sich so über Wasser und gut.
Jetzt schon den schwarzen Peter an die Wand zu malen find ich echt zum heulen, man weiss doch garnicht was da kommt. Man kennt ja nichtmal BD und seine Stärken und Schwächen.
Die Situation hat man ja jetzt schon, nur welchen Anreiz soll ich haben von einem Ph2 auf einen BD zu wechseln?
Ri*g*g*er
2011-09-30, 12:39:10
Keinen, Du kannst Dein System noch ne Weile behalten und Dich daran freuen, Geld gespart zu haben ^^
Oder wechselst halt auf nen Intel.
Ich denke diesen Winter sollte man mit nem Ph2 noch sehr gut durchkommen und kann sich dann nächsten Winter umsehen.
Gruss
Ri*g*g*er
Ronny145
2011-09-30, 13:12:21
Lol, wäre wirklich "witzig" ... man kann nur hoffen, dass der Kollege dort eher ein kleines Händlerlicht wäre. Klar, dass er die Teile dann als Letzter bekäme, wenn er nur 5-10Stück ordert. Solange newegg oder alternate hierzulande nicht klagen .. ok ;-)
Meanwhile, AMD's server processor codenamed Interlagos will also have difficulty shipping on schedule and is expected to be delayed to November.
http://www.digitimes.com/news/a20110930PD207.html
Solange es nur die Server betrifft...
LovesuckZ
2011-09-30, 13:53:10
Ein Paperlaunch von Bulldozer kann passieren, wenn man sieht, dass AMD nichtmal die paar Server-Chips "pünktlich" ausliefern konnte.
Additionally, shipments of AMD's next-generation server processor, codenamed "Interlagos", occurred later in the third quarter than originally anticipated.
http://phx.corporate-ir.net/phoenix.zhtml?c=74093&p=irol-newsArticle&ID=1611144&highlight=
http://www.digitimes.com/news/a20110930PD207.html
Solange es nur die Server betrifft...
Hmmm sieht echt nach wenig Volumen aus.
Zuerst schieben sie FX für die Cray Opterons, und jetzt siehts so aus, als ob die Massenmarkt Opterons für FX geschoben wurde. Hört sich so an, als ob in DD nur einzelne DIEs von Band kommen, und keine kompletten Wafer :freak:
Jetzt bin ich dann aber doch gespannt, wieviele FXe auf den Markt kommen.
Die Situation hat man ja jetzt schon, nur welchen Anreiz soll ich haben von einem Ph2 auf einen BD zu wechseln?
Zwingt dich niemand das zu tun. Von Thuban auf BD zu wechseln lohnt sich vllt wirklich nicht, muss man aber auch nicht tun. Wenn man einen 4,2 oder 4,5 GHz Piledrive nächstes Jahr bekommt kann das wieder ganz anders aussehen.
An einen Paperlaunch kann man jetzt nicht mehr ernsthaft glauben - die Produktion der Thubans und Denebs läuft aus, da muss Ersatz kommen. Es kommen halt nur weniger als erwartet.
Dural
2011-09-30, 16:07:33
Die Situation hat man ja jetzt schon, nur welchen Anreiz soll ich haben von einem Ph2 auf einen BD zu wechseln?
Welcher Anreiz hattest du den, um von xxx auf Ph2 zu wechseln :freak:
Den gibt s bei AMD doch eh nie, ausser der Preis...
dildo4u
2011-09-30, 16:11:45
Der X6 war keine so schlechte Option,bin sehr zufrieden jetzt wo ich Dirt 3 und BF3 auf nem 64 Server gespielt hab.Neuere Engine's skalieren mitlerweile sehr gut und für die alten Games ist die CPU schnell genug.
Thunder99
2011-09-30, 16:26:06
Irgendwie finde ich meine zahlreichen LN2-Pötte aber nicht ;).
That's me ;).
Ehrlich gesagt bin ich da schon am Hadern. Ich hatte bisher nur AMD-CPUs, auch in meinem ersten Selbstbau-PC von 1994 (der hatte zuerst noch einen SGS Thompson DX2-80). Ich will auch keinen Intel. Aber so wie es aussieht, lässt AMD sogar den "Fanboys" keine Wahl.
Jetzt lass mal die Sache ruhig angehen :)
Eine CPU, die ungefähr 2500k (so heißt es doch) Performance liefert ist doch nicht schlecht! ;) .
Alle wollten, dass die CPU der 2600k Killer wird, aber anscheinend braucht da AMD noch mehr Zeit (und Resourcen...)
Skysnake
2011-09-30, 16:51:42
Zwingt dich niemand das zu tun. Von Thuban auf BD zu wechseln lohnt sich vllt wirklich nicht, muss man aber auch nicht tun. Wenn man einen 4,2 oder 4,5 GHz Piledrive nächstes Jahr bekommt kann das wieder ganz anders aussehen.
An einen Paperlaunch kann man jetzt nicht mehr ernsthaft glauben - die Produktion der Thubans und Denebs läuft aus, da muss Ersatz kommen. Es kommen halt nur weniger als erwartet.
Oder es wird mehr bestellt als erwartet, wobei ich das nach der neusten Meldung bzgl den Problemen mit der 32nm Fertigung und den gesenkten Erwartungen nicht für realistisch halte.l
OgrEGT
2011-09-30, 19:33:58
Die Situation hat man ja jetzt schon, nur welchen Anreiz soll ich haben von einem Ph2 auf einen BD zu wechseln?
Aus meiner Perspektive:
Sofern BD am Ende mehr Leistung hat als mein Ph2 und der Preis OK ist, warum nicht? Wenn im allgemeinen der Unterbau bereits vorhanden ist, ist das System schneller als vorher. Das wieviel schneller in Relation zum Preis wird mich nachher überzeugen müssen. Ansonsten hab ich leistungsmäßig auch jetzt alle Zeit auf die Dinge zu warten, die da kommen werden.
Pentium M
2011-10-01, 00:36:42
@dllfreak2001 : Gibt es eigentlich praxisrelevante Situationen in denen die CPU einen deutlichen Vorteil gegenüber den Phenom2-Prozessoren hat. Laut OBR Link (http://www.imagebanana.com/view/bhnykfxj/winrarbully.png) fand ich diesen Benchmark ziemlich beeindruckend.
Lawmachine79
2011-10-01, 02:01:04
Jetzt lass mal die Sache ruhig angehen :)
Eine CPU, die ungefähr 2500k (so heißt es doch) Performance liefert ist doch nicht schlecht! ;) .
Alle wollten, dass die CPU der 2600k Killer wird, aber anscheinend braucht da AMD noch mehr Zeit (und Resourcen...)
Problem: wenn ich zwei CPUs im Onlineshop bestelle, einen SB und einen Bully und ich sie beide übertakte, ist die Wahrscheinlichkeit sehr hoch, daß ich danach von dem Intel deutlich mehr Performance fürs Geld bekomme. Gerade in Spielen.
Blediator16
2011-10-01, 02:05:19
Problem: wenn ich zwei CPUs im Onlineshop bestelle, einen SB und einen Bully und ich sie beide übertakte, ist die Wahrscheinlichkeit sehr hoch, daß ich danach von dem Intel deutlich mehr Performance fürs Geld bekomme. Gerade in Spielen.
Genau dieses Szenario muss noch getestet werden:cool:
LovesuckZ
2011-10-01, 03:02:10
http://i.imgur.com/nolFY.jpg
http://forums.anandtech.com/showpost.php?p=32349927&postcount=2046
Skysnake
2011-10-01, 07:44:47
Tja und JETZT ist die 1 Millionen Euro Frage, welche CPU sich hinter den 100% verbirgt.
Meine Spekulation dazu:
Core i7-2600k ;)
Könnte aber auch der FX-8150 sein, wobei ich es schöner sehen würde, wenn der 2600k auf 100% festgenagelt wird, um dann eben die ganze Sparte der FX Serie auf einen Blick vergleichen zu können mit dieser CPU. Wenn man die 100% auf den FX-8150 fest nagelt, dann sieht man zwar schöner, wie viel langsamer die anderen CPUs sind, um den genauen prozentualen Abstand zu 2600k zu erhalten, muss man dann wieder umrechnen.
Naja, mal schauen, welche der beiden Varianten es ist. Sooo schlecht sieht es auf jeden Fall nicht aus, wie von den meisten Leuten ständig behauptet.
Ronny145
2011-10-01, 09:10:21
Die CPU mit den 100% müsste die gleiche sein. Könnte der 2500k sein, weil das vielleicht eher der Gegner ist. Die schnellere CPU möglicherweise der 2600k.
Wenn sich darin ein Gulftown verbirgt, kann man das vergessen.
Die 100% ist wenn dann Zambezi ;). Dann würde er gut zwischen 2500k und 2600k liegen, was preislich passen würde. Mit den 100MHz mehr (2700k) würde Intel dann auch gegen den 8170 grade noch die Spitze halten.
Ronny145
2011-10-01, 10:35:40
Die 100% ist wenn dann Zambezi ;). Dann würde er gut zwischen 2500k und 2600k liegen, was preislich passen würde.
Dafür sind die Ergebnisse zu konstant. Bei der Multimedia Leiste könnte es hinkommen, in den Spielen sicherlich nicht. Die konstanten Ergebnisse sprechen eher für einen Sandy Bridge, 2500k mein Tipp.
Ähm das sind Durchschnittswerte... Und wer sagt eigentlich, dass Zambezi in Spielen so schlecht ist? Da hab ich bisher keine Anhaltspunkte entdecken können.
Ronny145
2011-10-01, 10:42:28
Ähm das sind Durchschnittswerte... Und wer sagt eigentlich, dass Zambezi in Spielen so schlecht ist? Da hab ich bisher keine Anhaltspunkte entdecken können.
Na genau deswegen ja. Der Anhaltpunkt für die schlechtere Gaming Leistung ist die mäßige IPC und der Umstand, dass Spiele selten von mehr als 4-5 Kernen profitieren. Desweiteren hat der Autor des Tests die deutlich geringere gaming Leistung bestätigt. (oder ist das ein anderes Französisch Magazin?)
/ist das gleiche Magazin
Knuddelbearli
2011-10-01, 11:00:08
Problem: wenn ich zwei CPUs im Onlineshop bestelle, einen SB und einen Bully und ich sie beide übertakte, ist die Wahrscheinlichkeit sehr hoch, daß ich danach von dem Intel deutlich mehr Performance fürs Geld bekomme. Gerade in Spielen.
dann übertakte mal eine intel cpu in dem preisbereich unter 150€ ;-)
Skysnake
2011-10-01, 11:03:10
Ich hab mir mal die Mühe gemacht, und die relativen Abstände der CPU im Vergleich zum Performance Index von PCGH für Applications (http://www.pcgameshardware.de/aid,675663/Test-AMD-und-Intel-CPUs/APUs-Uebersicht-und-Kauf-Tipps-inklusive-Performance-Index-September-2011-Test-des-Tages/CPU/Test/) angeschaut.
Nachfolgend mal eine Aufstellung, wie die relativen Abstände bei PCGH aussehen, und wie dort.
Sodele nehmen wir mal an, dass die CPU mit 112% der 2600k ist dann sieht das wie folgt aus
CPU; PCGH-Wert genormt auf Anantech-Wert; möglicher Anandtech-Wert
i7-2600k; 112,9%; 112,9%
FX-8150; - ; 102,3%
FX-8100; - ; 100,0%
X6 1100T; 98,4% ; 98,5%
i7-975 XE; 95,6% ; 95,9%
?; ; 94,8%
i5-2500k; 89,2; 90,2
?; ; 87,4%
?; ; 77,3%
?; ; 77,1%
PII X4 980 BE/QX9770; 74,5%/69,7%; 71,2%
PII X4 955 BE; 65,2%; 64,5%
Wie man sieht, passt das an einigen Stellen sehr gut, allerdings gibt es vier Werte, denen man nichts zuordnen kann. Man hätte noch den FX6100 und den FX4100, aber damit kommt man wohl nicht aus. Sind halt nur 2 CPUs für noch mögliche 4 Werte. Es sei denn, Sie haben auch OC CPUs verwendet. Dann wird die Sache aber gleich VIEL schwieriger. Wenn man das in Betracht zieht, könnten 100% der 2600k sein und 112,9% der 2600k mit OC auf ~3,8-4 GHz sein. Dementsprechend wären 98% wohl der FX8150 und die 102,3% der 8150 mit festem OC auf den gleichen Takt wahrscheinlich wie der 2600k.
Ich werde dann auch mal gleich noch schauen, wie es aussieht, wenn der 2500k als 100% Referenz genommen wird.
Botcruscher
2011-10-01, 11:06:53
Genau dieses Szenario muss noch getestet werden:cool:
Eigentlich nur noch prezisiert. Beste Wahl für gutes P/L in Spielen ist seit Monaten der 2500K. Dank hoher IPC und genug OC-Potential.
Skysnake
2011-10-01, 11:11:30
PII X6 1100T; 110,3% ; 112,9%
; - ; 102,3%
i5-2500k; 100,0% ; 100,0% (Reference)
; ; 98,5%
; ; 95,9%
; ; 94,8%
; ; 90,2
?; ; 87,4%
?; ; 77,3%
?; ; 77,1%
; ; 71,2%
; ; 64,5%
Ok, vergesst es. Ich habs versucht. Mit dem 2500k als Referenz für 100%, kann man es knicken, da passt NICHTS, außer dem 1100T von der Größenordnung her. Die Zahlen für alle anderen möglichen CPUs liegen nicht mal in der Nähe der Werte in dem Benchmark.
Wir können also fest halten, dass der 2500k nicht die 100% Referenz ist. Das passt auch nicht mit OC.
Wir können also fest halten, dass der 8150 wohl die 100% sein wird. Was ich mir noch anschauen werde ist, wie es aussieht, wenn der 2600k auf die 100% gesetzt wird. Dann wären die 112% wohl das OC Ergebnis.
Ronny145
2011-10-01, 11:13:05
Und wenn Du das Rating von Computerbase (http://www.computerbase.de/artikel/prozessoren/2011/test-intel-sandy-bridge/46/#abschnitt_performancerating) nimmst, sieht es wiederum ganz anders aus. Das kann nur ein 2500k sein wegen der Spieleleistung. 9% wäre ein zu großer Abstand in Spielen zwischen dem 2500k und 2600k. Da dürfte man nur BC2, Dirt 3 und ähnliches testen. GTA4 und Pripyat gehören in diese Kategorie schonmal nicht. Außerdem wäre trotz der GTX580 die Auflösung mit AA zu hoch, um so einen großen Abstand zwischen dem 2500K und 2600k herbeizuführen. 2500K ist klar am wahrscheinlichsten.
PCGH testet im übrigen ohne Turbo, die Ergebnisse sind dort eh etwas unter der Normalität. Es ist ja auch logisch, dass Bulldozer in Anwendungen besser abschneidet. Es passt überhaupt nicht zusammen, dass Bulldozer bei weniger Kernauslastung, den Spielen, ja fast besser abschneidet.
Skysnake
2011-10-01, 11:24:23
Sodele, dann betrachten wir doch jetzt mal den 2600k als 100% Angabe
; ; 112,9%
FX-8150(?); - ; 102,3%
i5-2600k; 100,0% ; 100,0% (Reference)
FX-8100(?); ; 98,5%
; ; 95,9%
; ; 94,8%
FX-6100(?); ; 90,2
PII X6 1100T; 84,7% ; 87,4%
PII X6 1055T; 74,8%; 77,3%
i5-2400; 74,2%; 77,1%
i7-930; 71,0%; 71,2%
PII X4 980BE; 66,0%; 64,5%
Wie man sieht, das passt auch nicht so wirklich rein, auch wenn es nicht sooo schlecht aussieht, aber man hat doch relativ große Abweichungen, die aber recht konstant bei 3 Prozentpunkten liegen.
Btw. hier noch das Spielen mit 112% 990X und 100 % FX8150. Der 2600k würde da nur auf 83,4% kommen, was hier nicht wirklich einem Wert entspricht. Ich denke daher nicht, dass der 9?0X die 112% Markieren.
Entweder es ist der 2600k, oder es eine CPU mit OC, und dann kann man die Zuweisung echt vergessen, da es VIEL zu VIELE Variationsmöglichkeiten gibt.
Skysnake
2011-10-01, 11:27:56
Und wenn Du das Rating von Computerbase (http://www.computerbase.de/artikel/prozessoren/2011/test-intel-sandy-bridge/46/#abschnitt_performancerating) nimmst, sieht es wiederum ganz anders aus. Das kann nur ein 2500k sein wegen der Spieleleistung. 9% wäre ein zu großer Abstand in Spielen zwischen dem 2500k und 2600k. Da dürfte man nur BC2, Dirt 3 und ähnliches testen. GTA4 und Pripyat gehören in diese Kategorie schonmal nicht. Außerdem wäre trotz der GTX580 die Auflösung mit AA zu hoch, um so einen großen Abstand zwischen dem 2500K und 2600k herbeizuführen. 2500K ist klar am wahrscheinlichsten.
Die Ergebnisse Streuen schon sehr stark, da hast du Recht.
PCGH testet im übrigen ohne Turbo, die Ergebnisse sind dort eh etwas unter der Normalität. Es ist ja auch logisch, dass Bulldozer in Anwendungen besser abschneidet. Es passt überhaupt nicht zusammen, dass Bulldozer bei weniger Kernauslastung, den Spielen, ja fast besser abschneidet.
Ja, und wenn hier mit Turbo getestet wird, dann kann das eventuell schon sein, wenn jedes Modul einen eigenen Thread bekommt, oder eben 2 Module komplett abgeschaltet werden, und der Turbo schön hoch jagt. Also ich würde das nicht für unmöglich halten. Der Turbo ist halt schon sehr aggressiv.
Ronny145
2011-10-01, 11:38:01
Ja, und wenn hier mit Turbo getestet wird, dann kann das eventuell schon sein, wenn jedes Modul einen eigenen Thread bekommt, oder eben 2 Module komplett abgeschaltet werden, und der Turbo schön hoch jagt. Also ich würde das nicht für unmöglich halten. Der Turbo ist halt schon sehr aggressiv.
Das hat doch mit deinem PCGH Link nichts zu tun, oder versteckt sich dort ein Bulldozer? Die 100% passen für Multimedia und Spiele nicht zusammen, absolut nicht. Der Autor des Tests hat die deutlich geringere gaming Leistung bereits bestätigt. Die Konstanz trifft auf den 2500k zu, verglichen mit dem CB Rating passt das.
Ein andere Möglichkeit wäre die OC CPU. Aber irgendwie passt dann der 2600k nirgends rein. Die anderen CPUs wären quasi gleichauf in Anwendungen.
Bei den Benchmarks kann eigentlich kein 990x/980x/980 mit dabei sein, da sich die 112,9% bei dem ersten Teil auf SMT beziehen müssen - die anderen Abstände im oberen Bereich sind mMn einfach zu klein. Das bedeutet dann, dass alle der "schnellsten" definitiv ein 2600k sein müssen. Darunter wirds spannend. Zwischen 2500k und 2400 liegen bei Anwendungen etwas 3,5%, zwischen 2300 und 2400 etwa 4%, da zwischen sind noch I7 960/970, wobei man hiervon sicher nur einen verwendet hat. Alles andere muss von FX aufgefüllt sein.
Ronny145
2011-10-01, 12:02:27
Bei der Anwendung wären die 102,3% für Bulldozer denkbar und 98,5% für einen Thuban. Vermutlich muss Bulldozer im Blender (http://ht4u.net/reviews/2011/intel_sandy_bridge_sockel_1155_quadcore/index48.php) und Photoshop (http://www.anandtech.com/show/4083/the-sandy-bridge-review-intel-core-i7-2600k-i5-2500k-core-i3-2100-tested/15) Benchmark Federn lassen.
Skysnake
2011-10-01, 12:06:34
Ein X6 und ein X4 werden aber sicherlich auch mit dabei sein. Ich kann mir nicht vorstellen, dass die den direkten Vorgänger nicht mit drin haben in den Benchmarks.
MÖPE -.- FAIL ME..
Es steht doch sogar drin, das eben ein 1155 und AM3+ System verwendet werden. Von 1156/1366 ist keine Rede, und es werden ja auch X6 und X4 genannt.
Sodele, dann können wir ja weiter spekulieren, wem welcher Zahlenwert gehört :biggrin:ü
Wieso ordnest du den Thuban so weit oben ein? MMn ist der 1100t bei 87,x% im oberen Bench, nicht mehr. Die 90,2% könnten von einem I5 2300 oder 2400S stammen.
Skysnake
2011-10-01, 12:14:24
Weil ich eben die relativen Abstände in dem Benchmark mit der Annahme, dass der 2600k die 112,9% ist, mit denen aus dem PCGH Rating abgeglichen habe. Deswegen habe ich doch extra beide Werte hin geschrieben.
Der linke %-Wert ist der genormte Werte aus dem PCGH Rating, und der Rechte eben der aus dem Anandtech-Benchmark.
anddill
2011-10-01, 12:18:44
Wahrscheinlich werde ich langsam alt und gelassen. Die ganze Spekuliererei lässt mich erstaunlicherweise fast völlig kalt. Oder es liegt daran, daß ich sowieso schon lange beschlossen hab, mir das Ding zu holen, einfach so aus Spaß am Basteln.
Ronny145
2011-10-01, 12:24:41
Wieso ordnest du den Thuban so weit oben ein? MMn ist der 1100t bei 77,3% und der 1090t bei 77,1% im oberen Bench.
Thuban 1100T ist etwas schneller als der 2500k wenn alle Kerne voll ausgelastet werden. Sind natürlich nicht nur solche Benchmarks dabei. Ja dann könnte es auch ein langsamerer i5 sein. Schwer zu sagen wie die Gewichtung ausfällt. 77% wären zu weit hinten für einen Thuban. Das wären ja 23% Differenz in der Annahme, dass 100% zum 2500k gehören. Im CB Test sind es in Anwendungen 14% Unterschied. Die 77% könnten für einen X4 Phenom passen. Der andere 77% Balken gehört vielleicht einem i3 von Intel.
Habs korrigiert ;). Dennoch seh ich den Prozessor weiter unten. Die meisten Durchschnittsbenchmarks sehen den Thuban klar unter dem 2300 und der 2300 liegt bei den meisten Benches ca. 20% hinter dem 2600k.
Wahrscheinlich werde ich langsam alt und gelassen. Die ganze Spekuliererei lässt mich erstaunlicherweise fast völlig kalt. Oder es liegt daran, daß ich sowieso schon lange beschlossen hab, mir das Ding zu holen, einfach so aus Spaß am Basteln.
Gesunde Einstellung. Aber Spekulieren macht auch Spass ;). Ich werd mir BD vor allem deshalb holen, weil er wohl noch in mein CH4 passt, was später bei Vishera unwahrscheinlich ist. Aber ich werden den 8170 nehmen, mich drängts nicht danach, sofort zuzuschlagen.
Skysnake
2011-10-01, 12:35:04
Naja, es sind aber eben nur Anwendungen, ohne Spiele, und die wo verwendet werden, sollten eigentlich alle alle Kerne gut auslasten. SuperPi, Chess und auch wPrime sind alle nicht dabei. Ein X6 sollte daher schon recht gut abschneiden.
Monkey
2011-10-01, 12:36:58
Fällt heute nicht das NDA?
Ronny145
2011-10-01, 12:40:10
Habs korrigiert ;). Dennoch seh ich den Prozessor weiter unten. Die meisten Durchschnittsbenchmarks sehen den Thuban klar unter dem 2300 und der 2300 liegt bei den meisten Benches ca. 20% hinter dem 2600k.
In einem Anwendungsdurchschnitt? i5-2300 liegt 4% vorm 1100T im CB Test. Selbst wenn die 98,5% einen kleineren i5 darstellen, bleibt genügend Platz für Thuban. Außerdem sind zu viele CPUs im 90er Bereich. Glaube kaum, dass mehr als zwei i5 im Test sind. 1 oder gar 2 Thubans sollten sich im 90er Bereich bewegen.
mapel110
2011-10-01, 12:41:20
Fällt heute nicht das NDA?
12. Oktober steht doch als Datum fest.
Monkey
2011-10-01, 12:50:49
Hm hab irgendwie was vom 1.10 im Kopf gehabt.
Ich will auch mal so ne tolle Spekuliste basteln :freak:
112,9% = I7 2600k
102.3% = I5 2500k
100.0% = FX 8150
98,5% = I5 2400
95,9% = P2 1100t
94,8% = FX 6100
90,2% = P2 1055t
87,4% = P2 960
77,3% = I3 ?
77,1% = Llano ?
Ich denke, dass der 2500k hier schneller sein sollte als der FX, da Photoshop nur Intels liegt und der FX aufgrund fehlender Optimierung in Cinebench nicht so gut darstehen wird (gibt kein passendes CPU-Profil in 11.5).
mironicus
2011-10-01, 13:04:54
X264-Pass 2 wer ist da wohl besser? FX8150 oder i7-2600k? :)
Sir Integral Wingate Hellsing
2011-10-01, 13:13:57
Wahrscheinlich werde ich langsam alt und gelassen. Die ganze Spekuliererei lässt mich erstaunlicherweise fast völlig kalt. Oder es liegt daran, daß ich sowieso schon lange beschlossen hab, mir das Ding zu holen, einfach so aus Spaß am Basteln.
Daumen hoch! :cool: :D
Ist auch lustig, wenn man die Diskussionen Pre-K8 und Pre-K10 vergleicht, lohnt sich im Forum zu stöbern ;)
Skysnake
2011-10-01, 13:38:23
Ich will auch mal so ne tolle Spekuliste basteln :freak:
112,9% = I7 2600k
102.3% = I5 2500k
100.0% = FX 8150
98,5% = I5 2400
95,9% = P2 1100t
94,8% = FX 6100
90,2% = P2 1055t
87,4% = P2 960
77,3% = I3 ?
77,1% = Llano ?
Ich denke, dass der 2500k hier schneller sein sollte als der FX, da Photoshop nur Intels liegt und der FX aufgrund fehlender Optimierung in Cinebench nicht so gut darstehen wird (gibt kein passendes CPU-Profil in 11.5).
Und kannst du uns jetzt auch noch erklären, wie du auf die Zuteilung gekommen bist? Oder haste einfach mal das hingeschrieben was du denkst?
Wenn ja, dann vergiss es, vergleiche die relativen Abstände zueinander. Alles andere ist doch einfach nur sinnfrei. Kannst ja mal die CB-Werte nehmen und das umrechnen, ich hab dafür grad keine Zeit ;)
0-Poster
2011-10-01, 13:58:15
X264-Pass 2 wer ist da wohl besser? FX8150 oder i7-2600k? :)
Man hat doch schon in den Vorab Benches, die mit B2 Bulldozern und Windows im Normalen Zustand und ohne Zusatz Performance Patches (sollten diese überhaupt existieren) gemacht wurden, gesehen das der Bulldozer da besser ist, selbst OBR hat solche benches veröffentlicht.
Und es ist ja wohl klar warum Bulldozer da so abgeht das ding hat immerhin 8 (!) IntegerKerne und x264 ist nunmal Integer heavy und Skaliert sehr gut mit vielen Threads. Ich zitiere mal:
in x264 encoding tests, Bulldozer scores 136fps in the first pass and 45fps in the second pass, whereas the Core i7 2600K manages 100fps and 36fps respectively.
Source: http://fudzilla.com/processors/item/23381-bulldozer-performance-figures-are-in
Im Bench wurde ein 8130P verwendet.
Und so performt das ding wie gesagt ohne Cache da B2 und ohne Windows Treiber Patch. Außerdem und das ist ziemlich geil arbeiten zurzeit x264 devs an XOP/FMA4 Assemby code wenn AMD also Glück hat dann kommt Bulldozer raus und x264 unterstützt schon die neuen Instruction Sets ! Ich zitiere nochmal:
2011-09-28 01:33:33 < Dark_Shikari> Oh bulldozer.
2011-09-28 01:33:41 < Dark_Shikari> AVX mbtree propagate is slower than sse2
2011-09-28 01:33:49 < Dark_Shikari> FMA only barely manages to get it fast again.
2011-09-28 01:33:49 < kemuri-_9> lol
2011-09-28 01:33:52 < Sean_McG> hahah
2011-09-28 01:33:59 < Dark_Shikari> SSE2: 342 cycles
2011-09-28 01:34:00 < Dark_Shikari> AVX: 374
2011-09-28 01:34:05 < Dark_Shikari> FMA4: 340
2011-09-28 01:34:18 < kemuri-_9> lol
2011-09-28 01:34:26 < Dark_Shikari> I guess this makes sense given that it only has 128-bit execution units
2011-09-28 01:34:34 < Dark_Shikari> and the INT16_TO_FLOAT code is obnoxiously slow because avx sucks
2011-09-28 01:34:41 < Dark_Shikari> i.e. avx has no way of doing int16_t -> float fast
2011-09-28 01:35:18 < Dark_Shikari> Hmm. I wonder if FMA4 supports sse registers?
2011-09-28 01:35:37 < Dark_Shikari> Oh. It *does*...
2011-09-28 01:35:38 < Dark_Shikari> Let me try that.
2011-09-28 01:37:45 * codestr0m ears perk up
2011-09-28 01:49:29 < Dark_Shikari> FMA4: 314 cycles. Much better
2011-09-28 01:49:46 < codestr0m> Dark_Shikari: what was the change?
2011-09-28 02:01:21 < Dark_Shikari> using the sse instead of avx version
2011-09-28 02:01:26 < Dark_Shikari> as the basis for xop
Source: http://akuvian.org/src/x264/freenode-x264dev.log.bz2
anddill
2011-10-01, 14:07:16
:cop: Fanboydetector Overload :cop:
Und ich dachte immer, ich wär der größte AMD-Fanboy hier im Forum.
Skysnake
2011-10-01, 14:11:58
Muss man das gerade verstehen?
dildo4u
2011-10-01, 14:12:54
Man hat doch schon in den Vorab Benches, die mit (kaputten) B2 Bulldozern ohne jeglichen Windows Treiber Patch gemacht wurden, gesehen das der Bulldozer da besser ist, selbst OBR hat solche benches veröffentlicht.
Und es ist ja wohl klar warum Bulldozer da so abgeht das ding hat immerhin 8 (!) IntegerKerne und x264 ist nunmal Integer heavy . Ich zitiere mal:
in x264 encoding tests, Bulldozer scores 136fps in the first pass and 45fps in the second pass, whereas the Core i7 2600K manages 100fps and 36fps respectively.
Source: http://fudzilla.com/processors/item/23381-bulldozer-performance-figures-are-in
Und so performt das ding wie gesagt mit kaputtem Cache weil B2 und ohne Windows Treiber Patch ! Außerdem und das ist ziemlich geil arbeiten zurzeit x264 devs an XOP/FMA4 Assemby code wenn AMD also Glück hat dann kommt Bulldozer raus und x264 unterstützt schon die neuen Instruction Sets ! Ich zitiere nochmal:
2011-09-28 01:33:33 < Dark_Shikari> Oh bulldozer.
2011-09-28 01:33:41 < Dark_Shikari> AVX mbtree propagate is slower than sse2
2011-09-28 01:33:49 < Dark_Shikari> FMA only barely manages to get it fast again.
2011-09-28 01:33:49 < kemuri-_9> lol
2011-09-28 01:33:52 < Sean_McG> hahah
2011-09-28 01:33:59 < Dark_Shikari> SSE2: 342 cycles
2011-09-28 01:34:00 < Dark_Shikari> AVX: 374
2011-09-28 01:34:05 < Dark_Shikari> FMA4: 340
2011-09-28 01:34:18 < kemuri-_9> lol
2011-09-28 01:34:26 < Dark_Shikari> I guess this makes sense given that it only has 128-bit execution units
2011-09-28 01:34:34 < Dark_Shikari> and the INT16_TO_FLOAT code is obnoxiously slow because avx sucks
2011-09-28 01:34:41 < Dark_Shikari> i.e. avx has no way of doing int16_t -> float fast
2011-09-28 01:35:18 < Dark_Shikari> Hmm. I wonder if FMA4 supports sse registers?
2011-09-28 01:35:37 < Dark_Shikari> Oh. It *does*...
2011-09-28 01:35:38 < Dark_Shikari> Let me try that.
2011-09-28 01:37:45 * codestr0m ears perk up
2011-09-28 01:49:29 < Dark_Shikari> FMA4: 314 cycles. Much better
2011-09-28 01:49:46 < codestr0m> Dark_Shikari: what was the change?
2011-09-28 02:01:21 < Dark_Shikari> using the sse instead of avx version
2011-09-28 02:01:26 < Dark_Shikari> as the basis for xop
Source: http://akuvian.org/src/x264/freenode-x264dev.log.bz2
Deshalb hat AMD x264 auch nur gegen ein 2500k gebencht. :rolleyes:
http://www.computerbase.de/news/2011-09/erste-offizielle-benchmarks-von-amds-fx-8xxx/
Ein i7 2600k ist dort 26% schneller als ein i5 2500k wäre als vor BD siehe Test 2
http://www.computerbase.de/artikel/prozessoren/2011/test-intel-core-i3-2100t/24/#abschnitt_x264_hd_benchmark_319
Und kannst du uns jetzt auch noch erklären, wie du auf die Zuteilung gekommen bist? Oder haste einfach mal das hingeschrieben was du denkst?
Wenn ja, dann vergiss es, vergleiche die relativen Abstände zueinander. Alles andere ist doch einfach nur sinnfrei. Kannst ja mal die CB-Werte nehmen und das umrechnen, ich hab dafür grad keine Zeit ;)
Das ist wie alle Schätzungen hier ne grobe Überschlagung der relativen Leistungsfähigkeit zueinander. Alles höchst subjektiv natürlich ;).
Die absolute Leistung ist in der Preisklasse doch sekundär,denn schnell genug dürften sowohl Bulldozer als auch 2500 und 2600 sein. Die Frage ist eher wie es mit der Leistung pro Watt aussieht.
mironicus
2011-10-01, 14:27:50
Wenn der FX 8150 so teuer wie ein i5-2500k wird (oder vielleicht etwas günstiger) und beim Videoenkodieren so schnell wie ein i7-2600k ist, und dabei laut OBR so viel Strom wie der i7 zieht, wäre das ein gutes Argument für die AMD-CPU.
Die günstigsten Preise für die neuen CPUs gibt es bestimmt wie beim Llano schon beim Launch. Wenn AMD die CPUs am Anfang etwas subventioniert und sie so 10-20 Euro billiger sind, werden die schnell ausverkauft sein (150 Euro für den FX-8150 :D).
Skysnake
2011-10-01, 14:28:06
Das ist wie alle Schätzungen hier ne grobe Überschlagung der relativen Leistungsfähigkeit zueinander. Alles höchst subjektiv natürlich ;).
Bei mir ist da aber rein gar nichts spekulativ, sondern rein auf den Messwerten von PCGH in Relation zueinander gesetzt.
Ich gehe daher schon davon aus, dass das mit dem 2600k @112,9% richtig sein wird. Sieht von den Zahlenwerten einfach am Besten aus, was die Näherung angeht.
Das Einzige was ich mir noch vorstellen könnte, wäre der 2600k bei 100%. Alles andere ist völlig unwahrscheinlich.
LovesuckZ
2011-10-01, 14:31:57
Wenn der FX 8150 so teuer wie ein i5-2500k wird (oder vielleicht etwas günstiger) und beim Videoenkodieren so schnell wie ein i7-2600k ist, und dabei laut OBR so viel Strom wie der i7 zieht, wäre das ein gutes Argument für die AMD-CPU.
Die günstigsten Preise für die neuen CPUs gibt es bestimmt wie beim Llano schon beim Launch. Wenn AMD die CPUs am Anfang etwas subventioniert und sie so 10-20 Euro billiger sind, werden die schnell ausverkauft sein (150 Euro für den FX-8150 :D).
Wie oft enkodiert man denn heutzutage so Filme?
mironicus
2011-10-01, 14:36:10
Ich ganz viel. Praktisch jeden Tag mehrere DVB-Aufnahmen und momentan viel Reenkodierung von 1080P-Rips in 10 Bit-H264. Spart sehr viel Speicherplatz bei leicht verbesserter Bildqualität.
Eins frage ich mich noch: Welchen Unterschied in der Geschwindigkeit gibt es bei den unterschiedlichsten AM3+ Boards? Ein 760G-Board für 40 Euro vs. ein 990FX-Board für 90 Euro zum Beispiel wenn man nur die CPU als Rechenknecht einsetzen will.
0-Poster
2011-10-01, 14:40:14
Deshalb hat AMD x264 auch nur gegen ein 2500k gebencht. :rolleyes:
http://www.computerbase.de/news/2011-09/erste-offizielle-benchmarks-von-amds-fx-8xxx/
Ein i7 2600k ist dort 26% schneller als ein i5 2500k wäre als vor BD siehe Test 2
http://www.computerbase.de/artikel/prozessoren/2011/test-intel-core-i3-2100t/24/#abschnitt_x264_hd_benchmark_319
Handbrake aktuelle version ist 0.9.5 diese ist vom 3. Januar 2011, d.h. die Benutzten eine alte x264 lib.[1] Die benutzten höchstens rev 1913 aktuell ist rev 2085 warum das ?[2] außerdem ist das Verhältnis komisch warum so schnelle settings und trotzdem so wenig Puste beim BD ? Oder hat Fuad mist gebaut ? ich bin verwirrt ?.? Man kann nur hoffen das die XOP/FMA patches was bringen werden :o
[1]http://handbrake.fr/downloads.php
[2]http://x264.fushizen.eu/?paged=2
Knuddelbearli
2011-10-01, 14:41:50
Hm hab irgendwie was vom 1.10 im Kopf gehabt.
1.10 angeblich cpu versand für die tester
Das Auge
2011-10-01, 15:05:51
Eins frage ich mich noch: Welchen Unterschied in der Geschwindigkeit gibt es bei den unterschiedlichsten AM3+ Boards? Ein 760G-Board für 40 Euro vs. ein 990FX-Board für 90 Euro zum Beispiel wenn man nur die CPU als Rechenknecht einsetzen will.
Prinzipiell gibt es bei Boards und Chipsätzen seitdem der IMC in die CPU gewandert ist (also bei AMD ca. 2003/04) quasi keine Performanceunterschiede mehr zwischen den Boards. Das Verkaufsargument heutzutage heisst "Features" (Ausstattung, OC, ...).
Dennoch würde ich eine CPU, die ständig irgendwelche Berechnungen crunchen soll, nicht auf ein Billigboard setzen, sondern auf eines, welches für sowas auch ausgelegt ist. So ein 40 € µATX-Böller ist nunmal normalerweise für einen Dualcore im Officebetrieb zuständig. Ich hätte bei deinem Einsatzzweck kein gutes Gefühl das Ding so zu betreiben.
Wie oft enkodiert man denn heutzutage so Filme?
In diversen Tests & Benchmarks ganz oft :biggrin:
Eins frage ich mich noch: Welchen Unterschied in der Geschwindigkeit gibt es bei den unterschiedlichsten AM3+ Boards? Ein 760G-Board für 40 Euro vs. ein 990FX-Board für 90 Euro zum Beispiel wenn man nur die CPU als Rechenknecht einsetzen will.
Schliesse mich dem AUGE an, es würde ohne grosse Probleme laufen, aber die Frage ist, wie lange :freak:
Die kleinen Bretter haben oft billigste Spannungswandler, da würde ich auf lange Frist keinen BD drauf los lassen. Als unterste Schiene würde ich die 870a Bretter ansehen. Da gibts z.B. ein paar von Asrock; und Gigabyte in der Rev.3.1., die jetzt 4 jahre Garantie haben (http://www.planet3dnow.de/vbulletin/showthread.php?t=398782)... schau Dich da mal um.
@0-Poster:
Die alten x264 BD/i7 Vergleichswerte waren unfair, der i7 hatte da ein altes Binary,mit dem neuen gings dann ab. Mal schauen, wies mit xop/fma ausgeht. Gut dass der Programmierer da die 128bit FMA Befehle gefunden hat, das ist optimal für die FlexFPU ;-)
(Wobei ich nicht weiss, ob der Fall den er gerade untersuchte überhaupt multithreaded war).
deekey777
2011-10-01, 15:30:49
Wenn der FX 8150 so teuer wie ein i5-2500k wird (oder vielleicht etwas günstiger) und beim Videoenkodieren so schnell wie ein i7-2600k ist, und dabei laut OBR so viel Strom wie der i7 zieht, wäre das ein gutes Argument für die AMD-CPU.
Die günstigsten Preise für die neuen CPUs gibt es bestimmt wie beim Llano schon beim Launch. Wenn AMD die CPUs am Anfang etwas subventioniert und sie so 10-20 Euro billiger sind, werden die schnell ausverkauft sein (150 Euro für den FX-8150 :D).
Ach komm, es gibt doch Quicksync. X-D
Ronny145
2011-10-01, 15:45:44
Ich will auch mal so ne tolle Spekuliste basteln :freak:
Schöne Liste, wegen der Spieleliste können die 100% leider nicht zutreffend sein.
Ronny145
2011-10-01, 17:32:38
http://4.bp.blogspot.com/-ejjh4QYNYaw/TocizISSJBI/AAAAAAAABKg/qpPpPD0Od4g/s1600/update.png
Warum liegt dem Bulldozer Cinebench 10 so viel besser als 11.5? Bei der 1 Thread Leistung sind das 88,25% statt 81,1% eines K10.5.
PassMark
http://www.cpubenchmark.net/cpu.php?cpu=AMD+FX-8150+Eight-Core
in x264 encoding tests, Bulldozer scores 136fps in the first pass and 45fps in the second pass,
whereas the Core i7 2600K manages 100fps and 36fps respectively.
Source: http://fudzilla.com/processors/item/23381-bulldozer-performance-figures-are-in
Das sind die Fake Benchmarks mit übertakteten Bulldozer. In der AMD Folie liegt der 2600k leicht vorne im H264 Benchmark.
Ich ganz viel. Praktisch jeden Tag mehrere DVB-Aufnahmen und momentan viel Reenkodierung von 1080P-Rips in 10 Bit-H264. Spart sehr viel Speicherplatz bei leicht verbesserter Bildqualität.
Du schaffst es durch reencodieren die Bildqualität zu steigern? Cool. Das ist ja wie die Leute die behaupten ihre von CD gerippte MP3 klänge besser. :)
mironicus
2011-10-01, 21:18:38
Beim Reenkodieren von 8 Bit nach 10 Bit wird die Bildqualität tatsächlich leicht besser, da wird z.B. das Banding reduziert,weniger Bildfehler aufgrund der höheren Farbtiefe. Besonders bei Cartoons spart man dazu noch eine Menge Bitrate.
Ich habe schon manche 2 GB-Files auf 300-400 MB herunterbekommen. Die waren teilweise übertrieben enkodiert mit CRF 13 und 8 Bit, und dann reenkodiert mit CRF 20 und 10 Bit (einzelne Anime-Episoden BluRay-Rips).
Screemer
2011-10-01, 21:19:01
diverse pp filter können filme durchaus besser aussehen lassen.
Schöne Liste, wegen der Spieleliste können die 100% leider nicht zutreffend sein.
Deswegen betrifft diese Liste auch nur den 1. Teil der Benchmarks und nicht die anderen beiden. Steht aber auch dabei.
http://4.bp.blogspot.com/-ejjh4QYNYaw/TocizISSJBI/AAAAAAAABKg/qpPpPD0Od4g/s1600/update.png
Warum liegt dem Bulldozer Cinebench 10 so viel besser als 11.5? Bei der 1 Thread Leistung sind das 88,25% statt 81,1% eines K10.5.
[...]
Soweit ich weiss, ist Cinebench für die CPU-Generationen handoptimiert. Will heißen, es gibt Profile für K8 sowie K10-Opteron und Core2 sowie Nehalem (Sandy weiss ich nicht), aber es gibt mit Sicherheit kein Profil für BD. Entweder gibts nen Standardpfad für BD oder die Kx-Opteron-Optimierung wird genutzt, was eher Kontraproduktiv wirken dürfte. Von daher sind Cinebench-Vergleiche für neue CPU-Generationen eh für die Tonne.
Ronny145
2011-10-01, 23:06:43
Deswegen betrifft diese Liste auch nur den 1. Teil der Benchmarks und nicht die anderen beiden. Steht aber auch dabei.
Die 100% Leiste betrifft alle Teile gleichermaßen, oder wechselt das je nach Anwendungsbereich? Wäre unlogisch. Hinter den 100% wird sich sicherlich die gleiche CPU verbergen. FX-8150 lässt sich daher ausschließen.
Ja und? Die beiden anderen Listen hab ich nicht beachtet. Ich hab nur die CPUs zur ersten Liste zugeordnet, ohne jegliche Berücksichtigung der 2. und 3.
Warum liegt dem Bulldozer Cinebench 10 so viel besser als 11.5? Bei der 1 Thread Leistung sind das 88,25% statt 81,1% eines K10.5.
Kann an 1000 Sachen liegen. Am Naheliegensten wäre ein aktiver P4 SSE2 Codepfad im CB10 64bit Fall, z.B. 16kB L1 wären da ganz praktisch. Unter 11.5 gibts dafür vielleicht schon nen extra AMD Default Codepfad, zumindest kamen damit die K10 Optimierungen und SSE2@32bit (davor lief auf AMD nur x87@32b).
Generell gesagt muss es halt irgendeine K10 Optimierung sein, die dem BD nicht schmeckt.
PatkIllA
2011-10-02, 12:24:13
Beim Reenkodieren von 8 Bit nach 10 Bit wird die Bildqualität tatsächlich leicht besser, da wird z.B. das Banding reduziert,weniger Bildfehler aufgrund der höheren Farbtiefe. Besonders bei Cartoons spart man dazu noch eine Menge Bitrate.Beim Rekodieren wird die Bildqualität immer schlechter. Wenn du sowieso neukodierst, weil es kleiner werden soll kann man das ja nehmen, aber deswegen neukodieren ist kontraproduktiv. Vorhandene Schwächen im Bild bekommt man damit auch nicht mehr weg. ußerdem bleibt das Pobem, dass man das nur auf einem schnellen PC mit eingeschränkter Playerauswahl anschauen kann.
Wenn man maximale Qualität will fasst man das Video nicht mehr an.
1.10 angeblich cpu versand für die tester
Weiß man da jetzt was festes?
Mit welchen Chipsätzen werden denn die Tests gefahren? Gibt AMD "Vorgaben" was zu testen ist?
y33H@
2011-10-02, 13:43:58
Es gibt keine Vorgaben, höchstens Empfehlungen ;-)
Die FX sollten idealerweise mit einem 9(90)er Chipsatz sowie AM3+ gekoppelt werden, 8er mit AM3 (non-plus) ist als Sidekick aber auch sehr spannend.
vBulletin®, Copyright ©2000-2025, Jelsoft Enterprises Ltd.