Anmelden

Archiv verlassen und diese Seite im Standarddesign anzeigen : AMD - AMDs Bulldozer - neue CPU-Architektur für Q2 2011


Seiten : 1 2 3 4 5 [6] 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

=Floi=
2010-12-27, 23:00:50
wie ist das mit der geschwindigkeitssteigerung des caches gemeint? imho laufen beim harlem doch jetzt schon die caches mit fullspeed?!
sollte ich mal genauer nachlesen.

Coda
2010-12-27, 23:05:03
L3 nicht.

john carmack
2010-12-27, 23:09:08
Sagt mal Leute,

wie ist eigentlich die allgemeine Erwartung an den BD?
Oder was erhofft Ihr euch vom BD?
Wird er schneller als SandyBridge und damit ein "zweiter" A64 der damals den P4 alt aussehen ließ?

Ich hoffe einfach mal das der BD ein voller Erfolg für AMD wird, alleine schon wegen der fast
Monopol-Stellung von Intel.

dildo4u
2010-12-27, 23:12:19
Sagt mal Leute,

wie ist eigentlich die allgemeine Erwartung an den BD?
Wird er schneller als SandyBridge und damit ein "zweiter" A64?

Ich hoffe einfach mal das der BD ein voller Erfolg für AMD wird, alleine schon wegen der fast
Monopol-Stellung von Intel.
AMD setzt auf viele Cores um auf Performacne zu kommen.Ich glaube 2011 und 2012 werden 8 Cores zumindest bei Games nich mal ansatzweise ausgelastet,so lange kann AMD imo nich schneller sein vorallem gegen SB.

john carmack
2010-12-27, 23:16:54
...stimmt, da ist ja die Sache mit den Games was us wieder hierhin bringt :(

http://www.forum-3dcenter.org/vbulletin/showthread.php?t=491661&page=13

Duplex
2010-12-27, 23:37:21
Zambezi kann mit Glück mehr als 50% schneller als Thuban sein, 8 integer Cores @3,5Ghz + Nehalem IPC pro integer Core wäre schon leistungsstark, natürlich schneller als ein Sandy Bridge 4/8 ;) den Gulftown hätte dann AMD ebenfalls in der Hand, mit geschätzten 320mm² Fläche ist BD sogar etwas kleiner als Thuban.

2012 folgt ja eine überarbeitete BD Version, vielleicht können dann die 8 integer Cluster als 4 große Cores mit Turbo & IPC++ in bestimmten Anwendungen arbeiten, das nennt sich Spekulativ Multithreading, 2 integer Cluster können 1 Thread auslasten/verarbeiten, dafür gibt es glaube ich auch Patente.

CMT+SMT wäre eine andere Möglichkeit, dazu gab es hier auch mal einen Thread.

wir werden es sehen, es wird noch spannend.

dildo4u
2010-12-27, 23:42:24
Zambezi kann mit Glück mehr als 50% schneller als Thuban sein, 8 integer Cores @3,5Ghz + Nehalem IPC pro integer Core wäre schon leistungsstark, natürlich schneller als ein Sandy Bridge 4/8 ;) den Gulftown hätte dann AMD ebenfalls in der Hand, mit geschätzten 320mm² Fläche ist BD sogar etwas kleiner als Thuban.

Das gilt für Anwendungen wenn überhaupt ein Sixcore kann sich Heute nicht mal 10% von einem Quad absetzen von 8 ausgelasteten Cores ganz zu schweigen.

Selbst wenn man den 1100T auf 3.5 OC würde.
http://www.abload.de/img/cpubenchxzc1.jpg

http://www.computerbase.de/artikel/prozessoren/2010/test-prozessoren-2010/28/#abschnitt_performancerating

Duplex
2010-12-27, 23:45:40
im Server spec Rate ist BD 50% schneller als ein Opteron 6100.

dildo4u
2010-12-27, 23:48:25
im Server spec Rate ist BD 50% schneller als ein Opteron 6100.
Jo wir sind aber in einem 3D Gameing Forum wenn's um die Server Spec Rate ging wär der Thuban jetzt auch die Must Have CPU hier was sie aber nicht ist.Beim 50% Wert ist die perfekte Skalierung über 8 vs 6 Cores mit drinn.Games skalieren aber kaum mal über 4 Cores hinaus zur Zeit.

|-Sh0r7y-|
2010-12-27, 23:56:49
Das gilt für Anwendungen wenn überhaupt ein Sixcore kann sich Heute nicht mal 10% von einem Quad absetzen von 8 ausgelasteten Cores ganz zu schweigen.

Selbst wenn man den 1100T auf 3.5 OC würde.
http://www.abload.de/img/cpubenchxzc1.jpg

http://www.computerbase.de/artikel/prozessoren/2010/test-prozessoren-2010/28/#abschnitt_performancerating
Mein Cubase 5.5 kann schon lange 8 und mehr kerne... neidisch gucke ich schon 1 jahr auf 2x4core oder 1x8 core cpu systeme... ein x6 würde sich schon lohnen aber wieso jetzt noch investieren wen AMD bald zu guten preisen noch bessere CPU´s für Digitale Workstations zur verfügung stellt!

Seien wir doch mal ehrlich für spiele reicht doch nach wie vor jeder stark übertaktete q6600 mit 3,5 - 4ghz ehr als dicke.

Ich kann es kaum erwarten 8 kerne mit 16gb ddr3 zu besitzen:redface:

Mein veraltetes cinema4D kriegt auch sicher einen guten schub (um das 3d nicht ganz zu verlassen).

S940
2010-12-28, 08:21:15
Beim 50% Wert ist die perfekte Skalierung über 8 vs 6 Cores mit drinn.Games skalieren aber kaum mal über 4 Cores hinaus zur Zeit.Jo, aber dafür skalieren Spiele oft mit Cachegröße & Speed. :)
Eigentlich kann ja gar nix schief gehen, Takt steigt, IPC steigt, Cache steigt gewaltig und die Turbomodi legen ebenfalls kräftig zu.

Das muss eigentlich in eine (sehr) gute Spieleleistung münden. Die Frage ist halt: "Wieviel genau" und ob es für Nehalem und/oder sogar Sandy reicht ;-)

Immerhin gibts "dank" Xbox mittlerweile viele Games (=Ports) die was mit 6 Threads anfangen können ... die restlichen 2 gönne ich mal dem Grafiktreiber und den restlichen, Hintergrundmüllprozessen ^^

Aber ein teildefekter Zambezi X6 könnte durchaus ein guter Kompromiss sein.

ciao

Alex

fondness
2010-12-28, 09:39:31
AMD setzt auf viele Cores um auf Performacne zu kommen.Ich glaube 2011 und 2012 werden 8 Cores zumindest bei Games nich mal ansatzweise ausgelastet,so lange kann AMD imo nich schneller sein vorallem gegen SB.

Und wie kommst du auf diese völlig haltlose Behauptung? AMD liefert mit Bulldozer 4 Module mit 8 Threads, Intel hat schon ewig 6 Kerne mit 12 Threads. Stattdessen sehe ich bei Bulldozer hohe Taktraten und satte 16M Cache, das spricht alles für eine gute Single-Thread-Performance.

S940
2010-12-28, 09:45:11
Und wie kommst du auf diese völlig haltlose Behauptung?
Naja, aktuell stimmt sie ja noch, AMD bringt mittlerweile schon 6 K10 Kerne unter das Volk, im Gegensatz zu Intel auch im billigeren Mainstreambereich. Aber nachdem es hier im Thread ja über BD geht, hast Du genaugenommen schon recht. Das Argument zieht bei BD nicht mehr, eben weil das Teil kein K10 ist.

Außerdem kommen vom Sandy schließlich auch noch 8 Kern / 16 Thread Versionen :)

Undertaker
2010-12-28, 11:32:37
Und wie kommst du auf diese völlig haltlose Behauptung? AMD liefert mit Bulldozer 4 Module mit 8 Threads, Intel hat schon ewig 6 Kerne mit 12 Threads. Stattdessen sehe ich bei Bulldozer hohe Taktraten und satte 16M Cache, das spricht alles für eine gute Single-Thread-Performance.

Wenn man heute im Preisbereich der Phenom II X6 vergleicht, stehen dessen 6 Kerne gegen 4 Kerne mit 4 bzw. 8 Threads mit SMT. Nehmen wir mal den zweiten Fall mit SMT: Unter Volllast sind i7 870 und 1100T in etwa gleich schnell. Werden nur noch 4 Threads genutzt, fällt der X6 aber auf etwa ~66% seiner Maximalleistung, der i7 nur auf ~83% (angenommener SMT-Gewinn von 20%, Turbo außen vor). Ein 8-Core-Bulldozer würde, eine Modulleistung von 80% eines echten Dualcores angenommen, bei 4 Threads nur noch ~62% seiner Maximalleistung liefern. Tendenziell hängt Bulldozer also mehr an der Parallelisierung der genutzten Software, als eine CPU mit SMT und gleicher Threadzahl.

Was letztlich dabei herauskommt, lässt sich mit den bisherigen (sehr mageren) Performanceandeutungen noch nicht wirklich sagen. ;) Ich würde in Richtung der von y33h@ getroffenen Prognose schielen, dass ein 4-Moduler BD bei Vollauslastung irgendwo zwischen einem 4C/8T SB und den noch kommenden LGA2011 Ablegern landen sollte.

fondness
2010-12-28, 12:43:54
Wenn man heute im Preisbereich der Phenom II X6 vergleicht, stehen dessen 6 Kerne gegen 4 Kerne mit 4 bzw. 8 Threads mit SMT. Nehmen wir mal den zweiten Fall mit SMT: Unter Volllast sind i7 870 und 1100T in etwa gleich schnell. Werden nur noch 4 Threads genutzt, fällt der X6 aber auf etwa ~66% seiner Maximalleistung, der i7 nur auf ~83% (angenommener SMT-Gewinn von 20%, Turbo außen vor). Ein 8-Core-Bulldozer würde, eine Modulleistung von 80% eines echten Dualcores angenommen, bei 4 Threads nur noch ~62% seiner Maximalleistung liefern. Tendenziell hängt Bulldozer also mehr an der Parallelisierung der genutzten Software, als eine CPU mit SMT und gleicher Threadzahl.

Was letztlich dabei herauskommt, lässt sich mit den bisherigen (sehr mageren) Performanceandeutungen noch nicht wirklich sagen. ;) Ich würde in Richtung der von y33h@ getroffenen Prognose schielen, dass ein 4-Moduler BD bei Vollauslastung irgendwo zwischen einem 4C/8T SB und den noch kommenden LGA2011 Ablegern landen sollte.

Sorry, aber was ist das denn bitte für ein Konstrukt? Du spricht von gleicher Threadanzahl, was aber nicht der Fall ist. Fakt ist Bulldozer benötigt nur 8 Threads um seine volle Leistung zu entfalten, Gulftown benötigt 12, der kommende Sandy-Bridge bis zu 16. Die Aussage das AMD seine Leistung nur bei einer hohen Parallelisierung erreicht ist somit schlicht falsch, genau das Gegenteil ist der Fall.

Und auch sonst ist es sicherlich kein Nachteil, dass man einen Weg gefunden hat die Leistung eines Core mit vergleichsweise wenig Aufwand fast zu verdoppelt. Das kannst du ja kaum als Nachteil verkaufen, diese Prozentangaben ohne zu wissen was 100% entspricht sind völlig sinnlos. So wäre es bei deiner Rechnung sogar vorteilhaft wenn Bulldozer nur SMT hätte.

Duplex
2010-12-28, 13:03:11
Intel benutzt aber keine zusätzlichen integer Cluster, Westmere (Gulftown) besitzt 6 Cores, Intel hat große Cores die eine überlegende IPC im gegensatz zu AMD besitzen, SMT bringt dann zusätzlich noch 5-20%.

fondness
2010-12-28, 13:07:42
Intel benutzt aber keine zusätzlichen integer Cluster, Westmere (Gulftown) besitzt 6 Cores, Intel hat große Cores die eine überlegende IPC im gegensatz zu AMD besitzen, SMT bringt dann zusätzlich noch 5-20%.

Es geht um Bulldozer. Da sind Aussagen von wegen überlegener IPC erst mal blöße Spekulation.

Undertaker
2010-12-28, 13:12:37
Genau das war aber meine Grundaussage: Ein nicht genutzer Int-Cluster ist deutlich schmerzhafter als ein nicht genutztes SMT - ganz einfach weil ersteres die deutlich höheren Profite bringt. Siehe obige Rechnung rein zu den Relationen, noch völlig ohne Bezug auf die letzliche Gesamtleistung als bisher große Unbekannte. ;)

Btw: Das ein 4-Modul BD eine höhere MT, aber niedrigere ST Performance als die LGA1155 Sandy Bridge haben wird mag noch Spekulation sein, ist aber mehr als wahrscheinlich.

dildo4u
2010-12-28, 13:13:34
Es geht um Bulldozer. Da sind Aussagen von wegen überlegener IPC erst mal blöße Spekulation.
Gesunder Menschenverstand AMD kann nicht zwei Sprünge machen,zur Zeit hängt man noch weit hinter Nehalem und SB setzt da noch drauf.Du solltest nich zu viel hypen was dann passiert hat man bei der 6900 gesehen.

fondness
2010-12-28, 13:18:52
Genau das war aber meine Grundaussage: Ein nicht genutzer Int-Cluster ist deutlich schmerzhafter als ein nicht genutztes SMT - ganz einfach weil ersteres die deutlich höheren Profite bringt. Siehe obige Rechnung rein zu den Relationen, noch völlig ohne Bezug auf die letzliche Gesamtleistung als bisher große Unbekannte. ;)

Und nochmal: Das alles macht nur einen Sinn bei der selben Threadanzahl, was aber nicht der Fall sein muss. Bei 8 Sandy-Cores oder 6 Gulftown-Cores plus SMT vs. 4 BD-Modulen ist ein nicht genutzter Core für Intel wesentlich schmerzhafter als ein nicht genutzter Int-Cluster bei BD, wo ich selbst den L2-Cache noch verwenden kann.

dildo4u
2010-12-28, 13:20:38
Und nochmal: Das alles macht nur einen Sinn bei der selben Threadanzahl, was aber nicht der Fall ist. Bei 8 Sandy-Cores plus SMT vs. 4 BD-Modulen ist ein nicht genutzter Core für Intel wesentlich schmerzhafter als ein nicht genutzter Int-Cluster bei BD, wo ich selbst den L2-Cache noch verwenden kann.
Was willst du den mit 8 Core Sandy Bridge,die 4 Core Modelle treten gegen das 8 Core AMD Modell an.Du lebst wirklich in einer Traumwelt.

davidzo
2010-12-28, 13:23:45
Wenn man heute im Preisbereich der Phenom II X6 vergleicht, stehen dessen 6 Kerne gegen 4 Kerne mit 4 bzw. 8 Threads mit SMT. Nehmen wir mal den zweiten Fall mit SMT: Unter Volllast sind i7 870 und 1100T in etwa gleich schnell. Werden nur noch 4 Threads genutzt, fällt der X6 aber auf etwa ~66% seiner Maximalleistung, der i7 nur auf ~83% (angenommener SMT-Gewinn von 20%, Turbo außen vor). Ein 8-Core-Bulldozer würde, eine Modulleistung von 80% eines echten Dualcores angenommen, bei 4 Threads nur noch ~62% seiner Maximalleistung liefern.
Du vergisst dass der aktive Core im BD-Modul dann viermal soviel L2 und einen sehr fetten scheduler sowie dicke FPUs zur Verfügung hat, gegenüber einem I7.


Tendenziell hängt Bulldozer also mehr an der Parallelisierung der genutzten Software, als eine CPU mit SMT und gleicher Threadzahl.
Ich bezweifle dass 4 core+SMT CPUs ins Leistungssegment von 8 Core Bulldozer fallen, der Vergleich lohnt also nicht, es geht ja nicht um Effizienz pro vorhandenem core, sondern um das was letzendlich hinten raus kommt - und natürlich das Energiebudget. siehe nvidia vs amd, da ist das effizienzsspielchen auch nicht eindeutig, von de rrohleistung nutzt nvidia die alus besser, trotzdem hängt man in absoluten Zahlen erheblich und im energieverbrauch moderat hinterher.
Bulldozer vs Gulftown heißt das Rennen und da sind 8 cores/8 threads 6 cores/12threads in Situationen mangelnder Parallelisierung überlegen.

dildo4u
2010-12-28, 13:27:01
Ich bezweifle dass 4 core+SMT CPUs ins Leistungssegment von 8 Core Bulldozer fallen, der Vergleich lohnt also nicht,.
Klar wie jetzt mit dem X6 muss AMD mehr Cores verramschen.Man büßt sogar den Takt Vorteil ein den man bis jetzt noch hatte SB und BD bewegen sich beide um 3.5Ghz.Da müsste AMD mal locker 50% IPC aufholen um gleich zu ziehen.

fondness
2010-12-28, 13:28:22
Was willst du den mit 8 Core Sandy Bridge,die 4 Core Modelle treten gegen das 8 Core AMD Modell an.Du lebst wirklich in einer Traumwelt.

Nein, DU lebst wirklich in einer Traumwelt, denn vor DIR kommt wirklich null Substanz sondern NUR Fanboygesülz. Wenn DU glaubst offensichtlich eh schon alles vorher zu wissen, brauchst DU hier im übrigen eh nicht mehr mitlesen.

Genau DAS war nämlich mein Punkt, aber dazu bräuchte man natürlich etwas Hirnschmalz. Man kann nicht von gleicher Threadanzahl ausgehen ohne zu wissen wie schnell BD wird.

fondness
2010-12-28, 13:31:01
Btw: Das ein 4-Modul BD eine höhere MT, aber niedrigere ST Performance als die LGA1155 Sandy Bridge haben wird mag noch Spekulation sein, ist aber mehr als wahrscheinlich.

Bei einer völlig neuen Architektur die seit Jahren in Entwicklung ist, ist erstmal alles möglich, von einer vollkommenen Enttäuschung bis zu einer Sensation. Beides hat die Vergangenheit zur genüge gezeigt. Es mehr als naiv zu glauben aus den bisher bekannten Daten abschätzen zu können wo sich BD einordnen wird.

dildo4u
2010-12-28, 13:34:39
Nein, DU lebst wirklich in einer Traumwelt, denn vor DIR kommt wirklich null Substanz sondern NUR Fanboygesülz. Wenn DU glaubst offensichtlich eh schon alles vorher zu wissen, brauchst DU hier im übrigen eh nicht mehr mitlesen.

Genau DAS war nämlich mein Punkt, aber dazu bräuchte man natürlich etwas Hirnschmalz. Man kann nicht von gleicher Threadanzahl ausgehen ohne zu wissen wie schnell BD wird.
Es gibt die Perfomance Angabe von AMD schon lange 50% mehr Leistung als ein 6 Core K10 mit 8 Cores kleiner Hinweiss das ist keine 50% IPC Steigerung die AMD bräuchte um überhaupt erstmal gleich zu ziehen.

http://img716.imageshack.us/img716/2326/attachmentif.jpg

fondness
2010-12-28, 13:40:21
Es gibt die Perfomance Angabe von AMD schon lange 50% mehr Leistung als ein 6 Core K10 mit 8 Cores kleiner Hinweiss das ist keine 50% IPC Steigerung die AMD bräuchte um überhaupt erstmal gleich zu ziehen.

http://img716.imageshack.us/img716/2326/attachmentif.jpg

DU hast doch null Ahnung was diese SPEC-Wert überhaupt aussagt, bzw. was SPEC misst und worauf es skaliert, also spare es dir einfach dein Halbwissen zu verbreiten.

Undertaker
2010-12-28, 13:47:49
fondness, bei aller Liebe zu leidenschaftlicher Diskussion, für die nächsten Verbalunfälle a'la "Fanboygesülz" und [fehlendes] "Hirnschmalz" gibt's Sanktionen.

Meinung vertreten ja, aber doch bitte ohne andere zu beleidigen. :)

Duplex
2010-12-28, 13:58:31
Btw: Das ein 4-Modul BD eine höhere MT, aber niedrigere ST Performance als die LGA1155 Sandy Bridge haben wird mag noch Spekulation sein, ist aber mehr als wahrscheinlich.
vielleicht wird BD in Single Thread nur 1 integer Core eines Modul benutzen, den 2. integer Core könnte AMD abschallten, dann kann der 1. integer Core höher takten, evtl. in Single Modus 4.0-4,5Ghz?, dazu kommt noch das der 1. integer Core die ganze FPU + L2 & L3 Cache nutzen könnte, laut JF-AMD wird die Single Thread Leistung klar vor dem K10 liegen.

dildo4u
2010-12-28, 14:03:10
vielleicht wird BD in Single Thread nur 1 integer Core eines Modul benutzen, den 2. integer Core könnte AMD abschallten, dann kann der 1. integer Core höher takten, evtl. in Single Modus 4.0-4,5Ghz?, dazu kommt noch das der 1. integer Core die ganze FPU + L2 & L3 Cache nutzen könnte, laut JF-AMD wird die Single Thread Leistung klar vor dem K10 liegen.
Eigentlich geht man von 3.5Ghz Basis Takt aus und von da max 500mhz Turbo.In dem Bereich bewegt sich auch SB 3.4 Basis 3.8 Turbo.

y33H@
2010-12-28, 14:06:18
Ich bezweifle, dass AMD innerhalb eines Moduls die beiden Int-Cores abschalten oder unterschiedlich takten kann - genial aber wäre es. Ich vermute jedoch, dass der Turbo sich jeweils auf ein Modul bezieht. Singlethread-Leistung muss höher als K10 sein, ansonsten würde AMD stagnieren oder einen Rückschritt machen und das wäre sehr enttäuschend. Nur Kerne und Takt sind nicht alles, aber beides ist bei BD ja ohnehin gegeben.

Duplex
2010-12-28, 14:07:41
Eigentlich geht man von 3.5Ghz Basis Takt aus und von da max 500mhz Turbo.In dem Bereich bewegt sich auch SB 3.4 Basis 3.8 Turbo.
die 3,5Ghz Basistakt beziehen sich aber für alle 8 integer Cores.

wenn der 2. integer Core eines Moduls sich abschallten kann, dann hat der 1. integer Core mehr Taktspielraum/IPC, dafür gibt es doch glaub ich Powergating, evtl. ist hier AMD noch weiter als Intel und kann hier mehr Potential demonstrieren.

Trap
2010-12-28, 14:11:05
Das ein 4-Modul BD eine höhere MT, aber niedrigere ST Performance als die LGA1155 Sandy Bridge haben wird mag noch Spekulation sein, ist aber mehr als wahrscheinlich.
Bis jetzt weiß man, dass BD mindestens 25% mehr Takt durch die Architektur (dazu kommt noch der Taktvorteil durch 32nm) und eine höhere IPC als der Phenom2 hat.

Da der ST-Vorteil von SB gegenüber Phenom2 im Bereich 30-50% liegt, würde ich den BD je nach Anwendung schon ab und zu schneller erwarten.

Duplex
2010-12-28, 14:11:48
Ich bezweifle, dass AMD innerhalb eines Moduls die beiden Int-Cores abschalten oder unterschiedlich takten kann - genial aber wäre es.
warum beide abschalten? den 2. integer Core abschalten/stromlos deaktivieren reicht aus, dann hat der 1. integer Core mehr Spielraum beim Takt & IPC gewinn, dazu kommt noch die volle FPU Leistung & komplette L2+L3 Cache. nutzung.

ich hoffe das AMD wert auf Single Thread legt.

Multit Tread > 8 integer Cores = 3,5Ghz Basistakt inkl. Turbo
Single Thread > 4 integer Cores = 4,5Ghz Takt?

Das ist leider noch wunschdenken...

y33H@
2010-12-28, 14:13:44
Ich meinte, pro Modul einen Int-Core abschalten und den anderen hochtakten.

Sollte das gehen, dann könnte man von 4M/8C bei 3,5 GHz + 500 MHz ja so Späße machen wie bei 4M/4C den jeweils nicht benötigten Int-Core eines Moduls in den C6 versetzen und dem einzelnen Int-Core jedes Modul steht die volle FPU/L2 usw. zur Verfügung und sagen wir auf 3,5 GHz + 800 MHz jagen. Das hätte den Namen Turbo dann auch wirklich verdient.

Gipsel
2010-12-28, 18:52:06
Ich meinte, pro Modul einen Int-Core abschalten und den anderen hochtakten.

Sollte das gehen, dann könnte man von 4M/8C bei 3,5 GHz + 500 MHz ja so Späße machen wie bei 4M/4C den jeweils nicht benötigten Int-Core eines Moduls in den C6 versetzen und dem einzelnen Int-Core jedes Modul steht die volle FPU/L2 usw. zur Verfügung und sagen wir auf 3,5 GHz + 800 MHz jagen. Das hätte den Namen Turbo dann auch wirklich verdient.
Ich würde fast davon ausgehen, daß das geht. Fassen wir doch mal die bisherigen Aussagen zu "TurboCore 2.0" kurz zusammen:

BD wird eine ähnliche Überwachung des Verbrauchs aufgrund von Aktivitätsdaten der einzelnen Bereiche (also keine wirkliche Messung des Verbrauchs und daher reproduzierbar) wie auch bei Cayman finden. Anders als beim Powercontainment des Cayman wird allerdings nicht die Maximalfrequenz spezifiziert sondern sozusagen die Minimalfrequenz, die bei jeder denkbaren Last anliegt. Bei Workloads, die das erlauben (eher niedrige Auslastung), kann man den TDP-Spielraum ausnutzen, um den Takt aller 4 Module bzw. 8 Kerne um bis zu 500 MHz anzuheben. Diese 500MHz stammen von JF, gelten also wohl für die Servervarianten. Er erwähnte, daß der "normale" Turbo bei Auslastung nur einem Teil der Kerne noch oben drauf kommt. Da erwarte ich also wieder so eine Lösung wie bei den heutigen PhenomII T-Modellen, die in einem solchen Fall den Takt einer Hälfte der Kerne anhebt, während die andere Hälfte schlafen gelegt wird. Das dies bevorzugt immer ein Kern pro Modul sein wird, ergibt sich ja zwangsläufig.

Alles in allem ist das von Dir geschilderte Szenario also durchaus realistisch.

Naitsabes
2010-12-28, 19:46:28
stellt sich nur die Frage, wie weit sie eingeschläfert werden - einfach nur weniger Takt, Clockgating oder gar Powergating...

Triskaine
2010-12-28, 23:14:44
Bulldozer wird über Powergating verfügen, ebenso wie Llano und Bobcat.

davidzo
2010-12-29, 12:01:07
nachdem was wir bisher von AMD selber oder jf-amd so wissen ist es wohl sicher dass man Teile eines Moduls per powergating abschalten kann. da wären die int-cores und die FPUs. denkbar wären dann folgende schemata:
Zwei int-kerne und zwei FPU (2Core mit 128bit FPU)
Zwei int-kerne und eine FPU (2Core, einer mit 128bit FPU)
Zwei int-kerne und beide FPU zusammen (2Core, einer mit 256bit FPU)
Ein int-Kern mit FPU (1Core mit 256bit FPU)
Ein int-Kern mit FPU (1 Core mit 128bit FPU)
Ein int-kern (1 Core ohne FPU)

Daran sieht man die Flexibilität von BD, bei unterschiedlichen workloads Energie zu sparen.
Die Maximalverlustleistung wird vermutlich sehr hoch sein, aber selten anliegen. Darauf bezieht sich wohl auch AMDs 10-100Watt Angabe.

Dass man mit Powergating sehr gut umgehen kann zeigt ja Bobcat schon (1-10W/core).

y33H@
2010-12-29, 13:48:03
Bobcat zeigt noch gar nichts, abgesehen von der Preview hat man noch nichts unabhängiges gesehen.

davidzo
2010-12-29, 15:21:57
Bobcat zeigt noch gar nichts, abgesehen von der Preview hat man noch nichts unabhängiges gesehen.

das mit den unabhängigen reviews stimmt, wir sind hier allerdings im spekualtionsforum, nicht im Messunghinterfragungsforum. Spekulationen, noch dazu welche mit handfesten Messungen die von vielen Reviewseiten nachvollzogen wurden kann man in diesem Forum nicht mit so einem billigen Totschlagargument vom Tisch fegen. Übrigens, ich finde die PCGH auch nicht gerade vertrauenswürdig was Verbrauchsmessungen angeht, da verlass ich mich auf Ht4U.

Ich denke ich bin da nicht der einzige der alleine die Tatsache dass man einen 19.1W/6.4W Grafikchip (HD5450) und einen 18Watt Dualcore (Neo X2 L335) mit PCie Interface und Crossbar in ein 18Watt SOC gequetscht hat ist schon erstaunlich genug. Ohne ausgereiftes Power-Gating ist das unmöglich.
Und diese 18/10/5Watt sind nicht irgendwelche Zahlenspielchen für den Consumermarkt, sondern Industrieangaben, die im embeddebereich auch genau geprüft werden.

Im übrigen haben die OEMs als de-facto unabhängige Reviewer bereits selber über die Glaubwürdigkeit der AMD Angaben entschieden, durch ihre designwins. Das Fazit von MSI und Co ist ja durchweg positiv, auch was die Batterielaufzeiten angeht scheinen die 18Watt ja eher übertrieben als untertrieben zu sein.

Man muss schon eine ziemliche blaue Brillentönung haben um diese Anzeichen zu übersehen oder miss- zu deuten.

y33H@
2010-12-29, 15:33:36
Der Cedar alleine kommt ohne Speicher, PCB usw. auf weniger als 19,1W TDP und taktet zudem nur mit 280 bzw. 500 MHz (statt 650 MHz), was eine geringere Spannung erlaubt. Bobcat ist weitaus sparsamer als ein X2 L335. Letzterer ist ein vergleichsweise stromsaufender K8/10-Mischling mit 65 nm. Ontario/Zacate aber ist 40 nm und zudem mit 1,0 bis 1,6 GHz getaktet. Daher passen die 9W bzw. 18W auch wunderbar, die AMD angibt und die Mischung aus Preis, Leistung und Stromverbrauch ist klasse.

Um die Topic Kurve zu kriegen: Eine APU mit VLIW4-Units und einem oder zwei Bulldozer-Modulen für 2012 wäre hammer =)

Trap
2010-12-29, 15:44:27
Um die Topic Kurve zu kriegen: Eine APU mit VLIW4-Units und einem oder zwei Bulldozer-Modulen für 2012 wäre hammer =)
Steht so in der Roadmap von AMD (VLIW4 steht nicht explizit drin, wird aber drin sein, wenn sie bis dahin nicht schon was besseres haben).

S940
2010-12-29, 15:48:42
Bulldozer wird über Powergating verfügen, ebenso wie Llano und Bobcat.
Jo, aber vermutlich nur pro Modul, nicht pro Core, zumindest interpretiere ich die Aussage so:

One of these is the new CC6 power state, which powers down an entire module when it is idle.
http://blogs.amd.com/work/2010/11/09/server-highlights-from-financial-analyst-day/

Da steht nichts von nem einzelnen INT Cluster. Das wird Modul-intern wohl nur per clock gating laufen.
Da das die Aussage von JF war, könnte es sein, dass sich das nur auf die Server Chips bezog, und Zambezi vielleicht doch die INT Cluster Power-gaten kann, das würde auch für AM3+ und die AM3 Inkompatibilität sprechen, aber sicher ist das natürlich auch nicht.

Vielleicht ist es auch egal. Einerseits ist die leakage beim clockgaten zwar prozentual nach wie vor hoch, andrerseits werden für den einen 2issue INT Cluster ja nicht viel Transistoren benötigt, d.h. der absolute Verlust könnte sich in Grenzen halten, sodass der Aufwand nicht lohnt.

y33H@
2010-12-29, 15:50:37
@ Trap

Das ist mir bewusst, ich wollte nur wieder on Topic :biggrin:

Hat jemand eine Liste, welche CPU-Kühler sich auf AM3 Richtung Heck drehen lassen, abgesehen vom EKL Matterhorn und den aktuellen Thermalrights?

davidzo
2010-12-29, 19:09:45
die zalmänner lassen sich drehen. aber die sind wohl nicht die erste wahl.
bei wasserkühlung lässt sich der radiator auch frei platzieren.

Gipsel
2010-12-30, 16:17:47
Eine APU mit VLIW4-Units und einem oder zwei Bulldozer-Modulen für 2012 wäre hammer =)
Dann muß ich ja nicht noch mal anmerken, daß die Dreieinigkeit (lat.: trinitas ;)) von Fusion, Bulldozer und VLIW4 ein durchaus interessantes Produkt zu werden verspricht. :rolleyes:

mboeller
2010-12-31, 15:10:31
Dresdenboy hat im Planet3DNow Forum eine tolle Präsentation gepostet. Danach scheint der Bulldozer vom Design her genau im "Knick" der Performance/Watt Kurve zu sitzen. Also ziemlich optimal:

http://isca2010.inria.fr/media/slides/Azizi-ISCA2010-EnergyEfficientProcessors-FinalDistributable.pdf

Das was mir persönlich in der Präsentation noch fehlt ist ein Performance/Watt bzw. Mips/pJ Diagramm.

john carmack
2011-01-01, 17:55:35
Multit Tread > 8 integer Cores = 3,5Ghz Basistakt inkl. Turbo
Single Thread > 4 integer Cores = 4,5Ghz Takt?




Gibts dazu ne Quelle?

Knuddelbearli
2011-01-01, 18:09:09
da steht doch das er das so hofft

MRM
2011-01-01, 19:11:41
Hat jemand eine Liste, welche CPU-Kühler sich auf AM3 Richtung Heck drehen lassen, abgesehen vom EKL Matterhorn und den aktuellen Thermalrights?

Hilft die hier weiter ?

http://www.computerbase.de/forum/showthread.php?t=571793

mboeller
2011-01-01, 19:47:44
Gibts dazu ne Quelle?

zu den 3,5GHz+ gibt es eine Quelle: http://citavia.blog.de/2010/11/22/isscc-10026027/


4.5 Design Solutions for the Bulldozer 32nm SOI 2-Core Processor Module in an 8-Core CPU
T. Fischer, S. Arekapudi, E. Busta, C. Dietz, M. Golden, S. Hilker, A. Horiuchi, K. A. Hurd, D. Johnson, H. McIntyre, S. Naffziger, J. Vinh, J. White, K. Wilcox, AMD
The Bulldozer 2-core CPU module contains 213M transistors in an 11-metal layer 32nm high-k metalgate SOI CMOS process and is designed to operate from 0.8 to 1.3V. This micro-architecture improves performance and frequency while reducing area and power over a previous AMD x86-64 CPU in the same process. The design reduces the number of gates/cycle relative to prior designs, achieving 3.5GHz+ operation in an area (including 2MB L2 cache) of 30.9mm2.
.

Die 3,5GHz beziehen sich auf eine 100%ige Auslastung aller Einheiten des Bulldozer; also alle 8 Integer-Einheiten sind zu 100% ausgelastet und gleichzeitig sind alle 4 256bit FPU's ebenfalls zu 100% ausgelastet.

Bei einer normalen Auslastung (also zB. nur eine geringe FPU-Auslastung) beträgt die Taktfrequenz bei allen 4 Modulen (laut JF-AMD) bereits bis zu 4GHz. Der normale Turbo, wenn nur 4 oder weniger Kerne ausgelastet sind kommt dann noch oben drauf.

Die 4,5GHz sind wohl seine Hoffnung. Aufgrund der bis zu 4 GHz bei allen 4 Modulen könnte das aber schon hinkommen.


TurboCore (er bezieht sich aber auf Interlagos):

Turbo CORE – We have disclosed that we would include AMD Turbo CORE technology in the past, so this should not be a surprise to anyone. But what is news is the uplift – up to 500MHz with all cores fully utilized. Today’s implementations of boost technology can push up the clock speed of a couple of cores when the others are idle, but with our new version of Turbo CORE you’ll see full core boost, meaning an extra 500MHz across all 16 threads for most workloads.


Link: http://blogs.amd.com/work/2010/11/09/server-highlights-from-financial-analyst-day/

y33H@
2011-01-06, 13:26:09
Es geht los =)

Prototyp einer MSI 990FX-Platine gesichtet: Erstes Bulldozer-Mainboard mit AM3+ (http://www.pcgameshardware.de/aid,806397/Prototyp-einer-MSI-990FX-Platine-gesichtet-Erstes-Bulldozer-Mainboard-mit-AM3/Mainboard/News/)

Undertaker
2011-01-06, 13:35:13
Die Boards könnten durch die Abwärtskompatibilität zu älteren AM3-CPUs womöglich schon deutlich vor Bulldozer selbst veröffentlich werden. Das wirklich interessante wird doch aber die CPU selbst... :D

Thunder99
2011-01-06, 15:57:42
Die Boards könnten durch die Abwärtskompatibilität zu älteren AM3-CPUs womöglich schon deutlich vor Bulldozer selbst veröffentlich werden. Das wirklich interessante wird doch aber die CPU selbst... :D
Naja, wird auf jedenfall interessant, da z.B. ich auf ne DDR3 Plattform wechseln könnte wenn die Speicherpreise noch im Keller sind. Dadurch noch günstig DDR3/1866 Riegel (2x2 oder 2x4 GB) einkaufen und dann später die CPU wechseln :D

john carmack
2011-01-06, 22:50:09
Soweit ich weiß stecken teile des P3 auch im Nehalem - richtig?

Wieviel Athlon steckt eigentlich im BD?

y33H@
2011-01-06, 22:58:08
Hilft die hier weiter ?

http://www.computerbase.de/forum/showthread.php?t=571793Hab mich noch gar nicht bedankt =) Werde wohl "ultra silent" bleiben und einen Thermalright HR-02 nutzen.

airbag
2011-01-06, 23:13:29
Wie sieht es denn mit dem alten Orochi aus ? --> edit: Okay geht. Aber weißt du wie HR-02 und Orochi zu einander stehen? Hast doch immerhin beide.

BTW
Gut zu wissen, dass der Hr-02 Richtung Heck geht. Hab meinen nämlich hier in Leipzig liegen und kann ihn erst einbauen, wenn ich wieder in der Studibude in Darmstadt bin. :)

anddill
2011-01-06, 23:18:38
Es geht los =)

Prototyp einer MSI 990FX-Platine gesichtet: Erstes Bulldozer-Mainboard mit AM3+ (http://www.pcgameshardware.de/aid,806397/Prototyp-einer-MSI-990FX-Platine-gesichtet-Erstes-Bulldozer-Mainboard-mit-AM3/Mainboard/News/)

Wieder so eine asoziale Slotanordnung, bei der der PCIe 1x Slot nicht nutzbar ist.

edit: Ups, da ist ja doch noch einer über dem ersten 16x.

airbag
2011-01-06, 23:21:11
Wieder so eine asoziale Slotanordnung, bei der der PCIe 1x Slot nicht nutzbar ist.

edit: Ups, da ist ja doch noch einer über dem ersten 16x.
Wenn es das Board erlaubt, ist es ja nicht notwendig die Grafikkarte in den obersten Slot zu stecken. (ist aber leider meistens nicht der Fall).

Der über dem ersten 16er, finde ich dagegen genauso problematisch, weil es bie ausladenden Kühlern, dann auch nichts wird.

y33H@
2011-01-06, 23:22:20
Der Orochi liegt und bleibt in der Vitrine, aber auf AM3+ sollte er passen - das Kit gab's ja damals schon (in Form von AM2, das Retention-Modul ist ja das gleiche).
Wieder so eine asoziale Slotanordnung, bei der der PCIe 1x Slot nicht nutzbar ist.

edit: Ups, da ist ja doch noch einer über dem ersten 16x.
Ich will einen PCIe-16x ganz oben [wegen fetter GraKa-Kühlung via Thermalright Shaman] und ganz unten einen PCI für meine X-Fi ... mal sehen ob's sowas gibt (von MSI, mit denen fahre ich seit Jahren gut).

Duplex
2011-01-06, 23:22:46
Soweit ich weiß stecken teile des P3 auch im Nehalem - richtig?
sogar vom P6 Design aus 1991 ;) aber wen interessiert das...

Wieviel Athlon steckt eigentlich im BD?
das kann jetzt noch keiner sagen, das Rad muss man nicht neu erfinden ;) Bulldozer hat z.b. ein redesign Uncore mit 50% mehr Speed als K8 @45nm, der rest wird bestimmt neu sein.

davidzo
2011-01-07, 02:09:26
sogar vom P6 Design aus 1991 ;) aber wen interessiert das...
P6 = Pentium Pro war '95!

Duplex
2011-01-07, 21:01:46
Bulldozer angeblich in 3D Rendering fast doppelt so schnell wie ein i7 980x

Before It's News (http://hostmaster.b4in.org/story/253/976/First_AMD_Bulldozer_benchmarks._Twice_as_fast_as_Intel_980X..html)

An AMD employee released some info on the upcoming Bulldozer CPU. Preliminary benchmarks on an 8 core Bulldozer desktop processor have it trouncing the mighty Intel i7 980X by a whopping 192% in 3D rendering benchmarks. The Orochi design is the company’s next-generation processor for high-end desktop. Rumors have the 8 core chip debuting at 3.4-4.0 GHz. AMD will launch their desktops chips first in an effort to regain market share from Intel.

vielleicht hat der Bench mit AVX gearbeitet, Intel Westmere hat z.b. kein AVX, nur Sandy Bridge hat AVX.


@davidzo
sry, die Entwicklung vom P6 war 1991, richtig vermarktung erst 1995!

S940
2011-01-07, 22:59:43
Die angegebene Quelle:

http://scarletwhore.com/

erscheint mir sehr dubios ...

Flatterball77
2011-01-07, 23:05:27
AMD ist fertig. "Bulldozer" ist eher Intel mit dem Sandy Bridge und bald kommt Ivy.

Amd ist hilflos versucht jetzt Kunden zu verarschen mit am Ende übertakteten Prozessoren. Umlabeln, bad sign.

P.S.: Ich bin echt um Sorge um die Pleitefirma AMD. Das ist kein Konkurrenz mehr.

Sandy is nur die Mittelklasse, bald sind die völlig fertig.

fondness
2011-01-07, 23:17:08
AMD ist fertig. "Bulldozer" ist eher Intel mit dem Sandy Bridge und bald kommt Ivy.

Amd ist hilflos versucht jetzt Kunden zu verarschen mit am Ende übertakteten Prozessoren. Umlabeln, bad sign.

P.S.: Ich bin echt um Sorge um die Pleitefirma AMD. Das ist kein Konkurrenz mehr.

AMD war vor dem K7 "fertig", AMD war vor dem K8 "fertig". Selbst wenn sie diesmal kein solches Meisterwerk mehr schaffen, ist es trotzdem noch mehr als beachtlich, was sie mit unterlegenen Fertigungsprozess und einem Zehntel(!) der RnD-Ausgaben von Intel bewerkstelligen.

P.S.: Wenn man sich ein paar deiner Beiträge so durch ließt fragt man sich wer hier "fertig" ist. :)

Hugo78
2011-01-07, 23:59:27
Wäre schön wenn AMD mal langsam ein paar verlässliche Benches streut.
So a la "oops hier ist uns ein Phenom III ES samt Mobo abhanden gekommen und die Person hat doch dreißt mal gleich Cinebench,
GTA 4, BC2 und Starcraft gebencht, so ein Lümmel aber auch!!" X-D :whistle:
Ich will einen PCIe-16x ganz oben [wegen fetter GraKa-Kühlung via Thermalright Shaman] und ganz unten einen PCI für meine X-Fi ... mal sehen ob's sowas gibt (von MSI, mit denen fahre ich seit Jahren gut).

Jo, 3 - 4 Slots für die Graka, aber min. noch 2 Slots je PCIe 1x, für Sound und ne extra Netzwerkkarte,
denn das Onboard-Netzwerkzeug ist beinah genauso halbgar wie Onboardsound und Grafik. :usad:

Flatterball77
2011-01-08, 00:02:07
Wie soll AMD das aufholen, wie? Die liegen jetzt schon Welten zurück. Leider ist es so. Intel bestimmt den Preis.


AMD wird von Intel nicht mehr Ernst genommen.

Intel hat eigene gute Fabs.

Hugo78
2011-01-08, 00:07:38
Och es zählt auch das Featureset.
PCIe 3.0 und ordentlich paar dutzend Lanes, nicht nur so mal 1x16 und der Rest per Southbridge oder NF200.

Dann kann man reichlich USB 3.0, SATA 6Gbit und natürlich rein PCIe verbauen.

Mobotechnisch sind die Sandy Bitches leider ne Enttäuschung.
Kotzt mich bischen an, dass so gut wie jedes Mobo unter 200€ noch Platz auf PCI verschwendet.

Also warten auf die großen Sandys oder ebend doch Bulldozer.

Hugo78
2011-01-08, 00:11:09
Ja, ja, dagegen sag ich ja nix, aber was nutzt mir die besste CPU, wenn ich an anderer Stelle verzichten muss, nur weil Intel die Mittelklasse so zusammenstreicht, PCIe Lane-technisch...?!

Coda
2011-01-08, 03:46:29
Soweit ich weiß stecken teile des P3 auch im Nehalem - richtig?
Ja. Nehalem reagiert auf bestimmte Codesequenzen genau mit den gleichen Quirks wie ein Pentium Pro. Das ist wirklich eine reine Evolution.

Aber warum das Rad neu erfinden, wenn es gut funktioniert?

Wieviel Athlon steckt eigentlich im BD?
Ziemlich wenig. Die Pipelines sind scheinbar länger und der ganze Int-Cluster sieht anders aus.

Ein Rewrite wie der P4 damals isses aber sicher nicht.

john carmack
2011-01-08, 20:09:58
Jedenfalls wirds schwer an Intel ran zu kommen. AMD sieht ja grad im Midrange und HighEnd kein land mehr!

Gaestle
2011-01-08, 20:21:34
Vielleicht muss AMD aber auch weniger im x86 Bereich punkten, sondern mehr im SoC-Bereich. Für mich scheint es so, dass sehr vieles in der generellen Entwicklung in Richtung mobile SoC geht. Tegra2 soll in absehbarer Zeit mehr als 50% des NV Umsatzes machen, Intel kommt mit Moorestown, Windows 8 wird ARM-kompatibel sein, Apple verdient richtig dick am iPhone/iPad .... Soweit ich weiß, hat alleine Nokia hat im letzten Jahr (oder war es 2009?) weltweit mehr Einheiten verkauft (obwohl da auch die Mehrheit "Feature-Phones" bzw. "Dumbphones" dabei waren), als weltweit x86-Systeme verkauft wurden! Diese Telefonkunden von heute könnten doch morgen SoC-Smartphone/Tablet/Desktop-SoC-Kunden sein.

In Schwellenländern gibt es häufig keine Kabelnetze für Internet, aber sehr gut ausgebaute Mobilfunknetzte.

Wozu brauchen westliche Privathaushalte (ohne oder mit nur geringem Spiele-Anspruch) einen x86 PC, wenn man alles Gewünschte mit starken SoC bekommt? Wozu müssen Sekretariate in Firmen und Behörden einen x86 PC nutzen, wenn Email und Textverarbeitung auch auf 'nem SoC laufen?

Cloud-Computing könnte doch in Firmen auch "inhouse" funktionieren, mit vielen relativ schwachen Arbeitsplatz-SoC-Clients, die aber mit einem starken Zentralrechner verknüpft sind. Dieser Zentralrechner kümmert sich um den rechenintensiven Kram.

Duplex
2011-01-08, 20:25:47
das gehört hier nicht rein, offtopic...
klar wird x86 auch in Zukunft das wichtigste sein, auf x86 läuft jede Software.

Gaestle
2011-01-08, 20:38:15
So gesehen gehört die ganze Diskussion um AMDs Verluste und Zukunft hier nicht rein.

Die Frage ist für mich ganz klar, wie lange noch x86 im Massenmarkt "das Wichtigste" ist.

Aber stimmt schon, hat mit BD nix zu tun. Von daher kommt von mir nix mehr dazu.

HPVD
2011-01-11, 14:23:55
Geschwindigkeit Bulldozer ähnlich Core i7 6-core:


We have some good news for everyone who would like to see AMD make a big comeback in style.

Since the time when Athlon used to be a high-end brand, and by that we mean the good old K8 core, it's been a while since AMD had a high end part capable of competing with Intel on a par.

However, initial test scores that slipped to a hands of industry source are suggesting that Bulldozer should come really close to new Core i7 six-core CPUs. Bulldozer has both six and eight cores in the pipeline and they should be launching before the end of Q2 2011, at least that is the current schedule.

The performance of Bulldozer should come really close to Core i7, but we don't know if this might be enough to take Intel's high end market dominance. Samples of Bulldozer are out for a while now and the full production should start as soon as this quarter.

Sources are suggesting that and yields should be quite good and that the chip is doing just fine in 32nm. One thing is certain, even if Core i7 remains faster, Bulldozer X8 and X6 parts should end up way cheaper. It looks like AMD will finally give Intel a run for its money.

http://fudzilla.com/processors/item/21512-bulldozer-to-come-close-to-core-i7

Coda
2011-01-11, 14:27:38
Ob das doch was mit Meyers Abdanken zu tun hat?

robbitop
2011-01-11, 14:34:56
Wenn Bulldozer an den Core-i7 rankäme, wäre das schonmal eine beträchtliche Leistung.

boxleitnerb
2011-01-11, 14:36:26
Hoffentlich verscherbelt man die CPUs nicht wieder für nen Appel und ein Ei. Man will ja auch Gewinn damit machen.

dildo4u
2011-01-11, 14:40:13
Hoffentlich verscherbelt man die CPUs nicht wieder für nen Appel und ein Ei. Man will ja auch Gewinn damit machen.
Müssen sie ein 4 Core SB mit HT ist auch auf einem Level wie die alten Sixcores.
AMD wird da ihr 8 Thread Modell gegenstellen müssen.

http://www.computerbase.de/artikel/prozessoren/2011/test-intel-sandy-bridge/46/#abschnitt_performancerating

Ronny145
2011-01-11, 14:47:22
Die Frage ist doch auch mit welchem Bulldozer verglichen wird. Ich würde mal auf den 4 Modul Bulldozer tippen. Das sind 8 Bulldozer Cores gegen 6 traditionelle Cores (12 Threads). Aber da nicht bekannt ist was genau getestet und verglichen wurde, ist das nicht sonderlich aufschlussreich.

Trap
2011-01-11, 14:48:25
Wenn Bulldozer an den Core-i7 rankäme, wäre das schonmal eine beträchtliche Leistung.
Es wär eine beträchtliche Verbesserung, aber nicht grad das Ergebniss, dass man sich wünscht, da der Chip deutlich größer als der i7 ist...

Und das trotz der Grafikeinheit in SB.

robbitop
2011-01-11, 14:51:47
Wie groß ist denn ein Bulldozer Die und wie groß ist ein i7 32-nm Die?

Undertaker
2011-01-11, 14:52:58
BD: Nach verfügbaren Die-Shots etwa 320mm², Sandy Bridge 4C 216mm² (ohne IGP afair ~180mm²). Gulftown 248mm².

Ronny145
2011-01-11, 14:57:16
Es wär eine beträchtliche Verbesserung, aber nicht grad das Ergebniss, dass man sich wünscht, da der Chip deutlich größer als der i7 ist...

Und das trotz der Grafikeinheit in SB.


Mit dem i7- Sechskerner kann nur Gulftown gemeint sein. Also ohne Grafikeinheit.

robbitop
2011-01-11, 15:14:46
Das ist ja dann von AMD nicht gerade ein effizientes Design, wenn man soviel mehr Fläche bei gleichem Prozess bei maximal gleicher Leistung bringt.

fondness
2011-01-11, 15:21:50
Das ist ja dann von AMD nicht gerade ein effizientes Design, wenn man soviel mehr Fläche bei gleichem Prozess bei maximal gleicher Leistung bringt.

Was mache Leute nicht alles aus einem solchen Kommentar heraus lesen können, wo sämtliche Parameter pure Spekulation sind. Selbst die Die-Size von BD ist ein reines Ratespiel.

Undertaker
2011-01-11, 15:30:33
http://chip-architect.com/news/AMD_Bulldozer.jpg

Der gute Hans hat ähnliche Analysen auch bereits für andere CPUs angefertigt und dabei ziemlich gut getroffen. Es geht auch nur um die grobe Einordnung, egal ob es letztlich doch 10mm² mehr oder weniger sind.

SavageX
2011-01-11, 15:31:24
BD: Nach verfügbaren Die-Shots etwa 320mm²

Für vier Module, also acht Cores, vermute ich mal.

Trap
2011-01-11, 15:59:31
Was mache Leute nicht alles aus einem solchen Kommentar heraus lesen können, wo sämtliche Parameter pure Spekulation sind.
Ich tipp drauf, dass die Formulierung von Fuad bewusst irreführend ist und die Performance besser ist, als das Gerücht andeutet.

Gipsel
2011-01-11, 16:00:18
http://chip-architect.com/news/AMD_Bulldozer.jpg

Der gute Hans hat ähnliche Analysen auch bereits für andere CPUs angefertigt und dabei ziemlich gut getroffen. Es geht auch nur um die grobe Einordnung, egal ob es letztlich doch 10mm² mehr oder weniger sind.
Na mal schauen. AMD hat ja semioffiziell (JF) bestätigt, daß der Dieshot ziemlich stark per Photoshop verfremdet wurde (deswegen sehen alle Kerne auch unterschiedlich aus, das ist natürlich nicht wirklich so).

w0mbat
2011-01-11, 16:03:08
klar ist die performance besser. er heißt nicht umsonst bulldozer.

boxleitnerb
2011-01-11, 16:04:36
Der war selbst für einen Fanboy lustig! ;D
Als ob man das bei der Namensgebung schon wusste...

fondness
2011-01-11, 16:07:06
http://chip-architect.com/news/AMD_Bulldozer.jpg

Der gute Hans hat ähnliche Analysen auch bereits für andere CPUs angefertigt und dabei ziemlich gut getroffen. Es geht auch nur um die grobe Einordnung, egal ob es letztlich doch 10mm² mehr oder weniger sind.

Es gibt nicht mal einen korrekten Die-Shot. Hans hat sich da wohl was zusammengebastelt aus den der vier Dice des Originalshots, der für ihm am meisten Sinn machte. Daraus die Abmessungen zu bestimmen halte ich für sehr gewagt.

Gipsel
2011-01-11, 16:09:06
Es gibt nicht mal einen korrekten Die-Shot. Hans hat sich da wohl was zusammengebastelt aus den der vier Dice des Originalshots, der für ihm an meisten Sinn machte. Daraus die Abmessungen zu bestimmen halte ich für sehr gewagt.
Ich auch. Allerdings kann er damit seinen Ruf als Guru stärken, falls er doch richtig liegen sollte :D

Duplex
2011-01-11, 16:20:02
im Artikel steht was von neuem Core i7 6 Core, nicht der i7-980x, entweder i7-990x oder vielleicht Sandy Bridge 6 Core?

Trap
2011-01-11, 16:32:41
Es steht eine Menge nicht drin. Performance in was gemessen (Super-Pi?), welche Variante vom BD (6C, 8C, welcher Takt) eigentlich gemeint ist, welche Intel CPU gemeint ist...

Es steht nichtmal drin ob Desktop oder Server gemeint war.

y33H@
2011-01-11, 16:33:08
@ Duplex

Sixcore = Hexacore = Gulftown

"New" weil Fuad da immer ein bisschen hinten dran ist ;-)

olol
2011-01-11, 16:36:41
er sagt aber "new Core i7 six-core CPUs", gulftown ist bald ein jahr alt den kann man nicht wirklich als neu bezeichnen

y33H@
2011-01-11, 16:38:40
Der einzige "new" Sixcore wäre der 990X und den gibt's (noch) nicht. "new" ist eine typische Schreibweise für Fuad, selbst wenn die CPUs schon Wochen oder Monate am Markt sind.

MiamiNice
2011-01-11, 16:41:21
Mich würde es überraschen wen BD an die IPC Leistung eines Nehalems rankommt und takmässig war ja bisher bei AMD, wegen der Fertigungsgrösse, auch nicht so viel zu hohlen. Was AMD braucht ist definitiv sowas wie der A64. Hoffentlich bekommen sie es mit BD wieder mal hin, ansonsten sehe ich mittelfristig auch eher schwartz für AMD. Sandy ist extrem performant und es sind bisher nur die Mainstream CPUs draussen. High End und Ivy stehen schon fast vor der Tür. AMD muss jetzt was reissen und auf BD warten wir immernoch.

olol
2011-01-11, 16:41:33
wenn das stimmt wäre die leistung eher entäuschend, aber fudzilla hat ja erst kürzlich bei der hd 6970 bewiesen dass sie meistens nicht recht haben.

y33H@
2011-01-11, 16:46:10
BD mit vier Modulen und acht Int-Cores sollte bei Multithreading locker an einen Gulftown ran kommen, das sind immerhin +33% mehr echte Kerne. Schön wäre natürlich wenn ein Triple-Modul-BD das schafft (wobei dann immer noch die Die-Size höher ist, da vermutlich teildeaktivierter Zambezi). Schafft's gar ein Dual-Modul-BD, wäre es porno - aber das erachte ich als extrem unwahrscheinlich. Denn dafür müsste AMD pro Takt mit BD doppelt so schnell sein wie ein Deneb. Oder extrem hoch takten.

samm
2011-01-11, 17:05:03
BD mit vier Modulen und acht Int-Cores sollte bei Multithreading locker an einen Gulftown ran kommen, das sind immerhin +33% mehr echte Kerne.Eben nicht wirklich :) Ich sehe schon das Marketingproblem (als ob AMD nicht genug davon hätte...), denn die 2 BD Kerne pro Modul sind ja nicht ganz vollständige Kerne und bringen dementsprechend nicht die entsprechende Leistung. Ich hoffe, die vermarkten das ähnlich Intel mit HT, als "4 Module (8 Threads)" oder so...

Trap
2011-01-11, 17:05:25
Die BD-Architektur hat 20% weniger Gatter pro Takt, was 25% mehr möglichem Takt entspricht. Dazu kommt wohl ein gewisser Taktvorteil durch 32nm.

IPC ist schwer zu schätzen, soll laut mehrer JF-AMD postings aber höher als beim Phenom2 sein. Dazu kommt noch ein besserer Turbo-Modus.

Gewinnen gegen Gulftown mit 3 Modulen ist meiner Meinung nach durchaus möglich. Mit 2 Modulen? Mal sehr optimistisch mit 135% Takt und 115% IPC, 105% Turbo => 163% gerechnet könnte es sogar fast funktionieren. Die 135% Takt sind sicher nicht unmöglich, die Sandy Bridge laufen ja auch mit 4.5 Ghz mit Luftkühlung.

Edit2: Eigentlich sind die 115% IPC nicht besonders optimistisch, das hat Intel ja sogar von Nehalem->Sandy Bridge geschafft, da wird AMD von Phenom2 ausgehend mehr Verbesserungspotential haben. Mit 130% IPC kommt man sogar auf 185% Phenom2-Leistung.

y33H@
2011-01-11, 17:32:55
IPC auf Nehalem Niveau, also rund plus 20-30% auf Deneb und ein höherer Takt und AMD wäre mit einem Dual-Modul-BD fast auf Höhe eines SB mit 4C/8T und dürfte mit einem Quad-Modul-BD auch einigermaßen mit den SBe mit 8C/16T mithalten können. Ich wünsche mir, dass ein Dual-Modul-BD bei gleichem Takt einen Lynnfield mit SMT schlägt, dann ist die Quad-Modul-Variante gekauft :)

S940
2011-01-11, 17:35:25
Eben nicht wirklich :) Ich sehe schon das Marketingproblem (als ob AMD nicht genug davon hätte...), denn die 2 BD Kerne pro Modul sind ja nicht ganz vollständige Kerne und bringen dementsprechend nicht die entsprechende Leistung. Ich hoffe, die vermarkten das ähnlich Intel mit HT, als "4 Module (8 Threads)" oder so...
Im Moment nennen sie es "8 Kerne".
Finde ich auch ok, wenn 2 Kerne wirklich die postulierten 180% Leistung von 2 hypothetischen "echten" Kernen bringen. Die 20% Minus sind Peanuts, bei allem über >150% kann aufgerundet werden.

y33H@
2011-01-11, 17:44:40
Ich finde es auch richtig, dass AMD Kerne sagt. Denn idR zählt man die Int-Cores. Wobei das Marketing die Module UND die Kerne ausschlachten könnte - je nachdem, wie es passt. Also "AMD-PC mit echten acht Kernen" und "Quad-Modul-Bulldozer schlägt 16-Thread-SB".

Undertaker
2011-01-11, 17:46:32
Mal sehr optimistisch mit 135% Takt und 115% IPC, 105% Turbo => 163% gerechnet könnte es sogar fast funktionieren. Die 135% Takt sind sicher nicht unmöglich, die Sandy Bridge laufen ja auch mit 4.5 Ghz mit Luftkühlung.

Edit2: Eigentlich sind die 115% IPC nicht besonders optimistisch, das hat Intel ja sogar von Nehalem->Sandy Bridge geschafft, da wird AMD von Phenom2 ausgehend mehr Verbesserungspotential haben. Mit 130% IPC kommt man sogar auf 185% Phenom2-Leistung.

Wo fließt da die Modul-Skalierung ein? :confused: Btw: 35% mehr Takt als aktuell wären 5GHz Singlethread, verglichen zu den 3,7GHz eines 1100T...

fondness
2011-01-11, 18:02:17
Ich finde es auch richtig, dass AMD Kerne sagt. Denn idR zählt man die Int-Cores. Wobei das Marketing die Module UND die Kerne ausschlachten könnte - je nachdem, wie es passt. Also "AMD-PC mit echten acht Kernen" und "Quad-Modul-Bulldozer schlägt 16-Thread-SB".

Da die FPU auch in 2x 128-bit geteilt werden kann sind es defacto auch zwei Kerne. Eine 256-bit FPU benötigt man nur für AVX und das wird sehr lange rar bleiben. Bei nur einen Thread profitiert man halt von den größeren Caches und dem überdimensionierten Sheduler. So gesehen ist jedes Modul ein Dual-Core, das eben bei nur einem Thread von den Einheiten des anderen Cores profitieren kann.

y33H@
2011-01-11, 18:05:59
Stimmt, die FPU spricht auch dafür =)

Und ja, AVX ist für Spieler wohl sehr lange unspannend, für Anwender wird's vll noch was dieses Jahr. Schön ist zudem, dass der BD auch FMA kann.

Trap
2011-01-11, 18:10:38
Wo fließt da die Modul-Skalierung ein? :confused: Btw: 35% mehr Takt als aktuell wären 5GHz Singlethread, verglichen zu den 3,7GHz eines 1100T...
Welche Modul-Skalierung? 180%,90% oder wie auch immer im Vergleich zu einem fiktiven "echten" Dualcore? Die sind in der IPC schon drin.
Oder die Skalierung von 6 Kernen auf 4 Module (8 Kerne)? Die hab ich nicht eingerechnet. Ist eine Rechnung für gleichbleibende Anzahl an Kernen.

Bei den Taktraten darf man nicht vergessen, dass die Chips mit vielen Kernen alle verbrauchslimitiert sind, die 5 GHz für den Bulldozer sind realistisch betrachtet vielleicht im 1 bis 2 core Turbo möglich, bei mehr Last wird es wohl nicht so viel Takt werden (4+ ist da das Gerücht). Soweit ich weiß hat Bulldozer auch gegenüber Sandy Bridge weniger Gatter pro Takt und wenn Sandy Bridge mit Luftkühlung locker 4.5 GHz erreicht, sind 5 für BD sicher auch möglich.

mboeller
2011-01-11, 18:34:09
gebe ich auch mal meinen Senf dazu:

[Performance-Horoskop]

Laut ISSCC 2011 erreichen die BD-Kerne 3,5+ GHz.

Das kann zwar alles mögliche heißen, aber ich denke, das könnte sich sogar auf Interlagos beziehen.

Ein 12-Core Magny Cours erreicht 2,3 GHz. BD hat aufgrund des (angeblichen?) 17FO4 Designs einen Taktvorsprung von min. 20%. Samsung erreicht mit 32nm HKMG im Vergleich zu 45nm 25% mehr Takt bei gleichzeitig 30% weniger Verbrauch. Das sollte AMD auch schaffen.

Ergo: 2,3GHz x 1,25 x 1,2 = 3,45 GHz (gerundet 3,5 GHz) ; laut AMD bei gleichem Verbrauch (beide, MC und Interlagos haben 115Watt ACP)

Damit sind dann, selbst ohne IPC-Verbesserungen +82% INT-Leistung möglich (wenn man jeden BD-Kern mit 90% ansetzt).

[/Performance-Horoskop]

McLuemmel
2011-01-11, 21:21:35
ich versteh nicht warum AMD nicht schon längst mal benchmarks rübergeschoben hat wie intel damals auf anandtech so eine art preview.

wenn man noch länger auf den bulldozer wartet dann kann man fast schon auf ivy warten. ich finde amd bringt den bulldozer nicht gerade zu einem günstigen zeitpunkt heraus.

y33H@
2011-01-11, 21:44:35
Wenn laaange nichts bekannt wird, heißt das idR nur eines von beidem: Extrem gut oder Müll.

Wenn man sich überlegt, JC hat seit letzten Sommer schon einen SBe mit 8C/16T für Sockel 2 und der kommt erst ein Jahr später :ugly:

olol
2011-01-11, 21:59:42
naja sandy bridge war ja nix überraschendes und besonderes, 20-30% mehr leistung gegenüber lynnfield bei neuem fertigungsprozess.

ich verstehe auch nicht warum alle meinen dass bd jezt zu spät kommen soll, wahrscheinlich ende april/mai also noch vor highend sandy bridge.

y33H@
2011-01-11, 22:04:41
AMD dürfte dann ein paar Wochen bis Monate die schnellste CPU haben, bevor die Sockel-R-Plattform (vermutlich) alles platt macht.

Coda
2011-01-11, 23:13:54
Bis auf mehr Cores erwarte ich da aber keine wirklich sensantionelle Leistungssteigerung - es sei denn sie kommen mit deutlich mehr Takt.

robbitop
2011-01-12, 14:18:37
Was mache Leute nicht alles aus einem solchen Kommentar heraus lesen können, wo sämtliche Parameter pure Spekulation sind. Selbst die Die-Size von BD ist ein reines Ratespiel.
Deshalb ja auch das "wenn".
Die Parameter sind zwar nicht fix - aber der Spielraum ist auch nicht mehr soo groß. Jedenfalls nicht groß genug, um so große DIE-Size Differenzen zu überbrücken. Aber stimmt - wirklich fix kann man das erst nach ersten Berichten behaupten. Es sieht aber danach aus.

Limit
2011-01-12, 21:00:59
Ich erwarte auch keine riesigen IPC Verbesserungen. Ein paar Prozent schneller als K10.5 sollte er aber werden, sagen wir mal 10-15%. Bei der Multithread-Leistung sollten auch noch mal ein paar Prozent dazukommen. Der gemeinsame L2-Cache pro Modul und der verbesserte Uncore-Bereich sollte da helfen, sagen wir nochmal 10%. Der Turbo-Modus scheint deutlich fein-granularer gesteuert werden zu können, da ließe sich dann auch wieder ein paar Prozente rausholen. Ansonsten muss die Holzhammer-Methode herhalten, mehr Kerne mit mehr Takt. Zu hoffen bleibt, dass die Verbesserungen in der Fertigung das Energieverbrauchs-mäßig ausgleichen.

mboeller, 3,5GHz bei einem 16C MCM kann ich mir in keinster Weise vorstellen. Ich fände es schon eine starke Leistung, wenn sie mit dem "Dickschiff" auf 3GHz kämen. Wenn sie mit Interlagos auf 3,5GHz kämen, wo soll denn dann ein 2C Zambezi landen? Bei 5GHz?

Bucklew
2011-01-12, 21:10:54
ich verstehe auch nicht warum alle meinen dass bd jezt zu spät kommen soll, wahrscheinlich ende april/mai also noch vor highend sandy bridge.
Bulldozer ist 22 Monate zu spät. Was sonst als "spät" sind 22 Monate?

Sorkalm
2011-01-12, 21:29:31
Bulldozer ist 22 Monate zu spät. Was sonst als "spät" sind 22 Monate?

Naja, auf welchen Planungsstand berufst du dich denn da? Den 45nm-Bulldozer hat man sehr frühzeitig gecancelt, war der überhaupt aus dem Stand einiger paar PDF-Dokumenten und Simulationen schon heraus? Da wird viel noch korrigiert, denke ich.

Nakai
2011-01-12, 21:45:42
Bulldozer ist 22 Monate zu spät. Was sonst als "spät" sind 22 Monate?

Bulldozer vor 22 Monate != Bulldozer now


mfg

Trap
2011-01-12, 22:22:47
Bis auf mehr Cores erwarte ich da aber keine wirklich sensantionelle Leistungssteigerung - es sei denn sie kommen mit deutlich mehr Takt.
Das einzige was AMD bis jetzt zur Leistung gesagt hat war 50% mehr SpecINT rate als magny cours. Das wären 12,5% Mehrleistung pro Core bei gleichem Stromverbrauch. Der Unterschied bei SpecFP soll wohl größer sein, in http://info.nuje.de/AMD_Interlagos_performance_estimation_new.png (keine Ahnung ob die Grafik stimmt, war mal bei Dresdenboy im Blog verlinkt) sind es 40% Mehrleistung pro Core bei gleichem Stromverbrauch.

Wie sich das genau zusammensetzt und wie sich das Verhältnis verschiebt wenn man statt 8W pro Kern beim Serverchip dann 15+W pro Kern bei den Desktopchips zur Verfügung hat ist wieder nicht so einfach zu beantworten.

Wenn man mal bei SPEC nachguckt (und mit den zahlen oben weiterrechnet):
2*X5680 350 int-rate
2*X5680 250 fp-rate
2*6176 SE 350 int-rate
2*6176 SE 295 fp-rate
2*interlagos 525 int-rate
2*interlagos 550 fp-rate

Bei 60W hätte ein 8-Core Bulldozer also 75%/110% der X5680 int/fp-Leistung. Bei 120W werden es mehr als das sein ;)

Coda
2011-01-12, 22:30:08
Ich bezog mich auf Sockel-R.

Bucklew
2011-01-13, 00:05:55
Bulldozer vor 22 Monate != Bulldozer now
Ist das jetzt positiv oder negativ?

S940
2011-01-13, 00:20:41
AMD dürfte dann ein paar Wochen bis Monate die schnellste CPU haben, bevor die Sockel-R-Plattform (vermutlich) alles platt macht.
Hmm, da kommt dann aber auch Interlagos ...
Bei 16 Thread auf 8 Kernen gegen 16 Threads auf 16 Clustern wird man kaum ein "platt machen" erwarten dürfen.
Intel mag ne Gamer Version rausbringen, AMD nicht, aber das ändert nichts daran, dass Gamer sowohl mit SandyE als auch Interlagos schlecht bedient sein werden ;-)
Ist das jetzt positiv oder negativ?
Das Thema "paar Jahre zu spät" hatten wird doch erst. Meine Meinung dazu steht hier:
http://www.forum-3dcenter.org/vbulletin/showthread.php?p=8470648#post8470648

Coda
2011-01-13, 00:27:24
Ist das jetzt positiv oder negativ?
Sie werden ihn wohl kaum verschlechtert haben in der Zeit.

Duplex
2011-01-13, 00:31:10
Ist das jetzt positiv oder negativ?

- 32nm SOI @HighK statt 45nm SOI
- AVX statt SSE5
- höhere Taktraten
- mehr Cache

Bucklew
2011-01-13, 00:46:30
- 32nm SOI @HighK statt 45nm SOI
- AVX statt SSE5
- höhere Taktraten
- mehr Cache
Muss trotzdem noch lange nicht bedeuten, dass man mit Intel mithalten kann. Wie war das damals noch bei Barcelona? Sollte doch alles von Intel meilenweit vernichten und dann....?!

Duplex
2011-01-13, 00:51:34
Wie war das damals noch bei Barcelona? Sollte doch alles von Intel meilenweit vernichten und dann....?!
das stimmt nicht, du verwechselst das mit K7 oder K8 der besser als Intel war,

Barcelona war eine 2. K8 Revision, das Design ist inzwischen über 8 Jahre alt,
den echten K8 Nachfolger hat AMD damals gestrichen, Bulldozer ist der echte K10, jedenfalls sehen das so die AMD Ingenieure.

Armaq
2011-01-13, 01:45:36
Wird einen Grund geben, warum Meyer gehen musste. Vll. ist Bulldozer nicht gut genug, oder man will zusammen mit Bulldozer einen neuen Chef präsentieren, weil das Teil abartig gut ist.

Mancko
2011-01-13, 09:27:53
Wird einen Grund geben, warum Meyer gehen musste. Vll. ist Bulldozer nicht gut genug, oder man will zusammen mit Bulldozer einen neuen Chef präsentieren, weil das Teil abartig gut ist.

Ganz ehrlich... Ich glaube es wird wieder nicht reichen. SandyBridge hat wirklich sehr gut vorgelegt. Die CPU Power und der Vorsprung zu den hauseigenen aber vor allem AMD's augenblicklichen Top Prozessoren ist schon immens. Ich glaube nicht daran, dass Bulldozer das aufholen kann. AMD wird wohl weiterhin kaum eine Chance haben in höheren Preissegmenten Produkte zu verkaufen.
Vieles dauert bei AMD einfach immer zu lange bis die Produkte dann endlich kaufbar sind. Bis dahin hat Intel häufig genügend Zeit gehabt sich vorzubereiten.

robbitop
2011-01-13, 09:43:36
AMD scheint seit Core 2 immer genau eine Generation hinten zu liegen. Hätte es einen 65nm DualCore Phenom 1 gegeben, hätte man kurz vor der Einführung der Wolfdales/Yorkfields den Conroe aufgeholt. Kurz vor Einführung von Nehalem hat man Wolfdale/Yorkfield mit Phenom 2 eingeholt. Und ich vermute ebenfalls, dass Bulldozer "nur" für Nehalem reichen wird, während Sandy Bridge allerdings schon draußen ist.

Es ist pure Spekulation - aber was Intel im Bereich IPC seit Core 2 konstant geleistet hat, ist wirklich beeindruckend und kaum aufholbar. 50 % mehr IPC ggü. Phenom 2 - das ist ein schweres Los.

AnarchX
2011-01-13, 09:54:42
Rumour: Bulldozer 50% faster than Core i7 950 and Phenom II X6 1100T
DonanimHaber have revealed early performance indications for AMD's much anticipated next-gen Bulldozer architecture, in the form of Zambezi CPUs. The benchmarks were sourced from an official AMD document, in three categories, Media, Rendering and Games, and the Bulldozer 8-core sampled ended up a whopping 50% faster than Intel's Core i7 950 and AMD's current flagship Phenom II X6 1100T.[...]
http://vr-zone.com/articles/rumour-bulldozer-50-faster-than-core-i7-950-and-phenom-ii-x6-1100t/10819.html

Weniger selektiert vielleicht dann 30%.

Aber eine ~$100 Preissenkung bei den Intel CPUs wäre schon keine schlechte Sache. ;D

Limit
2011-01-13, 10:03:04
Auf so einen Test gebe ich nicht sonderlich viel, auch wenn es zu wünschen wäre, wenn die Werte stimmten. Man sollte berücksichtigen, dass sowohl "Media" als auch "Rendering" quasi perfekt mit der Anzahl der Kerne skalieren sollte und alleine das schon 1/3 mehr Performance bringt. Und dieser 50% Speed-Bonus im Vergleich zu 33% mehr Kernen hatte ja schon JF für Magny Cours vs. Interlagos genannt.
Andererseits wäre es schon eine ordentliche Leistung, wenn Bulldozer IPC mäßig mit der Nehalem Architektur gleichziehen oder sie überholen könnte.

Ronny145
2011-01-13, 10:06:12
Der i7-950 ist doch nur ein Vierkerner, noch dazu "nur" ein Bloomfield und kein Westmere oder Sandy Bridge. Eigentlich ist das ernüchternd. Das 8-Bulldozer Core Modell ist doch schon das größte Modell, dürfte gerade beim Rendering und anderen multithreaded Sachen im Vorteil sein.

Bei hardware.fr rendert ein 2500k in Cinema 4D und 3D Studio Max auf Höhe des i7-950. Das als 4-Kerner. Aufschlussreicher wären auch die Ergebnisse des 1100T in AMDs Dokument.

Armaq
2011-01-13, 10:14:03
AMD scheint seit Core 2 immer genau eine Generation hinten zu liegen. Hätte es einen 65nm DualCore Phenom 1 gegeben, hätte man kurz vor der Einführung der Wolfdales/Yorkfields den Conroe aufgeholt. Kurz vor Einführung von Nehalem hat man Wolfdale/Yorkfield mit Phenom 2 eingeholt. Und ich vermute ebenfalls, dass Bulldozer "nur" für Nehalem reichen wird, während Sandy Bridge allerdings schon draußen ist.

Es ist pure Spekulation - aber was Intel im Bereich IPC seit Core 2 konstant geleistet hat, ist wirklich beeindruckend und kaum aufholbar. 50 % mehr IPC ggü. Phenom 2 - das ist ein schweres Los.
Sicherlich, aber Intel zaubert ja nicht, sie entwickeln. AMD hat auch fähige Ingenieure, stimmen die Bedingungen nicht?

y33H@
2011-01-13, 10:32:44
+50% schneller als X6 1100T ist auf Höhe des 980X, wenn nicht gar davor (je nach Benchmark-Auswahl). AMD wird vermutlich viel Multithreading nutzen, was die Spieleleistung ausgleichen sollte. Gerade bei letzterem aber ist SB eine Wucht. Klingt ein bisschen wie ein Thuban mit acht Kernen: In Anwendungen rasend schnell und in Spielen immer noch eine hohe Leistung, aber klar hinter Intel. Und im Mittel damit grob gleichauf.

Ronny145
2011-01-13, 10:35:10
+50% schneller als X6 1100T ist auf Höhe des 980X, wenn nicht gar davor (je nach Benchmark-Auswahl). AMD wird vermutlich viel Multithreading nutzen, was die Spieleleistung ausgleichen sollte. Gerade bei letzterem aber ist SB eine Wucht. Klingt ein bisschen wie ein Thuban mit acht Kernen: In Anwendungen rasend schnell und in Spielen immer noch eine hohe Leistung, aber klar hinter Intel. Und im Mittel damit grob gleichauf.


Zum 1100T stehen keine Prozente in der Quelle. Die 50% beziehen sich nur auf den i7-950.

The estimated results in the document, processors, three different categories (media, rendering and game) in comparing the overall assessment of the Bulldozer processor 8-core Core i7 950 is 50% faster stressed.

robbitop
2011-01-13, 10:37:08
Sicherlich, aber Intel zaubert ja nicht, sie entwickeln. AMD hat auch fähige Ingenieure, stimmen die Bedingungen nicht?
Intel hat einfach wesentlich mehr Ressourcen. Vor ein paar Jahren lagen zumindest einmal Faktor 10 dazwischen. Dafür hält AMD noch ganz gut mit.

y33H@
2011-01-13, 10:46:30
@ Ronny145

Argl. Dann ist's nicht toll ...

Raff
2011-01-13, 10:52:06
Intel hat einfach wesentlich mehr Ressourcen. Vor ein paar Jahren lagen zumindest einmal Faktor 10 dazwischen. Dafür hält AMD noch ganz gut mit.

So beeindruckend das immer klingt (und teilweise bestimmt auch so ist): Ich denke, dass bei Intel eine Menge Selbstschutz (vor der Zerschlagung) mitspielt. Die könnten locker deutlich höher taktende Modelle auf den Markt bringen. Oder kleine Gulftowns, um die Turbane zu vernichten. Tun sie aber nicht, damit AMD überlebt – und damit auch Intel in dieser Form.

MfG,
Raff

Undertaker
2011-01-13, 10:53:45
Immerhin sollen auch Spiele in diesem Mittelwert mit eingeschlossen sein. Wenn man inkl. derer noch 50% vor einem i7 950 landet, muss die Anwendungsleistung absolut brachial sein, oder aber man hat in diesem Bereich wirklich massiv aufholen können.

Wobei wir letztlich auch über von AMD selbst zusammengestellte und ermittelte Benchmarks reden, von einer sorgfältigen Auswahl der Software kann man also ausgehen...

Nakai
2011-01-13, 10:54:32
Auf langer Sicht hilft auch AMD zum Erhalt des X86-Marktes mit. Die Konkurrenz die ARM im unteren Segment liefert(und in Zukunft könnte es auch nach oben gehen...), darf nicht unterschätzt werden.


mfg

S940
2011-01-13, 10:55:23
Es ist pure Spekulation - aber was Intel im Bereich IPC seit Core 2 konstant geleistet hat, ist wirklich beeindruckend und kaum aufholbar. 50 % mehr IPC ggü. Phenom 2 - das ist ein schweres Los.
Naja, IPC ist das eine, multicore Leistung das andere, und da hat man halt den schon bekannten Speedup Vorteil CMT zu SMT Vorteil (+80 statt +30%). Wenn die Grundleistung nicht allzuschlecht ist, reicht das schon, um nen Quad Intel zu schlagen, egal ob Nehalem oder Sandy.
Aber das wissen wir schon seit den letzten 50 Seiten, spannend wird nur die single Thread Sache. Da weiss man, dass es wenigstens besser als ein Ph2 wird, und der Rest über den Takt gehen muss. Obs reicht, wird man sehen müssen.
Der i7-950 ist doch nur ein Vierkerner, noch dazu "nur" ein Bloomfield und kein Westmere oder Sandy Bridge. Eigentlich ist das ernüchternd. Das 8-Bulldozer Core Modell ist doch schon das größte Modell, dürfte gerade beim Rendering und anderen multithreaded Sachen im Vorteil sein.

Bei hardware.fr rendert ein 2500k in Cinema 4D und 3D Studio Max auf Höhe des i7-950. Das als 4-Kerner. Aufschlussreicher wären auch die Ergebnisse des 1100T in AMDs Dokument.
Hmm, und ? Laut der ominösen Quelle wäre der Bulldozer (mit wieviel Takt auch immer), 50% schneller als der i7 950. Mit Deiner Erkenntnis, dass der i5 2500K in etwa auf i7 950 Niveau rendert, ergibt das logischerweise dann die Aussage, dass BD auch +50% schneller als ein nagelneuer Sandy 2500K wäre.
Ist doch nicht soo schlecht, oder etwa nicht ?

Genaugenommen wäre es aber auch nur die Bestätigung von obiger CMT >> SMT Vermutung. Vor allem, wenn mans gegen einen 2500K ohne SMT einsetzt, ist das Ergebnis dann glasklar.

Die Frage die wieder Mal offen bleibt, ist wieder die gleiche wie oben, Single Thread Leistung. Man könnte jetzt die zitierten Gameergebnisse hernehmen, da gelten scheinbar die +50% auch:
Carefully examined the performance table in the 8-core processor, AMD's Bulldozer makes a difference, especially game and rendering tests.
Aber da man nicht weiß, welche Spiele da ausgewählt wurden, bringt das auch nichts. Für ne Mischung aus StarCraft2 (giert nach Cache), und einem Civ5/Gothic4 (gieren nach Kernen) oder ähnlich modernen, multithreaded Spielen, wäre das auch keine Überraschung.

Aber ich nehm das Gerücht mal als vorsichtige Rechtfertigung, dass die best-case Vermutungen korrekt waren. Wäre bei AMD ja auch schon was Positives :freak:

fondness
2011-01-13, 10:58:17
AMD scheint seit Core 2 immer genau eine Generation hinten zu liegen. Hätte es einen 65nm DualCore Phenom 1 gegeben, hätte man kurz vor der Einführung der Wolfdales/Yorkfields den Conroe aufgeholt. Kurz vor Einführung von Nehalem hat man Wolfdale/Yorkfield mit Phenom 2 eingeholt. Und ich vermute ebenfalls, dass Bulldozer "nur" für Nehalem reichen wird, während Sandy Bridge allerdings schon draußen ist.

Es ist pure Spekulation - aber was Intel im Bereich IPC seit Core 2 konstant geleistet hat, ist wirklich beeindruckend und kaum aufholbar. 50 % mehr IPC ggü. Phenom 2 - das ist ein schweres Los.

Selbst wenn es für SandyBridge reicht, IvyBridge in 22nm steht vor der Tür. Bulldozer war für AMD erst jetzt in 32nm machbar und damit schließlich sich der Kreis. Es ist fast unmöglich gegen jemanden auf Augenhöhe zu konkurrieren der einen Großteil der Zeit einen Full-Node Vorsprung hat. Das geht nur wenn sich dieser zu sicher fühlt und leichtsinnig wird. Aber der K8 war wohl der endgültige Weckruf für Intel.

AMD hat nicht die Ressourcen um wie Intel jährlich ein neues Prozessordesign raushauen zu können. Intel investiert aktuell 20% seines enormen Umsatzes in RnD und hat trotzdem noch riesige Gewinne, da kann keiner mehr mit. Wenn man sich die Aussagen des Vorgängers von Meyers so anhört, war das wohl auch der Grund für die Entlassung: Das Board of Directors sucht einen Markt wo man nicht mit Intel konkurrieren muss, den hat Meyers offenbar nicht gefunden.

Gipsel
2011-01-13, 10:59:54
mboeller, 3,5GHz bei einem 16C MCM kann ich mir in keinster Weise vorstellen. Ich fände es schon eine starke Leistung, wenn sie mit dem "Dickschiff" auf 3GHz kämen. Wenn sie mit Interlagos auf 3,5GHz kämen, wo soll denn dann ein 2C Zambezi landen? Bei 5GHz?
Das kommt alles auf die Auslegung an. Schau Dir doch mal IBMs Power6 oder Power7-Teile an! ;)

Power7:
8 Kerne, 576 mm² in 45nm und 3,7 GHz normal und mit TurboCore (nur 4 Kerne aktiv) dann 4,25 GHz. Und davon packen die dann noch bis zu 4 Chips in ein MCM-Modul (32 Kerne mit jeweils 4 Threads, also 128 Threads pro Modul) :freak:. Okay, der Stromverbrauch so eines Moduls ist auch jenseits von gut und böse, aber es ist nicht so, daß das nicht gehen würde.

puntarenas
2011-01-13, 11:03:22
@ Ronny145

Argl. Dann ist's nicht toll ...
Wir haben ja auch das grundsätzliche Problem, dass die klassische 3DCenter-Perspektive (Games) und die Positionierungsvorstellungen von AMD womöglich (notgedrungen) auseinanderlaufen. Für mich sieht das immer mehr so aus, als ob AMD sich aus dem Wettkampf um Single-Thread-Monster verabschiedet hat und Bulldozer aus Gamersicht einfach nur zum Gähnen wird. Entsprechend werden auch die Sneak-Benchmarks ablaufen, Spielebenchmarks der Kategorie PCGH-Benchsklave sind wohl eher nicht vertreten und was man mitlaufen lässt wird hübsch in Durchschnittswerten versteckt.

AMD hat Fusion für Notebooks und Office-Rechner, einen Multi-Thread-Achtungserfolg mit frühem Octacore für spezielle Anwendungsfälle und nichts für mich im Angebot, so stelle ich mir den Sommer 2011 vor. :(
P.S. Selbstverständlich "weiß" ich, dass niemand eine Sandy Bridge IPC zum Gamen benötigt, ein Athlon II kann alle... mach alle...

y33H@
2011-01-13, 11:11:34
Es klafft ja schon mit X6 gegen SB: Erstere sind sehr flott im Multithreading, werden bei Singlethread und Spielen aber von letzteren regelrecht zersägt. Möglich, dass AMD mit BD diesen Schritt weiterverfolgt - was ok ist, schließlich ist ein X4/X6 ja nicht absolut zu langsam in Spielen oder Singlethread, sondern "nur" in Relation.

robbitop
2011-01-13, 11:13:44
So beeindruckend das immer klingt (und teilweise bestimmt auch so ist): Ich denke, dass bei Intel eine Menge Selbstschutz (vor der Zerschlagung) mitspielt. Die könnten locker deutlich höher taktende Modelle auf den Markt bringen. Oder kleine Gulftowns, um die Turbane zu vernichten. Tun sie aber nicht, damit AMD überlebt – und damit auch Intel in dieser Form.

MfG,
Raff
Ja definitiv ist das so. Intel hält sich eindeutig mit Taktraten, Preisen und Releasedates zurück. Wenn man bedenkt, wie lange es schon sehr gut laufende Sandy Bridge Samples gibt.

Limit
2011-01-13, 11:17:35
Immerhin sollen auch Spiele in diesem Mittelwert mit eingeschlossen sein. Wenn man inkl. derer noch 50% vor einem i7 950 landet, muss die Anwendungsleistung absolut brachial sein, oder aber man hat in diesem Bereich wirklich massiv aufholen können.

Wobei wir letztlich auch über von AMD selbst zusammengestellte und ermittelte Benchmarks reden, von einer sorgfältigen Auswahl der Software kann man also ausgehen...

Ich vermute mal solche Leaks dienen genau dazu solche Eindrücke zu vermitteln. Allerdings würde man auch auf 50% Mehrleistung insgesamt kommen, wenn man 10 Media, 10 Rendering und nur 3 Games misst. Wenn man dann alle gleichgewichtet zusammenrechnet, spielen die Games praktisch keine Rolle mehr. Das ist das Problem an solch schwammingen Aussagen. Es kann sich alles möglich dahinter verstecken.

Naja, IPC ist das eine, multicore Leistung das andere, und da hat man halt den schon bekannten Speedup Vorteil CMT zu SMT Vorteil (+80 statt +30%). Wenn die Grundleistung nicht allzuschlecht ist, reicht das schon, um nen Quad Intel zu schlagen, egal ob Nehalem oder Sandy.

Das gilt allerdings nur, wenn man Intel's Kerne mit AMD's Modulen vergleicht oder eben Intel's Threads mit AMD's Kernen.


Hmm, und ? Laut der ominösen Quelle wäre der Bulldozer (mit wieviel Takt auch immer), 50% schneller als der i7 950. Mit Deiner Erkenntnis, dass der i5 2500K in etwa auf i7 950 Niveau rendert, ergibt das logischerweise dann die Aussage, dass BD auch +50% schneller als ein nagelneuer Sandy 2500K wäre.
Ist doch nicht soo schlecht, oder etwa nicht ?

Das wäre sicherlich schön, insbesondere für die Bereiche Media und Rendering, aber bei 100% mehr Kernen sind 50% mehr Leistung auch keine so überragende Leistung.


Das kommt alles auf die Auslegung an. Schau Dir doch mal IBMs Power6 oder Power7-Teile an! ;)

Power7:
8 Kerne, 576 mm² in 45nm und 3,7 GHz normal und mit TurboCore (nur 4 Kerne aktiv) dann 4,25 GHz. Und davon packen die dann noch bis zu 4 Chips in ein MCM-Modul (32 Kerne mit jeweils 4 Threads, also 128 Threads pro Modul) :freak:. Okay, der Stromverbrauch so eines Moduls ist auch jenseits von gut und böse, aber es ist nicht so, daß das nicht gehen würde.

Jo, wäre schön, wenn Zambezi auch in den Bereich kommen würde. Ob allerdings Interlagos das mit der doppelten Anzahl an Kernen und als MCM das auch schafft, habe ich immer noch meine Zweifel. Selbst von Power7 ausgehend müssten sie die Kernzahl ohne jede Stromverbrauchserhöhung verdoppeln. Wenn sie das, schaffen Hut ab, aber wirklich vorstellen kann ich mir das nicht.

fondness
2011-01-13, 11:18:37
Es klafft ja schon mit X6 gegen SB: Erstere sind sehr flott im Multithreading, werden bei Singlethread und Spielen aber von letzteren regelrecht zersägt. Möglich, dass AMD mit BD diesen Schritt weiterverfolgt - was ok ist, schließlich ist ein X4/X6 ja nicht absolut zu langsam in Spielen oder Singlethread, sondern "nur" in Relation.

Wenn dann nur unabsichtlich.

S940
2011-01-13, 11:21:41
Für mich sieht das immer mehr so aus, als ob AMD sich aus dem Wettkampf um Single-Thread-Monster verabschiedet hat und Bulldozer aus Gamersicht einfach nur zum Gähnen wird.
Naja, würde ich jetzt nicht ganz so negativ sehen, hast DU mein Posting eventuell noch übersehen ? In der Orginalquelle steht ja, dass nicht nur die Renderbenches für die +50% verantwortlich sind, sondern auch die Spielebenches:
Carefully examined the performance table in the 8-core processor, AMD's Bulldozer makes a difference, especially game and rendering tests.
Jetzt muss man nur noch überlegen, an was das liegen könnte. Entweder Rosinenpickerei auf AMD Seite, wobei sie nur Spiele nehmen die mit mehr als 4 Kernen gut skalieren, oder aber eine faire Auswahl, bei der die 1-2 Thread Spiele durch die großen Caches und dicke Turbomodi profitieren.

Beim Thema IPC und Spiele darf man ja nicht vergessen, dass Intels IPC Vorsprung da oftmals an den Caches lagen und nicht an irgendwelchen besseren ALU Schaltkreisen.

Fazit: Skeptisch bin ich ebenfalls nach wie vor, da man nicht weiss, was AMD da ausgewählt hat, oder ob das Gerücht überhaupt den Tatsachen entspricht, aber die Hoffnung würde ich noch nicht begraben ;-)

ciao

Alex

SavageX
2011-01-13, 11:21:59
Selbst wenn es für SandyBridge reicht, IvyBridge in 22nm steht vor der Tür.

Ivy Bridge ist doch "nur" ein Die-Shrink, bis auf evtl. höhere Takt (und das ist nichtmal sicher, dieser Prozess muss erstmal eingefahren werden) da wird nicht gezaubert. Ich denke statt an der CPU wird da eher an der GPU herumgebastelt, da drückt es derzeit.

Weiterhin ist IvyBridge ja noch ein Jahr weg, das bringt AMD zeit, den 32nm Prozess vernünftig kennen zu lernen, zumal Intel vielleicht mal wieder nicht die Top-Modelle voranstellt.

Undertaker
2011-01-13, 11:27:12
Ich vermute mal solche Leaks dienen genau dazu solche Eindrücke zu vermitteln. Allerdings würde man auch auf 50% Mehrleistung insgesamt kommen, wenn man 10 Media, 10 Rendering und nur 3 Games misst. Wenn man dann alle gleichgewichtet zusammenrechnet, spielen die Games praktisch keine Rolle mehr. Das ist das Problem an solch schwammingen Aussagen. Es kann sich alles möglich dahinter verstecken.

Sowas ist natürlich denkbar. Zumal: In perfekt parallelisierten Anwendungen sollten mit den 8 Kernen eigentlich deutlich mehr als 50% Profit zu einem i7 950 möglich sein. Im Cinebench beispielsweise ist ein 980X schon mehr als 60% vor dem 950. Das würde Profite <50% in anderen Fällen, z.B. Spielen, leicht wieder ausgleichen, zumal wir ja wie von dir angesprochen die Zusammenstellung der Benchmarks nicht kennen.

Ivy Bridge ist doch "nur" ein Die-Shrink, bis auf evtl. höhere Takt (und das ist nichtmal sicher, dieser Prozess muss erstmal eingefahren werden) da wird nicht gezaubert.

Man kann sicherlich einen ähnlichen Schritt wie damals Nehalem->Westmere erwarten, wobei diesmal natürlich auch die GPU überarbeitet wird.

puntarenas
2011-01-13, 11:28:40
Fazit: Skeptisch bin ich ebenfalls nach wie vor, da man nicht weiss, was AMD da ausgewählt hat, oder ob das Gerücht überhaupt den Tatsachen entspricht, aber die Hoffnung würde ich noch nicht begraben ;-)
Aus meiner ganz begrenzten Perspektive wird Zambezi sehr viel wahrscheinlicher ein Flop, als ein Erfolg. Anders ausgedrückt, ich glaube nicht, dass man die Teile ruhigen Gewissens in einem Kaufberatungsthread "Gamer-CPU - AMD oder Intel?" wird empfehlen können. Trotzdem gilt natürlich, abwarten und rosinengepickte Informationshäppchen mampfen. :)

Gipsel
2011-01-13, 11:31:33
Jo, wäre schön, wenn Zambezi auch in den Bereich kommen würde. Ob allerdings Interlagos das mit der doppelten Anzahl an Kernen und als MCM das auch schafft, habe ich immer noch meine Zweifel. Selbst von Power7 ausgehend müssten sie die Kernzahl ohne jede Stromverbrauchserhöhung verdoppeln. Wenn sie das, schaffen Hut ab, aber wirklich vorstellen kann ich mir das nicht.
Eigentlich sollte mein Punkt sein, daß man von gar nichts definitiv ausgehen kann. Bulldozer wird sowohl eine andere Pipeline-Auslegung haben (das verringerte FOV4-Delay der Stages wurde ja schon mehrfach angesprochen), als auch einen deutlich anderen Prozeß nutzen (32nm HighK metal gates sind schon ein anderer Schnack als der bisherige 45nm Prozeß) als die heutigen CPUs. Dazu kommt noch, daß BD auch einige der bei Bobcat implementierten Sachen nutzt, um Strom zu sparen.

Kurz, uns fehlt bisher einfach ein Fixpunkt um zu sagen, wie viel Takt bei welchem Verbrauch man damit erreichen kann. Klar scheint nur zu sein, daß es mehr Takt wird und der Stromverbrauch dabei nicht wesentlich steigt. Alles andere ist Spekulation oder allerhöchstens "Guesstimates" ;)

S940
2011-01-13, 11:43:11
ich glaube nicht, dass man die Teile ruhigen Gewissens in einem Kaufberatungsthread "Gamer-CPU - AMD oder Intel?" wird empfehlen können. Trotzdem gilt natürlich, abwarten und rosinengepickte Informationshäppchen mampfen. :)
Im Moment gibts nichtmal passende AM3+ Bretter, geschweige den BD CPUs zu kaufen. Schon alleine aus dem Grund verbietet es sich Bulldozer zu empfehlen ;-)
Wies in nem halben Jahr aussieht, weiss man aber jetzt noch nicht. Wie besagt, die Hoffnung würde ich nicht begraben, aber das Ganze skeptisch beäugen. Für vorschnelle Fazits oder Empfehlungen ist es aufgrund der nicht vorhandenen Datenbasis nach wie vor zu früh.

Zitat von Limit http://www.forum-3dcenter.org/vbulletin/images/3dc/insanedruid/buttons/viewpost.gif (http://www.forum-3dcenter.org/vbulletin/showthread.php?p=8504253#post8504253)
Das gilt allerdings nur, wenn man Intel's Kerne mit AMD's Modulen vergleicht oder eben Intel's Threads mit AMD's Kernen.
(...)
Das wäre sicherlich schön, insbesondere für die Bereiche Media und Rendering, aber bei 100% mehr Kernen sind 50% mehr Leistung auch keine so überragende Leistung.

Natürlich, beides hängt dann davon ab, wie AMD die Preise gestaltet. Nachdem ein Bulldozer Modul mit 2MB L2 so groß wird, wie ein Sandy Kern mit 2MB L3, sehe ich da von den Produktionskosten her kein Problem, dass AMD sich bei den Preise an Intels 4Kernern orientiert.

Ist aber eh egal, das Thuban DIE ist deutlich größer als ein Nehalem und trotzdem billiger. Daran sieht man, dass sich AMD grob immer an Intel orientiert. Müssen sie ja auch, wer würde schon einen AMD X6 für 500 Euro kaufen ;-)

ciao

Alex

mboeller
2011-01-13, 12:35:18
Beim Thema IPC und Spiele darf man ja nicht vergessen, dass Intels IPC Vorsprung da oftmals an den Caches lagen und nicht an irgendwelchen besseren ALU Schaltkreisen.



...und man sollte nicht vergessen, das der BD 2 ALUs und 2 AGLUs pro INT-core hat. Laut der letzten Info können die AGUs auch einige ALU Operationen in einem Rutsch mit bearbeiten.

Limit
2011-01-13, 12:40:23
Eigentlich sollte mein Punkt sein, daß man von gar nichts definitiv ausgehen kann. Bulldozer wird sowohl eine andere Pipeline-Auslegung haben (das verringerte FOV4-Delay der Stages wurde ja schon mehrfach angesprochen), als auch einen deutlich anderen Prozeß nutzen (32nm HighK metal gates sind schon ein anderer Schnack als der bisherige 45nm Prozeß) als die heutigen CPUs. Dazu kommt noch, daß BD auch einige der bei Bobcat implementierten Sachen nutzt, um Strom zu sparen.

Kurz, uns fehlt bisher einfach ein Fixpunkt um zu sagen, wie viel Takt bei welchem Verbrauch man damit erreichen kann. Klar scheint nur zu sein, daß es mehr Takt wird und der Stromverbrauch dabei nicht wesentlich steigt. Alles andere ist Spekulation oder allerhöchstens "Guesstimates" ;)

Da hast du schon recht. Was mit aber dazu noch einfällt, ist JFs Kommentar zu einer Spekulation, dass BD bei > 5GHz ankommen könnte und diesem Kommentar zu Folge ist das vollkommen unrealistisch. Wenn jetzt aber ein 16C BD schon auf 3,5GHz Grundtakt käme und dabei unter, sagen wir mal, 140W bliebe, wie hoch könnte dann ein Dual- oder Quadcore takten?

Gipsel
2011-01-13, 13:45:10
Da hast du schon recht. Was mit aber dazu noch einfällt, ist JFs Kommentar zu einer Spekulation, dass BD bei > 5GHz ankommen könnte und diesem Kommentar zu Folge ist das vollkommen unrealistisch. Wenn jetzt aber ein 16C BD schon auf 3,5GHz Grundtakt käme und dabei unter, sagen wir mal, 140W bliebe, wie hoch könnte dann ein Dual- oder Quadcore takten?
Ich kenne den Kommentar jetzt nicht (Link?) aber >5GHz klingen wirklich unrealistisch. Man darf ja auch nicht vergessen, daß JF eigentlich nur für die Server-Sparte spricht. Er hat mehrfach betont, daß er über die Desktop-Versionen nicht wirklich Auskunft geben kann. Meiner Meinung nach könnten die von Dir erwähnten 3,5 GHz im Serverbereich vielleicht erstmal das Maximum darstellen. Die momentanen 12 Kerner hängen doch im Moment nur bei 2,3GHz oder so, nicht? In Anbetracht dessen ist alles über 3,5GHz in meinen Augen nicht zu erwarten. Im Desktop, nun, da könnten es schon eher Richtung 4 GHz sein, falls GF den Prozeß schon gut im Griff hat. Traditionell verbessert sich das ja im Laufe der Zeit ständig ein wenig.

Bucklew
2011-01-13, 14:39:15
das stimmt nicht, du verwechselst das mit K7 oder K8 der besser als Intel war,

Barcelona war eine 2. K8 Revision, das Design ist inzwischen über 8 Jahre alt,
den echten K8 Nachfolger hat AMD damals gestrichen, Bulldozer ist der echte K10, jedenfalls sehen das so die AMD Ingenieure.
Nö, keine Angst. Barcelona war ursprünglich der Phenom1 und da gab es auch vorher die hysterischen News, wie irre schnell der doch sein wird. Ungefähr wie vor 4 Wochen mit Cayman ;)

Sieht man doch schön hier im Thread, wie sich einige immer noch an Strohhalmen festklammern, dass Bulldozer Intel schlagen wird.

R.I.P.
2011-01-13, 14:41:01
Ich finde es wirklich erschreckend wie viele von uns Wörter wie Flop, Überflieger, etc. in den Mund nehmen, OHNE jegliche Information über den BD zu haben....auch wenn es sich hier um einen Spekulationstread handelt -.-

Ich spekuliere in 300%iger Spieleleistung eines einzelnen BD Modul gegenüber dem 990iger von Intel (absoluter Schwachsinn natürlich). So jetzt habe ich meinen Mist ohne jegliche Information auch dazugegeben

anddill
2011-01-13, 14:45:03
P3D gibt auch seinen Senf dazu:
http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1294920226

mapel110
2011-01-13, 14:50:55
P3D gibt auch seinen Senf dazu:
http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1294920226
Sehr schön, dass sie vor allem sagen, dass den AMD-Prozessoren vor Launch immer tolle Leistung bescheinigt wurde. Eingehalten wurde davon wenig. Also sollte man schon froh sein, wenn sie den Abstand zu Intel verkürzen können.

aylano
2011-01-13, 14:52:06
Wow, jetzt gibt es ein Gerücht, der die Leistung nennt, die eh schon ewig im Bereich des Möglichen liegt.

Bulldozer 8X wird so je nach IPC & Erfolg zwischen 3,5-4,0 Ghz liegen.

y33H@
2011-01-13, 15:19:33
P3D gibt auch seinen Senf dazu:
http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1294920226Wie kann man CMT mit 8 Int-Cores mit 4 Int-Cores plus SMT vergleichen und dann noch sagen, es ist bemerkenswert, wenn 8 Int-Cores 4 Int-Cores schlagen? *seufz* :usad:

anddill
2011-01-13, 15:21:29
Jo, mußte auch grinsen. Und das, obwohl ich selber AMD-Fanboy bin.

Twodee
2011-01-13, 15:27:10
Wie kann man CMT mit 8 Int-Cores mit 4 Int-Cores plus SMT vergleichen und dann noch sagen, es ist bemerkenswert, wenn 8 Int-Cores 4 Int-Cores schlagen? *seufz* :usad:
Dann kommt das Argument das die 8 Int Cores wohl nur genauso viel Platz benötigen wie die 4 von Intel ;D

Undertaker
2011-01-13, 15:30:16
So wie es aussieht, wird man wohl deutlich über den 248mm² des 6-Kern Westmere enden.

Coda
2011-01-13, 15:42:57
Dann kommt das Argument das die 8 Int Cores wohl nur genauso viel Platz benötigen wie die 4 von Intel ;D
Nun, wenn das so wäre, dann ist das gar nicht so komisch.

Für parallelisierbaren Code wäre das dann die weit effizientere Lösung.

y33H@
2011-01-13, 15:43:41
Wenn das Die von Zambezi deutlich größer ist als das von Gulftown, dann sollte auch die Performance besser sein. Und danach sieht es momentan nicht aus. Dabei wird doch bei den Radeons immer das Perf/mm² so gelobt ... bei den CPUs macht das keiner. Und warum? Weil AMD hier halt nicht besser ist *seufz*

Viel spannender als acht ausgelastete Int-Cores wäre doch endlich mal zu wissen, wie BD abgeht, wenn auf vier Modulen nur ein Thread läuft bzw. ein Thread pro Modul.
Für parallelisierbaren Code wäre das dann die weit effizientere Lösung.In der Tat. Diesbezüglich steht BD offenbar gut dar.

Nakai
2011-01-13, 15:50:02
Nun, wenn das so wäre, dann ist das gar nicht so komisch.

Für parallelisierbaren Code wäre das dann die weit effizientere Lösung.

Genaue Aussagen könnten eh erst getroffen werden, wenn wir wüssten, wieviel SMT im Vergleich zu CMT gekostet hätte.

IMO ist AMD mit Bulldozer den einfacheren Weg gegangen.


mfg

davidzo
2011-01-13, 16:00:43
So wie es aussieht, wird man wohl deutlich über den 248mm² des 6-Kern Westmere enden.

Nicht bei den Kernen. ein BD-Modul entspricht schon eher einem SB HT Core von Intel, allerdings ist die Cacheausstattung beider sehr ungleich.

Wenn das Die von Zambezi deutlich größer ist als das von Gulftown, dann sollte auch die Performance besser sein. Und danach sieht es momentan nicht aus. Dabei wird doch bei den Radeons immer das Perf/mm² so gelobt ... bei den CPUs macht das keiner. Und warum? Weil AMD hier halt nicht besser ist *seufz*


Wieso, Bobcat hat doch eine unschlagbare Perf/mm² auch was die CPus angeht. Kann an AMD doch für loben. im lowcostsegment zahlt sich diese sparsamkeit ja auch am ehesten aus.

Nur spielt das im highendbereich eben wenig eine Rolle. Preislich ist ein 300mm² nur wirklich teurer als ein 240mm² wenn es auch hauptsächlich aus Logik besteht. Cache ist sowohl billiger beim Design, weniger problemanfällig und besser debugbar, robuster in der Fertigung als auch einfacher recyclebar.
Wenn ein Fehler im Cache liegt, dann ist das nicht weiter Schlimm, gibts halt ne SKU mit nur 6mb L3. Allerdings gehe ich davon aus, dass für solche Fälle sowieso einige redundanz vorgesehen ist damit man auch bei einem winzigen Fehler dann noch auf 8MB kommt.
Ist allerdings ein modul defekt, kostet das bei Bulldozer schon einiges mehr, als ein defekt beim cache...

Bulldozer hat immerhin 16MB L2+3 Cache, die meiste Fläche sind also gar nicht die cores...

Gipsel
2011-01-13, 16:14:39
Wenn das Die von Zambezi deutlich größer ist als das von Gulftown, dann sollte auch die Performance besser sein. Und danach sieht es momentan nicht aus. Dabei wird doch bei den Radeons immer das Perf/mm² so gelobt ... bei den CPUs macht das keiner. Und warum? Weil AMD hier halt nicht besser ist *seufz*Das Layout der bisherigen AMD-CPUs sieht etwa so großzügig aus, wie das von Intels Atom. Das sieht immer so aus, als wenn man feste Building Blocks wie Legosteine verschiebt und dann eben zum Teil recht viel ungenutzte Fläche dazwischen entsteht. Daß das auch anders geht, zeigt eigentlich Ontario/Zacate (auf dem veröffentlichtem Floorplan der Bobcat-Kerne kann man gut sehen, daß es diese Blöcke dort nicht mehr gibt, die Einheiten haben unregelmäßige Formen und mischen sich sogar teilweise). Ich bezweifle aber, daß man das für die High-Performance-CPUs macht, da das mit erheblichem Mehraufwand verbunden ist, solange man das nicht zum größten Teil automatisch von einer Software layouten läßt (wie bei Ontario/Zacate). AMD wird, wenn das Layout der einzelnen (rechteckigen) Blöcke fertig optimiert wurde, im Prinzip für die verschiedenen Versionen nur per C&P duplizieren. Intel macht das (iirc seit Prescott) anders.

y33H@
2011-01-13, 16:19:33
Wieso, Bobcat hat doch eine unschlagbare Perf/mm² auch was die CPus angeht. Kann an AMD doch für loben. im lowcostsegment zahlt sich diese sparsamkeit ja auch am ehesten aus.

[...]

Bulldozer hat immerhin 16MB L2+3 Cache, die meiste Fläche sind also gar nicht die cores...Ich sehe noch nicht genug unabhängige Benchmarks von Bobcat (Ontario/Zacate), die dies untermauern. Wie der sich overall gegen einen DC-Atom und einen CULV-i3-2k schlägt, muss sich erst noch zeigen. Wobei Bobcat halt untrennbar mit der GPU verbunden ist und zudem 40 nm. Einen direkten Vergleich bei 40 nm kann man ergo nicht aufstellen. Das bisher gesehene aber ist verdammt gut.

Undertaker
2011-01-13, 16:24:15
Nicht bei den Kernen. ein BD-Modul entspricht schon eher einem SB HT Core von Intel, allerdings ist die Cacheausstattung beider sehr ungleich.

Solche Teilvergleiche halte ich für generell recht unnütz. Je nach Architektur ist ein großer Cache nuneinmal mehr oder weniger notwendig, um die resultierende Performance zu gewährleisten - bestes Beispiel ist der für seine Zeit mit gewaltigen 12MB L2 ausgestattete Core 2 Quad, der ohne diese Menge aber teils erheblich in der Performance einbrach.

Entscheidend für die Kosten ist doch, wie groß der Die letztlich auf dem Wafer ist. :)

S940
2011-01-13, 16:37:29
Dann kommt das Argument das die 8 Int Cores wohl nur genauso viel Platz benötigen wie die 4 von Intel ;D
Hmm nicht mal das, man könnte auch einfach anführen, dass es durchaus fair ist ein 4way 4Kern SMT Design mit 8 Threads, mit einem 2x2way 4 Modul CMT Design zu vergleichen.

Coda
2011-01-13, 16:50:57
Solche Teilvergleiche halte ich für generell recht unnütz. Je nach Architektur ist ein großer Cache nuneinmal mehr oder weniger notwendig, um die resultierende Performance zu gewährleisten - bestes Beispiel ist der für seine Zeit mit gewaltigen 12MB L2 ausgestattete Core 2 Quad, der ohne diese Menge aber teils erheblich in der Performance einbrach.
Vor allem ist die Cachegrößer eh nur eine Stellschraube für die Hitrate eines Caches. Die Verdrängungsstrategie und Assoziativität spielen eine mindestens genauso große Rolle.

Ich kann dir sehr einfach theoretisch einen 256 KiB Cache konstruieren der besser funktioniert als ein 1MiB großer direct mapped Cache ;)

Limit
2011-01-13, 16:56:00
Ich kenne den Kommentar jetzt nicht (Link?) aber >5GHz klingen wirklich unrealistisch. Man darf ja auch nicht vergessen, daß JF eigentlich nur für die Server-Sparte spricht. Er hat mehrfach betont, daß er über die Desktop-Versionen nicht wirklich Auskunft geben kann. Meiner Meinung nach könnten die von Dir erwähnten 3,5 GHz im Serverbereich vielleicht erstmal das Maximum darstellen. Die momentanen 12 Kerner hängen doch im Moment nur bei 2,3GHz oder so, nicht? In Anbetracht dessen ist alles über 3,5GHz in meinen Augen nicht zu erwarten. Im Desktop, nun, da könnten es schon eher Richtung 4 GHz sein, falls GF den Prozeß schon gut im Griff hat. Traditionell verbessert sich das ja im Laufe der Zeit ständig ein wenig.

5GHz? Only if the chips were powered by magic unicorns. Expect higher clock speeds on those processors than you see today, but not 5GHz. (http://www.amdzone.com/phpbb3/viewtopic.php?f=52&t=137432&start=125#p178665)

Mal angenommen es würde den 16C Interlagos wirklich mit 3,5GHz geben, der nicht mehr Strom verbraucht als Magny Cours und einen höheren IPC-Wert hat als K10.5 (Single thread IPC is higher. (http://aceshardware.freeforums.org/post14368.html#p14368)). Dann würde das Teil dem Namen Bulldozer wirklich alle Ehre machen, denn mehr Leistung pro Sockel würde mal wohl nirgends bekommen.

So schön das auch wäre, hab ich größte Zweifel daran. Selbst für den 8C Zambezi wären 3,5GHz schon ne Menge Holz.



Wie kann man CMT mit 8 Int-Cores mit 4 Int-Cores plus SMT vergleichen und dann noch sagen, es ist bemerkenswert, wenn 8 Int-Cores 4 Int-Cores schlagen? *seufz* :usad:

Naja, es kommt immer drauf an, was man als Fixpunkt für den Vergleich wählt. Wählt man die Zahl der Kerne, macht das natürlich keinen Sinn. Wählt man die Die-Größe, macht der Vergleich schon deutlich mehr Sinn. Nimmt man die Zahl der Threads macht es absolut Sinn. Außerdem wurde ja nicht nur gesagt, dass der 8C BD"nur" schneller sei, sondern >= 50% schneller.

Gipsel
2011-01-13, 17:15:57
So schön das auch wäre, hab ich größte Zweifel daran. Selbst für den 8C Zambezi wären 3,5GHz schon ne Menge Holz.Nun, der aktuelle 1100T läuft bei Last auf 6 Kernen mit 3,3 GHz, bei 3 Kernen auf 3,7 GHz. Da könnte man ~3,5 GHz für die 4 Modul-Version auf dem Desktop eigentlich schon irgendwie erwarten, oder?
Für Server würde ich wie gesagt die 3,5GHz wirklich als obere Grenze definieren, wenns weniger wird, überrascht mich das aber nicht.

Die Frage ist eben auch, wie gut GF den Prozeß schon im Griff hat. Kann man wirklich schon alle potentiellen Vorteile ausspielen? Die Geschichte sagt eigentlich nein. Vor allem bei AMD (jetzt GF) haben sich kleine, aber stetige Verbesserungen des Prozesses im Laufe der Zeit gezeigt.

S940
2011-01-13, 17:43:04
Nun, wenn das so wäre, dann ist das gar nicht so komisch.

Für parallelisierbaren Code wäre das dann die weit effizientere Lösung.
Das ist auch so, ein Sandykern hat inkl. 2MB L3 29,5mm²:
http://www.chip-architect.com/news/Llano_vs_SandyBridge_vs_Westmere.jpg

Für ein BD Modul bürgt das Zitat aus der off. ISSCC Beschreibung:
The design reduces the number of gates/cycle relative to prior designs, achieving 3.5GHz+ operation in an area (including 2MB L2 cache) of 30.9mm2.Offen bleibt, inwiefern sich die 8MB L3 zu Intels GPU & PCIe size verhält, und ob AMD eventuell noch irgedwas Exotisches versteckt, z.B. ne Directory.

Im Moment sieht es bei der Gesamtgröße nach 216mm² Sandy gegen 320mm² Zambezi aus, wobei die letzte Zahl die aktuelle Schätzung von Hans de Vries ist. Erscheint mir jetzt etwas hoch, eventuell war das Photoshop Orochi Foto doch noch mehr editiert, als bisher bekannt.

Gipsel
2011-01-13, 17:51:05
Das ist auch so, Sandy hat inkl. L3 29,5mm²:
http://www.chip-architect.com/news/Llano_vs_SandyBridge_vs_Westmere.jpg

Und für ein BD Modul bürgt das Zitat aus der off. ISSCC Beschreibung:
Offen bleibt, inwiefern sich die 8MB L3 zu Intels GPU & PCIe size verhält, und ob AMD eventuell noch irgedwas Exotisches versteckt, z.B. ne Directory.

Im Moment sieht es bei der Gesamtgröße nach 216mm² Sandy gegen 320mm² Zambezi aus, wobei die letzte Zahl die aktuelle Schätzung von Hans de Vries ist. Erscheint mir jetzt etwas hoch, eventuell war das Photoshop Orochi Foto doch noch mehr editiert, als bisher bekannt.
Nun, Du solltest bedenken, daß bei Bulldozer auch noch ~2 MB L3 pro Modul dazukommen, die bei SB in der angegebenen Fläche schon mit drin sind.

Ronny145
2011-01-13, 17:55:51
Das ist auch so, ein Sandykern hat inkl. 2MB L3 29,5mm²:
http://www.chip-architect.com/news/Llano_vs_SandyBridge_vs_Westmere.jpg




Vom 12. April 2010...


Gibt es auch aktuelle Zahlen bzw. hat sich das bewahrheitet?

aylano
2011-01-13, 17:56:05
320 mm² macht keinen Sinn.

260mm² eher, so wie Deneb.
Schließlich will AMD ja noch einen 5 Modul-Bulldozer rausbringen alias + 62mm², was dann schon mindestens 322+mm² wäre.
380+mm² für einen Bulldozer-5Modul wäre dann schon mehr als heftig.

S940
2011-01-13, 17:57:10
So schön das auch wäre, hab ich größte Zweifel daran. Selbst für den 8C Zambezi wären 3,5GHz schon ne Menge Holz.

Sehe ich nicht so, das ist für mich eher das untere Ende. Schon alleine aus dem Grund, dass Bulldozer eher das high-end Segment bestellen soll, darunter wird es ja weiterhin Phenoms und Athlons geben.

Technisch spricht auch alles dafür:


längere Pipeline -> mehr Taktspielraum
deutlich besserer Herstellungsprozeß ->weniger Verlustleistung -> einfacher zu kühlen -> mehr Taktspielraum
kleinere INT Kerne -> einfacheres Routing -> weniger Speedpath Probleme -> mehr Taktspielraum

Dagegen spricht nur die zusätzlichen (kleinen) Kerne/Cluster, aber wie wenig das ausmacht sieht man am X6, der wird nur durch ULK schon auf X4 Energieverbrauch gehalten, da sollte 32nm hK dann locker reichen, um die restlichen Kernchen wett zu machen.

Und schließlich steht im offiziellen AMD ISSCC Bericht drin, dass das Design für 3,5+GHz ausgelegt ist. Das heißt zwar im Umkehrschluß jetzt nicht, dass nicht doch Zambezis mit weniger kommen, aber man kann ganz deutlich ausschließen, dass 3,5 GHz "viel Holz" wären.

Edit:
Nun, Du solltest bedenken, daß bei Bulldozer auch noch ~2 MB L3 pro Modul dazukommen, die bei SB in der angegebenen Fläche schon mit drin sind.
? Habe ich doch bedacht:
Offen bleibt, inwiefern sich die 8MB L3 zu Intels GPU & PCIe size verhältSandy schleppt dafür halt ne GPU mit.

@aylano:
Mir fiel gerade wieder ein, dass Hans de Vries auf den Photos eventuell auch schon ein paar PCIe Connects ausgemacht hat. Nachdem schon auf dem Barcelona DIE ein 4ter Hypertransport Anschluss war, der aber lange nicht genutzt wurde, könnte das schon sein. In dem Fall könnte man dann noch etwas draufschlagen, aber über 300 wären immer noch viel. Naja, warten wirs mal ab.

@Ronny145:
Gute Frage, Hans hatte auf alle Fälle schon einen hochauflösenden DIE Shot, das sollte stimmen, aber ne Bestätigung wäre nicht schlecht, da gebe ich Dir recht. Weiss jemand was ?

ciao

Alex

AnarchX
2011-01-13, 18:00:24
320 mm² macht keinen Sinn.

260mm² eher, so wie Deneb.
Schließlich will AMD ja noch einen 5 Modul-Bulldozer rausbringen alias + 62mm², was dann schon mindestens 322+mm² wäre.
380+mm² für einen Bulldozer-5Modul wäre dann schon mehr als heftig.

Thuban bewegt sich auch in diesem Größenbereich. Der 5 Modul BD wird wohl auch eher Ende 2011 erscheinen, wenn 32nm entsprechend reif ist.

dildo4u
2011-01-13, 18:06:14
320 mm² macht keinen Sinn.

260mm² eher, so wie Deneb.
Schließlich will AMD ja noch einen 5 Modul-Bulldozer rausbringen alias + 62mm², was dann schon mindestens 322+mm² wäre.
380+mm² für einen Bulldozer-5Modul wäre dann schon mehr als heftig.
Magny-Cours war 2 mal 346mm².Ich schätze das 8 Core Modell wird ca so groß sein wie Thuban.

Undertaker
2011-01-13, 18:08:34
Vom 12. April 2010...


Gibt es auch aktuelle Zahlen bzw. hat sich das bewahrheitet?

Kann man ja recht einfach nachmessen:

http://images.bit-tech.net/content_images/2011/01/intel-sandy-bridge-review/sandy-bridge-die-map.jpg

Ich komme auf etwa 28mm², Hans hatte damals allerdings noch mit einer Gesamtgröße von 225mm² gerechnet (tatsächlich 216mm²) und wirklich pixelgenau ausmessen kann man das eh nicht - also die Größenordnung passt schon.

Der Bulldozer-Die (http://2.bp.blogspot.com/_KltGV0kj344/TPEr0Wzae1I/AAAAAAAAADw/bVJQfYMtTig/s1600/Hans+de+Vries+Bulldozer.jpg) scheint im Vergleich dazu vor allem durch recht große (Frei-?)Flächen zwischen den Modulen/Cache-Tiles aufgebläht, womöglich ja Absicht für eine bessere Taktbarkeit? Recht groß sieht mir auf den ersten Blick auch der Speichercontroller aus, müsste allerdings mal jemand nachmessen, ob er es im Vergleich zu SB wirklich ist.

S940
2011-01-13, 18:21:23
Der 5 Modul BD wird wohl auch eher Ende 2011 erscheinen, wenn 32nm entsprechend reif ist.
Hmm, der 32nm Prozess mag dann reif sein, aber ob es auch das BD ver2 Design ist ? In der offiziellen Roadmap steht auf alle Fälle 2012.

aylano
2011-01-13, 18:36:41
Mir fiel gerade wieder ein, dass Hans de Vries auf den Photos eventuell auch schon ein paar PCIe Connects ausgemacht hat. Nachdem schon auf dem Barcelona DIE ein 4ter Hypertransport Anschluss war, der aber lange nicht genutzt wurde, könnte das schon sein. In dem Fall könnte man dann noch etwas draufschlagen, aber über 300 wären immer noch viel. Naja, warten wirs mal ab.

Man braucht ja nur die Teilflächen kleiner machen und die Abstände zwischen den Teilflächen zu vergrößern.
Die Abstände zwischen L3 zum Rest scheint mir viel zu groß, wo normalerweise bisher fastkein/kein Abstand war.

PS: AMD hat ja die Modul-Bauweise vor 2006 vorgestellt und die würde ich jetzt bei diesem Die nicht sehen.
Unter der Modul-Bauweise würde ich das so verstehen, wie es Intel macht mit kaum Platz neben zwischen den Teilflächen.

Es wäre komisch, wenn die drauf vergässen hätten, dann hätte das Konzept Performance /mm² keinen Sinn, wenn so viel Platz zwischen den ganzen Teilflächen wäre

fondness
2011-01-13, 18:49:21
Das Layout der bisherigen AMD-CPUs sieht etwa so großzügig aus, wie das von Intels Atom. Das sieht immer so aus, als wenn man feste Building Blocks wie Legosteine verschiebt und dann eben zum Teil recht viel ungenutzte Fläche dazwischen entsteht. Daß das auch anders geht, zeigt eigentlich Ontario/Zacate (auf dem veröffentlichtem Floorplan der Bobcat-Kerne kann man gut sehen, daß es diese Blöcke dort nicht mehr gibt, die Einheiten haben unregelmäßige Formen und mischen sich sogar teilweise). Ich bezweifle aber, daß man das für die High-Performance-CPUs macht, da das mit erheblichem Mehraufwand verbunden ist, solange man das nicht zum größten Teil automatisch von einer Software layouten läßt (wie bei Ontario/Zacate). AMD wird, wenn das Layout der einzelnen (rechteckigen) Blöcke fertig optimiert wurde, im Prinzip für die verschiedenen Versionen nur per C&P duplizieren. Intel macht das (iirc seit Prescott) anders.

Das ist halt auch eine Frage der time-to-market. Den Luxus wie Intel die Schaltungen noch aufwändig zu sortieren hat man einfach nicht. Bulldozer ist längst überfällig und muss endlich kommen. Ob da jetzt das Die etwas größer ist, wo man die Kapazitäten bei GloFo eh nicht auslastet ist völlig gleichgültig.

Das könnte beim Bulldozer-Nachfolger 2012 mit GPU schon anders aussehen, denn da muss man eh etwas Fläche sparen wenn man noch eine schnelle GPU integrieren will und bis dahin hat man auch noch etwas Zeit.

w0mbat
2011-01-13, 20:03:16
was machen eigentlich die AGU pipelines und was könnten die mehr machen als normal?

Trap
2011-01-13, 20:30:46
AGU=Address Generation Unit

Die berechnen die Adressen für Speicherzugriffe. Die können weniger als die ALUs, hauptsächlich so Zeugs wie x+konstante*y

w0mbat
2011-01-13, 20:33:14
und eine theoretische AGLU?

Gestrandet
2011-01-13, 21:30:42
Was du meinst ist ein IGLU, das schnitzen sich die Eskimos aus Schnee und pennen drin.

w0mbat
2011-01-13, 22:11:33
ne.

S940
2011-01-13, 23:28:59
Es gibt ein Patent für ne Hybrid AGU/ALU pipeline, die hatten wir auch mal vermutet, nachdem AMD damals im November 09 nur 4 gleichartige Pipes ins BD INT Clusterkästchen zeichnete.
Mittlerweile weiss man aber, dass das nicht so ist.

Dann gabs noch ein anderes Patent, in dem die AGU ein paar rudimentäre Operationen ausführen konnte, aber das war nichts Weltbewegendes. Wenn ich mich recht erinnere, dann meinte auch jemand, dass das schon ein K8/K10 könnte. Wie auch immer, im Gedächtnis ist hängengeblieben, dass das nichts Aufregendes war.

ciao

Alex

w0mbat
2011-01-13, 23:40:58
Es gibt ein Patent für ne Hybrid AGU/ALU pipeline, die hatten wir auch mal vermutet, nachdem AMD damals im November 09 nur 4 gleichartige Pipes ins BD INT Clusterkästchen zeichnete.
Mittlerweile weiss man aber, dass das nicht so ist.

Dann gabs noch ein anderes Patent, in dem die AGU ein paar rudimentäre Operationen ausführen konnte, aber das war nichts Weltbewegendes. Wenn ich mich recht erinnere, dann meinte auch jemand, dass das schon ein K8/K10 könnte. Wie auch immer, im Gedächtnis ist hängengeblieben, dass das nichts Aufregendes war.

ciao

Alex

ist das sicher?

S940
2011-01-13, 23:52:43
ist das sicher?
Äh ja, weil AMD im Aug. 2010 jetzt ganz deutlich 2xAGU und 2xALU ins Kästchen geschrieben hast, die Folie musst Du doch kennen :freak:
http://www.3dcenter.org/dateien/abbildungen/amd_bulldozer_integereinheit.png
AGen = AGU
http://www.3dcenter.org/artikel/amd-bulldozer-rechenkerne-modul-bauweise

w0mbat
2011-01-14, 00:05:01
Ok, also nicht sicher. Nur weil dort was steht heißt es noch lange nicht, dass es so ist ;)

Knuddelbearli
2011-01-14, 00:24:32
Sowas ist natürlich denkbar. Zumal: In perfekt parallelisierten Anwendungen sollten mit den 8 Kernen eigentlich deutlich mehr als 50% Profit zu einem i7 950 möglich sein. Im Cinebench beispielsweise ist ein 980X schon mehr als 60% vor dem 950. Das würde Profite <50% in anderen Fällen, z.B. Spielen, leicht wieder ausgleichen, zumal wir ja wie von dir angesprochen die Zusammenstellung der Benchmarks nicht kennen.



beide haben 8 Threads also passt es ja 980X hat ja schon 12 Threads, und in Zukunft wird das der einzige brauchbare Vergleich sein weill die Ansätze zu verschieden ist. Frage ist eher nach der der leistung bei Singlethread da davon auch die Leistung bei 23 und 4 Threads mitabhängt, bringt ja nichts wenn er die Leistung nur auf die Strasse bringt wenn er auch mit 8 Threads gefüttert wird. Da wird es wichtig sein ob Microsoft oder AMD es schafft die Threads so zu handeln das die immer je ein Thread pro Modul bekommen, und wie gut ein eventuell Turboboost wirkt.

Nachteil davon ist natürlich das SDtrom verschwendet wird da man bei 4 Threads die kaum Leistung brauchen auch 2 komplette Module abschalten könnte statt 35% von 4 Modulen.

S940
2011-01-14, 01:07:13
Ok, also nicht sicher. Nur weil dort was steht heißt es noch lange nicht, dass es so ist ;)
Die Folie ist von AMDs hotchips Präsentation. Meinst Du, der AMD Fellow und Bulldozer Chefentwickler Mike Butler hat dort Unsinn erzählt ?

mboeller
2011-01-14, 07:17:15
Es gibt ein Patent für ne Hybrid AGU/ALU pipeline, die hatten wir auch mal vermutet, nachdem AMD damals im November 09 nur 4 gleichartige Pipes ins BD INT Clusterkästchen zeichnete.
Mittlerweile weiss man aber, dass das nicht so ist.



Wirklich? nvo hat im semiaccurate forum genau das wieder ausgegraben (aus einem AMD Dokument zum BD)

edit: hier ist der Link zum thread:
http://www.semiaccurate.com/forums/showthread.php?t=4074
posting #14 und #18

S940
2011-01-14, 08:38:08
Wirklich? nvo hat im semiaccurate forum genau das wieder ausgegraben (aus einem AMD Dokument zum BD)

edit: hier ist der Link zum thread:
http://www.semiaccurate.com/forums/showthread.php?t=4074
posting #14 und #18

Die Hybrid Teile sind mit der Folie mMn definitiv Geschichte. Hab mal noch gegoogelt, was das für "rudimentäre Befehle" waren, die ich vorher nannte, das war LEA:

U.a. hier beschrieben:
+;; LEA executes in AGU unit with 1 cycle latency on BDVER1.
+(define_insn_reservation "bdver1_lea" 1
+ (and (eq_attr "cpu" "bdver1")
+ (eq_attr "type" "lea"))
+ "bdver1-direct,bdver1-agu,nothing")http://patchwork.ozlabs.org/patch/68787/
Wie besagt, nichts Weltbewegendes, das machen K8/K10 auch schon so:
The three AGU's are used for memory read, write and complex versions of the LEA instruction. It is possible to do two
memory operations and one LEA in the same clock cycle. It is not possible to do three
memory operations because there are only two ports to the data cache.

The K10 can do a LEA instructions with no more than two operands in the ALU's, even if it has a SIB byte. A LEA instruction with a scale factor or with both base register, index register and addend is executed in the AGU. It is unknown whether a LEA with a RIP-relative address is executed in the AGU. A LEA executed in the AGU has a latency of 2 clock cycles. If the AGU and ALU are at the same stage in the pipeline, as the model suggests, then the extra latency is most likely explained by assuming that there is no fast data forwarding path between these two units.
Sogar ATOM kanns:
The LEA instruction uses the address generation unit (AGU) rather than the ALU. This
causes a latency of 4 clock cycles when dependent on a pointer register or index register
because of the distance between the AGU and the ALU. It is therefore faster to use addition
and shift instructions than to use the LEA instruction in most cases.
Quelle:
http://www.agner.org/optimize/microarchitecture.pdf

fondness
2011-01-14, 10:24:41
So beeindruckend das immer klingt (und teilweise bestimmt auch so ist): Ich denke, dass bei Intel eine Menge Selbstschutz (vor der Zerschlagung) mitspielt. Die könnten locker deutlich höher taktende Modelle auf den Markt bringen. Oder kleine Gulftowns, um die Turbane zu vernichten. Tun sie aber nicht, damit AMD überlebt – und damit auch Intel in dieser Form.

MfG,
Raff

Den selben Spruch hörte man vor K7 und K8 auch immer. Als es so weit war kam...nichts.

Sandybridge taktet mit Turbo auf 3.8Ghz, den riesigen Spielraum ohne mit der Spannung deutlich rauf zu gehen und damit naturgemäß den Stromverbrauch durch die Decke zu jagen sehen ich nicht. Übertakten kann man auch CPUs von AMD.

Klar könnten sie die Preise derart drücken das keiner mehr überlebt, aber das verstößt eben gegen das Wettbewerbsrecht. Aber das gilt bis zu einem gewissen Grad auch für AMD, auch die dürfen keine Dumpingpreise verlangen.

Undertaker
2011-01-14, 10:25:46
beide haben 8 Threads also passt es ja 980X hat ja schon 12 Threads, und in Zukunft wird das der einzige brauchbare Vergleich sein weill die Ansätze zu verschieden ist.

Gerade weil die Ansätze so verschieden sind, ist auch ein Vergleich rein nach Threadzahlen kaum möglich - sonst könnte man auch einen N550 gegen einen 2500K stellen, haben ja beide 4 Threads. ;)

Für den Endkunden entscheidend ist vor allem die Preisklasse, aus technischer Sicht interessant ist noch der Vergleich bei ähnlichem Verbrauch sowie Die-Size. Ich bin ja mal sehr gespannt, wie groß die 2-Modul Version von Bulldozer wird...

Canopus
2011-01-14, 10:32:50
AMD dürfte dann ein paar Wochen bis Monate die schnellste CPU haben, bevor die Sockel-R-Plattform (vermutlich) alles platt macht.
Verstehe ich nicht. Warum wird Desktop Zambezi mit Server Sandy-E verglichen?
Sandy-E wird im Desktop Bereich so interessant sein wie die Information darüber, dass wir Farbfernsehen haben.
Zudem wird eine Quad Channel Plattform mindestens 200€ kosten und dabei aber einer Ausstattung wie eine 60€ Platine haben. Alleine schon der Preis macht doch einen Vergleich unlogisch.
Sandy-E mit Quad Channel wird sich dann mit Interlagos und Quad Channel messen müssen oder umgekehrt.

fondness
2011-01-14, 10:36:31
beide haben 8 Threads also passt es ja 980X hat ja schon 12 Threads, und in Zukunft wird das der einzige brauchbare Vergleich sein weill die Ansätze zu verschieden ist.

Das wäre zulässig wenn AMD genau so viele Threads zum selben Preis liefern könnte wie Intel.

Die absolute Leistung kann man denke ich sehr gut in zwei Kategorien einteilen: Single-Thread-Leistung und Multi-Thread-Leistung, beides ist je nach Einsatzgebiet mehr oder weniger bedeutend.

Trotzdem sehe ich das Problem nicht. 50% über einem i7 950 ist alles andere als wenig, auch ein 980X erreicht das im Schnitt nicht. Wer natürlich erwartet das AMD alles platt macht der wird enttäuscht sein, aber man sollte halt auch realistisch bleiben. Ein K8 war auch nur möglich weil sich Intel in eine Sackgasse manövriert hat und leichtsinnig wurde, das sehe ich aktuell nicht, ganz im Gegenteil.

Aber auch so wäre das auf jeden Fall ein beachtlicher Sprung und angesichts der Mittel von AMD mehr als beeindruckend. Man wird mit diesem innovativem Design zudem weiter die Technologieführerschaft behalten, nach dem integrierten MC bei K8, dem nativen Quad-Core mit drei Cachelevel hat man bald ein Moduldesign. Auch hier wird Intel über kurz oder lang nachziehen müssen.

Knuddelbearli
2011-01-14, 10:59:20
Für den Endkunden entscheidend ist vor allem die Preisklasse, aus technischer Sicht interessant ist noch der Vergleich bei ähnlichem Verbrauch sowie Die-Size. Ich bin ja mal sehr gespannt, wie groß die 2-Modul Version von Bulldozer wird...

auch nicht wirklich, Die Size ist außer für Technikleute uninteressant. und P/L ist dann eben davon abhängig wieviele Threads genutzt werden. für mein Anwendungsbereich kan ich viele Kerne eh gut gebrauchen zocke zwar auch viel aber da brauch ich nicht Leistung ohne Ende

y33H@
2011-01-14, 11:13:44
Verstehe ich nicht. Warum wird Desktop Zambezi mit Server Sandy-E verglichen? Sandy-E wird im Desktop Bereich so interessant sein wie die Information darüber, dass wir Farbfernsehen haben. Zudem wird eine Quad Channel Plattform mindestens 200€ kosten und dabei aber einer Ausstattung wie eine 60€ Platine haben. Alleine schon der Preis macht doch einen Vergleich unlogisch. Sandy-E mit Quad Channel wird sich dann mit Interlagos und Quad Channel messen müssen oder umgekehrt.SBe kommt wohl auch als "normale" Desktop-Plattform, Interlagos (BD mit 8M/16C) nicht. Zudem 8C gegen 8C, zumindest Integer.

Canopus
2011-01-14, 11:34:54
y33H@, in einem anderen Forum sagt du selber dass man ein BD Modul nicht = 2 Kerne 200% sehen kann sondern nur als 2 Kerne = 160%.
Jetzt argumentierst du BD hat 8 Kerne gegen Sandy 8 Kerne und verschweigst SMT bei Sandy. Könntest du mir das erklären wie man das alles so vermischen kann? Das hört sich für mich nicht an einer gleichbleibenden Argumentation an.

Zudem wird auch die mögliche 1356 Plattform keine 2% im Desktop erreichen und auch teuer sein. AMD wird auch diesen Markt nicht bedienen, weil es für AMD keinen Sinn ergibt eine 2% Marktnische zu bedienen die man dann auch noch teilen müsste.

Wird 1356, die ja immer noch als nicht bestätigt gilt Quad Channel haben?

Undertaker
2011-01-14, 11:44:51
auch nicht wirklich, Die Size ist außer für Technikleute uninteressant.

Genau das steht auch in meinem Posting. ;) Auch wenn die Die-Size natürlich die Fertigungskosten beeinflusst, hängt der letztendliche Marktpreis praktisch überhaupt nicht davon ab, da keine relevante Bedeutung für den Käufer.

Technisch ist sie insofern interessant, als das z.B. zusätzliche Kerne bei weniger Takt (innerhalb ein- und derselben Architektur) immer die effizientere Lösung sind, wenn es um die Multithreadleistung geht - man kann sozusagen zusätzliche Fläche gegen eine höheren Leistung oder niedrigere TDP tauschen.

AnarchX
2011-01-14, 11:45:50
Wird 1356, die ja immer noch als nicht bestätigt gilt Quad Channel haben?

LGA 2011 wird wohl 4 Speicherkanäle besitzen, während 1356 eine abgespeckte Version mit 3 Speicherkanälen sein wird und wohl auch bei der TDP unterhalb von 150W bleiben wird.

Wenn Intel eine Extra-Maske für einen 6-Core SNBe hat, könnte das wohl der in der Die-Größe vergleichbare Gegner zum 4 Modul BD sein.

Canopus
2011-01-14, 12:03:38
AnarchX, danke für die Antwort. Also wird die mögliche 1356 Plattform auch nicht unterhalb von 140€ beginnen. Also auch teuer sein und wie der aktuelle 1366 Markt zeigt keine 2% bedienen.

Die aktuellen Architekturen lassen eben als technisch interessierte es nicht mehr zu, von reine Kerne zu sprechen. Manche sagen ein BD Modul sind nicht 2 Kerne = 200% sondern 2 Kerne = 160%. Das währen ja dann 6,4 Kerne. Andere Sprechen von 1 Modul 2 Kerne = 180% was wiederum 7,2 Kerne bedeuten würde. Ein Quad Sandy mit SMT wäre dann ein 5 Kerner und ein Hexa Sandy mit SMT ein 7,5 Kerner. SMT kann man ja als 0,25 Kern bezeichnen.

Für den Markt wird das aber unbedeutend sein. Wichtig wird sein, was es kostet und was hinten raus kommt. Für die Debatte in einem Forum wird es aber schwierig werden, wenn es darum geht, wer jetzt nun mehr recht hat. Diese Kernespielereien wird wohl in der nächsten Zeit die Argumentation je nach Lager bestimmen.

y33H@
2011-01-14, 12:49:07
@ Canopus

Integer-Kern ist Integer-Kern. CMT ist CMT und SMT ist SMT - bei letzterem ändert sich nichts der Zahl der Integer-Kern. Ich vermische nichts.

R.I.P.
2011-01-14, 13:29:39
Scheinbar ist der BD in AM3+ doch mit dem 890iger Chipsatz kompatibel :) Schaut mal auf das Foto des GD65iger Board auf der MSI Seite (Revision 3.0) zwischen Sockel und Kühlblock

http://www.msi.com/product/mb/890FXA-GD65.html

Canopus
2011-01-14, 14:17:16
Der Chipsatz ist doch völlig egal für den Prozessor und das seit 754 Zeiten. Wenn ein Hersteller es will und die Legitimation hat, ist es technisch genau das gleiche einen 990FX oder einen 6150/430 (aus 754 Zeiten) an den Hypertransport anzubinden.

Die MSI Platine hat aber ein Problem. Es ist ein Sockel AM3. Die AM3+ Platine die MSI auf der CES gezeigt hat, hat aber einen Pin mehr.


Sockel AM3
http://www.abload.de/thumb/am320uh3a.jpg (http://www.abload.de/image.php?img=am320uh3a.jpg)

Sockel AM3+
http://www.abload.de/thumb/20zc6r.jpg (http://www.abload.de/image.php?img=20zc6r.jpg)

S940
2011-01-14, 16:27:29
@ Canopus

Integer-Kern ist Integer-Kern. CMT ist CMT und SMT ist SMT - bei letzterem ändert sich nichts der Zahl der Integer-Kern. Ich vermische nichts.
Naja, wie schon voher geschrieben, wenn man die Anzahl der Pipelines mitrechnet wirds schnell unfair.

Sollte man aber eigentlich machen, denn die Pipelines sind direktes Resultat der CMT vs. SMT Ansätze.

SMT setzt auf dicke Kerne mit viel Einheiten, die dann per SMT genutzt werden, CMT ist dagegen "brutaler" und teilt eine großen INT Kern in 2 kleine INT Kerne auf. Vorteil: 2 Threads kommen sich nicht so leicht wie bei SMT in die Quere, Nachteil: geringere Max IPC.

Um mal wieder die beliebten Autovergleiche aufleben zu lassen:
Wenn Du jetzt AMD INT Kern gegen Intel INT Kern vergleichst, vergleichst Du quasi nen 4 Zylinder Motor mit nem 8 Zylinder, und begründest die Fairness damit, dass beides ja Motoren seien ... wäre mir zu riskant.

Kurz: INT Kern ist eben doch nicht INT Kern.

Gestrandet
2011-01-14, 17:05:08
Alles Quatsch, 1 Kern oder 20, spielt doch gar keine Rolle. Chipfläche genausowenig - alles reine Nebelkerzen.
Die erste Ordnungsdimension ist der Preis, die zweite der Verbrauch (=laufende Kosten, also auch wieder Preis). Darüber lassen sich zu vergleichende Produkte bestimmen. Und verglichen wird dann natürlich die Leistung. Jedem halbwegs vernunftbegabten Menschen ist das klar. Wenn anders vorgegangen wird, kann man davon ausgehen, dass das nicht ganz unabsichtlich geschieht.

Trap
2011-01-14, 17:05:12
Wenn man beim Phenom2 Kern für Kern mit Intel vergleichen darf, darf man das beim Bulldozer erst recht, die Kerne im Bulldozer sind besser als die vom Phenom2.

Botcruscher
2011-01-14, 17:12:04
Am Ende zählt doch nur was raus kommt und zu welchem Preis. Bei der menge an Software welche nur einen Kern benutzt wird es BD nicht leicht haben. Wenn multicoreoptimierung greift hat man idr. mehr als genug Leistung.

Nakai
2011-01-14, 17:24:34
Am Ende zählt doch nur was raus kommt und zu welchem Preis. Bei der menge an Software welche nur einen Kern benutzt wird es BD nicht leicht haben. Wenn multicoreoptimierung greift hat man idr. mehr als genug Leistung.

Richtig. Das vergisst man hald relativ schnell.
Es darf nicht mit TDP, Leistung, Features etc etc etc verglichen werden. Nur der Preis ist entscheidend was mit was verglichen wird.
Den Rest kann man dann auf die Pro/Contra-Liste schmeißen.


mfg

anddill
2011-01-14, 17:26:38
Ich seh schon die Diagramme in den Testberichten:

-Leistung mit 1 Thread

-Leistung mit 2 Threads

-Leistung mit 4 Threads

-Leistung mit 8 Threads

.
.
.
usw.

y33H@
2011-01-14, 17:32:16
Nur der Preis ist entscheidend was mit was verglichen wird. Das sehe ich anders, denn Preise sind dynamisch. Features bzw. Produkt-Merkmale nicht oder nur kaum.

HPVD
2011-01-14, 17:32:57
schlage folgendes für einen einfachen Vergleich vor:

je nachdem für was für eine Software (multicore tauglich oder nicht) man einen Prozessor sucht:

single-threated Leistung / (Preis + Kosten für typischen 3 Jahresverbrauch)

oder eben

multi-threaded Leistung / (Preis + Kosten für typischen 3 Jahresverbrauch)

Wie das ganze erreicht wird mit wieviel Kernen, in welchem Herstellungsprozess oder mit wieviel Cache ist doch völlig egal.

Was zählt ist die Effizienz - also Leistung pro Kosten.

Das einzige über was man sich einigen muss ist wie der typische 3 Jahresverbrauch ermittelt wird. Ein Beispiel wäre z.B. 3x 365 Tage * ( 20% * Vollastverbrauch + 80% * Idleverbrauch) * Strompreis
die 3 Jahre enstehen einfach aus der typischen Nutzungsdauer (= Abschreibungsdauer). Und vielleicht noch ob man zu dem Preis auch noch das "kleinste" passende Mobo dazurechnet.

Brillus
2011-01-14, 17:37:02
Ich seh schon die Diagramme in den Testberichten:

-Leistung mit 1 Thread

-Leistung mit 2 Threads

-Leistung mit 4 Threads

-Leistung mit 8 Threads

.
.
.
usw.

Mich würde es freuen, da weiß man wo man dran ist.

Trap
2011-01-14, 17:40:12
Leistung mit x Threads Diagramme wären klasse, aber sowas hab ich bis jetzt sehr selten gesehen. Es wär ja auch heute schon sinnvoll...

Sorkalm
2011-01-14, 17:40:27
Eigtl. interessiert die Leute doch im wesentlichen die Leistung, egal wo sie herkommt. Gut, früher hat man bei 2 oder 4 Kernen mit Zukunftsfähigkeit argumentiert und lag damit sicher nicht falsch, dadurch bedingt, dass Multi-threaded-Software zugenommen hat. Aber inzwischen können doch die meisten CPUs relativ viele Threads bearbeiten...

Neben der Single-Thread-Leistung, die für einige Software wohl immer noch relevant sein wird, halte ich die "Full-Power-Leistung" für das, was interessant ist, egal aus wievielen vollständigen, nicht ganz-vollständigen oder virtuellen Kernen sie kommt...

mapel110
2011-01-14, 17:42:26
Ohnehin nur für Theoretiker interessant. Ich will wissen, was bei realen Anwendungen rumkommt.

2B-Maverick
2011-01-14, 17:44:44
Dem End-User kann es doch echt wurscht sein, wieviel Threads theoretisch wieviel Leistung bringen.

Im Endeffekt ist doch nur interessant, wieviel Leistung seine Anwendungen nun wirklich bringen. Sprich: Photoshop, Premiere, Encoding, Vegas-Pro, OpenOffice etc.....

PS: Mapel war schneller :)

Nakai
2011-01-14, 18:02:33
Das sehe ich anders, denn Preise sind dynamisch. Features bzw. Produkt-Merkmale nicht oder nur kaum.

Natürlich müssen die Preise dynamisch sein, da die Hersteller damit bestimmte konkurrierende Produkte zueinander stellen können. Und klar jeder urteilt anders.

IMO Produkte in ähnlichen Preisregionen müssen zwangsfolglich miteinander konkurrieren. Welches Produkt also besser ist, entscheiden dann die, im Kopf selbsterstellten, Pro/Contra-Liste.

Mich würde es freuen, da weiß man wo man dran ist.

Viel zu undurchsichtig. Für Leute interessant, die auf die Threads gucken. Für Ungebildete ist das nur verwirrend.


mfg

Schrotti
2011-01-14, 18:06:19
Ich hoffe ja das der Bulldozer schnell wird.

Dann sinken die Intel Preise :).

airbag
2011-01-14, 18:08:37
Das sehe ich anders, denn Preise sind dynamisch. Features bzw. Produkt-Merkmale nicht oder nur kaum.
Der Markt ist aber auch dynamisch und ständigen Einflüssen ausgeliefert, weswegen die Sicht auf die Features sich ständig ändern kann.

Canopus
2011-01-14, 18:15:44
Was ich nicht verstehe, wie man so eine Überschrift schreiben kann?
Aktuelle AMD-Chipsätze doch Bulldozer-kompatibel?
http://www.pcgameshardware.de/aid,807422/Aktuelle-AMD-Chipsaetze-doch-Bulldozer-kompatibel/CPU/News/

Das ist doch schon ein Widerspruch in sich. Der Chipsatz ist seit 754, seit der Integration des Speichercontrollers und der Einführung des Hypertransport total unwichtig für eine Kompatibilität zu einem Prozessor. Der Chipsatz wird an den Hypertransport angebunden und nicht an den Prozessor. Zudem ist der Chipsatz eh nur dafür da, I/O Geräte anzubinden.

Deswegen wunder es mich nicht, wenn User wie R.I.P solche Sätze schreiben.
Scheinbar ist der BD in AM3+ doch mit dem 890iger Chipsatz kompatibel
Es wird einem was falsches gelernt durch solche Aussagen. Man glaubt es auch noch, weil man denkt, eine Hardwareseite muss das ja wissen.

Also, der Chipsatz ist unwichtig, weil dieser per Hypertransport angebunden ist und das ist schon seit über 6 Jahren so.

Sockel AM3, DDR3, Chipsatz 6150/430 aus S754 Zeiten.
http://geizhals.at/deutschland/a577031.html
Den kann man auch auf eine AM3+ Platine löten.

Zudem wird es auch keine neuen Southbridges geben. Vielleicht gibt es eine neue, aber der große Teil wird umbenannt werden. Was soll sich auch ändern.
Also dieser Artikel hat Fehler und vermittelt falsches Wissen.

Gestrandet
2011-01-14, 18:19:34
Das sehe ich anders
Das wissen wir :smile:
Bei der "Begründung" hättest du dir aber ruhig ein bisschen mehr Mühe geben können.

y33H@
2011-01-14, 18:45:49
Es wird einem was falsches gelernt durch solche Aussagen. Man glaubt es auch noch, weil man denkt, eine Hardwareseite muss das ja wissen. [...] Also dieser Artikel hat Fehler und vermittelt falsches Wissen.Du hast natürlich Recht. Solange der Sockel passt und der IMC zum verbauten Speicher, läuft ein BD natürlich auch mit zB einem 770er wenn man den will. Im Text steht übrigens, dass sich die 9er praktisch nicht von den zB 8ern unterscheiden. Ich ändere dennoch den Text, damit keiner wie du ankommt und sagt, er sei fehlerhaft ;(

@ Gestrandet

Zwei gleich teure Produkte können sich massiv unterscheiden. Leistung unter bestimmten Vorraussetzungen Kerne, Takt, OC-Verhalten, Grundtakt, Features, Stromverbrauch etc. All das ist nahezu fix (wobei sich sowas wie OC oder Stromverbrauch mit neueren Steppings ändern kann). Sieht man wunderbar am Beispiel i3-530 vs. Athlon II X4 640. Daher muss man sich auch den Rest anschauen. Auch kann ein günstigeres Produkt in den persönlich präferierten Bereichen deutlich besser oder ein teureres klar schlechter sein. Der Preis alleine sagt nichts.

Canopus
2011-01-14, 19:02:34
Du hast natürlich Recht. Solange der Sockel passt und der IMC zum verbauten Speicher, läuft ein BD natürlich auch mit zB einem 770er wenn man den will. Im Text steht übrigens, dass sich die 9er praktisch nicht von den zB 8ern unterscheiden. Ich ändere dennoch den Text, damit keiner wie du ankommt und sagt, er sei fehlerhaft ;(

*Seufz*
Nochmal. Was du da sagt ist verworren. Natürlich wird kein Hersteller Bulldozer Platinen mit DDR2 DIMMs oder DDR 250 DIMMs bringen, wenn der Speichercontroller in der CPU nur DDR3 unterstützt. Da hat aber absolut und nochmals absolut nichts mit dem Chipsatz zu tun so wie du es schon wieder schreibst. Bulldozer läuft mit jedem Chipsatz den es seit 2004 für Sockel 754 gibt.
Selbst euer Moderator sagt das.
ruyven_macaran
http://extreme.pcgameshardware.de/2591973-post34.html

=Floi=
2011-01-14, 19:15:18
skaliert das denn eigentlich noch über 4 threads hinaus?
BD hat doch seine max. leistung schon bei 4 threads und im grunde können darüber die kerne eben nicht besser ausgelastet werden...

y33H@
2011-01-14, 19:25:19
@ Canopus

Reden wir aneinander vorbei? Ich sagte doch, wenn der IMC passt. BD hat nur DDR3-Support, wird also mit DDR2 nicht laufen.

dildo4u
2011-01-14, 19:30:42
skaliert das denn eigentlich noch über 4 threads hinaus?
BD hat doch seine max. leistung schon bei 4 threads und im grunde können darüber die kerne eben nicht besser ausgelastet werden...
Nein BD brauch 8 Thread für maximale Leistung deshalb wird's ne gute Server CPU am Desktop wird Sandy ihn verprügeln.

http://www.computerbase.de/bildstrecke/32624/1/

Knuddelbearli
2011-01-14, 19:46:57
ist es nicht so:
1 thread in einem modul alleine = 100%
2 threads auf einem modul = 160%

die frage wie viel 1 Thread leistet wurde von AMD doch noch nichtmal angedeutet

und aus dem oben genannten folgt dann natürlich das die Leistung des BD serh stark davon abhängt wie gut Microsoft es handeln kann oder ob AMD nen eigenen guten treiber dazu schreibt.

Canopus
2011-01-14, 19:55:56
y33H@, nein wir reden nicht aneinander vorbei. Ich habe eher das Gefühl, dass du nicht verstehst um was es geht. Deswegen wohl auch diese Überschrift zu deinem Artikel.
Warum erzählst du immer was vom Speichercontroller und Chipsatz?
Der Chipsatz wird per Hypertransport angebunden und fertig. Es ist unerheblich was für ein Speichercontroller dabei in der CPU steckt.
Das habe ich dir nun schon genug erklärt. Trotzdem kommst du immer wieder mit dem Speichercontroller und Chipsatz. Selbst euer Moderator schreibt das, aber dir fehlt anscheinend das Verständnis.

y33H@
2011-01-14, 20:02:50
Meiner Meinung nach reden wir aneinander vorbei. Du sagst Chipsatz und Sockel haben nichts miteinander zu tun und der Chipsatz hat nichts mit dem IMC zu tun. Ich behaupte nicht das Gegenteil.

SavageX
2011-01-14, 20:03:55
Nein BD brauch 8 Thread für maximale Leistung deshalb wird's ne gute Server CPU am Desktop wird Sandy ihn verprügeln.

http://www.computerbase.de/bildstrecke/32624/1/

Kommt ganz drauf an, ob BD innerhalb eines Modules einen Kern per Power-Gating abwürgen und dem verbleibendem Kern Zucker geben kann. Zumal der verbleibende Kern von einem Frontend naschen kann, welches eigentlich zwei Kerne bei Laune halten soll.

Schrotti
2011-01-14, 20:04:27
Nein BD brauch 8 Thread für maximale Leistung deshalb wird's ne gute Server CPU am Desktop wird Sandy ihn verprügeln.

http://www.computerbase.de/bildstrecke/32624/1/

Woher nimmst du die Weisheit?

Canopus
2011-01-14, 20:17:16
y33H@
Natürlich reden wir nicht aneinander vorbei.
Du stellst doch die ganze Zeit eine Beziehung zwischen Chipsatz und CPU her, dabei gibt es keine. Das zeigt doch schon die Überschrift zu deinem Artikel und die Beiträge hier. Insofern behauptet du doch das Gegenteil.

Knuddelbearli
2011-01-14, 20:36:57
was haltet ihr von einem extra thread über die diskusion mit welchem System man den BD gegenüber Sandy bewerten sollte bezüglich kerne / Threads