Anmelden

Archiv verlassen und diese Seite im Standarddesign anzeigen : Speicher-Skalierung auf dem Athlon 64: Frage


Thunder99
2006-07-19, 14:02:21
Hi,

hab mir den Artikel nochmal durchgelesen und hätte dazu ein paar Fragen.

Wenn der Speichertakt mit dem Referztakt mitzieht, wird die ProMhz Leistung
ja wieder besser. Das würde bedeuten das ein 2,6Ghz mit 10x266 schneller ist (ca. 5%?) als ein 2,6Ghz mit 13x200.

Dadurch könnte der AM2 mit DDR2 Ram von diesem profitieren (z.B. mit DDR2 667).

Bitte berichtet mich oder klärt mich auf wenn ich falsch liege, danke :)

Gruß

Thunder

BlackBirdSR
2006-07-19, 14:17:20
Thunder99[/POST]']Hi,

hab mir den Artikel nochmal durchgelesen und hätte dazu ein paar Fragen.

Wenn der Speichertakt mit dem Referztakt mitzieht, wird die ProMhz Leistung
ja wieder besser. Das würde bedeuten das ein 2,6Ghz mit 10x266 schneller ist (ca. 5%?) als ein 2,6Ghz mit 13x200.

Dadurch könnte der AM2 mit DDR2 Ram von diesem profitieren (z.B. mit DDR2 667).

Bitte berichtet mich oder klärt mich auf wenn ich falsch liege, danke :)

Gruß

Thunder

Zuerst: Mit steigendem Ramtakt fällt auch die Latenz bei DDR-Speicher. Daher kommt wohl der größte Teil der Performance.
DDR2 läuft zwar mit höherem Takt, erkauft sich das jedoch durch schlechtere Latenz.

Im Endeffekt kann sich der höhere Takt damit nicht durch zusätzliche Performance in Szene setzen. Das würde nur innerhalb einer RAM-Familie gelten.

Banshee18
2006-07-19, 16:19:13
Die absoluten Latenzen sind bei DDR2 doch kaum schlechter oder je nach Ram sogar besser?! :confused:

Thunder99
2006-07-19, 17:11:47
BlackBirdSR[/POST]']Zuerst: Mit steigendem Ramtakt fällt auch die Latenz bei DDR-Speicher. Daher kommt wohl der größte Teil der Performance.
DDR2 läuft zwar mit höherem Takt, erkauft sich das jedoch durch schlechtere Latenz.

Im Endeffekt kann sich der höhere Takt damit nicht durch zusätzliche Performance in Szene setzen. Das würde nur innerhalb einer RAM-Familie gelten.

Verstehe, deshalb braucht man DDR2/800 mit CL3 um eine Performace Steigerung zu bekommen (entspricht DDR1/400 CL1.5 laut einem Bericht seitens 3DC)

Schade, wäre echt ein Pluspunkt für AMD gewesen ihre ProMhz Leistung zu steigern ;)

BlackBirdSR
2006-07-19, 17:33:24
Banshee18[/POST]']Die absoluten Latenzen sind bei DDR2 doch kaum schlechter oder je nach Ram sogar besser?! :confused:

Es gibt ja noch mehr Signale als nur CAS und die üblichen verdächtigen. Und die laufen zum Teil noch langsamer. Am Ende bleibt einfach nicht viel übrig.
Wohl dem, der exzellentes Prefetching beherrscht (Core2)

Banshee18
2006-07-19, 17:49:31
BlackBirdSR[/POST]']Wohl dem, der exzellentes Prefetching beherrscht (Core2)
Ist dann beim K8 der integrierte Speichercontroller in dieser Hinsicht sogar eine Bremse?

S940
2006-07-19, 18:58:24
Jungs, immer ruhig bleiben :)

AMD hat an den K8 Kern einen Speicherkontroller mit der Bandbreite von 4 DDR1 Kanälen gepflanzt. Natürlich ist der Kern darauf noch nicht ausgelegt. Das wird sich aber wohl mit dem K8L stark ändern.
Bis dahin bringts auch weiterhin was den CPU Takt zu steigern.
Den RAM Takt anheben bringt auch was aber nicht sooo viel. Naja kommt immer darauf an, um wieviel man jetzt anhebt. AMD soll aber (angeblich) auch nen DDR2-1066 Teiler in den AM2 Chips verbaut haben. Evenutell kann man sich das Referenztakt OC also demnächst sparen.

Zum Thema Speicherskalierung/CPU Takt noch ein schönes Bildchen:
http://img215.imageshack.us/img215/8996/am2scaling28sx.jpg

Die 3200er Werte sind dabei nur hochgerechnet, da der Chip es leider nicht mehr schaffte. Die 3 Werte davor geben aber schon eine ausreichend deutliche Tendenz wieder.

@Banshee18:
Nein, der integrierte MC ist natürlich keine Bremse. Intel hat nur den Prefetch vorraus. Wenn AMD sowas auch implementiert dann ist wieder der alte Abstand da. Fragt sich halt nur, ob AMD sowas schon im K8L fertig bringt, oder länger dafür braucht.

So oder so, die 2 DDR2 Kanäle bekommen erst bei hohem Takt bzw. mit 4 Cores (K8L) wirklich was zu tun :)

ciao

Alex

Thunder99
2006-07-19, 20:48:28
Zum Verständis: Bremmst der Referenztakt den Speicher nichtaus obwohl der niedriger ist als jener z.B. AM2 200Mhz zu DDR2 800 (400Mhz) <-> A64 S939 200Mhz zu DDR1 400 (200Mhz).

Wie hoch sind dann die Bandbreiten nochmal beider Modelle (DDR1 400 zu DDR2 800) jeweils beim X2 4800+

Gruß

Thunder

Coda
2006-07-19, 21:29:18
Banshee18[/POST]']Ist dann beim K8 der integrierte Speichercontroller in dieser Hinsicht sogar eine Bremse?
Nö natürlich nicht. Core 2 mit integriertem Speichercontroller wäre noch böser.

S940[/POST]']Nein, der integrierte MC ist natürlich keine Bremse. Intel hat nur den Prefetch vorraus. Wenn AMD sowas auch implementiert dann ist wieder der alte Abstand da. Fragt sich halt nur, ob AMD sowas schon im K8L fertig bringt, oder länger dafür braucht.
Es ist nur leider nicht nur das was Core 2 so schnell macht.

S940
2006-07-20, 22:00:43
Thunder99[/POST]']Zum Verständis: Bremmst der Referenztakt den Speicher nichtaus obwohl der niedriger ist als jener z.B. AM2 200Mhz zu DDR2 800 (400Mhz) <-> A64 S939 200Mhz zu DDR1 400 (200Mhz).

Wie hoch sind dann die Bandbreiten nochmal beider Modelle (DDR1 400 zu DDR2 800) jeweils beim X2 4800+ Neee, was sollte der Referenztakt damit zu tun haben ? Der fungiert nur als -tja- Referenz für den Speichertakt. Da laufen keine Leitungen, oder irgendwas mit den "200" Mhz (abgesehen von den Taktleitungen ;-) ). Da bremst nichts.

Zu den Werten ... DDR2 gibts im bereits geposteten Bild, DDR1 sollte sich per google bestimmt irgendwo auftreiben lassen.

@coda:Es ist nur leider nicht nur das was Core 2 so schnell macht. Ja natürlich, ich meinte mit Abstand natürlich nur die Speicherlatenz ;-)
Wegen der Gesamtperformance bleibt AMD Fans wohl nur der 64bit Modus zum Hoffen übrig, da läuft ein so ein wohl nicht unwichtiges Feature von Intel nicht:
http://img109.imageshack.us/img109/493/urltrurllpjaentrurlhttp3a2f2fpcwatchimpresscojp2fdocsym9.jpg

ciao

Alex

Gast
2006-07-22, 12:47:41
irgendwie finde ich schon, dass AMD beim am2 k8 eine deutliche Bremse "eingebaut hat" in bezug auf Speicherbandbreite und dessen Effizienz, welche echt mies ist bei "niedriegem" Takt. (3000Mhz). Bei höherem Takt wird es zwar immer besser, aber hat sich schonmal jemand überlegt, was für einen Takt man da bräuchte? Wenn man mit dem Diagramm von S940 weiter hochrechnet kommt man erst bei knapp 5 Ghz an eine Effiziens von 90% bie ddr2 800. Das finde ich doch sehr unrealistsich und ich glaube nicht, dass AMD diese Frequenz so schnell erreichen wird. Muss also imo beim K8L verbessert werdern. Was denkt ihr?

MfG

BlackBirdSR
2006-07-22, 12:55:39
Gast[/POST]']irgendwie finde ich schon, dass AMD beim am2 k8 eine deutliche Bremse "eingebaut hat" in bezug auf Speicherbandbreite und dessen Effizienz, welche echt mies ist bei "niedriegem" Takt. (3000Mhz). Bei höherem Takt wird es zwar immer besser, aber hat sich schonmal jemand überlegt, was für einen Takt man da bräuchte? Wenn man mit dem Diagramm von S940 weiter hochrechnet kommt man erst bei knapp 5 Ghz an eine Effiziens von 90% bie ddr2 800. Das finde ich doch sehr unrealistsich und ich glaube nicht, dass AMD diese Frequenz so schnell erreichen wird. Muss also imo beim K8L verbessert werdern. Was denkt ihr?

MfG

Ich denke, dass Speicherbandbreite im Desktop nicht so wichtig ist, und bereits ejde Menge davon vorhanden ist.
Die Latenz machts jetzt aus, siehe Conroe.

Gast
2006-07-22, 17:28:47
dem Stimme ich schon zu. Aber warum soviel Bandbreite verschenken? Warum gibt's dann ddr2 1000 und bald auch ddr3, wenn diese Speicher nur den Vorteil in Größe und Stromverbrauch haben (und natürlich mit steigender Frequenz auch bessere Latenzen). Man kann ja noch weiterdenken: Wie weit wird denn ddr3 gehen. Ich denke schon bis ddr1600, oder? Die Effizienz würde dann ja nur noch bei vielleicht 30% liegen. Meiner Meinung nach wird da Performance verschenkt.
Aber ich denke beim K8L wird die Bandbreite besser genutzt, besonders weil da 4Cores vorhanden sein weden und diese die Bandbreite denke ich schon gebrauchen könnten. Bei ddr2 800; knapp 3Gb/s für jeden Kern, vorrausgesetzt man erreicht eine gute Effiziens.
Wo vermutet man eigentlich den "Flaschenhals" beim aktuellen K8 mit ddr2? Es muss ja irgendwo zwischen Speicherkontroller und Kern liegen, oder?

MfG

S940
2006-07-22, 20:56:39
Gast[/POST]']Wo vermutet man eigentlich den "Flaschenhals" beim aktuellen K8 mit ddr2? Es muss ja irgendwo zwischen Speicherkontroller und Kern liegen, oder?Jo irgendwo da, Genaues weiss man nicht. auf digit-life haben sies mal genauer untersucht, und festgestellt, dass anstatt der 8 byte(64bit) real nur um die 4 byte pro Takt übrig bleiben.

Eventuell könnte man den Flaschenhals noch eingrenzen, indem mal 2x ein geeignetes Bandbreitenmessprogramm startet und auf je einen Kern festlegt.
Ändert sich nichts, dann ist der Flaschenhals zwischen Crossbar und Speicherkontroller, steigt sie an, gibts keinen Flaschenhals, ein einzelner Kern kann einfach nicht mehr Daten verarbeiten.
Ich denk mir aber, dass er nicht ansteigen wird, da die Leitungen überall 64bit breit sind, vor der xbar eben 1x64, danach 2x64 (pro Kern 1x64bit) und beide Leitungen laufen mit demselben (CPU)Takt ...

Beim K8L wird alles aufgebohrt, verbreitert und verbessert, dass wird dann da bestimmt anders mit der Bandbreitennutzung ausschauen. Bei AMD haben sie auch gesagt, dass sie DDR2 nur wegen der geringeren Verlustleistung benützen, nicht wegen eines Geschwindigkeitsvorteil.

ciao

Alex

Coda
2006-07-22, 21:30:10
S940[/POST]']Wegen der Gesamtperformance bleibt AMD Fans wohl nur der 64bit Modus zum Hoffen übrig, da läuft ein so ein wohl nicht unwichtiges Feature von Intel nicht:
Huch. Das verstehe ich nich.

Irgendwie siehts dadurch so aus als würde Intel wirklich bald wieder nachlegen wollen, weil wenn man langfristiger geplant hätte wäre das drin gewesen.

Thunder99
2006-07-22, 22:06:50
Lohnt sich DDR2 einfach net bei den aktuellen A64 Modellen auf K8 Basis.

Danke schon mal für eure Ausführungen. Schreibt aber ruhig weiter, jede Info ist sehr Interessant

S940
2006-07-22, 22:50:08
Coda[/POST]']Irgendwie siehts dadurch so aus als würde Intel wirklich bald wieder nachlegen wollen, weil wenn man langfristiger geplant hätte wäre das drin gewesen.Nö, wieso ? Die Fusionierung kann halt nur 32 bit Befehle bündeln. Für 64bittigen ist der Decoder wohl zu "schmal" und Ihn nur dafür extra zu verbreitern macht wohl keinen Sinn.

Zum DDR2 Thema noch:
Mir ist grad noch eingefallen, dass hardwareluxx in seinen Test ja mit duble rank Modulen bessere Ergebnisse erreichte:

http://www.hardwareluxx.de/cms/artikel.php?action=show&id=386&seite=10
Ist schon ganz nett.

Mittlerweile hat das wohl auch LostCircuit "herausgefunden"
http://www.lostcircuits.com/motherboard/foxconn_c51xem2aa/7.shtml
Die haben da mit einem FX-62 9 GB/s Sandra Ergebnisse, auch nicht übel.
Allerdings glauben Sie, dass Foxconn "irgendwas" Supertolles gemacht hat, und kommen nicht auf die RAM Idee.
Vielleicht liegts auch wirklich an was anderem, denn ich habe auf die Schnelle leider keine single/dual rank Infos über die verwendeten OCZ Module gefunden, die das beweisen würden. Aber ich glaube doch mit 90%iger Wahrscheinlichkeit daran, dass es dual rank Module sind :)

@Thunder99:
Zumindest läuft nichts langsamer, was bleibt ist der geringere Stromverbrauch. Das interessiert vielleicht auch keinen, aber es spricht eben nichts gegen DDR2 (abgesehen vom Sockelwechsel :) )

ciao

Alex

Thunder99
2006-07-26, 14:41:48
S940[/POST]']Nö, wieso ? Die Fusionierung kann halt nur 32 bit Befehle bündeln. Für 64bittigen ist der Decoder wohl zu "schmal" und Ihn nur dafür extra zu verbreitern macht wohl keinen Sinn.

Zum DDR2 Thema noch:
Mir ist grad noch eingefallen, dass hardwareluxx in seinen Test ja mit duble rank Modulen bessere Ergebnisse erreichte:

http://www.hardwareluxx.de/cms/artikel.php?action=show&id=386&seite=10
Ist schon ganz nett.

Mittlerweile hat das wohl auch LostCircuit "herausgefunden"
http://www.lostcircuits.com/motherboard/foxconn_c51xem2aa/7.shtml
Die haben da mit einem FX-62 9 GB/s Sandra Ergebnisse, auch nicht übel.
Allerdings glauben Sie, dass Foxconn "irgendwas" Supertolles gemacht hat, und kommen nicht auf die RAM Idee.
Vielleicht liegts auch wirklich an was anderem, denn ich habe auf die Schnelle leider keine single/dual rank Infos über die verwendeten OCZ Module gefunden, die das beweisen würden. Aber ich glaube doch mit 90%iger Wahrscheinlichkeit daran, dass es dual rank Module sind :)

@Thunder99:
Zumindest läuft nichts langsamer, was bleibt ist der geringere Stromverbrauch. Das interessiert vielleicht auch keinen, aber es spricht eben nichts gegen DDR2 (abgesehen vom Sockelwechsel :) )

ciao

Alex

Danke dir für die Infos,

der Test auf Hardwareluxx ist genau was ich unter anderem suche, ein Vergleich zwischen DDR1 zu 2 mit verschiedenen Timings.
Interessant das Double Side Module nur mit T2 laufen (die meisten) aber dafür mehr Bandbreite mit der CPU erreichen :eek:

Gruß
Thunder

Madkiller
2006-07-26, 16:12:31
Thunder99[/POST]']der Test auf Hardwareluxx ist genau was ich unter anderem suche, ein Vergleich zwischen DDR1 zu 2 mit verschiedenen Timings.

Sry, daß ich so direkt bin.
Aber aus diesem Test kann man ungefähr genausogut (außer du nutzt excessiv iTunes) die Performance von verschiedenen Timings rausziehen, als wenn du ne Münze werfen würdest.
Warum?
Außer dem iTunes (s.o.) und Doom3 (bei dem die Timedemo völlig unübliche Ergebnisse bringt; davon abgesehen reden wir hier von Timedemos und avg fps) werden nur synthetische Benches hergenommen, die - richtig - keinerlei Praxisbezug haben.

Das Einzige was man wirklich aus diesem Test rausziehen kann ist wohl:
Thunder99[/POST]']
Interessant das Double Side Module nur mit T2 laufen (die meisten) aber dafür mehr Bandbreite mit der CPU erreichen :eek:

Womit man leider immer noch keinen blassen Schimmer hat, ob und wieviel das in realen Anwendungen bringt.

Thunder99
2006-07-26, 21:19:07
Madkiller[/POST]']Sry, daß ich so direkt bin.
Aber aus diesem Test kann man ungefähr genausogut (außer du nutzt excessiv iTunes) die Performance von verschiedenen Timings rausziehen, als wenn du ne Münze werfen würdest.
Warum?
Außer dem iTunes (s.o.) und Doom3 (bei dem die Timedemo völlig unübliche Ergebnisse bringt; davon abgesehen reden wir hier von Timedemos und avg fps) werden nur synthetische Benches hergenommen, die - richtig - keinerlei Praxisbezug haben.

Das Einzige was man wirklich aus diesem Test rausziehen kann ist wohl:


Womit man leider immer noch keinen blassen Schimmer hat, ob und wieviel das in realen Anwendungen bringt.
:redface:

Hmm, ok. Kann man dennoch sagen das die A64 auf bessere Timings positiv reagieren im Vergleich zum Conroe ?

BlackBirdSR
2006-07-27, 00:40:04
S940[/POST]']Nö, wieso ? Die Fusionierung kann halt nur 32 bit Befehle bündeln. Für 64bittigen ist der Decoder wohl zu "schmal" und Ihn nur dafür extra zu verbreitern macht wohl keinen Sinn.



Was sich wohl im einstelligen Prozentbereich bewegt und daher nahezu unkritisch ist.
Nicht alle x86 Befehle bestehen aus Jump/cmp Varianten.

Coda
2006-07-27, 00:48:11
S940[/POST]']Nö, wieso ? Die Fusionierung kann halt nur 32 bit Befehle bündeln. Für 64bittigen ist der Decoder wohl zu "schmal" und Ihn nur dafür extra zu verbreitern macht wohl keinen Sinn.
Ich will erstmal das Performance-Optimization-Manual für Conroe haben bevor ich dazu weitere Aussagen mach.

Bisher gibts dazu nämlich gar nix (zu Yonah und Dothan anscheinend übrigens auch nicht).

Madkiller
2006-07-27, 13:58:49
Thunder99[/POST]']:redface:

Hmm, ok. Kann man dennoch sagen das die A64 auf bessere Timings positiv reagieren im Vergleich zum Conroe ? Du meinst positiver?

Ya, schaut so aus.
Es ist aber schwer zu sagen, um wieviel. :)

S940
2006-07-27, 14:29:23
Coda[/POST]']Ich will erstmal das Performance-Optimization-Manual für Conroe haben bevor ich dazu weitere Aussagen mach.

Bisher gibts dazu nämlich gar nix (zu Yonah und Dothan anscheinend übrigens auch nicht).
Lol Yonah & Dothan sind a) keine 64bitter und b) können sie selbst im 32bit Modus kein macro fusion :) Oder meinst Du, dass es überhaupt kein Performance manual gibt ?

Wie auch immer, die Info ist mit weisser Schrift auf blauem Grund und intel Logo im Eck, das ist von einer off. Intel Presentation, das stimmt 100%.

Mehr zu den 64bit Tests gibts mittlerweile auch hier:
http://www.xbitlabs.com/articles/cpu/display/core2duo-64bit.html
(Leider ist die Testauswahl immer noch recht knapp)

@Madkiller
Wo ist das Problem ? Klar kannst Du nicht von Sandra Werten auf real Programme schließen, aber man weiss das Maximum. Das Maximum ist höher als bei DDR1, somit is klar (wenn es denn kein Ausreißer war), dass speicherintensive Programme auch schneller laufen werden. Um wieviel ? Na um soviel, wie das Programm den Speicher nutzt. Super Pi nützt nicht in den kleinen Einstellugen wenig RAM -> da bringt es nichts, DOOM3 dagegen schon -> da bringt es "viel". Allerdings weiss man das bei neuen Programmen/Spielen nicht, und bei Spielen ist die GraKa eh wichtiger.

Gibt auch wieder nen guten(ausnahmsweise) Test bei Anandtech:
http://www.anandtech.com/memory/showdoc.aspx?i=2800
Aber Achtung, auch meist nur Sandra oder Everest, so ähnlich wie der von hardwareluxx ;-) Interessant ist, dass der AM2 auf einmal 9,3 GB/s liefert ... langsam werden die AM2 Kinderkrankheiten wohl weniger.

ciao

Alex

Gast
2006-07-27, 14:31:30
S940[/POST]']Oder meinst Du, dass es überhaupt kein Performance manual gibt ?Genau das meint er. ;)

Madkiller
2006-07-27, 16:05:31
S940[/POST]']
@Madkiller
Wo ist das Problem ? Klar kannst Du nicht von Sandra Werten auf real Programme schließen, aber man weiss das Maximum. Das Maximum ist höher als bei DDR1, somit is klar (wenn es denn kein Ausreißer war), dass speicherintensive Programme auch schneller laufen werden. Um wieviel ? Na um soviel, wie das Programm den Speicher nutzt. Super Pi nützt nicht in den kleinen Einstellugen wenig RAM -> da bringt es nichts, DOOM3 dagegen schon -> da bringt es "viel". Allerdings weiss man das bei neuen Programmen/Spielen nicht, und bei Spielen ist die GraKa eh wichtiger.

Eben, wo ist das Problem? ;)
Du sagst doch selber, daß jedes Programm anders drauf reagiert, und nichts anderes habe ich doch gesagt.
Nämlich, daß man von den 2 praxistauglichen Werten nicht auf alles schließen kann.
Und auch das "Maximum" kann man nicht direkt übernehmen, da es auch viele Anwendungen gibt, die mehr von den Latenzen als von der Bandbreite provitieren - es sind sogar die meisten.

btw
GraKas sind in Spielen wichtiger, damit die besser aussehen. Aber die CPU bestimmt ganz allein, wie schnell eine gewisse Szene überhaupt dargestellt werden kann, und bestimmt damit wie spielbar das Ganze ist.
(zur Sicherheit: natürlich nur bei realistischen CPU/GraKa-Kombinationen.)

Thunder99
2006-07-27, 17:09:33
Madkiller[/POST]']Du meinst positiver?

Ya, schaut so aus.
Es ist aber schwer zu sagen, um wieviel. :)

Jup, positiver :D
Laut den Berichten die ich gelesen hab lagen die im einstelligem Prozent Bereich.
Aber ist ja auch logisch, DDR2 rechnet intern mit dem halben Takt, das heißt im Vergleich zum DDR1 400 2/2/2/5 brauch man DDR2 800 4/4/4/12 um gleich oder besser zu sein (meine nicht die Bandbreite).

Das stört mich aber nicht da die DDR2 800er Rams ja so viel kosten wie gute DDR1 :)