PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: DDR3-Speicher aus Intel- und AMD-Sicht


Leonidas
2007-06-28, 16:27:10
Link zum Artikel:
http://www.3dcenter.org/artikel/2007/06-28_a.php

Gast
2007-06-28, 16:46:27
Um das an einem Beispiel zu klassifizieren: Bei Intels aktuelle FSB1066-Prozessoren können über ihren Front Side Bus maximal 8 GB/sec an Daten empfangen, mehr ist technisch gar nicht möglich.

Die Rechnung haut nicht hin.
Es sind 8533,44 MB/s, was in allen Fällen mehr als 8 GB ergeben würde.
Außerdem steht FSB1333 schon vor der Türe, was vielleicht noch ergänzt werden sollte.

Es sollte außerdem auf den Gesichtspunkt eingegangen werden, das die absoluten Latenzen bei DDR3 über die Zeit besser werden.
Schon jetzt bietet Kingston DDR3-1375 mit CL7-7-7 an, der das bei nur 1.7V erreicht.
Dabei ist dieser Speicher schon jetzt günstiger+schneller als die Corsair Dominator auf Basis von DDR2-1250, die für ein schlechteres Ergebniss bereits 2.4V benötigen.
Test: http://www.anandtech.com/memory/showdoc.aspx?i=2996

Außerdem bietet der letzte offizielle JEDEC Standard (DDR2-800 CL4) auch nur theoretische 10 ns. DDR-1066 wird offiziell vorerst nur 9,3ns erreichen.
DDR3 ist somit nicht mehr weit weg, sondern in einigen Fällen schon davor. Außerdem erreichen die Module es bei deutlich weniger Betriebsspannung, was sowohl Verbrauch als auch der Wärmeabgabe zugute kommt.

Leonidas
2007-06-28, 19:37:47
1. Es sind 8 GB/sec nach der 1024er Regel. Und ich denke, die sollten wir schon ansetzen - es sei denn, wir fangen an, von 2,1 GB oder 4,2 GB Speicherausbau zu sprechen, wenn wir uns ein 2GB- oder 4GB-Speicherkit ranholen. Für den Artikel selber hat das im übrigen keine Relevanz - rechnet man die Bandbreite nach der 1000er Regeln, muß man das auch beim FSB tun - womit die Werte wieder gleich sind.

2. FSB1333 wurde einwandfrei in der entsprechenden Tabelle mit berücksichtigt. Ich habe sogar FSB1666 mit berücksichtigt und bis auf FSB2666 vorgedacht - insofern verstehe ich den Einwand nicht.

3. Mit der Zeit besser werdende Latenzen wurde in dem Artikel zweimal kurz erwähnt. Ich will das allerdings nicht zum Hauptthema machen, weil der Performancegewinn dadurch viel zu gering ist. Dein DDR3/1375 mit 7-7-7 (10,2ns) hat beispielsweise immer noch eine schlechtere Latenzzeit als DDR3/800 mit 3-3-3 (7,5ns).

4. Verbrauch und Betriebsspannung wurden evenfalls erwähnt. Allerdings existiert hier kein deutlicher Unterschied, sondern es ging von 1.8 auf 1.5V herunter. Dein DDR3/1375 mit 1.7V ist da schon gleich fast wieder auf dem Niveau von DDR2.

Gast
2007-06-28, 20:07:33
1. Es sind 8 GB/sec nach der 1024er Regel.

Dann stimmt es aber immer noch nicht. ;D

266,67*4*8 sind 8533,44 MB/s oder 8,53344 GB/s nach 1000er Rechenweise. Bei 1024er Rechenweise sinds 7,947 GB/s, also wie kommst du jetzt auf 8?

2. FSB1333 wurde einwandfrei in der entsprechenden Tabelle mit berücksichtigt.

Ja, schon, aber in knapp 4 Wochen werden FSB1333 CPUs zum Standard erhoben, der Artikel wird dann veraltet sein. Warum schreibst du nicht im Text schon, was optimal wäre für eine FSB1333 CPU?

3. Mit der Zeit besser werdende Latenzen wurde in dem Artikel zweimal kurz erwähnt. Ich will das allerdings nicht zum Hauptthema machen, weil der Performancegewinn dadurch viel zu gering ist. Dein DDR3/1375 mit 7-7-7 (10,2ns) hat beispielsweise immer noch eine schlechtere Latenzzeit als DDR3/800 mit 3-3-3 (7,5ns).

Du hast ne ganz komische Vorstellung was das betrifft. Das ist ARBEITSSPEICHER und KEINE CPU! ;) Da sind 5% Mehrperformance bereits WELTEN.
Außerdem hast du nicht berücksichtigt, das DDR3-1375 CL7 bereits schneller ist als DDR2-1250 CL5 und somit auch schneller als DDR2-800 CL3.
Deine Rechnung haut nämlich nicht hin, weil die Bandbreiten die DDR2 und DDR3 liefert, theoretisch ist. Du wirst mit DDR2-800 niemals 12.8GB/s erreichen < dein größte Denkfehler.

Ich habe selbst schon einige Anwendungen (u.a. WinRAR) mit FSB1600 bei DDR2-800 CL3 und DDR2-1000 CL5 gebencht, DDR2-800 CL3 war deutlich langsamer, eben weil es die versprochene Bandbreite nicht liefern kann!

4. Verbrauch und Betriebsspannung wurden evenfalls erwähnt. Allerdings existiert hier kein deutlicher Unterschied, sondern es ging von 1.8 auf 1.5V herunter. Dein DDR3/1375 mit 1.7V ist da schon gleich fast wieder auf dem Niveau von DDR2.

Auch da kann ich nicht zustimmen. Hast du dir mal angeschaut, wie groß der Unterschied ist?
Zur Zeit liegt das maximum bei DDR2-1066 @ 1.8V oder DDR2-1250 @ 2.4V.
DDR3 erreicht und übertrumpft diese Werte schon mit 1.5 bzw. 1.7 bei DDR3-1333.
Ein Unterschied von 0,7 V, das ist EXTREM viel. Schau dir bitte mal an, was solch stark übertaktete Speichermodule an Strom schlucken und überlege dann nochmal, ob diese Passage so richtig ist!
Du solltest wissen, das die Spannung der entscheidenste Punkt ist, wenn es um die Verlustleistung geht. Danach folgt der Takt.
Hier wird das schön verdeutlicht: http://www.hardware-mag.de/hardware.php?id=461&page=3

Das ist keinesfalls zu vernachlässigen.

Gast
2007-06-28, 20:15:20
Was ich genau damit sagen will:
DDR2-1250 @ 2.4 V vs = DDR3-1333 CL7 @ 1.7V = BESSERE Leistung bei 0.7V weniger Spannung.

Du solltest aber auch berücksichtigen, das DDR2-1250 kein JEDEC konformer Speicher ist und daher auch nur übertaktete DDR3-Module als Vergleich dienen können:
http://vic.expreview.com/attachment/1182253112_1.jpg

Diese erreichen aber deutlich mehr und das bei einer immer noch geringerer Spannung.

Leonidas
2007-06-28, 20:40:49
7,947 GB/s .......... gerundet 8 GB/sec. Wenn ich auf eine Stelle nach dem Komma runden würde, würde ich schon "7,9" schreiben. Wenn ich "8" schreibe, dann ist es auf ganze Zahlen gerundet.



Warum schreibst du nicht im Text schon, was optimal wäre für eine FSB1333 CPU? ................ Nochmals: Wieso wird die Tabelle nicht beachtet? Nichts desto trotz werde ich das wohl noch ändern.




Da sind 5% Mehrperformance bereits WELTEN ................. zwischen zwei Speichertimings gemäß unserer eigenen Messungen 2%. D.h. du müsstest da schon zwei bessere Timings hinlegen, um auf deine 5% zu kommen. Und 5% sind noch nicht die Welt, das ist eine halbe/drittel CPU-Stufe.



DDR3-1375 CL7 bereits schneller ist als DDR2-1250 CL5 und somit auch schneller als DDR2-800 CL3 ............ Von den Latenzzeiten her? Nada. DDR2/800 CL3 mit 7,5ns gegen DDR3/1375 mit CL7 mit 10,2ns.




Du wirst mit DDR2-800 niemals 12.8GB/s erreichen < dein größte Denkfehler. .......... wieso nicht? und vor allem: Wieso soll es mit DDR3/800 gelingen.



Ich habe selbst schon einige Anwendungen (u.a. WinRAR) mit FSB1600 bei DDR2-800 CL3 und DDR2-1000 CL5 gebencht, DDR2-800 CL3 war deutlich langsamer, eben weil es die versprochene Bandbreite nicht liefern kann! ......................... Eventuell reagiert auch WinRAR überhaupt nicht auf die Latenz und viel besser auf die Bandbreite? Jeder Benchmark läuft nun einmal anders. Es lassen sich auch umgedrehte Beispiele finden. Ein Beispiel ist kein Beispiel.





Zur Zeit liegt das maximum bei DDR2-1066 @ 1.8V oder DDR2-1250 @ 2.4V.
DDR3 erreicht und übertrumpft diese Werte schon mit 1.5 bzw. 1.7 bei DDR3-1333. ............... tolle Übertrumpfung, wenn man schon bei DDR3/1375 wieder 1.7V benötigt (fast DDR2-Standard!)






Schau dir bitte mal an, was solch stark übertaktete Speichermodule an Strom schlucken und überlege dann nochmal, ob diese Passage so richtig ist! ..................... Es geht hierbei nicht um Übertakterspeicher. Baust Du den im Notebook ein? Nein. Ok. Aufm Desktop isses dagegen egal, weil da ist der Verbrauch der Speicher nicht wirklich relevant.




DDR2-1250 @ 2.4 V vs = DDR3-1333 CL7 @ 1.7V = BESSERE Leistung bei 0.7V weniger Spannung ..................... bessere Leistung wo? An einem FSB800-Prozessor?




Meines Erachtens nach hast Du den Zweck des Artikels nicht begriffen. Es ging nicht darum, DDR3 schlechtzumachen, sondern darum, die Limitationen dieses Speichers auf heutigen, FSB-gebundenen Intel-Systemen aufzuzeigen. Der Speicher mag eine bessere Leistung haben, kann diese aber nicht ausspielen. Nur darum geht es in diesem Artikel - darum, daß Leute nicht blindglaubend etwas kaufen, was ihnen nichts bringt.

Gast
2007-06-28, 21:00:10
Da sind 5% Mehrperformance bereits WELTEN ................. zwischen zwei Speichertimings gemäß unserer eigenen Messungen 2%. D.h. du müsstest da schon zwei bessere Timings hinlegen, um auf deine 5% zu kommen. Und 5% sind noch nicht die Welt, das ist eine halbe/drittel CPU-Stufe.

Eure Messungen berücksichtigen leider nicht die von mir angesprochenen Details FSB<>RAM Takt und sind auch nicht bei Latenz bzw. Bandbreitenlastigen Anwendungen durchgeführt worden.
Bei Dateiarchivierung kann ich dir Unterschiede von 15 % und mehr aufzeigen.

DDR3-1375 CL7 bereits schneller ist als DDR2-1250 CL5 und somit auch schneller als DDR2-800 CL3 ............ Von den Latenzzeiten her? Nada. DDR2/800 CL3 mit 7,5ns gegen DDR3/1375 mit CL7 mit 10,2ns.

Genau dieser Gedanke den du hast, ist falsch. Ich weiß es, weil ich derjenige war, der das ständig hier im Forum gepredigt hat und auch bei Wikipedia ergänzt habe. ;D

Llatenzzeit ist nicht alles. Die Fakten sehen so aus, das DDR2-800 nie die versprochene Bandbreite liefern kann, sondern meist viel viel weniger. Man merkt sogar bei einem FSB1066 noch Unterschiede zwischen DDR2-533 und DDR2-667 im Dual Channel obwohls deiner Theorie nach nicht möglich wäre. Habe ich selbst nachgeprüft, weil es mich interessiert hat.

Eventuell reagiert auch WinRAR überhaupt nicht auf die Latenz und viel besser auf die Bandbreite? Jeder Benchmark läuft nun einmal anders. Es lassen sich auch umgedrehte Beispiele finden. Ein Beispiel ist kein Beispiel.

WinRAR profitiert beidermaßen von Latenz und Bandbreite.
Aber auch einfache Benchmarks, wie z.B. bei EVEREST, zeigen keinen Vorteil von DDR2-800 CL3 gegenüber DDR2-1000/1066 CL5 in der Latenzzeit.

tolle Übertrumpfung, wenn man schon bei DDR3/1375 wieder 1.7V benötigt (fast DDR2-Standard!)

Vergleichbare DDR2 Module brauchen aber 2.4V, also ist das eine Senkung von 0.7V.

Du darfst nicht dem Gedanken verfallen, (fast) Standardmodule mit highend Speicher, der an der Grenze des machbaren arbeitet, zu vergleichen.

Es geht hierbei nicht um Übertakterspeicher. Baust Du den im Notebook ein? Nein.

Genau das ist es doch, was ich dir versuche zu zeigen.
Im Notebook ist zur Zeit noch DDR2-800 1.8V der Standard, man könnte jedoch bei gleichem Verbrauch auch DDR3-1333 oder gar DDR3-1600 (sobald verfügbar) verbauen und hätte trotzdem mehr Leistung bei gleichbleibendem bzw. geringfügig niedrigeren Verbrauch.
Allein das wäre es schon Wert, den Umstieg zu vollziehen.

Außerdem ist es dringend notwendig, so früh wie möglich, die Massenproduktion von DDR3 aufzunehmen. Daher war es absolut richtig, DDR3 so früh einzuführen, denn die Stückzahlen werden sich nur langsam erhöhen und selbst bis Ende 2008, wird DDR3 immer noch nicht so extrem günstig sein, wie DDR2 jetzt. Bis jetzt hat es immer etwa 2 bis 2,5 Jahre gedauert, bis der neue Standard ein akzeptables Preisniveau erreicht hat - schon bevor diese Zeit abgelaufen ist, soll auch der Nehalem da sein.

bessere Leistung wo?

Bei Standard-FSB. DDR3-1375 @ 1,7V ist geringfügig schneller als DDR2-1250 @ 2.4V.
Seh es doch mal so: DDR3-1375 @ 1,7V ist schneller als DDR2-1066 CL5 und benötigt dabei immer noch weniger Strom.

Kurzum: Man bekommt mit DDR3 die Mehrleistung, die jetzt nur mit stark überhöhter Spannung und stromfressenden DDR2-Modulen möglich ist.

WinRAR kann ich gleich mal benchen...

Leonidas
2007-06-28, 21:12:26
Einiges von dem, was Du sagst, hat was und ich würde es gern vertiefen. Dazu solltest Du Dir aber angewöhnen, auf Argumente zu reagieren. Teilweise wiederhole ich mich in diesem Disput doch wieder arg.



Eure Messungen berücksichtigen leider nicht die von mir angesprochenen Details FSB<>RAM Takt und sind auch nicht bei Latenz bzw. Bandbreitenlastigen Anwendungen durchgeführt worden.
Bei Dateiarchivierung kann ich dir Unterschiede von 15 % und mehr aufzeigen.

1. Beweis?
2. Keinerlei Hinweis, daß damit die aufgestellten Regeln durchbrochen werden. Hier wurde einfach nur ins blaue hinein eine neue, nicht genau spezifizierte Regel aufgestellt.









Llatenzzeit ist nicht alles. Die Fakten sehen so aus, das DDR2-800 nie die versprochene Bandbreite liefern kann, sondern meist viel viel weniger. Man merkt sogar bei einem FSB1066 noch Unterschiede zwischen DDR2-533 und DDR2-667 im Dual Channel obwohls deiner Theorie nach nicht möglich wäre. Habe ich selbst nachgeprüft, weil es mich interessiert hat.


Lesen meiner Texte bildet. Ich schrieb klar, daß die nächsthöhere Taktung immer noch etwas bringt. Bei FSB1066 ist DDR2/533 optimal und DDR2/667 die nächsthöhere Taktung. Das das mehr Leistung bringt, *IST* meine Theorie.







Vergleichbare DDR2 Module brauchen aber 2.4V, also ist das eine Senkung von 0.7V.

Du darfst nicht dem Gedanken verfallen, (fast) Standardmodule mit highend Speicher, der an der Grenze des machbaren arbeitet, zu vergleichen.


Korrekt. Allerdings vergleiche ich das nicht. Ich hab nirgendwo gesagt: Nimm DDR2/1250 mit 2.4V und nicht DDR3/1375 mit 1.7V. Ich sagte: So hohe Speichertaktungen sind zwecklos. Dies gilt natürlich nicht nur für DDR3, sondern auch dann, wenn man mit DDR2-Speicher das Taktniveau von DDR3 erreicht.







Genau das ist es doch, was ich dir versuche zu zeigen.
Im Notebook ist zur Zeit noch DDR2-800 1.8V der Standard, man könnte jedoch bei gleichem Verbrauch auch DDR3-1333 oder gar DDR3-1600 (sobald verfügbar) verbauen und hätte trotzdem mehr Leistung bei gleichbleibendem bzw. geringfügig niedrigeren Verbrauch.


DDR2/800 ist möglicherweise in AMD-Notebooks Standard. In Intel-Notebooks wird für FSB1066 weiterhin DDR2/533 verbaut. Wenn was besseres verbaut wird, dann nur, weil es nichts billigeres auf dem Markt gab, jedoch nie aus Performanceerwägungen heraus.

Desweiteren: DDR3/1333 verbraucht schon mehr als DDR2/800, die Differenz liegt ja nur bei 25% bei gleichem Takt. Gegenüber DDR2/533 dürfte DDR3/1333 dann schon erheblich mehr verbrauchen. Zudem: Leistungsgewinn, wo? Bei einem limitierenden FSB?





Außerdem ist es dringend notwendig, so früh wie möglich, die Massenproduktion von DDR3 aufzunehmen. Daher war es absolut richtig, DDR3 so früh einzuführen, denn die Stückzahlen werden sich nur langsam erhöhen und selbst bis Ende 2008, wird DDR3 immer noch nicht so extrem günstig sein, wie DDR2 jetzt. Bis jetzt hat es immer etwa 2 bis 2,5 Jahre gedauert, bis der neue Standard ein akzeptables Preisniveau erreicht hat - schon bevor diese Zeit abgelaufen ist, soll auch der Nehalem da sein.


Vollkommen korrekt - aus Industriesicht. Muß das den Käufer interessieren? Nada.








Bei Standard-FSB. DDR3-1375 @ 1,7V ist geringfügig schneller als DDR2-1250 @ 2.4V.
Seh es doch mal so: DDR3-1375 @ 1,7V ist schneller als DDR2-1066 CL5 und benötigt dabei immer noch weniger Strom.

Kurzum: Man bekommt mit DDR3 die Mehrleistung, die jetzt nur mit stark überhöhter Spannung und stromfressenden DDR2-Modulen möglich ist


Mehrleistung * wo? Der verdammte FSB limitiert! Gegenbeweise werden gern angenommen, aber bis zu diesem Zeitpunkt steht das erst einmal.




WinRAR kann ich gleich mal benchen...


Wenn Du was beweisen willst, dann gehe unvoreingenommen ein größeres Benchmarkfeld an und nicht nur einen Benchmark, dessen Ergebnis Du bereits kennst.





* Ganz allgemein: Wir reden in diesem Punkt aneinander vorbei. Wenn Du "Mehrleistung" sagst, meinst Du damit, was der Speicher für sich allein leisten kann bzw. könnte. Ich meine damit, was beim User davon ankommt. Kleine Differenz, große Wirkung.

Gast
2007-06-28, 21:55:12
Wenn Du was beweisen willst, dann gehe unvoreingenommen ein größeres Benchmarkfeld an und nicht nur einen Benchmark, dessen Ergebnis Du bereits kennst.
Wenn Du "Mehrleistung" sagst, meinst Du damit, was der Speicher für sich allein leisten kann bzw. könnte. Ich meine damit, was beim User davon ankommt. Kleine Differenz, große Wirkung.

Arbeitsspeicher ist genau wie die CPU oder Grafikkarte eine Komponente für sich. Warum sollte man die nicht einzelned benchen dürfen? Macht ihr bei den anderen Komponenten schließlich auch.

Die Mehrleistung vom Speicher wird die CPU in allen CPU limitieren Fällen sofort 1:1 ummünzen.

Es wäre unsinnig, den so zu benchen, wie du für richtig hälst. Du benchst schließlich auch keine 8800 Ultra in 640x480 0xAA, weil das Ergebniss vernichtend und schlichtweg falsch wäre.
Speicherperformance kannst du genau wie Grafikkartenperformance nur da testen, wo eine Limitierung vorliegt.

Ich hätte gern ein paar Benches mit EVEREST+WinRAR gemacht (vielleicht noch weitere Vorschläge), nur leider habe ich gerade festgestellt, das CPU-Z und EVEREST die Speichertiminigs nicht korrekt auslesen können, da ich ein brandneues Board habe. Gibts irgendwo ne brauchbare Version für Bearlake Boards?

Gast
2007-06-28, 22:03:08
mal 'ne kleine technische anfrage: ich war bisher immer der ansicht, das die i/o-einheiten bei ddr2 mit der gleichen realen frequenz laufen wie der speicher und erst durch ddr-verfahren effektiv doppelt so schnell getaktet: macht also bei zwei leitungen und zwei bits pro takt einen prefetch von vier.

Gast
2007-06-28, 23:18:33
Jetzt einfach mal aus Interesse, obwohl er bei Pcs nicht benutzt wird. Wie ist denn die Leistung von XDR im vergleich zu den DDR Speichern? und würde es sich lohnen diesen in PCs einzusetzen?

Gast
2007-06-29, 00:36:44
Ganz toller Artikel, Danke Leo!!!
Ich habe echt alles verstanden und blicke ein wenig mehr durch im Speicherdschungel. Toll wie alles erklärt und verglichen wurde.
Nochmals danke.

GI-Joe323
2007-06-29, 02:27:58
Sehr schöner Artikel. Mich würde mal interessieren wie man die Latenzzeit genau ausrechnet. Kann mir das jemand aufschreiben?

Leonidas
2007-06-29, 05:35:12
mal 'ne kleine technische anfrage: ich war bisher immer der ansicht, das die i/o-einheiten bei ddr2 mit der gleichen realen frequenz laufen wie der speicher und erst durch ddr-verfahren effektiv doppelt so schnell getaktet: macht also bei zwei leitungen und zwei bits pro takt einen prefetch von vier.


Nein. Ich erkläre es am Beispiel DDR2/800:

400 MHz Bustakt + DDR-Verfahren (also insgesamt 800 MHz) liegt am Speicherbus
Die I/O-Einheit taktet ebenfalls 400 MHz
Die Speicherzellen takten mit 200 MHz, werden aber über ein doppelt so breites Interfaces an die I/O-Einheiten angeschlossen.

Der sogenante Prefetch von 4 ergibt sich aus dem Vergleich von Speichertakt zu Takt der Speicherzellen (800 zu 200 MHz).

PS: "2 Bits pro Takt" ist nicht korrekt. Es werden jeweils so viele Bits pro Takt übertragen wie das Speicherinterface breit ist. Heutzutage sind das 64 Bit DualChannel DDR, also 256 Bit pro Takt.




Jetzt einfach mal aus Interesse, obwohl er bei Pcs nicht benutzt wird. Wie ist denn die Leistung von XDR im vergleich zu den DDR Speichern? und würde es sich lohnen diesen in PCs einzusetzen?


Insbesondere XDR2 ist wohl leistungsfähiger als DDR3, kann locker auf deutlich höhere Bandbreiten kommen. Allerdings hängt dies primär mit den Interfaces an - XDR ist auch mehr eine Interface-, als eine Speichertechnologie.

Dies hat zwei Nachteile: Erstens kann man die XDR-Speicher derzeit nicht an gewöhnliche Prozessoren hängen, dafür braucht man spezielle CPUs mit integriertem XDR-Controller oder Mainboard-Chipsätze mit integriertem XDR-Controller. Das baut natürlich keiner, weil derzeit zu teuer und zu ungewiß.

Und zweitens wird das System durch die nötigen breiten Speicherinterfaces ziemlich teuer und wird wohl auch in Massenanwendung teurer bleiben als DDR. XDR ist eher interessant für Fälle, wo diese hohe Bandbeite auch benötigt wird - beispielsweise wird es ja bei der PS3 eingesetzt.




Sehr schöner Artikel. Mich würde mal interessieren wie man die Latenzzeit genau ausrechnet. Kann mir das jemand aufschreiben?


1000 / Nominaltakt des Speichers * Latenz
... wobei der Nominaltakt bei DDR2/800 also 400 MHz sind

Beispiel: DDR2/800 mit CAS3
1000 / 400 * 3 = 7.5ns





Arbeitsspeicher ist genau wie die CPU oder Grafikkarte eine Komponente für sich. Warum sollte man die nicht einzelned benchen dürfen? Macht ihr bei den anderen Komponenten schließlich auch.

Die Mehrleistung vom Speicher wird die CPU in allen CPU limitieren Fällen sofort 1:1 ummünzen.



So war das nicht gemeint. Benche bitte gern nur nur den Speicher, so weit möglich. Allerdings benchst Du eben auch immer den FSB mit, diesen Effekt kannst Du nicht ausschließen. Und wenn der FSB limitiert, ist halt Feierabend.

Das ist das gleiche, wenn Du GeForce 8800 GTS und Ultra auf einem PCI-Bus benchst. Klar sind die Grafikkarten unterschiedlich schnell - nur wirst Du das auf dem superlangsamen PCI-Bus niemals ermitteln können, weil zuerst der PCI-Bus limitiert.

AnPapaSeiBua
2007-06-29, 08:13:48
Super Artikel!

Jetzt kann man auf einen vernünftigen Gegen-Artikel verweisen, wenn wieder einer schreit: "DDR3 ist Scheiße, schau dir den Test bei THG an.".


Aber: ein Vorteil von DDR3 wurde nicht erwähnt. Beide Teile einzeln schon, aber nicht kombiniert: Single Channel im Notebook.
Die meisten Notebooks haben nämlich gar kein Dual Channel Interface, dort könnte dann DDR3 tatsächlich auch jetzt schon Performance-Vorteile bringen (passende Chipsätze vorausgesetzt).

Krischi
2007-06-29, 08:18:16
Die Berechnung genaugenommen:

400 MHz = 0,4 * 10^9 Hz entspricht 1 / 0,4 * 10^9 s, ergo 2,5 * 10^-9s, mulripliziert mit 3 kommt man auf 7,5 * 10^-9s.

Und der Gast mit seiner Bandbreite sieht eben nicht, dass wie Leo sagte, der Speicher nicht für sich allein arbeitet, sondern im Verbund.

Bei CPU-Test reduziert man die Abhängigkeit von der GraKa durch kleine Auflösungen, bei GraKa-Test reduziert man die Abhängigkeit von der CPU durch hohe Auflösungen. Das bei beiden Szenarien der Einfluss der jeweils anderen Kompüonente nciht 100%ig ausgeschlossen werden kann, liegt auf der Hand.

Bei der Speicherbandbreite kann man höchstens noch argumentieren, dass mit höherem CPU-Takt die I/O-Leistung der CPU ans Limit getrieben werden kann und sie die I/O-Anbindung (FSB) besser ausnutzt. Ergo sollte man mit einem hochgetakteten Prozessor messen, um hier alles an seine Grenze zu treiben. Wie schon gesagt, auch zwischen CPU und Northbridge sowie Northbridge und Speicher regeln Protokolle den Datenverkehr. Und solche Protokolle (Vergleich Ampeln im Straßenverkehr) können "nicht jedem, der zu einer beliebigen Zeit an eine Kreuzung kommt, immer grün geben". Analogie klar?

Also, CPU-I/O-Output und Übertragungsprotokoll (inkl. Fehler und deren Korrekturaufwand auf der Transportstrecke) sorgen dafür, dass die theoretische Bandbreite nicht ausgeschöpft werden kann, man kann sich ihr allerhöchsten asymptotisch nähern. Und zwar nur soweit, wie die schmalste Stelle im Verbund es zulässt. Und das ist aktuell bei Intel der FSB. Deswegen stimmen von der Seite her die Aussagen des Artikels.


Eine andere Sache ist immer noch der Unterschied Bandbreite zu Latenz.
Den Unterschied kann man sich vielleicht verdeutlichen, wenn man sich den Vergleich DDR1-RAM (CL2) auf 400 MHz und DDR2-RAM (CL4) auf 800 MHz vorstellt.
In Szenarien, in denen es nicht auf große Datenmengen ankommt, sind beide Varianten rein vom Ansprechverhalten des Speichers gleichschnell. Eventuell ist DDR2 technikbedingt leicht im Nachteil, das halbsoschnell getakte Speicherzellen im ungünstigsten Falle nur mit dem halben I/O-Takt liefern können (wenn alle nötigen Daten eben nur in dieser Zelle sind). Erst wenn die Bandbreite zum entscheidenden Kriterium wird, kann der DDR2-RAM seine theoretisch doppelt so große Bandbreite ausspielen kann. Das das außer in theoreitschen Benchmarks im normalen PC-Geschehen eher seltend er Fall ist, haben die Benchmarks damals zwischen S. 939 und S. AM2 bei AMD nur kleine Leistungssteigerungen gezeigt.

Alles ein Paar verschiedene Schuhe: Bandbreite und Latenz sind ja nach Szenario unterschiedlich in ihrem Einfluss auf Benchmarks.

Nachtrag:
Da ja die absoluten Zugrifsszeiten mit DDR3 auf den höchsten Taktstufen auch nicht besser werden als sie schon bei DDR1 waren, verpufft der Vorteil von DDR3 völlig, soalnge die größere Bandbreite nicht irgendwie genutzt werden kann.

Das einzige auf der Habenseite von DDR3 bleibt wirklich die Energieersparnis bei bestimmten, nciht auf schnellste Performance getrimmten Szenarien sowie die angenehme Möglichkeit, wieder Single-Channel-Interfaces zu bauen (geringere Kosten / Komplexität). Meiner einer hätte kein Problem damit, ein Single-Channel-Interface auf einem Mainboard zu akzeptieren, wenn es genauso schnell ist.

So, reicht für jetzt ^^

Gruß Krischi

Scream
2007-06-29, 10:40:19
also erst einmal find ich den Artikel wirklich gut Leo!

wäre vielleicht noch anzumerken dass der Bloomfield ein Triple-Channel-Interface besitzen könnte und daher DDR2 theoretisch auch noch reichen würde
bis dahin werden allerings die niedrigen Preise von DDR3 und der geringere Stromverbrauch auf jeden Fall den Durchbruch für DD3 bringen

paul.muad.dib
2007-06-29, 10:41:23
Habe zwei technische Fragen zum Artikel:

1. AMD hat ja mit HT ein Link-System etabliert, wo jeweils 2 Komponenten direkt verbunden sind. Bei Intels fsb ist das doch anders. Nicht Chipsatz und Ram sowie CPU und Ram haben eine Direktverbindung sondern sie sind über den gemeinsamen Bus verbunden, der insgesamt die angegebenen Bandbreiten transportieren kann. Das bedeuted aber, die fsb-Limitierung betrifft die RAM-Anbindung an sich und nicht die Verbindung CPU-Northbridge. Damit könnte aber auch einem IGP keine zusätzliche Bandbreite zur Verfügung gestellt werden.
Bitte klär mich auf, wenn ich hier falsch liege.


2. Sorgt Dual-Channel wirklich für eine exakte Verdopplung der Speicherbandbreite? Ein Festplatten-Raid oder SLI bewirken ja auch keine Verdopplung der Leistung. Beim Ram müsste ja die Aufteilung der Daten so sein, dass genau die Hälfte der Daten auf dem einen Speicherriegel und die andere Hälfte auf dem anderen liegt.

Gast
2007-06-29, 11:16:08
@ Krischi

Absoluter Denkfehler, den du da machst! Der Gast weiß nämlich, wovon er redet. ;)

Nicht der FSB ist der limitierende Faktor, sondern der Speicher selbst.

DDR2-800 wird nie so effektiv sein, wie reale 800 MHz Speichertakt, obwohl uns das Marketing das immer vorgaukeln will.

BlackBirdSR
2007-06-29, 11:18:29
Habe zwei technische Fragen zum Artikel:

1. AMD hat ja mit HT ein Link-System etabliert, wo jeweils 2 Komponenten direkt verbunden sind. Bei Intels fsb ist das doch anders. Nicht Chipsatz und Ram sowie CPU und Ram haben eine Direktverbindung sondern sie sind über den gemeinsamen Bus verbunden, der insgesamt die angegebenen Bandbreiten transportieren kann. Das bedeuted aber, die fsb-Limitierung betrifft die RAM-Anbindung an sich und nicht die Verbindung CPU-Northbridge. Damit könnte aber auch einem IGP keine zusätzliche Bandbreite zur Verfügung gestellt werden.
Bitte klär mich auf, wenn ich hier falsch liege.


Hier trifftst du genau auf die grobe Linie, wo oberflächliche Anschauung und Realität verschmelzen.
Der Speicherbus und der FSB sind auch bei Intel zweierlei unterschiedliche Dinge. Beide Münden an der Northbridge und deren Speichercontroller. Der FSB hat aber keine Einwirkung darauf, wie schnell/viel der Speichercontroller den Speicher theoretisch ansprechen kann.
Die FSB-"Limitierung" betrifft daher nicht den Speicherbus.
Trotzdem ist die Sache noch verzwickter als es scheint. Zur Vereinfachung sagt man natürlich, dass sich CPU und IGP die Speicherbandbreite Teilen.
Auf Signalebene ist dies natürlich nicht korrekt. Pro Takt kann der Speichercontroller natürlich nur Daten für die CPU oder! den IGP bearbeiten. Der Gewinn kommt dann dadurch, dass der Speichertakt höher ist (geringere Latenz) und der 128Bit breite Speicherbus größere Happen übertragen kann. Das verringert die Wartezyklen für CPU und IGP, und steigert damit die Performance.


2. Sorgt Dual-Channel wirklich für eine exakte Verdopplung der Speicherbandbreite? Ein Festplatten-Raid oder SLI bewirken ja auch keine Verdopplung der Leistung. Beim Ram müsste ja die Aufteilung der Daten so sein, dass genau die Hälfte der Daten auf dem einen Speicherriegel und die andere Hälfte auf dem anderen liegt.

Und wieder ein Realität/Veranschaulichungs-Problem.
Um exakt die doppelte Bandbreite und gleiche Latenz zu erhalten, müsste der Speichercontroller alle Daten gleichmäßig über die Module verteilen. Selbst dann, kann aber niemals sicher gestellt werden, dass sich Daten A1 und DatenA2 nicht ganz wo anders befinden. Wie es der Zufall und der Programmcode eben so wollen.
Abhilfe schaffen hier zwei Gesetze: Spatial locality und Temporal locality.

Das Erste besagt, dass darauffolgende Speicherzugriffe mit hoher Wahrscheinlichkeit Daten wollen, die nahe an dem gerade gelesenen Datum liegen.
Das Zweite geht davon aus, dass gerade gelesene Daten mit hoher Wahrscheinlichkeit wieder angefordert werden.

Bei einem Speicherzugriff auf Datum A3 liest die CPU also nicht nur A3 in den L2-Cache, der Speichercontroller wird aufgefordert den ganzen Bereich um A3 einzulesen und an den Cache zu schicken. Mit großer Wahrscheinlichkeit, ist der nächste Zugriff auf A7 dann schon im Cache.
Es geht also weniger darum, zu jeder Zeit gleichzeitig aus den Modulen lesen zu können, man schiebt immer einen ganzen Schwung an Daten aus dem Speicher in den Cache.

Dabei behandelt man momentan beide Module als einen Speicherpool. Sowohl die K8 als auch die Intel-Chipsätze sind IMO darauf ausgelegt, einen großen 128Bit breiten Speicherkanal zu sehen. Das spart Controller-Logik und Latenz für die Verteilung.

Das führt natürlich auch dazu, dass von doppelter Bandbreite und so nicht mehr direkt die Rede sein kann.
Das wäre auch die Kritik an fast allen Benchmarkprogrammen. PEAK-Performance messen kann jeder. Aussagen tut das fast gar nichts mehr.
Daher ist es auch gefährlich von Limitierung, verpuffender Bandbreite etc zu sprechen. Im Endeffekt ist die Mischung aus realer Bandbreite, Latenz und Programmcode das einzige was wirklich korrekt ist.

Aber du siehst ja was alleine diese simplen, hoffentlich korrekten, erklärungen für Platz wegnehmen. Und wieviel braucht die gängige Variante? ;)

puntarenas
2007-06-29, 12:26:51
Danke, der Artikel hat bei mir viele Unklarheiten beseitigt!
:up:

Leider wurde mir auch die Illusion genommen, mit DDR2-667 4-4-4-12 deutlich geringere Latenzen als mit DDR2-800 5-5-5-12 zu bekommen, sind ja doch nur 12ns zu 12,5ns. So gesehen hast du meinen PC verlangsamt :(

Gast
2007-06-29, 12:50:00
Leider wurde mir auch die Illusion genommen, mit DDR2-667 4-4-4-12 deutlich geringere Latenzen als mit DDR2-800 5-5-5-12 zu bekommen, sind ja doch nur 12ns zu 12,5ns. So gesehen hast du meinen PC verlangsamt :(

Aber DDR2-800 wird trotzdem gleichschnell sein, da die Bandbreiten nur theoretisch sind und bei DDR2-667 schon erste kleine Leistungeinbußen bei FSB1333 CPU eintreten werden.

Wenn ich die Wahl zwischen niedrigen Takt und strammen Timings oder hohen Takt und lasche Timings hätte, würde ich immer letzteres nehmen.
Vorteile: Übertakten im größeren Stil möglich, die praktische Bandbreite ist höher, sie sind zur Zeit nicht teurer, man hat bessere Verkaufsmöglichkeiten, trotz des höheren Taktes, kann der Stromverbrauch geringer sein.

Wenn ich sehe, das DDR2-800 CL3 meistens 2.3 V braucht, fahre ich besser/genauso gut mit DDR2-1066 CL5 bei 1.8 - 2.1 V und könnte dann noch ohne Probleme bis 533 MHz FSB übertakten.
FSB1600 CPUs sind nicht unwahrscheinlich, also bei RAM immer die Zukunftsperspektiven berücksichtigen, den braucht man nicht alle paar Monate ersetzen. :)

Krischi
2007-06-29, 13:25:01
Hallo Gast, der auf meinen Beitrag geantwortet hat:

Ich habe doch nichts anderes behauptet!?

Am effektivsten in dem Sinne wäre (um bei aktuellen Technologien zu bleiben) SDRAM mit physischen 800 MHz... aber darum ging es mir ja nicht primär.

RAM funktioniert ja bekanntlich so, das wir eine Speicherzellenmatrix haben, aus der wir einzelne Bits auslesen wollen. Diese müssen wir adressieren und das dauert eine bestimmte Zeit (diverse Latenzzeiten). Wenn wir dann den Zugriff geschafft haben, kommt ja erst das eigentlich Interessante zum Tragen: erstens das parallele Auslesen gleich mehrerer Bits (64 pro Speicherkanal) und zweitens das Auslesen nciht nur einzelner 64Bit-Blücke, sondern mehrere davon hintereinander (Burst). Ohne Burst-Zugriff wären Speicher mit hohem Takt und hohen Latenzen nicht viel schneller als Speicher mit niedrigem Takt und niedrigen Latenzen.
Die Latenz spielt beim Erstzugriff eine große Rolle, danach verringert sich die Zugriffszeit durch das Verfahren der Burst-Übertragung. Hier spielt schneller Speicher dann seine Bandbreite aus.
Aber du hast völlig recht, im wahlfreien Zugriff ist ein physischer Speichertakt von X Mhz schneller als ein 2x X/2 Takt.

Wohlgemerkt es ja auch Unterschiede gibt zwischen DDR1 und DDR2, 3 etc. Bei DDR1 sind ja die Speicherzellen noch so schnell wie der I/O-Bus, bei DDR2/3 nur halb bzw. ein Viertel so schnell. Da kommen auch wieder Wartenzeiten beim wahlfreien Zugriff rein, beim Burst geht dann wieder die Post ab.

Lange Rede, wenig Sinn: Ich bin völlig deiner Meinung.

Gruß Krischi

Gast
2007-06-29, 13:33:07
Dann ist gut. ;)

Ich bräuchte trotzdem noch ein programm zum Speichertimings auslesen beim Bearlake. Gibt es da zur Zeit nichts? CPU-Z zeigt mir eine CAS Latency von 33 an. ;D
EVEREST streikt ebenso...

Ohne diese Infos, wären Screenshots als "Beweis" sinnlos...

Interessant für diese Art Artikel wäre auch mal folgender Vergleich:
DDR400 3-3-2-8 vs DDR2-400 3-3-2-8
oder
DDR2-800 5-5-5-15 vs DDR3-800 5-5-5-15 @ Gigabyte GA-P35C-DS3R

Dadurch würde man den Marketingpfusch leicht aufdecken können.

Gast
2007-06-29, 13:43:50
Aber DDR2-800 wird trotzdem gleichschnell sein, da die Bandbreiten nur theoretisch sind und bei DDR2-667 schon erste kleine Leistungeinbußen bei FSB1333 CPU eintreten werden.
In meinem Fall aber ein E6600 und damit FSB1066, aus dem früheren Artikel zur Speicherskalierung auf C2D-Prozessoren habe ich laienhaft geschlossen, dass bei einer Stufe über dem 1:1 Betrieb das Ende der Fahnenstange erreicht ist, das wäre bei mir dann ja DDR2-667...

Scream
2007-06-29, 13:53:31
Dann ist gut. ;)

Ich bräuchte trotzdem noch ein programm zum Speichertimings auslesen beim Bearlake. Gibt es da zur Zeit nichts? CPU-Z zeigt mir eine CAS Latency von 33 an. ;D
EVEREST streikt ebenso...



welche everest version hast du denn?

Gast
2007-06-29, 14:23:49
welche everest version hast du denn?

Die aktuellste von der Webseite in der Downloadsektion. Der P35 ist aber noch aktueller als diese Version.

Scream
2007-06-29, 15:01:38
das sollte dir helfen :D
http://www.computerbase.de/downloads/software/systemueberwachung/everest/

Xmas
2007-06-29, 15:14:57
1. Es sind 8 GB/sec nach der 1024er Regel. Und ich denke, die sollten wir schon ansetzen - es sei denn, wir fangen an, von 2,1 GB oder 4,2 GB Speicherausbau zu sprechen, wenn wir uns ein 2GB- oder 4GB-Speicherkit ranholen.
Übertragungsraten werden üblicherweise in Zehnerpotenzen angegeben.

RavenTS
2007-06-29, 15:40:56
...
PS: "2 Bits pro Takt" ist nicht korrekt. Es werden jeweils so viele Bits pro Takt übertragen wie das Speicherinterface breit ist. Heutzutage sind das 64 Bit DualChannel DDR, also 256 Bit pro Takt.

Was er meinte ist doch: "2 Datenworte pro Taktflanke" statt jeweils nur einem...

DDR3 wird mit den aktuellen CPU-Architekturen auch in Zukunft nicht schneller werden.

Sicherlich wird DDR3 nicht direkt besser werden, ausser das die JEDEC vielleicht neue Taktstufen validiert, und auch ein heute gekauftes (theoretisches) DDR3/1600-Modul wird mit der Zeit sicherlich "nicht besser" (es verändert sich ja nicht), aber es wird doch sicherlich "schneller" werden in dem Sinn, als es dann in Zukunft endlich voll ausgenutzt werden kann (mit den kommenden Architekturen, explizit CPU-Interne RAM-Controller angesprochen), also doch einen zukünftigen Mehrnutzen haben könnte...

paul.muad.dib
2007-06-30, 21:28:34
Danke BlackBirdSR für die Erklärungen. Womit ich bei der zweiten Frage hinauswollte ist, dass die Aussage Dual-Channel => Verdopplung der Speicherbandbreite nicht immer richtig ist.

Falls die Bandbreite effektiv nur um - sagen wir mal - 50% erhöht könnten bei DDR 800 nur 9 GB/s übertragen werden, während der fsb 1333 10,6 GB/s veträgt. Insofern könnte, wenn man davon ausgeht, das DDR2 schneller als 800 weiterhin exorbitant teuer bleibt, DDR3 schon einen kleinen Vorteil bringen.


edit: Wie kann der Speichercontroller mehr Bandbreite erreichen, wenn er doch nur mit fsb-Takt läuft? Oder taktet der asynchron?

Gast
2007-07-01, 04:38:41
Da ist wohl bei der ersten Anmerkung ein kleiner Fehler drin, da Binärpräfixe mit 2^10=1024 und die normale Zählung mit 1000 wäre ;) Ansonsten hab ich grad nen Denkfehler ;)

(del)
2007-07-02, 02:31:48
Über den Artikel kann ich nicht beurteilen, zu wenig Fachkenntnis. Jedenfalls liest es sich schonmal sehr gut.

Das Thema find ich sehr interessant. Ich hab mir erst vor kurzem ein E6600/650i zusammengeschraubt und war und bin am überlegen wie ich es "am performantesten" konfigurieren soll. Vor allem im Bezug auf OC. Benchen kann man bis zum Vergasen und viel Zeit investieren ohne etwas herauszufinden, was "RL-Programmen" nützt. Wenn man nicht 100% Kenne hat.

Die CPU läuft mit 1424. Der Speicher mit 864. Ratio syncron oder asyncron? Timings 3-3-3-9/690 oder 4-4-4-12/864? CommandRate 1T mit bis zu 700 oder 2T mit 854?

Ein Folgeartikel mit speicherlastigen Anwendungen hätte also was. Vor allem zeigt der erste Artikel nur die Spitze des Eisbergs :(

Gast
2007-07-15, 16:26:34
Vielen Dank für diesen Artikel! Ist schon Jahre her, seit ich das letzte Mal hier war und bin durch einen Verweis im Geizhalsforum auf den Artikel aufmerksam gemacht worden.
Leicht verständlich und man merkt das Bemühen der Autoren, zu erklären, nicht zu blenden. Hervorragend.
Weitermachen!

Gast
2007-07-15, 16:59:17
Wie kann der Speichercontroller mehr Bandbreite erreichen, wenn er doch nur mit fsb-Takt läuft? Oder taktet der asynchron?

Wie schon gesagt, ist die RAM-Bandbreite theoretisch! Die wird nie maximal erreicht.
Ich vergleiche das immer gerne mit der SLI-Effizienz, denn die ist auch selten bei 100%, es geht einfach Effizienz verloren und dann kommt noch hinzu, das die Bandbreite nicht immer doppelt so hoch sein kann, wie BlackBird erklärt hat.

Wenn eine FSB1600 CPU mit DDR2-800 im Dual Channel betrieben wird, geht etwas Leistung verloren.
Mit DDR2-1066 ließen sich noch ein paar hundert MB/s (laut EVEREST) herausholen.

Auch sollte berücksichtigt werden, das eine bessere Latenzzeit, egal auf welchem Takt, Leistung bringt!

Beispielweise ist bei einer FSB1600 CPU, DDR2-1066 5-5-5 immer noch langsamer, als DDR3-1375 5-5-5, weil die CPU länger benötigt, um auf die Daten überhaupt zugreifen zu können!

Deswegen verstehe ich die ablehnende Haltung dieses Artikels nicht. Es kann nie früh genug losgehen, denn die Anlaufzeit benötigt es dringend, da die abgesetzten Stückzahlen nur sehr langsam ansteigen und dadurch die Produktion nur sehr langsam günstiger wird.

Leonidas
2007-07-26, 05:34:35
Deswegen verstehe ich die ablehnende Haltung dieses Artikels nicht. Es kann nie früh genug losgehen, denn die Anlaufzeit benötigt es dringend, da die abgesetzten Stückzahlen nur sehr langsam ansteigen und dadurch die Produktion nur sehr langsam günstiger wird.


Und ich werde nie verstehen, wieso jemand wegen Vorteilen in der Zukunft eine Technologie pusht, bei welcher klar ist, daß sie *jetzt* keine Vorteile hat, *jetzt* zuviel kostet und vor allem in der Zukunft nur mit anderen neuen Technologien die prognostizierten Vorteile bringt. Eine D3D10-Karte, jetzt gekauft, wird mit den D3D10-Games des Jahres 2008 (hoffentlich) ihre Vorteile ausspielen können - ohne das man ein neues Mainboard oder eine neue CPU kaufen muß. Ein DDR3-Speicher, jetzt zum überteuerten Preis gekauft, wird auch in Zukunft nicht schneller werden, weil gleichzeitig auch der Unterbau gewechselt werden müsste. D.h. hier bietet es sich dreifach an zu warten: Die Leistung wird erst später kommen, der Preis erst später sinken und letztlich der Unterbau, der die höhere Leistung ermöglicht, wird auch erst später kommen.

Der Antrieb, jetzt zu kaufen um die Technologie voranzubringen, kommt seitens der Hersteller und die brauchen diese Anschubfinanzierung sicherlich. Aber muß der Konsument das mitmachen? Sicherlich nicht, wenn er rechnen kann.

Und nebenbei würde ich all das auch problemlos umstossen, wenn Du Deine Geschichte von der höheren Bandbreite durch DDR3 auch schon jetzt nachweisen könntest. Ich hab wirklich kein Problem damit, der Wahrheit ins Auge zu sehen und damit auch eigenen Fehler einzugestehen. Ich denke selber derzeit intensiv darüber nach, ob in meiner Argumentation ein Fehler sein könnte.

Gast
2007-08-29, 16:36:38
Hallo,

aus dem ganzen Hardwaregeschehen bin ich ein wenig raus, will mir aber nun einen neuen Rechner zusammenstellen. Dabei muss ich natürlich auch zwischen DDR2 und DDR3 entscheiden. Dabei ist der Artikel eine Hilfe aber eins verstehe ich nicht so ganz:

Wieso ist die Geschwindigkeit mit der der Speicher mit dem Prozessor spricht denn so wichtig? Kann eine Grafikkarte an einem PCI-E Bus nicht auch ohne über den Prozessor zu gehen auf den Hauptspeicher zugreifen?
Und, wenn "ja", ist die Geschwindigkeit mit der die Grafikkarte mit dem Speicher spricht nicht (bei Grafikintensiven Anwendungen) wichtiger als die, mit dem der Prozessor mit dem Speicher spricht, weil der Prozessor nur Modelle und Skellette berechnen muss, mit Texturen aber nichts am Hut hat?

Grüße
Björn

RavenTS
2007-08-29, 21:33:10
...
Wieso ist die Geschwindigkeit mit der der Speicher mit dem Prozessor spricht denn so wichtig? Kann eine Grafikkarte an einem PCI-E Bus nicht auch ohne über den Prozessor zu gehen auf den Hauptspeicher zugreifen?
Und, wenn "ja", ist die Geschwindigkeit mit der die Grafikkarte mit dem Speicher spricht nicht (bei Grafikintensiven Anwendungen) wichtiger als die, mit dem der Prozessor mit dem Speicher spricht, weil der Prozessor nur Modelle und Skellette berechnen muss, mit Texturen aber nichts am Hut hat?

Grüße
Björn

Sie greift ja nicht direkt über die CPU auf den RAM zu, sondern über den Memorycontroller, der bei AMD aber beispielsweise in der CPU sitzt.

Die Geschwindigkeit wäre natürlich ein wichtiger Punkt, den man hier jedoch nicht auseinanderklöppeln kann. Beide Komponenten greifen auf einen großen Speicher zu, würde man den auseinanderziehen, würde das einfach nur den Aufwand erhöhen mit der so ein MoBo designt werden muss...

MrSpadge
2007-09-07, 23:23:12
Hallo Leonidas,

ein gut geschriebener Artikel, allerdings stellten sich mir beim Lesen fast die Nackenhaare auf, so dass ich mich nach Jahren des Mitlesens doch für's Forum registriert habe.

Hättest du formuliert "DDR3 ist für den Geschwindigkeitsgewinn noch viel zu teuer und außerdem wird er durch den FSB gebremst" würde ich dir vollkommen zustimmen. Aber deine Aussage ist "DDR3 und hoch getakteter DDR2 können bei heutigen FSBs kein bisschen Geschwindigkeit bringen (abgesehen von Latenzen)". Hier vereinfachst du zu sehr und liegst meiner Meinung nach falsch. Lass es mich erklären und belegen.

Ich beobachte die hardware-Welt schon eine Weile länger als ich 3DCenter lese. Zu Zeiten des P2 hättest du mit deinen Überlegungen sicherlich Recht gehabt. Auch beim Athlon XP brachte RAM schneller als der FSB nichts - im Gegenteil, durch die asynchrone Taktung verlor man sogar noch Geschwindigkeit. Während der P4-Zeit bemerkte ich allerdings, dass bei intel-Chipsätzen der asynchrone Betrieb immer weniger an Geschwindigkeit verlor. Als intel dann mit dem der Einführung des C2D wieder interessant wurde, stellte ich überrascht fest, dass bei intel-Chipsätzen selbst RAM auf deutlich höherem Takt als dem FSB-Takt noch einen Geschwindigkeitsvorteil brachte.

Wie kann das möglich sein? Ich denke, dass sie "einfach" einen schnellen und groß genug dimensionierten Puffer zwischen FSB und Northbridge verwenden. Ich bin zwar kein Entwickler bei intel, aber so macht es verdammt viel Sinn.

Beim Zugriff auf den RAM kann man prinzipiell 2 Zugriffsarten unterscheiden: sequentielle und zufällige Zugriffe. Im ersten Fall werden immer nur aufeinander folgende Daten ausgelesen. Vor dem ersten Zugriff muss die Adresse angelegt werden und die Latenzen schlagen voll zu. Alle weiteren Zugriffen erfolgen dann ohne weitere Wartezyklen, bis zum Ende des bursts. In diesem und nur in diesem Fall erreicht man die theoretische Geschwindigkeit des RAMs und deine Argumentation trifft voll zu. Wann kommen solche Zugriffe vor? Programme wie Sandra (buffered) oder Everest versuchen, einen puren burst zu erreichen und so die maximale Transferrate aufzuzeigen. Bei einem C2D mit FSB266 und DDR2-800 kommen dabei aber nur 5 - 6 GB/s heraus (link (http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2991&p=3)). Wenn du Recht hättest, müsste sich der Wert viel näher an den maximalen 10 GB/s des FSB befinden, was DDR2-800 im dual channel ja locker schaffen sollte. Das deutet schon darauf hin, dass die burst-Geschwindigkeit in der Praxis bei weitem nicht erreicht wird. Wenden wir uns realen Speicherzugriffen zu: hier wird ab und zu (um nicht zu sagen relativ häufig) die neue Adresse nicht direkt neben der alten Adresse liegen. Dann müssen Spalte und Zeile im RAM neu adressiert werden und die Latenzen schlagen wieder zu. Hier fällt nicht nur die reine CAS-Latenz an, sondern meist deutlich mehr. Wenn Programme wie Everest die durchschnittliche Latenz messen, dann kommt da etwas zwischen 30 ns (hoch getakteter single core A64) und über 100 ns (server) heraus. Das sind ziemlich viele RAM- auch FSB-Takte. Und genau hier kommt der Puffer in's Spiel: wenn der RAM höher als der FSB getaktet ist und eine Weile im burst-Modus arbeiten kann, sammelt man erstmal alle Daten im Puffer, die nicht sofort auf den FSB können. Der FSB transferiert kontinuierlich Daten zur CPU und der Puffer füllt sich langsam. Sobald jetzt aber der burst abbricht, weil die Adresse springt oder vielleicht auch weil es nach einer gewissen burst-Länge vielleich ein paar Latenz-Takten bedarf, kann der Puffer über den FSB geleert oder zumindest verkleinert werden. Da, wie oben geschrieben, 30ns ziemlich viele Takte sind, denke ich, dass das ganz gut funktionieren sollte. Dass es recht viele solcher Gelgenheiten geben muss, sieht man schon daran, wie viel schneller normale PC-Anwendungen durch schnellere RAM-timings werden können (trotz CPU caches, hard- und software prefetch usw.).

Mit solch einem Puffer kann man dann auch wunderbar Geschwindigkeitsverluste durch asynchronen RAM/FSB-Takt "abpuffern". Und man sorgt dafür, dass RAM mit höherem Takt als der FSB immer mit voller Geschwindigkeit arbeiten kann, solange er genug Pausen einlegen muss (wegen den Latenzen).

Wer hat also Recht? Ich möchte hier gerne recht detaillierte Messungen von Anandtech anlässlich der Vorstellung des P35 in's Feld führen. Mein erster (http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2991&p=3) link ist wieder der gleiche wie oben: Sandra buffered und unbuffered. Der zweite (http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2991&p=4) ist die folgende Seite mit Super Pi und Far Cry. Man sieht:

- Sandra buffered, welches einem Dauer-burst am nahesten kommt, legt beim Wechsel von DDR2-800 zu 1066 bei FSB266 um 5.9% zu und bei FSB333 um 7.8%

- der Wechsel von FSB266 zu 333 bringt bei DDR2-800 10.8% und bei DDR2-1066 sogar 12.8%

-> Man sieht also, dass der FSB limitiert, bei DDR2-1066 stärker als bei DDR2-800, aber auch dass DDR2-1066 mit gleichen timings (in Takten) trotzdem schneller als DDR2-800 ist. Und bevor es jemand auf die bei 1066 MHz kürzeren Latenzen in Sekunden schiebt: DDR2-1066 6-6-6 ist hier sogar schneller als DDR2-800 3-3-3.

- Sandra unbuffered, was erfahrungsgemäß eher mit der Anwendungsgeschwindigkeit korreliert, gewinnt beim Wechsel von DDR2-800 zu 1066 bei FSB266 16.4% und bei FSB333 14.6%

- der Wechsel von FSB266 zu 333 bringt bei DDR2-800 3.2% und bei DDR2-1066 1.6%

-> Hier hat der FSB kaum noch limitiert, aber der höhere RAM-Takt brachte einiges! DDR2-1066 6-6-6 ist auch wieder etwas schneller als DDR2-800 3-3-3.

- Super Pi reagiert generell stark auf Latenz und Bandbreite, hier scheint aber etwas mit den FSB 333-Messungen falsch zu sein (sind langsamer als FSB266). Bei FSB 266 ist DDR2-1066 immerhin 3.6% schneller als DDR2-800 und wieder etwas schneller als DDR2-800 mit den scharfen timings.

- Bei Far Cry bringt der Wechsel von DDR2-800 zu 1066 bei FSB266 3.2% und bei FSB333 3.5%

- dagegen bringt der Wechsel von FSB266 zu 333 bei DDR2-800 ganze 0.2% und bei DDR2-1066 0.5%

-> Auch hier limitiert der FSB zwar, aber der Gewinn durch höheren RAM-Takt überwiegt bei weitem. DDR2-1066 6-6-6 ist auch wieder etwas schneller als DDR2-800 3-3-3.

Um das ganze zusammenzufassen: du hast zwar Recht, dass der FSB die Leistung des schnelleren RAMs begrenzt, aber in der Praxis ist diese Begrenzung weit von "kein Vorteil mehr" entfernt, selbst bei DDR2-1066 und FSB 266, der laut deinem Artikel schon durch DDR2-533 gesättigt sein sollte und mit DDR2-667 völlig ausreichend versorgt sein sollte.

Dass ich mir die Zeit genommen habe, das hier aufzuschreiben, sagt dir vermutlich schon, dass mich deine Meinung dazu interessiert ;)

Gruß, MrS

Edit@Björn: die Grafikkarte benutzt zum Glück hauptsächlich ihren eigenen RAM, der deutlich schneller als der RAM des PCs ist. Ansonsten müssten wir immernoch in 800x600 zocken :D

MrSpadge
2007-09-29, 20:59:14
Und noch ein Test mit nem C2D, der nur eine sehr begrenzte FSB-Limitierung zeigt:
http://www.overclockers.com/articles1477/

Gruß, MrS

MrSpadge
2007-10-13, 00:09:07
http://www.anandtech.com/cpuchipsets/intel/showdoc.aspx?i=3120&p=2

Test zum X38, gibt etwas Einblick wie der Speichercontroller so arbeitet. Zeigt sehr schön, dass RAM und FSB alles andere als direkt verbunden sind, da wird einiges zwischengespeichert.

While Intel's press slides simply tout the virtues of Intel's "faster memory access", the fact is Intel has revamped the X38's memory controller to include their revised "flexible clock crossing architecture" and improved prefetching circuitry. We have done a little digging into exactly what faster memory access means and it seems to revolve around the snoop cache buffer improvements. The snoop feature can be described very simply as an extra level of pseudo-cache resident in the MCH. It's not really cache, per-se, but lines of recently cached memory reads. The purpose of this feature is to reduce memory read latencies in memory intensive programs that read a lot of data in parallel. The most common scenario is in multiple core computations where the cores are all manipulating shared data a little differently.

The primary benefit is that a separate memory read isn't needed every time data is accessed; instead the X38 MCH intelligently caches data and provides it when available. This also allows for a larger re-order buffer for read and write operations that further enhances memory performance. Every time the MCH must switch between reading and writing there is a wait period on the data lines, so the X38 MCH will wait until there are enough write requests stored before committing the data to memory.

Essentially, the MCH will "store" write requests and then "burst" them into memory when either the filter is full or the core requests data from memory that has not been written yet. So when the MCH writes this data it is coming straight from the pseudo-cache and this is what provides the "faster memory access" in the X38. It is almost like the chipset engineers followed their CPU brethren in the op re-ordering design in the Core 2 series, only it is applied to memory read/writes and implemented by the MCH - or maybe it's just a highly refined feature from the Intel 870. In reality, we have noticed slightly improved latencies and read rates when compared to the P35, but nothing that would make us dance in streets.


MrS

Gast
2007-10-21, 14:57:26
Einfach mal danke für den Artikel. Hat mir als absoluten Newbie in dem Gebiet auf jeden Fall mal den Kopf zurecht gerückt von wegen immer höhere Zahlen sind auch besser (vor allem wenn sie dann auch noch teurer sind).
Der Artikel beschreibt differenziert und objektiv(meines erachtens) vor- und nachteile der Baugruppen und erklärt die Unterschiede allgemein verständlich. Mehr solcher Artikel wären für die eigene Auswahl von Systembauteilen wirklich hilfreich.

Gruß,
erfreuter Leser

MrSpadge
2007-10-21, 23:23:09
Zu sagen, dass schnellerer RAM kaum Geschwindigkeit bringt ist OK - schließlich rechnet der RAM ja nicht, sondern versorgt nur die CPU mit Daten, die nicht im cache sind. Das ist sicher auch für viele Leser nützlich.

Aber zu sagen, dass schneller DDR2 und vor allem DDR3 wegen der FSB-Limitierung bei aktuellen Intels 0.000 % mehr Geschwindigkeit bringt ist schlicht und einfach falsch :/

MrS

Gast
2007-12-12, 14:45:20
Hi ihr alle,

will mich an dieser Stelle auch einfach mal kurz für den echt ausführlichen, verständlich und ordentlich aufgemachten Tag über das ganze MHz- und GB- Gewerbe bedanken, wirklich, mal ein bisschen Licht in der Sache :-)

Echt gut, macht weiter so. Und net zu sehr streiten, schließlich steckt hinter allem (siehe günstigere Produktion von DDR3 aufgrund geringerer Kerntakte) ein ganz großer Prozentteil an Marketing und Gewinnsucht der Industrie. Also, lassen wir uns net veräppeln ;)

Euch schöne Adventstage und Weihnachten, bis denne

SlaMMa

Gast
2008-04-05, 21:39:20
Übertragungsraten werden üblicherweise in Zehnerpotenzen angegeben.

jo, recht hast, die aussage ist einfach falsch:

Bandbreiten seitens Intel nach der 1000er Regel errechnet, nach der korrekteren 1024er Regel sind es 10, 12 und 16 GB/sec).

Gast
2008-06-06, 10:35:03
Ich muss einfach etwas loswerden, weil es wirklich not tut:

Der obige Artikel ist schwer zu lesen, rethorisch auf Schulniveau und präsentiert ein handvoll Fakten in einem Gemenge aus Füllwörtern, gepaart mit der (teilweise) falschen und fehlplatzierten persönlichen Meinung des Autors "Leonidas".

Hier gewinnt die Aussage des Autors "Lesen meiner Texte bildet." eine ganz andere (ironische) Perspektive..

Belege dazu finden sich im gesamten Text und den anschließenden Kommentaren !


Und nun meine Bitte an "Leonidas"; ich hoffe du kannst mit Kritik umgehen und sie positiv umsetzen - deine Leser weren es dir danken.

Schaue dir bitte dazu einmal andere Artikel an (z.B. von "Robbitop" aus diesem Forum) und lerne..
MfG