PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Wer erklärt mir Ram-timing? 2-3-2-"6"


Super Grobi
2005-05-16, 17:28:20
Hallo Leute,
wer kann mir in einfachen Worten erklären was der Wert in Klammern bedeutet? Dieser Wert ist ja für die Perfomence angeblich egal, aber was macht er? Was ist dann der beste Wert?

Gruss
SG

K4mPFwUr$t
2005-05-16, 17:44:47
tRAS
Diese Option legt die Anzahl der Taktzyklen fest, bevor der DRAM nach dem aktiven Zustand erneut geladen werden kann. Einstellmöglichkeiten: 1 ~ 15

Tras Timing
Diese Option konfiguriert die Verzögerung zwischen Aktivierung einer Bank bis zu dem Zeitpunkt, an dem ein Schreib- oder Lesebefehl akzeptiert wird. Die Einstellungen sind 1 ,2 ,3, 4 Cycles.

Tras Timing Value
Unter dieser Option (RAS Active Time) können Sie die Zeit angeben, die eine Speicherzeile offen gehalten wird, um auf die in der gleichen Zeile liegenden Zeilen zuzugreifen. AMD empfiehlt in seinem Datenblatt 7 Cycles. Einstellmöglichkeiten: 2, 3, 4, 5, 6, 7 Cycles


ich würde nicht grade sagen das man ihn komplett vernachläsigen soll, bei mir brachte eine verschärfung gut 100MB/s bei max. read ;)

Super Grobi
2005-05-16, 17:46:10
THX!!!

SG

Spasstiger
2005-05-16, 17:47:36
THX!!!

SG

Je geringer der Wert, desto schneller.

BlackArchon
2005-05-16, 17:57:24
Je geringer der Wert, desto schneller.
Nee. Auf dem Nforce 3 ist laut Anandtech 10 am schnellsten, auf dem Nforce 4 6, beim Nforce 2 mit Dualchannel 11. Bei Intel stimmt das allerdings.

K4mPFwUr$t
2005-05-16, 17:59:38
Nee. Auf dem Nforce 3 ist laut Anandtech 10 am schnellsten, auf dem Nforce 4 6, beim Nforce 2 mit Dualchannel 11. Bei Intel stimmt das allerdings.

ich mach mal einen test mit meinem RAM und nF3 250U

die werte poste ich hier rein

Undertaker
2005-05-16, 18:00:26
aber die unterschiede bewegen sich im bereich der messungenauigkeiten... also das nehmen womit der ram am besten läuft...

Undertaker
2005-05-16, 18:02:43
ich mach mal einen test mit meinem RAM und nF3 250U

die werte poste ich hier rein

das wäre supi ;)

bitte mit screens, vor allem die everest lesen/schreiben/latenz ergebnisse :)

K4mPFwUr$t
2005-05-16, 18:08:07
es ist zwar nicht everest, den dieses hat eine extrem hohe ungenauigkeit

rightmark memory analyser ist da besser.

alle test wurden mit DDR500 durchgeführt

2.5-3-3-5
http://img17.echo.cx/img17/830/253359du.jpg

2.5-3-3-6
http://img17.echo.cx/img17/8651/253363qa.jpg

2.5-3-3-10
http://img17.echo.cx/img17/9155/2533108ar.jpg

;D

Super Grobi
2005-05-16, 18:18:12
Hi,
ich hab kurz mal mit Everest den Lesetest gemacht und bei 5 und 10 kommt das selber raus. Liegt das daran das ich nur eine Singelchanel CPU habe? (S754 3700+)

Gruss
SG

Coda
2005-05-16, 18:19:32
Nein, das liegt daran dass der Wert keinen großen Einfluss hat.

Kampfwurst was sieht man da? Imho ist das doch alles gleich innerhalb der Messgenauigkeit.

Gummikuh
2005-05-16, 18:31:20
Bei Dual Channel sind die Timings eh nicht mehr so sehr ausschlaggebend...ist schon eher Feintuning...

K4mPFwUr$t
2005-05-16, 18:31:32
die einstellungen sind vorgenommen per A64 tweaker, die timings zeigt es auch im RAM test an. wie es scheint, ist es relativ wurst ob tRAS 5,6-10 ... bei nF3

wobei ich immer die schärferen bevor zugen würde.
aber mit einer höheren tRAS kann man mehr aus dem RAM an takt bekommen ;)

könnte einer mal die ganze sache bei nF4 austesten :confused:

Bei Dual Channel sind die Timings eh nicht mehr so ausschlaggebend...ist schon eher Feintuning...
ja wie es scheint schon, sieht man ja oben, nur minimalste abweichungen.

@Code das programm ist haargenau nicht wie everest :)
selbst nach 4 durchläuften sind nur 0,001% abweichung (leicht übertrieben)

Coda
2005-05-16, 19:06:00
Und selbst wenn was glaubst du was +-10MB/s an der Performance ändern...

K4mPFwUr$t
2005-05-16, 19:13:19
Und selbst wenn was glaubst du was +-10MB/s an der Performance ändern...

an sich nix und zwar null komma nix

aber in spielen hat man bessere ergebnisse wenn man niedrige timings hat. die machen zwar keinen unterschied in der effektiven bandbreite aus, aber dafür sind diese schneller von der latency denn 50ns und 100ns sind doch ein unterschied. auch wenn die ergebnisse oben fast gleich sind. ist man mit x-x-x-5 gegenüber x-x-x-10 auf der sicheren seite

Coda
2005-05-16, 19:16:14
Für das bischen Unterschied würde ich eventuelle Instabilitäte nie im Leben in Kauf nehmen.

Bokill
2005-05-16, 19:25:02
@K4mPFwUr$t

Nunu? Das ist ja ein leserlicher faktenbasierter Beitrag? Wie kommt`s?

MFG Bokill

K4mPFwUr$t
2005-05-16, 19:27:42
Für das bischen Unterschied würde ich eventuelle Instabilitäte nie im Leben in Kauf nehmen.

ja das stimmt allerdings, ich nehm auch lieberstabilität als ein tick performance, aber bei mir läuft es seit tagen ohne probleme :wink:

Nunu? Das ist ja ein leserlicher faktenbasierter Beitrag? Wie kommt`s?

ach so aus reiner lust :D

avalanche
2005-05-17, 02:49:02
Hmm... sicher, dass die Bezeichnung "tRAS" die richtige ist? tRAS ist doch eigentlich die Zeit, die zwischen dem Anlegen der Zeilenadresse und der tatsächlichen Verfügbarkeit des Datums vergeht, oder nicht? Die Zugriffszeit (!= Zykluszeit) also. Berichtigt mich, wenn ich falsch liege.

onkel2003
2005-05-17, 05:04:58
es ist zwar nicht everest, den dieses hat eine extrem hohe ungenauigkeit

rightmark memory analyser ist da besser.

alle test wurden mit DDR500 durchgeführt



;D

Schalte mal C&Q ab, dann ist everest auch ok.
2,5.3.3.11
Lessen 5586 Schreiben 2172
Lessen 5601 Schreiben 2183 gleiche einstellung mit neustart
Also wie du siehst fast garkein unterschied.

2,5.3.3.5
Lessen 5618 Schreiben 2172
2,5.3.3.6
Lessen 5670 Schreiben 2180

Also fast kein unterschied zwischen 2,5.3.3.11 und 2,5.3.3.5(6).
Und keine extrem hohe ungenauigkeit zwischen den beiden test mit gleicher einstellung, und neustart.

K4mPFwUr$t
2005-05-17, 15:46:42
ich habe kein QnC an :biggrin: bzw. den treiber dafür installiert, also läuft er auf vollen speed :eek: und dabei 30°C idle :wink:

onkel2003
2005-05-17, 17:56:07
ich habe kein QnC an :biggrin: bzw. den treiber dafür installiert, also läuft er auf vollen speed :eek: und dabei 30°C idle :wink:

Hat einer nach dein Idle Temps gefragt ?.
Und wenn du kein C&Q an hast, wieso haste dann den Treiber installiert ;D .

K4mPFwUr$t
2005-05-17, 17:57:43
äähh nicht fehlt da noch, wo war ich da mit dem gedanken nur :biggrin:

Coda
2005-05-17, 19:15:54
ich habe kein QnC an :biggrin: bzw. den treiber dafür installiert, also läuft er auf vollen speed :eek: und dabei 30°C idle :wink:Und was genau nützt dir das, wenn die Leistung sowieso nicht gebraucht wird? Q'n'Q führt zu absolut keinem bemerkbaren Geschwindigkeitsverlust.

K4mPFwUr$t
2005-05-17, 19:53:23
Und was genau nützt dir das, wenn die Leistung sowieso nicht gebraucht wird? Q'n'Q führt zu absolut keinem bemerkbaren Geschwindigkeitsverlust.
es ist meine entscheidung, ich habe auch einen A64 2800+ mit CnQ und merke da keinen unterschied, aber wenn er schon im idle bei 2500MHz 30°C ist, was dann bei CnQ, will doch net das der arme erfiert :D

dann wäre auch mein CnQ OCed sprich statt 1000MHz (5x200) hätte ich dann 1250MHz (5x250), und das ist wiederum so ne sache mit dem Vcore, da der glaube ich automatisch eingestellt wird wenn CnQ aktiv ist auf 1.1Vcore ... das hieße es gäbe probleme mit der stabilität bei 1250MHz ;(

naja und CnQ braucht man eigentlich nur wenn man keine vernümpfite kühlung hat, also was bei mir nicht der falle ist

Madkiller
2005-05-18, 17:11:42
Nee. Auf dem Nforce 3 ist laut Anandtech 10 am schnellsten, auf dem Nforce 4 6, beim Nforce 2 mit Dualchannel 11. Bei Intel stimmt das allerdings.
Krass, ich hätte nich gedacht, daß es beim nForce 3/4 ähnlich ist...
Gerade weil die ja "richtiges" DC (im Gegensatz zum nForce2) haben...

K4mPFwUr$t
2005-05-18, 17:30:55
bei dem nF3 250U kann man sagen, das es bei RAM benches kaum unterschied ist ... aber wie sich das mit 2.5-3-3-5 vs 2.5-3-3-10 verhalten wird, immerhin 5cyles mehr. und weniger ist immer besser. wenn alles stabil läuft, wieso nicht :confused:

Bandit666
2005-05-21, 00:34:33
So.....mal ein NF4.
Alles on default. Ram bei 200Mhz!

2.2.2.5 1T

http://www.directupload.net/images/050521/temp/BbH8ydFj.jpg (http://www.directupload.net/show_image.php?d=261&n=BbH8ydFj.jpg)

2.3.3.6 1T

http://www.directupload.net/images/050521/temp/qko4L9Z5.jpg (http://www.directupload.net/show_image.php?d=261&n=qko4L9Z5.jpg)

2,5.3.3.5 1T

http://www.directupload.net/images/050521/temp/TpgRg8e7.jpg (http://www.directupload.net/show_image.php?d=261&n=TpgRg8e7.jpg)

2,5.3.3.11 1T

http://www.directupload.net/images/050521/temp/r4yTeAvf.jpg (http://www.directupload.net/show_image.php?d=261&n=r4yTeAvf.jpg)

mfg

K4mPFwUr$t
2005-05-21, 10:18:19
danke für dein vergleich :uclap:
da kann man gut sehen wie sich die ganze sache so auswirkt :rolleyes:

GloomY
2005-05-23, 21:49:49
[...] und weniger ist immer besser.Da muss ich widersprechen. In den meisten Fällen dürftest du Recht haben, dass weniger, d.h. kürzer (zeitlich) eben auch besser (schneller) ist.

Gerade bei tRAS kann länger aber auch schneller sein. tRAS ist die Zeit, die eine geöffnete Page mindestens offen sein muss, bevor diese wieder geschlossen werden kann. Wenn der Speichercontroller die Page bei einem Zugriff schon zumacht, obwohl er noch etwas aus dieser benötigt, muss er sie erneut wieder öffnen (tRCD lang warten, also üblicherweise 2, 3 oder 4 Takte).
Das kann - neben Instabilitäten - eben auch zu verlängerten Wartezeiten führen, wenn z.B. der Controller die Page schon nach einem Burst von 4 schließt, auch wenn er eigentlich 8 Quadwords für eine Cacheline benötigt.

Man kann also mit zu kleinen tRAS Werten die Performance eventuell auch verschlechtern.

Bandit666
2005-05-23, 22:15:11
Da muss ich widersprechen. In den meisten Fällen dürftest du Recht haben, dass weniger, d.h. kürzer (zeitlich) eben auch besser (schneller) ist.

Gerade bei tRAS kann länger aber auch schneller sein. tRAS ist die Zeit, die eine geöffnete Page mindestens offen sein muss, bevor diese wieder geschlossen werden kann. Wenn der Speichercontroller die Page bei einem Zugriff schon zumacht, obwohl er noch etwas aus dieser benötigt, muss er sie erneut wieder öffnen (tRCD lang warten, also üblicherweise 2, 3 oder 4 Takte).
Das kann - neben Instabilitäten - eben auch zu verlängerten Wartezeiten führen, wenn z.B. der Controller die Page schon nach einem Burst von 4 schließt, auch wenn er eigentlich 8 Quadwords für eine Cacheline benötigt.

Man kann also mit zu kleinen tRAS Werten die Performance eventuell auch verschlechtern.



Hmmm....ich dachte das täte Dram Idle Time!!??

mfg

bitte
2005-05-23, 22:15:38
Nee. Auf dem Nforce 3 ist laut Anandtech 10 am schnellsten, auf dem Nforce 4 6, beim Nforce 2 mit Dualchannel 11. Bei Intel stimmt das allerdings.

Hi bei welchen bgriff muss ich 11 eingeben?Hab ein Nforce 2 board bei was muss ich 11 eingeben bei zb cas latenzy oder wo ?

GloomY
2005-05-23, 22:19:39
Hi bei welchen bgriff muss ich 11 eingeben?Hab ein Nforce 2 board bei was muss ich 11 eingeben bei zb cas latenzy oder wo ?Bei tRAS. Dafür gibt es verschiedene Bezeichnungen. Poste doch mal deine Auswhlmöglichkeiten.
Die CAS Latency ist es aber nicht.
Hmmm....ich dachte das täte Dram Idle Time!!??

mfgtRAS ist die minimale Zeit, die verstreichen muss, bis die Page geschlossen werden darf(!). Wenn sie dann effektiv geschlossen wird, ist eine andere Frage.
Ich vermute, dass dies die Einstellung von "DRAM Idle Time" regelt. Das ist aber AFAIK eine Einstellung des Speichercontrollers. Zumindest kenne ich diese nicht aus den JEDEC Specs.

K4mPFwUr$t
2005-05-23, 22:20:12
wenn ich dynamic idle cycle counter ausmache kommen massive verschlechterungen vor bis 11ns :eek:

also kann man tRAS wie mit der belichtungszeit bei einem fotoaperat vergleichen, zu wenig und zu viel ist nicht gut :hammer:

GloomY
2005-05-23, 22:27:52
wenn ich dynamic idle cycle counter ausmache kommen massive verschlechterungen vor bis 11ns :eek:"Dynamic idle Time" ist ja auch was anderes als "idle time" alleine. Je nach Zugriffsmuster wird bei ersterem die Zeit wie lange eine Page nach einem erfolgten Zugriff offen bleibt dynamisch verändert. Man kann sich also ein bisschen auf die getätigten Zugriffsmuster einstellen und so die Performance verbessern.
also kann man tRAS wie mit der belichtungszeit bei einem fotoaperat vergleichen, zu wenig und zu viel ist nicht gut :hammer:Ja. Am Besten würde ich tRAS auf das Maximum von dem im SPD-EEPROM geforderten Wert und der Summe aus tRCD und der entsprechenden Burst-Länge für eine Cacheline einstellen.
Exoten wie NForce2 ausgenommen.

K4mPFwUr$t
2005-05-23, 22:36:51
bei rightmark ram analyzer kann man gut die zugriffskurve betrachten, so kann man den optimal wert rausfinden, bei mir ist der unterschied nichtmal %1 von 5,6 und 10 als tRAS :rolleyes:

Super Grobi
2005-05-23, 22:40:24
Zitat: Ja. Am Besten würde ich tRAS auf das Maximum von dem im SPD-EEPROM geforderten Wert und der Summe aus tRCD und der entsprechenden Burst-Länge für eine Cacheline einstellen

*hust* Das hab ich jetzt nicht verstanden. Also ich habe derzeit 2-3-2-6 T1 eingestellt. Was sollte ich anstatt der 6 deiner Meinung nach einstellen?

Gruss und dank
SG

Edit: SPD=2,5-3-3-8 (falls das wichtig ist)

Bandit666
2005-05-23, 22:45:13
bei rightmark ram analyzer kann man gut die zugriffskurve betrachten, so kann man den optimal wert rausfinden, bei mir ist der unterschied nichtmal %1 von 5,6 und 10 als tRAS :rolleyes:


Aber Rmma ist ein theoretischer Bench. Vielleicht sieht die Realworldperf. anders aus?

mfg

K4mPFwUr$t
2005-05-23, 23:09:57
kann man ja mal austesten, wie es sich da verhält ;)

GloomY
2005-05-24, 00:06:37
Zitat: Ja. Am Besten würde ich tRAS auf das Maximum von dem im SPD-EEPROM geforderten Wert und der Summe aus tRCD und der entsprechenden Burst-Länge für eine Cacheline einstellen

*hust* Das hab ich jetzt nicht verstanden. Also ich habe derzeit 2-3-2-6 T1 eingestellt. Was sollte ich anstatt der 6 deiner Meinung nach einstellen?

Gruss und dank
SG

Edit: SPD=2,5-3-3-8 (falls das wichtig ist)Wenn im SPD-EEPROM wirklich tRAS=8 Takte steht, würde ich es auf 8 stellen.

Zu obigem:
Ich habe vorgeschlagen, zwei Werte anzuschauen und den höheren davon zu nehmen. Der erste Wert ist der tRAS-Wert aus dem EEPROM. In deinem Fall also 8 Takte.
Der andere Wert ist die Summe aus tRCD (bei dir 3 Takte; zweiter Wert in 2,5-3-3-8) und der Anzahl der Takte zu berechnen, die für das Bust-Auslesen einer (L2-) Cacheline des Prozessors benötigt werden.
Eine L2 Cacheline ist beim K7/K8 64 Byte groß und beim P4 128 Byte (P3: 32 Byte). Pro Takt werden vom RAM bei einem Burst Dank DDR-Technik 2 mal 64 Bit = 16 Byte übertragen. Das gilt natürlich pro Kanal, d.h. bei DualChannel sind es 32 Byte / Takt.
Wenn man nun z.B. einen Intel-Prozessor mit 128 Byte L2 Cacheline hernimmt, so braucht man für das Füllen einer Cacheline

128 Byte / (32 Byte / Takt) = 4 Takte

In deinem Fall: tRCD + 4 Takte = 7 Takte. tRAS sollte also imho auf das Maximum von 8 und 7 Takten eingestellt werden, d.h. auf 8 Takte.

Bei einem AMD Rechner mit DualChannel wären es :

64 Byte / (32 Byte / Takt) = 2 Takte.

Hier sollte tRAS also imho auf das Maximum von tRAS und (tRCD + 2 Takte) eingestellt werden.

K4mPFwUr$t
2005-05-24, 13:54:36
wenn es so ist
tRCD + 2 cyles = tRAS = 5cyles bei mir dann ist 2.5-3-3-5 gudi ;D

DrumDub
2005-05-24, 14:35:33
wenn es so ist
tRCD + 2 cyles = tRAS = 5cyles bei mir dann ist 2.5-3-3-5 gudi ;D hmm.. macht bei mir irgendwie keinen unterschied ob 2,5-3-3-5 oder 2,5-3-3-6. 2,5-3-3-3 ist aber auf jeden fall schlechter.

K4mPFwUr$t
2005-05-24, 14:36:56
bei 2.5-3-3-10 kann ich aber um ein paar MHz höher takten ;)

wies es gezeigt hatte ist kaum unterschied dazwischen ;( so kann man sich irren