PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Zeigt her eure: CPU-z L2-Cache Latenz


Quasar
2004-10-16, 11:12:41
Ja, gebt sie mir - am besten die beiden Bildchen aus CPU-z v1.24 (http://www.cpuid.com/cpuz.php) als angehängte .png-Dateien (kann auch Paint in WinXP erzeugen, AFAIK).

Mich interessieren die Unterschiede zwischen den verschiedenen CPU-Klassen, aber auch die der jeweiligen Evolutionsstufen, so soll z.B. der Prescott eine höhere L2-Latenz aufweisen, als der Northwood. :|

Mein habt ihr hier:

Digg
2004-10-16, 11:19:01
hier mal von meinem northwood.. diesmal inc der latenzen:

http://mitglied.lycos.de/meinnamegehtnicht/cache1234.JPG

ps: unter last kommen andere ergebnisse zusammen.

dildo4u
2004-10-16, 11:20:31
Nein latency steht ja nicht da funzt bei mir auch nicht was muss ich machen um die result zu speichern?

Quasar
2004-10-16, 11:21:56
Komisch, daß die Latenz bei euch da nicht angegeben ist... :|

Speichern:
ALT GR+DRUCK und dann in Paint via STRG+V einfügen.
edit:
STRG zu ALT GR gemacht +
Ihr könnt auch zwei einzelne Bilder machen und hier anhängen, die werden dann so dargestellt, wie in meinem Posting oben...

dildo4u
2004-10-16, 11:24:42
Komisch, daß die Latenz bei euch da nicht angegeben ist... :|

Speichern:
ALT GR+DRUCK und dann in Paint via STRG+V einfügen.
edit:
STRG zu ALT GR gemacht +
Ihr könnt auch zwei einzelne Bilder machen und hier anhängen, die werden dann so dargestellt, wie in meinem Posting oben...
Das mit den bildern is kein problem aber wenn ich die lateny exe ausführe passiert nix und wenn ich so cpu z starte stehts halt nicht da.

Quasar
2004-10-16, 11:26:08
Schade, ich dachte, das Programm gibt das bei jeder CPU aus. Bei mir muss ich nichts weiter tun, als das Programm (cpuzexe) starten und auf den Cache-Reiter wechseln.... :(

MechWOLLIer
2004-10-16, 11:39:12
mh, ich hab jetzt mal die latency.exe unter der MS-DOS Eingabeaufforderung gestartet und das kam dabei raus.
AMD Athlon64 3200+

dildo4u
2004-10-16, 11:54:57
@Mech Danke für den tipp P4 Northwood


http://img99.exs.cx/img99/4589/latency.jpg

Gast
2004-10-16, 11:55:17
Mit meiner Ur-Alt-CPU K6-2 500 gibt es bei Latency im DOS-Fenster:
1 cache levels detected
Level 1 size = 32Kb latency = 2 cycles
Der Level-2-Cache auf dem Board wird nicht erkannt.

Gast
2004-10-16, 12:01:32
Eine Latency von 0 Cyclen gibt es nicht, dann wäre der Prozessor sehr schnell. Das erste Bild von P3 ist somit nicht richtig.

BlackArchon
2004-10-16, 12:04:19
Athlon64 3000+:

Ganon
2004-10-16, 12:04:33
;)
ConnectixCPU 668 Mhz. ;)


Cache latency computation, ver 1.0
www.cpuid.com

Computing ...


stride 4 8 16 32 64 128 256 512
size (Kb)
1 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 2
4 2 2 2 2 2 2 2 2
8 2 2 2 2 2 2 2 2
16 2 2 2 2 2 2 2 2
32 2 2 2 2 2 2 2 2
64 2 3 3 5 5 5 5 5
128 2 3 5 7 10 7 7 7
256 2 3 5 11 8 8 8 11
512 4 6 12 22 25 23 21 21
1024 4 8 21 37 36 41 36 41
2048 4 13 21 43 59 58 56 61
4096 4 9 23 51 64 65 65 69
8192 4 8 21 47 64 68 67 68
16384 4 8 24 49 66 68 67 70
32768 4 8 23 51 67 64 391 708

2 cache levels detected
Level 1 size = 32Kb latency = 2 cycles
Level 2 size = 16384Kb latency = 38 cycles

Jesus
2004-10-16, 12:23:48
http://nemesis.rushers.net/Unbenannt1.PNG http://nemesis.rushers.net/Unbenannt2.PNG

Birdman
2004-10-16, 12:39:24
AMD64 3400+ aka "Clawhammer"

Stone2001
2004-10-16, 12:50:11
Hier mal ein Athlon MP 2400+ Throughbred B-Core!

Black-Scorpion
2004-10-16, 13:11:03
xp2400+


E:\3DCenter\CPU-Z\cpu-z-124>latency

Cache latency computation, ver 1.0
www.cpuid.com

Computing ...


stride 4 8 16 32 64 128 256 512
size (Kb)
1 3 3 3 3 3 3 3 3
2 3 3 3 3 3 3 3 3
4 3 3 3 3 3 3 3 3
8 3 3 3 3 3 3 3 3
16 3 3 3 3 3 3 3 3
32 3 3 3 3 3 3 3 3
64 3 3 3 3 3 3 3 3
128 4 6 9 18 20 20 20 20
256 4 6 9 18 20 20 20 20
512 20 22 60 120 210 211 217 219
1024 19 31 61 120 210 211 216 219
2048 19 31 61 123 211 213 218 222
4096 19 31 62 123 214 212 218 222
8192 19 31 61 122 215 216 218 223
16384 19 31 61 123 215 216 218 223
32768 17 27 61 123 214 216 218 223

2 cache levels detected
Level 1 size = 64Kb latency = 3 cycles
Level 2 size = 256Kb latency = 20 cycles

BUGFIX
2004-10-16, 13:13:37
Ein Xeon 3,06 GHz [Prestonia] im 2er gespann


Cache latency computation, ver 1.0
www.cpuid.com

Computing ...


stride 4 8 16 32 64 128 256 512
size (Kb)
1 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 2
4 2 2 2 2 2 2 2 2
8 2 2 2 3 2 2 2 2
16 3 3 8 10 19 19 19 19
32 3 4 8 11 19 16 19 19
64 3 4 4 11 18 17 19 18
128 3 4 9 18 18 18 18 18
256 3 4 9 18 19 19 19 19
512 3 4 13 18 21 28 23 27
1024 3 13 23 50 95 359 349 378
2048 3 13 26 50 92 352 353 372
4096 3 13 25 50 94 353 353 374
8192 3 14 26 49 93 360 351 373
16384 3 14 26 49 91 363 352 381
32768 3 12 26 50 94 367 353 372

2 cache levels detected
Level 1 size = 8Kb latency = 2 cycles
Level 2 size = 512Kb latency = 19 cycles


MfG

BUGFIX

mirp
2004-10-16, 13:51:56
Von meinem P3-S hatte ich noch alte Werte gesammelt. Bei der Version 1.22 war dieser Latency-Test noch integriert. Die Werte des Barton habe ich jetzt mit der aktuellen Version 1.24 gemessen: latency > latency.txt


Pentium III-S

L1/DC: 16 KBytes, 4-way Associativity, 32 Bytes Line Size
L1/IC: 16 KBytes, 4-way Associativity, 32 Bytes Line Size

L2: 512 KBytes, 8-way Associativity, 32 Bytes Line Size, 256 bits Bus Width

CPU-Z version 1.22
Latency Test

stride 4 8 16 32 64 128 256 512
size (Kb)
1 3 3 3 3 3 3 3 3
2 3 3 3 3 3 3 3 3
4 3 3 3 3 3 3 3 3
8 3 3 3 3 3 3 3 3
16 3 3 3 3 3 3 3 3
32 4 4 6 8 8 8 8 8
64 4 4 6 8 8 8 8 8
128 4 4 6 8 8 8 8 8
256 4 4 6 8 8 8 8 8
512 4 5 6 10 9 9 10 10
1024 21 39 73 126 127 128 129 133
2048 21 39 73 127 127 128 129 133
4096 21 39 73 126 127 128 129 133
8192 21 39 73 127 127 128 130 133
16384 21 39 73 126 127 128 130 133
32768 21 39 73 126 127 128 130 133

2 cache levels detected
Level 1 size = 16KB latency = 3 cycles
Level 2 size = 512KB latency = 8 cycles (5 cycles for this only level)

Athlon XP (Barton)

L1/DC: 64 KBytes, 2-way Associativity, 64 Bytes Line Size
L1/IC: 64 KBytes, 2-way Associativity, 64 Bytes Line Size

L2: 512 KBytes, 16-way Associativity, 64 Bytes Line Size, 64 bits Bus Width

Cache latency computation, ver 1.0
www.cpuid.com

Computing ...


stride 4 8 16 32 64 128 256 512
size (Kb)
1 3 3 3 3 3 3 3 3
2 3 3 3 3 3 3 3 3
4 3 3 3 3 3 3 3 3
8 3 3 3 3 3 3 3 3
16 3 3 3 3 3 3 3 3
32 3 3 3 3 3 3 3 3
64 3 3 3 3 3 3 3 3
128 4 6 9 18 20 20 20 20
256 4 6 9 18 20 20 20 20
512 4 6 9 18 20 20 20 20
1024 4 28 36 92 166 166 168 174
2048 4 28 50 94 166 167 170 178
4096 4 28 51 94 169 167 171 180
8192 4 28 50 94 169 170 171 180
16384 4 28 50 94 169 170 174 180
32768 4 28 50 94 169 170 174 180

2 cache levels detected
Level 1 size = 64Kb latency = 3 cycles
Level 2 size = 512Kb latency = 20 cycles

Quasar
2004-10-16, 13:56:14
Merkwürdig. Bei beiden Latency-Tests (v1.24 extern und v1.21 intern) will er mir erzählen, ich hätte drei Cache Level: 16k, 128k und 256k....

P3-S, wie bei mirp.

mirp
2004-10-16, 14:09:30
Dass der Test den Cache falsch erkennt, ist bei mir auch schon mal vorgekommen. Aber nach mehreren Durchläufen kamen dann doch irgendwann die richtigen Cachegrößen heraus. Manchmal sind die Werte wohl etwas an der Grenze und dann werden sie falsch interpretiert. Gerade beim Pentium III-S sind die Latenzen vom L1 Cache und L2 Cache ziemlich ähnlich. Dann reicht schon eine kleine Messungenauigkeit.

ShadowXX
2004-10-16, 14:10:23
Duron 1400Mhz (Appelbred Core)


stride 4 8 16 32 64 128 256 512
size (Kb)
1 3 3 3 3 3 3 3 3
2 3 3 3 3 3 3 3 3
4 3 3 3 3 3 3 3 3
8 3 3 3 3 3 3 3 3
16 3 3 3 3 3 3 3 3
32 3 3 3 3 3 3 3 3
64 4 3 3 3 3 3 3 3
128 5 6 13 19 24 20 21 20
256 13 30 53 96 171 175 180 182
512 15 29 53 96 176 175 176 182
1024 15 30 54 96 171 174 177 182
2048 15 29 54 102 173 176 178 185
4096 15 30 54 99 175 176 178 184
8192 15 30 54 98 174 176 178 184
16384 15 30 58 97 175 176 179 193
32768 15 30 54 98 176 180 181 187

2 cache levels detected
Level 1 size = 64Kb latency = 3 cycles
Level 2 size = 128Kb latency = 20 cycles

Lokadamus
2004-10-16, 15:55:04
mmm...

:| http://home.arcor.de/t-schuermann/Trash/CPUz124.png
Cache latency computation, ver 1.0
www.cpuid.com

Computing ...

stride 4 8 16 32 64 128 256 512
size (Kb)
1 2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2 2
4 2 2 2 2 2 2 2 2
8 2 2 2 3 2 2 3 2
16 2 3 4 10 16 15 19 16
32 2 3 4 17 17 18 17 23
64 2 3 9 11 17 18 17 21
128 3 4 9 18 19 18 18 18
256 3 4 9 18 19 19 19 19
512 3 4 9 18 20 21 22 26
1024 3 10 17 35 67 237 239 264
2048 3 10 20 39 75 282 247 263
4096 3 10 19 36 71 283 279 264
8192 3 10 18 35 68 295 281 264
16384 6 10 18 35 68 297 286 264
32768 3 10 18 39 75 262 244 265

2 cache levels detected
Level 1 size = 8Kb latency = 2 cycles
Level 2 size = 512Kb latency = 19 cycles

misterh
2004-10-16, 18:00:04
A64 3400+ @ 2520 FSB210


stride 4 8 16 32 64 128 256 512
size (Kb)
1 3 3 3 3 3 3 3 3
2 3 3 3 3 3 3 3 3
4 3 3 3 3 3 3 3 3
8 3 3 3 3 3 3 3 3
16 3 3 3 3 3 3 3 3
32 3 3 3 3 3 3 3 3
64 3 3 3 3 3 3 3 3
128 4 6 8 16 17 16 17 17
256 4 6 8 16 17 12 13 13
512 4 6 8 17 17 12 13 13
1024 4 9 14 33 63 122 126 135
2048 4 9 17 34 63 122 126 135
4096 4 9 17 34 64 123 127 136
8192 4 9 17 34 64 125 127 136
16384 4 9 17 34 64 125 129 136
32768 4 9 17 34 64 125 129 136

2 cache levels detected
Level 1 size = 64Kb latency = 3 cycles
Level 2 size = 512Kb latency = 14 cycles

Gast
2004-10-16, 20:12:35
Was man bis jetzt sehen kann:
Latenzen:

Lat L1 L2
P3 3 8
P4 2 19-20
P4 Xeon 2 20
Duron 3 20
Athlon XP 3 20 (Barton, TB)
A64 3 13-14
ConnectixCPU 2 38 (x86-CPU-Emulation)

Die Cache-Algorithmen sind auch wichtig.

Schrotti
2004-10-17, 02:29:25
Hier mein Celeron aus dem Zweitsystem.

Mfg Schrotti

PS: Hier mein Prescott.


C:\>latency.exe

Cache latency computation, ver 1.0
www.cpuid.com

Computing ...

stride 4 8 16 32 64 128 256 512
size (Kb)
1 4 4 7 4 4 4 4 4
2 4 4 4 4 4 4 4 4
4 4 4 4 4 4 4 4 4
8 4 4 4 4 4 4 4 4
16 4 4 5 4 5 5 5 4
32 6 8 11 21 28 33 33 31
64 6 8 11 21 28 27 32 28
128 6 8 10 21 29 28 32 30
256 6 8 11 21 31 30 31 30
512 6 11 11 21 33 31 31 39
1024 6 8 12 27 29 32 59 36
2048 8 8 16 29 61 138 323 362
4096 6 8 16 33 68 133 316 328
8192 6 8 16 31 70 135 359 365
16384 6 8 15 30 57 137 325 366
32768 6 8 15 29 63 144 389 337

2 cache levels detected
Level 1 size = 16Kb latency = 4 cycles
Level 2 size = 1024Kb latency = 32 cycles

EngiN
2004-10-17, 02:53:47
AMD Thunderbird 1.100mhz@1255 mHz,114 FSB, der rest unten :crazy2:

Bald bin ich den los und dann kommt der selbe test mit nem s.939 und nen 3200+ winchester :P
:ucrazy4:

BlackArchon
2004-10-17, 03:41:42
Dual Celeron 500:

Chrisch
2004-10-17, 03:50:47
Intel Pentium 4 "Northwood"

http://www.muenster.de/~ktmchris/bilder/forum/P4/123.jpg

Ma ne frage, warum hab ich 3 Level?

Gruß
Chris

Lokadamus
2004-10-17, 09:39:07
Intel Pentium 4 "Northwood"
Ma ne frage, warum hab ich 3 Level?

Gruß
Chrismmm...

Ganz simple Theorie:
Beim P4 gibt es die Möglichkeit, einen 3.Level- Cache zu besitzen (P4- EE). CPUz scheint nur die Zugriffszeit zu messen und bei dir bricht die Geschwindigkeit bei 512KB tierisch ein ( bei 2x anderen steht dort etwas von ca. 20, du bist da bei 80, was viel zu langsam für den "normalen" 2. Level Cache ist => Schlussfolgerung, du must einen 3. Cache haben. Danach "eiert" der P4 bei allen mit irgendwas von >200 rum) ...

Aqualon
2004-10-17, 19:42:36
P3-E@1GHz


stride 4 8 16 32 64 128 256 512
size (Kb)
1 3 3 3 3 3 3 3 3
2 3 3 3 3 3 3 3 3
4 3 3 3 3 3 3 3 3
8 3 3 3 3 3 3 3 3
16 3 3 3 3 3 3 3 3
32 3 4 5 7 7 7 7 7
64 3 4 5 7 7 7 7 7
128 3 4 5 7 7 7 7 7
256 4 4 5 7 7 7 7 7
512 30 49 113 188 190 194 202 211
1024 30 60 118 190 189 194 202 211
2048 29 60 118 193 189 194 202 213
4096 30 60 116 193 194 194 202 213
8192 30 60 116 191 190 195 203 214
16384 30 60 115 193 193 197 202 214
32768 30 55 115 193 193 197 202 213

2 cache levels detected
Level 1 size = 16Kb latency = 3 cycles
Level 2 size = 256Kb latency = 7 cycles

@Chrisch: Der Test reagiert sehr empfindlich auf Last durch andere Programme, also am besten alles andere beenden.

Aqua

BubbleBoy
2004-10-17, 21:18:08
..

Aqualon
2004-10-17, 21:47:24
Könnte vielleicht jemand erklären, was das Programm eigentlich genau misst? Was versteht der unter stride? Welche Bedeutung hat die size?

Aqua

Muh-sagt-die-Kuh
2004-10-17, 22:39:15
Mich interessieren die Unterschiede zwischen den verschiedenen CPU-Klassen, aber auch die der jeweiligen Evolutionsstufen, so soll z.B. der Prescott eine höhere L2-Latenz aufweisen, als der Northwood. :|
Wieso messen, wenn man sie auch nachlesen kann....

Reine L2 Latenzen (Was cpu-z misst ist L1 Latenz + L2 Latenz):

P3 Coppermine: 5 P3 Tualatin: 5 P-M Banias: 6 P-M Dothan: 7 P4 Willamette: 7 P4 Northwood: 7 P4 Prescott: 18 K7 Palomino: 8 K8 Sledgehammer: 9 C3 Ezra: 13 C3 Antaur: 11

Quellen: Sandpile.org, IA-32 Software Developer Manual, Digit-Life Platform Benchmarking with RightMark Memory Analyzer Part1-5

Quasar
2004-10-17, 22:45:16
Wenn man weiß, wo man es nachlesen kann.... :)

Muh-sagt-die-Kuh
2004-10-17, 22:49:33
Wenn man weiß, wo man es nachlesen kann.... :)Stimmt :)

Ich habe dem ersten Post gerade noch die Werte von 2 VIA CPUs hinzugefügt.

mrdigital
2004-10-17, 22:57:04
Hier mal ein Pentium-M Banias 1,6GHz. Es macht keinen Unterschied, ob Speedstep an ist oder ob auf Full Speed geschaltet ist.

Haarmann
2004-10-17, 23:42:33
Muh-sagt-die-Kuh

Trotzdem eigenartig, wie sehr sich die Messwerte von den "Sollwerten" unterscheiden...

BlackBirdSR
2004-10-17, 23:59:05
Muh-sagt-die-Kuh

Trotzdem eigenartig, wie sehr sich die Messwerte von den "Sollwerten" unterscheiden...

Dazu sollte man eben immer wissen, was ein Programm denn genau misst.
(bzw es nicht allzu ernst nehmen, wenn man es nicht weiss)

@mdsk: das mit den 7 Takten L2 Latent beim K7 kann aber nicht stimmen.
Das müssten zwischen 13-20 sein, wenn ich mich recht erinnere.

Muh-sagt-die-Kuh
2004-10-18, 01:35:57
@mdsk: das mit den 7 Takten L2 Latent beim K7 kann aber nicht stimmen.
Das müssten zwischen 13-20 sein, wenn ich mich recht erinnere.Da steht ja auch eine 8 und keine 7 ;)

Die Messungen von Digit-Life ergaben eine minimale Gesamtlatenz beim L2 Zugriff von 11 Takten für den Palomino Core, gleiches gibt Ace's in einem Artikel für den Thunderbird Core an. Abzüglich der 3 Takte für den L1 Zugriff ergeben sich eben 8 Takte reine L2 Latenz.

BlackBirdSR
2004-10-18, 11:18:55
Da steht ja auch eine 8 und keine 7 ;)

Die Messungen von Digit-Life ergaben eine minimale Gesamtlatenz beim L2 Zugriff von 11 Takten für den Palomino Core, gleiches gibt Ace's in einem Artikel für den Thunderbird Core an. Abzüglich der 3 Takte für den L1 Zugriff ergeben sich eben 8 Takte reine L2 Latenz.


Es war spät ... :rolleyes:

Hab die wichtigen teile wieder übersehen-

R300
2004-10-18, 11:43:32
Wer findet den Fehler und weiß woran es liegt? X-D

Haarmann
2004-10-18, 11:47:53
BlackBirdSR

Selbst ne "schlechte" Messung, weil unter Windows, ist mir lieber als ein Papierwert... Ich vertrau nämlich gewinnorientierten Firmen nur ungern - das betrifft dann gleich alle CPU Hersteller gleich. Es ist doch auffallend, dass eigentlich nur P3, PM und A64 irgendwo in der Gegend ihrer Angaben liegen und XP und P4 völlig daneben, obschons beim L1 ja nicht wirklich so daneben liegt. Nen Grund wirds also haben.

Nachtrag

Ich füg mal noch nen paar Werte hinzu

C3 vom EPIA-M 4 26
Celeron3 633 3 13
Willy P4 @2133 2 18
NW P4 2.53 2 18
A64 CH 3 13

Muh-sagt-die-Kuh
2004-10-18, 13:32:23
BlackBirdSR

Selbst ne "schlechte" Messung, weil unter Windows, ist mir lieber als ein Papierwert... Ich vertrau nämlich gewinnorientierten Firmen nur ungern - das betrifft dann gleich alle CPU Hersteller gleich. Es ist doch auffallend, dass eigentlich nur P3, PM und A64 irgendwo in der Gegend ihrer Angaben liegen und XP und P4 völlig daneben, obschons beim L1 ja nicht wirklich so daneben liegt. Nen Grund wirds also haben.Der Grund ist die Art und Weise, wie cpu-z die Latenzwerte errechnet.....wie das Programm es macht kann ich nicht sagen, nur dass die Werte für alles außer dem L1 nicht zuverlässig sind.

Die von mir angegebenen L2 Latenzen wurden in der Digit-Life Artikelserie zum Right Mark Memory Analyzer übrigens bestätigt, vielleicht solltest du dir diese mal ansehen.

Haarmann
2004-10-18, 14:09:47
Muh-sagt-die-Kuh

Ich hab mitem RMMA gegengetestet den P4 NW und den A64 hier. Resultate des CPU-Z waren reproduzierbar. Zu Deutsch - ich erhielt identische Resultate.

Muh-sagt-die-Kuh
2004-10-18, 16:27:03
Muh-sagt-die-Kuh

Ich hab mitem RMMA gegengetestet den P4 NW und den A64 hier. Resultate des CPU-Z waren reproduzierbar. Zu Deutsch - ich erhielt identische Resultate.Was hast du genau gemacht und welche Ergebnisse hast du erhalten? Und dass ein Ergebnis reproduzierbar ist bedeutet nicht, dass es auch richtig ist ;)

BodyLove
2004-10-18, 17:07:37
Meine Werte...

Haarmann
2004-10-18, 17:27:19
Muh-sagt-die-Kuh

Ich lud 2.41 RMMA runter. Führte aus, Microarchitekture, D-Cache Latency und schaltete von Linesize auf 512 um... Schon gibt der Graph "genau" (ist und bleibt ein Graph und keine Zahl) die 3 und 13 resp 2 und 18.

Was auch immer das heisst ist dann nen anderes Paar Schuhe, aber es zeigt mindestens das Gleiche an ;).

Muh-sagt-die-Kuh
2004-10-18, 20:49:43
Muh-sagt-die-Kuh

Ich lud 2.41 RMMA runter. Führte aus, Microarchitekture, D-Cache Latency und schaltete von Linesize auf 512 um... Schon gibt der Graph "genau" (ist und bleibt ein Graph und keine Zahl) die 3 und 13 resp 2 und 18.

Was auch immer das heisst ist dann nen anderes Paar Schuhe, aber es zeigt mindestens das Gleiche an ;).Nimm doch einfach mal die Tests zur bestimmung der minimalen D-Cache Latency....und die geht es hier nämlich.

Außerdem ist es schon sehr zweifelhaft, so lange an den Parametern des Tests rumzuspielen, bis die Ergebnisse denen eines anderen Programms entsprechen.

Haarmann
2004-10-18, 21:15:41
Muh-sagt-die-Kuh

Ich spielte nicht rum, sondern setzte den Parameter ein, der beim anderen auch genutzt wird. Wie Du dort siehst, wird dort bis 512 genutzt. Die Latenz sollte das eigentlich nicht wirklich verändern...

Und wenns änderte, dann müsste es analoge Änderungen geben. Aber genau das tritt ja nicht ein. Somit können wir uns ja auch mal mit den Änderungen befassen, wenn Dir das lieber ist.

Muh-sagt-die-Kuh
2004-10-18, 23:56:39
Muh-sagt-die-Kuh

Ich spielte nicht rum, sondern setzte den Parameter ein, der beim anderen auch genutzt wird. Wie Du dort siehst, wird dort bis 512 genutzt. Die Latenz sollte das eigentlich nicht wirklich verändern...Parameter ändern ohne deren Bedeutung zu verstehen ist rumspielen.Und wenns änderte, dann müsste es analoge Änderungen geben. Aber genau das tritt ja nicht ein. Somit können wir uns ja auch mal mit den Änderungen befassen, wenn Dir das lieber ist.Was du mir hier sagen willst ist (wie so oft) nicht klar....ein Anfang wäre, wenn du zuerst die Dokumentation von RightMark liest, bevor du darüber diskutierst.

Haarmann
2004-10-19, 10:50:07
Muh-sagt-die-Kuh

So schwer ist Stride ned zu übersetzen ;). Danach weiss man sofort, worum es sich handelt und wieso man es verändern sollt. Mit Linesize Messen ist jedenfalls sinnlos. Das Ding muss auch mit anderen Werten laufen... Alles Andere wäre zu einfach. Dann ergeben sich so lustige Sachen wie + ist schneller als -... Das nimmt ja wohl auch keiner ernst.

GloomY
2004-10-26, 00:38:22
Könnte vielleicht jemand erklären, was das Programm eigentlich genau misst? Was versteht der unter stride? Welche Bedeutung hat die size?

AquaDas Programm greift auf die in der ersten Spalte aufgeführten Datenmengen im Hauptspeicher zu. Das tut es sehr häufig und nach einem festen Muster, nämlich einer bestimmten Schrittlänge (stride). D.h. dass nachdem auf Adresse x zugegriffen wurde, auf Adresse x+stride oder x-stride zugegriffen wird.

Man bleibt aber immer innerhalb des durch Size angegebenen Datenfeld. Man sieht z.B. an den Werten mit großer Stride Zahl und kleinen Datenmengen (Mitte Rechts), dass diese komplett in den L1 bzw. L2 Cache passen. Aus den unterschiedlichen Zugriffszeiten kann man dann die Größe der Cache Level erraten.

Eine andere Sache, die man hier sieht, ist die Line Größe der einzelnen Caches. Bei sehr geringer Stride Länge liegt der nächste Zugriff wieder in der gleichen Cache Line. Daher ist in der aller erste Spalte praktisch immer nur ein einziger Wert zu finden. Man produziert quasie am laufenden Band Cache Hits durch das Ausnutzen von räumlicher Lokalität. Auch hier kann man die Load-to-Use Latency des (L1-) Caches ablesen.


Bei solchen Zahlen muss man aber immer vorsichtig sein. Moderne Prozessoren haben eine Hardware Prefetch Unit, die bestimmte Muster erkennt. Wenn diese Einheit bei einer bestimmten Stride-Länge richtig zuschlägt, kann das oftmals die Ergebnisse der Cache Latency Messungen verfälschen. Die Ergebnisse sind also grundsätzlich mit Vorsicht zu genießen.


btw: Sehr Interessanter Thread =)