PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Stresstest für neues System


robbitop
2003-09-03, 22:05:59
Ich habe meinen Eltern ein halbwechs neues System zusammen gebaut, würde allerdings gern über einen mehrstündigen Stresstest wissen, ob das SYSTEM stabil ist. (3D ist unwichtig).
Sprich: CPU und Speicher und was noch so möglich währe. Möglichst in einem Bench der ein paar h dauert. Sagt jetzt nicht SETI...damit habe ich schon mal stressgetestet und der RAM war irgendwie trotzdem nicht stabil.

ich sorge mich nämlich wegen dem RAM es sind 3x128er Bausteine....

Also danke im Vorraus für Vorschläge schonmal

Endorphine
2003-09-03, 22:24:21
http://www.memtest86.com/

CPUBurn eignet sich auch gut.

Edit: Und natürlich Prime95.

robbitop
2003-09-03, 22:29:28
wie findest du prime95?

BlackBirdSR hat es mir eben empfohlen (testet auch den Speicher)

Kakarot
2003-09-03, 22:50:03
Prime95 ist genial, testet auch den RAM auf Stabilität. Kann man gut nebenbei laufen lassen.

BlackArchon
2003-09-03, 22:58:03
Prime95 empfinde ich sogar als NOCH empfindlicher als memtest86, unbedingt empfehlenswert.

Endorphine
2003-09-03, 23:18:23
Naja, für sonderlich viel CPU-Stress sorgt Prime95 nicht gerade. Den P4 ohne SMT lastet es auf Architekturebene gerade mal zu maximal 40% aus.

Nebenbei noch BurnK7 laufen lassen und man ist bei sagenhaften 80% :) Das ist dann schon eher eine Anforderung.

Hamster
2003-09-03, 23:30:13
wenns nur um cpu geht, toast.

G-Ray
2003-09-03, 23:31:52
hi,
also prime95 hat generell eine auslastung vonn 100% auf die cpu. es ist aber wenn du einen p4 mit HT hast, nur eine auslastung von 50%.
was auch logisch ist da ja 2 cpu`s simuliert werden.
ansonsten ist das programm eigl. die ideallösung um einen stresstest zu machen.

wenns zu rundungsfehlern hierbei dann kommt, kann es sehr gut am RAM liegen. war zumindest bei mir der fall.
ich hatte vorher 2x 256 kingston hyperX (cl 2,5) und hab den nun gegen 2x 512infenion ( cl3) eingetauscht. man merkt eh den unterschied net..


bye :-)

Kakarot
2003-09-03, 23:40:43
Original geschrieben von G-Ray
hi,
also prime95 hat generell eine auslastung vonn 100% auf die cpu. es ist aber wenn du einen p4 mit HT hast, nur eine auslastung von 50%.

aber nur nach Taskmonitor...
wenn man exakte Werte zur CPU Auslastung will, dann sollte man schon PerfWatch (http://www.heise.de/ct/ftp/ctsi.shtml) benutzen.

robbitop
2003-09-03, 23:43:31
die zu testende CPU ist ein Athlon Thunderbird 1000C.
Es sind 3x PC133 Module @CL3 (für meine Ellies reicht das)

habe eben Prime95 angeschmissen

der Taskmanager sagt 97-99% Auslastung...naja wenigstens wird der Speicher auch ordendlich mitgetestet.

Ich habe mal auf "Torture Test" gestellt....ich hoffe dass der die Nacht über läuft....oder ist er vorher fertig?

Endorphine
2003-09-03, 23:45:17
Original geschrieben von G-Ray
hi,
also prime95 hat generell eine auslastung vonn 100% auf die cpu. Nein. Ich spreche hier von der Auslastung auf Architekturebene, auch "Einheitenauslastung" genannt. Da heutige CPUs intern mehr oder weniger stark parallelisieren aber (ausser bei SMT) nur je einen seriellen I/O Link haben verhungern die einzelnen Pipeline Stages oft. Von aussen ist die CPU aber dennoch zu 100% ausgelastet. Beim P4 kann man allerdings mit dem performance monitoring erbsenzähler auch die Auslastung auf Architekturebene messen. Und diese ist bei Prime95 mitnichten 100%. Maximal 40% habe ich gemessen. Kein unüblicher Wert, die meisten Benchmarks und Spiele liegen nur im Bereich von 30-40%. Original geschrieben von G-Ray
es ist aber wenn du einen p4 mit HT hast, nur eine auslastung von 50%.
was auch logisch ist da ja 2 cpu`s simuliert werden. SMT halbiert überhaupt nichts, es werden nur eventuell freie CPU-Ressourcen für einen zweiten Task/Thread genutzt. Mit SMT kann man also für eine höhere Einheitenauslastung sorgen. Original geschrieben von G-Ray
ansonsten ist das programm eigl. die ideallösung um einen stresstest zu machen. Offensichtlich mitnichten. Wenn das Programm nur für maximal 40% Einheitenauslastung sorgt wird langweilt sich die CPU eher. Mit BurnK7 komme ich auf fast 90%. Mit SMT sollte die Auslastung dann gegen 100% laufen.

Endorphine
2003-09-03, 23:48:06
robbitop,

lass mal BurnK7 nebenbei mitlaufen :) Wenn das für den K7 optimierte Programm für ~85% Einheitenauslastung auf nem Northwood sorgt sollten es auf einem K7 eher noch mehr sein :) Das stresst dann die CPU richtig.

robbitop
2003-09-03, 23:50:19
danke für den Hinweis Endorphine :)

BlackBirdSR
2003-09-04, 18:06:08
Original geschrieben von Endorphine
robbitop,

lass mal BurnK7 nebenbei mitlaufen :) Wenn das für den K7 optimierte Programm für ~85% Einheitenauslastung auf nem Northwood sorgt sollten es auf einem K7 eher noch mehr sein :) Das stresst dann die CPU richtig.

ich halte es für ein Gerücht, dass BurnX die CPU direkt in allen belangen höher auslastet als andere Programme.
Eher wird noch weniger in Sachen Funktionseinheiten und Decoder belastet als bei anderen Programmen.

BurnX soll max Wärmeproduktion erreichen, und das tut es so weit ich weiss mit einigen wenigen Befehlen für ALU und FPU, und immer den gleichen Befehlsdurchläufen. (Trace Cache ahoi)
Um eine CPU wie den P4 auf Architektureben wirklich! zu 80% auszulasten würde es ganze bestimmte konstruierte Befehlsabfolgen benötigen. Besonders bei einem P4, und schon gar nicht mit einem Tool das einen K7 ins Schwitzen bringen soll.

Muh-sagt-die-Kuh
2003-09-04, 18:21:52
SPEC CPU2000 sollte auch ein guter Stresstest sein...ist nur etwas schwer zu bekommen ;)

BlackBirdSR
2003-09-04, 18:26:23
Original geschrieben von Muh-sagt-die-Kuh
SPEC CPU2000 sollte auch ein guter Stresstest sein...ist nur etwas schwer zu bekommen ;)

hatte die C't im Zusammenhang mot Spec2000 nicht was von 40-50% erwähnt?
Ich halte a) das Tool nicht für 100% vertrauenswürdig wenn man die Auslastung als wirkliche Arbeitslast aller Funktionsbereiche definiert
und b) denke ich, kommt man ohne wirklich effizientes! SMT gar nicht mal in der Nähe einer Gesamtauslastung.

Endorphine
2003-09-04, 19:41:12
Original geschrieben von BlackBirdSR
ich halte es für ein Gerücht, dass BurnX die CPU direkt in allen belangen höher auslastet als andere Programme.
Eher wird noch weniger in Sachen Funktionseinheiten und Decoder belastet als bei anderen Programmen. Wenn die Netburst-Auslastung Peaks von ~85% erreicht, dann sind alle Einheiten des Kerns nunmal im Messzeitraum durchschnittlich zu ~85% ausgelastet gewesen =) Das ist kein Gerücht, das habe ich selbst gemessen.

Original geschrieben von BlackBirdSR
BurnX soll max Wärmeproduktion erreichen, und das tut es so weit ich weiss mit einigen wenigen Befehlen für ALU und FPU, und immer den gleichen Befehlsdurchläufen. (Trace Cache ahoi)
Um eine CPU wie den P4 auf Architektureben wirklich! zu 80% auszulasten würde es ganze bestimmte konstruierte Befehlsabfolgen benötigen. Besonders bei einem P4, und schon gar nicht mit einem Tool das einen K7 ins Schwitzen bringen soll. Tja, wenns aber nunmal so ist. Sicher, wenn man die paar Zeilen noch etwas auf SSE2 anpassen würde würde das zu mehr Auslastung führen. Dennoch ist BurnK7 das einzige mir bekannte Programm, welches auf einem SMT-losen P4 konstant so eine hohe Einheitenauslastung schafft.

Endorphine
2003-09-04, 19:46:03
Original geschrieben von Muh-sagt-die-Kuh
SPEC CPU2000 sollte auch ein guter Stresstest sein...ist nur etwas schwer zu bekommen ;) Jo, mit dem ICC auf jeden Fall, ich glaub es gibt kein Programm, was mehr auf die CPU optimiert ist als SPEC_CPU2000 - mit ICC und allen Optimierungen compiliert - *eg*

Aber erstmal SPEC_CPU bekommen :...(

BlackBirdSR
2003-09-04, 20:32:39
Original geschrieben von Endorphine
Wenn die Netburst-Auslastung Peaks von ~85% erreicht, dann sind alle Einheiten des Kerns nunmal im Messzeitraum durchschnittlich zu ~85% ausgelastet gewesen =) Das ist kein Gerücht, das habe ich selbst gemessen.



sicher, dass hier nicht die Auslastung im Sinne von "mehr Befehle kann er nicht mehr ausführen" gemeint ist?

Wenn man sich einmal die Architektur des P7 ansieht, und dann K7 optimierten Code drauf loslässt, könnte doch folgendes passieren:


der Decoder versucht verzweifelt die ankommenden Befehle zu decodieren, schafft das aber zu Beginn nicht. Nach dem ersten Durchlauf sind sie aber alle mir sehr großer Wahrscheinlichkeit im Trace Cache und der Decoder sitzt auf idle.

Die ankommenden FPU Instruktionen sind frei nach K7 manier nicht in ADD -> MUL -> ADD -> MUL etc etc Formation angeordnet. Daraus folgt, dass die FPU immer wieder aussetzer hat. 1 Takt arbeiten, 2 Takte warten etc etc.

Die ALU Befehle sind ebenfalls für die 3 ALUs des K7 ausgelegt nehme ich an. Die P4 bekommt diese nun aus dem Dispatcher und die Scheduler dürfen die Befehle nun aufteilen.
Unsere FAST-ALUs können dabei nur bestimmte Befehlesfolgen abarbeiten. Da ich nicht annehme dass der K7 diese forgesetzt bekommt, laufen die Fast ALUs wohl ziemlich nebenher. Die SLOW-ALU dagegen kommt gar nicht mit den Befehlen mit, die beim K7 von 2 ALUs bearbeitet werden.

In beiden Fällen stauen sich die Befehle in den Schedulern auf, der TraceCache muss keine 3µOps mehr an den Dispatcher schicken, der Decoder idled sowieso... und ich hab keine AHnung wie man damit eine 85% Auslastung der Funktionseinheiten erreichen will...

EInfälle?

Endorphine
2003-09-05, 00:11:32
Uhm, da müsste ich mich jetzt erst in die Performance Counter Details einarbeiten, wass der Erbsenzähler tatsächlich misst. Eins ist jedoch deutlich spürbar: eine weitaus stärkere Abwärme/Leistungsaufnahme, die sehr schön mit der Perf-Counter Auslastung zunimmt. Für mich ein starkes Indiz für auch tatsächlich vorhandene erhöhte Aktivität ggü. z.B. Prime95.

Und bitte, Source zu BurnK7:
// burnk7_2.cpp : Defines the entry point for the console application.
//

#include "stdafx.h"


int main(int argc, char* argv[])
{


unsigned long half[2]={0x7fffffff,0};
unsigned long e[2]={0xffffffff,0x3fdfffff};
unsigned long rt[2]={0xffffffff,0x3fefffff};

_asm{

finit
push ebp
mov ebp, esp
and ebp,-32
sub esp,96
fld rt
fstp QWORD PTR[ebp-40]
fld e
fstp QWORD PTR[ebp-32]
fldpi
fldpi
xor eax, eax
xor ebx, ebx
xor ecx, ecx
mov edx, half
lea esi,[eax-1]
mov [ebp-12], eax
mov [ebp-8], edx

after_check:
mov [ebp-4], 0x850000000

ALIGN 16
crunch:
fxch // CALC BLOCK
fld QWORD PTR [ebp+esi*8-24] // 17 instr / 6.0 cycles
add edx, dword ptr 04012b8h[9+esi+8*esi]
fmul QWORD PTR [ebp+esi*8-32]
faddp
dec ecx
fld QWORD PTR [ebp+esi*8-24]
dec ebx
inc DWORD PTR [ebp+esi*8-12]
sub edx, dword ptr 04012b8h[9+esi+8*esi]
inc ecx
fmul QWORD PTR [ebp+esi*8-32]
inc ebx
dec DWORD PTR [ebp+esi*8-4]
jmp $+2
fsubp st(2), st(0)
jnz crunch // time for testing ?


test ebx, ebx // TEST BLOCK
jnz int_exit
test ecx, ecx
jnz int_exit
cmp edx, half
jnz int_exit
fcom st(1)
fstsw ax
sahf
jz after_check
dec ebx

int_exit:
dec ebx
add esp,96
pop ebp
mov eax,1


}


return 0;
}

Gast
2003-09-05, 00:38:13
PassMark BurnInTest (http://www.passmark.com/products/bit.htm)
Einfach Klasse! http://www.passmark.com/shared/bit_icon48x48.gif

up

Kakarot
2003-09-06, 14:33:06
Original geschrieben von Endorphine
Nebenbei noch BurnK7 laufen lassen...
Bei BurnK7 bekommt man, eine teilweise über 80%ige Auslastung eines P4 mit SMT. Bei Prime95 und BurnK7 geht es nicht über 75% Auslastung hinaus (gemessen mit PerfWatch 1.0).

Method Man
2003-09-07, 15:36:56
wo gibts BurnK7??