PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Mysteriöses Hardwareproblem, Teil Zwei


busfahrer
2004-07-20, 23:24:59
Hi,

nachdem ich in diesem (http://www.forum-3dcenter.org/vbulletin/showthread.php?s=&threadid=156334) thread dem fehler schon auf der spur war, erwies sich die
soundkarte als fehlerquelle doch scheinbar als falsche spur.

ich habe einen AMD Athlon XP 3000+ auf einem Asus A7N8X Deluxe und 1024 MB PC 2700 DDR RAM.

Das Problem:
Wenn ich 15-30 Minuten prime95 laufen lasse (torture test, in-place large FFT's), stürzt das programm mit der fehlermeldung

the instruction at "0x..." referenced memory at "0x...". the memory could not be "read".

ab. einmal kam auch "division by zero".

wenn ich ungefähr gleichlang dnetc (http://distributed.net/) laufen lasse, bekomme ich einen bluescreen den scheinbar das modul ntoskrnl.exe verursacht hat.

Die CPU hat laut Asus Probe zu dem Zeitpunkt eine Temperatur von 52-54°C.

Ich habe den Rechner seit einiger Zeit, und am Anfang konnte ich für Tage dnetc laufen lassen, und das war soweit ich weiss noch bevor ich die beiden casefans eingebaut hab, die zur CPU hin blasen.

Ich glaube auch das 54°C für einen Athlon kein Problem darstellen, oder? ich meine mich zu erinnern dass er früher auch schonmal bis auf 60°C mit dnetc ging ohne instabil zu werden (also bevor ich die casefans hatte).

ich habe memtest86 90 minuten lang laufen lassen, es hat keinen fehler angezeigt (es waren 2,5 durchläufe ("passes")).

wenn ich starcraft spiele geht das spiel nach 10-30 minuten ins windows zurück oder zeigt einen bluescreen. q3a beendet auch nach einiger zeit oder zeigt einen bluescreen.

mein O/S ist win2k sp4, ich habe noch eine kleine partition mit einer winxp pro sp1a installation, da traten die probleme mit den spielen auch auf (wenn auch meines gefühls nach etwas später).

ich bin etwas ratlos, für tipps und/oder hinweise wäre ich sehr dankbar. :(

gruss, busfahrer

iam.cool
2004-07-20, 23:30:06
Also ab 65Grad wird meiner instabil, bei 60 solte kein Problem auftreten.

Hast du vieleicht Winamp instaqlliert? Der scheiss hat mir kürzlich wein Windoofs total zerschossen, da kam auch immer Ntoskrnl.exe blue screen..... Also Winamp deeinstallieren und mit nem Ragcleaner nochmal drüber.


Ansonsten test mal die Rams einzeln, also einen raus Prime laufen lassen, dann den nächsten. Vieleicht ist ein Ram defekt.

Auch die Spannungen mal mit Everest überprüfen, ob dein NT auch genug liefert.

MFG

busfahrer
2004-07-20, 23:59:26
also winamp hab ich drauf, benutz es aber nie. oder reicht es wenn es installiert ist?

was ist ein ragcleaner?

der ram müsste ok sein da memtest86 ja keinen fehler bringt.

das mit everest werd ich mal probieren, danke für den tipp. :)

edit: asus probe zeigt auch die spannungen an. da ich davon keine ahnung hab werd ich sie mal so wiedergeben wie sie momentan sind:

+12V: 12.416
+5V: 4.838
+3.3V: 3.296
VCore: 1.696

ist das so ok?

Weyoun
2004-07-21, 00:05:25
Original geschrieben von busfahrer
the instruction at "0x..." referenced memory at "0x...". the memory could not be "read".

Also gleich mal vorweg: Du hast eine neue Soundkarte eingebaut. Dadurch könntest du eine der Komponenten deines Rechners beschädigt haben. Wahrscheinlichster Faktor ist hier das Mainboard, du könntest es so weit durchgedrückt haben, dass eine oder mehrere Leiterbahnen auf dem Mainboard gerissen sind.

Zur Fehlersuche:
--------------------

Speichertimings und sonst alles was mit dem Speicher zu tun hat bis auf äußerste entschärfen. Ansonsten nimm die beiden Riegel raus und steck einen anderen billigen und gebrauchten rein. Pass aber auf, dass du das Mainboard nicht zu arg biegst (nicht das sich ein möglicher Fehler wiederholt)

Division by zero (Teilen durch Null) hört sich dagegen für mich wie ein Problem mit der CPU an. In diesem Fall setz unbedingt den FSB runter, wenn es geht, auch den Multiplikator. Ich weiß, das ist zwar dein Standarttakt, setz ihn aber trotzdem weit unter Standart. Im zweiten Anlauf setzt du den Vcore etwas runter, um Temperaturprobleme aussschließen zu können. Ansonsten den gleichen Ratschlag wie oben: Wenn möglich andere, billige CPU reinsetzen. Beim Verstellen deines Rechners könntest du irgendwie den Kühler deiner CPU geärgert haben, dass du den ohnehin (zur Kühlung erforderlichen) hohen Anpressdruck vom ganzen Die auf eine Ecke des Dies verlagert hast und sie abgebrochen ist. Solche Dinge hab ich schon öfter gesehen - grauenhafter Alptraum bei Lans sowas...

Wenn das Problem dennoch auftritt, kann man zu 90 %iger Sicherheit sagen, dass dein Board einen Schaden hat.

Übrigens, andere Komponenten setze ich ungern in ein System mit einem unbekannten Defekt, da diese neue Komponente auch beschädigt werden könnte. Denk also dran, wenn du noch eine Ersatz CPU zu Hause rumfliegen hast.

busfahrer
2004-07-21, 00:08:28
also andere komponenten reinsetzen geht nicht, da ich keine habe, und von freunden leihen geht auch nicht da sie es 1) garnicht machen würden weil es 2) zu gefährlich ist.

zum händler bringen kann ich das ding auch nicht da ich mir die komponenten bei ihm nur zusammengekauft hab. :(

was kann ich tun?

Alex31
2004-07-21, 00:11:51
Will ja nichts sagen, hab aber auch schon ein Soundkarte eingebaut und bisher läuft mein System noch stabil. Mag sich ja vielleicht bald ändern. Mich würde auch mal interessieren wie man Speicher einbaut, so das sich dabei das Mainboard verbiegt. Ich schraube schon etwas länger aber das habe ich bisher noch nicht geschaft.

division by zero kenn ich nur aus Java heraus, dort zeigt es meist wenn der Quellcode richtig ist, auf zerschossene Dateien bzw. von Viren zerstörte Dateien. Ich die Komponenten nach einander wechseln, da die Fehler nicht eindeutig auf eine Komponente hinweisen. Denke ich jeden falls.

:-)

iam.cool
2004-07-21, 00:14:29
Original geschrieben von busfahrer
also winamp hab ich drauf, benutz es aber nie. oder reicht es wenn es installiert ist?

was ist ein ragcleaner?

der ram müsste ok sein da memtest86 ja keinen fehler bringt.

das mit everest werd ich mal probieren, danke für den tipp. :)

edit: asus probe zeigt auch die spannungen an. da ich davon keine ahnung hab werd ich sie mal so wiedergeben wie sie momentan sind:

+12V: 12.416
+5V: 4.838
+3.3V: 3.296
VCore: 1.696

ist das so ok?


Auf 5V und 3,3V gibt dein board jeweils zu wenig, das ist zwar nur minimal aber bei belastung könnte es noch weniger werden......
Gib mal die Werte durch die an der seite deines Netzteils stehen, da müste jeweils stehn wieviel Ampere auf den einzelnen leitungen möglich sind maximal.

Ein Ragcleaner ist ein Programm das alle spuren von Programmen nach dem deinstallieren aus der Registry entfährnt, oft bleiben nach dem deinstallieren noch rest spuren zurück die Probleme verurschen können.
Ich würd Winamp deinstallieren......

Weyoun
2004-07-21, 00:15:33
Was du tun könntest, wenn du wirklich lieber einen anderen das machen lassen willst: Den Händler fragen, ob er so kulant ist und die Sachen sich mal anschaut. Er hat sicher ein paar Komponenten, die er (auf sein Risiko ;)) einbauen könnte. Kostet möglicherweise etwas.

Wenn du es dennoch selber machen willst, meine (unverbindlichen) Tipps kannst du in meinem Beitrag lesen.

Das Ding heißt REgcleaner und da http://www.chip.de/downloads/c_downloads_8830516.html kannst du es dir downloaden. Damit entfernst du alte Leichen von Software jeglicher Art, die sich seinerzeit in die Reg eingeschrieben hat.

@Axel, glaub mir, auch das haben schon einige geschafft, weil sie meinten, auf ein paar Abstandshalter, die im übrigen auch der Fixierung des Mainboards dienen, weglassen zu dürfen. Dadurch dass da dann beim Drücken kein entgegengesetzter Widerstand exestiert, lässt sich das Mobo durchbiegen.

busfahrer
2004-07-21, 00:18:18
also das netzteil ist von "be quiet!" und hat 350W. hier die werte von der schachtel (unter "max output current"):

+3,3V: 28A
+5V: 32A
+12V: 18A
-12V: 1A
-5V: 0,8A
+5VSB: 2,5A

edit: ich meine mich zu erinnern dass ich damals alle abstandshalter so gesetzt zu haben wie im handbuch beschrieben. allerdings meine ich mich auch zu erinnern dass damit nicht alle "löcher" benutzt waren.

iam.cool
2004-07-21, 00:31:27
Original geschrieben von busfahrer
also das netzteil ist von "be quiet!" und hat 350W. hier die werte von der schachtel (unter "max output current"):

+3,3V: 28A
+5V: 32A
+12V: 18A
-12V: 1A
-5V: 0,8A
+5VSB: 2,5A

edit: ich meine mich zu erinnern dass ich damals alle abstandshalter so gesetzt zu haben wie im handbuch beschrieben. allerdings meine ich mich auch zu erinnern dass damit nicht alle "löcher" benutzt waren.


Also am NT solte es nicht liegen, die ampere werte sind alle ok.

Ansonstem nimm mal einen ram aus und teste die einzeln, ich bin ziemlich sicher das ein Ram bei dir defekt ist.

PS: Falls das auch nichts bringt kann auch ein Bios update oft hilfreich sein.

MFG

busfahrer
2004-07-21, 00:37:29
ich habe afaik bios update 1007 drauf, es gibt mittlerweile 1008. da steht aber "only for pcb revision 1.04 and 1.06"... was heisst das und wie kann ich es rausfinden? :)

ist mir zwar ein rätsel warum ihr immernoch meint es seien die rams nachdem memtest86 nichts gefunden hat, aber ich werd es mal probieren sie einzeln zu testen mit prime95.

Redy
2004-07-21, 00:50:13
Original geschrieben von busfahrer
ich habe afaik bios update 1007 drauf, es gibt mittlerweile 1008. da steht aber "only for pcb revision 1.04 and 1.06"... was heisst das und wie kann ich es rausfinden? :)

ist mir zwar ein rätsel warum ihr immernoch meint es seien die rams nachdem memtest86 nichts gefunden hat, aber ich werd es mal probieren sie einzeln zu testen mit prime95.
Das heist das es nur für dei rev 1.04 und 1.06 geeigentzt ist.

Wie du rasufindest welche revision du hast ?
Steht das vielleicht irgendo auf dm PCB, habnd buch, verpackung ?

Sag mal welche version vom 3000+ hat du ? FSB 166 oder FSB 200 ?

Auch wenn memtest kein fehler anzeigt kann es ab und zu mal vorkommen, das die rams zusammen im richtigen betrieb trotzdem probleme machen.

busfahrer
2004-07-21, 00:56:56
Original geschrieben von Redy
Sag mal welche version vom 3000+ hat du ? FSB 166 oder FSB 200 ?

FSB 166

busfahrer
2004-07-21, 01:07:52
also ich hab jetzt die riegel einzeln mit prime95 (in-place large FFT's) getestet. bei dem ersten kam der gleiche fehler wie oben beschrieben (memory could not be "read"). beim zweiten kam im prime95 zigmal diese meldung:


ERROR: ILLEGAL SUMOUT
Possible hardware failure, consult readme.txt file, restarting test.


in der readme.txt ist nun zu lesen dass diese meldung bei win2k/xp systemen mit ziemlicher sicherheit auf einen hardwarefehler hindeutet.

nun bin ich verwirrt, da bei beiden riegeln fehlern auftraten, der zweite (drastischere?) aber nur bei dem einen. also sind entweder beide kaputt (was ziemlich unwahrscheinlich ist, oder?), oder es ist was anderes, vermutlich mainboard oder cpu. falls dem so ist wird mir nichts anderes übrig bleiben als zum händler zu fahren und ihn es gegen eine deftige gebühr durchtesten zu lassen (obwohl ich ja nichts dafür kann... :(), oder? dann kann ich nur hoffen dass er mir das defekte teil ersetzt, wie stehen meine chancen da?

gruss, busfahrer

Holundermann
2004-07-21, 10:02:03
die defekten teile solltest du auf garantie austauschen lassen können, sollte kein problem sein... nur erstmal muss man wissen woran das liegt...

ich würde an deiner stelle mit den rams zu deinem händler gehen, ihm deine situation erklären, diese tauschen lassen. wenn das ncihts bringt das mainboard und wenn das wieder nichts bringt die cpu... ist eine blöde situation, wenn man keine teile zum tauschen hat tut man sich schwer die fehlerquelle zu finden. da hilft nur probieren und eingrenzen. alles abstecken was man nicht braucht und dann nochmal testen. man kann bei so einem fehler eigentlich keine komponenten ausschliesen. evtl. sind auch die ide kabel defekt, oder die festplatte auf der das os installiert ist.

Schoof
2004-07-21, 13:52:07
hab deinen anderen post leider nicht gelesen (keine zeit gerade) aber erhöhe mal vcore um 1 oder 2 schritte. aber net höher als 1,8v und lass das gehäuse auf da deine cpu temp dadurch hoch geht.

busfahrer
2004-07-21, 14:46:40
Original geschrieben von Schoof
hab deinen anderen post leider nicht gelesen (keine zeit gerade) aber erhöhe mal vcore um 1 oder 2 schritte. aber net höher als 1,8v und lass das gehäuse auf da deine cpu temp dadurch hoch geht.

da die vcore sich ja nicht von allein ändert und ich sie nie verändert habe, der computer anfangs aber einwandfrei lief, kann ich das ausschliessen, oder?