PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Stabilitätsprobleme / Diagnose


liquid
2010-01-17, 17:42:58
Hallo allerseits,

als erstes mal die Aufstellung des betroffenen Systems:
Mainboard: ASRock A780GXH/128M
CPU: AMD Athlon64 X2 7750 Black Edition (mit Boxed Kühler)
Arbeitsspeicher: 2x2GB OCZ Gold Edition
Grafikkarte: XFX Radeon HD 4770
Netzteil: TSP-420 P4

Außerdem sind verbaut:
3x Festplatte (1xPATA, 2xSATA)
2x Optisches Laufwerk
1x Soundkarte (SB Live! Player 1024)

Netzteil-Daten:
|-----------------------------------------------------------------|
| | Max output | +3.3V | +5V | +12V | -5V | -12V | +5VSB |
| 420P4 | current |------------------------------------------|
| | | 26A | 42A | 18A | 0.8A | 1A | 2.5A |
|-----------------------------------------------------------------|
| | | 220W | 216W | 4W | 12W | 12.5W |
| | |------------------------------------------|
| 420W | Max combined | 400W | 28W |
| | wattage |------------------------------------------|
| | | 420 W |
|-----------------------------------------------------------------|

(direkt von der Netzteil-Aufschrift übernommen)

Ich benutze normalerweise das System unter Gentoo Linux zum Arbeiten. habe auch WinXP installiert zum Spielen.

Momentan sind unter XP (SP4 + alle aktuellen Patches) jedoch nur Mirror's Edge und PCSX2 installiert (ich spiele FFX mit dem Emulator).

Dabei treten beim PCSX2 Stabilitätsprobleme auf. Hin und wieder friert das komplette System ein. Ich habe das Problem gestern das erste Mal festgestellt. Gestern ist allerdings auch das erste Mal gewesen, dass ich den PCSX2 nach langer Zeit mal wieder im Betrieb hatte - außerdem dass erste Mal seitdem die XFX Radeon ihren Dienst im Rechner tut.

Mit einfrieren ist gemeint: Prozess bleibt stehen, Soundbuffer wiederholt sich. Affengriff hat keine Wirkung, nur Reset tut es noch.

Das System ist in keinster Weise übertaktet, Temperaturen sind recht normal (später dazu mehr). Ich sollte auch dazu sagen, dass Mirror's Edge problemlos läuft, sogar über mehrere Stunden. Allerdings war gestern nach einer Stunde PCSX2 Schluss, nach dem Reset hielt es der Emulator dann nicht einmal mehr 15 Minuten aus.

Ich habe das Netzteil im Verdacht, aber auch dazu später mehr.

Werde nachher noch ein paar mehr Tests machen. Gestern reichte es dann nur für ein paar Runden FurMark und Prime95. Keinerlei Stabilitätsprobleme dort, allerdings habe ich das ganze nicht sonderlich lange laufen lassen.

FurMark bringt die Karte auf knapp 65 Grad hoch, das sollte in Ordnung gehen. Ich habe ein Wattmeter an der Leiste wo das ganze System (samt CRT) dranhängt. Normalerweise dümpelt es im Idle so bei 300W rum, normales Arbeiten erzeugt so 330W. PCSX2 resultiert in ~370W und wenn ich FurMark+Prime95 laufen lasse, dann bekomme ich schonmal 440W zusammen.
Man muss allerdings bedenken dass an der Leiste auch der CRT hängt, der zieht vermutlich auch nochmal 100W (teste ich nachher).

Gehen wir mal davon aus, dass es Peak wirklich 340W sind. Dann könnte das ja bereits zu viel für das NT sein. Ist ja eines der alten Bauart, wo noch sehr viel Power auf der 5V Leitung liegt. Die 12V Leitung gibt ja nur 216W her - könnte evtl. zu wenig für das System sein.

Allerdings wundert es mich dann warum FurMark+Prime95 das System nicht gleich über den Jordan schicken, mit soviel mehr Verbrauch als PCSX2 (440W vs. 370W).

Was könnt ihr für Bechmarks / Torturetests vorschlagen? Ich habe mir gestern noch die Unigine Demos gezogen, da Vantage ja nur mit Vista / DX10 läuft.

Gruß,
liquid

EDIT: Der neuste AMD Catalyst ist natürlich installiert, bin sogar auf die Hotfix-Variante übergegangen als das Problem zum ersten Mal auftrat. Keinerlei Änderung jedoch.

Maorga
2010-01-17, 18:00:35
TJa Furmakr belastet 'nur' die Grafikkarte. Ein Emulator nutzt nun mal die CPU.

Dein Netzteil ist schon etwas in die Tage gekommen. Spendier deinen PC ein neues.

Biba

Maorga

Dicker Igel
2010-01-17, 18:08:05
Könnte auch an den Speicherlatenzen liegen, diese etwas "lockern", oder der RAM bekommt keine anständige Spannung -> Memtest.
Was sagt denn das Systemlog in der Ereignisanzeige ?

liquid
2010-01-17, 18:13:18
TJa Furmakr belastet 'nur' die Grafikkarte. Ein Emulator nutzt nun mal die CPU.
Deswegen lässt man ja auch gleichzeitig FurMark und Prime95 laufen. Anders hätte ich die 440W auch gar nicht hinbekommen.

Allerdings ist die Aussage "Emulator nutzt nur die CPU" hier nicht korrekt, denn GSdx (das GS-plugin, welches DX als backend nutzt) ist sehr shaderlastig, belastet also durchaus auch die Grafikkarte.

Dein Netzteil ist schon etwas in die Tage gekommen.
Wie du siehst habe ich das auch schon gesehen. Allerdings ist mir diese Vermutung momentan noch zu vage.

liquid
2010-01-17, 18:15:36
Könnte auch an den Speicherlatenzen liegen, diese etwas "lockern", oder der RAM bekommt keine anständige Spannung -> Memtest.
Ich habe als ich das System (ohne die XFX) zusammengebaut habe einen memtest über 12h durchlaufen lassen, ohne Probleme. Ich bezweifle stark dass es daran liegt. Dann müssten die Module wirklich in kürzester Zeit den Geist aufgegeben haben, und das ohne jegliches Overclocking.

Was sagt denn das Systemlog in der Ereignisanzeige ?
Du meinst wenn das System freezt? Habe ich noch nicht geguckt, aber ich denke nicht dass der Eventlog etwas davon mitkriegt, da das OS gar keine Zeit hat die Log zu flushen.

Daredevil
2010-01-17, 18:25:09
Also wo ich FFX im Emu gespielt habe mit 8x Kantenglättung war das ganze sehr GPU limitiert, hatte meist 100% GPU Auslastung und die CPU lief so bei 60% rum.

Wenn dein System nur Probleme beim FFX spielen macht, liegt es ja evtl. am Emulator selber, der das System dann einfach crashed?!
Hast du denn die neueste PCSX2 Version?

liquid
2010-01-17, 18:33:34
Wenn dein System nur Probleme beim FFX spielen macht, liegt es ja evtl. am Emulator selber, der das System dann einfach crashed?!
Der Emulator ist ein Userspace-Programm, darf also per Definition das System gar nicht freezen. Der Emulator darf ja gerne abstürzen, aber wir befinden uns ja nicht in Zeiten von Windows98 wo ein gecrashtes Programm gleich das ganze OS mitziehen kann. Und in diesem Falle solle ich ja wenigstens noch meinen Bluescreen bekommen...

Hast du denn die neueste PCSX2 Version?
Momentan läuft r2435.

Daredevil
2010-01-17, 18:38:07
Theorie und Praxis unterscheiden sich aber nun ab und an mal.
Also.... die neueste Version?

liquid
2010-01-17, 18:44:59
Nein, die neuste Version wäre nach SVN Log die r2445 - allerdings unterscheidet sich diese nur marginal von der r2435, nämlich durch PortAudio support.

Ich verfolge die Entwicklung im SVN sehr genau, hier hat sich nichts getan dass plötzlich ein "Wunder" passieren würde.

Habe jedoch einen ersten Test (ohne CRT) gemacht:
Momentan läuft FurMark und Prime95 (auf beiden Kernen), das Wattmeter pendelt zwischen 288W und 295W herum.

Jetzt wäre zu überprüfen wieviel davon über die 12V gezogen wird, und wie hoch der Wirkungsgrad des NTs ist. Setze ich mal 80% an, dann werden von System 236W gezogen. Das könnte eng werden.....

EDIT: Allerdings läuft es momentan stabil. Man sieht zwar am Prime95 Log dass auf dem ersten Core primär FurMark läuft, aber die Auslastung sollte ganz ordentlich sein. Das einzige was natürlich jetzt nicht getestet wird, ist das RAM (kein "blend test" bei Prime95 ausgewählt).

EDIT2: Der FurMark bringt die XFX auf maximal 65 Grad, ich hab ihn jetzt mal wieder ausgemacht und lasse Prime95 weiterlaufen. K10stat meldet momentan eine Kerntemperatur von 40 Grad, ich denke das ist ganz annehmbar. Was mir ein wenig Sorgen macht ist der Chipsatzkühler (kein Lüfter dort installiert), der ist nämlich knallewarm.
Das NT selbst gibt allerdings nur handwarme Brise ab...

EDIT3: Nur mit Prime95 lande ich bei circa 255W.

Lawmachine79
2010-01-17, 21:27:32
1) Dein Netzteil stammt aus Zeiten, als die 12V-Leitung noch nicht so sehr in Anspruch genommen wurde. Die starke 3.3V und 5V-Schiene helfen heutzutage nicht mehr viel.
2) Deshalb können 18A bei einem Phenom I und einer 4770 knapp werden - das Netzteil hat ja nur eine 12V-Leitung
3) Das Netzteil kann man wie folgt ausschließen: Lad' Dir OCCT runter und lass den "Power Supply Test" laufen. Starte parallel Prime95. Wenn der Rechner damit eine Stunde läuft, sollte das NT nicht der Verursacher sein (die Prozedur ist noch mal eine Ecke härter).
4) Latenzen senken kann man mal probieren. Meiner Erfahrung nach führen zu scharfe Ramsettings nicht zu so einem brutalen Hänger, daß der Sound stockt.
5) Ich kann es nicht belegen, aber meine Erfahrungswerte sind, daß diese "Totalabstürze" entweder ihre Ursache im Bereich von PCI/PCI-E und Festplattenproblemen vorkommen ODER ein Treiberproblem sind.

Dicker Igel
2010-01-17, 21:54:45
4) Latenzen senken kann man mal probieren. Meiner Erfahrung nach führen zu scharfe Ramsettings nicht zu so einem brutalen Hänger, daß der Sound stockt.


Kann schon passieren wenn der RAM während dem daddeln ned mehr "will" und die Daten im virtuellen Nirvana landen.


ODER ein Treiberproblem sind.

Ich hatte derartige Probleme mal mit einer 1950XTX unter XP und mit einer HD3870 unter Vista (jeweils nach einem Treiberwechsel), da half ein neuer DirectX Install.

liquid
2010-01-18, 01:32:26
Ich habe ein wenig im BIOS rumgefummelt und einige Optionen deaktiviert, wie z.B. ACC (Advanced Clock Calibration) und unter anderem auch CnQ.

Spiele jetzt seit ca. 4 Stunden FFX und soweit noch keinerlei Probleme. Wenn es das CnQ ist dann ist vermutlich das NT schuld, aber nicht so wie ich es erst gedacht habe. Unter Volllast scheint es ja keinerlei Probleme zu bereiten. Es könnte aber durchaus sein, dass das NT die Lastwechsel nicht verträgt.
Ich werde weitertesten und morgen mal ein paar Optionen wieder aktivieren (wie ACC), mal sehen wann sich der Freeze reproduzieren lässt.

EDIT: Wenn Daredevil Recht hat (ich habe das nicht nachgeprüft) und PCSX2 insbesondere die GPU auslastet, dann würde das erklären warum ich das Problem bis jetzt unter Gentoo nicht gesehen habe.
Ich benutze die GPU dort nur im "2D-Modus", da der r600/r700 Support in Mesa momentan noch am Reifen ist. Dementsprechend gab es dort noch keine Situation wo die GPU wirklich unter Last war und ihre volle Leistung beansprucht hat.

Das wäre jetzt unter Windows der Fall. Nehmen wir an PCSX2 lastet die GPU voll aus, während die CPU nur "sporadisch" zu tun hat, also das CnQ ständig hoch- und runterregelt. Wir haben also eine recht hohe Grundlast auf der 12V-Schiene (durch die GPU), und jetzt kommt noch dazu dass die Last der CPU ständig wechselt - wohl nicht ideal für ein Netzteil welches sowieso schon leicht am Limit läuft.

EDIT2: Haha, und falsch gedacht. Grad hat sich das System wieder verabschiedet - selbe Problematik wie oben beschrieben: Bild friert ein, Soundbuffer wiederholt sich, nur noch Reset hilft.
Ich werde dann mal morgen nicht die Settings zurückdrehen, sondern warmachine79's genanntes OCCT Programm ausprobieren.

Gast
2010-01-18, 09:54:21
also nachdem das Netzteil nur eine 12V Schiene hat, sind 18A darauf nicht so viel.

Die CPU hat ja 95W TDP, und die Grafikkarte auch ca. gleich viel, macht zusammen unter Vollast schon mal 190W, wobei aber auch noch andere Komponenten auf 12V etwas Strom brauchen, wie HD-& DVD-Laufwerke, Lüfter, etc. und schon bist über den dort max. verfügbaren 216W! Übrigens wird nicht nur in der CPU Strom verbraten, sondern auch in den Spannungswandlern dafür auf der CPU, die werden schließlich auch heiss.

Daredevil
2010-01-18, 17:57:53
Ich weiß, Netzteil ist nicht gleich Netzteil, aber ich betreibe ein Stromhungrigeres System als liquid mit einem Enermax Netzteil, welches 17A auf der +12V Schiene leistet.
Nur mal um den "Die 12V Schiene ist zu schwach" Kommentaren ein wenig entgegen zu kommen.

Peterxy
2010-01-18, 19:09:42
Würde mal unnötige Verbraucher (die 2xHDDs, opt. LW usw.) abklemmen, C&Q aussschalten und die CPU im Bios mal auf 1GHz runtertakten + undervolten. So verbraucht der PC logischerweise weit weniger und läuft das System dann stabil, wird es ev. am NT liegen. Sollte der PC mit 1GHZ Takt jedoch immer noch abstürzen, können halt auch andere Ursache noch zugrunde liegen wie ngünstige Memtimings, irgendwelche Biosssettings oder was softwareseitiges halt.

Btw. läuft auf dem Board dein Kuma als Quad? :confused:
(weil hast ja anscheinend ACC an)

liquid
2010-01-18, 20:10:57
Btw. läuft auf dem Board dein Kuma als Quad? :confused:
(weil hast ja anscheinend ACC an)
Nein bzw. ich habe den ACC-Trick zum Aktivieren der "defekten" Cores nicht ausprobiert - ich brauche ein stabiles System und den großen Nutzen aus 4 Kernen könnte ich jetzt auch nicht ziehen.

Mir ist bekannt dass das mit einigen Revisionen und dem ASRock Board gehen soll, aber wie gesagt: Nicht ausprobiert bzw. nicht interessant für mich.

Lawmachine79
2010-01-18, 21:49:49
Kannst Du den Fehler eigentlich irgendwie reproduzieren?
Und noch eine Idee: Ressourcenkonflikt? Sollte heutzutage aber eigentlich nicht mehr vorkommen.
Ich erinnere mich, daß früher IRQ-oder DMA-Konflikte unter W95/98 totale Deadlocks verursachen konnten.

liquid
2010-01-18, 23:21:24
Kannst Du den Fehler eigentlich irgendwie reproduzieren?
Nein, wenn du mit "reproduzieren" meinst: Es existiert eine Situation in der das Problem innerhalb von 5 Minuten auftaucht.

Das OCCT habe ich allerdings noch nicht getestet. Kann mir allerdings nicht vorstellen dass es damit zu reproduzieren ist (denn das Problem tritt ja auf OBWOHL das System nicht unter Volllast läuft / das NT recht wenig Leistung umzusetzen hat).

Ist tippe darauf dass das NT nicht gut auf wechselnde Lasten zu sprechen ist. Ohne CnQ konnte ich heute erneut 3 Stunden FFX spielen, hatte nebenher k10stat und GPU-Z laufen:

Man sieht was Daredevil schon gesagt hat. Die CPU dümpelt so vor sich hin, Core 1 auf circa 70% und Core 2 so bie circa 50%, alles natürlich so im Durchschnitt mit ordentlich Ausreißern.
GPU-Z liefert allerdings ein ähnliches Bild von der GPU, je nach Szene ist das eine Berg- und Talfahrt mit dem Takt.

@IRQ-Konflikte: Sollte es im Zeitalter von APIC nicht mehr geben. Ich wüsste ausserdem von keinem Problem des APIC im AMD 780G.

Lawmachine79
2010-01-18, 23:22:43
Was Du noch probieren könntest: Slot der Soundkarte wechseln.

liquid
2010-02-06, 17:10:25
Nachdem der OCCT Benchmark negativ ausfiel (ich konnte das System damit NICHT zum Freezen bekommen) und auch der Ausbau von der Soundkarte nicht half bin ich letztendlich zu dem Schluss gekommen dass ein neues NT her muss.

Es ist nun doch ein Be Quiet PurePower 530W geworden, auch wenn einige "Experten" mir davon abgeraten haben. Gestern zusammen mit neuem CPU-Kühler eingetroffen, heute alles zusammengebaut und bei der Gelegenheit den Rechner entstaubt und ausgewischt.

Nach der Umbauaktion - erste Eindrücke: Rechner ist wesentlich leiser geworden, insbesondere das NT ist wesentlich ruhiger als das alte von TSP. Auch der Sythe Mugen 2 überzeugt - CPU wesentlich kühler und sehr geringe Laufgeräusche auszumachen.

Ich habe schon ein wenig gebencht, aber bis jetzt läuft noch alles sauber. Verbrauch ist nach meinem Wattmeter auch etwas zurückgegangen, das spricht dafür dass das Be Quiet effizienter als das TSP ist (logisch, denn wie alt ist das TSP auch?!).

Werde die Kiste heute abend mal ein wenig wieder mit dem Emulator quälen, mal sehen ob ich Erfolg habe :)