PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : RTX 4090 System Freezes und VRAM-Instabilitäten => Defekt?


Nasenbaer
2023-04-02, 20:58:13
Hi,
ich seit kurzem Probleme mit der Systemstabilität. Fing kurz nach der Installation der aktuellen Nvidia-Treber 531.41 an. Beim Start jedes Spiels ist nach weniger als einer Minute das gesamte System eingefroren. Ich hatte meine Windows 10 Installation im Verdacht (gab bereits andere Macken) und hab das System daher komplett neu mit Windows 11 aufgesetzt.

Zusätzlich AMD Chipsatz Treiber ( v. 5.02.19.2221, 28.2.2023) und wieder die nvidia 531.41 Treiber installiert. Und wieder das gleiche. Satisfactory, Resident Evil 4 Remake, 3D Mark Timespy bringen das gesamte System zum Stehen. Auch verschiedene ältere Treiber ohne Erfolg probiert.

Mit OCCT dann die Stabilität getestet. Alles stabil, auch der 3D-Test. Aber VRAM-Test hängt das System immer nach einigen Minuten.
Dann mit dem Hersteller-Tool den VRAM-Takt um 1GHz reduziert, keine Probleme mehr - auch nicht mit -333 Mhz. Auch Spiele laufen dann wieder. Beim -66 Mhz gings aber wieder los.


Mein System:
MSI MEG X570 Ace (UEFI mit AGESA ComboAm4v2PI 1.2.0.8)
AMD Ryzen7 58003D
32GiB RAM 3600MHz
Zotac RTX 4090 Trinity OC

Besitze die Karte seit Anfang des Jahres und hatte vor wenigen Wochen Subnautica über 90h durchgespielt und nie Probleme gehabt. Selbiges sorgt nun aber auch für einen System freeze direkt beim Start.

EDIT: Im Memory-Dump vom Absturz steht immer nvlddmkm.sys als IMAGE_NAME drin - also Nvidia GPU Treiber. Hab testweise nochmal wieder frisch Windows 10 installiert und die Probleme bleiben.

Hat die Karte womöglich einen Defekt?

Exxtreme
2023-04-02, 21:13:27
Könnte die Karte sein, könnte aber auch das Netzteil sein. Mit untertaktetem RAM frisst sie weniger Strom und kann sein, dass das Netzteil das noch packt.

Nasenbaer
2023-04-02, 23:15:20
Der OCCT Leistungstest lief problemlos durch - der setzt auf maximale Leistungsaufnahme mit ~100W CPU und 450W GPU. Auch beim OCCT 3D Standardtest nimmt die Graka 420-450W auf und stürzt nicht ab.

Aber wenn ich das Powerlimit auf 50% setze, dann läuft der VRAM weiterhin mit 10500MHz aber ich habe keine Freezes mehr. Dann vielleicht doch eher das Netzteil?

Hab ein Corsair HX1200i und das hat schon ein paar Jahre auf'm Buckel.

sapito
2023-04-03, 01:44:47
Der OCCT Leistungstest lief problemlos durch - der setzt auf maximale Leistungsaufnahme mit ~100W CPU und 450W GPU. Auch beim OCCT 3D Standardtest nimmt die Graka 420-450W auf und stürzt nicht ab.

Aber wenn ich das Powerlimit auf 50% setze, dann läuft der VRAM weiterhin mit 10500MHz aber ich habe keine Freezes mehr. Dann vielleicht doch eher das Netzteil?

Hab ein Corsair HX1200i und das hat schon ein paar Jahre auf'm Buckel.


Informier dich bitte einmal was LASTSPITZEN sind. Du könntest aber auch den VRAM unter tackten


PS: das sys/ die PSU würde schlicht abschalten wenn eine Schutzschaltung anspringt > nix freeze oder so

Nasenbaer
2023-04-03, 07:54:26
Ich hab schon ein grobes Verständnis davon was Lastspitzen sind. Die kann ich aber schlecht messen und daher kann ich dazu keine Infos teilen, ob und wenn ja wie hoch diese sind.

Und ich kann nicht sagen wie Schutzschaltungen im Detail funktionieren und ob diese hier überhaupt von Belang sind oder bei dem Szenario gar nicht zum Tragen kommen.
Genau darum frage ich in einem Hardware-Hilfe-Forum um Rat. ;)

Jedenfalls bin ich jetzt genauso schlau wie vorher. :/

Lowkey
2023-04-03, 08:49:02
Ich tippe mal auf die Karte an sich. Vielleicht liegt ein Designfehler bei der Speicherkühlung vor? Vllt ist bei der Montage etwas verrutscht? Vllt wurde die Karte zu wenig gekühlt in Kombination mit Last und Designfehler?

In jedem Fall klingt es nach den Testversuchen nach einer defekten Karte und die sollte man nun austauschen lassen.

gogetta5
2023-04-03, 08:51:42
Am besten wäre es immer einen Kreuztest zu machen. Dh. du baust die Karte in einen anderen PC ein, falls du denn die Möglichkeit hast. Damit kann man den Fehler eingrenzen.

Ansonsten wurde ja schon gesagt an was es liegen kann.
Die Schutzschaltungen greifen erst ab einer bestimmten Grenze und wenn die Spannung mal etwas zu niedrig ist bzw. das NT nicht die erforderliche Leistung liefern kann für einen sehr kurzen Moment (im Bereich von Milisekunden) stürzt dein Spiel ab.
Die Tools wie OCCT legen immer die maximale Last an, die aber stabil bleibt. In Spielen hat man sehr viel mehr wechselnde Lasten, was Fehler schneller zu Tage führt.

Zusammengefasst kann man sagen entweder das Netzteil oder die Grafikkarte selbst, was man aber am ehesten mit Eingangs erwähnten Kreuztest herausfinden kann. Und ja, soweit waren wir schon. Nur ist es jetzt vielleicht verständlicher warum.

gbm31
2023-04-03, 10:33:00
Nachdem sich letztens das Pico von meinem HTPC verabschiedet hat, würd ich nach der Erfahrung sagen, daß es nicht am NT liegt.

Dann würde der Rechner nehme ich an wie bei mir einfach plötzlich neu starten.

Bei mir fing es mit sporadischen Neustarts an, nach jahrelangem stabilen Betrieb manchmal über Tage hinweg, wenn meine Kids bei mir übernachtet haben.

Entschärfen der Speichereinstellungen hat kurzzeitig geholfen.

Bis der Rechner nicht mal mehr idle laufen wollte. Ein kurzer Test mit meinem Notnetzteil zeigte dann normalen Dauerbetrieb mit den ursprünglichen Einstellungen. Da wars dann eindeutig.

Hast du eine andere Grafikkarte oder ein anderes Netzteil oder kannst jemanden fragen, der sein Zeug für dich ausbauen würde (trotz des Aufwands und des Risikos...)

Oder deine Karte woanders einbauen?

Exxtreme
2023-04-03, 10:43:41
Also ich hatte NT-Probleme, die sich so geäussert hatten. Ein altes NT schaffte die Spannungen auf einigen Leitungen nicht mehr. Sprich, statt 12V waren es öfter 11,7V etc. Das äusserte sich mit sporadischen Neustarts, Treiberresets oder plötzlicher Klötzchengrafik etc.

Ich glaube, mit HWInfo kann man die Netzteilspannung protokolieren. Da würde man das sehen wenn die Spannung zu stark abfällt.

Und ja, es kann natürlich auch sein, dass die Grafikkarte einen Schuss weg hat.

Rolsch
2023-04-03, 10:44:23
Wenn die Karte so hart abstürzt wird die VRM für den Speicher defekt sein. Da hilft nur Tausch. Bei Zotac hat man ja 5 jahre Garantie.

minisale
2023-04-03, 10:57:30
Verrückt, ich besitze eine Trinity 4090 non OC und habe die selbe Problematik.

Da ich nicht glauben konnte, dass es an der GraKa liegt, habe ich so gut wie alle Komponenten ausgetauscht bzw. gegen getestet, ohne Erfolg.

Bis vor kurzem konnte ich das Problem umschiffen, in dem ich den Speicher um 500MHz reduziert habe. Mittlerweile funktioniert dies nun auch nicht mehr.

Ich werde die Karte diese Woche bei Media-Markt reklamieren.

Langlay
2023-04-03, 15:57:08
Also ich hatte NT-Probleme, die sich so geäussert hatten. Ein altes NT schaffte die Spannungen auf einigen Leitungen nicht mehr. Sprich, statt 12V waren es öfter 11,7V etc. Das äusserte sich mit sporadischen Neustarts, Treiberresets oder plötzlicher Klötzchengrafik etc.

Ich glaube, mit HWInfo kann man die Netzteilspannung protokolieren. Da würde man das sehen wenn die Spannung zu stark abfällt.


Mir ist letztes Jahr mein Seasonic Netzteil abgeraucht. Und ich hatte auch mit HWinfo die Sensorwerte in da Logfile mitgeloggt und dort war z.b. nichts zu erkennen. Aber das mit dem Netzteil war eh komisch, der ist halt nicht bei Vollast abgeraucht sondern beim Lastwechsel. Und das war bei mir ähnlich wie bei GBM31. Am Anfang hatte ich 1 Absturz alle paar Wochen wo mir die Ursache nicht ganz klar waren. Und irgendwann hat EVE Online mit Framelimiter ausgereicht um die Abschaltung auszulösen.

Nasenbaer
2023-04-03, 21:21:34
@gogetta5
Danke für die Erläuterung, das hat geholfen.

Danke auch an alle Anderen!

Ich hab's vorhin mal im Rechner meines Mannes mit BeQuiet PurePower 1000W probiert - da bootet die Karte gar nicht erst. :biggrin:
Bei meinem PC war die 12V Spannung erstmal unauffällig. Interessant find ich, dass mit Quiet-BIOS der Karte, welches laut Hersteller nur die Lüfterkurve anpassen soll, deutlich stabilier läuft (Taktraten und GPU Spannung waren auch gemessen identisch).

Da mir der dicke 12VHPWR-Adapter auf 4x PCIe ohnehin auf den Keks geht, hab ich jetzt erstmal ein Bequiet Dark Power 13 1000W bestellt - das ist dann wenigstens direkt ATX 3.0 konform und spart ne Menge Kabelsalat.
Karte tausche ich sonst danach - bei Notebooksbilliger ohnehin gerade erst im Zulauf.

Ich werde dann berichten, ob es wirklich am Netzteil lag oder ob ich doch noch die Karte tauschen musste.

Nasenbaer
2023-04-20, 22:53:31
Hi nochmal,
hab jetzt seit über einer Woche das neue Netzteil drin und seitdem keinen Crash mehr gehabt. Grafikkarte scheint also nicht das Problem gewesen zu sein.

Natürlich nochmal danke für eure Tipps!

Nasenbaer
2023-05-08, 20:41:04
Ich muss nochmal ein Update nachschieben:

Die Grafikkarte lief ca. 2 Wochen völlig problemlos ohne jegliche Abstürze. Danach stürzten Spiele erst vereinzelt und wenige Tage später wieder mit kompletten System-Freeze ab.

Habe daher jetzt die 4090 gegen eine von INNO3D mit AiO getauscht und seitdem erstmal wieder keine Probleme. Daumen drücken, dass es so bleibt. :D

Lawmachine79
2023-06-13, 17:00:01
Hier ist der nächste mit der Zotac 4090 Trinity OC und dem gleichen Fehlerbild, auch zuerst Netzteil getauscht.

Zuerst vereinzelt Crashes in DCS, Modern Warfare 2 und Automobilista 2. Jedes Mal blieb das Bild stehen oder der Monitor wurde schwarz. Der Sound lief manchmal weiter, manchmal nicht. Bei AMS 2 war danach sogar noch der Crash zu hören.

Beim Reboot kriege ich dann 3-4 Versuche lang einen Bluescreen (Watchdogviolation). Er ist auch schon 1-2 mal am Desktop hängengeblieben. und es waren vereinzelt - so 5-6 - kleine schwarze senkrechte Balken zu sehen; jeder ca. einen halben Zentimeter breit und zwei lang (bei 55").

System Shock z.B. kann ich z.T. aber stundenlang spielen, da sind aber max 150W auf der Karte.

Ich tippe die Graka ist defekt. 6 Monate rum, also Abwicklung über Garantie...

Ric
2023-06-13, 17:31:47
Nur als kleiner Hinweis: Die Beweislastumkehr wurde schon vor geraumer Zeit auf ein Jahr verlängert (§ 477 Aba. 1 S. 1 BGB).

Könnte im Zweifel helfen, aber Garantie dürfte schneller sein.

Grüße

Daimon
2023-06-13, 18:00:23
Mit OCCT dann die Stabilität getestet. Alles stabil, auch der 3D-Test. Aber VRAM-Test hängt das System immer nach einigen Minuten.
Dann mit dem Hersteller-Tool den VRAM-Takt um 1GHz reduziert, keine Probleme mehr - auch nicht mit -333 Mhz. Auch Spiele laufen dann wieder. Beim -66 Mhz gings aber wieder los.

Zu spät gesehen, dass es tatsächlich das NT war, aber wer Geld für eine 4090 abdrückt, der sollte auch Geld für ein NT haben, dass mit der neuen GPU nicht überfordert ist :freak:

Informier dich bitte einmal was LASTSPITZEN sind. Du könntest aber auch den VRAM unter tackten

PS: das sys/ die PSU würde schlicht abschalten wenn eine Schutzschaltung anspringt > nix freeze oder so

Besorg dir bitte einen Duden, Jemand der "Takt" nicht schreiben kann, sollte nicht von Transienten schwurbeln :freak:
Die Schutzschaltung vom Netzteil würden nur greifen, wenn OCP (zu viel Ampere auf 12V), OTP (NT wird zu heiß) oder UVP (zu wenig Volt auf einer Schiene) zutreffen würde.

Wenn aber das Netzteil pauschal nur 100A auf 12V liefern kann, weils nur eine 12v Schiene hat (die wiederrum auf 4x 8-Pin ATX verteilt wird, von denen dann 4x auf 1x 12VHPWR adaptiert werden), dann reicht es, wenn das Netzteil einfach nur "alt" ist und 10-15% seiner Leistung eingebüßt hat, um die Grafikkarte nicht ausreichend versorgen zu können.
Vor allem, wenn da noch andere Verbraucher im System hängen. Mainboard/CPU z.B. wollen auch über 12V 1x 24-Pin ATX und 2x 8-Pin EPS gefüttert werden.

Lawmachine79
2023-06-13, 19:54:31
Nur als kleiner Hinweis: Die Beweislastumkehr wurde schon vor geraumer Zeit auf ein Jahr verlängert (§ 477 Aba. 1 S. 1 BGB).

Könnte im Zweifel helfen, aber Garantie dürfte schneller sein.

Grüße
Oh! Na das ist mal ein Top-Hinweis - und ich als Jurist weiß das nicht mal :D.

Aber wieso sollte die Garantie schneller sein? Computeruniverse muss mir doch eine neue zur Verfügung stellen oder die alte reparieren.

Kann ich irgendwelche Teile der Graka, z.B: den VRAM dediziert prüfen? Geht beim Systemspeicher ja auch.

r3ptil3
2023-06-13, 20:08:51
Den 5800X3D würde ich mal genauer anschauen.

Ist Curve Optimizer, RAM Tuning oder sowas aktiv?

Starte mal AIDA64, Systemstabilitätstest, "Stress FPU" und 10 Min laufen lassen.

crux2005
2023-06-13, 20:23:19
Kann ich irgendwelche Teile der Graka, z.B: den VRAM dediziert prüfen? Geht beim Systemspeicher ja auch.

Gibt eigentlich nur OCCT VRAM Test.

Ric
2023-06-13, 22:46:52
Oh! Na das ist mal ein Top-Hinweis - und ich als Jurist weiß das nicht mal :D.

Aber wieso sollte die Garantie schneller sein? Computeruniverse muss mir doch eine neue zur Verfügung stellen oder die alte reparieren.

Kommt ja darauf an wie der RMA Prozess beim Hersteller ausgestaltet ist und es bei direkter Abwicklung schneller geht. Schaltet den Zwischenschritt Händler aus.

Der Händler wird im Zweifel die Karte auch beim Hersteller einschicken um den Mangel bestätigen zu können. Ergebnisorientiert sollte der schnellere Weg gewählt werden.

Mal Garantiebedingungen abklären und dann entscheiden.

Die Entscheidung erübrigt sich, wenn die Garantie auch über dem Händler abgewickelt wird. Wenn sowohl Garantie und Gewährleistung gleichzeitig in Frage kommt und über den Händler abgewickelt wird, dann aber Gewährleistung geltend machen, da die Rechte in Regel günstiger sind, als die frei bestimmbaren Garantiebedingungen.

Grüße

Lawmachine79
2023-06-16, 08:55:59
Es liegt übrigens am VRAM. Wenn ich die Karte mit -500 Mhz VRAM im Afterburner betreibe, läuft sie stabil. Oft kackt der Rechner aber vorher ab, und zwar genau in dem Moment, in dem der Grafiktreiber geladen wird (kurz bevor die Logon-Aufforderung erscheint.

joe kongo
2023-06-17, 13:10:31
Kann auch sein das die VRAM Versorgung emfindlicher auf 12V Schwankungen reagiert als diejenige für die GPU, und sich dort dann erste Probleme zeigen.
Hilft aber niemanden wirklich, wenn es vorher lief.

Zur Sicherheit täte ich dennoch die Steckverbindungen auf Wärmeentwicklung kontrollieren, hatte selber mal ein Problem mit
diesen doch recht billigen Steckverbindungen und Spannungseinbrüche, 2 Kontakte hatten das Steckergehäuse angeröstet
und die Stifte in der Buchse der Graka dunkel verfärbt.

Gast
2023-06-20, 13:14:24
Geh mal auf PCIE 3.0. Dann müssten die Instabilitäten weg sein.

Exxtreme
2023-06-21, 09:05:26
Geh mal auf PCIE 3.0. Dann müssten die Instabilitäten weg sein.

Nicht unbedingt. Wenn der RAM einen Schuss weg hat dann hilft PCIe 3 nichts. :)

Lawmachine79
2023-06-22, 21:49:16
Geh mal auf PCIE 3.0. Dann müssten die Instabilitäten weg sein.
Habe ich natürlich versucht, ist ja der erste Gedanke in einem AMD-Board. Aber das hat nicht geholfen.