PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : 7900 XTX - immer öfter Timeouts


Taigatrommel
2023-08-14, 19:10:38
Hallo zusammen, vielleicht mag noch der eine oder andere hier dunkel im Hinterkopf haben, dass meine MBA 7900 XTX eine ziemliche UV Gurke ist. Sprich selbst bei der kleinsten Spannungsverringerung kommt es zu Treibertimeouts: Spiele stürzen meistens binnen weniger Minuten ab, Bildschirm wird kurz schwarz, anschließend geht's zurück auf den Desktop "Der AMD Treiber hat ein Problem festgestellt." Als Beispiel selbst wenn ich von den regulären 1150 mV auf 1145 mV absenke, wird es instabil.

Jedenfalls läuft meine Karte nun komplett auf Default, sprich es wurde in den Leistungseinstellungen absolut gar nichts verstellt, nicht einmal Lüfter oder Powerlimit. Dennoch häufen sich bei einigen Titeln in letzter Zeit dezent die Timeouts. Aktuell sind Baldurs Gate 3 und Jagged Alliance 3 solche Kandidaten - wobei ich dazu sagen muss, dass die Timeouts nicht regelmäßig bzw. binnen kürzester Zeit auftreten, sondern eher während längeren Sessions.

Nun stellt sich die Frage: Ist es wirklich die Karte? Wenn diese ja schon bei absolut geringster Herabsetzung der Spannung instabil läuft, kann es sich hier vielleicht um eine seltene Gurke handeln, für die auch 1150 mV nicht ausreichend sind und eigentlich noch mehr benötigt? Die Temperaturen der Karte sind in Ordnung, sie ist auch keine mit einer defekten Vaporchamber.
Ein anderer Verdacht wäre mein Netzteil: BeQuiet Pure Power 850W, welches inzwischen bald sieben Jahre alt ist. Können hier Probleme mit dem Netzteil für die Timeouts verantwortlich sein? Bei meinen letzten beiden defekten Netzteilen, gab es eher eine komplette Abschaltung bzw. einen Reset des Rechners. Die Karte ist übrigens mit zwei separaten PCI-E Kabeln angeschlossen.

Ich will die Karte noch nicht einschicken, weil sich die Fehler selbst mit den Standardeinstellungen halt leider nicht ohne weiteres reproduzieren lassen, ein neues Netzteil ist diesen Monat finanziell leider auch nicht drin, sonst würde ich es ggf. vorsorglich austauschen.

BlacKi
2023-08-14, 19:25:32
brainstorming meinerseits:
hast du die möglichkeit die karte im anderen rechner zu testen?
am treiber liegts nicht?
wird die karte beim untertakten stabil oder tauchen die fehler auch dort auf?
12v spannung mit HWinfo loggen und prüfen.

Taigatrommel
2023-08-14, 19:33:09
Leider nicht, es sei denn, ich baue mir hier aus Altteilen noch einen zusammen - jedoch bleibt es dann beim gleichen Netzteil.

Die Treiber sind jedenfalls aktuell und wurden auch erst letztens mit DDU mal komplett frisch installiert.

Direktes Untertakten alleine habe ich so noch gar nicht probiert, das ist zumindest mal eine Idee. In Kombination mit dem UV jedenfalls hat es nie etwas gebracht, dort konnte ich den Takt auch auf ~2400 MHz absenken und es war trotzdem noch instabil.

anddill
2023-08-14, 19:33:55
Kann schon am Netzteil liegen. Hängt halt von vielen Faktoren ab. Wie hoch waren Betriebszeit und Last, hatten die Giftmischer in der Elko-Fabrik beim Elektrolyt anrühren einen guten Tag, ist irgend eine Komponente nicht richtig verlötet, war es lange schlecht gekühlt usw.
Kannst Du ein NT irgendwo zum Testen borgen?

BlacKi
2023-08-14, 19:57:43
was passiert beim erhöhen des powertargets? wäre es das netzteil, dann würden die timeouts zunehmen.

ich würde die spannungen mit hw info mitloggen, fällt 12v dort auf 11,75v dann ist das netzteil fertig.

Gast
2023-08-15, 02:12:05
Das hat mit dem Speicher/Speichertakt zu tun und ist ein weit verbreitetes Phänomen der RDNA3 Karten. Tritt sporadisch auf. AMD sagt dazu, das:

Verwenden Sie das AMD Bug Report Tool unter dem folgenden Link, um potenzielle Treiberprobleme zu kennzeichnen. Geben Sie dabei alle erforderlichen Informationen an, einschließlich der Schritte zur Reproduktion des Problems. https://www.amd.com/en/support/kb/faq/amdbrt...

Und das wars - still ruht der See...natürlich alles auf englisch genau erläutern. Kauf dir ne andere Karte, wenn möglich keine 7900. Mehr kann man dazu nicht sagen. Liegt wahrscheinlich an MCM/SI/VRAM, was auch immer.

Wenn es zunimmt, kanns ein sterbendes SI oder VRAM Modul sein. Die sagen dazu nichts. Ansonsten einfach eine RMA beantragen, vielleicht bekommst du dann dein Geld zurück, MBA XTX Karten zum austauschen haben sie keine. Gunst der Stunde nutzen...

horn 12
2023-08-15, 09:13:00
Rechne es sind die Treiber
Habe ja selbst eine 7900XTX und auch Red Redem. II stürzt mit 1175 mV bei mir nach 5-10 Minuten ab.

Karten werden wohl besser ausgelastet als noch vor Monaten und schauen was der August / September Treiber reist.

@edit
Gerade 1085 mV getestet und Red Redemption II lief nun 35 Minuten durch!

Exxtreme
2023-08-15, 09:30:31
Das 7 Jahre alte NT könnte auch der Grund sein, ja. Lass mal hwinfo laufen und kontrolliere die Spannungen. Das Tool merkt sich auch die Minimum- und Maximum-Spannungen. Da sieht man dann ob man temporär unter die Spannungen rutscht, die die Spezifikation vorgibt.

Taigatrommel
2023-08-15, 11:32:23
Also erstmal danke für die vielen Vorschläge, ich werde jetzt HWinfo immer im Hintergrund laufen und loggen lassen. Vielleicht ist es wirklich nur das Netzteil.

@horn 12: Die Probleme treten inzwischen nicht mehr nur mit UV auf, sondern halt auch komplett mit Werkseinstellungen, sprich Treiber -> Leistung -> Standardeinstellungen laden. Somit läuft die Karte derzeit von Haus aus gar nicht erst stabil.

gbm31
2023-08-15, 11:38:32
Ich tippe nichts.

Würde als erstes aber mal mit einem anderen Netzteil testen.

HWInfo kriegt da wohl kaum was mit, das sind kurze Spitzen. Meine 7900XTX hat ja damals auch Timeouts verursacht als sie an nur einem Kabel hing.
Von der 4090 zeigt sich das selbe Netzteil seit letztem Jahr unbeeindruckt.

Exxtreme
2023-08-15, 11:42:59
Kurze Spitzen können die Kondensatoren auffangen. Dazu sind sie z.T. auch da. Ist halt immer nur die Frage wie genau die Messsensoren auf dem MoBo sind. Hwinfo würde ich trotzdem mal laufen lassen. Schadet erstmal nicht.

Hier sind die Spannungstoleranzen, die man nicht über- oder unterschreiten darf:
https://de.wikipedia.org/wiki/ATX-Format#Spannungstoleranzen

Lehdro
2023-08-15, 16:47:20
Mal eine dumme Idee dazu:

Overvolten und PT hochnehmen. Sind die Timeouts weg, ist die Karte stock nicht mehr stabil. Nehmen die Timeouts zu, liegts wohl am Netzteil.

BlacKi
2023-08-15, 17:00:40
direktes overvolten ist glaub ich nicht möglich. aber untertakten bringt ja auch stabilität so wie ich es vorgeschlagen habe.

BlacKi
2023-08-18, 11:05:16
passend dazu
https://videocardz.com/newz/amd-releases-radeon-gpu-detective-a-tool-for-developers-to-analyze-gpu-crashes

dildo4u
2023-08-18, 11:40:50
Andere Klasse aber Igor hat hier Probleme da die Kühlung zu wenig Kontakt hat.


https://www.igorslab.de/en/amd-radeon-pro-w7600-mit-blackout-ab-werk-eine-modifizierung-schafft-abhilfe-und-wirft-fragen-auf/

Skusi
2023-08-18, 19:00:56
Kann der helfen?

https://gpuopen.com/radeon_gpu_detective_available_now/

Gast
2023-08-19, 08:08:48
Stöpsel mal alle Verbraucher ab, deaktiviere alle nicht benötigten USB-Ports usw. im Bios.
Nur eine SSD/M2 also alles auf aus, was du für den Grafikkarten Stabilitäts-Test nicht brachst.

Schau dir die Einstellungen für die Integrierte GPU im Bios an, schalte sie auf Aus sollte das gehen.

Stell die PCI-Express Anbindung der Grafikkarte von Auto auf 3/4 oder 5.

Sollte das Besserungen bringen kannst du von deinem NT ausgehen.

RoughNeck
2023-08-19, 11:00:56
Anderes NT testen oder die Karte in einem anderen Rechner testen (vom Freund z.B.).
Wenn die Karte da auch noch instabil läuft, RMA und wenn die neue kommt weh damit und eine vernünftige Karte kaufen (RTX 4080, 4090).

Exxtreme
2023-08-19, 11:08:20
Anderes NT testen oder die Karte in einem anderen Rechner testen (vom Freund z.B.).
Wenn die Karte da auch noch instabil läuft, RMA und wenn die neue kommt weh damit und eine vernünftige Karte kaufen (RTX 4080, 4090).

Auch mit einer Nvidia-Karte kannst du Stabilitätsprobleme bekommen wenn die Hardware einen Schuss weg hat. :rolleyes:

Ansonsten erfährt man leider nicht mehr viel wie es mit der Karte weitergeht und ob sich was gebessert hat.

Taigatrommel
2023-08-19, 16:22:12
Also erstmal erneut danke für die ganzen Vorschläge, ich war jetzt nicht nur einige Tage nicht daheim und konnte dementsprechend nicht viel testen. Jedenfalls ist seit meinem Posting kein einziger Timeout mehr aufgetreten, obwohl ich die gesamte Zeit HWinfo mitlaufen lasse.

Das neue AMD Tool werde ich mir auch einmal anschauen, allerdings logt es laut Beschreibung nur DX12 Titel, sprich bei JA3 könnte es tatsächlich etwas einfangen, bei BG3 aufgrund von DX11 ja wohl eher nicht.

Die Spannung erhöhen ist bei RDNA3 leider absolut nicht möglich, sprich diese ist nach oben auf den Standardwert von 1,15 V gedeckelt.

GaryX
2023-08-21, 12:13:11
Hallo. Als ich meine 6900xt damals gekauft hab, da hatte ich täglich ctd, immer im msfs 2020. Ich wollte es beinahe schon aufgeben, manchmal nach 5min manchmal erst nach 20, sporadisch eben. Es wurde mir vieles geraten, board scheisse, Netzteil, allgemeine instabillität usw. Am Ende war es eine Verkettung mehrerer Fehler, Bios, Firmware VR Headset, Fehler im msfs und auch der Treiber von AMD selbst. Bis das dann endlich stabil war vergingen 1,5 Jahre 😂 im AMD Treiber am lüfter rumschrauben war immer eine der Ursachen. Mittlerweile läuft das Ding sehr stabil, Netzteil umsonst gewechselt. Viel Erfolg!

Exxtreme
2023-08-21, 12:28:25
Ja, den Lüfter etwas aggressiver kühlen lassen kann Instabilitäten beheben. Meine alte RX 5700XT wurde ab 100°C instabil. Die Standard-Lüfterkurve liess sie aber 103°C warm werden was auch Timeouts und CTDs verursachte. Dann habe ich die Lüfterkurve so angepasst, dass es kaum über 94°C ging und voila. Was auch noch Instabilitäten beheben kann ist den PCIE-Port, in dem die Grafikkarte steckt von PCIE4 auf PCIE3 zu setzen. Die ersten AM4-Chipsätze hatten Schwierigkeiten damit.

GaryX
2023-08-21, 13:16:23
Ja, den Lüfter etwas aggressiver kühlen lassen kann Instabilitäten beheben. Meine alte RX 5700XT wurde ab 100°C instabil. Die Standard-Lüfterkurve liess sie aber 103°C warm werden was auch Timeouts und CTDs verursachte. Dann habe ich die Lüfterkurve so angepasst, dass es kaum über 94°C ging und voila. Was auch noch Instabilitäten beheben kann ist den PCIE-Port, in dem die Grafikkarte steckt von PCIE4 auf PCIE3 zu setzen. Die ersten AM4-Chipsätze hatten Schwierigkeiten damit.

Ich hatte genau das Gegenteil gemeint, immer wenn ich in den lüftereinstellubgen rumgefingert hab hatte der wattman nach kurzer Zeit einen Schlaganfall und hatte alles resettet. 🤔

RoughNeck
2023-08-21, 14:03:29
MorePowerTool nutzen, dann muss man im Treiber nix pfuschen und die Einstellungen bleiben.

HOT
2023-08-21, 14:30:29
Das 7 Jahre alte NT könnte auch der Grund sein, ja. Lass mal hwinfo laufen und kontrolliere die Spannungen. Das Tool merkt sich auch die Minimum- und Maximum-Spannungen. Da sieht man dann ob man temporär unter die Spannungen rutscht, die die Spezifikation vorgibt.

Nach eigener Erfahrung kann ich sagen: Ja Netzteil ist ziemlich wahrscheinlich. Die N31 sind sehr anspruchsvoll bei NTs. Ich hatte auch zunehmend Abstürze, aber ich wusste schon, dass das am uralten Seasonic Netzteil lag. Ausgetauscht gegen ein billiges Pure Power 12M 850W und zack nicht mehr ein Absturz.

dargo
2023-08-21, 14:32:37
MorePowerTool nutzen, dann muss man im Treiber nix pfuschen und die Einstellungen bleiben.
Witzbold... MPT + RDNA3 nix Zusammenspiel. ;)

Die N31 sind sehr anspruchsvoll bei NTs.
Halte ich für ein Gerücht. Keine Probleme hier gehabt mit einem Seasonic 650W. Oder was bedeutet bei dir anspruchsvoll? Und wenn du schon vom uralten Seasonic sprichst... auch NTs altern. Kann noch gut gehen, muss aber nicht. ;)

RoughNeck
2023-08-21, 18:56:12
Witzbold... MPT + RDNA3 nix Zusammenspiel. ;)

Dachte das geht Mittlerweile.
Ist da die Entwicklung eingestellt worden oder schiebt AMD da einen Riegel vor?

BlacKi
2023-08-21, 19:05:55
igor hat schon als beteiligter gesagt, das es nicht kommen wird.

Hier geht es am Ende auch nicht mehr nur um Urheberrechtsverletzungen, sondern das Aufbrechen einer Sicherheitsstruktur, die die betroffene Hardware im ungünstigsten Fall auch sehr anfällig für den Zugriff Dritter oder von Schadsoftware machen würde.

https://www.igorslab.de/stellungnahme-vom-team-kein-morepowertool-mpt-fuer-rdna3-und-die-gruende/

dargo
2023-08-21, 20:21:56
Ist da die Entwicklung eingestellt worden oder schiebt AMD da einen Riegel vor?
Letzteres.

Taigatrommel
2023-10-30, 13:16:55
Ich wollte jetzt doch mal ein Update zu der ganzen Sache geben, weil ihr ja auch zahlreich Tipps gegeben habt, nochmals danke dafür. Um es kurz und knackig zu machen:
Seit einem der 23.9 Treiber habe ich keine Timeouts mehr, egal ob nun in BG3 (wobei Vulkan da nach wie vor mehr als suboptimal ist), Cyberpunk, Jagged Alliance 3 oder jetzt aktuell z.B. auch in Alan Wake 2.

Das hat zwar am UV Verhalten der Karte nichts geändert, sprich diese ist nach wie vor nicht gegeben, doch zumindest @Stock läuft aktuell wieder alles stabil.

horn 12
2023-11-01, 01:53:38
Sage ja die 7900 XTX Karte IST SOWAS VON STABIL
und Treiberprobleme KEIN EINZIGES Mal.

Könnte aber etwas besser laufen bei Alan Wake 2 ,- aber dies wird schon noch!

dman
2023-11-01, 19:06:42
Hier mit ner 6900XT vor 2 Tagen Alan Wake Treiber installiert und dann fing die Misere an...auf einmal Blackscreens(auch beim surfen),neustart war die Lösung.
Dann wieder Blackscreen und nachdem Neustart wurde Adrenalin nicht mehr erkannt bzw. geladen..hööö...blick in die Anzeigeeinstellungen und dann stand da "6900XT Unbekannt",keine Auflösung,keine Hz wählbar,nix.

O.k,Treiber nochmal drübel bügeln dacht ich mir,aber pustekuchen,installation hat mit Fehler abgebrochen weil keine unterstützungsfähige Karte eingebaut ist:eek:....guuuut,dann muß DDU ran,also abgesichter Modus,Treiber weggehauen,neustart,Treiber wieder frisch drauf und zack,blackscreen forever...nichtmal mehr Bios Screen wurde angezeigt.Jawoll,was soll das denn:confused:

"DP+HDMI-Kabel-Eingänge" alles durchprobiert und getauscht,nix,Karte tot.

Dann Graka raus/rein + Cmos Reset(mit Custom Wakü natürlich ne 1h Aktion) und tadaa,zumindestens schonmal wieder ein Bild.Treiber rauf und die Kiste läuft wieder 1a.;D

Meine Vermutung ist das das AFMF Treiber + WHQL Treiber rumgetauche inkl. Win Updates es irgendwann zuviel wurde fürs System.

Naja,jetzt läuft wieder alles.:smile: