PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Kurioses Grafikstottern - woher kommt es? Was meint ihr?


Midnight3DC
2016-02-09, 17:41:01
Seit ca. einem dreiviertel Jahr habe ich ein seltsames Problem mit meiner Asus Strix 670 GTX (4GB Variante). In Spielen, die die 3D Beschleunigung der Grafikkarte verwenden, kommt es gelegentlich zu den im Titel erwähnten Grafikstottern. Dabei friert das Bild komplett ein, der Mauszeiger lässt sich nicht mehr bewegen und auch der Sound bleibt "stecken". Diese "Standbildphase" wird alle paar Sekunden für kurze Momente mit "Normalphasen" unterbrochen, bei denen wieder alles funktioniert und sich auch der Mauscursor wieder bewegen lässt. Dadurch ist es sogar möglich den PC mit etwas Geduld wieder geregelt herunterzufahren oder neu zu starten. Generell lässt sich das Problem nur durch einen Neustart wieder beheben - bleibt also auch im normalen Desktopbetrieb bestehen nachdem es einmal aufgetreten ist. Besonders ärgerlich war außerdem, dass das Problem so unberechenbar und nicht gezielt reproduzierbar war. Manchmal ist es schon nach 5 Minuten im Spiel aufgetaucht andere Male erst nach einer Stunde und gelegentlich auch nach mehreren Stunde gar nicht.

Meine erste Idee war, dass sich CPU oder GPU überhitzen, was dazu führt, dass diese sich zum Eigenschutz kurzfristig stark untertakten. Das lies sich allerdings schnell als Ursache ausschließen, da keine von beiden sonderlich heiß wird und das Problem Stellenweise auch bei weniger Anspruchsvollen Spielen (Battle Worlds Kronos, Shadowrun Returns um mal zwei Beispiele zu nennen) aufgetreten ist. Generell hatte ich im Zuge einer Aufrüstung so ziemlich jede Hardwarekomponente außer der Grafikkarte bereits ausgetauscht und auch das Betriebssystem (ursprünglich Windows 7, inzwischen Windows 10) mehrfach sauber neu aufgesetzt, verschiedene Treiberversionen getestet, den Speicher mit Memtest86+ gecheckt und so ziemlich alles ausprobiert was mir eingefallen ist.

Vor vielleicht 1-2 Monaten hatte ich dann eine interessante Beobachtung gemacht. Beim spielen von Dragon Age: Inquisition hatte ich reproduzierbar mit den gleichen Grafikeinstellungen stark voneinander abweichende fps, wie ihr an den Screenshots unten sehen könnt.

Bad performance
http://i.imgur.com/V8WhFvnl.jpg (http://i.imgur.com/V8WhFvn.jpg)

Good performance
http://i.imgur.com/ZCGRXItl.jpg?1 (http://i.imgur.com/ZCGRXIt.jpg)

Diese Performance blieb auch bei Neustarts des Spiels immer gleich, erst ein kompletter Neustart des Computers ergab dann die Chance auf eine Änderung. Da ich natürlich nicht bei schlechter fps spielen wollte bin ich also dazu übergegangen den PC solange neuzustarten, bis ich in den "good performance" Zustand gekommen bin. Dies hat zur weiteren Erkenntnis geführt, dass auch das "Stotter" Problem offensichtlich nur im "bad performance" Zustand auftritt.

Weitere interessante Beobachtungen in diesem Zusammenhang sind:

Bei einem Kaltstart - also nachdem der PC für einen längeren Zeitraum geruht hat (z.B. morgends nach dem Aufstehen oder Abends nach der Arbeit) ist der erste Zustand bisher eigentlich immer der "bad performance" Zustand. Der erste Neustart danach ist dagegen fast immer (würde sagen gut 80% der Fälle) der "good performance" Zustand.
Als ich den PC einmal zu einem Freund mitgenommen habe um ihm ein Spiel vorzuführen und wir den PC dazu per HDMI an seinen TV angeschlossen haben, gab es reproduzierbar im "bad performance" Zustand ganz üble Soundprobleme, die im "good performance" Zustand so nicht aufgetreten sind. Diese Soundprobleme gab es bei Spielen, Youtube oder per VLC abgespielten Videos, nicht aber bei den normalen Windows System Sounds.
Wie schon an den Screenshots oben zu erkennen ist, sind nicht nur die fps deutlich niedriger sondern schwanken insbesondere auch die frametimes deutlich stärker im "bad performance" Zustand. Hier noch einmal deutlich zu erkennen: bad (http://i.imgur.com/jdFcrGA.jpg) / good (http://i.imgur.com/qqIKWbI.jpg).


Nun ist das Ganze für mich inzwischen (zum Glück) eher nur noch von Akademischen interesse, da ich ohnehin vorhabe mir mit der Polaris/Pascal Generation eine neue Grafikkarte zu besorgen und ich nun ja auch weiß, daß ich das Problem durch die Neustarts unter Kontrolle bringen kann. Trotzdem bin ich ja jetzt etwas neugierig was die Grafikkarten Experten des 3DC Forums dazu sagen.

Godmode
2016-02-09, 17:47:03
Wenn du sagst die Temperatur etc. ist alles in Ordnung, dann könnte es ein Bitcoinmining Virus sein. Ein Bekannter von mir hatte genau dieses Problem. Seltsam ist halt, das es nach dem Neustart dann wieder funktioniert. Hast du die Karte mal in einem anderen Rechner probiert?

Lowkey
2016-02-09, 17:48:49
Das wird ein interessantes Ratespiel:

1. Ich würde das Spiel zunächst von einer SSD/HDD starten, auf der nicht das OS ist. Ich habe da meine Erfahrungen mit Diablo 3 fast ein Jahr gehabt.

2. Ich tippe aber vielmehr auf einen Wackelkontakt beim PCI-E (es kann auch der CPU Sockel sein). Irgendwo besteht kein 100% Kontakt. Das erklärt das Problem mit dem Neustart.

Midnight3DC
2016-02-09, 18:27:33
Wenn du sagst die Temperatur etc. ist alles in Ordnung, dann könnte es ein Bitcoinmining Virus sein. Ein Bekannter von mir hatte genau dieses Problem. Seltsam ist halt, das es nach dem Neustart dann wieder funktioniert. Hast du die Karte mal in einem anderen Rechner probiert?
Jain. Ich habe quasi meinen kompletten PC - also Mainboard, RAM, CPU, Gehäuse, Netzteil seit dem ersten Auftreten des Problems ersetzt, was man wohl als "testen in einem anderen Rechner" werten könnte. :wink:
Wenn es ein Bitcoinmining Virus wäre (höre ich heute zum ersten mal), dann frage ich mich wie dieser die diversen System neuinstallationen überstanden haben soll bzw. wie ich ihn nachweisen und entfernen könnte.

Das wird ein interessantes Ratespiel:

1. Ich würde das Spiel zunächst von einer SSD/HDD starten, auf der nicht das OS ist. Ich habe da meine Erfahrungen mit Diablo 3 fast ein Jahr gehabt.

2. Ich tippe aber vielmehr auf einen Wackelkontakt beim PCI-E (es kann auch der CPU Sockel sein). Irgendwo besteht kein 100% Kontakt. Das erklärt das Problem mit dem Neustart.
1. Problematisch, da ich nur eine 1 TB SSD eingebaut und in 2 Partitionen (System und Games) unterteilt habe. Filme, Musik etc. sind auf einen kleinen Fileserver ausgelagert.
2. Die Karte aus- und wieder eingebaut habe ich schon und das Mainboard kann es eigentlich ja nicht sein, da ich das wie gesagt schon ausgetauscht habe und es wohl hochgradig unwahrscheinlich ist, dass es unabhängig voneinander bei 2 Mainboards nacheinander aufgetreten ist.

Bizi
2016-02-09, 18:47:12
Im "schlechten" Modus mal per gpuz geschaut, welcher PCIe Modus anliegt?

HTB|Bladerunner
2016-02-09, 18:47:54
Hattest Du mal die Sata-Kabel getauscht? Ein ähnliches Phänomen hatte ich schon mit schlecht abgeschirmten/verlegten Sata-Kabeln beobachtet. Zwischendurch blieb halt das komplette System für ein paar Sekunden stehen.

ux-3
2016-02-09, 19:07:19
Bilder bitte spoilern!

N0Thing
2016-02-09, 19:19:15
Screenshots von einem Tool wie GPU-Z, Nvidia Inspector, etc. mit den Taktraten und Temperatur der GPU im bad performance Modus fände ich interessant.

-/\-CruNcher-/\-
2016-02-09, 22:21:37
Du solltest dir auch mal den gesammten Frostbite Graph einblenden nicht nur die die GPU Frametime, es kann genauso möglich sein das in dem Moment etwas die CPU belastet und das Rendering zum Einstürzen bringt (Background task)
Frostbites Debug Graph ist sehr genau um solche Fluktuationen in Windows auch im DX Exclusive Mode festzustellen sollte man komplett nutzen zur eigenen System Analyse :)

Es kann auch eine Funktion im Treiber sein dessen Overhead du gerade beobachtest mit Frostbites Graph konnte man sehr gut Nvidias AA Gama Corection overhead analysiseren z.b :)

Auch wenn du Reshade und Co einsetzt lässt sich der Overhead sehr leicht und genau feststellen mit dem Graph :)


Frostbites Internes Debuging ist wohl eines der Empfindlichsten DX Engine Internen überhaupt und noch genauer als wie Afterburner selbst eben mit dem Vorteil auch den DX Exclusive Mode mit sehr wenig eigen Overhead abzudecken (exzelente Windows Low Level Programmierung) ;)

Vor allem im Non Exclusive Mode findet man da jeden störer im System ;)

Lowkey
2016-02-10, 09:33:11
1. Problematisch, da ich nur eine 1 TB SSD eingebaut und in 2 Partitionen (System und Games) unterteilt habe. Filme, Musik etc. sind auf einen kleinen Fileserver ausgelagert.
2. Die Karte aus- und wieder eingebaut habe ich schon und das Mainboard kann es eigentlich ja nicht sein, da ich das wie gesagt schon ausgetauscht habe und es wohl hochgradig unwahrscheinlich ist, dass es unabhängig voneinander bei 2 Mainboards nacheinander aufgetreten ist.


Dieses von dir beschriebene Problem trat in ähnlicher Forum mit D3 auf, dass wiederholt stehengeblieben ist. Die Ursache wurde gut ein Jahr später gefunden: speicherlast auf der Windows Partition. Dann gab es wohl ein Update oder Patch für Windows. Einige hatten den Fehler immer noch und die Lösung war es, dass man das Spiel auf ein anderes Laufwerk verschiebt.

Aber in deinem Fall würde ich immer noch auf den PCI-E tippen. Eventuell läuft er sichtbar im PCI-E x8 1.0 Modus? Eventeull ist auch ein Pin im CPU Sockel nicht ganz kontaktfreudig?

Midnight3DC
2016-02-10, 20:48:15
So, habe jetzt einmal Screenshots mit laufendem nVidia Inspector im bad und good performance Zustand gemacht:

Bad:
http://i.imgur.com/Psv79atl.jpg (http://i.imgur.com/Psv79at.jpg)
Good:
http://i.imgur.com/dIkAGPMl.jpg (http://i.imgur.com/dIkAGPM.jpg)
PCIe Modus ist in beiden Fällen 3.0 @ 3.0x16 - sollte also passen. Einzige Auffälligkeit ist, dass die Karte nur auf ca. 75% power läuft obwohl weder ein Thermisches- noch ein Stromverbrauchsproblem erkennbar ist. Wobei sich hier natürlich die Frage stellt, ob das Ursache des oder eher Wirkung eines anderen zugrundeliegenden Problems ist.

Generell vermute ich schon stark, dass es an der Grafikkarte liegt und nicht an einer anderen Hardwarekomponente wie z.B. der CPU oder den Kabeln. Dort hätte sich das bei den ganzen Umbauarbeiten sicher irgendwann einmal erledigt gehabt. Des Weiteren sollte ich vielleicht noch anmerken, dass es in einigen seltenen Fällen vorgekommen ist, dass sich der Grafiktreiber komplett aufgehängt und neu gestartet hat und sich das Problem damit (zeitweilig) auch gelöst hatte. Soll heissen: der PC war vermutlich immernoch im bad performance modus, die Standbilder waren aber fürs erste wieder weg. Die Fehlermeldung hatte dabei explizit auf den Grafiktreiber referenziert und ich meine sie besagte irgend etwas über einen Kernel Neustart o.ä.

Ich will hier jetzt auch nicht zuviel Aufwand (System neu aufsetzen, CPU + Kühler aus und wieder einbauen etc.) zur Fehlerdiagnose betreiben - dafür ist mir der Leidensdruck jetzt doch nicht groß genug. Ich bin einfach nur neugierig, was die geballte 3DC Kompetenz hier so als Problemursache sehen. :biggrin:

Midnight3DC
2016-02-10, 20:51:16
Du solltest dir auch mal den gesammten Frostbite Graph einblenden nicht nur die die GPU Frametime, es kann genauso möglich sein das in dem Moment etwas die CPU belastet und das Rendering zum Einstürzen bringt (Background task)
Frostbites Debug Graph ist sehr genau um solche Fluktuationen in Windows auch im DX Exclusive Mode festzustellen sollte man komplett nutzen zur eigenen System Analyse :)

Es kann auch eine Funktion im Treiber sein dessen Overhead du gerade beobachtest mit Frostbites Graph konnte man sehr gut Nvidias AA Gama Corection overhead analysiseren z.b :)

Auch wenn du Reshade und Co einsetzt lässt sich der Overhead sehr leicht und genau feststellen mit dem Graph :)


Frostbites Internes Debuging ist wohl eines der Empfindlichsten DX Engine Internen überhaupt und noch genauer als wie Afterburner selbst eben mit dem Vorteil auch den DX Exclusive Mode mit sehr wenig eigen Overhead abzudecken (exzelente Windows Low Level Programmierung) ;)

Vor allem im Non Exclusive Mode findet man da jeden störer im System ;)
Gibt es dazu eine Befehlsreferenz oder hast du da bestimmte console commands im Sinn?

x-force
2016-02-10, 20:54:09
könnte noch eine hintergrundlast sein.
hdmi soundprobleme sprechen auch dafür
irgendwas blockiert da wohl zwischendurch mal alles

chipsatztreiber usw ordentlich installier?

aufkrawall
2016-02-10, 21:12:42
Mit perfoverlay.drawgraph 1 sollte auch der CPU-Graph angezeigt sein. Wenn nicht, schau mal, was dir die Konsole im Spiel so für Befehle für perfoverlay anbietet. Da sollte einer für den CPU-Graphen dabei sein.
Wenn der Treiber aber ein vollständiges GPU-Limit meldet, so wie hier der Fall, würde ich es als unwahrscheinlich erachten, dass etwas anderes als die Grafikkarte oder der Treiber dafür verantwortlich sind.

Edit: Das Netzteil kanns natürlich auch immer sein.

Midnight3DC
2016-02-10, 21:31:03
könnte noch eine hintergrundlast sein.
hdmi soundprobleme sprechen auch dafür
irgendwas blockiert da wohl zwischendurch mal alles

chipsatztreiber usw ordentlich installier?
Na ja, woran würde ich denn erkennen das sie nicht korrekt installiert sind? Eigentlich bin ich schon der Meinung das da alles ordentlich installiert ist. Hatte wegen dieser Vermutung in der Anfangszeit auch einmal viel mit speziellen Intel Treibern herumexperimentiert - was aber alles nicht geholfen hat.

Mit perfoverlay.drawgraph 1 sollte auch der CPU-Graph angezeigt sein. Wenn nicht, schau mal, was dir die Konsole im Spiel so für Befehle für perfoverlay anbietet. Da sollte einer für den CPU-Graphen dabei sein.
Wenn der Treiber aber ein vollständiges GPU-Limit meldet, so wie hier der Fall, würde ich es als unwahrscheinlich erachten, dass etwas anderes als die Grafikkarte oder der Treiber dafür verantwortlich sind.

Edit: Das Netzteil kanns natürlich auch immer sein.
Das Netzteil habe ich erst kürzlich sowieso austauschen müssen, da da alte den Geist aufgegeben hatte. Der CPUgraph ist in der Tat normalerweise auch dabei - hatte ich bewusst ausgeblendet, da ich die Information nicht so wertvoll fand. Ich kann aber gerne auch noch einmal neue Screenshots machen. Gibt es sonst noch Details, die die Frostbite Engine hergibt und ich einblenden sollte?

aufkrawall
2016-02-10, 21:38:26
Ich denke nichts, was wirklich interessant wäre.
Das Problem kann aber auch mit einer komplett anderen Spiele-Engine auftreten?

Midnight3DC
2016-02-10, 23:05:32
Ich denke nichts, was wirklich interessant wäre.
Das Problem kann aber auch mit einer komplett anderen Spiele-Engine auftreten?
Ja, der GPU-Graph der Frostbite Engine von DA:I ist nur der bisher einzige mir bekannte Weg zuverlässig zu erkennen, ob sich mein PC gerade in einem bad oder good performance Zustand befindet. Der Unterschied der FPS ist mir bei anderen 3D Spielen/Anwendungen so noch nicht aufgefallen (was nicht bedeutet, dass er so nicht existiert). Ich hatte das Problem z.B. erst vor ein paar Tagen wieder einmal, als ich vergessen hatte mit DA:I zu testen, mit dem vergleichsweise anspruchslosen Spiel Shadowrun: Hong Kong. Dabei handelt es sich noch nicht einmal um ein richtiges 3D Spiel, es nutzt die GPU m.W. nur für einige einfache Effekte vor einem gezeichnetem 2D Hintergrund. Bei einem solchen Spiel fällt es natürlich nicht auf, wenn die Karte nur 30% der eigentlich möglichen FPS packt.

edit: Die Engine von Shadowrun: Hong Kong bzw. Returns basiert offensichtlich auf der Unity Engine.

Midnight3DC
2016-02-11, 09:52:43
Habe heute beim durchgehen der Frostbite console commands während des bad performance Zustands wieder einmal das Stotterproblem gehabt und konnte einen Screenshot davon machen.

http://i.imgur.com/reNgK5Ql.jpg (http://i.imgur.com/reNgK5Q.jpg)
Leider ist mir das System diesmal komplett abgestürzt (Rechner hat sich von alleine neu gestartet) bevor ich mehr Screenshots mit anderen Graphenoptionen machen konnte. Auffällig wäre hier, dass - zumindest zum Zeitpunkt des Screenshots - das Power Feld des nVidia Inspectors komplett ausgegraut war.

Wie man an den max Zahlenwerten für die Frametimes übrigens gut erkennen kann dauern die Aussetzer jeweils gut 10s (nehme an die Angaben sind in ms).

Noebbie
2016-02-11, 10:01:19
Ich meine in Erinnerung zu haben, dass ich ähnliche Probleme mal mit einer Soundkarte hatte. Allerdings war da bei den Standbildern auch immer ein Kratzen dabei so wie leichtes Knistern bei normalem Verhalten.

Hast du vllt iegendwelche Treiberprobleme bzgl Soundkarte?

Vllt auch mal an die Intel Chipsatztreiber denken und die updaten!

Screemer
2016-02-12, 11:10:21
die cpu-spikes sind ja mal :ugly:.

irgendwas macht da deiner cpu ganz schön zu schaffen. ich dachte ja ich hatte in bf4 cpu-spikes aus der hölle aber das toppt alles. kannst mal ein meinen thread damals schauen. ich konnte das ganze mit deaktivieren von coreparking aus der welt schaffen. hier wirds zwar wieder rufer geben die behaupten, dass das gar nicht sein könnte. mir hat es geholfen. betraf mich damals nach dem umstieg von 4c/4th auf 4c/8th, respektive 2500k auf 2600k.

http://www.forum-3dcenter.org/vbulletin/showthread.php?t=563559

mein erster ansatz wäre mal mit dem ressourcenmonitor zu schaun, was die cpu dermaßen auslastet. würde mich auch nicht wundern, wenn es der index-dienst von windows wäre. das problem hatte ich auch mal. sollte eigentlich nur im hintergrund mit niedriger prio laufen und aus sein, wenn der pc gunutzt wird. lief aber die ganze zeit und lastete platten und cpu aus.

Thomas Gräf
2016-02-12, 13:48:25
Oha is wohl ein etwas ärgeres Problem.
Ich selbst nutze seit jahren "Prozess Lasso" , damit lassen sich solche Dienste die den PC systematisch niederringen ermitteln.
Nehme die Software um in Games immer volle Reaktionsfähigkeit und Rechenpower zu behalten.
Aber wiegesagt es zeigt die "Bösewichte" nicht nur auf, Du siehst halt auch Echtzeit was passiert.

http://winfuture.de/downloadvorschalt,3250.html

Midnight3DC
2016-02-12, 15:42:28
Ich meine in Erinnerung zu haben, dass ich ähnliche Probleme mal mit einer Soundkarte hatte. Allerdings war da bei den Standbildern auch immer ein Kratzen dabei so wie leichtes Knistern bei normalem Verhalten.

Hast du vllt iegendwelche Treiberprobleme bzgl Soundkarte?

Vllt auch mal an die Intel Chipsatztreiber denken und die updaten!
Die Soundkarte hatte ich auch schon in Verdacht. Der Sound hört während des Standbilds auch nicht auf sondern bleibt - soweit ich das beurteilen kann - einfach auf einer Tonlage stecken (sehr unangenehmes Geräusch!). Im prinzip ein Audio-Standbild. Ich konnte/wollte das damals nicht testen, weil ich keine andere Soundkarte zur Verfügung, noch nicht die Methode zum feststellen des bad/good performance Zustands und keine Lust hatte ggf. Stundenlang ohne Audio zu leben, wenn das Problem mal gerade nicht auftreten will.
Inzwischen habe ich ein Headset mit eingebauter Soundkarte und weiß wieso ich manchmal tagelang keine Probleme damit hatte - insofern könnte ich das jetzt natürlich noch einmal testen. Aber...
die cpu-spikes sind ja mal :ugly:.
Nicht wahr? Deswegen wollte ich euch das ja auch nicht vorenthalten! :biggrin:
irgendwas macht da deiner cpu ganz schön zu schaffen. ich dachte ja ich hatte in bf4 cpu-spikes aus der hölle aber das toppt alles. kannst mal ein meinen thread damals schauen. ich konnte das ganze mit deaktivieren von coreparking aus der welt schaffen. hier wirds zwar wieder rufer geben die behaupten, dass das gar nicht sein könnte. mir hat es geholfen. betraf mich damals nach dem umstieg von 4c/4th auf 4c/8th, respektive 2500k auf 2600k.

http://www.forum-3dcenter.org/vbulletin/showthread.php?t=563559

mein erster ansatz wäre mal mit dem ressourcenmonitor zu schaun, was die cpu dermaßen auslastet. würde mich auch nicht wundern, wenn es der index-dienst von windows wäre. das problem hatte ich auch mal. sollte eigentlich nur im hintergrund mit niedriger prio laufen und aus sein, wenn der pc gunutzt wird. lief aber die ganze zeit und lastete platten und cpu aus.
Ich bin mir ziemlich sicher, dass es nicht an der CPU sondern eben an der Grafikhardware liegt, wo ein Hardwarefehler dem Treiber soviel Stress bereitet, dass es zu diesen Aussetzern kommt. Der Ressourcenmonitor hatte IIRC auch keinen wirklich Aufschluss darüber gegeben was das Problem verursacht. Wahrscheinlich merkt dieser nicht einmal etwas davon, da er selbst mit-stillsteht, wenn es wieder einmal zum Standbild kommt. Es ist z.B. auch nicht möglich per STRG+ALT+ENTF den Task Manager zu öffnen, während ich gerade ein Standbild habe. Es lassen sich aber Tastaur und Mausbefehle queuen, die dann abgearbeitet werden sobald ich mal wieder die Sekunde Normalität habe.
Aber ich wollte ja eure Einschätzung des Problems haben, da ist es vermutlich unproduktiv diese mit der Argumentation abzulehnen, das ich das nicht für Wahrscheinlich halte. :tongue:
In diesem Sinne werde ich dann wohl trotzdem bei Gelegenheit noch einmal schauen, ob ich auch einen Screenshot mit Ressourcenmonitor hinbekomme wenn das Problem wieder auftritt.
Oha is wohl ein etwas ärgeres Problem.
Ich selbst nutze seit jahren "Prozess Lasso" , damit lassen sich solche Dienste die den PC systematisch niederringen ermitteln.
Nehme die Software um in Games immer volle Reaktionsfähigkeit und Rechenpower zu behalten.
Aber wiegesagt es zeigt die "Bösewichte" nicht nur auf, Du siehst halt auch Echtzeit was passiert.

http://winfuture.de/downloadvorschalt,3250.html
Hmm, schaue ich mir einmal an. Vielleicht in Kombination mit dem Ressourcenmonitor. Der Vorschlag schlägt ja auch irgendwie in dieselbe Kerbe.

Noch einmal zur Klarstellung meinerseits: Natürlich kommen die Standbilder von CPU-Last Spikes. Ich glaube nur, dass die Ursache darin liegt das der Grafiktreiber die CPU in regelmäßigen Abständen in ein Quasi-Deadlock versetzt, aus der sie nur alle ca. 10s einmal kurz ausbrechen kann (vielleicht eine Art Fallbackmechanismus im Treiber, der die Bearbeitung des problematischen Befehls/Tasks/Threads/Whatever einfach selbst killt?) nur um eine Sekunde später wieder reinzulaufen. Aber das ist natürlich jetzt nur Spekulation meinerseits.

Achill
2016-02-12, 16:35:11
Midnight3DC - wie ist den deine genaue System-Spec? Also CPU, MB + BIOS, RAM, NT, ...

Aus deiner Beschreibung entnehme ich:
1. Es gibt System-Starts, wo das "Bad-Performance" Problem auch über Stunden spielen nicht auftritt. Richtig?
2. Neustarts/Reboots beheben das Problem. Ist es ein Reboot oder ein richtiges Aus/Ein?

Weitere Fragen:
1. Es tritt nur bei Spielen auf? Oder auch bei reiner CPU-Last? Wie sieht ein Mix von CPU-Last und Video-Playback inkl. Audio aus?
2. Memtest86 von einen Boot-Medium laufen lassen?
3. Wie Verhält sich das System bei starker GPU-Last (Furmark/Kombuster)?
4. Wie läuft ein aktuelles Live-Linux auf dem System?

Thomas Gräf
2016-02-12, 16:39:35
Habe nit Lasso auch wunderbar den Star Citizen download Manager entlarven können.
Der hat auch das ganze System geentert.
Da wird halt jede Anwendung jeder Dienst auf Reaktionszeit in ms angezeigt.
Gibt es fatale Hanger kommt der gelbe Balken als Graph.

-/\-CruNcher-/\-
2016-02-12, 17:04:14
Das letzte mal hab ich solche temporären spikes mit Einführung des Compute Shader Tiled Rendering in Frostbite gesehen (die nicht auf 3rd Party Code auf der CPU zurückzuführen waren) auf Nvidia Fermi und Kepler bevor Nvidia wie verrückt gepatched hat und erst mit Maxwell wurde es dann ordentlicher wobei man bei z.b Ryse auch nochmal hand anlegen musste da zu sehr GCN Compute Optimiert ;)

Aber deine Spikes sind wirklich extreme übel hmm du solltest mal eine Prozess und treiber analyse durchführen ob hier irgend ein Treiber/Prozess zu hohe DPCs und Hardpage faults verursacht.

http://www.resplendence.com/whysoslow_beta

http://www.resplendence.com/latencymon

Midnight3DC
2016-02-12, 17:45:37
Midnight3DC - wie ist den deine genaue System-Spec? Also CPU, MB + BIOS, RAM, NT, ...

Aus deiner Beschreibung entnehme ich:
1. Es gibt System-Starts, wo das "Bad-Performance" Problem auch über Stunden spielen nicht auftritt. Richtig?
2. Neustarts/Reboots beheben das Problem. Ist es ein Reboot oder ein richtiges Aus/Ein?

Weitere Fragen:
1. Es tritt nur bei Spielen auf? Oder auch bei reiner CPU-Last? Wie sieht ein Mix von CPU-Last und Video-Playback inkl. Audio aus?
2. Memtest86 von einen Boot-Medium laufen lassen?
3. Wie Verhält sich das System bei starker GPU-Last (Furmark/Kombuster)?
4. Wie läuft ein aktuelles Live-Linux auf dem System?

CPU: Intel Core i5-4460 @ 3.20GHz (also nicht übertaktet)
RAM: 16 GB in Form von 2x Kingston ValueRAM DIMM 8 GB DDR3-1600 (KVR16N11S8K2/8)
MB: Asus Z97-A (Bios Version: 2401 x64 Date: 04/24/2015)
OS: Windows 10 Education (x64)
NT: beQuit! L8-CM-530W

Zu den Fragen:
1. Habe ich jetzt so noch nicht getestet, da ich üblicherweise keine Lust habe Stundenlang DA:I bei 14 fps zu zocken. Ein zwingender "Beweis" dafür das es im bad Zustand nicht passiert ist auch schwer zu erbringen. Wenn es 5h gut läuft könnte es ja trotzdem sein, dass es nach 5h und 1m plötzlich passiert. Eine Zuverlässige Methode das Problem reproduzierbar herbeizuführen habe ich leider noch nicht herausgefunden.
2. Tatsächlich scheint ein "Neustart", wie ihn Windows versteht das Problem in 4 von 5 Fällen zu beheben. Ich hatte es aber auch schon erlebt, dass ich 4-5x neu starten musste, bis ich im good Zustand war. Dabei wäre anzumerken, dass es durchaus noch so mediocre Zustände gibt, wo der GPU-Graph von DA:I zwar Ausreißer hat, diese aber signifikant seltener sind wie das im Screenshot zu sehen ist (was sich dann auch in einer Framerate irgendwo zwischen den 14 und 40 fps niederschlägt). Ob es bei einem Kaltstart (also Herunterfahren und dann neu Anschalten) so auch immer passiert wäre noch zu überprüfen.

Zu den weiteren Fragen:
1. Nein, es tritt - soweit ich das feststellen konnte - generell nur bei Programmen auf, die die GPU verwenden. Belasten ist hier eigentlich der falsche Ausdruck. Wie gesagt es ist schon bei denkbar wenig fordernden Spielen vorgekommen (Stichwort: Shadowrun Returns). Interessant ist dabei allerdings, dass nachdem es einmal aufgetreten ist, auch die Beendung des Spiels den Fehler nicht mehr behebt.
2. Ja, von einer Bootbaren CD.
3. Habe ich jetzt nicht mehr getestet seit ich per DA:I zwischen good und bad performance Zustand unterscheiden kann. Meine Vermutung wäre allerdings: kann im bad Zustand genauso passieren wie in den Spielen selbst und wird im good Zustand problemlos stundenlang laufen. Werde ich aber auch bei Gelegenheit noch einmal prüfen wobei auch hier wieder gilt: ein Positivbeweis im good Zustand natürlich ist nicht wirklich möglich.
4. Wäre zu testen.

N0Thing
2016-02-12, 18:37:56
Was du mit NT meinst ist mir nicht klar :confused:

Damit ist das Netzteil gemeint. ;)

-/\-CruNcher-/\-
2016-02-12, 18:46:47
Also das der Strom gerade kurzeitig so wenig ist das die GPU nicht crashed aber die Leistung fällt hab ich selbst noch nie gesehen :)

Midnight3DC
2016-02-12, 19:28:29
Damit ist das Netzteil gemeint. ;)
Ahh, ok ist ein beQuit! L8-CM-530W Netzteil (habe es oben reineditiert).
Das Netzteil selbst halte ich allerdings für einen noch unwahrscheinlicheren Kandidaten wie die restlichen Komponenten, da ich das Problem hier nicht nur mit 2 sondern sogar 3 verschieden Netzteilen hatte. Das beQuit! ist jetzt erst ein gutes halbes Jahr alt.

Thomas Gräf
2016-02-12, 20:14:29
Wieauchimmer, welche Hardware bringt die Software zum Straucheln?
Oder andersherum, welche Software tut das mit Deiner Hardware?
Wenn Du Hardware Fehlfunktionen ausschließt bleibt nur noch... ;)

Midnight3DC
2016-02-12, 21:02:30
Wieauchimmer, welche Hardware bringt die Software zum Straucheln?
Oder andersherum, welche Software tut das mit Deiner Hardware?
Wenn Du Hardware Fehlfunktionen ausschließt bleibt nur noch... ;)
Wieso meinst du ich würde eine Hardware Fehlfunktion ausschließen? Ich halte eine Hardware Fehlfunktion der Grafikkarte für die Wahrscheinlichste Ursache (deshalb auch der Post in diesem Forum!).

gedi
2016-02-12, 22:53:08
Lade im Mobo-Bios mal die Default-Settings und probiere neu. Wenn dies nicht hilft, deaktiviere im Mobo-Bios alle Systemkomponenten wie Sound, BT usw. um zu versuchen den Fehler einzugrenzen. Außerdem würde ich in die tRFC-Latenz um 20% nach oben korrigieren.

Kann es sein dass der Fehler erst auftrat, nachdem du das Mobo-Bios aktualisiert hast?

Achill
2016-02-13, 00:58:08
Weitere Ideen/Fragen:
- Die Intel iGPU ist deaktiviert im Bios, nicht das sich da etwas in die quere kommt?
- Das CPU thermal throttling im Bios deaktiviert, um eine "Fehlfunktion" des Temp. Sensors in der CPU aus zu schließen?

Thomas Gräf
2016-02-13, 00:58:13
Wieso meinst du ich würde eine Hardware Fehlfunktion ausschließen? Ich halte eine Hardware Fehlfunktion der Grafikkarte für die Wahrscheinlichste Ursache (deshalb auch der Post in diesem Forum!).

Nein, ich meinte wenn es so ist.
Der gedi emphiehlt ja nun das was eigentlich "Satz" ist wenn man kuriose Probs
hat. Also ganz klar zuallererst die Hardware in die Zange nehmen...über das BIOS. Den Hardware Erkenner vor dem Herrn...auf gut deutsch gesagt. ;)

-/\-CruNcher-/\-
2016-02-13, 09:48:25
Also erstens mal läuft da Beta Windows 10 da sehe ich erst mal primär Software im Target nicht Hardware :D

Am besten Windows 10 elimenieren zu Windows 8/7 zurück und stabilität testen wenn man kein genaues Software Debuging durchführen möchte.

Wenn die Probleme weg sind Windows 10 wieder drauf und erneut testen tretten die Probleme wieder auf ohne irgendwelche 3rd Party Software weiss man das das Problem bei Windows 10 innerhalb der Hardware Konfiguration liegt.

Sobald man das sichergestellt hat kann es weiter gehen ;)

Das ist jetzt wie gesagt die Schnelle Methode da die andere ein sehr genaues vorgehen benötigt ansonsten sucht man sich einen Wolf und es wird schnell sehr inefizient (Zeitazfwand).


Aber vorher schau dir nochmal mal das verhalten von

WorldRender.LightTileCsPathEnable [0/1] an

Midnight3DC
2016-02-13, 10:24:28
Also erstens mal läuft da Beta Windows 10 da sehe ich erst mal primär Software im Target nicht Hardware :D

Am besten Windows 10 elimenieren zu Windows 8/7 zurück und stabilität testen wenn man kein genaues Software Debuging durchführen möchte.

Wenn die Probleme weg sind Windows 10 wieder drauf und erneut testen tretten die Probleme wieder auf ohne irgendwelche 3rd Party Software weiss man das das Problem bei Windows 10 innerhalb der Hardware Konfiguration liegt.

Sobald man das sichergestellt hat kann es weiter gehen ;)

Das ist jetzt wie gesagt die Schnelle Methode da die andere ein sehr genaues vorgehen benötigt ansonsten sucht man sich einen Wolf und es wird schnell sehr inefizient (Zeitazfwand).


Aber vorher schau dir nochmal mal das verhalten von

WorldRender.LightTileCsPathEnable [0/1] an
Als das Problem zum ersten Mal aufgetreten ist hatte ich noch Windows 7 am laufen. Habe dann erst nach diversen Neuinstallationen von Windows 7 auf Windows 10 umgesattelt. Dabei habe ich u.a. auch versuch mit einem möglichst "Nacktem" Windows zu testen um Einflüße von anderer Software weitestmöglich auszuschließen. Also am OS selbst sollte es eigentlich nicht liegen und wenn doch, dann müsste es in einem Teil des OS liegen, das W7 und 10 gemeinsam haben.

WorldRender.LightTileCsPathEnable habe ich eben in DA:I getestet und konnte zumindest visuel keinen Unterschied feststellen. Was ist denn da der Defaultwert? Worin sollte der Unterschied bestehen?

Was die BIOS Einstellungen angeht - mein PC basiert im Kern auf dem Quadcore c't Bauvorschlag aus der Ausgabe 1/15 (http://www.heise.de/ct/projekte/Bauvorschlaege-fuer-leise-flotte-und-effiziente-PCs-1375124.html?seite=2). Der Prozessor wurde im Vorschlag auf Broadwell upgedated, ich verwende ein anderes Gehäuse und natürlich noch meine alte Grafikkarte. Die BIOS Einstellungen sind so, wie sie unten im Artikel beschrieben werden - also im wesentlichen Default und lediglich die Lüftereinstellungen sind geändert.

-/\-CruNcher-/\-
2016-02-13, 10:50:24
Default ist 1
Es sollte ein paar ms pro frame gewinn bringen und die CPU Entlasten, sollte ;)

Am besten du testest es auf deiner Konfiguration mit dem internen Cutscene Benchmark als erstes, allerdings ist es sehr unwahrscheinlich das es überhaupt solche extremen CPU spikes verursachen könnte selbst auf disabled.

Midnight3DC
2016-02-13, 11:09:07
Ok, habe jetzt die BIOS Version gecheckt:

BIOS Version: 2401 x64
Build Date: 04/24/2015
EC Version: MBEO-Z97-0121
ME Version: 9.1.1.1000
PCH Stepping: 00/A0

Habe jetzt die "Optimized Default Values" geladen. Was vermutlich ASUS-Marketing Sprech für Stinknormale Default Werte ist, die ich sonst nirgendwo im BIOS finden konnte. Der bad Zustand ist damit definitiv nicht behoben, ein Auftreten des Stotterns selbst konnte ich bislang heute Morgen noch nicht herbeiführen.

Benchmark Ergebnis bad Zustand/WorldRender.LightTileCsPathEnable 1:
Avg FPS: 16.4
Min FPS: 11.5
Benchmark Ergebnis bad Zustand/WorldRender.LightTileCsPathEnable 0:
Avg FPS: 16.6
Min FPS: 11.4
Benchmark Ergebnis good Zustand/WorldRender.LightTileCsPathEnable 1:
Avg FPS: 32.1
Min FPS: 22.8
Benchmark Ergebnis bad Zustand/WorldRender.LightTileCsPathEnable 0:
Avg FPS: 31.6
Min FPS: 22.5

-/\-CruNcher-/\-
2016-02-13, 11:24:37
Hast du externe USB,Firewire,Sata Devices angeschlossen vor allem Storage Devices ?
Vielleicht irgend eine Platte defekt auf die irgendwas in Windows zugreifen will und einen IO Kernel Hard Lock verursacht währenddessen ?

Solche Hard Locks zeigen sich in Mauscursor input problemen stottern des Systems bis zum total Freeze von Windows.

Midnight3DC
2016-02-13, 11:39:06
Hast du externe USB,Firewire,Sata Devices angeschlossen vor allem Storage Devices ?
Vielleicht irgend eine Platte defekt auf die irgendwas in Windows zugreifen will und einen IO Kernel Hard Lock verursacht währenddessen ?
Außer Tastatur, Maus und seit neuestem einem Headset - nein.
Habe im Post oben noch einmal die Benchmark Werte während des good Zustands eingetragen.

Bemerkenswert wäre vielleicht noch die folgende Feststellung:
Ich habe heute morgen direkt nach dem ersten Rechnerstart angefangen zu testen - der PC war im bad Zustand. Danach habe ich den PC heruntergefahren und wieder neu eingeschaltet -> bad Zustand. Danach ein weiteres Mal -> wieder bad Zustand. Beim dritten (oder vierten?) Mal habe ich dann einen Neustart/Warmstart gemacht und bin sofort im good Zustand gelandet. Ich weiß, dass ein Neustart kein Garant für den good Zustand ist, es scheint aber definitiv ein Zusammenhang zwischen Hard- und Softreset zu bestehen.

Anyway, ich habe für heute erst einmal genug mit testen - werde mich dem Thema morgen noch einmal widmen. :wink:

-/\-CruNcher-/\-
2016-02-13, 11:44:25
Ram könnte auch defekt sein bei so sehr Random geschichten am besten System Memory und GPU Memory testen.

=Floi=
2016-02-13, 11:49:43
ich habe ein ähnliches problem. entweder gleich hänger beim booten oder dann nach 10-60 sek nen bluescreen mit rücksetzen des treibers. das mit der bad performance habe ich auch manchmal. nach neustart alls ok und die kiste rennt stundenlang stabil und ohne abstürze.

Achill
2016-02-13, 12:02:16
Bemerkenswert wäre vielleicht noch die folgende Feststellung:
Ich habe heute morgen direkt nach dem ersten Rechnerstart angefangen zu testen - der PC war im bad Zustand. Danach habe ich den PC heruntergefahren und wieder neu eingeschaltet -> bad Zustand. Danach ein weiteres Mal -> wieder bad Zustand. Beim dritten (oder vierten?) Mal habe ich dann einen Neustart/Warmstart gemacht und bin sofort im good Zustand gelandet. Ich weiß, dass ein Neustart kein Garant für den good Zustand ist, es scheint aber definitiv ein Zusammenhang zwischen Hard- und Softreset zu bestehen.


@Midnight3DC ... teste das doch bitte mal:

Weitere Ideen/Fragen:
- Die Intel iGPU ist deaktiviert im Bios, nicht das sich da etwas in die quere kommt?
- Das CPU thermal throttling im Bios deaktiviert, um eine "Fehlfunktion" des Temp. Sensors in der CPU aus zu schließen?

Ansonsten lass bitte prime95 / furmark (fullscreen) / prime95 (mit nur 3 Cores) + furmark (fullscreen) laufen, immer schon im Beisein...

Das Auffällig ist doch, das es nur bei Spielen passiert. D.h. wenn dein System (bis jetzt) max. Verbraucht hat. Nur ein Programm das die CPU gut Auslastet erzeugt nicht die Last+Wärme und damit verbunden Effekte (auch termische).

Auch Sitz von GPU / anderen PCI(e) Karten / Ram überprüft (Schrauben, Klemmhebel, Strom-Anschlusskabel, Slotblende, ...)?

gedi
2016-02-13, 14:15:36
Ram könnte auch defekt sein bei so sehr Random geschichten am besten System Memory und GPU Memory testen.

Der Ram muss nicht zwingend defekt sein, da Asus in gewissen Bios-Updates recht eigenwillige Werte der Sublatenzen einträgt.

Midnight3DC
2016-02-14, 03:21:02
So, ich habe es jetzt noch einmal geschafft, den Fehler zu Provozieren und einen Screenshot mit Lasso + Ressourcenmanager + nVidia Inspector zu machen:
http://i.imgur.com/YOF6NRih.jpg (http://i.imgur.com/YOF6NRi.jpg) Auffällig finde ich an dieser Stelle wieder, dass die "Power" Angabe beim nVidia Inspector leer ist. sämtliche anderen CPU/GPU Monitore scheinen die Spikes gar nicht zu "bemerken".

Außerdem habe ich einmal mit meinem Handy das Ganze mit dem Smartphone aufgenommen. Qualität ist natürlich entsprechend vorsichtig ausgedrückt eher mäßig, man kann aber durchaus erkennen wie das Problem sich äußert:
a7EpFzql7vo Wobei der Sound sich dieses Mal interessanterweise anders verhalten hat, wie ich es sonst gewohnt bin. Üblicherweise hatte ich genau synchron zum Standbild nur einen Ton wie er im Video z.B. etwa bei Sekunde 43 und 47 zu hören ist und nur während die Grafikausgabe lief war auch der Ton normal zu hören. In diesem Video ist aber zu erkennen, dass das Bild Gelegentlich schon steht und die Sprachausgabe noch weiter läuft.

Im Anschluß hatte ich übrigens wieder einmal die folgende Windows Fehlermeldung:

Der Anzeigetreiber wurde nach einem Fehler wiederhergestellt.
Der Anzeigetreiber "NVIDIA Windows Kernel Mode Driver, Version 361.75" reagiert nicht mehr und wurder wiederhergestellt.

Außerdem ist mir dabei auch DA:I gecrashed und hatte diese Fehlermeldung gebracht:
DirectX function "screen->swapChain->ResizeBuffers(
renderer->m_settings->getTrippleBufferingEnable() ? 3 : 2,
screen->info.windowWidth, screen->info.windowHeight,
DXGI_Format_R8G8B8A8_UNORM,
DXGI_SWAP_CHAIN_FLAG_ALLOW_MODE_SWITCH)" failed with
DXGI_ERROR_DEVICE_REMOVED ("The video card has been physically
removed from the system, or a drviver upgrade for the video card has
occured. The application should destroy and recreate the device. For
help debugging the problem, call
ID3D10Device::GetDeviceRemovedReason.") GPU: "NVIDIA GeForce GTX
670", Driver: 36175. This error is usually caused by the graphics driver
crashing; try installing the latest drivers. Also, make sure you have a
supported graphics card with at least 512MB.

Wobei diese Fehlermeldung wohl eher nur aufgrund der des Treiberabsturzes gekommen ist (wie ja auch im vorletzten Satz der Meldung selbst vermutet) und keine große Aussagekraft hat.

Am wahrscheinlichsten halte ich ja nach wie vor einen Defekt des Grafikkartenspeichers. Zum einen, weil das Problem immer im Zusammenhang mit GPU Effekten auftritt und auch deren Treiber abstürzen, zum anderen und wichtigeren aber deshalb, weil ich so ziemlich jede andere Systemkomponente - einschließlich Mainboard, RAM und CPU - schon ausgetauscht habe und das Problem weiterhin besteht. Ich schätze der beste Test wäre entsprechend ein Austausch der Grafikkarte.

-/\-CruNcher-/\-
2016-02-14, 10:31:07
Jep ein TDR wenn du System RAM,HDDs,SSDs schon durch hast bleibt nur noch der GPU RAM, sieht in der tat böhse aus in Motion.

Als Software kann sich bis jetzt nur Microsofts Browser Engine wieder ohne Absturz restarten, 3rd Parties haben das noch nicht geschaft ohne Absturz bis jetzt hinzubekommen seit NT6 ;)

Maorga
2016-02-14, 10:38:35
Für mich sieht das so aus als würde der High Precission Event Timer ne Macke haben.

-/\-CruNcher-/\-
2016-02-14, 10:44:17
weil ich so ziemlich jede andere Systemkomponente - einschließlich Mainboard, RAM und CPU - schon ausgetauscht habe

Und das System funktionierte ja ne ganze Zeit das der HPET schuld sein soll hmm

Midnight3DC has du die GPU öfter mal über die Werksübertaktung OCed ? oder bist du eher so ein Standard user ?

Treiber schliese ich mal komplett aus der ist durchs WHQL gelaufen sowas extremes darf da überhaupt nicht passiieren, es flutschen heute nur noch sehr kleine probleme durch aber garantiert nicht sowas.

Hübie
2016-02-14, 11:06:54
Bau mal die Karte aus und reinige die Kontakte zum Slot mit Alkohol und prüf mal die Stromkontakte an der Karte. Wenn du die Karte bei ASUS registriert hast, hast du außerdem 36 Monate Garantie. Vielleicht besteht diese noch und du kannst umtauschen (falls die Reinigung nicht hilft).
Übrigens erkenne ich hier am Smartphone nix auf den Screenshots. Entweder komprimiert der Anbieter zu Tode (imgur) oder deine Aufnahme ist defizitär (hab die sogar abgespeichert und die sind noch verwaschen). Ich empfehle gerne abload.de als hoster. :up:

Lowkey
2016-02-14, 11:52:35
Es deutet ja daraufhin, dass die Grafikkarte defekt ist?

Mit dem Reinigen von Kontakten konnte ich noch nie ein Problem lösen.

Bei meinem Standbildproblem hatte ich auch die Nvidia gegen eine Nvidia ersetzt und das Problem blieb bestehen. Mit der AMD 7970 sah das Problem dann anders aus, aber war vorhanden.


Die Grafikkarte schaltet ab bzw. der Treiber erzeugt einen Fehler. Das war zB. beim Firefox Bug über Jahre der Fall, wo die Grafikkarte im jeweiligen Powermodus zu wenig Spannung bekam. Doch in dem Fall hier kann es auch bedeuten, dass die Grafikkarte erst nach dem Fehler abschaltet und einen Fehler als Folge des eigentlichen Fehlers erzeugt.

Midnight3DC
2016-02-14, 11:58:57
Als ich die Karte neu gekauft hatte, habe ich ein Zeit lang etwas mit Übertaktung herumexperimentiert, es dann aber nach Kurzem wieder sein lassen. Das Problem ist erst sehr viel Später nach einem Umbau aufgetreten.

@Hübie Hast du den Screenshot angeclickt und in Orignialauflösung 3840x1200 angesehen? Der Thumbnail ist in der Tat ziemlich klein - ich wollte den Post nicht unnötig vergrößern.

Das Video und der Screenshot sind übrigens entstanden nachdem das Problem schon einmal aufgetreten und der Treiber abgestürzt ist. Ich hatte dann ohne Reboot DA:I gleich noch einmal gestartet. Ich vermute, das diese etwas mildere Version des Problems vielleicht deshalb aufgetreten ist. Ich werde einmal schauen, ob ich noch eine Aufnahme hinbekomme, wenn es richtig schlimm ist.

Malabolge
2016-02-14, 12:12:45
Bringt dein MB genug Saft über den PCIe ?

Vielleicht hat das MB Problem damit genug Spannung über den PCIe zu bringen , und schaltet deshalb in den "BadMode".

Hatte früher auch mal so ein Problem (War aber nur PCI) , lag aber daran das die Karte zuviel vom MB "forderte"

Du könntest versuchsweise auch mal einen der anderen PCIe Anschlüsse versuchen

-/\-CruNcher-/\-
2016-02-14, 12:14:04
Es deutet ja daraufhin, dass die Grafikkarte defekt ist?

Mit dem Reinigen von Kontakten konnte ich noch nie ein Problem lösen.

Bei meinem Standbildproblem hatte ich auch die Nvidia gegen eine Nvidia ersetzt und das Problem blieb bestehen. Mit der AMD 7970 sah das Problem dann anders aus, aber war vorhanden.


Die Grafikkarte schaltet ab bzw. der Treiber erzeugt einen Fehler. Das war zB. beim Firefox Bug über Jahre der Fall, wo die Grafikkarte im jeweiligen Powermodus zu wenig Spannung bekam. Doch in dem Fall hier kann es auch bedeuten, dass die Grafikkarte erst nach dem Fehler abschaltet und einen Fehler als Folge des eigentlichen Fehlers erzeugt.

Also es macht den Eindruck als das ein bestimmter berreich im Speicher sehr wahrscheinlich VRAM defekt ist und sobald dort Daten Landen sollen die Latenz explodiert was irgendwann einen TDR triggered.
Eventuell noch das vielleicht tatsächlich zu wenig Strom geliefert wird um den Datentransfer schnell genug zu gewährleisten ?

Also

- Netzteil ist am Sterben
- Vram ist beschädigt

Nach den ganzen bisherigen Daten zu urteilen.

Das ein Netzteil so stirbt hab ich selbst aber noch nicht erlebt meine sind bisher immer explodiert (China Böler) oder es lies sich einfach nicht mehr Power On, so ein seichtes dahinsiechen währe was nettes ;)

mein BeQuiet Dark Power Pro läuft so immernoch ohne murren über die Garantie, wie der Duracell Hase ;)

Hübie
2016-02-14, 12:16:00
Es deutet ja daraufhin, dass die Grafikkarte defekt ist?

Mit dem Reinigen von Kontakten konnte ich noch nie ein Problem lösen.

Bei meinem Standbildproblem hatte ich auch die Nvidia gegen eine Nvidia ersetzt und das Problem blieb bestehen. Mit der AMD 7970 sah das Problem dann anders aus, aber war vorhanden.


Die Grafikkarte schaltet ab bzw. der Treiber erzeugt einen Fehler. Das war zB. beim Firefox Bug über Jahre der Fall, wo die Grafikkarte im jeweiligen Powermodus zu wenig Spannung bekam. Doch in dem Fall hier kann es auch bedeuten, dass die Grafikkarte erst nach dem Fehler abschaltet und einen Fehler als Folge des eigentlichen Fehlers erzeugt.

Erstens: Konnte ich dadurch schon mal Fehler beheben.
Zweitens: Ist der Aufwand vergleichsweise gering und es muss alles probiert werden
Drittens: Siehe eins und Zwei, drei sehen besser aus :biggrin:

@Midnight3DC: Probiere es einfach aus.
Ich vermute allerdings einen tieferliegenden Defekt an der Karte. Softwareprobleme schließe ich weitgehend aus, da die oft reproduzierbar / provozierbar sind. Da du alles andere gewechselt hast bleibt nicht mehr viel. Monitorkabel (-anschluß), Monitor und Stromkabel kann man höchsten mal tauschen. Beginnen sollte man eh immer bei Kabeln, wenn man Software ausschließt bzw. unwahrscheinlicher ist.

Edit: Und aktiviere doch bitte mal die Aufzeichnung des PowerTarget (PT) mit rechtsklick auf den Graphen im Inspector. :smile:

Midnight3DC
2016-02-14, 12:38:41
(...) Siehe eins und Zwei, drei sehen besser aus :biggrin:
Bestes Argument ever - das hat mich überzeugt! :D
Alkohol habe ich nicht zur Hand aber ein Spiritus Glasreiniger sollte da wohl auch gehen, oder?

@Midnight3DC: Probiere es einfach aus.
Ich vermute allerdings einen tieferliegenden Defekt an der Karte. Softwareprobleme schließe ich weitgehend aus, da die oft reproduzierbar / provozierbar sind. Da du alles andere gewechselt hast bleibt nicht mehr viel. Monitorkabel (-anschluß), Monitor und Stromkabel kann man höchsten mal tauschen. Beginnen sollte man eh immer bei Kabeln, wenn man Software ausschließt bzw. unwahrscheinlicher ist.
Die Monitore (habe 3 gleichen Modells) gehören in der Tat zu den wenigen (eigentlich außer der Grafikkarte einzigen meine ich...).
Wobei... jetzt wo ich darüber nachdenke - ich hatte das Problem - wie ganz am Anfang vom Thread schon einmal geschrieben, auch bei meinem Freund auf seinem FullHD TV per HDMI. Also mit anderem Kabel, an anderem Ausgang und auf einem anderen Monitor. Dürfte also eigentlich auch auszuschließen sein. Stromkabel habe ich - Netzteilbedingt - auch schon mindestens zwei mal getauscht.

Edit: Und aktiviere doch bitte mal die Aufzeichnung des PowerTarget (PT) mit rechtsklick auf den Graphen im Inspector. :smile:
Das wäre wohl wirklich einmal interessant! Mal so laienhaft gefragt:
Wäre es denkbar, dass ein VRAM Hardwarefehler besteht, wie Ihn CruNcher beschrieben hat und dieser dazu führt, dass die GPU so langsam mit Arbeit gefüttert wird, dass sie einfach nicht voll ausgelastet ist und eben nur auf 75% Power fährt?

Midnight3DC
2016-02-14, 12:51:09
Vielleicht doch noch einmal etwas ausführlicher zur Hardware Historie:


Ursprungszustand: Alter Rechner mit 670 GTX - alles funktioniert prima.
Neuer Zusammebau eines Rechners nach dem c't Bauvorschlag 1/15 (oben verlinkt) mit abweichendem Gehäuse und einer 970 GTX - weiterhin keine Probleme. Der alte Rechner steht bei meinem Vater und wird dort genutzt.
Rückgabe der 970 GTX wegen 3,5 GB VRAM problem und weil mir die Karte zu laut war (im Vergleich zur 670).
Die 670 habe ich dann wieder in meinen PC eingebaut und seit diesem Umbau treten die Probleme auf. In meinen alten Rechner kommt eine neue 750 GTX.
Netzteil in Verdacht also Testweise mein neues beQuit! in den alten Rechner verbaut und mein altes Enermax in den neuen. Probleme treten weiterhin auf.
Enermax raucht bei mir ab (Rechner startet nicht mehr) und ich besorge mir ein völlig neues beQuit!

Hübie
2016-02-14, 13:25:50
Bestes Argument ever - das hat mich überzeugt! :D
Alkohol habe ich nicht zur Hand aber ein Spiritus Glasreiniger sollte da wohl auch gehen, oder?


Die Monitore (habe 3 gleichen Modells) gehören in der Tat zu den wenigen (eigentlich außer der Grafikkarte einzigen meine ich...).
Wobei... jetzt wo ich darüber nachdenke - ich hatte das Problem - wie ganz am Anfang vom Thread schon einmal geschrieben, auch bei meinem Freund auf seinem FullHD TV per HDMI. Also mit anderem Kabel, an anderem Ausgang und auf einem anderen Monitor. Dürfte also eigentlich auch auszuschließen sein. Stromkabel habe ich - Netzteilbedingt - auch schon mindestens zwei mal getauscht.


Das wäre wohl wirklich einmal interessant! Mal so laienhaft gefragt:
Wäre es denkbar, dass ein VRAM Hardwarefehler besteht, wie Ihn CruNcher beschrieben hat und dieser dazu führt, dass die GPU so langsam mit Arbeit gefüttert wird, dass sie einfach nicht voll ausgelastet ist und eben nur auf 75% Power fährt?

Die (Cache) Fehlerkorrektur hat ihre Grenzen und es würden sich Bildfehler ergeben. Wäre ein VRAM defekt würde es beim Training - zumindest hin und wieder - mal Fehler geben und das System würde gar nicht erst mit der Karte hochfahren (ggf. stellt ein System dann iGPU an).

Deine Fehlerbeschreibung passt auf fehlerhafte Energieversorgung, zu hohe Temperaturen oder ein anderer Defekt der Hardware, aber VRAM wohl weniger (zumindest hab ich noch nie diese Symptomatik erlebt, gelesen oder davon gehört).
Hast du die Kontakte mal gereinigt?

-/\-CruNcher-/\-
2016-02-14, 14:27:25
Vielleicht doch noch einmal etwas ausführlicher zur Hardware Historie:


Ursprungszustand: Alter Rechner mit 670 GTX - alles funktioniert prima.
Neuer Zusammebau eines Rechners nach dem c't Bauvorschlag 1/15 (oben verlinkt) mit abweichendem Gehäuse und einer 970 GTX - weiterhin keine Probleme. Der alte Rechner steht bei meinem Vater und wird dort genutzt.
Rückgabe der 970 GTX wegen 3,5 GB VRAM problem und weil mir die Karte zu laut war (im Vergleich zur 670).
Die 670 habe ich dann wieder in meinen PC eingebaut und seit diesem Umbau treten die Probleme auf. In meinen alten Rechner kommt eine neue 750 GTX.
Netzteil in Verdacht also Testweise mein neues beQuit! in den alten Rechner verbaut und mein altes Enermax in den neuen. Probleme treten weiterhin auf.
Enermax raucht bei mir ab (Rechner startet nicht mehr) und ich besorge mir ein völlig neues beQuit!


Also moment die GTX 670 lief schon korrekt auf diesem Board oder nicht

Bei Z97 werd ich doch schon etwas nachfragender immerhin gab es da ja letztens schon probleme die durch Nvidias testing gerutscht sind ;)

Hübie
2016-02-14, 14:29:49
Was mir noch eingefallen ist: stelle mal bitte im UEFI auf PCIE 2.0. Einfach machen.. ;)

-/\-CruNcher-/\-
2016-02-14, 14:33:34
Richtig das kommt mir auch in den Sinn als ich das gelesen hab PCIe 3.0 probleme pre Maxwell sind ja nicht unbekannt und dann noch Z97 ;)

Midnight3DC
2016-02-14, 14:39:14
Also moment die GTX 670 lief schon korrekt auf diesem Board oder nicht ?
Soweit ich das noch aus meinen Rechnungsbelegen rekonstruieren kann lief es so ab:
Die GTX 970 hatte ich mir in ende November 2014 gekauft. Die lief dann erst einmal im alten Rechner und die 670 war arbeitslos. Ende Januar 2015 habe ich mir dann meinen neuen Rechner zusammengebaut, die 970 dort und die 670 wieder in meinen alten Rechner eingebaut. Anfang Februar 2015 habe ich dann die 750 gekauft, in den alten Rechner verbaut und die 670 zum ersten mal in meinem neuen Verbaut und ab da sind die Probleme auch zum ersten mal Aufgetaucht.

Also - nein. Nur die wieder zurückgegebene GTX 970 lief schon problemlos auf dem Asus Z97-A. Es wäre also wohl noch eine inkompatibilität zwischen Board und Karte denkbar.

-/\-CruNcher-/\-
2016-02-14, 14:41:33
Bingo zumindestens PCie 3.0 interoperabilitätsproblem könnte sehr wahrscheinlich sein :)

Lowkey
2016-02-14, 14:52:57
Ich hatte fast eine ähnliche Abfolge:

660 Ti, 750 Ti und 970. Dann kam das Asus ITX Board mit z97 und letztlich durfte ich das z97 Board und die 660 Ti reklamieren. Beide waren defekt, wobei die Grafikkarte richtig defekt war. Das passierte allerdings erst nachdem ich auf dem ITX Board die Grafikkarten durchgewechselt hatte. Quasi war jede Grafikkarte mal auf jedem Board. Und dann lief am Ende die 660 Ti auf keinem Board und jede Grafikkarte hatte Probleme mit dem Asus z97 ITX Board. Quasi kam der Freeze mit der 660 Ti und direkt nach dem Wechsel auch mit der 750 Ti. Mit der 750 Ti traten zB. bei Battlefield starke Grafikfehler auf, aber nicht immer, aber dann sehr stark. Ein vergleichbares Fehlerbild konnte ich mit der Bildersuche bis heute nicht finden. Das Bild entsprach nicht den typischen Fehlerbildern bei Speicher oder Überhitzung.

Midnight3DC
2016-02-14, 15:04:04
Bingo zumindestens PCie 3.0 interoperabilitätsproblem könnte sehr wahrscheinlich sein :)
Ok, dann wäre das Sinnvollste vorgehen vermutlich die 670 noch einmal in den alten Rechner zu verbauen um zu schauen, ob sie dort noch normal funktioniert. Wenn ich dich richtig verstehe wäre das ja dann kein echter "Defekt" des Boards oder der Graka, sondern einfach eine Inkompatibilität und ich sollte mit einem neuen Chip der Arctic Islands oder Pascal Generation auf meinem Asus Z97-A eigentlich keine Probleme mehr haben, korrekt?

Hübie
2016-02-14, 15:18:59
Korrekt.

Im UEFI sollte es im advanced mode bei dir ungefähr so aussehen wie bei mir:

http://abload.de/thumb/asusp9x79propciem9srl.png (http://abload.de/image.php?img=asusp9x79propciem9srl.png)

Midnight3DC
2016-02-15, 09:32:09
Hier noch einmal Screenshots von LatencyMonitor im bad und good Zustand:
bad:
http://i.imgur.com/19wqeii.jpg (http://imgur.com/19wqeii)
good:
http://i.imgur.com/YOPCliZ.jpg (http://imgur.com/YOPCliZ)

Hier ist auch vor dem Problemauftreten und vor dem Start einer 3D Anwendung schon klar erkennbar, ob der PC sich gerade im bad oder good Zustand befindet.

Lowkey
2016-02-15, 10:07:02
So sah das bei mir auch aus, aber selbst dein good Zustand ist etwas höher (was andere Ursachen haben kann).

Mir fiel vor zwei Jahren auf, dass nicht jede Grafikkarte auf einem beliebigen Mainboard in jedes Gehäuse paßt. Die Ursache wird vermutlich irgendwo bei PCI-E zu finden sein. Mein Mainboard hatte einen Schaden mit dem PCI-E und sämtlichen Grafikkarten und die Grafikkarte kann nach einem Neustart nur noch den VGA Modus. Ich weiss bis heute keine Möglichkeit die genaue Ursache zu finden. Denn die Grafikkarte ist anfangs nur ein Symptom.

Midnight3DC
2016-02-15, 11:51:20
Meine Vermutung ist, dass es keinen 100% good Zustand gibt, sondern nur einen weitgehend Problemfreien. Bei dem was ich als good Zustand bezeichne liegt der Anteil der hard pagefaults einfach so niedrig, dass er subjektiv und auch bei FPS Messungen im Grundrauschen untergeht.

Hübie
2016-02-15, 12:18:42
Hast du meine Vorschläge schon durch? :|

Midnight3DC
2016-02-15, 13:28:11
Du meinst das Reinigen der Kontakte mit Alkohol (bzw. Spiritus Glasreiniger in meinem Fall)? Nein, ich habe den Rechner noch nicht aufgeschraubt.

IceKillFX57
2016-02-15, 14:35:24
Bei meinem PC lag das damals am Netzteil.
Wobei das wirklich ein böller war.