PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Ryzen 2200g auf Asrock AB350M Pro4 - PCIe bus errors


SavageX
2018-10-20, 14:14:06
Hallo,

da ich noch ein AB350M Pro4 und 16 GB DDR4 "herumliegen" hatte, habe ich noch einen Ryzen 2200g besorgt, um damit einen altehrwürdigen Phenom II 945 (Familien-PC) in Rente zu schicken.

Offenkundig war (ist?) der Raven Ridge Support bei Linux ja ziemlich wackelig (mindestens soll man wohl Kernel 4.15 haben, besser 4.16, noch besser 4.17, ...), weshalb ich die Kiste vorab auf Ubuntu 18.10 (Kernel 4.18) gehoben habe.

Nach dem Umbau bootete der Rechner bis in den Desktop hoch, aber die Konsole wird mit PCIe-Fehlern geflutet und nach und nach steigt Ethernet, SSD, Tastatur etc. aus...

Das bekam ich auf die Schnelle nicht mit Sachen wie "C6 im BIOS deaktivieren" und diversen Grub-Kernelparametern in den Griff, so dass ich den Phenom II wieder ins Gehäuse zurückgestopft habe, damit die Familie einen funktionierenden Rechner hat. Vielleicht erlebt der Phenom ja doch noch seinen zehnten Geburtstag im Einsatz...

Ähnliche Fehler scheinen z.B. manche Ryzen-Notebooks unter Linux zu haben, scheint also ein Raven-Problemchen zu sein.

Hat jemand sowas a) schonmal gesehen und b) in den Griff bekommen? Für einen zukünftigen Anlauf könnte das sehr hilfreich sein!

Lokadamus
2018-10-20, 14:41:16
Hab nur den Hinweis gefunden, dass man aspm im Kernel oder Bios deaktivieren soll, um diese Meldungen bezüglich bad dllp los zu werden.
https://forum.level1techs.com/t/threadripper-pcie-bus-errors/118977

SavageX
2018-10-20, 23:33:56
Danke für den Link. Das mit dem aspm=off ist ein vielversprechender Kandidat.

BBig
2018-10-21, 15:22:32
Danke für den Link. Das mit dem aspm=off ist ein vielversprechender Kandidat.

Nach https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1521173 ( https://askubuntu.com/questions/771899/pcie-bus-error-severity-corrected#771908 )
würde ich eher pci=nomsi oder pci=noaer probieren.

Ja, beides "unschön"; :(
==> https://www.kernel.org/doc/Documentation/admin-guide/kernel-parameters.txt


Vll schickst du auch Asrock deinen Screenshot.
Gruß

SavageX
2018-10-21, 23:11:17
Danke für die Links. pci=noaer schaltet nur das error-reporting aus - das wird also den error-spam auf der Konsole abstellen, aber im Hintergrund kracht es natürlich trotzdem.

pci=nomsi kommt mal mit auf die Liste von Sachen, die ich ausprobieren sollte.

SavageX
2018-10-22, 18:17:02
Habe den Patienten als fliegenden Aufbau auf meinem Schreibtisch.

Mit pcie_aspm=off sind die PCIe bus errors anscheinend nicht mehr da.

Dafür steigt nach einiger Zeit einfach die SATA-Festplatte aus, was der Stabilität nicht gut tut.

Lade gerade den Win10-Installer runter. Wenn das Teil selbst mit dem formschönen Betriebssystem vom sympathischen Weltmarktführer aus dem sonnigen Redmond die Hufe reißt, dann hat die Hardware wohl einen Hau weg.

edit: Der Win10-Installer hängt sich auch auf. Ich würde mal sagen, da ist was gründlich in Unordnung.

edit2: So, habe den Ryzen 2200g mal in das Board meines Hauptsystems (B450 Pro4, normalerweise mit Ryzen 2700) rübergepflanzt. Das scheint ganz wunderbar zu laufen... mal einige Zeit einfach mal durchprobieren, um sicherzustellen, dass nicht die CPU das Problem ist.

Skinner
2018-10-22, 23:22:29
Bios Update schon durchgeführt?

SavageX
2018-10-23, 07:36:40
Ja, habe Versionen 4.50, 5.00 und 5.10 (neueste Version) des BIOS ausprobiert. Keine Veränderungen erkennbar.

Pappenheimer
2018-10-30, 12:10:09
Ja, habe Versionen 4.50, 5.00 und 5.10 (neueste Version) des BIOS ausprobiert. Keine Veränderungen erkennbar.

Irgendwo hatte ich gelesen das es Probleme mit AGESA 1004(c) und Linux gibt.
Keine Ahnung ob das mit deinem Thema zu tun hat. :freak:

SavageX
2018-11-11, 13:40:01
So, Problem ist gelöst.

Ich habe Kontakt mit dem technischen Support von Asrock aufgenommen und die Fehler geschildert. Dieser hat ein Hardware-Defekt am Mainboard vermutet - ich solle mal Kontakt zu meinem Händler für Prüfung und ggf. Austausch aufnehmen.

Ergo habe ich einen RMA-Prozess bei Mindfactory angestossen: Mainboard mit Zubehör ordentlich verpackt, den Mailverkehr mit Asrock beigefügt, Retoure-Label drauf und ab damit. Das Board war jetzt etwas über ein Jahr alt, also prinzipiell innerhalb der Gewährleistung - aber die Beweislast, dass der Fehler im Produkt veranlagt ist, liegt ja nach sechs Monaten beim Kunden. Das hätte also eine nervige Geschichte werden können.

Hat aber einwandfrei geklappt, einige Tage später hatte ich ein neues AB350M Pro4 in den Händen, glücklicherweise mit "Ryzen 2000 ready"-Aufkleber. Das neue Board funktioniert einwandfrei!

Ich weiß nicht, ob das alte Mainboard tatsächlich einen Defekt entwickelt hat, oder ob Asrock ggf. in späteren Chargen etwas am Board verbessert hat. Das ist jetzt aber der zweite mir bekannte Fall, wo ein RMA beim AB350M Pro4 diese Art von Fehlern ausgeräumt hat.