PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Fedora 31 - Wifi führt zu SoftLockups und blockiert das ganze System


Acid-Beatz
2020-02-01, 14:43:46
Guten Tag zusammen,

vorne weg: Der PC lief "damals" unter Fedora 30 schon mal absolut stabil, ich kann den genauen "Bruch" nur leider nicht genau angeben, weil ich dann in der Arbeit recht viel zu tun hatte und das System nur noch sporadisch gebootet habe. Da nicht viele Daten darauf sind, habe ich auch bereits eine komplette Neuinstallation mit Fedora 31 durchgeführt, leider ohne Erfolg!

Reproduzieren lässt sich der Fehler sofort, indem man einen Download startet, unmittelbar danach friert alles für 20 - 30 Sekunden ein, stürzt aber nicht ab.


Das Muster in den Logs ist auch immer das gleiche, zuerst kommt ein Error/Reset des WLANs, der folgendermaßen aussieht:

Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: Error sending STATISTICS_CMD: time out after 2000ms.
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: Current CMD queue read_ptr 249 write_ptr 250
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: Hardware error detected. Restarting.
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: HW error, resetting before reading
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: Start IWL Error Log Dump:
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: Status: 0x00000080, count: -405747467
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: Loaded firmware version: 46.6bf1df06.0
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xA3FA149C | ADVANCED_SYSASSERT
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x38A575F1 | trm_hw_status0
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x11C7C3C9 | trm_hw_status1
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xC9767E59 | branchlink2
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xE522A76D | interruptlink1
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x8262EF2E | interruptlink2
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xFEFBDFD0 | data1
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x499D81F5 | data2
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x0A79A5D1 | data3
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xFE66A157 | beacon time
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xC96EED42 | tsf low
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xD7A2719C | tsf hi
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x577C7A1D | time gp1
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x560C518B | time gp2
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x631F148E | uCode revision type
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xC704773D | uCode version major
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x76EB4BFD | uCode version minor
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x429777B5 | hw version
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xE577FC8A | board version
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x7E878FFA | hcmd
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x20E93AA7 | isr0
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xCEF0BBAA | isr1
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xFBBBA3A8 | isr2
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x49B2BEE3 | isr3
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x5739176D | isr4
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x5224655F | last cmd Id
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x308DE45D | wait_event
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x21FD0F33 | l2p_control
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x8460CC13 | l2p_duration
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xE5992575 | l2p_mhvalid
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xC2FA0255 | l2p_addr_match
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xFD26FDBD | lmpm_pmg_sel
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x3C008539 | timestamp
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x69663BFF | flow_handler
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: Start IWL Error Log Dump:
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: Status: 0x00000080, count: -275324971
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x523E0BA9 | ADVANCED_SYSASSERT
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xFE6DA992 | umac branchlink1
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x17E4A264 | umac branchlink2
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xDEEE99ED | umac interruptlink1
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x4CA058A4 | umac interruptlink2
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xE8FE796B | umac data1
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x2CC25781 | umac data2
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xE0F12F4F | umac data3
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x54CAEA4E | umac major
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x7D8FECDB | umac minor
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0x36C6B8B2 | frame pointer
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xDA8E9F60 | stack pointer
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xCE927731 | last host cmd
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xDDFF5293 | isr status reg
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: Fseq Registers:
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xA5A5A5A2 | FSEQ_ERROR_CODE
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xA5A5A5A2 | FSEQ_TOP_INIT_VERSION
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xA5A5A5A2 | FSEQ_CNVIO_INIT_VERSION
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xA5A5A5A2 | FSEQ_OTP_VERSION
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xA5A5A5A2 | FSEQ_TOP_CONTENT_VERSION
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xA5A5A5A2 | FSEQ_ALIVE_TOKEN
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xA5A5A5A2 | FSEQ_CNVI_ID
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xA5A5A5A2 | FSEQ_CNVR_ID
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xA5A5A5A2 | CNVI_AUX_MISC_CHIP
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xA5A5A5A2 | CNVR_AUX_MISC_CHIP
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xA5A5A5A2 | CNVR_SCU_SD_REGS_SD_REG_DIG_DCDC_VTRIM
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: 0xA5A5A5A2 | CNVR_SCU_SD_REGS_SD_REG_ACTIVE_VDIG_MIRROR
Feb 01 13:34:07 celsius kernel: iwlwifi 0000:04:00.0: Collecting data: trigger 2 fired.
Feb 01 13:34:07 celsius kernel: ieee80211 phy0: Hardware restart was requested

Anschließend daran kommt dann IMMER ein SoftLockup, der in meinen Augen der Auslöser für den Freeze ist:
Feb 01 13:34:35 celsius kernel: watchdog: BUG: soft lockup - CPU#10 stuck for 21s! [kworker/10:0:62]
Feb 01 13:34:35 celsius kernel: Modules linked in: ccm nf_conntrack_netbios_ns nf_conntrack_broadcast xt_CT ip6t_REJECT nf_reject_ipv6 ip6t_rpfilter ipt_REJECT nf_reject_ipv4 xt_conntrack ebtable_nat ebtable_broute ip6table_nat ip6table_mangle ip6table_raw ip6table_security iptable_nat nf_nat iptable_mangle iptable_raw iptable_security nf_conntrack nf_defrag_ipv6 nf_defrag_ipv4 libcrc32c ip_set nfnetlink ebtable_filter ebtables ip6table_filter ip6_tables iptable_filter sunrpc intel_rapl_msr intel_rapl_common snd_hda_codec_conexant x86_pkg_temp_thermal snd_hda_codec_generic intel_powerclamp coretemp snd_hda_codec_hdmi ledtrig_audio raid0 iwlmvm snd_hda_intel kvm_intel snd_hda_codec iTCO_wdt mac80211 snd_hda_core mei_hdcp mei_wdt iTCO_vendor_support snd_hwdep libarc4 kvm irqbypass snd_seq iwlwifi snd_seq_device intel_cstate snd_pcm intel_uncore intel_rapl_perf mei_me i2c_i801 snd_timer cfg80211 lpc_ich snd mei soundcore rfkill tpm_infineon ip_tables dm_crypt amdgpu amd_iommu_v2 gpu_sched i2c_algo_bit
Feb 01 13:34:35 celsius kernel: crct10dif_pclmul ttm crc32_pclmul crc32c_intel drm_kms_helper isci drm ghash_clmulni_intel serio_raw e1000e libsas scsi_transport_sas ums_realtek uas usb_storage fuse
Feb 01 13:34:35 celsius kernel: CPU: 10 PID: 62 Comm: kworker/10:0 Not tainted 5.3.7-301.fc31.x86_64 #1
Feb 01 13:34:35 celsius kernel: Hardware name: FUJITSU CELSIUS M720 POWER/D3128-A1, BIOS V4.6.5.1 R1.13.0 for D3128-A1x 09/20/2013
Feb 01 13:34:35 celsius kernel: Workqueue: events iwl_fw_error_dump_wk [iwlwifi]
Feb 01 13:34:35 celsius kernel: RIP: 0010:_raw_spin_unlock_irqrestore+0x10/0x20
Feb 01 13:34:35 celsius kernel: Code: 41 bc 40 42 0f 00 e9 7b ff ff ff 90 90 90 90 90 90 90 90 90 90 90 90 90 90 90 66 66 66 66 90 48 89 f8 48 89 f7 c6 00 00 57 9d <66> 66 90 66 90 c3 66 2e 0f 1f 84 00 00 00 00 00 66 66 66 66 90 49
Feb 01 13:34:35 celsius kernel: RSP: 0018:ffff990c802f3d58 EFLAGS: 00000246 ORIG_RAX: ffffffffffffff13
Feb 01 13:34:35 celsius kernel: RAX: ffff8b446db790c4 RBX: ffff990c850f4169 RCX: 0000000000000003
Feb 01 13:34:35 celsius kernel: RDX: 0000000008040005 RSI: 0000000000000246 RDI: 0000000000000246
Feb 01 13:34:35 celsius kernel: RBP: ffff8b446db70028 R08: 0000000000003a98 R09: 0000000000000011
Feb 01 13:34:35 celsius kernel: R10: ffffce200c1c7fc0 R11: ffff8b443fd06e18 R12: ffff990c850f4169
Feb 01 13:34:35 celsius kernel: R13: 0000000000400000 R14: 0000000000000005 R15: ffff8b446f3eacb8
Feb 01 13:34:35 celsius kernel: FS: 0000000000000000(0000) GS:ffff8b4473a80000(0000) knlGS:0000000000000000
Feb 01 13:34:35 celsius kernel: CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033
Feb 01 13:34:35 celsius kernel: CR2: 00007f0d0d91b290 CR3: 000000031fd34001 CR4: 00000000000606e0
Feb 01 13:34:35 celsius kernel: Call Trace:
Feb 01 13:34:35 celsius kernel: iwl_trans_pcie_read_mem+0x8f/0xc0 [iwlwifi]
Feb 01 13:34:35 celsius kernel: iwl_fw_dump_mem.isra.0.part.0+0x48/0x80 [iwlwifi]
Feb 01 13:34:35 celsius kernel: iwl_fw_dbg_collect_sync+0x817/0x1d20 [iwlwifi]
Feb 01 13:34:35 celsius kernel: ? __switch_to+0x80/0x440
Feb 01 13:34:35 celsius kernel: iwl_fw_error_dump_wk+0x53/0x80 [iwlwifi]
Feb 01 13:34:35 celsius kernel: process_one_work+0x19d/0x340
Feb 01 13:34:35 celsius kernel: worker_thread+0x50/0x3b0
Feb 01 13:34:35 celsius kernel: kthread+0xfb/0x130
Feb 01 13:34:35 celsius kernel: ? process_one_work+0x340/0x340
Feb 01 13:34:35 celsius kernel: ? kthread_park+0x80/0x80
Feb 01 13:34:35 celsius kernel: ret_from_fork+0x35/0x40
Feb 01 13:34:35 celsius kernel: iwlwifi 0000:04:00.0: Failing on timeout while stopping DMA channel 8 [0xa5a5a5a2]
Feb 01 13:34:35 celsius kernel: iwlwifi 0000:04:00.0: Applying debug destination EXTERNAL_DRAM
Feb 01 13:34:35 celsius kernel: iwlwifi 0000:04:00.0: Applying debug destination EXTERNAL_DRAM
Feb 01 13:34:35 celsius kernel: iwlwifi 0000:04:00.0: FW already configured (0) - re-configuring
Feb 01 13:34:35 celsius rtkit-daemon[1158]: Supervising 13 threads of 7 processes of 1 users.
Feb 01 13:34:35 celsius rtkit-daemon[1158]: Supervising 13 threads of 7 processes of 1 users.
Feb 01 13:34:35 celsius rtkit-daemon[1158]: Supervising 13 threads of 7 processes of 1 users.
Feb 01 13:34:35 celsius rtkit-daemon[1158]: Supervising 13 threads of 7 processes of 1 users.
Feb 01 13:34:35 celsius wpa_supplicant[1375]: wlp4s0: CTRL-EVENT-REGDOM-CHANGE init=DRIVER type=WORLD
Feb 01 13:34:35 celsius rtkit-daemon[1158]: Successfully made thread 3577 of process 3548 (/usr/lib64/firefox/firefox) owned by '1000' RT at priority 10.
Feb 01 13:34:35 celsius rtkit-daemon[1158]: Supervising 14 threads of 8 processes of 1 users.
Feb 01 13:34:35 celsius wpa_supplicant[1375]: wlp4s0: CTRL-EVENT-SIGNAL-CHANGE above=1 signal=-68 noise=9999 txrate=240000

Das war es eigentlich schon mit der Fehlerbeschreibung, das System läuft unter Windows absolut zuverlässig, ebenso unter dem selben! Linux, wenn ich Wifi deaktiviere ... .

Wifi ist über PCI-E angebunden, der Chip ein Intel 9260 (Gigabyte GC-WB1733D-I).


Irgendwelche Ideen, ich konnte im Internet leider nicht mal ansatzweise ähnliche Fehler auf dieser Hardware finden.


Vielen Dank schon mal für Euren Input, Grüße: Paul

drdope
2020-02-01, 15:14:18
Mein (zugegeben pragmatischer) Ansatz wäre es erst mal mit einem anderen WiFi-Adapter zu testen (am besten einen, der an einer anderen, baugleichen, Celsius-Workstation verifiziert funktioniert), bevor ich da weiter Zeit rein investiere.

Sprich erst mal schauen, ob der Fehler generell auftritt, wenn ein WLAN-Adapter genutzt wird, oder ob er spezifisch für den Intel/Gigabyte-Adapter ist.

Acid-Beatz
2020-02-01, 15:29:42
Danke für Deine Antwort aber die ist mir dann zugegebenermaßen doch zu pragmatisch :)

1.) Mit Fedora 30 hat es ja schon mal bestens funktioniert.
2.) Habe ich mir diese Karte vor gerade einem Jahr bewusst gekauft, damit sowas nicht passiert.

Versteh mich nicht falsch, mir geht es nicht um die paar Euro für einen WLAN Adapter aber ich bin absolut kein Freund der heutigen Wegwerfgesellschaft. Gut, wenn es sein muss, dann muss es halt sein aber davor würde ich jetzt doch gerne noch paar Sachen ausprobieren :)

Und zur Zertifizierung: Rein vom alter her, kann diese maximal bis RHEL 6 gegangen sein, weil die Gute doch schon 8-9 Jahre alt ist :rolleyes:

drdope
2020-02-01, 15:35:52
Zumindest kannst du mit meinem Ansatz schon mal eingrenzen, ob das Problem im Fedora Wifi-Stack (dann tritt es mit theoretisch mit anderen Adaptern auch auf) sitzt, oder adapterspezifisch ist...
;)

edit:
Das klingt sehr nach deinem Problem:
--> https://forum.manjaro.org/t/intel-corporation-wireless-ac-9260/108190

Kann man scheinbar mit Übergabe der Option
#/etc/modprobe.d/wifi.conf

options iwlwifi lar_disable=1
beheben...

Acid-Beatz
2020-02-02, 19:07:32
So, nachdem das System sowieso noch jungfräulich war, da nicht benutzbar, bin ich nun den Schritt gegangen, dass ich noch mal ein Fedora 30 drübergebügelt habe und jetzt läuft wieder alles wie eh und je.

Aktuell saugt er sich gerade alle Updates und wenn dann noch alles passt, setze ich einen Version-Lock auf den WLAN-Treiber. Denke, ich werde dann noch bisschen bei Fedora 30 bleiben und im April oder so werde ich dann noch mal auf 31 heben.


Merci noch mal für Deine Hilfe!

drdope
2020-02-02, 19:28:01
Schade... das es nichts gebracht hat...
:(

Ich würd' den Bug zumindest hier mal dokumentieren:
--> https://bugzilla.redhat.com/buglist.cgi?quicksearch=iwlwifi
Evt. findet sich ja jemand der sich dem an nimmt...

Kann man bei Fedora (nutze es selbst nicht), eigentlich im GIT schauen, was sich von F30 auf F31 am code des iwlwifi.ko geändert hat?