NVIDIA: критичСскиС сбои Π΄Ρ€Π°ΠΉΠ²Π΅Ρ€ΠΎΠ² Π½Π° ядрС Linux 6.10

NVIDIA: критичСскиС сбои Π΄Ρ€Π°ΠΉΠ²Π΅Ρ€ΠΎΠ² Π½Π° ядрС Linux 6.10

Компания NVIDIA занимаСтся расслСдованиСм критичСского Π±Π°Π³Π°, ΠΏΡ€ΠΈ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ ΠΈΡ… Π΄Ρ€Π°ΠΉΠ²Π΅Ρ€Ρ‹ Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‚ ΡΠ±ΠΎΠΈΡ‚ΡŒ ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ Π½Π° послСдних вСрсиях ядра Linux (начиная с вСрсии 6.10 ΠΈ Π²Ρ‹ΡˆΠ΅). Π­Ρ‚Π° ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° Π·Π°Ρ‚Ρ€Π°Π³ΠΈΠ²Π°Π΅Ρ‚ Π΄Ρ€Π°ΠΉΠ²Π΅Ρ€Ρ‹ вСрсии 550, 555 ΠΈ Π΄Π°ΠΆΠ΅ послСдний Π½Π° Ρ‚Π΅ΠΊΡƒΡ‰ΠΈΠΉ ΠΌΠΎΠΌΠ΅Π½Ρ‚ Π΄Ρ€Π°ΠΉΠ²Π΅Ρ€ 560. ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΠ° проявляСтся ΠΊΠ°ΠΊ Π½Π° Π·Π°ΠΊΡ€Ρ‹Ρ‚Ρ‹Ρ… Π΄Ρ€Π°ΠΉΠ²Π΅Ρ€Π°Ρ… NVIDIA, Ρ‚Π°ΠΊ ΠΈ Π½Π° ΠΈΡ… ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹Ρ… вСрсиях.

Будя ΠΏΠΎ Π΄Π°Π½Π½Ρ‹ΠΌ Π½Π° Ρ„ΠΎΡ€ΡƒΠΌΠ΅ NVIDIA, эта ошибка Π²ΠΎΠ·Π½ΠΈΠΊΠ»Π° Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ рСгрСссии, связанной с ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ΠΌ ядра Linux Π΄ΠΎ вСрсии 6.10. Ошибки Π²ΠΎΠ·Π½ΠΈΠΊΠ°ΡŽΡ‚ Π² ситуациях, ΠΊΠΎΠ³Π΄Π° активируСтся ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ приостановки систСмы (suspension) ΠΈΠ»ΠΈ ΠΊΠΎΠ³Π΄Π° ΠΊΠ°ΠΊΠΎΠ΅-Π»ΠΈΠ±ΠΎ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ Π½Π°Ρ‡ΠΈΠ½Π°Π΅Ρ‚ ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Ρ‚ΡŒ 3D-Π³Ρ€Π°Ρ„ΠΈΠΊΡƒ. ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΠ° Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² появлСнии систСмных сбоСв (kernel oops), Ρ‡Ρ‚ΠΎ доставляСт массу нСудобств ΠΊΠ°ΠΊ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠ°ΠΌ, Ρ‚Π°ΠΊ ΠΈ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡΠΌ.

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ сбоя Π΄Ρ€Π°ΠΉΠ²Π΅Ρ€Π°

БистСма Π½Π΅ΠΎΠΆΠΈΠ΄Π°Π½Π½ΠΎ Π½Π°Ρ‡ΠΈΠ½Π°Π΅Ρ‚ Π·Π°Π²ΠΈΡΠ°Ρ‚ΡŒ ΠΈ Π΄Π°Π²Π°Ρ‚ΡŒ сбои Π² самых Π½Π΅ΠΎΠΆΠΈΠ΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠΌΠ΅Π½Ρ‚Π°Ρ…, особСнно ΠΏΡ€ΠΈ запускС ΠΈΠ³Ρ€ ΠΈΠ»ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с графичСскими прилоТСниями. ΠŸΡ€ΠΈΠΌΠ΅Ρ€ ΠΈΠ· систСмного ΠΆΡƒΡ€Π½Π°Π»Π°:

[ 29.168385] ————[ cut here ]———— [ 29.168385] WARNING: CPU: 13 PID: 7032 at include/linux/rwsem.h:80 follow_pte+0x1de/0x200 [ 29.168387] Modules linked in: rfcomm nvidia_drm(OE) nvidia_uvm(OE) nvidia_modeset(OE) nvidia(OE) … [ 29.168456] CPU: 13 PID: 7032 Comm: nv_queue Tainted: P W OE 6.10.6-arch1-1 #1 703d152c24f1971e36f16e505405e456fc9e23f8 [ 29.168457] Hardware name: ASUSTeK COMPUTER INC. ASUS TUF Dash F15 FX517ZR_FX517ZR/FX517ZR, BIOS FX517ZR.317 05/03/2023 [ 29.169159] ret_from_fork+0x31/0x50 [ 29.169164] —[ end trace 0000000000000000 ]—

ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΠ° проявляСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

  • Π’ΠΈΠ΄Π΅ΠΎ становится Π΄Π΅Ρ€Π³Π°Π½Ρ‹ΠΌ ΠΈ ΠΊΠ°ΠΆΠ΄Ρ‹Π΅ 45 сСкунд ΡΠ»ΡƒΡ‡Π°ΡŽΡ‚ΡΡ ΠΊΡ€Π°Ρ‚ΠΊΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ «Ρ„Ρ€ΠΈΠ·Ρ‹».
  • Π’ ΠΈΠ³Ρ€Π°Ρ… происходит Ρ€Π°Π·Ρ€Ρ‹Π² ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ΠΌ ΠΈ ΠΈΠ³Ρ€ΠΎΠ²Ρ‹ΠΌ процСссом: ΠΈΠ³Ρ€Π° продолТаСтся, ΠΏΠΎΠΊΠ° экран Π·Π°ΠΌΠΎΡ€ΠΎΠΆΠ΅Π½.
  • ПослС 30 ΠΌΠΈΠ½ΡƒΡ‚ ΠΈΠ³Ρ€Ρ‹ срСдняя Π½Π°Π³Ρ€ΡƒΠ·ΠΊΠ° Π½Π° систСму ΠΌΠΎΠΆΠ΅Ρ‚ Π²Π·Π»Π΅Ρ‚Π΅Ρ‚ΡŒ Π΄ΠΎ Ρ‚Ρ€Ρ‘Ρ…Π·Π½Π°Ρ‡Π½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ, ΠΏΡ€ΠΈ этом инструмСнты ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³Π°, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ top, iostat, vmstat ΠΈΠ»ΠΈ free, Π½Π΅ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ явных ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΡƒΡ…ΡƒΠ΄ΡˆΠ΅Π½ΠΈΡ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ систСмы.
  • Команда dmesg заполняСтся ΠΏΠΎΡ…ΠΎΠΆΠΈΠΌΠΈ трассировочными сообщСниями стСка (stack trace).

На Π΄Π°Π½Π½Ρ‹ΠΉ ΠΌΠΎΠΌΠ΅Π½Ρ‚ Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹ΠΌ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использованиС ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΡ… вСрсий ядра. НапримСр, ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ Π½Π° Π²Π΅Ρ‚ΠΊΡƒ linux-lts (долгосрочная ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ°) с вСрсиСй ядра 6.6 Π² сочСтании с Π΄Ρ€Π°ΠΉΠ²Π΅Ρ€Π°ΠΌΠΈ NVIDIA вСрсий 550 ΠΈΠ»ΠΈ 555 ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠΎΠΌΠΎΡ‡ΡŒ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ сбоСв.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: linux.org.ru