AMD EPYC 7002 CPU-da səhv 1044 günlük əməliyyatdan sonra donur

2018-ci ildən göndərilən "Zen 7002" mikroarxitekturasına əsaslanan AMD EPYC 2 ("Roma") seriyalı server prosessorlarında vəziyyət sıfırlanmadan (sistemi yenidən yükləmədən) 1044 gün işlədikdən sonra prosessorun dayanmasına səbəb olan xəta var. Problemin qarşısını almaq üçün həll yolu kimi, CC6 enerjiyə qənaət rejimi dəstəyini söndürmək və ya serveri hər 1044 gündə bir dəfədən çox (təxminən 2 il 10 ay) yenidən başlatmaq tövsiyə olunur.

AMD-nin yaydığı məlumata görə, dayanma prosessorun nüvəsi CC6 enerjiyə qənaət rejimindən oyanmağa çalışdıqda (nüvə-C6, boş zaman gərginliyi azaldır) taymer 1044 gün dəyərinə çatdıqda baş verən nasazlıqdan qaynaqlanır. son CPU vəziyyətinin sıfırlanmasından sonra (təzahür müddəti REFCLK tezliyindən asılı olaraq dəyişə bilər).

AMD uğursuzluğun səbəbi ilə bağlı daha ətraflı izahat vermir. Reddit-də dərc olunan fərziyyəyə əsasən, 2800 MHz tezliyində sıfırlandıqdan sonra iş dövrlərinin sayını hesablayan TSC (Vaxt möhürü sayğacı) reyestrindəki sayğac 0x380000000000000 (2800 MHz *10) dəyərinə çatdıqda, dayanma baş verir. *6 * 1042.5, yəni 1042 gün və 12 saatdan sonra).

Səhvlərin düzəldilməsi dərc edilməyəcək. Problem uzun müddət diqqətdən kənarda qaldı, çünki çoxillik iş vaxtları yenilənmək üçün nüvə yeniləmələrini quraşdırmaq və ya əməliyyat sisteminin yeni buraxılışına keçmək üçün vaxtaşırı yenidən işə salınmalı olan serverlər üçün xarakterik deyil. Bununla belə, Linux paylamalarının yenidən işə salınmayan nüvə təkmilləşdirmə üsulları, eləcə də uzun texniki xidmət dövrləri (Ubuntu, RHEL və SUSE 10 il dəstəklənir) serverlərin uzun müddət ərzində yenidən başlamadan tapılması ilə nəticələnə bilər.

Mənbə: opennet.ru

Добавить комментарий