BGP konfiqurasiya xətası Cloudflare-in 27 dəqiqə ərzində qəzaya uğramasına səbəb olur

Cloudflare şirkəti, təmin edir 27 milyon internet resursu üçün məzmun çatdırılması şəbəkəsi və 13 ən böyük saytın 1000%-nin trafikinə xidmət edən, ortaya qoydu London, Çikaqo, Los-Anceles, Vaşinqton, Amsterdam, Paris, Moskva və Sankt-Peterburqa trafikin çatdırılmasına cavabdeh olanlar da daxil olmaqla, Cloudflare şəbəkəsinin bir çox seqmentlərinin işinin 27 dəqiqə ərzində dayandırıldığı hadisənin təfərrüatları. . Problem Atlanta marşrutlaşdırıcısında səhv konfiqurasiya dəyişikliyi nəticəsində yaranıb. İyulun 17-də saat 21:12-dən 21:39-a qədər (UTC) baş verən insident zamanı Cloudflare şəbəkəsində trafikin ümumi həcmi təxminən 50% azalıb.

BGP konfiqurasiya xətası Cloudflare-in 27 dəqiqə ərzində qəzaya uğramasına səbəb olur

Texniki iş zamanı magistrallardan birindən trafikin bir hissəsini çıxarmaq istəyən mühəndislər, müəyyən edilmiş prefikslər siyahısına uyğun olaraq süzgəcdən keçirilmiş magistral vasitəsilə qəbul edilən marşrutların siyahısını müəyyən edən parametrlər blokunda bir sətri siliblər. Bütün bloku deaktiv etmək düzgün olardı, lakin səhvən yalnız prefikslərin siyahısı olan sətir silindi.

{usta [redaktə] atl01# şou | müqayisə etmək
[redaktə siyasət-seçimləri siyasət bəyanatı 6-BBONE-OUT müddəti 6-SITE-LOCAL from] ! qeyri-aktiv: prefiks siyahısı 6-SITE-LOCAL { … }

Blok məzmunu:

{dan
prefiks siyahısı 6-SITE-LOCAL;
}
sonra {
yerli üstünlük 200;
icma əlavə SITE-LOCAL-ROUTE;
icma əlavə ATL01;
icma ŞİMALİ AMERİKA əlavə edin;
qəbul etmək;
}

Prefikslər siyahısına bağlanmanın aradan qaldırılması ilə əlaqədar olaraq, blokun qalan hissəsi bütün prefikslərə paylanmağa başladı və marşrutlaşdırıcı bütün BGP marşrutlarını digər magistralların marşrutlaşdırıcılarına göndərməyə başladı. Təsadüfən, yeni marşrutlar avtomatik trafikin optimallaşdırılması sistemi tərəfindən digər marşrutlar üçün müəyyən edilmiş prioritet (200) ilə müqayisədə daha yüksək prioritetə ​​(yerli üstünlük 100) malik idi. Nəticədə, marşrutlaşdırmanı magistraldan çıxarmaq əvəzinə, daha yüksək prioritet BGP marşrutları sızdı, nəticədə digər magistrallara ünvanlanan trafik Atlantaya göndərildi ki, bu da marşrutlaşdırıcının həddindən artıq yüklənməsinə və şəbəkənin bir hissəsinin dağılmasına səbəb oldu.

BGP konfiqurasiya xətası Cloudflare-in 27 dəqiqə ərzində qəzaya uğramasına səbəb olur

Gələcəkdə oxşar hadisələrin baş verməməsi üçün bazar ertəsi günü Cloudflare-in magistral parametrlərində bir sıra dəyişikliklərin edilməsi planlaşdırılır. BGP seansları üçün maksimum prefiks sayına məhdudiyyət (maksimum-prefiks) əlavə olunacaq və bu, çoxlu prefikslər vasitəsilə ötürülürsə, problemli onurğa sütununu bloklayacaq. Əgər bu məhdudiyyət daha əvvəl əlavə edilsəydi, sözügedən problem Atlantada magistralın bağlanmasına səbəb olardı, lakin bütün şəbəkənin işinə təsir göstərməzdi, çünki Cloudflare şəbəkəsi fərdi magistralların sıradan çıxmasına imkan vermək üçün nəzərdə tutulmuşdur. Artıq qəbul edilmiş dəyişikliklər arasında, bir marşrutlaşdırıcının şəbəkənin digər hissələrində trafikə təsir göstərməsinə imkan verməyəcək yerli marşrutlar üçün prioritetlərin (yerli üstünlük) yenidən nəzərdən keçirilməsi qeyd olunur.

Mənbə: opennet.ru

Добавить комментарий