BGP konfiguratsiya xatosi Cloudflare 27 daqiqa davomida ishdan chiqishiga olib keladi

Cloudflare kompaniyasi, ta'minlash 27 million Internet-resurslar uchun kontentni etkazib berish tarmog'i va 13 ta eng yirik saytlarning 1000% trafikiga xizmat ko'rsatadi; oshkor bo'ldi voqea tafsilotlari, buning natijasida Cloudflare tarmog'ining ko'plab segmentlarining ishi 27 daqiqa davomida, shu jumladan London, Chikago, Los-Anjeles, Vashington, Amsterdam, Parij, Moskva va Sankt-Peterburgga trafikni etkazib berish uchun mas'ul bo'lganlar ishi to'xtatildi. . Muammo Atlanta routerida noto'g'ri konfiguratsiya o'zgarishi tufayli yuzaga kelgan. 17-iyul kuni soat 21:12 dan 21:39 (UTC) ga qadar sodir bo'lgan voqea paytida Cloudflare tarmog'idagi umumiy trafik hajmi taxminan 50% ga kamaydi.

BGP konfiguratsiya xatosi Cloudflare 27 daqiqa davomida ishdan chiqishiga olib keladi

Texnik ish davomida, magistrallardan biridan trafikning bir qismini olib tashlashni istagan muhandislar, belgilangan prefikslar ro'yxatiga muvofiq filtrlangan magistral orqali qabul qilinadigan marshrutlar ro'yxatini belgilaydigan sozlash blokidagi bitta qatorni o'chirib tashladilar. Butun blokni o'chirib qo'yish to'g'ri bo'lar edi, lekin xato bilan faqat prefikslar ro'yxati bilan qator o'chirildi.

{master[tahrirlash] atl01# ko'rsatuv | solishtiring
[tahrirlash siyosati-opsiyalari siyosati-bayonoti 6-BBONE-OUT muddati 6-SITE-LOCAL dan] ! faol emas: prefiks roʻyxati 6-SITE-LOCAL {…}

Kontentni bloklash:

dan {
prefiks ro'yxati 6-SITE-LOCAL;
}
keyin {
mahalliy-afzal 200;
hamjamiyat SITE-LOCAL-ROUTE qo'shish;
hamjamiyat qo'shish ATL01;
hamjamiyat qo'shish Shimoliy Amerika;
qabul qilish;
}

Prefikslar ro'yxatiga bog'lanish olib tashlanganligi sababli, blokning qolgan qismi barcha prefikslarga taqsimlana boshladi va yo'riqnoma o'zining barcha BGP marshrutlarini boshqa magistrallarning marshrutizatorlariga yuborishni boshladi. Tasodifan yangi marshrutlar avtotransportni optimallashtirish tizimi tomonidan boshqa yoʻnalishlar uchun oʻrnatilgan ustuvorlik (200) bilan solishtirganda yuqoriroq ustuvorlikka ega boʻldi (mahalliy afzallik 100). Natijada, magistraldan marshrutlashni olib tashlash o'rniga, yuqoriroq ustuvor BGP marshrutlari sizib chiqdi, buning natijasida boshqa magistrallarga yo'naltirilgan trafik Atlantaga jo'natildi, bu marshrutizatorning haddan tashqari yuklanishiga va tarmoqning bir qismining qulashiga olib keldi.

BGP konfiguratsiya xatosi Cloudflare 27 daqiqa davomida ishdan chiqishiga olib keladi

Kelajakda shunga o'xshash hodisalarning oldini olish uchun dushanba kuni Cloudflare-ning asosiy sozlamalariga bir nechta o'zgartirishlar kiritilishi rejalashtirilgan. BGP seanslari uchun prefikslarning maksimal soniga (maksimal-prefiks) cheklov qo'shiladi, agar u orqali juda ko'p prefikslar yo'naltirilsa, muammoli magistralni bloklaydi. Agar ushbu cheklov avvalroq qo‘shilgan bo‘lsa, ko‘rib chiqilayotgan muammo Atlantadagi magistralning yopilishiga olib kelgan bo‘lardi, lekin butun tarmoqning ishlashiga ta’sir qilmasdi, chunki Cloudflare tarmog‘i alohida magistrallarning ishdan chiqishiga yo‘l qo‘yish uchun yaratilgan. Qabul qilingan o'zgarishlar orasida mahalliy yo'nalishlar uchun ustuvorliklarni qayta ko'rib chiqish (mahalliy afzallik) qayd etilgan, bu bitta yo'riqnoma tarmoqning boshqa qismlaridagi trafikka ta'sir qilishiga imkon bermaydi.

Manba: opennet.ru

a Izoh qo'shish