Hitilafu ya usanidi wa BGP husababisha Cloudflare kuacha kufanya kazi kwa dakika 27

Kampuni ya Cloudflare, kutoa mtandao wa uwasilishaji wa yaliyomo kwa rasilimali za mtandao milioni 27 na kuhudumia trafiki ya 13% ya tovuti 1000 kubwa zaidi, kufunuliwa maelezo ya tukio hilo, kutokana na kazi ya sehemu nyingi za mtandao wa Cloudflare kukatizwa kwa dakika 27, ikiwa ni pamoja na wale waliohusika na kupeleka trafiki London, Chicago, Los Angeles, Washington, Amsterdam, Paris, Moscow na St. . Tatizo lilisababishwa na mabadiliko sahihi ya usanidi kwenye kipanga njia cha Atlanta. Wakati wa tukio hilo, lililotokea Julai 17 kutoka 21:12 hadi 21:39 (UTC), jumla ya trafiki kwenye mtandao wa Cloudflare ilipungua kwa takriban 50%.

 Hitilafu ya usanidi wa BGP husababisha Cloudflare kuacha kufanya kazi kwa dakika 27

Wakati wa kazi ya kiufundi, wakitaka kuondoa sehemu ya trafiki kutoka kwa moja ya migongo, wahandisi walifuta mstari mmoja katika kuzuia mipangilio ambayo inafafanua orodha ya njia zilizokubaliwa kupitia uti wa mgongo, zilizochujwa kwa mujibu wa orodha maalum ya viambishi awali. Ingekuwa sahihi kulemaza kizuizi kizima, lakini kwa makosa tu mstari ulio na orodha ya viambishi awali ulifutwa.

{master}[edit] atl01# show | kulinganisha
[hariri matamko ya sera-chaguo-sera 6-BBONE-OUT neno 6-SITE-LOCAL kutoka] ! isiyotumika: orodha ya kiambishi awali 6-SITE-LOCAL { … }

Zuia maudhui:

kutoka {
kiambishi awali-orodha 6-SITE-LOCAL;
}
kisha {
mitaa-upendeleo 200;
jumuiya ongeza SITE-LOCAL-ROUTE;
jumuiya ongeza ATL01;
jumuiya ongeza AMERIKA KASKAZINI;
kukubali;
}

Kutokana na kuondolewa kwa kifungo kwa orodha ya viambishi awali, sehemu iliyobaki ya block ilianza kusambazwa kwa viambishi awali vyote na router ilianza kutuma njia zake zote za BGP kwa routers za backbones nyingine. Kwa bahati mbaya, njia mpya zilikuwa na kipaumbele cha juu (upendeleo wa eneo 200) ikilinganishwa na kipaumbele (100) kilichowekwa kwa njia zingine na mfumo wa uboreshaji wa trafiki otomatiki. Kama matokeo, badala ya kuondoa njia kutoka kwa uti wa mgongo, njia za kipaumbele za BGP zilivuja, kama matokeo ambayo trafiki iliyoelekezwa kwa migongo mingine ilitumwa Atlanta, ambayo ilisababisha upakiaji wa router na kuanguka kwa sehemu ya mtandao.

 Hitilafu ya usanidi wa BGP husababisha Cloudflare kuacha kufanya kazi kwa dakika 27

Ili kuzuia matukio kama haya kutokea katika siku zijazo, mabadiliko kadhaa yamepangwa kufanywa kwenye mipangilio ya uti wa mgongo wa Cloudflare siku ya Jumatatu. Kikomo cha idadi ya juu zaidi ya viambishi awali (kiambishi-kiambishi cha juu zaidi) kitaongezwa kwa vipindi vya BGP, ambacho kitazuia uti wa mgongo wenye matatizo ikiwa viambishi awali vingi sana vitapitishwa ndani yake. Ikiwa kizuizi hiki kingeongezwa mapema, shida inayohusika ingesababisha kuzimwa kwa uti wa mgongo huko Atlanta, lakini isingeathiri utendakazi wa mtandao mzima, kwani mtandao wa Cloudflare umeundwa kuruhusu mikongo ya kibinafsi kushindwa. Miongoni mwa mabadiliko yaliyopitishwa tayari, marekebisho ya vipaumbele (upendeleo wa ndani) kwa njia za mitaa huzingatiwa, ambayo haitaruhusu router moja kuathiri trafiki katika sehemu nyingine za mtandao.

Chanzo: opennet.ru

Kuongeza maoni