BGP-ի կազմաձևման սխալը հանգեցնում է Cloudflare-ի խափանման 27 րոպեի ընթացքում

Cloudflare ընկերությունը, ապահովելով բովանդակության առաքման ցանց 27 միլիոն ինտերնետ ռեսուրսների համար և սպասարկում է 13 խոշորագույն կայքերի 1000%-ի տրաֆիկը, բացահայտվեց միջադեպի մանրամասները, ինչի հետևանքով Cloudflare ցանցի բազմաթիվ հատվածների աշխատանքը 27 րոպեով խափանվել է, այդ թվում՝ Լոնդոն, Չիկագո, Լոս Անջելես, Վաշինգտոն, Ամստերդամ, Փարիզ, Մոսկվա և Սանկտ Պետերբուրգ երթևեկություն հասցնելու համար պատասխանատուներին։ . Խնդիրն առաջացել է Ատլանտայի երթուղիչի սխալ կազմաձևման փոփոխության պատճառով: Միջադեպի ժամանակ, որը տեղի է ունեցել հուլիսի 17-ին, ժամը 21:12-ից մինչև 21:39 (UTC), Cloudflare ցանցի ընդհանուր տրաֆիկի ծավալը նվազել է մոտավորապես 50%-ով:

BGP-ի կազմաձևման սխալը հանգեցնում է Cloudflare-ի խափանման 27 րոպեի ընթացքում

Տեխնիկական աշխատանքի ընթացքում, ցանկանալով հեռացնել երթևեկության մի մասը ողնաշարներից մեկից, ինժեներները ջնջել են մեկ տող պարամետրերի բլոկում, որը սահմանում է ողնաշարի միջոցով ընդունված երթուղիների ցանկը, որը զտվել է ըստ նախածանցների նշված ցանկի: Ճիշտ կլիներ ապաակտիվացնել ամբողջ բլոկը, բայց սխալմամբ ջնջվեց միայն նախածանցների ցանկով տողը:

{master}[edit] atl01# շոու | համեմատել
[edit Policy-options Policy-statement 6-BBONE-OUT term 6-SITE-LOCAL from] ! անգործուն. նախածանցների ցուցակ 6-SITE-LOCAL { … }

Արգելափակել բովանդակությունը.

սկսած {
prefix-list 6-SITE-LOCAL;
}
ապա {
տեղական-նախապատվություն 200;
համայնք ավելացնել SITE-LOCAL-ROUTE;
համայնքի ավելացում ATL01;
համայնք ավելացնել ՀՅՈՒՍԻՍԱՅԻՆ ԱՄԵՐԻԿԱ;
ընդունել;
}

Նախածանցների ցանկի հետ կապված կապի հեռացման պատճառով բլոկի մնացած մասը սկսեց բաշխվել բոլոր նախածանցներին, և երթուղիչը սկսեց ուղարկել իր բոլոր BGP երթուղիները այլ ողնաշարի երթուղիչներ: Պատահականորեն, նոր երթուղիներն ունեին ավելի բարձր առաջնահերթություն (տեղական նախապատվություն 200)՝ համեմատած երթևեկության ավտոմատ օպտիմալացման համակարգի կողմից այլ երթուղիների համար սահմանված առաջնահերթության (100) հետ: Արդյունքում երթուղիները ողնաշարից հանելու փոխարեն արտահոսեցին ավելի առաջնահերթության BGP երթուղիները, ինչի արդյունքում այլ ողնաշարեր հասցեագրված երթևեկությունը ուղարկվեց Ատլանտա, ինչը հանգեցրեց երթուղիչի ծանրաբեռնվածությանը և ցանցի մի մասի փլուզմանը:

BGP-ի կազմաձևման սխալը հանգեցնում է Cloudflare-ի խափանման 27 րոպեի ընթացքում

Ապագայում նմանատիպ միջադեպեր թույլ չտալու համար երկուշաբթի նախատեսվում է մի քանի փոփոխություններ կատարել Cloudflare-ի backbon-ի կարգավորումներում։ BGP նիստերի համար կավելացվի նախածանցների առավելագույն քանակի սահմանափակում (maximum-prefix), որը կարգելափակի խնդրահարույց ողնաշարը, եթե չափազանց շատ նախածանցներ անցնեն դրա միջով: Եթե ​​այս սահմանափակումն ավելի վաղ ավելացվեր, ապա խնդրո առարկա խնդիրը կհանգեցներ Ատլանտայում ողնաշարի անջատմանը, բայց չէր ազդի ամբողջ ցանցի աշխատանքի վրա, քանի որ Cloudflare ցանցը նախատեսված է առանձին ողնաշարի ձախողման համար: Արդեն ընդունված փոփոխություններից նշվում է տեղական երթուղիների առաջնահերթությունների վերանայում (տեղական-նախապատվություն), որը թույլ չի տա մեկ երթուղիչին ազդել ցանցի այլ մասերում երթեւեկության վրա։

Source: opennet.ru

Добавить комментарий