BGP конфигурациясының қатесі Cloudflare 27 минут бойы істен шығуына әкеледі

Cloudflare компаниясы, қамтамасыз ету 27 миллион интернет-ресурсқа арналған мазмұнды жеткізу желісі және 13 ең ірі сайттардың 1000% трафигіне қызмет көрсетеді, ашылды оқиғаның егжей-тегжейлері, соның салдарынан Cloudflare желісінің көптеген сегменттерінің жұмысы 27 минутқа үзілді, соның ішінде Лондон, Чикаго, Лос-Анджелес, Вашингтон, Амстердам, Париж, Мәскеу және Санкт-Петербургке трафикті жеткізуге жауаптылар. . Мәселе Атланта маршрутизаторындағы қате конфигурацияның өзгеруінен туындады. 17 шілдеде 21:12-ден 21:39-ға дейін (UTC) болған оқиға кезінде Cloudflare желісіндегі трафиктің жалпы көлемі шамамен 50%-ға қысқарды.

BGP конфигурациясының қатесі Cloudflare 27 минут бойы істен шығуына әкеледі

Техникалық жұмыс барысында магистральдардың бірінен трафиктің бір бөлігін алып тастауды қалайтын инженерлер префикстердің көрсетілген тізіміне сәйкес сүзгіленген магистраль арқылы қабылданған маршруттар тізімін анықтайтын параметрлер блогында бір жолды жойды. Бүкіл блокты өшіру дұрыс болар еді, бірақ қателіктен тек префикстер тізімі бар жол жойылды.

{шебер[өңдеу] atl01# көрсету | салыстыру
[өңдеу саясат-опциялар саясаты-мәлімдеме 6-BBONE-OUT мерзімі 6-SITE-LOCAL бастап] ! белсенді емес: префикс тізімі 6-SITE-LOCAL { … }

Мазмұнды блоктау:

бастап {
префикс тізімі 6-SITE-LOCAL;
}
содан кейін {
жергілікті артықшылық 200;
қауымдастық SITE-LOCAL-ROUTE қосу;
қауымдастық қосу ATL01;
қауымдастықты қосу СОЛТҮСТІК-АМЕРИКА;
қабылдау;
}

Префикстер тізіміне байланыстыруды жоюға байланысты блоктың қалған бөлігі барлық префикстерге таратыла бастады және маршрутизатор өзінің барлық BGP маршруттарын басқа магистральдардың маршрутизаторларына жібере бастады. Кездейсоқ жаңа маршруттар қозғалысты автоматты оңтайландыру жүйесі басқа маршруттар үшін белгіленген басымдықпен (200) салыстырғанда жоғары басымдыққа ие болды (жергілікті артықшылық 100). Нәтижесінде, магистральдан маршруттауды алып тастаудың орнына, басымдылығы жоғары BGP маршруттары ағып кетті, нәтижесінде басқа магистральдарға бағытталған трафик Атлантаға жіберілді, бұл маршрутизатордың шамадан тыс жүктелуіне және желінің бір бөлігінің бұзылуына әкелді.

BGP конфигурациясының қатесі Cloudflare 27 минут бойы істен шығуына әкеледі

Болашақта осындай оқиғалардың алдын алу үшін дүйсенбіде Cloudflare магистральдық параметрлеріне бірнеше өзгертулер енгізу жоспарлануда. BGP сеанстары үшін префикстердің ең көп санына (максималды-префикс) шектеу қосылады, ол арқылы тым көп префикстер бағытталса, проблемалық магистральді блоктайды. Егер бұл шектеу ертерек қосылған болса, қарастырылып отырған мәселе Атлантадағы магистральдық жүйенің тоқтап қалуына әкеліп соқтырар еді, бірақ бүкіл желінің жұмысына әсер етпес еді, өйткені Cloudflare желісі жеке магистральдардың істен шығуына мүмкіндік беру үшін жасалған. Қабылданған өзгерістердің ішінде бір маршрутизатор желінің басқа бөліктеріндегі трафикке әсер етуге мүмкіндік бермейтін жергілікті маршруттар үшін басымдықтарды (жергілікті артықшылықты) қайта қарау атап өтілді.

Ақпарат көзі: opennet.ru

пікір қалдыру