BGP-konfiguraasjeflater feroarsaket dat Cloudflare 27 minuten crasht

Cloudflare Company, foarsjen netwurk foar levering fan ynhâld foar 27 miljoen ynternetboarnen en betsjinje it ferkear fan 13% fan 'e 1000 grutste siden, ûntdutsen details fan it ynsidint, as gefolch wêrfan it wurk fan in protte segminten fan it Cloudflare-netwurk foar 27 minuten fersteurd waard, ynklusyf dyjingen dy't ferantwurdlik binne foar it leverjen fan ferkear nei Londen, Chicago, Los Angeles, Washington, Amsterdam, Parys, Moskou en St. . It probleem waard feroarsake troch in ferkearde konfiguraasje feroaring op de Atlanta router. Tidens it ynsidint, dat barde op 17 july fan 21:12 oant 21:39 (UTC), sakke it totale folume fan ferkear op it Cloudflare-netwurk mei sawat 50%.

BGP-konfiguraasjeflater feroarsaket dat Cloudflare 27 minuten crasht

Tidens de technyske wurk, wollen fuortsmite in part fan it ferkear út ien fan 'e rêchbonken, yngenieurs wiske ien rigel yn de ynstellings blok dat definiearret de list fan rûtes akseptearre troch de rêchbonke, filtere yn oerienstimming mei de oantsjutte list fan foarheaksels. It soe krekt west hawwe om it hiele blok út te skeakeljen, mar by fersin waard allinnich de rigel mei de list mei foarheaksels wiske.

{master}[bewurkje] atl01# sjen litte | ferlykje
[bewurkje belied-opsjes beliedsferklearring 6-BBONE-OUT term 6-SITE-LOKAAL fan]! ynaktyf: prefix-list 6-SITE-LOCAL { … }

Ynhâld blokkearje:

fan {
prefix-list 6-SITE-LOCAL;
}
dan {
lokale-foarkar 200;
mienskip tafoegje SITE-LOCAL-ROUTE;
mienskip tafoegje ATL01;
mienskip tafoegje NOORD-AMERIKA;
oannimme;
}

Troch it fuortheljen fan 'e bining oan' e list mei foarheaksels begon it oerbleaune diel fan 'e blok te fersprieden nei alle foarheaksels en begon de router al syn BGP-rûtes te stjoeren nei routers fan oare rêchbonken. Troch tafal hienen de nije rûtes in hegere prioriteit (lokaal-foarkar 200) yn ferliking mei de prioriteit (100) dy't foar oare rûtes ynsteld is troch it automatysk ferkearsoptimalisaasjesysteem. As gefolch, ynstee fan it fuortheljen fan routing fan 'e rêchbonke, waarden BGP-rûtes mei hegere prioriteit útlekt, as gefolch wêrfan ferkear dat rjochte is oan oare rêchbonken nei Atlanta stjoerd waard, wat late ta oerlêst fan' e router en it ynstoarten fan in diel fan it netwurk.

BGP-konfiguraasjeflater feroarsaket dat Cloudflare 27 minuten crasht

Om foar te kommen dat ferlykbere ynsidinten yn 'e takomst foarkomme, binne ferskate feroaringen pland om moandei te meitsjen oan' e backbon-ynstellingen fan Cloudflare. In limyt op it maksimum oantal foarheaksels (maksimum-foarheaksel) sil tafoege wurde foar BGP sesjes, dat sil blokkearje in problematyske rêchbonke as tefolle foarheaksels wurde trochstjoerd. As dizze beheining earder tafoege wie, soe it probleem yn kwestje liede ta it ôfsluten fan 'e rêchbonke yn Atlanta, mar soe de wurking fan it hiele netwurk net beynfloede hawwe, om't it Cloudflare-netwurk is ûntwurpen om yndividuele rêchbonken te mislearjen. Under de wizigingen dy't al oannommen binne, wurdt in revyzje fan prioriteiten (lokaal-foarkar) foar lokale rûtes opmurken, dy't ien router net tastean om ferkear yn oare dielen fan it netwurk te beynfloedzjen.

Boarne: opennet.ru

Add a comment