BGP-konfigurasiefout veroorsaak dat Cloudflare vir 27 minute ineenstort

Cloudflare Maatskappy, verskaffing inhoudafleweringsnetwerk vir 27 miljoen internetbronne en die verkeer van 13% van die 1000 grootste werwe bedien, onbedek besonderhede van die voorval, as gevolg waarvan die werk van baie segmente van die Cloudflare-netwerk vir 27 minute ontwrig is, insluitend diegene wat verantwoordelik is vir die lewering van verkeer na Londen, Chicago, Los Angeles, Washington, Amsterdam, Parys, Moskou en St. . Die probleem is veroorsaak deur 'n verkeerde konfigurasieverandering op die Atlanta-roeteerder. Tydens die voorval, wat op 17 Julie van 21:12 tot 21:39 (UTC) plaasgevind het, het die totale volume verkeer op die Cloudflare-netwerk met ongeveer 50% afgeneem.

BGP-konfigurasiefout veroorsaak dat Cloudflare vir 27 minute ineenstort

Tydens die tegniese werk, wat 'n deel van die verkeer van een van die ruggraat wou verwyder, het ingenieurs een reΓ«l in die instellingsblok uitgevee wat die lys roetes definieer wat deur die ruggraat aanvaar word, gefiltreer in ooreenstemming met die gespesifiseerde lys voorvoegsels. Dit sou korrek gewees het om die hele blok te deaktiveer, maar per ongeluk is net die reΓ«l met die lys van voorvoegsels uitgevee.

{meester}[wysig] atl01# wys | vergelyk
[wysig beleid-opsies beleidsverklaring 6-BBONE-UIT termyn 6-WERF-PLAAS vanaf] ! onaktief: voorvoegsel-lys 6-WERF-PLAASLIK { … }

Blokkeer inhoud:

van {
voorvoegsel-lys 6-SITE-PLAATS;
}
dan {
plaaslike-voorkeur 200;
gemeenskap voeg WERF-PLAASLIK-ROETE;
gemeenskap voeg ATL01;
gemeenskap voeg NOORD-AMERIKA;
aanvaar;
}

As gevolg van die verwydering van die binding aan die lys van voorvoegsels, het die oorblywende deel van die blok na alle voorvoegsels begin versprei word en die router het begin om al sy BGP-roetes na routers van ander ruggraat te stuur. Toevallig het die nuwe roetes 'n hoΓ«r prioriteit (plaaslike voorkeur 200) gehad in vergelyking met die prioriteit (100) wat vir ander roetes gestel is deur die outomatiese verkeersoptimeringstelsel. As gevolg hiervan, in plaas daarvan om roetes van die ruggraat te verwyder, het hoΓ«r prioriteit BGP-roetes uitgelek, as gevolg waarvan verkeer wat na ander ruggraat gerig is na Atlanta gestuur is, wat gelei het tot oorlading van die roeteerder en die ineenstorting van 'n deel van die netwerk.

BGP-konfigurasiefout veroorsaak dat Cloudflare vir 27 minute ineenstort

Om te voorkom dat soortgelyke voorvalle in die toekoms plaasvind, word beplan om Maandag verskeie veranderinge aan Cloudflare se ruggraatinstellings aan te bring. 'n Beperking op die maksimum aantal voorvoegsels (maksimum-voorvoegsel) sal bygevoeg word vir BGP-sessies, wat 'n problematiese ruggraat sal blokkeer as te veel voorvoegsels daardeur gelei word. As hierdie beperking vroeΓ«r bygevoeg is, sou die betrokke probleem gelei het tot die sluiting van die ruggraat in Atlanta, maar sou nie die werking van die hele netwerk beΓ―nvloed het nie, aangesien die Cloudflare-netwerk ontwerp is om individuele ruggraat te laat misluk. Onder die veranderinge wat reeds aangeneem is, word 'n hersiening van prioriteite (plaaslike voorkeur) vir plaaslike roetes opgemerk, wat nie een roeteerder sal toelaat om verkeer in ander dele van die netwerk te beΓ―nvloed nie.

Bron: opennet.ru

Voeg 'n opmerking