Mae gwall cyfluniad BGP yn achosi i Cloudflare ddamwain am 27 munud

Cwmni Cloudflare, darparu rhwydwaith darparu cynnwys ar gyfer 27 miliwn o adnoddau Rhyngrwyd ac yn gwasanaethu traffig 13% o'r 1000 o wefannau mwyaf, dadorchuddio manylion y digwyddiad, ac o ganlyniad amharwyd ar waith llawer o segmentau o rwydwaith Cloudflare am 27 munud, gan gynnwys y rhai sy'n gyfrifol am gludo traffig i Lundain, Chicago, Los Angeles, Washington, Amsterdam, Paris, Moscow a St. . Achoswyd y broblem gan newid cyfluniad anghywir ar y llwybrydd Atlanta. Yn ystod y digwyddiad, a ddigwyddodd ar 17 Gorffennaf rhwng 21:12 a 21:39 (UTC), gostyngodd cyfanswm y traffig ar rwydwaith Cloudflare tua 50%.

Mae gwall cyfluniad BGP yn achosi i Cloudflare ddamwain am 27 munud

Yn ystod y gwaith technegol, yn awyddus i gael gwared ar ran o'r traffig o un o'r asgwrn cefn, fe wnaeth peirianwyr ddileu un llinell yn y bloc gosodiadau sy'n diffinio'r rhestr o lwybrau a dderbynnir trwy'r asgwrn cefn, wedi'i hidlo yn unol Γ’'r rhestr ragodiadau penodedig. Byddai wedi bod yn gywir dadactifadu'r bloc cyfan, ond trwy gamgymeriad dim ond y llinell gyda'r rhestr rhagddodiaid a gafodd ei dileu.

{master}[edit] atl01# sioe | cymharer
[golygu polisi-dewisiadau polisi-datganiad 6-BBONE-OUT term 6-SITE-LOCAL from] ! anactif: rhagddodiad-rhestr 6-SITE-LOCAL { … }

Rhwystro cynnwys:

o {
rhagddodiad-rhestr 6-SITE-LLEOL;
}
yna {
dewis lleol 200;
cymuned ychwanegu SAFLE-LLEOL-LLWYBR;
cymuned ychwanegu ATL01;
cymuned ychwanegu GOGLEDD-AMERICA;
derbyn;
}

Oherwydd dileu'r rhwymiad i'r rhestr o ragddodiaid, dechreuwyd dosbarthu'r rhan sy'n weddill o'r bloc i bob rhagddodiad a dechreuodd y llwybrydd anfon ei holl lwybrau BGP i lwybryddion asgwrn cefn eraill. Trwy gyd-ddigwyddiad, roedd gan y llwybrau newydd flaenoriaeth uwch (dewis lleol 200) o gymharu Γ’'r flaenoriaeth (100) a osodwyd ar gyfer llwybrau eraill gan y system optimeiddio traffig awtomatig. O ganlyniad, yn lle tynnu llwybro o asgwrn cefn, gollyngwyd llwybrau BGP Γ’ blaenoriaeth uwch, ac o ganlyniad anfonwyd traffig wedi'i gyfeirio at asgwrn cefn eraill i Atlanta, a arweiniodd at orlwytho'r llwybrydd a chwymp rhan o'r rhwydwaith.

Mae gwall cyfluniad BGP yn achosi i Cloudflare ddamwain am 27 munud

Er mwyn atal digwyddiadau tebyg rhag digwydd yn y dyfodol, mae nifer o newidiadau ar y gweill i'w gwneud i osodiadau asgwrn cefn Cloudflare ddydd Llun. Bydd cyfyngiad ar uchafswm nifer y rhagddodiaid (uchafswm-rhagddodiad) yn cael ei ychwanegu ar gyfer sesiynau BGP, a fydd yn rhwystro asgwrn cefn problemus os bydd gormod o rhagddodiaid yn cael eu cyfeirio drwyddo. Pe bai'r cyfyngiad hwn wedi'i ychwanegu'n gynharach, byddai'r broblem dan sylw wedi arwain at gau'r asgwrn cefn yn Atlanta, ond ni fyddai wedi effeithio ar weithrediad y rhwydwaith cyfan, gan fod rhwydwaith Cloudflare wedi'i gynllunio i ganiatΓ‘u i asgwrn cefn unigol fethu. Ymhlith y newidiadau a fabwysiadwyd eisoes, nodir adolygiad o flaenoriaethau (dewis lleol) ar gyfer llwybrau lleol, na fydd yn caniatΓ‘u i un llwybrydd ddylanwadu ar draffig mewn rhannau eraill o'r rhwydwaith.

Ffynhonnell: opennet.ru

Ychwanegu sylw