Gollyngiad Llwybr BGP yn Arwain at Ddatgysylltu Anferth ar y Rhyngrwyd

Cwmni Cloudflare cyhoeddi adroddiad ar y digwyddiad ddoe, a arweiniodd at tair awr o 13:34 i 16:26 (MSK) roedd problemau gyda mynediad i lawer o adnoddau ar y rhwydwaith byd-eang, gan gynnwys seilwaith Cloudflare, Facebook, Akamai, Apple, Linode ac Amazon AWS. Problemau yn seilwaith Cloudflare, sy'n darparu CDN ar gyfer 16 miliwn o safleoedd, arsylwyd o 14:02 i 16:02 (MSK). Mae Cloudflare yn amcangyfrif bod tua 15% o draffig byd-eang wedi'i golli yn ystod y cyfnod segur.

Y broblem oedd achosir Gollyngiad llwybr BGP, pan gafodd tua 20 mil o rhagddodiaid ar gyfer 2400 o rwydweithiau eu hailgyfeirio'n anghywir. Ffynhonnell y gollyngiad oedd y darparwr DQE Communications, a ddefnyddiodd y feddalwedd Optimizer BGP i optimeiddio llwybro. Mae BGP Optimizer yn rhannu rhagddodiaid IP yn rhai llai, er enghraifft rhannu 104.20.0.0/20 yn 104.20.0.0/21 a 104.20.8.0/21, ac o ganlyniad, cadwodd DQE Communications nifer fawr o lwybrau penodol ar ei ochr sy'n gor-redeg mwy. llwybrau rhai cyffredinol (h.y. yn lle llwybrau cyffredinol i Cloudflare, defnyddiwyd llwybrau mwy gronynnog i is-rwydweithiau Cloudflare penodol).

Cyhoeddwyd y llwybrau pwynt hyn i un o'r cleientiaid (Allegheny Technologies, AS396531), a oedd hefyd Γ’ chysylltiad trwy ddarparwr arall. Darlledodd Allegheny Technologies y llwybrau canlyniadol i ddarparwr trafnidiaeth arall (Verizon, AS701). Oherwydd y diffyg hidlo cywir o gyhoeddiadau BGP a chyfyngiadau ar nifer y rhagddodiaid, cododd Verizon y cyhoeddiad hwn a darlledodd yr 20 mil o rhagddodiaid dilynol i weddill y Rhyngrwyd. Roedd rhagddodiaid anghywir, oherwydd eu maintioli, yn cael eu hystyried yn flaenoriaeth uwch gan fod gan lwybr penodol flaenoriaeth uwch nag un cyffredinol.

Gollyngiad Llwybr BGP yn Arwain at Ddatgysylltu Anferth ar y Rhyngrwyd

O ganlyniad, dechreuodd traffig ar gyfer llawer o rwydweithiau mawr gael ei gyfeirio trwy Verizon i'r darparwr bach DQE Communications, nad oedd yn gallu ymdopi Γ’'r traffig ymchwydd, a arweiniodd at gwymp (mae'r effaith yn debyg i ddisodli rhan o draffordd brysur gyda a ffordd wledig).

I atal digwyddiadau tebyg rhag digwydd yn y dyfodol
argymhellir:

  • Defnyddio gwirio cyhoeddiadau sy'n seiliedig ar RPKI (Dilysiad Tarddiad BGP, yn caniatΓ‘u derbyn cyhoeddiadau gan berchnogion rhwydwaith yn unig);
  • Cyfyngu ar uchafswm nifer y rhagddodiaid a dderbynnir ar gyfer pob sesiwn EBGP (byddai'r gosodiad rhagddodiad uchaf yn helpu i ddileu trosglwyddiad 20 mil o rhagddodiaid o fewn un sesiwn ar unwaith);
  • Cymhwyso hidlo yn seiliedig ar y gofrestr IRR (Cofrestrfa Llwybro Rhyngrwyd, sy'n pennu'r ASes y caniateir llwybro rhagddodiaid penodedig);
  • Defnyddiwch y gosodiadau blocio rhagosodedig a argymhellir yn RFC 8212 ar lwybryddion ('gwadu diofyn');
  • Rhoi'r gorau i ddefnyddio optimizers BGP yn ddi-hid.

Gollyngiad Llwybr BGP yn Arwain at Ddatgysylltu Anferth ar y Rhyngrwyd

Ffynhonnell: opennet.ru

Ychwanegu sylw