Gollyngiad Llwybr BGP yn Arwain at Ddatgysylltu Anferth ar y Rhyngrwyd
Cwmni Cloudflare cyhoeddi adroddiad ar y digwyddiad ddoe, a arweiniodd at tair awr o 13:34 i 16:26 (MSK) roedd problemau gyda mynediad i lawer o adnoddau ar y rhwydwaith byd-eang, gan gynnwys seilwaith Cloudflare, Facebook, Akamai, Apple, Linode ac Amazon AWS. Problemau yn seilwaith Cloudflare, sy'n darparu CDN ar gyfer 16 miliwn o safleoedd, arsylwyd o 14:02 i 16:02 (MSK). Mae Cloudflare yn amcangyfrif bod tua 15% o draffig byd-eang wedi'i golli yn ystod y cyfnod segur.
Y broblem oedd achosir Gollyngiad llwybr BGP, pan gafodd tua 20 mil o rhagddodiaid ar gyfer 2400 o rwydweithiau eu hailgyfeirio'n anghywir. Ffynhonnell y gollyngiad oedd y darparwr DQE Communications, a ddefnyddiodd y feddalwedd Optimizer BGP i optimeiddio llwybro. Mae BGP Optimizer yn rhannu rhagddodiaid IP yn rhai llai, er enghraifft rhannu 104.20.0.0/20 yn 104.20.0.0/21 a 104.20.8.0/21, ac o ganlyniad, cadwodd DQE Communications nifer fawr o lwybrau penodol ar ei ochr sy'n gor-redeg mwy. llwybrau rhai cyffredinol (h.y. yn lle llwybrau cyffredinol i Cloudflare, defnyddiwyd llwybrau mwy gronynnog i is-rwydweithiau Cloudflare penodol).
Cyhoeddwyd y llwybrau pwynt hyn i un o'r cleientiaid (Allegheny Technologies, AS396531), a oedd hefyd Γ’ chysylltiad trwy ddarparwr arall. Darlledodd Allegheny Technologies y llwybrau canlyniadol i ddarparwr trafnidiaeth arall (Verizon, AS701). Oherwydd y diffyg hidlo cywir o gyhoeddiadau BGP a chyfyngiadau ar nifer y rhagddodiaid, cododd Verizon y cyhoeddiad hwn a darlledodd yr 20 mil o rhagddodiaid dilynol i weddill y Rhyngrwyd. Roedd rhagddodiaid anghywir, oherwydd eu maintioli, yn cael eu hystyried yn flaenoriaeth uwch gan fod gan lwybr penodol flaenoriaeth uwch nag un cyffredinol.
O ganlyniad, dechreuodd traffig ar gyfer llawer o rwydweithiau mawr gael ei gyfeirio trwy Verizon i'r darparwr bach DQE Communications, nad oedd yn gallu ymdopi Γ’'r traffig ymchwydd, a arweiniodd at gwymp (mae'r effaith yn debyg i ddisodli rhan o draffordd brysur gyda a ffordd wledig).
I atal digwyddiadau tebyg rhag digwydd yn y dyfodol argymhellir:
Defnyddio gwirio cyhoeddiadau sy'n seiliedig ar RPKI (Dilysiad Tarddiad BGP, yn caniatΓ‘u derbyn cyhoeddiadau gan berchnogion rhwydwaith yn unig);
Cyfyngu ar uchafswm nifer y rhagddodiaid a dderbynnir ar gyfer pob sesiwn EBGP (byddai'r gosodiad rhagddodiad uchaf yn helpu i ddileu trosglwyddiad 20 mil o rhagddodiaid o fewn un sesiwn ar unwaith);
Cymhwyso hidlo yn seiliedig ar y gofrestr IRR (Cofrestrfa Llwybro Rhyngrwyd, sy'n pennu'r ASes y caniateir llwybro rhagddodiaid penodedig);
Defnyddiwch y gosodiadau blocio rhagosodedig a argymhellir yn RFC 8212 ar lwybryddion ('gwadu diofyn');
Rhoi'r gorau i ddefnyddio optimizers BGP yn ddi-hid.