Kesalahan konfigurasi BGP nyebabake Cloudflare nabrak nganti 27 menit

Perusahaan Cloudflare, nyediakake jaringan pangiriman konten kanggo 27 yuta sumber daya Internet lan nglayani lalu lintas 13% saka 1000 situs paling gedhe, katutup rincian kedadean, minangka asil kang karya akeh perangan saka jaringan Cloudflare disrupted kanggo 27 menit, kalebu sing tanggung jawab kanggo ngirim lalu lintas menyang London, Chicago, Los Angeles, Washington, Amsterdam, Paris, Moscow lan St. . Masalah kasebut disebabake owah-owahan konfigurasi sing salah ing router Atlanta. Sajrone kedadeyan kasebut, sing kedadeyan tanggal 17 Juli saka 21:12 nganti 21:39 (UTC), volume total lalu lintas ing jaringan Cloudflare mudhun kira-kira 50%.

 Kesalahan konfigurasi BGP nyebabake Cloudflare nabrak nganti 27 menit

Sajrone karya teknis, pengin mbusak bagean saka lalu lintas saka salah siji backbones, engineers mbusak siji baris ing blok setelan sing nemtokake dhaptar rute sing ditampa liwat backbone, disaring miturut dhaptar prefiks kasebut. Pancen bener kanggo mateni kabeh blok, nanging kanthi ora sengaja mung baris kanthi dhaptar prefiks sing dibusak.

{master}[suntingan] atl01# acara | mbandhingake
[sunting kabijakan-pilihan-pernyataan-kabijakan 6-BBONE-OUT istilah 6-SITE-LOKAL saka]! ora aktif: prefix-list 6-SITE-LOCAL { … }

Blok konten:

saka {
ater-ater-dhaftar 6-SITE-LOKAL;
}
banjur {
preferensi lokal 200;
komunitas nambah SITE-LOCAL-ROUTE;
komunitas nambah ATL01;
komunitas nambah LOR-AMERIKA;
nampani;
}

Amarga mbusak ikatan karo dhaptar ater-ater, bagean blok sing isih ana wiwit disebarake menyang kabeh awalan lan router wiwit ngirim kabeh rute BGP menyang router saka backbone liyane. Kanthi kebetulan, rute anyar duwe prioritas sing luwih dhuwur (preferensi lokal 200) dibandhingake karo prioritas (100) sing disetel kanggo rute liyane kanthi sistem optimasi lalu lintas otomatis. Akibaté, tinimbang mbusak rute saka backbone, rute BGP prioritas sing luwih dhuwur bocor, minangka asil lalu lintas sing ditujokake menyang backbone liyane dikirim menyang Atlanta, sing nyebabake kakehan router lan ambruk bagean jaringan.

 Kesalahan konfigurasi BGP nyebabake Cloudflare nabrak nganti 27 menit

Kanggo nyegah kedadeyan sing padha ing mangsa ngarep, sawetara owah-owahan direncanakake bakal ditindakake ing setelan backbon Cloudflare ing dina Senin. Watesan ing jumlah maksimum ater-ater (maksimum-awalan) bakal ditambahake kanggo sesi BGP, kang bakal mblokir backbone masalah yen kakehan ater-ater sing routed liwat. Yen watesan iki wis ditambahake sadurungé, masalah ing pitakonan bakal mimpin kanggo mati saka backbone ing Atlanta, nanging ora bakal mengaruhi operasi kabeh jaringan, wiwit jaringan Cloudflare dirancang kanggo ngidini backbones individu kanggo gagal. Antarane owah-owahan sing wis diadopsi, revisi prioritas (preferensi lokal) kanggo rute lokal kacathet, sing ora bakal ngidini siji router mengaruhi lalu lintas ing bagean liya saka jaringan.

Source: opennet.ru

Add a comment