Kasalahan konfigurasi BGP nyababkeun Cloudflare ngadat salami 27 menit

Perusahaan Cloudflare, nyadiakeun jaringan pangiriman eusi pikeun 27 juta sumber Internet sarta ngalayanan lalulintas 13% tina 1000 situs panggedéna, teu katutup rinci kajadian, salaku hasil tina karya loba bagéan tina jaringan Cloudflare ieu kaganggu pikeun 27 menit, kaasup nu jawab delivering lalulintas ka London, Chicago, Los Angeles, Washington, Amsterdam, Paris, Moscow jeung St. . Masalahna disababkeun ku parobahan konfigurasi anu salah dina router Atlanta. Salila kajadian, anu lumangsung dina 17 Juli ti 21:12 ka 21:39 (UTC), total volume lalulintas dina jaringan Cloudflare turun ku kira 50%.

Kasalahan konfigurasi BGP nyababkeun Cloudflare ngadat salami 27 menit

Salila karya teknis, wanting miceun bagian tina lalulintas ti salah sahiji tulang tonggong, insinyur ngahapus hiji garis dina blok setelan nu ngahartikeun daptar ruteu katampa ngaliwatan tulang tonggong, disaring luyu jeung daptar husus tina awalan. Éta leres pikeun nganonaktipkeun sadayana blok, tapi ku kasalahan ngan ukur garis sareng daptar awalan anu dihapus.

{master[édit] atl01 # nunjukkeun | ngabandingkeun
[édit kawijakan-pilihan kawijakan-pernyataan 6-BBONE-OUT istilah 6-SITE-LOCAL ti] ! teu aktip: prefiks-list 6-SITE-LOCAL { … }

Blok eusi:

ti {
awalan-daptar 6-SITE-LOKAL;
}
saterusna {
lokal-resep 200;
komunitas nambahkeun SITE-LOKAL-ROUTE;
komunitas nambahkeun ATL01;
komunitas nambahkeun kalér-Amérika;
narima;
}

Kusabab ngaleungitkeun panyambungan kana daptar prefiks, sésa-sésa blok mimiti disebarkeun ka sadaya awalan sareng router mimiti ngirimkeun sadaya rute BGP na ka router tulang tonggong anu sanés. Ku kabeneran, ruteu anyar miboga prioritas luhur (lokal-resep 200) dibandingkeun jeung prioritas (100) Nyetél pikeun ruteu séjén ku sistem optimasi lalulintas otomatis. Hasilna, tinimbang miceun routing tina tulang tonggong, ruteu BGP prioritas luhur bocor, salaku hasil tina lalulintas ditujukan pikeun tulang tonggong séjén dikirim ka Atlanta, nu ngarah ka overload tina router jeung runtuhna bagian tina jaringan.

Kasalahan konfigurasi BGP nyababkeun Cloudflare ngadat salami 27 menit

Pikeun nyegah kajadian anu sami dina mangsa nu bakal datang, sababaraha parobihan direncanakeun bakal dilakukeun kana setélan backbon Cloudflare dina Senén. Watesan jumlah maksimum awalan (maksimum-awalan) bakal ditambahkeun pikeun sesi BGP, nu bakal meungpeuk tulang tonggong masalah lamun loba teuing awalan anu routed ngaliwatan eta. Mun pangwatesan ieu geus ditambahkeun saméméhna, masalah sual bakal ngakibatkeun shutdown tina tulang tonggong di Atlanta, tapi moal bakal mangaruhan operasi sakabéh jaringan, saprak jaringan Cloudflare dirancang pikeun ngidinan tulang tonggong individu gagal. Diantara parobihan anu parantos diadopsi, révisi prioritas (pilihan lokal) pikeun rute lokal kacatet, anu moal ngijinkeun hiji router pikeun mangaruhan lalu lintas di bagian séjén jaringan.

sumber: opennet.ru

Tambahkeun komentar