BGP کنفیگریشن کی خرابی Cloudflare کو 27 منٹ تک کریش کرنے کا سبب بنتی ہے۔

Cloudflare کمپنی، فراہم کرنا 27 ملین انٹرنیٹ وسائل کے لیے مواد کی ترسیل کا نیٹ ورک اور 13 سب سے بڑی سائٹس میں سے 1000% ٹریفک کی خدمت کرتا ہے، بے نقاب اس واقعے کی تفصیلات، جس کے نتیجے میں کلاؤڈ فلیئر نیٹ ورک کے بہت سے حصوں کا کام 27 منٹ تک متاثر ہوا، جن میں لندن، شکاگو، لاس اینجلس، واشنگٹن، ایمسٹرڈیم، پیرس، ماسکو اور سینٹ پیٹرزبرگ تک ٹریفک پہنچانے کے ذمہ دار بھی شامل ہیں۔ . مسئلہ اٹلانٹا راؤٹر پر کنفیگریشن کی غلط تبدیلی کی وجہ سے ہوا تھا۔ اس واقعے کے دوران، جو 17 جولائی کو 21:12 سے 21:39 (UTC) تک پیش آیا، Cloudflare نیٹ ورک پر ٹریفک کا کل حجم تقریباً 50% کم ہو گیا۔

BGP کنفیگریشن کی خرابی Cloudflare کو 27 منٹ تک کریش کرنے کا سبب بنتی ہے۔

تکنیکی کام کے دوران، ریڑھ کی ہڈی میں سے ایک سے ٹریفک کا کچھ حصہ ہٹانا چاہتے تھے، انجینئرز نے سیٹنگز بلاک میں ایک لائن کو حذف کر دیا جو ریڑھ کی ہڈی کے ذریعے قبول کیے جانے والے راستوں کی فہرست کی وضاحت کرتی ہے، جو سابقے کی مخصوص فہرست کے مطابق فلٹر کی گئی ہے۔ پورے بلاک کو غیر فعال کرنا درست تھا، لیکن غلطی سے صرف سابقے کی فہرست والی لائن کو حذف کر دیا گیا۔

{master[ترمیم] atl01# شو | موازنہ
[پالیسی-آپشنز پالیسی بیان میں ترمیم کریں 6-BBONE-OUT ٹرم 6-SITE-LOCAL from]! غیر فعال: سابقہ ​​فہرست 6-سائٹ-لوکل { … }

مواد کو مسدود کریں:

سے {
prefix-list 6-SITE-LOCAL;
}
پھر {
مقامی ترجیح 200؛
کمیونٹی شامل کریں SITE-LOCAL-ROUTE؛
کمیونٹی شامل کریں ATL01؛
کمیونٹی شامل کریں شمالی امریکہ؛
قبول کریں
}

سابقوں کی فہرست سے بائنڈنگ کو ہٹانے کی وجہ سے، بلاک کا باقی حصہ تمام پریفکس میں تقسیم ہونا شروع ہو گیا اور راؤٹر نے اپنے تمام BGP روٹس کو دیگر بیک بونز کے راؤٹرز پر بھیجنا شروع کر دیا۔ اتفاق سے، نئے راستوں کی ترجیح (200) کے مقابلے میں زیادہ ترجیح (مقامی ترجیح 100) تھی جو خودکار ٹریفک کی اصلاح کے نظام کے ذریعے دوسرے راستوں کے لیے مقرر کی گئی تھی۔ نتیجے کے طور پر، روٹنگ کو ریڑھ کی ہڈی سے ہٹانے کے بجائے، اعلیٰ ترجیحی BGP روٹس لیک ہو گئے، جس کے نتیجے میں دیگر ریڑھ کی ہڈیوں کی طرف جانے والی ٹریفک کو اٹلانٹا بھیج دیا گیا، جس کی وجہ سے روٹر زیادہ لوڈ ہو گیا اور نیٹ ورک کا کچھ حصہ گر گیا۔

BGP کنفیگریشن کی خرابی Cloudflare کو 27 منٹ تک کریش کرنے کا سبب بنتی ہے۔

مستقبل میں ایسے ہی واقعات کو رونما ہونے سے روکنے کے لیے، پیر کے روز Cloudflare کی بیک بون سیٹنگز میں کئی تبدیلیاں کرنے کا منصوبہ ہے۔ بی جی پی سیشنز کے لیے زیادہ سے زیادہ سابقہ ​​جات (زیادہ سے زیادہ سابقہ) کی ایک حد شامل کی جائے گی، جو کہ اگر بہت زیادہ سابقہ ​​جات اس کے ذریعے روٹ کیے جائیں تو ایک مشکل ریڑھ کی ہڈی کو روک دے گی۔ اگر اس پابندی کو پہلے شامل کر دیا جاتا، تو زیر بحث مسئلہ اٹلانٹا میں ریڑھ کی ہڈی کے بند ہونے کا باعث بنتا، لیکن پورے نیٹ ورک کے آپریشن کو متاثر نہیں کرتا، کیونکہ Cloudflare نیٹ ورک کو انفرادی ریڑھ کی ہڈیوں کو ناکام ہونے کی اجازت دینے کے لیے ڈیزائن کیا گیا ہے۔ پہلے سے اختیار کردہ تبدیلیوں میں، مقامی راستوں کے لیے ترجیحات (مقامی ترجیحات) پر نظر ثانی کی گئی ہے، جو ایک روٹر کو نیٹ ورک کے دوسرے حصوں میں ٹریفک کو متاثر کرنے کی اجازت نہیں دے گی۔

ماخذ: opennet.ru

نیا تبصرہ شامل کریں