حبر جي پوسٽ مارٽم رپورٽ: اها اخبار تي ڪري پئي

اونهاري 2019 جي پهرين مهيني جي پڇاڙي ۽ شروعات مشڪل ٿي وئي ۽ عالمي آئي ٽي سروسز ۾ ڪيترن ئي وڏن قطرن جي نشاندهي ڪئي وئي. قابل ذڪر ماڻهن ۾: CloudFlare انفراسٽرڪچر ۾ ٻه سنگين واقعا (پهريون - آمريڪا کان ڪجهه ISPs جي طرف کان BGP ڏانهن ڌڪيل هٿن ۽ لاپرواهي واري رويي سان؛ ٻيو - CF جي پاڻ ۾ ٺڳيءَ واري تعیناتي سان، جنهن هرڪو متاثر ڪيو CF استعمال ڪندي. ، ۽ اهي ڪيتريون ئي قابل ذڪر خدمتون آهن) ۽ Facebook CDN انفراسٽرڪچر جي غير مستحڪم آپريشن (سڀني ايف بي پروڊڪٽس کي متاثر ڪيو، بشمول Instagram ۽ WhatsApp). اسان کي پڻ تقسيم ۾ پڪڙڻو پيو، جيتوڻيڪ عالمي پس منظر جي مقابلي ۾ اسان جي کوٽ تمام گهٽ قابل ذڪر هئي. ڪنهن اڳ ۾ ئي ڪاري هيلي ڪاپٽر ۽ ”خودمختاري“ سازشن ۾ ڇڪڻ شروع ڪيو آهي، تنهنڪري اسان پنهنجي واقعي جو سرڪاري پوسٽ مارٽم ڪري رهيا آهيون.

حبر جي پوسٽ مارٽم رپورٽ: اها اخبار تي ڪري پئي

03.07.2019، 16: 05
وسيلن سان مسئلا رڪارڊ ٿيڻ شروع ٿي ويا، اندروني نيٽ ورڪ رابطي ۾ خرابي وانگر. هر شيءِ کي مڪمل طور تي جانچڻ کان پوءِ، هنن DataLine ڏانهن خارجي چينل جي ڪارڪردگيءَ کي خراب ڪرڻ شروع ڪيو، جيئن اهو واضح ٿي ويو ته مسئلو اندروني نيٽ ورڪ جي انٽرنيٽ تائين پهچ (NAT) جو هو، BGP سيشن کي DataLine ڏانهن رکڻ جي نقطي تائين.

03.07.2019، 16: 35
اهو واضح ٿيو ته نيٽ ورڪ ايڊريس جو ترجمو مهيا ڪندڙ سامان ۽ سائيٽ جي مقامي نيٽ ورڪ کان انٽرنيٽ تائين رسائي (NAT) ناڪام ٿي چڪي هئي. سامان کي ريبوٽ ڪرڻ جي ڪوشش ڪجھ به نه ٿي سگھيو، رابطي کي منظم ڪرڻ لاء متبادل اختيارن جي ڳولا ٽيڪنيڪل سپورٽ کان جواب حاصل ڪرڻ کان اڳ شروع ٿي، تجربو کان وٺي، اهو گهڻو ڪري مدد نه ڪري ها.

مسئلو ڪجهه حد تائين وڌي ويو حقيقت اها آهي ته هن سامان پڻ ڪلائنٽ وي پي اين جي ملازمن جي ايندڙ ڪنيڪشن کي ختم ڪري ڇڏيو، ۽ ريموٽ بحالي واري ڪم کي انجام ڏيڻ وڌيڪ ڏکيو ٿي ويو.

03.07.2019، 16: 40
اسان اڳ ۾ ئي موجود بيڪ اپ NAT اسڪيم کي بحال ڪرڻ جي ڪوشش ڪئي جيڪا اڳ ۾ چڱي طرح ڪم ڪري چڪي هئي. پر اهو واضح ٿي ويو ته نيٽ ورڪ جي بحاليءَ جي ڪيترن ئي منصوبن هن اسڪيم کي تقريبن مڪمل طور تي غير فعال بڻائي ڇڏيو آهي، ڇاڪاڻ ته ان جي بحالي، بهترين طور تي، ڪم نه ڪري سگهي ٿي، يا، بدترين طور تي، جيڪو اڳ ۾ ڪم ڪري رهيو هو ان کي ٽوڙيو.

اسان ڪجهه خيالن تي ڪم ڪرڻ شروع ڪيو ته ٽرئفڪ کي نئين روٽرن جي سيٽ ڏانهن منتقل ڪرڻ لاءِ جيڪو پوئتي خدمت ڪري رهيو آهي، پر اهي بنيادي نيٽ ورڪ ۾ رستن جي ورڇ جي خاصيتن جي ڪري ناقابل عمل لڳي رهيا هئا.

03.07.2019، 17: 05
ساڳئي وقت، نالو سرورز تي نالو ريزوليوشن ميڪانيزم ۾ هڪ مسئلو جي نشاندهي ڪئي وئي، جنهن جي نتيجي ۾ ايپليڪيشنن ۾ آخري پوائنٽن کي حل ڪرڻ ۾ غلطيون پيدا ڪيون ويون، ۽ اهي جلدي ميزبان فائلن کي نازڪ خدمتن جي رڪارڊ سان ڀرڻ شروع ڪيو.

03.07.2019، 17: 27
حبر جي محدود ڪارڪردگي بحال ڪئي وئي آهي.

03.07.2019، 17: 43
پر آخر ۾، هڪ نسبتا محفوظ حل لڌو ويو ٽريفڪ کي منظم ڪرڻ لاء سرحد جي رستن مان هڪ ذريعي، جيڪو جلدي نصب ڪيو ويو. انٽرنيٽ ڪنيڪشن بحال ڪيو ويو آهي.

ايندڙ ڪجهه منٽن ۾، مانيٽرنگ سسٽم مان مانيٽرنگ ايجنٽن جي ڪارڪردگيءَ جي بحاليءَ بابت ڪيترائي نوٽيفڪيشن آيا، پر ڪجهه خدمتون ناڪاره ثابت ٿيون ڇاڪاڻ ته نالو سرورز (dns) تي نالو ريزوليوشن ميڪنزم ٽٽي ويو هو.

حبر جي پوسٽ مارٽم رپورٽ: اها اخبار تي ڪري پئي

03.07.2019، 17: 52
اين ايس ٻيهر شروع ڪيو ويو ۽ ڪيش صاف ڪيو ويو. حل ڪرڻ بحال ڪيو ويو آهي.

03.07.2019، 17: 55
MK، Freelansim ۽ Toaster کانسواءِ سڀ خدمتون ڪم ڪرڻ شروع ڪيون.

03.07.2019، 18: 02
MK ۽ Freelansim ڪم ڪرڻ لڳو.

03.07.2019، 18: 07
DataLine سان هڪ معصوم بي جي پي سيشن کي واپس ڪيو.

03.07.2019، 18: 25
انهن وسيلن سان مسئلن کي رڪارڊ ڪرڻ شروع ڪيو، جيڪو NAT پول جي خارجي پتي ۾ تبديلي ۽ ڪيترن ئي خدمتن جي acl ۾ ان جي غير موجودگي جي ڪري، جنهن کي فوري طور تي درست ڪيو ويو. ٽوسٽر فوري طور تي ڪم ڪرڻ شروع ڪيو.

03.07.2019، 20: 30
اسان ٽيليگرام بوٽن سان لاڳاپيل غلطيون محسوس ڪيون. اهو ظاهر ٿيو ته اهي ٻاهرئين ايڊريس کي رجسٽر ڪرڻ لاءِ وساري ويٺا آهن ڪجهه acl (پراکسي سرور) ۾، جنهن کي فوري طور تي درست ڪيو ويو.

حبر جي پوسٽ مارٽم رپورٽ: اها اخبار تي ڪري پئي

پهچڻ

  • سامان، جيڪو اڳ ۾ ئي ان جي مناسبيت بابت شڪ پيدا ڪري چڪو هو، ناڪام ٿي ويو. آپريشن کان ان کي ختم ڪرڻ لاء منصوبا هئا، ڇاڪاڻ ته اهو نيٽ ورڪ جي ترقي سان مداخلت ڪئي هئي ۽ مطابقت مسئلا هئا، پر ساڳئي وقت اهو هڪ نازڪ فنڪشن انجام ڏنو، ڇو ته ڪنهن به متبادل خدمتن جي مداخلت کان سواء ٽيڪنالاجي طور تي ڏکيو هو. هاڻي توهان اڳتي ڪري سگهو ٿا.
  • DNS مسئلو ان کي NAT نيٽ ورڪ کان ٻاهر نئين ريبون نيٽ ورڪ جي ويجھو منتقل ڪرڻ کان بچائي سگھجي ٿو ۽ اڃا تائين بغير ترجمي جي گرين نيٽ ورڪ سان مڪمل ڪنيڪشن آهي (جيڪو واقعي کان اڳ جو منصوبو هو).
  • توهان کي ڊومين جا نالا استعمال نه ڪرڻ گهرجن جڏهن آر ڊي بي ايم ايس ڪلسٽرز کي گڏ ڪيو وڃي، ڇاڪاڻ ته شفاف طور تي IP پتي کي تبديل ڪرڻ جي سهولت خاص طور تي ضروري ناهي، ڇو ته اهڙيون ڦيرڦار اڃا تائين ڪلستر کي ٻيهر ٺاهڻ جي ضرورت آهي. اهو فيصلو تاريخي سببن جي ڪري ڪيو ويو ۽، سڀ کان پهريان، RDBMS ترتيبن ۾ نالي جي آخري نقطي جي واضعيت جي ڪري. عام طور تي، هڪ کلاسک پيچرو.
  • اصولي طور تي، "رنيٽ جي خودمختاري" جي مقابلي ۾ مشقون منعقد ڪيا ويا آهن؛ اتي ڪجهه سوچڻ جي باري ۾ آهي ته خودمختيار بقا جي صلاحيتن کي مضبوط ڪرڻ جي لحاظ کان.

جو ذريعو: www.habr.com

تبصرو شامل ڪريو