ڈیٹا سینٹرز میں بڑے حادثات: اسباب اور نتائج

جدید ڈیٹا سینٹرز قابل اعتماد ہیں، لیکن کوئی بھی سامان وقتاً فوقتاً ٹوٹ جاتا ہے۔ اس مختصر مضمون میں ہم نے 2018 کے اہم ترین واقعات کو جمع کیا ہے۔

ڈیٹا سینٹرز میں بڑے حادثات: اسباب اور نتائج

معیشت پر ڈیجیٹل ٹیکنالوجیز کا اثر بڑھ رہا ہے، پروسیس شدہ معلومات کا حجم بڑھ رہا ہے، نئی سہولیات تعمیر ہو رہی ہیں، اور یہ تب تک اچھا ہے جب تک سب کچھ کام کرتا ہے۔ بدقسمتی سے، ڈیٹا سینٹر کی ناکامیوں کے معاشی اثرات میں بھی اضافہ ہوتا جا رہا ہے جب سے لوگوں نے ڈیجیٹلائزیشن کے ناگزیر نتیجے کے طور پر کاروباری اہم آئی ٹی انفراسٹرکچر کی میزبانی شروع کی۔ ہم گزشتہ سال مختلف ممالک میں پیش آنے والے انتہائی قابل ذکر حادثات کا ایک چھوٹا سا انتخاب شائع کر رہے ہیں۔

ریاست ہائے متحدہ امریکہ

یہ ملک ڈیٹا سینٹر کی تعمیر کے میدان میں ایک تسلیم شدہ رہنما ہے۔ ریاست ہائے متحدہ امریکہ کے پاس عالمی خدمات فراہم کرنے والے بڑے تجارتی اور کارپوریٹ ڈیٹا سینٹرز کی سب سے بڑی تعداد ہے، لہذا وہاں ہونے والے واقعات کے نتائج سب سے زیادہ اہم ہیں۔ مارچ کے اوائل میں، ایک طاقتور طوفان کی وجہ سے چار Equinix سہولیات کو بجلی کی بندش کا سامنا کرنا پڑا۔ جگہ Amazon Web Services (AWS) کے آلات کے لیے استعمال کی گئی تھی؛ حادثے کی وجہ سے بہت سی مشہور سروسز کی عدم دستیابی ہوئی: GitHub، MongoDB، NewVoiceMedia، Slack، Zillow، Atlassian، Twilio اور mCapital One، نیز Amazon Alexa ورچوئل اسسٹنٹ، متاثر ہوئے.

ستمبر میں، ٹیکساس میں واقع مائیکروسافٹ کے ڈیٹا سینٹرز پر موسم کی بے ضابطگیوں نے تباہی مچائی۔ پھر طوفان کی وجہ سے پورے علاقے کا بجلی کی فراہمی کا نظام درہم برہم ہو گیا، اور ڈیٹا سینٹر میں جس نے ڈیزل جنریٹر سیٹ سے پاور سوئچ کی، یہ معلوم نہیں ہو سکا کہ کیوں کولنگ بند کر دیا. حادثے کے نتائج کو ختم کرنے میں کئی دن لگے، اور اگرچہ لوڈ بیلنسنگ کی بدولت یہ ناکامی اہم نہیں بنی، لیکن مائیکروسافٹ کلاؤڈ سروسز کے آپریشن میں ہلکی سی سست روی کو دنیا بھر کے صارفین نے دیکھا۔

روس

سب سے سنگین حادثہ 20 اگست کو Rostelecom کے ڈیٹا سینٹرز میں سے ایک میں پیش آیا۔ اس کی وجہ سے، یونیفائیڈ اسٹیٹ رجسٹر آف رئیل اسٹیٹ کے سرورز 66 گھنٹے کے لیے رک گئے، اور اس لیے انہیں بیک اپ سائٹ پر منتقل کرنا پڑا۔ Rosreestr صرف 3 ستمبر کو تمام چینلز کے ذریعے موصول ہونے والی درخواستوں کی پروسیسنگ کو بحال کرنے میں کامیاب رہا - سرکاری تنظیم سروس لیول کے معاہدے کی خلاف ورزی کرنے پر Rostelecom سے بڑی رقم وصول کرنے کی کوشش کر رہی ہے۔

16 فروری کو، Lenenergo کے نیٹ ورکس میں مسائل کی وجہ سے، Xelnet (سینٹ پیٹرزبرگ) کے ڈیٹا سینٹر میں بیک اپ پاور سپلائی سسٹم کو آن کر دیا گیا۔ سائن ویو کی ایک قلیل مدتی رکاوٹ نے بہت سی خدمات کے کام میں رکاوٹیں پیدا کیں: خاص طور پر، بڑا کلاؤڈ فراہم کرنے والا 1 کلاؤڈ متاثر ہوا، لیکن روسی انٹرنیٹ کے سامعین کے لیے سب سے نمایاں مسئلہ VKontakte سوشل نیٹ ورکنگ سائٹ تک رسائی حاصل کرنے میں ناکامی تھی۔ . سب سے دلچسپ بات یہ ہے کہ قلیل مدتی بجلی کی ناکامی کے نتائج کو مکمل طور پر ختم کرنے میں تقریباً 12 گھنٹے لگے۔

یورپی یونین

یورپی یونین میں 2018 میں کئی سنگین واقعات ریکارڈ کیے گئے۔ مارچ میں، ایئر لائن KLM کے ڈیٹا سینٹر میں ایک ناکامی تھی: بجلی کی فراہمی 10 منٹ کے لئے منقطع تھی، اور ڈیزل جنریٹر سیٹ کی طاقت آلات کو چلانے کے لیے ناکافی تھی۔ کچھ سرورز ڈاؤن ہو گئے، اور ایئر لائن کو کئی درجن پروازیں منسوخ یا دوبارہ شیڈول کرنا پڑیں۔

ہوائی سفر سے متعلق یہ واحد واقعہ نہیں ہے - پہلے ہی اپریل میں یوروکنٹرول ڈیٹا سینٹر کے پاور سپلائی سسٹم میں خرابی واقع ہوئی تھی۔ یہ تنظیم یورپی یونین میں ہوائی جہازوں کی نقل و حرکت کو کنٹرول کرتی ہے، اور ماہرین نے حادثے کے نتائج کو ختم کرنے میں 5 گھنٹے صرف کیے، مسافروں کو دوبارہ تاخیر اور پروازوں کا شیڈول تبدیل کرنا پڑا۔

مالیاتی شعبے کی خدمت کرنے والے ڈیٹا سینٹرز میں حادثات کی وجہ سے بہت سنگین مسائل پیدا ہوتے ہیں۔ یہاں لین دین میں رکاوٹوں کی قیمت عام طور پر زیادہ ہوتی ہے، اور سہولیات کی وشوسنییتا کی سطح مناسب ہے، لیکن اس سے واقعات کی روک تھام نہیں ہوتی۔ 18 اپریل کو، Nordic NASDAQ اسٹاک ایکسچینج (Helsinki, Finland) دن کے وقت پورے شمالی یورپ میں تجارت کرنے سے قاصر تھا کیونکہ DigiPlex کمرشل ڈیٹا سینٹر میں گیس کے آگ بجھانے والے نظام کے غیر مجاز فعال ہونے کی وجہ سے، جو کہ اچانک غیر فعال ہو گیا تھا۔

7 جون کو ڈیٹا سینٹر کی بندش نے لندن اسٹاک ایکسچینج (LSE) کو ٹریڈنگ کے آغاز میں ایک گھنٹے کے لیے تاخیر کرنے پر مجبور کیا۔ اس کے علاوہ، جون میں، یورپ میں، ایک ڈیٹا سینٹر میں ناکامی کی وجہ سے، بین الاقوامی ادائیگی کے نظام VISA کی خدمات پورے دن کے لیے غیر فعال کر دی گئیں، اور اس واقعے کی تفصیلات کبھی بھی ظاہر نہیں کی گئیں۔

جاپان

2018 کے موسم گرما میں، ٹوکیو کے ایک مضافاتی علاقے میں زیر تعمیر ایمیزون ڈیٹا سینٹر کی زیر زمین سطح پر آگ لگ گئی، جس میں 5 کارکن ہلاک اور کم از کم 50 زخمی ہوئے۔ آگ نے تقریباً 5000 m2 کو نقصان پہنچایا۔ تحقیقات سے معلوم ہوا کہ آگ لگنے کی وجہ انسانی غلطی تھی: ایسیٹیلین ٹارچوں کو لاپرواہی سے ہینڈل کرنے کی وجہ سے، موصلیت بھڑک اٹھی۔

ناکامیوں کے اسباب

مندرجہ بالا واقعات کی فہرست مکمل نہیں ہے؛ ڈیٹا سینٹرز میں حادثات کی وجہ سے، بینکوں اور ٹیلی کام آپریٹرز کے کلائنٹس کو تکلیف ہوتی ہے، کلاؤڈ فراہم کرنے والوں کی خدمات آف لائن ہوجاتی ہیں، اور یہاں تک کہ ایمرجنسی سروسز کا کام بھی متاثر ہوتا ہے۔ اپ ٹائم انسٹی ٹیوٹ کے مطابق، سروس کی ایک چھوٹی سی بندش بڑے نقصانات کا باعث بن سکتی ہے، اور زیادہ تر بندش (39%) بجلی کے نظام سے متعلق ہیں۔ دوسرے نمبر پر (24%) انسانی عنصر ہے، اور تیسرے نمبر پر (15%) ایئر کنڈیشنگ سسٹم ہے۔ ڈیٹا سینٹرز میں ہونے والے حادثات کا صرف 12% قدرتی مظاہر سے منسوب کیا جا سکتا ہے، اور ان میں سے صرف 10% درج کردہ وجوہات کے علاوہ دیگر وجوہات کی بنا پر پیش آتے ہیں۔

سخت وشوسنییتا اور حفاظتی معیارات کے باوجود، کوئی بھی سہولت واقعات سے محفوظ نہیں ہے۔ ان میں سے اکثر بجلی کی ناکامی یا انسانی غلطیوں کی وجہ سے ہوتے ہیں۔ ڈیٹا سینٹرز اور سرور رومز کے مالکان کو سب سے پہلے ان دو عوامل پر توجہ دینی چاہیے، اور صارفین کو سمجھنا چاہیے: یہاں تک کہ مارکیٹ لیڈر بھی مکمل اعتبار کی ضمانت نہیں دے سکتے۔ اگر سامان یا کلاؤڈ سروس کاروبار کے لیے اہم عمل فراہم کرتی ہے، تو آپ کو بیک اپ سائٹ کے بارے میں سوچنا چاہیے۔

تصویر کا ذریعہ: telecombloger.ru

ماخذ: www.habr.com