الحوادث الكبرى في مراكز البيانات: الأسباب والنتائج

تعتبر مراكز البيانات الحديثة موثوقة ، لكن أي جهاز يتعطل من وقت لآخر. باختصار ، قمنا بجمع أهم أحداث عام 2018.

الحوادث الكبرى في مراكز البيانات: الأسباب والنتائج

إن تأثير التقنيات الرقمية على الاقتصاد آخذ في الازدياد ، ويزداد حجم المعلومات المعالجة ، ويتم بناء مرافق جديدة ، وهذا أمر جيد طالما أن كل شيء يعمل. لسوء الحظ ، فإن تأثير إخفاقات مركز البيانات على الاقتصاد يتزايد أيضًا منذ أن بدأ الناس في وضع البنية التحتية لتكنولوجيا المعلومات المهمة للأعمال فيها - وهذه نتيجة حتمية للرقمنة. ننشر مجموعة صغيرة من أبرز الحوادث التي وقعت في بلدان مختلفة في العام الماضي.

الولايات المتحدة الأمريكية

هذا البلد هو رائد معترف به في مجال بناء مركز البيانات. تمتلك الولايات المتحدة أكبر مراكز البيانات التجارية والشركات التي تخدم الخدمات العالمية ، لذا فإن عواقب الحوادث فيها تكون أكثر أهمية. في أوائل مارس ، بسبب الإعصار القوي ، تعرضت أربع منشآت Equinix لانقطاع التيار الكهربائي. تم استخدام المنطقة لمعدات Amazon Web Services (AWS) ، وأدى الحادث إلى عدم توفر العديد من الخدمات الشائعة: GitHub و MongoDB و NewVoiceMedia و Slack و Zillow و Atlassian و Twilio و mCapital One ، بالإضافة إلى Amazon Alexa الظاهري. مساعد.

في سبتمبر ، ضربت حالات الطقس الشاذة مراكز بيانات Microsoft الموجودة في تكساس ، ثم بسبب عاصفة رعدية ، تعطل نظام الإمداد بالطاقة في المنطقة بأكملها ، وتم إيقاف التبريد في مركز البيانات الذي تحول إلى الطاقة من مولد الديزل. استغرق الأمر عدة أيام لتنظيف عواقب الحادث ، وعلى الرغم من أن الفشل لم يصبح حرجًا بفضل موازنة التحميل ، لاحظ المستخدمون في جميع أنحاء العالم بعض التباطؤ في خدمات السحابة من Microsoft.

روسيا

وقع أخطر حادث في 20 أغسطس في أحد مراكز بيانات Rostelecom. بسبب ذلك ، توقفت خوادم سجل الدولة الموحد للعقارات لمدة 66 ساعة ، وبالتالي كان لا بد من نقلها إلى موقع نسخ احتياطي. تمكن Rosreestr من استعادة معالجة الطلبات الواردة من خلال جميع القنوات فقط في 3 سبتمبر - تحاول مؤسسة الدولة استرداد مبلغ كبير من Rostelecom لانتهاكها اتفاقية مستوى الخدمة.

في 16 فبراير ، بسبب مشاكل في شبكات Lenenergo ، تم تشغيل نظام تزويد الطاقة الاحتياطية في مركز البيانات لشركة Xelnet (سانت بطرسبرغ). أدى الانقطاع قصير المدى للجيوب الأنفية إلى حدوث اضطرابات في تشغيل العديد من الخدمات: عانى المزود السحابي الكبير 1cloud ، على وجه الخصوص ، ولكن المشكلة الأكثر وضوحًا لجمهور الإنترنت الروسي كانت عدم القدرة على الوصول إلى موقع VKontakte للتواصل الاجتماعي. الشيء الأكثر إثارة للاهتمام هو أن الأمر استغرق حوالي 12 ساعة للتخلص تمامًا من عواقب انقطاع التيار الكهربائي على المدى القصير.

الاتحاد الأوروبي

في الاتحاد الأوروبي ، تم تسجيل العديد من الحوادث الخطيرة في عام 2018. في مارس ، حدث عطل في مركز بيانات الناقل الجوي KLM: تم إيقاف تشغيل مصدر الطاقة لمدة 10 دقائق ، وكانت طاقة مجموعات مولدات الديزل غير كافية لتشغيل المعدات. تعطل جزء من الخوادم ، واضطرت شركة الطيران إلى إلغاء أو إعادة جدولة عشرات الرحلات الجوية.

ليست هذه هي الحادثة الوحيدة المتعلقة بالنقل الجوي - فقد حدث بالفعل في أبريل ، عطل في نظام إمداد الطاقة لمركز بيانات Eurocontrol. تدير المنظمة حركة الطائرات في الاتحاد الأوروبي ، وبينما أزال المتخصصون عواقب الحادث لمدة 5 ساعات ، كان على الركاب مرة أخرى تحمل التأخير ونقل الرحلات.

تنشأ مشاكل خطيرة للغاية بسبب الحوادث في مراكز البيانات التي تخدم القطاع المالي. عادة ما تكون تكلفة الانقطاعات في المعاملات مرتفعة هنا ، ومستوى موثوقية العناصر مناسب ، لكن هذا لا يوفر عليك من الحوادث. في 18 أبريل ، لم تتمكن بورصة نورديك ناسداك (هلسنكي ، فنلندا) من التداول في جميع أنحاء شمال أوروبا خلال النهار بسبب بدء غير مصرح به لنظام إطفاء حريق الغاز في مركز بيانات تجاري DigiPlex ، والذي تم حجبه.

في 7 يونيو ، أجبرت انقطاع مركز البيانات بورصة لندن (LSE) على تأجيل بدء التداول لمدة ساعة. بالإضافة إلى ذلك ، في يونيو ، في أوروبا ، بسبب فشل في مركز البيانات ، تم تعطيل خدمات نظام الدفع الدولي VISA طوال اليوم ، ولم يتم الكشف عن تفاصيل الحادث.

اليابان

في صيف عام 2018 ، اندلع حريق في المستويات تحت الأرض لمركز بيانات أمازون قيد الإنشاء في ضواحي طوكيو ، مما أسفر عن مقتل 5 عمال وإصابة ما لا يقل عن 50. وألحق الحريق أضرارًا بحوالي 5000 متر مربع من مباني المركز. منشأة. أظهر التحقيق أن سبب الحريق كان عاملاً بشريًا: بسبب الإهمال في التعامل مع مشاعل الأسيتيلين ، اشتعل العزل.

Причины сбоев

قائمة الحوادث المذكورة أعلاه بعيدة عن الاكتمال ، نظرًا للحوادث في مراكز البيانات ، يعاني عملاء البنوك ومشغلي الاتصالات ، ويتوقف مزودو الخدمات السحابية عن الاتصال بالإنترنت ، وحتى خدمات الطوارئ تتعطل. يمكن أن يؤدي انقطاع الخدمة الصغير إلى خسائر كبيرة ، حيث ترتبط غالبية الأعطال (39٪) بنظام إمداد الطاقة ، وفقًا لمعهد Uptime Institute. في المرتبة الثانية (24٪) عامل بشري ، وفي المرتبة الثالثة (15٪) نظام تكييف الهواء. يمكن أن تُعزى 12٪ فقط من الحوادث في مراكز البيانات إلى ظواهر طبيعية ، و 10٪ فقط منها تحدث لأسباب غير تلك المذكورة.

على الرغم من معايير الموثوقية والسلامة الصارمة ، لا يوجد شيء مؤمن ضد الحوادث. معظمهم بسبب انقطاع التيار الكهربائي أو أخطاء بشرية. يجب أولاً وقبل كل شيء الانتباه إلى هذين العاملين من قبل مالكي مراكز البيانات وغرف الخوادم ، ويجب أن يفهم العملاء أنه حتى قادة السوق لا يمكنهم ضمان الموثوقية المطلقة. إذا كانت المعدات أو الخدمة السحابية تخدم العمليات الحيوية للأعمال ، فيجب أن تفكر في موقع النسخ الاحتياطي.

مصدر الصورة: telecombloger.ru

المصدر: www.habr.com

إضافة تعليق