المراقبة في مركز البيانات: كيف قمنا بتغيير BMS القديم إلى الجديد. الجزء 3

نواصل قصتنا حول كيفية تغيير نظام BMS في مراكز البيانات لدينا (جزء 1, جزء 2). وفي الوقت نفسه، لم نقم ببساطة باستبدال حل بائع بآخر، بل قمنا بتطوير نظام من الصفر ليناسب متطلباتنا. في نهاية قصتنا، نشارك نتائج العمل المنجز والحلول المثيرة للاهتمام التي قد تكون مفيدة لك.

واجهة جديدة

هنا، كما يقولون، من الأفضل أن نرى مرة واحدة.

المراقبة في مركز البيانات: كيف قمنا بتغيير BMS القديم إلى الجديد. الجزء 3الرفوف.

دعونا ننظر إلى الاختلافات.

  • الأول، هو красиво مريحة. لاحظ مدى سهولة تتبع الأحمال على وحدات PDU ("البنوك" أو ببساطة "البنوك") ومجموع الأحمال المتوازية للوحدات المقترنة. في نموذج الرف من BMS الجديد، نرى على الفور أن وحدات PDU المقترنة السفلية محملة بشكل زائد (إجمالي التيار أعلى من 16A المسموح به - الإشعار "الأزرق")، ويتم تحميل الوحدات العلوية بشكل ناقص. إذا تم فصل أحد المدخلات، فسيتم نقل الحمل بأكمله إلى الثاني، وسيتم إيقاف تشغيل الوحدة السفلية التي تظل نشطة بسبب التحميل الزائد. ولمنع حدوث ذلك، ستقوم خدمة دعم مركز البيانات بتحذير العميل مسبقًا وإرسال توصية حول كيفية إعادة توزيع الحمل.
  • سهولة إضافة المعدات. في نظام إدارة المباني الجديد، تتم بالفعل إضافة أجهزة استشعار افتراضية لمجموع تيارات الوحدة وطاقة الحامل إلى قوالب الحامل القياسية ويتم إنشاؤها تلقائيًا بعد إضافة وحدة PDU إلى الحامل. في نظام إدارة المباني القديم، كان يجب إنشاؤها يدويًا ثم سحبها إلى الخريطة، مما زاد من احتمالية الخطأ بسبب "العامل البشري".
  • مجال غير محدود للإبداع. الآن ليس لدينا أي قيود عند إنشاء أجهزة استشعار افتراضية. يمكنك بناء أي نماذج رياضية لأي متغيرات. وهذا يعني أن لدينا القدرة على إنشاء أجهزة استشعار افتراضية معقدة (في السابق لم يكن بإمكاننا سوى إضافة القيم) وتحليل الإحصائيات والاتجاهات بشكل أفضل في أداء الأنظمة الهندسية. يؤدي ذلك إلى تحسين جودة القرارات المتخذة فيما يتعلق بتكوين النظام واستبدال المعدات وإدارة الموارد. 
  • واجهة بديهية. في الواجهة الجديدة، لا يوجد فوضى في الرموز، وتدور المراوح، ويتم النقر على المفاتيح. والشيء الأكثر ملاءمة هو القدرة على الإشارة إلى حالة خط PDU A/B داخل الرفوف. لقد حاولنا أن نفعل شيئًا مشابهًا في نظام إدارة المباني القديم، لكن عدد الرموز المدمجة لكل سنتيمتر مربع من الخريطة أجبرنا على التخلي عنه.

الآن من الجميل أن ننظر إلى:

المراقبة في مركز البيانات: كيف قمنا بتغيير BMS القديم إلى الجديد. الجزء 3
الخادم.

المراقبة في مركز البيانات: كيف قمنا بتغيير BMS القديم إلى الجديد. الجزء 3
جزء من لوحة المفاتيح الرئيسية.

المراقبة في مركز البيانات: كيف قمنا بتغيير BMS القديم إلى الجديد. الجزء 3
لوحة التحكم بالتهوية.

ويمكن تزيين BMS الجديد للعام الجديد :)
المراقبة في مركز البيانات: كيف قمنا بتغيير BMS القديم إلى الجديد. الجزء 3

صفحة واحدة – تفاهم متبادل بدون كلمة وبدون مواصفات فنية

لفترة طويلة جدًا، أردنا تنفيذ "خدعة" أخرى في نظام إدارة المباني: تجميع المعلمات الرئيسية لمركز البيانات في صفحة واحدة، بحيث تكون نظرة واحدة على الشاشة كافية لتقييم حالة الأنظمة الرئيسية. ومع ذلك، فإننا لم نفهم تماما كيف ينبغي أن تبدو.

حتى قبل بدء تطوير نظام إدارة المباني الجديد، قمنا بزيارة عشرات مراكز البيانات في هولندا في رحلات. وكان أحد الأهداف هو رؤية أمثلة على تنفيذ مثل هذه الصفحة.

ولم يُظهر لنا أي مركز بيانات ذلك - في البعض لم يكن موجودًا، وفي البعض الآخر كان "قيد التطوير الآن"، وفي البعض الآخر كان "سرًا تجاريًا كبيرًا". لذلك، في اختصاصاتنا لإنشاء نظام إدارة المباني الجديد، لم يكن هناك وصف دقيق لهذه الصفحة المهمة جدًا بالنسبة لنا.

ونتيجة لذلك، توصلنا إلى ذلك حرفيًا "على الطاير". في تلك اللحظة فقط اضطررت إلى استشارة زملائي في مركز البيانات عن بعد. كان من غير المناسب جدًا التمرير عبر صفحات BMS على الهاتف بحثًا عن البيانات المتناثرة، وفي الواقع تم رسم النسخة الأولى على منديل صفحة واحدة. تم تنفيذه من قبل المطورين بناءً على الصورة. 

اقتداءً بزملائنا الهولنديين الحذرين، لن نعرض النسخة النهائية لصفحتنا الرئيسية، خاصة وأن كل مركز بيانات فريد من نوعه ولا فائدة من نسخه. لكن دعونا نصف مبدأين رئيسيين لتشكيلها:

  1. هذا جدول مصمم ليناسب تنسيق شاشة الهاتف الذكي العمودية (أو شاشة العرض، مع الحفاظ على التخطيط الرأسي)، مع عرض جميع المعلومات المهمة على شاشة واحدة. يوجد فوق الجدول "ملخص" للحوادث النشطة، لذلك كان من الملائم أكثر وضعها معًا في شكل رأسي. 
  2. يتبع ترتيب الخلايا في الجدول بنية مركز البيانات (المادية أو المنطقية). لقد تخلينا عن ترتيب الأنظمة حسب الترتيب الأبجدي، كما قد يكون مرغوبا للوهلة الأولى. يعكس التسلسل الارتباطات المرئية لموظفي مركز البيانات - كما لو كانوا يراقبون فعليًا جميع الغرف والأنظمة. وهذا يجعل من السهل العثور على المعلومات.

في الواقع، تم الآن تجميع جميع الخصائص الرئيسية لمركز البيانات وعرضها على شاشة واحدة للهاتف الذكي/الشاشة الخاصة بالمهندس والمدير المسؤول، مع تنفيذ الارتباط بالتضاريس المادية والمنطقية لمركز البيانات. 

إليكم صورة لتلك المسودة الأولى، على الرغم من أنه تمت إعادة التفكير في هذا الإصدار ووضع اللمسات النهائية عليه بالطبع.

المراقبة في مركز البيانات: كيف قمنا بتغيير BMS القديم إلى الجديد. الجزء 3

الاعتراف وملخص الحادث

دعونا نتحدث عن مفهوم جديد آخر بالنسبة لنا، والذي ظهر نتيجة لمشروع تحديث نظام المراقبة.

المصافحة هو مصطلح نادر إلى حد ما اقترحه مطور نظام إدارة المباني الجديد. ويعني ذلك التأكيد على أن المشغل رأى الحادث واعترف به وقبل المسؤوليات لحله.  

لقد ظلت الكلمة عالقة، ونحن الآن "نعترف" بالحوادث.

الخوارزمية المضمنة في الإصدار الأساسي من نظام إدارة المباني الجديد لم تناسبنا. في الواقع، كانت هذه تعليقات على سجل الأحداث، أي أن الأحداث التي تم حلها لم تختف من السجل، ولم يتم فرز الحوادث المقبولة ("المعترف بها") من الحوادث الجديدة.

ونتيجة لذلك تم تطوير نافذة تسمى "الملخص" وفيها:

  1. يتم عرض الأحداث النشطة والأجهزة في وضع الخدمة فقط (لا توجد إشعارات تجارية زرقاء).
  2. هناك تمييز واضح بين الحوادث الجديدة والمقبولة.
  3. يشار إلى من قبل الحادث.

خوارزمية العمل للضباط المناوبين في نظام إدارة المباني الجديد هي كما يلي:

  1. يتم تضمين حوادث جديدة في التقرير وتنتظر الاعتراف بها. لا يمكنهم البقاء في هذا القسم لفترة طويلة، ويجب على الشخص المسؤول عن المعدات أن يتولى مسؤولية الحادث على الفور.
  2. يتحمل الموظف مسؤولية الحادث من خلال النقر على علامة الاختيار الموجودة على اليمين. نظرًا لأن جميع الموظفين يتبعون حسابات فريدة، فسيتم عرض من قبل الحادث تلقائيًا. إذا لزم الأمر، ترك تعليق.
  3. يتم نقل الحادث إلى قسم "المسلم به"، ويدرك باقي الضباط المناوبين والمدير أن الحادث يتم التعامل معه من قبل الموظف المسؤول.

المراقبة في مركز البيانات: كيف قمنا بتغيير BMS القديم إلى الجديد. الجزء 3
مثال لنافذة ملخص تحتوي على رسالة جديدة تم إقرارها بالفعل.

من خلال ربط نافذة الملخص بجدول الصفحة الواحدة، حصلنا على ملف كامل الشاشة الرئيسية نظام BMS، حيث يمكنك أن ترى على الفور: 

  • حالة أنظمة مركز البيانات الرئيسية؛
  • وجود حوادث جديدة لم تتم معالجتها؛
  • وجود حوادث مقبولة ومعلومات حول من يقوم بالقضاء عليها على وجه التحديد.

الوصول إلى المتصفح والتنبيهات المنبثقة عبر الهاتف

تمثل واجهة الويب، التي يمكن الوصول إليها من أي جهاز من أي مكان في العالم، تناقضًا صارخًا مع العميل "السميك"، المغلق تمامًا أمام المستخدمين الخارجيين. 

كان النهج القديم ينطوي على مجموعة من المضايقات، بدءًا من مشاكل تنظيم العمل عن بعد لمراقبة موظفي الخدمة إلى الحاجة إلى تثبيت عملاء "كثيفين" من مجموعات التوزيع على محطات عمل الموظفين في مركز البيانات.

الآن تتمتع أي صفحة في BMS بعنوان فريد، مما يسمح لك بمشاركة ليس فقط العنوان المباشر للصفحة أو الجهاز، ولكن أيضًا روابط إلى رسوم بيانية/تقارير فريدة. 

يتم الآن الوصول إلى النظام من خلال مصادقة LDAP من خلال Active Directory، مما يزيد من مستوى الأمان الخاص به. 

يعد التنقل اليوم عاملاً رئيسياً في جودة العمل الذي يقوم به المهندسون المناوبون. بالإضافة إلى مراقبة المراقبة في غرفة نوبة العمل، يقوم المهندسون بجولات، ويقومون بأعمال روتينية خارج "غرفة العمل"، وبفضل شاشة BMS الرئيسية المُحسّنة لشاشات الهاتف المحمول، لا تفقد السيطرة على ما يحدث في غرف التوربينات حتى لثانية واحدة. 

تم أيضًا تحسين جودة التحكم بفضل وظيفة محادثات العمل. إنها تعمل على تسريع عمليات العمل من خلال السماح "بربط" مراسلات المهندسين المناوبين بنظام إدارة المباني. على سبيل المثال، نستخدم تطبيق Teams الذي يسمح لك بإجراء المراسلات الداخلية واستقبال جميع الرسائل من BMS على هاتفك على شكل إشعارات منبثقة، مما يلغي حاجة الضابط المناوب إلى النظر باستمرار إلى الهاتف شاشة.

المراقبة في مركز البيانات: كيف قمنا بتغيير BMS القديم إلى الجديد. الجزء 3
 دفع الإخطار على شاشة الهاتف الذكي.

المراقبة في مركز البيانات: كيف قمنا بتغيير BMS القديم إلى الجديد. الجزء 3
هذه هي الطريقة التي تظهر بها الإشعارات في تطبيق Teams.

في الوقت نفسه، يتم تكوين الإشعارات المنبثقة فقط للرسائل المتعلقة بحدوث الحوادث، وبالتالي تقليل عامل التشتيت؛ يعرف الموظفون: إذا ظهر إشعار دفع الفرق على شاشة الهاتف الذكي، فيجب عليهم الانتقال إلى صفحة BMS وقبول الحادث. يتم تتبع رسائل حل الحوادث على صفحة BMS.

المراقبة في مركز البيانات: كيف قمنا بتغيير BMS القديم إلى الجديد. الجزء 3
تُظهر الصورة واجهة BMS في الهاتف الذكي.

إجمال

في حين أن تكلفة تحديث نظام إدارة المباني من البائع القديم لدينا كانت مماثلة لتطوير نظام جديد من الصفر (حوالي 100 دولار)، إلا أن الفرق في وظائف المنتجات تبين أنه هائل. لقد حصلنا على نظام مرن مُحسّن لمهام وعمليات أعمالنا. لقد حققنا أيضًا وفورات كبيرة في تكاليف الدعم المستمر للنظام وترقيته. 

ولكن، بالطبع، كانت هناك صعوبات. 

  • أولاً، قللنا من تقدير حجم التغييرات التي يجب إجراؤها على الإصدار الأساسي من نظام إدارة المباني الجديد ولم نلتزم بالمواعيد النهائية المتفق عليها مسبقًا. بالنسبة لنا، لم تكن هذه مشكلة حرجة، حيث تم التأمين علينا حتى اللحظة الأخيرة وعملنا على النظام القديم، وكانت العملية إبداعية ومعقدة وبالتالي سارت في بعض الأحيان أبطأ من المتوقع. بالإضافة إلى ذلك، لقد رأينا دائمًا أن المطور لدينا يبذل قصارى جهده لتحقيق أفضل نتيجة. ولكن في الواقع، تبين أن القصة طويلة جدًا، وقد أنفق المتخصصون الرئيسيون لدينا جهدًا ووقتًا أكبر بكثير مما خططوا له. 
  • ثانيًا، كنا بحاجة إلى عدة مراحل من الاختبار لتصحيح أخطاء خوارزمية حجز الأجهزة الافتراضية وقنوات الاتصال. في البداية، كانت هناك إخفاقات على جانب نظام إدارة المباني (BMS) وعلى جانب إعداد الأجهزة الافتراضية والشبكة. استغرق تصحيح الأخطاء هذا أيضًا وقتًا. ولحسن الحظ، تم تزويد المقاول بمنصة اختبار على شكل خدمة سحابية، حيث تم اختبار جميع الإعدادات والابتكارات في البداية.
  • ثالثًا، تبين أن النظام الناتج أكثر صعوبة في التعديل من قبل المستخدم النهائي. إذا كانت الخريطة في السابق تتكون من خلفية (ملف رسومي) وأيقونات يسهل تغييرها أو نقلها، فقد أصبحت الآن واجهة رسومية معقدة مع رسوم متحركة تتطلب مهارات تحرير معينة.

يمكن بالفعل أن يسمى التحديث الجذري لنظام BMS الخاص بنا أهم مشروع في العام الماضي، والذي سيؤثر بشكل خطير على جودة الإدارة التشغيلية لمواقعنا في المستقبل. 

نحن، بالطبع، لم نتخلص من الخادم الحديدي القديم، ولكننا "خففناه": لقد قمنا بإزالته من آلاف أجهزة الاستشعار الافتراضية "التجارية" ووحدات PDU ولم نترك فيه سوى بضع عشرات من الأجهزة الأكثر أهمية، مثل الديزل مجموعات المولدات، UPS، مكيفات الهواء، المضخات، أجهزة استشعار التسرب ودرجات الحرارة في هذا الوضع، عادت سرعته السابقة، ويمكنه أن يكون "احتياطي احتياطي". بالمناسبة، بعد إزالة وحدة PDU من نظام إدارة المباني القديم، قمنا بتحرير حوالي 1000 ترخيص غير ضروري الآن، هل تعرف ماذا تفعل بها؟

المصدر: www.habr.com

إضافة تعليق