نظارت در مرکز داده: چگونه BMS قدیمی را به جدید تغییر دادیم. قسمت 3

ما به داستان خود در مورد چگونگی تغییر سیستم BMS در مراکز داده خود ادامه می دهیم (قسمت 1, قسمت 2). در همان زمان، ما به سادگی راه حل یک فروشنده را با فروشنده دیگری مبادله نکردیم، بلکه سیستمی را از ابتدا برای مطابقت با نیازهای خود توسعه دادیم. در پایان داستان ما نتایج کار انجام شده و راه حل های جالبی را که ممکن است برای شما مفید باشد به اشتراک می گذاریم.

New Interfeys

اینجا، همانطور که می گویند، بهتر است یک بار ببینید.

نظارت در مرکز داده: چگونه BMS قدیمی را به جدید تغییر دادیم. قسمت 3قفسه ها

بیایید به تفاوت ها نگاه کنیم.

  • اول، آن است که красиво удобно توجه داشته باشید که ردیابی بارهای ماژول های PDU ("بانک ها" یا به سادگی "بانک ها") و مجموع بارهای موازی ماژول های جفت چقدر آسان شده است. در مدل رک از BMS جدید، بلافاصله می بینیم که ماژول های PDU جفت شده پایین بارگذاری می شوند (کل جریان بالاتر از 16A مجاز است - اعلان "آبی") و ماژول های بالایی بارگذاری نشده اند. اگر یکی از ورودی ها قطع شود، کل بار به دومی منتقل می شود و ماژول پایینی که روشن می ماند به دلیل اضافه بار خاموش می شود. برای جلوگیری از این اتفاق، سرویس پشتیبانی مرکز داده از قبل به مشتری هشدار می دهد و توصیه ای در مورد نحوه توزیع مجدد بار ارسال می کند.
  • اضافه شدن آسان تجهیزات در BMS جدید، حسگرهای مجازی برای مجموع جریان های ماژول و توان رک از قبل به قالب های رک استاندارد اضافه شده اند و پس از افزودن یک PDU به رک به طور خودکار ایجاد می شوند. در BMS قدیمی، آنها باید به صورت دستی ایجاد می شدند و سپس روی نقشه کشیده می شدند، که احتمال خطا را به دلیل "عامل انسانی" افزایش می داد.
  • دامنه نامحدود برای خلاقیت. اکنون هنگام ایجاد حسگرهای مجازی هیچ محدودیتی نداریم. شما می توانید مطلقاً هر مدل ریاضی از هر متغیری بسازید. این بدان معناست که ما توانایی ایجاد حسگرهای مجازی پیچیده را داریم (قبلاً فقط می‌توانستیم مقادیر اضافه کنیم) و آمارها و روندهای عملکرد سیستم‌های مهندسی را بهتر تجزیه و تحلیل می‌کنیم. این کیفیت تصمیمات اتخاذ شده در مورد پیکربندی سیستم، جایگزینی تجهیزات و مدیریت منابع را بهبود می بخشد. 
  • رابط بصری در رابط جدید هیچ آیکون درهم و برهمی وجود ندارد، فن ها می چرخند، سوئیچ ها را «کلیک کنید». و راحت ترین چیز امکان نشان دادن وضعیت PDU Line A/B در داخل قفسه ها است. ما سعی کردیم کاری مشابه در BMS قدیمی انجام دهیم، اما تعداد نمادهای ادغام شده در هر سانتی متر مربع از نقشه ما را مجبور کرد آن را رها کنیم.

حالا خوب است به این نگاه کنید:

نظارت در مرکز داده: چگونه BMS قدیمی را به جدید تغییر دادیم. قسمت 3
سرور.

نظارت در مرکز داده: چگونه BMS قدیمی را به جدید تغییر دادیم. قسمت 3
قطعه ای از تابلوی اصلی.

نظارت در مرکز داده: چگونه BMS قدیمی را به جدید تغییر دادیم. قسمت 3
پنل کنترل تهویه.

و BMS جدید را می توان برای سال نو تزئین کرد :)
نظارت در مرکز داده: چگونه BMS قدیمی را به جدید تغییر دادیم. قسمت 3

یک صفحه - درک متقابل بدون کلمه و بدون مشخصات فنی

برای مدت طولانی ما می خواستیم "ترفند" دیگری را در BMS پیاده سازی کنیم: پارامترهای اصلی مرکز داده را در یک صفحه جمع آوری کنیم، به طوری که یک نگاه به صفحه برای ارزیابی وضعیت سیستم های اصلی کافی باشد. با این حال، ما به طور کامل متوجه نشدیم که چگونه باید باشد.

حتی قبل از شروع توسعه BMS جدید، ما از ده ها مرکز داده در هلند بازدید کردیم. یکی از اهداف دیدن نمونه هایی از اجرای چنین صفحه ای بود.

و حتی یک مرکز داده آن را به ما نشان نداد - در برخی وجود نداشت، در برخی دیگر "در حال حاضر در حال توسعه بود"، در برخی دیگر این یک "راز تجاری بزرگ" بود. بنابراین، در شرایط مرجع ما برای ایجاد یک BMS جدید، هیچ توضیح دقیقی از این صفحه بسیار مهم برای ما وجود نداشت.

در نتیجه، ما به معنای واقعی کلمه "در حال پرواز" به آن رسیدیم. درست در آن لحظه مجبور شدم از راه دور با همکاران در مرکز داده مشورت کنم. پیمایش صفحات BMS روی تلفن در جستجوی داده های پراکنده بسیار ناخوشایند بود و در واقع نسخه اول روی یک دستمال طراحی شده بود. یک صفحه. توسط توسعه دهندگان بر اساس عکس پیاده سازی شده است. 

با الگوبرداری از همکاران هلندی محتاط خود، ما نسخه نهایی صفحه اصلی خود را نشان نمی دهیم، به خصوص که هر مرکز داده منحصر به فرد است و هیچ فایده ای برای کپی کردن آن وجود ندارد. اما اجازه دهید دو اصل اصلی شکل گیری آن را شرح دهیم:

  1. این جدولی است که برای تناسب با فرمت یک صفحه نمایش تلفن هوشمند عمودی (یا یک مانیتور، اما با حفظ طرح بندی عمودی) طراحی شده است که تمام اطلاعات مهم در یک صفحه نمایش داده می شود. در بالای جدول یک "خلاصه" از حوادث فعال است، بنابراین راحت ترین آنها را در کنار هم در قالب عمودی قرار داد. 
  2. آرایش سلول ها در جدول از معماری مرکز داده (فیزیکی یا منطقی) پیروی می کند. ما ترتیب سیستم ها را به ترتیب حروف الفبا، همانطور که در نگاه اول مطلوب بود، کنار گذاشتیم. این توالی منعکس کننده ارتباطات بصری پرسنل مرکز داده است - گویی آنها به طور فیزیکی تمام اتاق ها و سیستم ها را زیر نظر دارند. این کار یافتن اطلاعات را آسان تر می کند.

در واقع، اکنون کاملاً تمام ویژگی های کلیدی مرکز داده گروه بندی شده و در یک صفحه از تلفن هوشمند / مانیتور مهندس و مدیر مسئول ارائه می شود، در حالی که پیوند به توپوگرافی فیزیکی و منطقی مرکز داده پیاده سازی می شود. 

در اینجا یک عکس از همان پیش نویس اولیه است، اگرچه، البته، پس از آن این نسخه تجدید نظر و نهایی شد.

نظارت در مرکز داده: چگونه BMS قدیمی را به جدید تغییر دادیم. قسمت 3

تصدیق و خلاصه حادثه

بیایید در مورد یک مفهوم جدید دیگر برای ما صحبت کنیم که در نتیجه پروژه به روز رسانی سیستم نظارت پدیدار شد.

Handshake یک اصطلاح نسبتا نادر است که توسط توسعه دهنده BMS جدید پیشنهاد شده است. این به معنای تأیید این است که اپراتور حادثه را دیده، آن را تصدیق کرده و مسئولیت حل آن را پذیرفته است.  

این کلمه گیر کرده است و اکنون ما حوادث را "اعتراف می کنیم".

الگوریتم موجود در نسخه اصلی BMS جدید برای ما مناسب نبود. در واقع، اینها نظرات مربوط به گزارش رویداد بودند، یعنی رویدادهای حل شده از گزارش ناپدید نشدند و موارد پذیرفته شده ("تأیید شده") از موارد جدید مرتب نشدند.

در نتیجه پنجره ای به نام "خلاصه" ایجاد شد که در آن:

  1. فقط رویدادهای فعال و دستگاه‌های در حالت سرویس نمایش داده می‌شوند (بدون اعلان آبی تجاری).
  2. تمایز واضحی بین حوادث جدید و پذیرفته شده وجود دارد.
  3. مشخص می شود که چه کسی این حادثه را پذیرفته است.

الگوریتم کار افسران وظیفه در BMS جدید به شرح زیر است:

  1. حوادث جدید در گزارش گنجانده شده و منتظر تایید هستند. آنها نمی توانند برای مدت طولانی در این قسمت بمانند؛ فرد وظیفه تجهیزات باید بلافاصله مسئولیت حادثه را بر عهده بگیرد.
  2. کارمند با کلیک بر روی علامت سمت راست مسئولیت حادثه را بر عهده می گیرد. از آنجایی که همه کارمندان تحت حساب های منحصر به فرد هستند، به طور خودکار نمایش داده می شود که چه کسی حادثه را پذیرفته است. در صورت لزوم نظر بدهید.
  3. این حادثه به بخش "تصدیق" منتقل می شود، بقیه افسران وظیفه و مدیر متوجه می شوند که این حادثه توسط کارمند مسئول رسیدگی می شود.

نظارت در مرکز داده: چگونه BMS قدیمی را به جدید تغییر دادیم. قسمت 3
نمونه ای از یک پنجره خلاصه با یک پیام جدید و از قبل تأیید شده.

با اتصال پنجره خلاصه با جدول یک صفحه، یک کامل دریافت کردیم صفحه اصلی سیستم BMS، که در آن بلافاصله می توانید ببینید: 

  • وضعیت سیستم های مرکز داده اصلی؛
  • وجود حوادث جدید پردازش نشده؛
  • وجود حوادث پذیرفته شده و اطلاعات در مورد اینکه چه کسی آنها را به طور خاص حذف می کند.

دسترسی به مرورگر و هشدارهای پاپ آپ تلفن

رابط وب، قابل دسترسی از هر دستگاهی از هر نقطه در جهان، در تضاد کامل با کلاینت "ضخیم" است که به طور کامل برای کاربران خارجی بسته است. 

رویکرد قدیمی مجموعه‌ای از ناراحتی‌ها را به همراه داشت، از مشکلات در سازمان‌دهی کار از راه دور برای نظارت بر کارکنان خدمات گرفته تا نیاز به نصب مشتریان «ضخیم» از کیت‌های توزیع در ایستگاه‌های کاری کارکنان در مرکز داده.

اکنون هر صفحه در BMS دارای یک آدرس منحصر به فرد است که به شما امکان می دهد نه تنها آدرس مستقیم صفحه یا دستگاه، بلکه پیوندهایی به نمودارها/گزارش های منحصر به فرد را نیز به اشتراک بگذارید. 

اکنون دسترسی به سیستم از طریق احراز هویت LDAP از طریق Active Directory انجام می شود که سطح امنیت آن را افزایش می دهد. 

امروزه تحرک یک عامل کلیدی در کیفیت کار مهندسان وظیفه است. علاوه بر نظارت بر نظارت در اتاق شیفت وظیفه، مهندسان دور می‌زنند، کارهای معمولی را در خارج از «اتاق وظیفه» انجام می‌دهند و به لطف صفحه نمایش اصلی BMS که برای صفحه‌نمایش‌های موبایل بهینه شده است، حتی کنترل آنچه را که در اتاق‌های توربین می‌افتد از دست نمی‌دهند. برای یک ثانیه 

کیفیت کنترل نیز به لطف عملکرد چت های کاری بهبود یافته است. آنها فرآیندهای کاری را با اجازه دادن به مکاتبات مهندسان وظیفه "پیوند" به BMS سرعت می بخشند. به عنوان مثال، ما از برنامه Teams استفاده می کنیم که به شما امکان می دهد مکاتبات داخلی را انجام دهید و تمام پیام ها را از BMS در تلفن خود به صورت اعلان های فشاری پاپ آپ دریافت کنید که نیاز افسر وظیفه را از نگاه مداوم به تلفن بی نیاز می کند. صفحه نمایش

نظارت در مرکز داده: چگونه BMS قدیمی را به جدید تغییر دادیم. قسمت 3
 اعلان فشاری روی صفحه گوشی هوشمند.

نظارت در مرکز داده: چگونه BMS قدیمی را به جدید تغییر دادیم. قسمت 3
اعلان‌ها در برنامه Teams به این صورت است.

در همان زمان، اعلان‌های پاپ‌آپ فقط برای پیام‌های مربوط به وقوع حوادث پیکربندی می‌شوند و در نتیجه عامل حواس‌پرتی را به حداقل می‌رسانند؛ کارکنان می‌دانند: اگر یک Teams Push Notification روی صفحه گوشی هوشمند ظاهر شود، باید به صفحه BMS بروند. و حادثه را بپذیرد. پیام های حل حادثه در صفحه BMS ردیابی می شوند.

نظارت در مرکز داده: چگونه BMS قدیمی را به جدید تغییر دادیم. قسمت 3
این عکس رابط BMS را در یک گوشی هوشمند نشان می دهد.

مجموع

در حالی که هزینه به‌روزرسانی یک BMS از فروشنده قدیمی ما با توسعه یک سیستم جدید از ابتدا (حدود 100 دلار) قابل مقایسه بود، تفاوت در عملکرد محصولات بسیار زیاد بود. ما یک سیستم منعطف دریافت کردیم که برای وظایف و فرآیندهای تجاری ما بهینه شده است. ما همچنین به صرفه جویی قابل توجهی در هزینه های پشتیبانی مداوم و ارتقاء سیستم دست یافته ایم. 

اما، البته، مشکلاتی وجود داشت. 

  • ابتدا، مقدار تغییراتی که باید در نسخه پایه BMS جدید ایجاد شود را دست کم گرفتیم و مهلت های از پیش توافق شده را رعایت نکردیم. برای ما این مشکل حیاتی نبود، زیرا تا آخرین لحظه بیمه بودیم و روی سیستم قدیمی کار می‌کردیم و فرآیند خلاقانه، پیچیده بود و به همین دلیل گاهی کندتر از حد انتظار پیش می‌رفت. علاوه بر این، ما همیشه شاهد بوده ایم که توسعه دهنده ما تمام تلاش خود را برای دستیابی به بهترین نتیجه انجام می دهد. اما در واقع، داستان بسیار طولانی شد و متخصصان کلیدی ما تلاش و زمان بیشتری را نسبت به آنچه برنامه ریزی کرده بودند صرف آن کردند. 
  • ثانیاً، برای رفع اشکال الگوریتم رزرو ماشین‌های مجازی و کانال‌های ارتباطی به چندین مرحله آزمایش نیاز داشتیم. در ابتدا، خطاهایی هم در سمت سیستم BMS و هم در سمت راه اندازی ماشین های مجازی و شبکه وجود داشت. این اشکال زدایی هم زمان برد. خوشبختانه پلتفرم آزمایشی در قالب سرویس ابری در اختیار پیمانکار قرار گرفت که در ابتدا تمامی تنظیمات و نوآوری ها مورد آزمایش قرار گرفت.
  • سوم، ویرایش سیستم به دست آمده توسط کاربر نهایی دشوارتر بود. اگر قبلاً یک نقشه از یک پس‌زمینه (فایل گرافیکی) و آیکون‌هایی تشکیل می‌شد که به راحتی قابل تغییر یا جابجایی بودند، اکنون یک رابط گرافیکی پیچیده با انیمیشن است که به مهارت‌های ویرایشی خاصی نیاز دارد.

به روز رسانی ریشه ای سیستم BMS ما را می توان مهمترین پروژه سال گذشته نامید که کیفیت مدیریت عملیاتی سایت های ما در آینده را به طور جدی تحت تأثیر قرار می دهد. 

ما، البته، سرور آهنی قدیمی را بیرون نینداختیم، بلکه آن را "سبک کردیم": آن را از هزاران حسگر مجازی "تجاری" و PDU پاک کردیم و تنها چند ده مورد از حیاتی ترین دستگاه ها، مانند دیزل را در آن گذاشتیم. مجموعه های ژنراتور، یو پی اس، تهویه مطبوع، پمپ ها، سنسورهای نشتی و دما در این حالت، سرعت قبلی او بازگشته است و او می تواند یک "رزرو رزرو" باشد. در ضمن، بعد از حذف PDU از BMS قدیمی، حدود 1000 مجوز غیر ضروری را آزاد کردیم، آیا می دانید با آنها چه کار کنید؟

منبع: www.habr.com

اضافه کردن نظر