การตรวจสอบในศูนย์ข้อมูล: เราเปลี่ยน BMS เก่าให้เป็นใหม่ได้อย่างไร ส่วนที่ 3

เราเล่าเรื่องราวของเราต่อเกี่ยวกับวิธีที่เราเปลี่ยนแปลงระบบ BMS ในศูนย์ข้อมูลของเรา (ส่วนหนึ่งของ 1, ส่วนหนึ่งของ 2). ในเวลาเดียวกัน เราไม่เพียงแค่แลกเปลี่ยนโซลูชันของผู้จำหน่ายรายหนึ่งไปยังอีกรายหนึ่งเท่านั้น แต่ยังพัฒนาระบบตั้งแต่เริ่มต้นเพื่อให้เหมาะกับความต้องการของเรา ในตอนท้ายของเรื่องราวของเรา เราจะแบ่งปันผลงานที่ทำเสร็จแล้วและวิธีแก้ปัญหาที่น่าสนใจที่อาจเป็นประโยชน์กับคุณ

อินเทอร์เฟซใหม่

อย่างที่พวกเขาพูดกันว่าจะดีกว่าที่จะเห็นครั้งเดียว

การตรวจสอบในศูนย์ข้อมูล: เราเปลี่ยน BMS เก่าให้เป็นใหม่ได้อย่างไร ส่วนที่ 3ชั้นวางของ

มาดูความแตกต่างกัน

  • ครั้งแรกเป็น красиво สะดวก สังเกตว่าการติดตามโหลดบนโมดูล PDU (“ธนาคาร” หรือเรียกง่ายๆ ว่า “ธนาคาร”) และผลรวมของโหลดแบบขนานของโมดูลที่จับคู่กลายเป็นเรื่องง่ายเพียงใด ในรุ่นแร็คจาก BMS ใหม่ เราจะเห็นทันทีว่าโมดูล PDU ที่จับคู่ด้านล่างมีโอเวอร์โหลด (กระแสรวมสูงกว่าการแจ้งเตือน 16A - "สีน้ำเงิน" ที่อนุญาต) และโมดูลด้านบนมีโหลดน้อยเกินไป หากอินพุตตัวใดตัวหนึ่งถูกตัดการเชื่อมต่อ โหลดทั้งหมดจะถ่ายโอนไปยังตัวที่สอง และโมดูลด้านล่างที่ยังมีพลังงานอยู่จะปิดลงเนื่องจากการโอเวอร์โหลด เพื่อป้องกันไม่ให้สิ่งนี้เกิดขึ้น บริการสนับสนุนศูนย์ข้อมูลจะเตือนลูกค้าล่วงหน้าและส่งคำแนะนำเกี่ยวกับวิธีการกระจายโหลดอีกครั้ง
  • การเพิ่มอุปกรณ์อย่างง่ายดาย ใน BMS ใหม่ เซ็นเซอร์เสมือนสำหรับผลรวมของกระแสโมดูลและกำลังของชั้นวางได้ถูกเพิ่มลงในเทมเพลตชั้นวางมาตรฐานแล้ว และจะสร้างขึ้นโดยอัตโนมัติหลังจากเพิ่ม PDU ลงในชั้นวาง ใน BMS แบบเก่า ต้องสร้างพวกมันด้วยตนเองแล้วลากลงบนแผนที่ ซึ่งเพิ่มโอกาสที่จะเกิดข้อผิดพลาดเนื่องจาก "ปัจจัยมนุษย์"
  • ขอบเขตที่ไม่ จำกัด สำหรับความคิดสร้างสรรค์ ตอนนี้เราไม่มีข้อจำกัดในการสร้างเซ็นเซอร์เสมือน คุณสามารถสร้างแบบจำลองทางคณิตศาสตร์ของตัวแปรใดๆ ก็ได้ ซึ่งหมายความว่าเรามีความสามารถในการสร้างเซ็นเซอร์เสมือนที่ซับซ้อน (ก่อนหน้านี้เราทำได้เพียงเพิ่มมูลค่าเท่านั้น) และวิเคราะห์สถิติและแนวโน้มในประสิทธิภาพของระบบวิศวกรรมได้ดีขึ้น สิ่งนี้ช่วยปรับปรุงคุณภาพของการตัดสินใจเกี่ยวกับการกำหนดค่าระบบ การเปลี่ยนอุปกรณ์ และการจัดการทรัพยากร 
  • อินเทอร์เฟซที่ใช้งานง่าย ในอินเทอร์เฟซใหม่ ไม่มีไอคอนที่เกะกะ พัดลมหมุน สวิตช์ "คลิก" และสิ่งที่สะดวกที่สุดคือสามารถระบุสถานะของ PDU Line A/B ภายในชั้นวางได้ เราพยายามทำสิ่งที่คล้ายกันใน BMS แบบเก่า แต่จำนวนไอคอนที่รวมเข้าด้วยกันต่อตารางเซนติเมตรของแผนที่ทำให้เราต้องละทิ้งมัน

ตอนนี้เป็นเรื่องดีที่ได้ดู:

การตรวจสอบในศูนย์ข้อมูล: เราเปลี่ยน BMS เก่าให้เป็นใหม่ได้อย่างไร ส่วนที่ 3
เซิร์ฟเวอร์

การตรวจสอบในศูนย์ข้อมูล: เราเปลี่ยน BMS เก่าให้เป็นใหม่ได้อย่างไร ส่วนที่ 3
ส่วนของแผงสวิตช์หลัก

การตรวจสอบในศูนย์ข้อมูล: เราเปลี่ยน BMS เก่าให้เป็นใหม่ได้อย่างไร ส่วนที่ 3
แผงควบคุมการระบายอากาศ

และ BMS ใหม่ก็ตกแต่งต้อนรับปีใหม่ได้นะ :)
การตรวจสอบในศูนย์ข้อมูล: เราเปลี่ยน BMS เก่าให้เป็นใหม่ได้อย่างไร ส่วนที่ 3

หน้าเดียว – ความเข้าใจร่วมกันโดยไม่ต้องใช้คำพูดและไม่มีข้อกำหนดทางเทคนิค

เป็นเวลานานมากแล้วที่เราต้องการนำ "เคล็ดลับ" อีกอย่างหนึ่งไปใช้ใน BMS: เพื่อรวบรวมพารามิเตอร์หลักของศูนย์ข้อมูลไว้ในหน้าเดียว เพื่อให้การดูหน้าจอเพียงครั้งเดียวก็เพียงพอที่จะประเมินสถานะของระบบหลักได้ อย่างไรก็ตาม เรายังไม่เข้าใจอย่างถ่องแท้ว่าควรมีลักษณะอย่างไร

แม้กระทั่งก่อนที่การพัฒนา BMS ใหม่จะเริ่มต้น เราได้ไปเยี่ยมชมศูนย์ข้อมูลหลายสิบแห่งในเนเธอร์แลนด์เพื่อทัศนศึกษา เป้าหมายประการหนึ่งคือการดูตัวอย่างการใช้งานเพจดังกล่าว

และไม่มีศูนย์ข้อมูลแห่งใดแสดงให้เราเห็นว่า - บางแห่งไม่มีอยู่จริง บางแห่งกำลัง "กำลังพัฒนาอยู่ในขณะนี้" ส่วนบางแห่งถือเป็น "ความลับทางการค้าที่สำคัญ" ดังนั้น ในแง่ของการอ้างอิงของเราสำหรับการสร้าง BMS ใหม่ จึงไม่มีคำอธิบายที่ชัดเจนของหน้าที่สำคัญมากนี้สำหรับเรา

ด้วยเหตุนี้ เราจึงได้แนวคิดนี้ขึ้นมาว่า "ทันที" ในขณะนั้น ฉันต้องปรึกษาเพื่อนร่วมงานในศูนย์ข้อมูลจากระยะไกล ไม่สะดวกมากที่จะเลื่อนดูหน้า BMS บนโทรศัพท์เพื่อค้นหาข้อมูลที่กระจัดกระจายและอันที่จริงเวอร์ชันแรกถูกร่างบนผ้าเช็ดปาก หน้าหนึ่ง. มันถูกนำไปใช้โดยนักพัฒนาตามภาพถ่าย 

ตามตัวอย่างเพื่อนร่วมงานชาวดัตช์ที่ระมัดระวังของเรา เราจะไม่สาธิตเวอร์ชันสุดท้ายของหน้าหลักของเรา โดยเฉพาะอย่างยิ่งเนื่องจากศูนย์ข้อมูลแต่ละแห่งมีเอกลักษณ์เฉพาะตัวและไม่มีเหตุผลในการคัดลอก แต่ให้เราอธิบายหลักการสำคัญสองประการของการก่อตัวของมัน:

  1. นี่คือตารางที่ออกแบบมาให้พอดีกับรูปแบบของหน้าจอสมาร์ทโฟนแนวตั้ง (หรือจอภาพ แต่ยังคงรูปแบบแนวตั้ง) โดยแสดงข้อมูลสำคัญทั้งหมดบนหน้าจอเดียว เหนือตารางคือ "สรุป" ของเหตุการณ์ที่เกิดขึ้น ดังนั้นจึงสะดวกที่สุดที่จะรวมเหตุการณ์เหล่านั้นไว้ด้วยกันในรูปแบบแนวตั้ง 
  2. การจัดเรียงเซลล์ในตารางเป็นไปตามสถาปัตยกรรมของศูนย์ข้อมูล (ทางกายภาพหรือเชิงตรรกะ) เราละทิ้งการจัดเรียงระบบตามลำดับตัวอักษรตามที่ต้องการตั้งแต่แรกเห็น ลำดับดังกล่าวสะท้อนถึงการเชื่อมโยงภาพของบุคลากรศูนย์ข้อมูล ราวกับว่าพวกเขากำลังตรวจสอบห้องและระบบทั้งหมดทางกายภาพ ทำให้สามารถหาข้อมูลได้ง่ายขึ้น

ในความเป็นจริง ขณะนี้คุณลักษณะหลักทั้งหมดของศูนย์ข้อมูลได้รับการจัดกลุ่มและนำเสนอบนหน้าจอเดียวของสมาร์ทโฟน/จอภาพของวิศวกรและผู้จัดการที่รับผิดชอบ ขณะเดียวกันก็นำการเชื่อมโยงไปยังภูมิประเทศทางกายภาพและตรรกะของศูนย์ข้อมูลไปใช้ 

นี่คือรูปถ่ายของฉบับร่างแรกนั้น แม้ว่าเวอร์ชันนี้จะถูกคิดใหม่และสรุปผลแล้วก็ตาม

การตรวจสอบในศูนย์ข้อมูล: เราเปลี่ยน BMS เก่าให้เป็นใหม่ได้อย่างไร ส่วนที่ 3

รับทราบและสรุปเหตุการณ์

เรามาพูดถึงแนวคิดใหม่อีกประการหนึ่งสำหรับเราซึ่งเกิดขึ้นจากโครงการปรับปรุงระบบการตรวจสอบ

Handshake เป็นคำที่ค่อนข้างหายากที่เสนอโดยผู้พัฒนา BMS ใหม่ หมายถึงการยืนยันว่าผู้ปฏิบัติงานเห็นเหตุการณ์ รับทราบ และยอมรับความรับผิดชอบในการแก้ไข  

คำพูดติดขัดและตอนนี้เรา "รับทราบ" เหตุการณ์แล้ว

อัลกอริธึมที่รวมอยู่ใน BMS เวอร์ชันพื้นฐานใหม่ไม่เหมาะกับเรา อันที่จริง สิ่งเหล่านี้เป็นความคิดเห็นในบันทึกเหตุการณ์ กล่าวคือ เหตุการณ์ที่แก้ไขแล้วไม่ได้หายไปจากบันทึก และเหตุการณ์ที่ยอมรับ ("ที่รับทราบ") จะไม่ถูกจัดเรียงจากเหตุการณ์ใหม่

เป็นผลให้มีการพัฒนาหน้าต่างที่เรียกว่า "สรุป" ซึ่ง:

  1. แสดงเฉพาะเหตุการณ์ที่ใช้งานอยู่และอุปกรณ์ในโหมดบริการเท่านั้น (ไม่มีประกาศสีน้ำเงินเชิงพาณิชย์)
  2. มีความแตกต่างที่ชัดเจนระหว่างเหตุการณ์ใหม่และเหตุการณ์ที่ยอมรับ
  3. ระบุว่าใครเป็นผู้ยอมรับเหตุการณ์นี้

ขั้นตอนการทำงานของเจ้าหน้าที่ปฏิบัติหน้าที่ใน BMS ใหม่มีดังนี้:

  1. เหตุการณ์ใหม่จะรวมอยู่ในรายงานและรอการรับทราบ พวกเขาไม่สามารถอยู่ในส่วนนี้เป็นเวลานานได้ผู้ทำหน้าที่ดูแลอุปกรณ์จะต้องรับผิดชอบเหตุการณ์ทันที
  2. พนักงานจะรับผิดชอบต่อเหตุการณ์ดังกล่าวโดยคลิกที่เครื่องหมายถูกทางด้านขวา เนื่องจากพนักงานทุกคนอยู่ภายใต้บัญชีที่ไม่ซ้ำกัน จึงแสดงโดยอัตโนมัติว่าใครเป็นผู้ยอมรับเหตุการณ์นี้ หากจำเป็นให้แสดงความคิดเห็น
  3. เหตุการณ์จะถูกย้ายไปยังส่วน "รับทราบแล้ว" เจ้าหน้าที่ปฏิบัติหน้าที่ที่เหลือและผู้จัดการเข้าใจว่าเหตุการณ์ดังกล่าวได้รับการจัดการโดยพนักงานที่รับผิดชอบ

การตรวจสอบในศูนย์ข้อมูล: เราเปลี่ยน BMS เก่าให้เป็นใหม่ได้อย่างไร ส่วนที่ 3
ตัวอย่างหน้าต่างสรุปที่มีข้อความใหม่และได้รับการยอมรับแล้ว

โดยการเชื่อมต่อหน้าต่างสรุปกับตาราง One page เราก็ได้ข้อมูลครบถ้วน หน้าจอหลัก ระบบ BMS ที่คุณสามารถมองเห็นได้ทันที: 

  • สภาพของระบบศูนย์ข้อมูลหลัก
  • การปรากฏตัวของเหตุการณ์ใหม่ที่ยังไม่ได้ดำเนินการ
  • การปรากฏตัวของเหตุการณ์ที่ยอมรับและข้อมูลเกี่ยวกับผู้ที่กำจัดเหตุการณ์เหล่านั้นโดยเฉพาะ

การเข้าถึงเบราว์เซอร์และการแจ้งเตือนป๊อปอัปทางโทรศัพท์

เว็บอินเทอร์เฟซที่สามารถเข้าถึงได้จากอุปกรณ์ใดก็ได้จากทุกที่ในโลกนั้นแตกต่างอย่างสิ้นเชิงกับไคลเอนต์ "หนา" ซึ่งปิดไม่ให้ผู้ใช้ภายนอกโดยสิ้นเชิง 

วิธีการแบบเก่านำมาซึ่งความไม่สะดวกหลายประการ ตั้งแต่ปัญหาในการจัดระเบียบการทำงานระยะไกลเพื่อติดตามพนักงานบริการ ไปจนถึงความจำเป็นในการติดตั้งไคลเอนต์ "หนา" จากชุดแจกจ่ายบนเวิร์กสเตชันของพนักงานในศูนย์ข้อมูล

ขณะนี้เพจใดๆ ใน BMS มีที่อยู่ที่ไม่ซ้ำกัน ซึ่งช่วยให้คุณแบ่งปันไม่เพียงแต่ที่อยู่โดยตรงของเพจหรืออุปกรณ์เท่านั้น แต่ยังรวมถึงลิงก์ไปยังกราฟ/รายงานที่ไม่ซ้ำใครด้วย 

ขณะนี้การเข้าถึงระบบดำเนินการผ่านการตรวจสอบสิทธิ์ LDAP ผ่าน Active Directory ซึ่งจะเพิ่มระดับความปลอดภัย 

ความคล่องตัวในปัจจุบันเป็นปัจจัยสำคัญในการทำงานที่มีคุณภาพของวิศวกรที่ปฏิบัติหน้าที่ นอกเหนือจากการตรวจสอบการตรวจสอบในห้องปฏิบัติหน้าที่แล้ว วิศวกรยังทำรอบ ทำงานประจำนอก "ห้องปฏิบัติหน้าที่" และด้วยหน้าจอหลัก BMS ที่ปรับให้เหมาะกับหน้าจอมือถือ ทำให้ไม่สูญเสียการควบคุมสิ่งที่เกิดขึ้นในห้องกังหันแม้แต่ สักครู่ 

คุณภาพของการควบคุมได้รับการปรับปรุงด้วยฟังก์ชันการทำงานของแชทที่ทำงาน พวกเขาเร่งกระบวนการทำงานโดยอนุญาตให้ "เชื่อมโยง" การโต้ตอบจดหมายของวิศวกรประจำหน้ากับ BMS ตัวอย่างเช่น เราใช้แอปพลิเคชัน Teams ซึ่งช่วยให้คุณดำเนินการโต้ตอบภายในและรับข้อความทั้งหมดจาก BMS บนโทรศัพท์ของคุณในรูปแบบของการแจ้งเตือนแบบพุชแบบป๊อปอัป ซึ่งช่วยลดความจำเป็นที่เจ้าหน้าที่ประจำหน้าที่จะต้องดูโทรศัพท์อยู่ตลอดเวลา หน้าจอ.

การตรวจสอบในศูนย์ข้อมูล: เราเปลี่ยน BMS เก่าให้เป็นใหม่ได้อย่างไร ส่วนที่ 3
 การแจ้งเตือนแบบพุชบนหน้าจอสมาร์ทโฟน

การตรวจสอบในศูนย์ข้อมูล: เราเปลี่ยน BMS เก่าให้เป็นใหม่ได้อย่างไร ส่วนที่ 3
นี่คือลักษณะของการแจ้งเตือนในแอป Teams

ในเวลาเดียวกัน การแจ้งเตือนแบบป๊อปอัปได้รับการกำหนดค่าเฉพาะสำหรับข้อความเกี่ยวกับการเกิดเหตุการณ์ จึงช่วยลดปัจจัยรบกวน เจ้าหน้าที่รู้: หากการแจ้งเตือนแบบพุชของทีมปรากฏบนหน้าจอสมาร์ทโฟน พวกเขาจะต้องไปที่หน้า BMS และยอมรับเหตุการณ์ที่เกิดขึ้น ติดตามข้อความการแก้ไขเหตุการณ์ได้ที่หน้า BMS

การตรวจสอบในศูนย์ข้อมูล: เราเปลี่ยน BMS เก่าให้เป็นใหม่ได้อย่างไร ส่วนที่ 3
ภาพถ่ายแสดงอินเทอร์เฟซ BMS ในสมาร์ทโฟน

ข้อสรุปถึง

แม้ว่าค่าใช้จ่ายในการอัปเดต BMS จากผู้ขายเก่าของเราจะเทียบได้กับการพัฒนาระบบใหม่ตั้งแต่เริ่มต้น (ประมาณ 100 ดอลลาร์) แต่ความแตกต่างในฟังก์ชันการทำงานของผลิตภัณฑ์กลับกลายเป็นว่ามีค่าใช้จ่ายมหาศาล เราได้รับระบบที่ยืดหยุ่นซึ่งปรับให้เหมาะกับงานและกระบวนการทางธุรกิจของเรา นอกจากนี้เรายังประหยัดค่าใช้จ่ายด้านการสนับสนุนระบบและการอัพเกรดอย่างต่อเนื่องได้อีกด้วย 

แต่แน่นอนว่ามีปัญหาเกิดขึ้น 

  • ประการแรก เราประเมินปริมาณการเปลี่ยนแปลงที่จำเป็นในเวอร์ชันพื้นฐานของ BMS ใหม่ต่ำเกินไป และไม่เป็นไปตามกำหนดเวลาที่ตกลงไว้ล่วงหน้า สำหรับเรา นี่ไม่ใช่ปัญหาร้ายแรง เนื่องจากเราได้รับการประกันจนถึงนาทีสุดท้ายและทำงานกับระบบเก่า และกระบวนการนี้สร้างสรรค์ ซับซ้อน และบางครั้งก็ช้ากว่าที่คาดไว้ นอกจากนี้ เราได้เห็นมาโดยตลอดว่านักพัฒนาของเราพยายามทุกวิถีทางเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด แต่ในความเป็นจริงแล้ว เรื่องราวกลายเป็นเรื่องยาวมากและผู้เชี่ยวชาญคนสำคัญของเราใช้เวลาและความพยายามกับเรื่องนี้มากกว่าที่พวกเขาวางแผนไว้มาก 
  • ประการที่สอง เราต้องการการทดสอบหลายขั้นตอนเพื่อดีบักอัลกอริทึมสำหรับการจองเครื่องเสมือนและช่องทางการสื่อสาร ในขั้นต้น มีความล้มเหลวทั้งในด้านระบบ BMS และด้านการตั้งค่าเครื่องเสมือนและเครือข่าย การแก้ไขข้อบกพร่องนี้ยังต้องใช้เวลา โชคดีที่ผู้รับเหมาได้รับแพลตฟอร์มทดสอบในรูปแบบของบริการคลาวด์ ซึ่งการตั้งค่าและนวัตกรรมทั้งหมดได้รับการทดสอบในขั้นต้น
  • ประการที่สาม ระบบผลลัพธ์กลายเป็นเรื่องยากที่จะแก้ไขโดยผู้ใช้ปลายทาง หากก่อนหน้านี้แผนที่ประกอบด้วยพื้นหลัง (ไฟล์กราฟิก) และไอคอนที่เปลี่ยนแปลงหรือย้ายได้ง่าย ตอนนี้แผนที่กลายเป็นอินเทอร์เฟซกราฟิกที่ซับซ้อนพร้อมแอนิเมชั่นที่ต้องใช้ทักษะการแก้ไขบางอย่าง

การปรับปรุงระบบ BMS ของเราครั้งใหญ่ถือได้ว่าเป็นโครงการที่สำคัญที่สุดในปีที่ผ่านมา ซึ่งจะส่งผลร้ายแรงต่อคุณภาพการจัดการการปฏิบัติงานของไซต์งานของเราในอนาคต 

แน่นอนว่าเราไม่ได้โยนเซิร์ฟเวอร์เหล็กเก่าทิ้ง แต่ "ทำให้เบาลง": เราได้ล้างเซ็นเซอร์เสมือนและ PDU "เชิงพาณิชย์" นับพันตัวในเซิร์ฟเวอร์ และเหลืออุปกรณ์ที่สำคัญที่สุดเพียงไม่กี่โหล เช่น ดีเซล ไว้ในนั้น ชุดเครื่องกำเนิดไฟฟ้า, UPS, เครื่องปรับอากาศ, ปั๊ม, เซ็นเซอร์ตรวจจับการรั่วไหลและอุณหภูมิ ในโหมดนี้ ความเร็วเดิมของเขากลับมาแล้ว และเขาสามารถเป็น "ตัวสำรอง" ได้ อย่างไรก็ตาม หลังจากลบ PDU ออกจาก BMS เก่า เราได้เพิ่มใบอนุญาตที่ไม่จำเป็นออกไปประมาณ 1000 ใบ คุณรู้ไหมว่าต้องทำอย่างไรกับใบอนุญาตเหล่านั้น

ที่มา: will.com

เพิ่มความคิดเห็น