เราเล่าเรื่องราวของเราต่อเกี่ยวกับวิธีที่เราเปลี่ยนแปลงระบบ BMS ในศูนย์ข้อมูลของเรา (
อินเทอร์เฟซใหม่
อย่างที่พวกเขาพูดกันว่าจะดีกว่าที่จะเห็นครั้งเดียว
- ครั้งแรกเป็น красиво สะดวก สังเกตว่าการติดตามโหลดบนโมดูล PDU (“ธนาคาร” หรือเรียกง่ายๆ ว่า “ธนาคาร”) และผลรวมของโหลดแบบขนานของโมดูลที่จับคู่กลายเป็นเรื่องง่ายเพียงใด ในรุ่นแร็คจาก BMS ใหม่ เราจะเห็นทันทีว่าโมดูล PDU ที่จับคู่ด้านล่างมีโอเวอร์โหลด (กระแสรวมสูงกว่าการแจ้งเตือน 16A - "สีน้ำเงิน" ที่อนุญาต) และโมดูลด้านบนมีโหลดน้อยเกินไป หากอินพุตตัวใดตัวหนึ่งถูกตัดการเชื่อมต่อ โหลดทั้งหมดจะถ่ายโอนไปยังตัวที่สอง และโมดูลด้านล่างที่ยังมีพลังงานอยู่จะปิดลงเนื่องจากการโอเวอร์โหลด เพื่อป้องกันไม่ให้สิ่งนี้เกิดขึ้น บริการสนับสนุนศูนย์ข้อมูลจะเตือนลูกค้าล่วงหน้าและส่งคำแนะนำเกี่ยวกับวิธีการกระจายโหลดอีกครั้ง
- การเพิ่มอุปกรณ์อย่างง่ายดาย ใน BMS ใหม่ เซ็นเซอร์เสมือนสำหรับผลรวมของกระแสโมดูลและกำลังของชั้นวางได้ถูกเพิ่มลงในเทมเพลตชั้นวางมาตรฐานแล้ว และจะสร้างขึ้นโดยอัตโนมัติหลังจากเพิ่ม PDU ลงในชั้นวาง ใน BMS แบบเก่า ต้องสร้างพวกมันด้วยตนเองแล้วลากลงบนแผนที่ ซึ่งเพิ่มโอกาสที่จะเกิดข้อผิดพลาดเนื่องจาก "ปัจจัยมนุษย์"
- ขอบเขตที่ไม่ จำกัด สำหรับความคิดสร้างสรรค์ ตอนนี้เราไม่มีข้อจำกัดในการสร้างเซ็นเซอร์เสมือน คุณสามารถสร้างแบบจำลองทางคณิตศาสตร์ของตัวแปรใดๆ ก็ได้ ซึ่งหมายความว่าเรามีความสามารถในการสร้างเซ็นเซอร์เสมือนที่ซับซ้อน (ก่อนหน้านี้เราทำได้เพียงเพิ่มมูลค่าเท่านั้น) และวิเคราะห์สถิติและแนวโน้มในประสิทธิภาพของระบบวิศวกรรมได้ดีขึ้น สิ่งนี้ช่วยปรับปรุงคุณภาพของการตัดสินใจเกี่ยวกับการกำหนดค่าระบบ การเปลี่ยนอุปกรณ์ และการจัดการทรัพยากร
- อินเทอร์เฟซที่ใช้งานง่าย ในอินเทอร์เฟซใหม่ ไม่มีไอคอนที่เกะกะ พัดลมหมุน สวิตช์ "คลิก" และสิ่งที่สะดวกที่สุดคือสามารถระบุสถานะของ PDU Line A/B ภายในชั้นวางได้ เราพยายามทำสิ่งที่คล้ายกันใน BMS แบบเก่า แต่จำนวนไอคอนที่รวมเข้าด้วยกันต่อตารางเซนติเมตรของแผนที่ทำให้เราต้องละทิ้งมัน
ตอนนี้เป็นเรื่องดีที่ได้ดู:
เซิร์ฟเวอร์
ส่วนของแผงสวิตช์หลัก
แผงควบคุมการระบายอากาศ
และ BMS ใหม่ก็ตกแต่งต้อนรับปีใหม่ได้นะ :)
หน้าเดียว – ความเข้าใจร่วมกันโดยไม่ต้องใช้คำพูดและไม่มีข้อกำหนดทางเทคนิค
เป็นเวลานานมากแล้วที่เราต้องการนำ "เคล็ดลับ" อีกอย่างหนึ่งไปใช้ใน BMS: เพื่อรวบรวมพารามิเตอร์หลักของศูนย์ข้อมูลไว้ในหน้าเดียว เพื่อให้การดูหน้าจอเพียงครั้งเดียวก็เพียงพอที่จะประเมินสถานะของระบบหลักได้ อย่างไรก็ตาม เรายังไม่เข้าใจอย่างถ่องแท้ว่าควรมีลักษณะอย่างไร
แม้กระทั่งก่อนที่การพัฒนา BMS ใหม่จะเริ่มต้น เราได้ไปเยี่ยมชมศูนย์ข้อมูลหลายสิบแห่งในเนเธอร์แลนด์เพื่อทัศนศึกษา เป้าหมายประการหนึ่งคือการดูตัวอย่างการใช้งานเพจดังกล่าว
และไม่มีศูนย์ข้อมูลแห่งใดแสดงให้เราเห็นว่า - บางแห่งไม่มีอยู่จริง บางแห่งกำลัง "กำลังพัฒนาอยู่ในขณะนี้" ส่วนบางแห่งถือเป็น "ความลับทางการค้าที่สำคัญ" ดังนั้น ในแง่ของการอ้างอิงของเราสำหรับการสร้าง BMS ใหม่ จึงไม่มีคำอธิบายที่ชัดเจนของหน้าที่สำคัญมากนี้สำหรับเรา
ด้วยเหตุนี้ เราจึงได้แนวคิดนี้ขึ้นมาว่า "ทันที" ในขณะนั้น ฉันต้องปรึกษาเพื่อนร่วมงานในศูนย์ข้อมูลจากระยะไกล ไม่สะดวกมากที่จะเลื่อนดูหน้า BMS บนโทรศัพท์เพื่อค้นหาข้อมูลที่กระจัดกระจายและอันที่จริงเวอร์ชันแรกถูกร่างบนผ้าเช็ดปาก หน้าหนึ่ง. มันถูกนำไปใช้โดยนักพัฒนาตามภาพถ่าย
ตามตัวอย่างเพื่อนร่วมงานชาวดัตช์ที่ระมัดระวังของเรา เราจะไม่สาธิตเวอร์ชันสุดท้ายของหน้าหลักของเรา โดยเฉพาะอย่างยิ่งเนื่องจากศูนย์ข้อมูลแต่ละแห่งมีเอกลักษณ์เฉพาะตัวและไม่มีเหตุผลในการคัดลอก แต่ให้เราอธิบายหลักการสำคัญสองประการของการก่อตัวของมัน:
- นี่คือตารางที่ออกแบบมาให้พอดีกับรูปแบบของหน้าจอสมาร์ทโฟนแนวตั้ง (หรือจอภาพ แต่ยังคงรูปแบบแนวตั้ง) โดยแสดงข้อมูลสำคัญทั้งหมดบนหน้าจอเดียว เหนือตารางคือ "สรุป" ของเหตุการณ์ที่เกิดขึ้น ดังนั้นจึงสะดวกที่สุดที่จะรวมเหตุการณ์เหล่านั้นไว้ด้วยกันในรูปแบบแนวตั้ง
- การจัดเรียงเซลล์ในตารางเป็นไปตามสถาปัตยกรรมของศูนย์ข้อมูล (ทางกายภาพหรือเชิงตรรกะ) เราละทิ้งการจัดเรียงระบบตามลำดับตัวอักษรตามที่ต้องการตั้งแต่แรกเห็น ลำดับดังกล่าวสะท้อนถึงการเชื่อมโยงภาพของบุคลากรศูนย์ข้อมูล ราวกับว่าพวกเขากำลังตรวจสอบห้องและระบบทั้งหมดทางกายภาพ ทำให้สามารถหาข้อมูลได้ง่ายขึ้น
ในความเป็นจริง ขณะนี้คุณลักษณะหลักทั้งหมดของศูนย์ข้อมูลได้รับการจัดกลุ่มและนำเสนอบนหน้าจอเดียวของสมาร์ทโฟน/จอภาพของวิศวกรและผู้จัดการที่รับผิดชอบ ขณะเดียวกันก็นำการเชื่อมโยงไปยังภูมิประเทศทางกายภาพและตรรกะของศูนย์ข้อมูลไปใช้
นี่คือรูปถ่ายของฉบับร่างแรกนั้น แม้ว่าเวอร์ชันนี้จะถูกคิดใหม่และสรุปผลแล้วก็ตาม
รับทราบและสรุปเหตุการณ์
เรามาพูดถึงแนวคิดใหม่อีกประการหนึ่งสำหรับเราซึ่งเกิดขึ้นจากโครงการปรับปรุงระบบการตรวจสอบ
Handshake เป็นคำที่ค่อนข้างหายากที่เสนอโดยผู้พัฒนา BMS ใหม่ หมายถึงการยืนยันว่าผู้ปฏิบัติงานเห็นเหตุการณ์ รับทราบ และยอมรับความรับผิดชอบในการแก้ไข
คำพูดติดขัดและตอนนี้เรา "รับทราบ" เหตุการณ์แล้ว
อัลกอริธึมที่รวมอยู่ใน BMS เวอร์ชันพื้นฐานใหม่ไม่เหมาะกับเรา อันที่จริง สิ่งเหล่านี้เป็นความคิดเห็นในบันทึกเหตุการณ์ กล่าวคือ เหตุการณ์ที่แก้ไขแล้วไม่ได้หายไปจากบันทึก และเหตุการณ์ที่ยอมรับ ("ที่รับทราบ") จะไม่ถูกจัดเรียงจากเหตุการณ์ใหม่
เป็นผลให้มีการพัฒนาหน้าต่างที่เรียกว่า "สรุป" ซึ่ง:
- แสดงเฉพาะเหตุการณ์ที่ใช้งานอยู่และอุปกรณ์ในโหมดบริการเท่านั้น (ไม่มีประกาศสีน้ำเงินเชิงพาณิชย์)
- มีความแตกต่างที่ชัดเจนระหว่างเหตุการณ์ใหม่และเหตุการณ์ที่ยอมรับ
- ระบุว่าใครเป็นผู้ยอมรับเหตุการณ์นี้
ขั้นตอนการทำงานของเจ้าหน้าที่ปฏิบัติหน้าที่ใน BMS ใหม่มีดังนี้:
- เหตุการณ์ใหม่จะรวมอยู่ในรายงานและรอการรับทราบ พวกเขาไม่สามารถอยู่ในส่วนนี้เป็นเวลานานได้ผู้ทำหน้าที่ดูแลอุปกรณ์จะต้องรับผิดชอบเหตุการณ์ทันที
- พนักงานจะรับผิดชอบต่อเหตุการณ์ดังกล่าวโดยคลิกที่เครื่องหมายถูกทางด้านขวา เนื่องจากพนักงานทุกคนอยู่ภายใต้บัญชีที่ไม่ซ้ำกัน จึงแสดงโดยอัตโนมัติว่าใครเป็นผู้ยอมรับเหตุการณ์นี้ หากจำเป็นให้แสดงความคิดเห็น
- เหตุการณ์จะถูกย้ายไปยังส่วน "รับทราบแล้ว" เจ้าหน้าที่ปฏิบัติหน้าที่ที่เหลือและผู้จัดการเข้าใจว่าเหตุการณ์ดังกล่าวได้รับการจัดการโดยพนักงานที่รับผิดชอบ
ตัวอย่างหน้าต่างสรุปที่มีข้อความใหม่และได้รับการยอมรับแล้ว
โดยการเชื่อมต่อหน้าต่างสรุปกับตาราง One page เราก็ได้ข้อมูลครบถ้วน หน้าจอหลัก ระบบ BMS ที่คุณสามารถมองเห็นได้ทันที:
- สภาพของระบบศูนย์ข้อมูลหลัก
- การปรากฏตัวของเหตุการณ์ใหม่ที่ยังไม่ได้ดำเนินการ
- การปรากฏตัวของเหตุการณ์ที่ยอมรับและข้อมูลเกี่ยวกับผู้ที่กำจัดเหตุการณ์เหล่านั้นโดยเฉพาะ
การเข้าถึงเบราว์เซอร์และการแจ้งเตือนป๊อปอัปทางโทรศัพท์
เว็บอินเทอร์เฟซที่สามารถเข้าถึงได้จากอุปกรณ์ใดก็ได้จากทุกที่ในโลกนั้นแตกต่างอย่างสิ้นเชิงกับไคลเอนต์ "หนา" ซึ่งปิดไม่ให้ผู้ใช้ภายนอกโดยสิ้นเชิง
วิธีการแบบเก่านำมาซึ่งความไม่สะดวกหลายประการ ตั้งแต่ปัญหาในการจัดระเบียบการทำงานระยะไกลเพื่อติดตามพนักงานบริการ ไปจนถึงความจำเป็นในการติดตั้งไคลเอนต์ "หนา" จากชุดแจกจ่ายบนเวิร์กสเตชันของพนักงานในศูนย์ข้อมูล
ขณะนี้เพจใดๆ ใน BMS มีที่อยู่ที่ไม่ซ้ำกัน ซึ่งช่วยให้คุณแบ่งปันไม่เพียงแต่ที่อยู่โดยตรงของเพจหรืออุปกรณ์เท่านั้น แต่ยังรวมถึงลิงก์ไปยังกราฟ/รายงานที่ไม่ซ้ำใครด้วย
ขณะนี้การเข้าถึงระบบดำเนินการผ่านการตรวจสอบสิทธิ์ LDAP ผ่าน Active Directory ซึ่งจะเพิ่มระดับความปลอดภัย
ความคล่องตัวในปัจจุบันเป็นปัจจัยสำคัญในการทำงานที่มีคุณภาพของวิศวกรที่ปฏิบัติหน้าที่ นอกเหนือจากการตรวจสอบการตรวจสอบในห้องปฏิบัติหน้าที่แล้ว วิศวกรยังทำรอบ ทำงานประจำนอก "ห้องปฏิบัติหน้าที่" และด้วยหน้าจอหลัก BMS ที่ปรับให้เหมาะกับหน้าจอมือถือ ทำให้ไม่สูญเสียการควบคุมสิ่งที่เกิดขึ้นในห้องกังหันแม้แต่ สักครู่
คุณภาพของการควบคุมได้รับการปรับปรุงด้วยฟังก์ชันการทำงานของแชทที่ทำงาน พวกเขาเร่งกระบวนการทำงานโดยอนุญาตให้ "เชื่อมโยง" การโต้ตอบจดหมายของวิศวกรประจำหน้ากับ BMS ตัวอย่างเช่น เราใช้แอปพลิเคชัน Teams ซึ่งช่วยให้คุณดำเนินการโต้ตอบภายในและรับข้อความทั้งหมดจาก BMS บนโทรศัพท์ของคุณในรูปแบบของการแจ้งเตือนแบบพุชแบบป๊อปอัป ซึ่งช่วยลดความจำเป็นที่เจ้าหน้าที่ประจำหน้าที่จะต้องดูโทรศัพท์อยู่ตลอดเวลา หน้าจอ.
การแจ้งเตือนแบบพุชบนหน้าจอสมาร์ทโฟน
นี่คือลักษณะของการแจ้งเตือนในแอป Teams
ในเวลาเดียวกัน การแจ้งเตือนแบบป๊อปอัปได้รับการกำหนดค่าเฉพาะสำหรับข้อความเกี่ยวกับการเกิดเหตุการณ์ จึงช่วยลดปัจจัยรบกวน เจ้าหน้าที่รู้: หากการแจ้งเตือนแบบพุชของทีมปรากฏบนหน้าจอสมาร์ทโฟน พวกเขาจะต้องไปที่หน้า BMS และยอมรับเหตุการณ์ที่เกิดขึ้น ติดตามข้อความการแก้ไขเหตุการณ์ได้ที่หน้า BMS
ภาพถ่ายแสดงอินเทอร์เฟซ BMS ในสมาร์ทโฟน
ข้อสรุปถึง
แม้ว่าค่าใช้จ่ายในการอัปเดต BMS จากผู้ขายเก่าของเราจะเทียบได้กับการพัฒนาระบบใหม่ตั้งแต่เริ่มต้น (ประมาณ 100 ดอลลาร์) แต่ความแตกต่างในฟังก์ชันการทำงานของผลิตภัณฑ์กลับกลายเป็นว่ามีค่าใช้จ่ายมหาศาล เราได้รับระบบที่ยืดหยุ่นซึ่งปรับให้เหมาะกับงานและกระบวนการทางธุรกิจของเรา นอกจากนี้เรายังประหยัดค่าใช้จ่ายด้านการสนับสนุนระบบและการอัพเกรดอย่างต่อเนื่องได้อีกด้วย
แต่แน่นอนว่ามีปัญหาเกิดขึ้น
- ประการแรก เราประเมินปริมาณการเปลี่ยนแปลงที่จำเป็นในเวอร์ชันพื้นฐานของ BMS ใหม่ต่ำเกินไป และไม่เป็นไปตามกำหนดเวลาที่ตกลงไว้ล่วงหน้า สำหรับเรา นี่ไม่ใช่ปัญหาร้ายแรง เนื่องจากเราได้รับการประกันจนถึงนาทีสุดท้ายและทำงานกับระบบเก่า และกระบวนการนี้สร้างสรรค์ ซับซ้อน และบางครั้งก็ช้ากว่าที่คาดไว้ นอกจากนี้ เราได้เห็นมาโดยตลอดว่านักพัฒนาของเราพยายามทุกวิถีทางเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด แต่ในความเป็นจริงแล้ว เรื่องราวกลายเป็นเรื่องยาวมากและผู้เชี่ยวชาญคนสำคัญของเราใช้เวลาและความพยายามกับเรื่องนี้มากกว่าที่พวกเขาวางแผนไว้มาก
- ประการที่สอง เราต้องการการทดสอบหลายขั้นตอนเพื่อดีบักอัลกอริทึมสำหรับการจองเครื่องเสมือนและช่องทางการสื่อสาร ในขั้นต้น มีความล้มเหลวทั้งในด้านระบบ BMS และด้านการตั้งค่าเครื่องเสมือนและเครือข่าย การแก้ไขข้อบกพร่องนี้ยังต้องใช้เวลา โชคดีที่ผู้รับเหมาได้รับแพลตฟอร์มทดสอบในรูปแบบของบริการคลาวด์ ซึ่งการตั้งค่าและนวัตกรรมทั้งหมดได้รับการทดสอบในขั้นต้น
- ประการที่สาม ระบบผลลัพธ์กลายเป็นเรื่องยากที่จะแก้ไขโดยผู้ใช้ปลายทาง หากก่อนหน้านี้แผนที่ประกอบด้วยพื้นหลัง (ไฟล์กราฟิก) และไอคอนที่เปลี่ยนแปลงหรือย้ายได้ง่าย ตอนนี้แผนที่กลายเป็นอินเทอร์เฟซกราฟิกที่ซับซ้อนพร้อมแอนิเมชั่นที่ต้องใช้ทักษะการแก้ไขบางอย่าง
การปรับปรุงระบบ BMS ของเราครั้งใหญ่ถือได้ว่าเป็นโครงการที่สำคัญที่สุดในปีที่ผ่านมา ซึ่งจะส่งผลร้ายแรงต่อคุณภาพการจัดการการปฏิบัติงานของไซต์งานของเราในอนาคต
แน่นอนว่าเราไม่ได้โยนเซิร์ฟเวอร์เหล็กเก่าทิ้ง แต่ "ทำให้เบาลง": เราได้ล้างเซ็นเซอร์เสมือนและ PDU "เชิงพาณิชย์" นับพันตัวในเซิร์ฟเวอร์ และเหลืออุปกรณ์ที่สำคัญที่สุดเพียงไม่กี่โหล เช่น ดีเซล ไว้ในนั้น ชุดเครื่องกำเนิดไฟฟ้า, UPS, เครื่องปรับอากาศ, ปั๊ม, เซ็นเซอร์ตรวจจับการรั่วไหลและอุณหภูมิ ในโหมดนี้ ความเร็วเดิมของเขากลับมาแล้ว และเขาสามารถเป็น "ตัวสำรอง" ได้ อย่างไรก็ตาม หลังจากลบ PDU ออกจาก BMS เก่า เราได้เพิ่มใบอนุญาตที่ไม่จำเป็นออกไปประมาณ 1000 ใบ คุณรู้ไหมว่าต้องทำอย่างไรกับใบอนุญาตเหล่านั้น
ที่มา: will.com