ในเดือนกันยายนนี้ Broadcom (เดิมชื่อ CA) ได้เปิดตัวเวอร์ชัน 20.2 ใหม่ของโซลูชัน DX Operations Intelligence (DX OI) ผลิตภัณฑ์นี้วางอยู่ในตลาดในฐานะระบบตรวจสอบแบบร่ม ระบบสามารถรับและรวมข้อมูลจากระบบการตรวจสอบของโดเมนต่างๆ (เครือข่าย โครงสร้างพื้นฐาน แอปพลิเคชัน ฐานข้อมูล) ของทั้ง CA และผู้ผลิตบุคคลที่สาม รวมถึงโซลูชันโอเพ่นซอร์ส (Zabbix, Prometheus และอื่นๆ)
หน้าที่หลักของ DX OI คือการสร้างทรัพยากรและบริการโมเดล (RSM) เต็มรูปแบบตามหน่วยการกำหนดค่า (CU) ซึ่งจะเติมเต็มฐานสินค้าคงคลังเมื่อรวมเข้ากับระบบของบุคคลที่สาม DX OI ใช้ฟังก์ชันการเรียนรู้ของเครื่องและปัญญาประดิษฐ์ (ML และ AI) กับข้อมูลที่เข้าสู่แพลตฟอร์ม ซึ่งช่วยให้คุณสามารถประเมิน/คาดการณ์ความน่าจะเป็นของความล้มเหลวของ KE เฉพาะและระดับผลกระทบของความล้มเหลวในบริการทางธุรกิจ ซึ่ง ขึ้นอยู่กับ KE ที่เฉพาะเจาะจง นอกจากนี้ DX OI ยังเป็นจุดเดียวในการรวบรวมเหตุการณ์การตรวจสอบและรวมเข้ากับระบบส่วนให้บริการ ซึ่งเป็นข้อได้เปรียบที่ปฏิเสธไม่ได้ของการใช้ระบบในศูนย์ตรวจสอบแบบรวมศูนย์สำหรับการเปลี่ยนแปลงหน้าที่ขององค์กร ในบทความนี้ เราจะบอกคุณเพิ่มเติมเกี่ยวกับการทำงานของระบบและแสดงอินเทอร์เฟซผู้ใช้และผู้ดูแลระบบ
สถาปัตยกรรมโซลูชัน DX OI
แพลตฟอร์ม DX มีสถาปัตยกรรมไมโครเซอร์วิส ติดตั้งและทำงานภายใต้ Kubernetes หรือ OpenShift รูปภาพต่อไปนี้แสดงส่วนประกอบของโซลูชันที่สามารถใช้เป็นเครื่องมือตรวจสอบอิสระหรือสามารถแทนที่ด้วยระบบตรวจสอบที่มีอยู่ซึ่งมีฟังก์ชันที่คล้ายกัน (มีตัวอย่างของระบบดังกล่าวในรูป) จากนั้นจึงเชื่อมต่อกับร่ม DX OI ในแผนภาพด้านล่าง:
- การตรวจสอบแอปพลิเคชันมือถือใน DX App Experience Analytics;
- การตรวจสอบประสิทธิภาพของแอปพลิเคชันใน DX APM;
- การตรวจสอบโครงสร้างพื้นฐานใน DX Infrastructure Manager;
- การตรวจสอบอุปกรณ์เครือข่ายใน DX NetOps Manager
ส่วนประกอบ DX ทำงานภายใต้การควบคุมของคลัสเตอร์ Kubernetes และปรับขนาดโดยเพียงแค่เปิดตัว POD ใหม่ ด้านล่างนี้เป็นแผนภาพโซลูชันระดับสูง
การดูแล ปรับขนาด และอัปเดตแพลตฟอร์ม DX ทำได้ในคอนโซลผู้ดูแลระบบ จากคอนโซลเดียว คุณสามารถจัดการสถาปัตยกรรมที่มีผู้เช่าหลายรายซึ่งสามารถขยายหลายองค์กรหรือหลายหน่วยธุรกิจภายในบริษัทได้ ในแบบจำลองนี้ แต่ละองค์กรสามารถกำหนดค่าแยกกันเป็นผู้เช่าด้วยชุดการกำหนดค่าของตนเอง
Administration Console คือการดำเนินการบนเว็บและเครื่องมือการจัดการระบบที่ให้ผู้ดูแลระบบมีอินเทอร์เฟซแบบครบวงจรที่สอดคล้องกันเพื่อดำเนินงานการจัดการคลัสเตอร์การมอนิเตอร์
ผู้เช่าใหม่สำหรับหน่วยธุรกิจหรือองค์กรภายในบริษัทจะถูกปรับใช้ภายในไม่กี่นาที สิ่งนี้จะให้ข้อได้เปรียบหากคุณต้องการมีระบบตรวจสอบที่เป็นหนึ่งเดียว แต่ในระดับแพลตฟอร์ม (และไม่ใช่สิทธิ์ในการเข้าถึง) เพื่อแยกความแตกต่างของออบเจ็กต์การตรวจสอบระหว่างแผนก
โมเดลการบริการทรัพยากรและการติดตามบริการทางธุรกิจ
DX OI มีกลไกในตัวสำหรับการสร้างบริการและพัฒนา PCM แบบคลาสสิกพร้อมการตั้งค่าตรรกะของอิทธิพลและน้ำหนักระหว่างส่วนประกอบของบริการ นอกจากนี้ยังมีกลไกในการส่งออก PCM จาก CMDB ภายนอก รูปด้านล่างแสดงโปรแกรมแก้ไข PCM ในตัว (สังเกตน้ำหนักของลิงก์)
DX OI ให้ภาพรวมของตัวบ่งชี้ประสิทธิภาพหลักของธุรกิจหรือบริการด้านไอทีพร้อมรายละเอียด รวมถึงความพร้อมใช้งานของบริการและการคาดการณ์ความเสี่ยงจากความล้มเหลว เครื่องมือนี้ยังสามารถให้ข้อมูลเชิงลึกเกี่ยวกับผลกระทบของปัญหาด้านประสิทธิภาพหรือการเปลี่ยนแปลงในการออกแบบส่วนประกอบไอที (แอปพลิเคชันหรือโครงสร้างพื้นฐาน) ในบริการทางธุรกิจ รูปด้านล่างแสดงแดชบอร์ดแบบโต้ตอบที่แสดงสถานะของบริการทั้งหมด
ดูรายละเอียดการใช้บริการ Digital Banking เป็นตัวอย่าง เมื่อคลิกที่ชื่อบริการ เราจะไปที่ PCM โดยละเอียดของบริการ เราเห็นว่าสถานะของบริการ Digital Banking ขึ้นอยู่กับสถานะของโครงสร้างพื้นฐานและบริการย่อยของธุรกรรมที่มีน้ำหนักต่างกัน การทำงานกับตุ้มน้ำหนักและการแสดงไว้เป็นข้อดีที่น่าสนุกของ DX OI
โทโพโลยีเป็นองค์ประกอบสำคัญของการตรวจสอบโรงงานในการปฏิบัติงาน ช่วยให้ผู้ปฏิบัติงานและวิศวกรวิเคราะห์ความสัมพันธ์ระหว่างส่วนประกอบ ค้นหาสาเหตุที่แท้จริงและอิทธิพลได้
DX OI Topology Viewer เป็นบริการที่ใช้ข้อมูลโทโพโลยีที่มาจากระบบการตรวจสอบโดเมนที่รวบรวมข้อมูลโดยตรงจากออบเจ็กต์การตรวจสอบ เครื่องมือนี้ได้รับการออกแบบเพื่อค้นหาร้านค้าโทโพโลยีหลายชั้นและแสดงแผนผังความสัมพันธ์เฉพาะบริบท หากต้องการตรวจสอบปัญหา คุณสามารถไปที่บริการย่อย Backend Banking ที่มีปัญหา และดูโทโพโลยีและส่วนประกอบที่เป็นปัญหา คุณยังสามารถวิเคราะห์ข้อความแจ้งเตือนและตัววัดประสิทธิภาพสำหรับแต่ละส่วนประกอบได้
เมื่อวิเคราะห์ส่วนประกอบธุรกรรมการชำระเงิน (ธุรกรรมผู้ใช้) เราสามารถติดตามค่า KPI ของธุรกิจได้ ซึ่งจะนำมาพิจารณาด้วยเมื่อคำนวณความพร้อมใช้งานและสถานะความสมบูรณ์ของบริการ ตัวอย่างของ KPI ธุรกิจมีดังต่อไปนี้:
การวิเคราะห์เหตุการณ์
การลดสัญญาณรบกวนอัลกอริธึมเนื่องจากอุบัติเหตุการจัดกลุ่ม
คุณสมบัติหลักประการหนึ่งของ DX OI ในการประมวลผลเหตุการณ์คือการจัดกลุ่ม เอ็นจิ้นทำงานกับการแจ้งเตือนทั้งหมดที่เข้ามาในระบบเพื่อระบุรูปแบบตามบริบทที่แตกต่างกันและจัดกลุ่มไว้ด้วยกัน คลัสเตอร์เหล่านี้เป็นการเรียนรู้ด้วยตนเองและไม่จำเป็นต้องกำหนดค่าด้วยตนเอง
ดังนั้นการจัดกลุ่มทำให้ผู้ใช้สามารถรวมและจัดกลุ่มเหตุการณ์จำนวนมากและวิเคราะห์เฉพาะเหตุการณ์ที่มีบริบทร่วมกันเท่านั้น ตัวอย่างเช่น ชุดของเหตุการณ์ที่แสดงถึงเหตุการณ์ที่ส่งผลต่อการทำงานของแอปพลิเคชันหรือศูนย์ข้อมูล สถานการณ์ถูกสร้างขึ้นโดยใช้อัลกอริธึมการจัดกลุ่มตามการเรียนรู้ของเครื่องซึ่งใช้ความสัมพันธ์ชั่วคราว ความสัมพันธ์ทอพอโลยี และการประมวลผลภาษาพื้นเมืองสำหรับการวิเคราะห์ รูปภาพด้านล่างแสดงตัวอย่างการแสดงกลุ่มข้อความแบบคลัสเตอร์ ซึ่งเรียกว่าการเตือนสถานการณ์ และไทม์ไลน์หลักฐาน ซึ่งแสดงพารามิเตอร์หลักของการจัดกลุ่มและกระบวนการลดจำนวนเหตุการณ์เสียงรบกวน
การวิเคราะห์ปัญหาต้นตอและความสัมพันธ์ของอุบัติเหตุ
ในสภาพแวดล้อมแบบไฮบริดในปัจจุบัน ธุรกรรมของผู้ใช้อาจส่งผลกระทบต่อหลายระบบที่ใช้งานแบบไดนามิก ด้วยเหตุนี้ การแจ้งเตือนหลายรายการอาจถูกสร้างขึ้นจากระบบที่แตกต่างกัน แต่เกี่ยวข้องกับปัญหาหรือเหตุการณ์เดียวกัน DX OI ใช้กลไกที่เป็นกรรมสิทธิ์เพื่อระงับการแจ้งเตือนที่ซ้ำซ้อนและซ้ำซ้อน และเชื่อมโยงการแจ้งเตือนที่เกี่ยวข้องเพื่อปรับปรุงการตรวจจับปัญหาสำคัญและการแก้ไขที่รวดเร็วยิ่งขึ้น
ลองดูตัวอย่างเมื่อระบบได้รับข้อความแจ้งเตือนจำนวนมากสำหรับออบเจ็กต์ (OU) ที่แตกต่างกันภายใต้บริการเดียว ในกรณีที่มีผลกระทบต่อความพร้อมใช้งานและประสิทธิภาพของบริการ ระบบจะสร้างสัญญาณเตือนการบริการ (Service Alarm) ระบุและระบุสาเหตุที่แท้จริงที่เป็นไปได้ (KE ที่เป็นปัญหาและข้อความแจ้งเตือนสำหรับ KE) ซึ่งส่งผลให้ประสิทธิภาพลดลงหรือ ความล้มเหลวของการบริการ รูปด้านล่างแสดงภาพสถานการณ์ฉุกเฉินสำหรับบริการ Webex
DX OI ช่วยให้คุณสามารถทำงานกับเหตุการณ์ต่างๆ ผ่านการดำเนินการที่ใช้งานง่ายบนเว็บอินเทอร์เฟซของระบบ ผู้ใช้สามารถกำหนดกิจกรรมให้กับพนักงานที่รับผิดชอบด้วยตนเองเพื่อแก้ไขปัญหา รีเซ็ต/รับทราบการแจ้งเตือน สร้างตั๋วหรือส่งการแจ้งเตือนทางอีเมล และเรียกใช้สคริปต์อัตโนมัติเพื่อแก้ไขเหตุฉุกเฉิน (เวิร์กโฟลว์การแก้ไข จะมีรายละเอียดเพิ่มเติมในภายหลัง) ด้วยวิธีนี้ DX OI ช่วยให้ผู้ปฏิบัติงานที่โทรสามารถมุ่งเน้นไปที่ข้อความแจ้งเตือนรูท และยังช่วยปรับปรุงกระบวนการจัดเรียงข้อความลงในอาร์เรย์แบบคลัสเตอร์
อัลกอริธึมเครื่องจักรสำหรับการประมวลผลตัวชี้วัดและการวิเคราะห์ข้อมูลประสิทธิภาพ
การเรียนรู้ของเครื่องช่วยให้คุณติดตาม รวบรวม และแสดงภาพตัวบ่งชี้ประสิทธิภาพหลักในช่วงเวลาใดเวลาหนึ่ง ซึ่งจะให้ประโยชน์แก่ผู้ใช้ดังต่อไปนี้:
- การตรวจจับคอขวดและความผิดปกติของประสิทธิภาพ
- การเปรียบเทียบตัวบ่งชี้ต่างๆ สำหรับอุปกรณ์ อินเทอร์เฟซ หรือเครือข่ายเดียวกัน
- การเปรียบเทียบตัวบ่งชี้ที่เหมือนกันในหลายไซต์
- การเปรียบเทียบตัวบ่งชี้ต่างๆ สำหรับวัตถุหนึ่งและหลายวัตถุ
- การเปรียบเทียบหน่วยเมตริกหลายมิติระหว่างออบเจ็กต์หลายรายการ
เพื่อวิเคราะห์หน่วยเมตริกที่เข้าสู่ระบบ DX OI ใช้ฟังก์ชันการวิเคราะห์เครื่องจักรโดยใช้อัลกอริธึมทางคณิตศาสตร์ ซึ่งช่วยลดเวลาในการตั้งค่าเกณฑ์คงที่และสร้างคำเตือนเมื่อเกิดความผิดปกติ
ผลลัพธ์ของการใช้อัลกอริธึมทางคณิตศาสตร์คือการสร้างสิ่งที่เรียกว่าการแจกแจงความน่าจะเป็นของค่าเมตริก (หายาก ความน่าจะเป็น ศูนย์กลาง ค่าเฉลี่ย และค่าจริง) ตัวเลขด้านบนและด้านล่างแสดงการแจกแจงความน่าจะเป็น
กราฟทั้งสองด้านบนแสดงข้อมูลต่อไปนี้:
- ข้อมูลจริง ข้อมูลจริงจะแสดงบนกราฟเป็นเส้นทึบสีดำ (ไม่มีสัญญาณเตือน) หรือเส้นทึบสี (สถานะสัญญาณเตือน) เส้นนี้คำนวณตามข้อมูลจริงสำหรับเมตริก ด้วยการเปรียบเทียบข้อมูลจริงและค่ามัธยฐาน คุณสามารถดูการเปลี่ยนแปลงของเมตริกได้อย่างรวดเร็ว เมื่อมีเหตุการณ์เกิดขึ้น เส้นสีดำจะเปลี่ยนเป็นเส้นทึบสีที่สอดคล้องกับความวิกฤตของเหตุการณ์ และแสดงไอคอนพร้อมการวิกฤตที่สอดคล้องกันเหนือกราฟ ตัวอย่างเช่น สีแดงสำหรับความผิดปกติร้ายแรง สีส้มสำหรับความผิดปกติที่สำคัญ และสีเหลืองสำหรับความผิดปกติเล็กน้อย
- ค่าเฉลี่ยของตัวบ่งชี้ ค่าเฉลี่ยหรือค่ามัธยฐานของตัวบ่งชี้จะแสดงในแผนภูมิเป็นเส้นสีเทา ค่าเฉลี่ยจะแสดงเมื่อมีข้อมูลประวัติไม่เพียงพอ
- ค่ามัธยฐานของตัวบ่งชี้ (ค่ากลาง) เส้นมัธยฐานคือกึ่งกลางของช่วงและแสดงเป็นเส้นประสีเขียว โซนที่อยู่ใกล้กับเส้นนี้มากที่สุดจะใกล้เคียงกับค่าทั่วไปของตัวบ่งชี้มากที่สุด
- ค่าทั่วไป ข้อมูลโซนโดยรวมจะติดตามเส้นกึ่งกลางที่ใกล้ที่สุดหรือเส้นปกติสำหรับหน่วยวัดของคุณและปรากฏเป็นแถบสีเขียวเข้ม การคำนวณเชิงวิเคราะห์จะวางโซนโดยรวมไว้ที่หนึ่งเปอร์เซ็นต์ไทล์สูงหรือต่ำกว่าปกติ
- ข้อมูลความน่าจะเป็น ข้อมูลโซนความน่าจะเป็นจะแสดงเป็นแถบสีเขียวบนกราฟ ระบบจะวางโซนความน่าจะเป็นไว้ที่ XNUMX เปอร์เซ็นต์ไทล์สูงหรือต่ำกว่าปกติ
- ข้อมูลหายาก ข้อมูลโซนที่หายากจะแสดงบนกราฟเป็นแถบสีเขียวอ่อน ระบบจะวางพื้นที่ที่มีค่าเมตริกที่หายากไว้ที่สามเปอร์เซ็นไทล์เหนือหรือต่ำกว่าบรรทัดฐานและส่งสัญญาณพฤติกรรมของตัวบ่งชี้ที่อยู่นอกช่วงปกติ ในขณะที่ระบบสร้างสิ่งที่เรียกว่าการแจ้งเตือนความผิดปกติ
ความผิดปกติคือการวัดหรือเหตุการณ์ที่ไม่สอดคล้องกับประสิทธิภาพปกติของเมตริก การตรวจจับความผิดปกติเพื่อระบุปัญหาและทำความเข้าใจแนวโน้มในโครงสร้างพื้นฐานและแอปพลิเคชันเป็นคุณลักษณะสำคัญของ DX OI การตรวจจับความผิดปกติช่วยให้คุณรับรู้ถึงพฤติกรรมที่ผิดปกติ (เช่น เซิร์ฟเวอร์ที่ตอบสนองช้ากว่าปกติ หรือกิจกรรมเครือข่ายที่ผิดปกติที่เกิดจากการแฮ็ก) และตอบสนองตามนั้น (ทำให้เกิดเหตุการณ์ การเรียกใช้สคริปต์การแก้ไขอัตโนมัติ)
การตรวจจับความผิดปกติ DX OI ให้ประโยชน์ดังต่อไปนี้:
- ไม่จำเป็นต้องกำหนดเกณฑ์ DX OI จะเปรียบเทียบข้อมูลและระบุความผิดปกติอย่างอิสระ
- DX OI มีอัลกอริธึมปัญญาประดิษฐ์และการเรียนรู้ของเครื่องมากกว่าสิบรายการ รวมถึง EWMA (Exponentially-Weighted—Moving-Average) และ KDE (การประมาณความหนาแน่นของเคอร์เนล) อัลกอริธึมเหล่านี้ช่วยให้สามารถวิเคราะห์สาเหตุที่แท้จริงและการทำนายค่าเมตริกในอนาคตได้อย่างรวดเร็ว
การวิเคราะห์เชิงคาดการณ์และการแจ้งเตือนถึงความล้มเหลวที่อาจเกิดขึ้น
Predictive Insights เป็นฟีเจอร์ที่ใช้พลังของการเรียนรู้ของเครื่องเพื่อระบุรูปแบบและแนวโน้ม จากแนวโน้มเหล่านี้ ระบบจะคาดการณ์เหตุการณ์ที่อาจเกิดขึ้นในอนาคต ข้อความเหล่านี้บ่งบอกถึงความจำเป็นในการดำเนินการก่อนที่ค่าเมตริกจะเบี่ยงเบนไปจากค่าปกติและส่งผลกระทบต่อบริการทางธุรกิจที่สำคัญ ข้อมูลเชิงลึกเชิงคาดการณ์แสดงอยู่ในภาพด้านล่าง
และนี่คือการแสดงภาพคำเตือนเชิงคาดการณ์สำหรับเมตริกเฉพาะ
การพยากรณ์โหลดของกำลังประมวลผลพร้อมฟังก์ชันระบุสถานการณ์โหลด
การวางแผนความจุของการวิเคราะห์ความจุช่วยให้คุณจัดการทรัพยากรด้านไอที ทำให้มั่นใจได้ว่าทรัพยากรมีขนาดเหมาะสมเพื่อตอบสนองความต้องการทางธุรกิจในปัจจุบันและอนาคต คุณจะสามารถเพิ่มประสิทธิภาพการผลิตและประสิทธิภาพของทรัพยากรที่มีอยู่ วางแผนและปรับการลงทุนทางการเงินใดๆ ได้
คุณสมบัติการวิเคราะห์ความจุใน DX OI ให้ประโยชน์ดังต่อไปนี้:
- การคาดการณ์กำลังการผลิตในช่วงฤดูท่องเที่ยว
- การกำหนดช่วงเวลาที่จำเป็นต้องใช้ทรัพยากรเพิ่มเติมเพื่อให้แน่ใจว่าการทำงานของบริการมีคุณภาพสูง
- การซื้อทรัพยากรเพิ่มเติมเมื่อจำเป็นเท่านั้น
- การจัดการโครงสร้างพื้นฐานและเครือข่ายอย่างมีประสิทธิภาพ
- ขจัดค่าใช้จ่ายด้านพลังงานที่ไม่จำเป็นโดยการระบุทรัพยากรที่ไม่ได้ใช้ประโยชน์
- ดำเนินการประเมินภาระทรัพยากรในกรณีที่ความต้องการบริการหรือทรัพยากรเพิ่มขึ้นตามแผน
หน้า Capacity Analytics DX OI (ภาพด้านล่าง) มีวิดเจ็ตต่อไปนี้:
- สถานะความจุของทรัพยากร
- กลุ่ม/บริการที่ได้รับการตรวจสอบ;
- ผู้บริโภคที่มีความจุสูงสุด
หน้าหลัก การวิเคราะห์ความจุ แสดงส่วนประกอบทรัพยากรที่มีการใช้งานมากเกินไปและมีกำลังการผลิตเหลือน้อย หน้านี้ช่วยให้ผู้ดูแลระบบแพลตฟอร์มค้นหาทรัพยากรที่ใช้งานมากเกินไป และช่วยให้พวกเขาปรับขนาดและเพิ่มประสิทธิภาพทรัพยากรได้ สถานะของทรัพยากรสามารถวิเคราะห์ได้ตามรหัสสีและความหมายที่เกี่ยวข้อง ทรัพยากรจะถูกจัดประเภทตามระดับความแออัดในหน้าสถานะกำลังการผลิตของทรัพยากร คุณสามารถคลิกที่แต่ละสีเพื่อดูรายการส่วนประกอบที่รวมอยู่ในหมวดหมู่ที่เลือก ถัดไป แผนที่ความร้อนจะแสดงพร้อมกับออบเจ็กต์ทั้งหมดและการคาดการณ์เป็นเวลา 12 เดือน ซึ่งช่วยให้คุณระบุทรัพยากรที่กำลังจะหมดลงได้
สำหรับแต่ละตัววัดในการวิเคราะห์ความจุ คุณสามารถระบุตัวกรองที่ DX Operational Intelligence ใช้เพื่อทำการคาดการณ์ (รูปด้านล่าง)
มีตัวกรองต่อไปนี้:
- เมตริก เมตริกที่จะใช้สำหรับการคาดการณ์
- ขึ้นอยู่กับ. การเลือกจำนวนข้อมูลในอดีตที่จะใช้ในการคาดการณ์ในอนาคต ช่องนี้ใช้เพื่อเปรียบเทียบและวิเคราะห์แนวโน้มในเดือนที่ผ่านมา แนวโน้มในช่วง 3 เดือนที่ผ่านมา แนวโน้มตลอดปี ฯลฯ
- การเจริญเติบโต. อัตราการเติบโตของปริมาณงานที่คาดหวังที่คุณต้องการใช้ในแบบจำลองการคาดการณ์พลังงานของคุณ ข้อมูลนี้สามารถใช้เพื่อคาดการณ์การเติบโตนอกเหนือจากการคาดการณ์ได้ ตัวอย่างเช่น คาดว่าการใช้ทรัพยากรจะเพิ่มขึ้นอีก 40 เปอร์เซ็นต์เนื่องจากการเปิดสำนักงานแห่งใหม่
การวิเคราะห์บันทึก
คุณสมบัติการวิเคราะห์บันทึก DX OI ให้:
- การรวบรวมและการรวมบันทึกจากแหล่งต่าง ๆ (รวมถึงที่ได้รับจากวิธีตัวแทนและไม่ใช่ตัวแทน)
- การแยกวิเคราะห์ข้อมูลและการทำให้เป็นมาตรฐาน
- การวิเคราะห์เพื่อให้สอดคล้องกับเงื่อนไขที่กำหนดและการสร้างเหตุการณ์
- ความสัมพันธ์ของเหตุการณ์ตามบันทึก รวมถึงเหตุการณ์ที่ได้รับจากการตรวจสอบโครงสร้างพื้นฐานด้านไอที
- การสร้างภาพข้อมูลตามการวิเคราะห์ใน DX Dashboards
- ข้อสรุปเกี่ยวกับความพร้อมในการให้บริการโดยอิงจากการวิเคราะห์ข้อมูลจากบันทึก
การรวบรวมบันทึกโดยใช้วิธีแบบไม่ใช้เอเจนต์จะดำเนินการโดยระบบสำหรับบันทึกเหตุการณ์ของ Windows และ Syslog บันทึกข้อความจะถูกรวบรวมโดยใช้วิธีตัวแทน
ฟังก์ชั่นการแก้ปัญหาฉุกเฉินอัตโนมัติ (การแก้ไข)
การดำเนินการอัตโนมัติเพื่อแก้ไขสถานการณ์ฉุกเฉิน (เวิร์กโฟลว์การแก้ไข) ช่วยให้คุณสามารถแก้ไขปัญหาที่ทำให้เกิดเหตุการณ์ใน DX OI ตัวอย่างเช่น ปัญหาการใช้งาน CPU ทำให้เกิดข้อความแจ้งเตือน เวิร์กโฟลว์การแก้ไขจะแก้ไขปัญหาโดยการรีสตาร์ทเซิร์ฟเวอร์ที่เกิดปัญหา การบูรณาการระหว่าง DX OI และระบบอัตโนมัติทำให้คุณสามารถรันกระบวนการแก้ไขจากคอนโซลเหตุการณ์ใน DX Operational Intelligence และตรวจสอบได้ในคอนโซลอัตโนมัติ
เมื่อรวมเข้ากับระบบอัตโนมัติแล้ว คุณสามารถทริกเกอร์การดำเนินการอัตโนมัติเพื่อแก้ไขสถานการณ์การแจ้งเตือนในคอนโซล DX OI จากบริบทของข้อความแจ้งเตือนได้ คุณสามารถดูการดำเนินการที่แนะนำพร้อมกับข้อมูลเกี่ยวกับเปอร์เซ็นต์ความเชื่อมั่น (ความเป็นไปได้ในการแก้ไขสถานการณ์โดยการดำเนินการ)
เริ่มแรก เมื่อไม่มีสถิติเกี่ยวกับผลลัพธ์ของเวิร์กโฟลว์การแก้ไข กลไกการแนะนำจะแนะนำตัวเลือกที่เป็นไปได้ตามการค้นหาคำหลัก จากนั้นจะใช้ผลลัพธ์การเรียนรู้ของเครื่อง และกลไกจะเริ่มแนะนำเทคนิคการแก้ไขตามการวิเคราะห์พฤติกรรม เมื่อคุณเริ่มประเมินผลลัพธ์ของเคล็ดลับที่คุณได้รับ ความแม่นยำของคำแนะนำจะดีขึ้น
ตัวอย่างคำติชมจากผู้ใช้: ผู้ใช้เลือกว่าเขาชอบหรือไม่ชอบการกระทำที่เสนอ และระบบจะพิจารณาตัวเลือกนี้เมื่อให้คำแนะนำเพิ่มเติม ชอบ/ไม่ชอบ:
การดำเนินการแก้ไขที่แนะนำสำหรับสัญญาณเตือนเฉพาะจะขึ้นอยู่กับผลป้อนกลับร่วมกันซึ่งกำหนดว่าการดำเนินการนั้นยอมรับได้หรือไม่ DX OI มาพร้อมกับการบูรณาการที่พร้อมใช้งานทันทีกับระบบอัตโนมัติอัตโนมัติ
การบูรณาการ DX OI เข้ากับระบบของบุคคลที่สาม
เราจะไม่ลงรายละเอียดเกี่ยวกับการบูรณาการข้อมูลจากผลิตภัณฑ์ตรวจสอบดั้งเดิมของ Broadcom (DX NetOps, DX Infrastructure Management, DX Application Performance Management) มาดูกันว่าข้อมูลจากระบบบุคคลที่สามของบุคคลที่สามถูกรวมเข้าด้วยกันอย่างไร และดูตัวอย่างการรวมเข้ากับหนึ่งในระบบที่ได้รับความนิยมมากที่สุด - Zabbix
สำหรับการผสานรวมกับระบบของบริษัทอื่น จะใช้ส่วนประกอบ DX Gateway DX Gateway ประกอบด้วย 3 องค์ประกอบ - On-Prem Gateway, RESTmon และ Log Collector (Logstash) คุณสามารถติดตั้งทั้ง 3 ส่วนประกอบหรือเฉพาะที่คุณต้องการโดยเปลี่ยนไฟล์การกำหนดค่าทั่วไปเมื่อติดตั้ง DX Gateway รูปด้านล่างแสดงสถาปัตยกรรม DX Gateway
มาดูวัตถุประสงค์ของส่วนประกอบ DX Gateway แยกกัน
เกตเวย์ออนเปรม นี่คืออินเทอร์เฟซที่รวบรวมการแจ้งเตือนจากแพลตฟอร์ม DX และส่งเหตุการณ์การแจ้งเตือนไปยังระบบของบุคคลที่สาม On-Prem Gateway ทำหน้าที่เป็นตัวสำรวจที่รวบรวมข้อมูลเหตุการณ์จาก DX OI เป็นระยะโดยใช้ API คำขอ HTTPS จากนั้นส่งการแจ้งเตือนไปยังเซิร์ฟเวอร์ของบริษัทอื่นที่ผสานรวมกับแพลตฟอร์ม DX โดยใช้ webhooks
ตัวสะสมบันทึก DX รับ syslog จากอุปกรณ์เครือข่ายหรือเซิร์ฟเวอร์และอัปโหลดไปยัง OI DX Log Collector ช่วยให้คุณสามารถแยกซอฟต์แวร์ที่สร้างข้อความ ระบบที่จัดเก็บข้อความเหล่านั้น และซอฟต์แวร์ที่รายงานและวิเคราะห์ข้อความเหล่านั้น แต่ละข้อความจะถูกแท็กด้วยรหัสเอนทิตีที่ระบุประเภทของซอฟต์แวร์ที่สร้างข้อความและกำหนดระดับความรุนแรง คุณสามารถดูทั้งหมดนี้ได้ในภายหลังใน DX Dashboards
DX เรสต์มอน ผสานรวมกับผลิตภัณฑ์/บริการของบุคคลที่สามผ่าน REST API และส่งข้อมูลไปยัง OI รูปด้านล่างแสดงแผนภาพการทำงานของ DX RESTmon โดยใช้ตัวอย่างการรวมเข้ากับระบบตรวจสอบ Solarwinds และ SCOM
คุณสมบัติที่สำคัญของ DX RESTmon:
- เชื่อมต่อกับแหล่งข้อมูลบุคคลที่สามเพื่อรับข้อมูล:
- PULL: การเชื่อมต่อและดึงข้อมูลจาก REST API สาธารณะ
- PUSH: การไหลของข้อมูลไปยัง RESTmon ผ่าน REST
- รองรับรูปแบบ JSON และ XML;
- นำเข้าตัวชี้วัด การแจ้งเตือน กลุ่ม โทโพโลยี สินค้าคงคลัง และบันทึก
- ตัวเชื่อมต่อสำเร็จรูปสำหรับเครื่องมือ/เทคโนโลยีต่าง ๆ นอกจากนี้ยังสามารถพัฒนาตัวเชื่อมต่อไปยังแหล่งที่มาใด ๆ ด้วย API แบบเปิด (รายชื่อตัวเชื่อมต่อชนิดบรรจุกล่องอยู่ในรูปด้านล่าง)
- รองรับการรับรองความถูกต้องขั้นพื้นฐาน (ค่าเริ่มต้น) เมื่อเข้าถึงอินเทอร์เฟซ Swagger และ API
- รองรับ HTTPS (โดยค่าเริ่มต้น) สำหรับข้อความขาเข้าและขาออกทั้งหมด
- รองรับผู้รับมอบฉันทะขาเข้าและขาออก
- ความสามารถในการแยกวิเคราะห์ข้อความที่มีประสิทธิภาพสำหรับบันทึกที่ได้รับผ่าน REST
- การแยกวิเคราะห์แบบกำหนดเองด้วย RESTmon เพื่อการแยกวิเคราะห์และการแสดงภาพบันทึกที่มีประสิทธิภาพ
- รองรับการดึงข้อมูลกลุ่มอุปกรณ์จากการตรวจสอบแอปพลิเคชันและโหลดเข้าสู่ OI เพื่อการวิเคราะห์และการแสดงภาพ
- รองรับการจับคู่นิพจน์ทั่วไป ซึ่งสามารถใช้เพื่อแยกวิเคราะห์และจับคู่ข้อความบันทึกที่ได้รับผ่าน REST และเพื่อสร้างหรือปิดเหตุการณ์ตามเงื่อนไขนิพจน์ทั่วไปบางอย่าง
ตอนนี้เรามาดูกระบวนการตั้งค่าการรวม DX OI กับ Zabbix ผ่าน DX RESTmon การรวมแบบกล่องใช้ข้อมูลต่อไปนี้จาก Zabbix:
- ข้อมูลสินค้าคงคลัง
- โทโพโลยี;
- ปัญหา;
- เมตริก
เนื่องจากตัวเชื่อมต่อสำหรับ Zabbix พร้อมใช้งานทันที สิ่งที่คุณต้องทำเพื่อตั้งค่าการรวมระบบคืออัปเดตโปรไฟล์ของคุณด้วยที่อยู่ IP และบัญชี API ของเซิร์ฟเวอร์ Zabbix จากนั้นอัปโหลดโปรไฟล์ผ่านเว็บอินเทอร์เฟซ Swagger ตัวอย่างในภาพสองภาพต่อไปนี้
หลังจากตั้งค่าการผสานรวมแล้ว ฟังก์ชันการวิเคราะห์ DX OI ที่อธิบายไว้ข้างต้นจะพร้อมใช้งานสำหรับข้อมูลที่มาจาก Zabbix ได้แก่: การวิเคราะห์สัญญาณเตือน การวิเคราะห์ประสิทธิภาพ ข้อมูลเชิงลึกเชิงคาดการณ์ การวิเคราะห์บริการ และการแก้ไข รูปด้านล่างแสดงตัวอย่างการวิเคราะห์ตัวชี้วัดประสิทธิภาพสำหรับออบเจ็กต์ที่รวมจาก Zabbix
ข้อสรุป
DX OI เป็นเครื่องมือวิเคราะห์สมัยใหม่ที่จะมอบประสิทธิภาพการดำเนินงานที่สำคัญให้กับแผนกไอที ช่วยให้ตัดสินใจได้รวดเร็วและถูกต้องยิ่งขึ้นเพื่อปรับปรุงคุณภาพของบริการด้านไอทีและบริการธุรกิจผ่านการวิเคราะห์บริบทข้ามโดเมน สำหรับเจ้าของแอปพลิเคชันและหน่วยธุรกิจ DX OI จะคำนวณตัวบ่งชี้ความพร้อมใช้งานและคุณภาพของบริการ ไม่เพียงแต่ในบริบทของตัวบ่งชี้ด้านเทคโนโลยีไอทีเท่านั้น แต่ยังรวมถึง KPI ทางธุรกิจที่ดึงมาจากสถิติธุรกรรมของผู้ใช้ปลายทางด้วย
หากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับโซลูชันนี้ โปรดส่งคำขอสำหรับการสาธิตหรือโปรแกรมนำร่อง
ที่มา: will.com