Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Nitong Setyembre, inilabas ng Broadcom (dating CA) ang bagong bersyon 20.2 ng solusyon nitong DX Operations Intelligence (DX OI). Ang produktong ito ay nakaposisyon sa merkado bilang isang sistema ng pagsubaybay sa payong. Nagagawa ng system na tumanggap at pagsamahin ang data mula sa mga monitoring system ng iba't ibang domain (network, imprastraktura, application, database) ng parehong CA at third-party na mga tagagawa, kabilang ang mga open source na solusyon (Zabbix, Prometheus at iba pa).

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Ang pangunahing function ng DX OI ay ang paglikha ng isang ganap na mapagkukunan at modelo ng serbisyo (RSM) batay sa mga yunit ng pagsasaayos (CU), na pumupuno sa base ng imbentaryo kapag isinama sa mga third-party na system. Ang DX OI ay nagpapatupad ng mga function ng Machine Learning at Artificial Intelligence (ML at AI) sa data na pumapasok sa platform, na nagbibigay-daan sa iyong masuri/hulaan ang posibilidad ng pagkabigo ng isang partikular na KE at ang antas ng epekto ng pagkabigo sa serbisyo ng negosyo, na ay batay sa isang tiyak na KE. Bilang karagdagan, ang DX OI ay isang solong punto para sa pagkolekta ng mga kaganapan sa pagsubaybay at, nang naaayon, pagsasama sa sistema ng Service Desk, na isang hindi maikakaila na bentahe ng paggamit ng system sa pinag-isang monitoring center para sa mga paglilipat ng tungkulin ng mga organisasyon. Sa artikulong ito sasabihin namin sa iyo ang higit pa tungkol sa pag-andar ng system at ipakita ang mga interface ng user at administrator.

Arkitektura ng Solusyon ng DX OI

Ang DX platform ay may microservice architecture, na naka-install at tumatakbo sa ilalim ng Kubernetes o OpenShift. Ang sumusunod na figure ay nagpapakita ng mga bahagi ng solusyon na maaaring magamit bilang mga independiyenteng tool sa pagsubaybay o maaaring mapalitan ng mga umiiral na sistema ng pagsubaybay na may katulad na mga function (may mga halimbawa ng mga naturang sistema sa figure) at pagkatapos ay konektado sa payong ng DX OI. Sa diagram sa ibaba:

  • Pagsubaybay sa mga mobile application sa DX App Experience Analytics;
  • Pagsubaybay sa pagganap ng aplikasyon sa DX APM;
  • Pagsubaybay sa imprastraktura sa DX Infrastructure Manager;
  • Pagsubaybay sa mga network device sa DX NetOps Manager.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Ang mga bahagi ng DX ay tumatakbo sa ilalim ng kontrol ng isang Kubernetes cluster at scale sa pamamagitan lamang ng paglulunsad ng mga bagong POD. Nasa ibaba ang isang high-level solution diagram.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Ang pangangasiwa, pag-scale, at pag-update ng DX platform ay ginagawa sa administrative console. Mula sa isang console, maaari mong pamahalaan ang isang multi-tenant na arkitektura na maaaring sumasaklaw sa maraming negosyo o maraming unit ng negosyo sa loob ng isang kumpanya. Sa modelong ito, ang bawat enterprise ay maaaring i-configure nang isa-isa bilang isang nangungupahan na may sarili nitong hanay ng mga configuration.

Ang Administration Console ay isang web-based na pagpapatakbo at tool sa pamamahala ng system na nagbibigay sa mga administrator ng pare-pareho, pinag-isang interface upang magsagawa ng mga gawain sa pamamahala ng cluster sa pagsubaybay.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Ang mga bagong nangungupahan para sa mga unit ng negosyo o mga negosyo sa loob ng isang kumpanya ay idine-deploy sa ilang minuto. Nagbibigay ito ng kalamangan kung gusto mong magkaroon ng pinag-isang sistema ng pagsubaybay, ngunit sa antas ng platform (at hindi mga karapatan sa pag-access) upang pag-iba-ibahin ang mga bagay sa pagsubaybay sa pagitan ng mga departamento.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Mga modelo ng resource-service at pagsubaybay sa mga serbisyo ng negosyo

Ang DX OI ay may mga built-in na mekanismo para sa paglikha ng mga serbisyo at pagbuo ng mga klasikong PCM na may pagtatakda ng lohika ng impluwensya at mga timbang sa pagitan ng mga bahagi ng serbisyo. Mayroon ding mga mekanismo para sa pag-export ng PCM mula sa isang panlabas na CMDB. Ang figure sa ibaba ay nagpapakita ng built-in na PCM editor (tandaan ang mga timbang ng link).

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Nagbibigay ang DX OI ng isang holistic na larawan ng mga pangunahing tagapagpahiwatig ng pagganap ng negosyo o mga serbisyo ng IT na may detalye, kabilang ang pagkakaroon ng serbisyo at paghula sa panganib sa pagkabigo. Ang tool ay maaari ding magbigay ng insight sa epekto ng isang isyu sa pagganap o pagbabago sa disenyo ng mga bahagi ng IT (application o imprastraktura) sa isang serbisyo ng negosyo. Ang figure sa ibaba ay nagpapakita ng isang interactive na dashboard na nagpapakita ng katayuan ng lahat ng mga serbisyo.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Tingnan natin ang mga detalye gamit ang serbisyo ng Digital Banking bilang isang halimbawa. Sa pamamagitan ng pag-click sa pangalan ng serbisyo, pumunta kami sa detalyadong PCM ng serbisyo. Nakikita namin na ang katayuan ng serbisyo ng Digital Banking ay nakasalalay sa estado ng imprastraktura at mga subservice ng transaksyon na may iba't ibang timbang. Ang pagtatrabaho sa mga timbang at pagpapakita ng mga ito ay isang masayang benepisyo ng DX OI.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Ang topology ay isang mahalagang elemento ng pagsubaybay sa pagpapatakbo ng planta, na nagpapahintulot sa mga operator at inhinyero na suriin ang mga ugnayan sa pagitan ng mga bahagi, hanapin ang ugat na sanhi at epekto.

Ang DX OI Topology Viewer ay isang serbisyo na gumagamit ng topological na data na nagmumula sa mga sistema ng pagsubaybay sa domain na direktang nangongolekta ng data mula sa mga bagay sa pagsubaybay. Ang tool ay idinisenyo upang maghanap ng maraming layer ng mga topology store at magpakita ng isang mapa ng mga relasyon na tukoy sa konteksto. Upang imbestigahan ang mga problema, maaari kang pumunta sa may problemang Backend Banking subservice at tingnan ang topology at may problemang mga bahagi. Maaari mo ring suriin ang mga mensahe ng alarma at sukatan ng pagganap para sa bawat bahagi.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Kapag sinusuri ang mga bahagi ng transaksyon sa Payments (mga transaksyon ng user), maaari naming subaybayan ang mga halaga ng KPI ng negosyo, na isinasaalang-alang din kapag kinakalkula ang availability at katayuan sa kalusugan ng serbisyo. Ang isang halimbawa ng isang KPI ng negosyo ay ibinigay sa ibaba:

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Analytics ng Kaganapan

Algorithmic noise reduction dahil sa accident clustering

Ang isa sa mga pangunahing tampok ng DX OI sa pagproseso ng kaganapan ay ang clustering. Gumagana ang makina sa lahat ng mga alertong pumapasok sa system upang matukoy ang mga pattern batay sa iba't ibang konteksto at pagsama-samahin ang mga ito. Ang mga cluster na ito ay self-learning at hindi kailangang i-configure nang manu-mano.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Kaya, ang clustering ay nagbibigay-daan sa mga user na pagsamahin at pagpangkatin ang isang malaking bilang ng mga kaganapan at pag-aralan lamang ang mga may isang karaniwang konteksto. Halimbawa, isang hanay ng mga kaganapan na kumakatawan sa isang insidente na nakakaapekto sa pagpapatakbo ng mga application o isang data center. Nilikha ang mga sitwasyon gamit ang machine learning-based clustering algorithm na gumagamit ng temporal na ugnayan, topological na relasyon, at pagproseso ng katutubong wika para sa pagsusuri. Ang mga figure sa ibaba ay nagpapakita ng mga halimbawa ng visualization ng mga grupo ng cluster ng mga mensahe, ang tinatawag na Mga Alarm ng Sitwasyon, at Timeline ng Ebidensya, na nagpapakita ng mga pangunahing parameter ng pagpapangkat at ang proseso ng pagbabawas ng bilang ng mga kaganapan sa ingay.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Pagsusuri ng problema sa ugat at ugnayan ng aksidente

Sa hybrid na kapaligiran ngayon, ang isang transaksyon ng user ay maaaring makaapekto sa maraming system na ginagamit nang pabago-bago. Bilang resulta, maraming mga alerto ang maaaring mabuo mula sa iba't ibang mga system ngunit nauugnay sa parehong problema o insidente. Gumagamit ang DX OI ng mga pagmamay-ari na mekanismo upang sugpuin ang mga redundant at duplicate na alerto at iugnay ang mga nauugnay na alerto para sa pinahusay na pagtuklas ng mga kritikal na isyu at mas mabilis na paglutas.

Tingnan natin ang isang halimbawa kapag ang system ay nakatanggap ng maraming mga mensahe ng alarma para sa iba't ibang mga bagay (OU) na pinagbabatayan ng isang serbisyo. Kung sakaling magkaroon ng epekto sa availability at performance ng serbisyo, bubuo ang system ng service alarm (Service Alarm), ipahiwatig at itatalaga ang probable root cause (problematic KE at alarm message para sa KE), na nag-ambag sa pagbaba ng performance o kabiguan ng serbisyo. Ang figure sa ibaba ay nagpapakita ng visualization ng isang emergency na sitwasyon para sa serbisyo ng Webex.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Binibigyang-daan ka ng DX OI na magtrabaho kasama ang mga kaganapan sa pamamagitan ng mga intuitive na pagkilos sa web interface ng system. Ang mga user ay maaaring manu-manong magtalaga ng mga kaganapan sa responsableng empleyado para sa pag-troubleshoot, pag-reset/pagkilala ng mga alerto, paggawa ng mga tiket o pagpapadala ng mga abiso sa email, at pagpapatakbo ng mga awtomatikong script upang malutas ang isang emergency (Remediation Workflow, higit pa tungkol doon sa ibang pagkakataon). Sa ganitong paraan, binibigyang-daan ng DX OI ang mga on-call operator na tumuon sa mensahe ng root alarm at tumutulong din na i-streamline ang proseso ng pag-uuri ng mga mensahe sa mga clustered array.

Mga algorithm ng makina para sa pagproseso ng mga sukatan at pagsusuri ng data ng pagganap

Nagbibigay-daan sa iyo ang machine learning na subaybayan, pagsama-samahin at ilarawan ang mga pangunahing tagapagpahiwatig ng pagganap para sa anumang partikular na yugto ng panahon, na nagbibigay sa user ng mga sumusunod na benepisyo:

  • Pagtuklas ng mga bottleneck at anomalya sa pagganap;
  • Paghahambing ng ilang indicator para sa parehong mga device, interface o network;
  • Paghahambing ng magkatulad na mga tagapagpahiwatig sa ilang mga site;
  • Paghahambing ng iba't ibang mga tagapagpahiwatig para sa isa at ilang mga bagay;
  • Paghahambing ng mga multidimensional na sukatan sa maraming bagay.

Upang pag-aralan ang mga sukatan na pumapasok sa system, gumagamit ang DX OI ng mga function ng machine analytics gamit ang mga mathematical algorithm, na nakakatulong na bawasan ang oras kapag nagtatakda ng mga static na threshold at bumubuo ng mga babala kapag naganap ang mga anomalya.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Ang resulta ng paglalapat ng mga mathematical algorithm ay ang pagbuo ng tinatawag na probability distribution ng metric value (Rare, Probable, Center, Mean, Actual). Ang mga figure sa itaas at ibaba ay nagpapakita ng mga pamamahagi ng posibilidad.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Ang dalawang graph sa itaas ay nagpapakita ng sumusunod na data:

  • Aktwal na data. Ang aktwal na data ay ipinapakita sa graph bilang isang solidong itim na linya (walang alarma) o isang may kulay na solidong linya (estado ng alarma). Kinakalkula ang linya batay sa aktwal na data para sa sukatan. Sa pamamagitan ng paghahambing ng aktwal na data at median, mabilis mong makikita ang mga variation sa sukatan. Kapag naganap ang isang kaganapan, ang itim na linya ay nagbabago sa isang kulay na solidong linya na tumutugma sa pagiging kritikal ng kaganapan at nagpapakita ng mga icon na may kaukulang kritikalidad sa itaas ng graph. Halimbawa, pula para sa isang kritikal na anomalya, orange para sa isang malaking anomalya, at dilaw para sa isang maliit na anomalya.
  • Mean value ng indicator. Ang mean o median na halaga para sa isang indicator ay ipinapakita sa chart bilang isang gray na linya. Ang average ay ipinapakita kapag walang sapat na makasaysayang data.
  • Median value ng indicator (Center value). Ang median na linya ay ang gitna ng hanay at ipinapakita bilang isang berdeng tuldok na linya. Ang mga zone na pinakamalapit sa linyang ito ay pinakamalapit sa mga karaniwang halaga ng indicator.
  • Karaniwang Halaga. Sinusubaybayan ng pangkalahatang data ng zone ang pinakamalapit na center line o normal para sa iyong sukatan at lumilitaw bilang dark green bar. Inilalagay ng mga analytical na kalkulasyon ang pangkalahatang zone sa isang porsyento sa itaas o mas mababa sa normal.
  • Probabilistikong data. Ang data ng probability zone ay ipinapakita bilang isang berdeng bar sa graph. Inilalagay ng system ang probability zone sa dalawang porsyento sa itaas o mas mababa sa normal.
  • Rare data. Ang data ng rare zone ay ipinapakita sa graph bilang isang light green na bar. Ang system ay naglalagay ng isang lugar na may mga bihirang halaga ng panukat sa tatlong porsyento sa itaas o mas mababa sa pamantayan at nagpapahiwatig ng pag-uugali ng indicator sa labas ng normal na hanay, habang ang system ay bumubuo ng tinatawag na Anomaly Alert.

Ang anomalya ay isang pagsukat o kaganapan na hindi naaayon sa normal na pagganap ng isang sukatan. Ang pagtuklas ng anomalya upang matukoy ang mga problema at maunawaan ang mga uso sa imprastraktura at aplikasyon ay isang pangunahing tampok ng DX OI. Ang pagtuklas ng anomalya ay nagbibigay-daan sa iyong kapwa makilala ang hindi pangkaraniwang pag-uugali (halimbawa, isang server na tumutugon nang mas mabagal kaysa karaniwan, o hindi pangkaraniwang aktibidad sa network na dulot ng isang hack) at tumugon nang naaayon (pagtaas ng isang insidente, pagpapatakbo ng isang awtomatikong script ng Remediation).

Ang DX OI Anomaly Detection ay nagbibigay ng mga sumusunod na benepisyo:

  • Hindi na kailangang magtakda ng mga limitasyon. Ang DX OI ay independiyenteng magkokolekta ng data at tutukoy ng mga anomalya.
  • Kasama sa DX OI ang higit sa sampung artificial intelligence at machine learning algorithm, kabilang ang EWMA (Exponentially-Weightedβ€”Moving-Average) at KDE (Kernel Density Estimation). Ang mga algorithm na ito ay nagbibigay-daan sa mabilis na pagsusuri ng sanhi ng ugat at paghula ng mga halaga ng panukat sa hinaharap.

Predictive analytics at notification ng mga posibleng pagkabigo

Ang Predictive Insights ay isang feature na gumagamit ng kapangyarihan ng machine learning para matukoy ang mga pattern at trend. Batay sa mga trend na ito, hinuhulaan ng system ang mga kaganapang maaaring mangyari sa hinaharap. Isinasaad ng mga mensaheng ito ang pangangailangang kumilos bago lumihis ang mga halaga ng sukatan mula sa mga normal na halaga at makaapekto sa mga kritikal na serbisyo sa negosyo. Ang mga Predictive Insight ay inilalarawan sa figure sa ibaba.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

At isa itong visualization ng mga predictive na babala para sa isang partikular na sukatan.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Pagtataya ng load ng computing power na may function ng pagtukoy ng mga senaryo ng pagkarga

Tinutulungan ka ng pagpaplano ng kapasidad ng Capacity Analytics na pamahalaan ang iyong mga mapagkukunang IT, na tinitiyak na ang mga mapagkukunan ay wastong sukat upang matugunan ang kasalukuyan at hinaharap na mga pangangailangan ng negosyo. Magagawa mong i-optimize ang pagiging produktibo at kahusayan ng mga kasalukuyang mapagkukunan, planuhin at bigyang-katwiran ang anumang pamumuhunan sa pananalapi.

Ang tampok na Capacity Analytics sa DX OI ay nagbibigay ng mga sumusunod na benepisyo:

  • Kapasidad ng pagtataya sa mga peak season;
  • Pagtukoy sa sandali kung kailan kinakailangan ang mga karagdagang mapagkukunan upang matiyak ang mataas na kalidad na paggana ng serbisyo;
  • Pagbili ng mga karagdagang mapagkukunan lamang kung kinakailangan;
  • Epektibong pamamahala ng imprastraktura at mga network;
  • Tanggalin ang mga hindi kinakailangang gastos sa enerhiya sa pamamagitan ng pagtukoy sa hindi nagamit na mga mapagkukunan;
  • Pagsasagawa ng mga pagtatasa sa pagkarga ng mapagkukunan kung sakaling may nakaplanong pagtaas ng demand para sa isang serbisyo o mapagkukunan.

Ang pahina ng Capacity Analytics DX OI (larawan sa ibaba) ay may mga sumusunod na widget:

  • Katayuan ng Kapasidad ng Mapagkukunan;
  • Mga Sinusubaybayang Grupo/Serbisyo;
  • Mga Mamimili ng Pinakamataas na Kapasidad.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Ang pangunahing page ng Capacity Analytics ay nagpapakita ng mga bahagi ng mapagkukunan na labis na ginagamit at nauubusan ng kapasidad. Tinutulungan ng page na ito ang mga administrator ng platform na mahanap ang mga nagamit na mapagkukunan at tinutulungan silang baguhin ang laki at i-optimize ang mga mapagkukunan. Ang katayuan ng mga mapagkukunan ay maaaring masuri batay sa mga code ng kulay at ang kanilang mga kaukulang kahulugan. Inuri ang mga mapagkukunan batay sa kanilang antas ng kasikipan sa pahina ng katayuan ng kapasidad ng mapagkukunan. Maaari kang mag-click sa bawat kulay upang tingnan ang isang listahan ng mga bahagi na kasama sa napiling kategorya. Susunod, ang isang mapa ng init ay ipapakita kasama ang lahat ng mga bagay at mga hula sa loob ng 12 buwan, na nagbibigay-daan sa iyong tukuyin ang mga mapagkukunan na malapit nang maubusan.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Para sa bawat isa sa mga sukatan sa Capacity Analytics, maaari mong tukuyin ang mga filter na ginagamit ng DX Operational Intelligence upang gumawa ng mga pagtataya (figure sa ibaba).

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Available ang mga sumusunod na filter:

  • Sukatan. Ang sukatan na gagamitin para sa hula.
  • Base sa. Pagpili sa dami ng makasaysayang data na gagamitin upang gumawa ng mga pagtataya para sa hinaharap. Ginagamit ang field na ito upang ihambing at suriin ang mga trend sa nakalipas na buwan, mga trend sa nakalipas na 3 buwan, mga trend sa loob ng taon, atbp.
  • Paglago. Ang inaasahang rate ng paglago ng workload na gusto mong gamitin para i-modelo ang iyong forecast ng kuryente. Maaaring gamitin ang data na ito upang hulaan ang paglago na lampas sa mga pag-asa. Halimbawa, ang paggamit ng mapagkukunan ay inaasahang tataas ng isa pang 40 porsyento dahil sa pagbubukas ng isang bagong opisina.

Pagsusuri ng log

Ang tampok na pagsusuri ng log ng DX OI ay nagbibigay ng:

  • koleksyon at pagsasama-sama ng mga log mula sa iba't ibang mga mapagkukunan (kabilang ang mga nakuha ng ahente at hindi ahente na mga pamamaraan);
  • pag-parse at normalisasyon ng data;
  • pagsusuri para sa pagsunod sa mga itinakdang kundisyon at pagbuo ng mga kaganapan;
  • ugnayan ng mga kaganapan batay sa mga tala, kabilang ang mga kaganapan na nakuha bilang resulta ng pagsubaybay sa imprastraktura ng IT;
  • visualization ng data batay sa pagsusuri sa DX Dashboards;
  • mga konklusyon tungkol sa pagkakaroon ng serbisyo batay sa pagsusuri ng data mula sa mga log.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Ang pagkolekta ng log gamit ang isang agentless method ay ginagawa ng system para sa Windows Event logs at Syslog. Kinokolekta ang mga text log gamit ang isang paraan ng ahente.

Automated emergency resolution function (Remediation)

Nagbibigay-daan sa iyo ang mga awtomatikong pagkilos para iwasto ang isang sitwasyong pang-emergency (Remediation Workflow) na lutasin ang mga problemang naging sanhi ng pagbuo ng isang kaganapan sa DX OI. Halimbawa, ang isang isyu sa paggamit ng CPU ay bumubuo ng isang mensahe ng alarma, nireresolba ng Remediation Workflow ang isyu sa pamamagitan ng pag-restart sa server kung saan nangyari ang isyu. Ang pagsasama sa pagitan ng DX OI at ng automation system ay nagbibigay-daan sa iyong magpatakbo ng mga proseso ng remediation mula sa event console sa DX Operational Intelligence at subaybayan ang mga ito sa automation console.

Kapag naisama na sa automation system, maaari kang mag-trigger ng mga awtomatikong pagkilos para itama ang anumang sitwasyon ng alarma sa DX OI console mula sa konteksto ng mensahe ng alarma. Maaari mong tingnan ang mga inirerekomendang aksyon kasama ang impormasyon tungkol sa porsyento ng kumpiyansa (ang posibilidad na malutas ang sitwasyon sa pamamagitan ng paggawa ng aksyon).

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Sa una, kapag walang mga istatistika sa mga resulta ng Remediation Workflow, ang engine ng rekomendasyon ay nagmumungkahi ng mga potensyal na opsyon batay sa mga paghahanap sa keyword, pagkatapos ay gagamitin ang mga resulta ng machine learning, at ang engine ay magsisimulang magrekomenda ng diskarte sa remediation batay sa heuristics. Kapag sinimulan mo nang suriin ang mga resulta ng mga tip na iyong natatanggap, ang katumpakan ng iyong mga rekomendasyon ay mapapabuti.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Isang halimbawa ng feedback mula sa user: pinipili ng user kung gusto niya o hindi niya gusto ang iminungkahing aksyon, at isinasaalang-alang ng system ang pagpipiliang ito kapag gumagawa ng mga karagdagang rekomendasyon. Gusto/hindi gusto:

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Ang mga inirerekomendang pagkilos sa pagwawasto para sa isang partikular na alarma ay batay sa kumbinasyon ng feedback na tumutukoy kung katanggap-tanggap ang pagkilos. Ang DX OI ay may kasamang out-of-the-box na pagsasama sa Automic Automation.

Pagsasama ng DX OI sa mga third-party na system

Hindi namin tatalakayin nang detalyado ang pagsasama-sama ng data mula sa mga katutubong produkto ng pagsubaybay ng Broadcom (DX NetOps, DX Infrastructure Management, DX Application Performance Management). Sa halip, tingnan natin kung paano isinama ang data mula sa mga third-party na 3rd-party system at tingnan ang isang halimbawa ng pagsasama sa isa sa mga pinakasikat na system - Zabbix.

Para sa pagsasama sa mga sistema ng third-party, ginagamit ang bahagi ng DX Gateway. Ang DX Gateway ay binubuo ng 3 bahagi - On-Prem Gateway, RESTmon at Log Collector (Logstash). Maaari mong i-install ang lahat ng 3 bahagi o ang isa lang na kailangan mo sa pamamagitan ng pagpapalit ng pangkalahatang configuration file kapag nag-i-install ng DX Gateway. Ipinapakita ng figure sa ibaba ang arkitektura ng DX Gateway.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Tingnan natin ang layunin ng mga bahagi ng DX Gateway nang hiwalay.

On-Prem Gateway. Ito ang interface na nangongolekta ng mga alarma mula sa DX platform at nagpapadala ng mga alarm event sa mga third party system. Ang On-Prem Gateway ay gumaganap bilang isang poller na pana-panahong nangongolekta ng data ng kaganapan mula sa DX OI gamit ang HTTPS request API, pagkatapos ay nagpapadala ng mga alerto sa isang third-party na server na isinama sa DX platform gamit ang mga webhook.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Kolektor ng DX Log tumatanggap ng syslog mula sa mga network device o server at ina-upload ang mga ito sa OI. Pinapayagan ka ng DX Log Collector na paghiwalayin ang software na bumubuo ng mga mensahe, ang system na nag-iimbak ng mga ito, at ang software na nag-uulat at nagsusuri sa kanila. Ang bawat mensahe ay na-tag ng isang entity code na nagsasaad ng uri ng software na bumubuo ng mensahe at nagtalaga ng antas ng kalubhaan. Maaari mong tingnan ang lahat ng ito sa ibang pagkakataon sa DX Dashboards.

DX RESTmon sumasama sa mga produkto/serbisyo ng third party sa pamamagitan ng REST API at nagpapadala ng data sa OI. Ang figure sa ibaba ay nagpapakita ng gumaganang diagram ng DX RESTmon gamit ang halimbawa ng pagsasama sa Solarwinds at SCOM monitoring system.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Mga pangunahing tampok ng DX RESTmon:

  • Kumonekta sa anumang third party na data source para makatanggap ng data:
    • PULL: pagkonekta at pagkuha ng data mula sa mga pampublikong REST API;
    • PUSH: daloy ng data sa RESTmon sa pamamagitan ng REST.
  • Suporta para sa JSON at XML na mga format;
  • Mga sukatan sa ingest, alerto, pangkat, topolohiya, imbentaryo at mga log;
  • Mga ready-made connector para sa iba't ibang tool/teknolohiya; posible ring bumuo ng connector sa anumang source na may bukas na API (ang listahan ng mga boxed connectors ay nasa figure sa ibaba);
  • Suporta para sa pangunahing pagpapatunay (default) kapag ina-access ang Swagger interface at API;
  • Suporta sa HTTPS (bilang default) para sa lahat ng papasok at papalabas na mensahe;
  • Suporta para sa mga papasok at papalabas na proxy;
  • Napakahusay na mga kakayahan sa pag-parse ng teksto para sa mga log na natanggap sa pamamagitan ng REST;
  • Custom na pag-parse gamit ang RESTmon para sa mahusay na pag-parse ng log at visualization;
  • Suporta para sa pagkuha ng impormasyon ng pangkat ng device mula sa mga application ng pagsubaybay at pag-load sa OI para sa pagsusuri at visualization;
  • Suporta para sa regular na pagtutugma ng expression. Magagamit ito para i-parse at itugma ang mga mensahe ng log na natanggap sa pamamagitan ng REST, at para bumuo o magsara ng mga event batay sa ilang partikular na kundisyon ng regular na expression.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Ngayon tingnan natin ang proseso ng pag-set up ng DX OI integration sa Zabbix sa pamamagitan ng DX RESTmon. Kinukuha ng boxed integration ang sumusunod na data mula sa Zabbix:

  • data ng imbentaryo;
  • topology;
  • Problema;
  • mga sukatan.

Dahil ang connector para sa Zabbix ay available out of the box, ang kailangan mo lang gawin para i-set up ang integration ay i-update ang iyong profile gamit ang Zabbix server API IP address at account, at pagkatapos ay i-upload ang profile sa pamamagitan ng Swagger web interface. Isang halimbawa sa sumusunod na dalawang larawan.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Pagkatapos i-set up ang pagsasama, ang DX OI analytical function na inilarawan sa itaas ay magiging available para sa data na nagmumula sa Zabbix, katulad ng: Alarm Analytics, Performance Analytics, Predictive Insights, Service Analytics at Remediation. Ang figure sa ibaba ay nagpapakita ng isang halimbawa ng pagsusuri ng mga sukatan ng pagganap para sa mga bagay na isinama mula sa Zabbix.

Umbrella monitoring system at mga resource-service na modelo sa na-update na DX Operations Intelligence mula sa Broadcom (hal. CA)

Konklusyon

Ang DX OI ay isang modernong tool sa analytics na magbibigay ng makabuluhang kahusayan sa pagpapatakbo sa mga departamento ng IT, na nagbibigay-daan sa mas mabilis at mas tamang mga pagpapasya na gawin upang mapabuti ang kalidad ng mga serbisyo ng IT at negosyo sa pamamagitan ng cross-domain na contextual analysis. Para sa mga may-ari ng application at mga unit ng negosyo, kakalkulahin ng DX OI ang indicator ng availability at kalidad ng mga serbisyo hindi lamang sa konteksto ng mga teknolohikal na tagapagpahiwatig ng IT, kundi pati na rin ang mga KPI ng negosyo na nakuha mula sa mga istatistika ng transaksyon sa mga end user.

Kung gusto mong matuto nang higit pa tungkol sa solusyon na ito, mangyaring magsumite ng kahilingan para sa isang demo o piloto sa paraang maginhawa para sa iyo sa aming website.

Pinagmulan: www.habr.com

Magdagdag ng komento