Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

У гэтым верасні Broadcom (былая CA) выпусціла новую версію 20.2/XNUMX свайго рашэння DX Operations Intelligence (DX OI). На рынку гэты прадукт пазіцыянуецца як парасонавая сістэма маніторынгу. Сістэма здольная атрымліваць і аб'ядноўваць дадзеныя ад сістэм маніторынгу розных даменаў (сетка, інфраструктура, прыкладанні, базы дадзеных) як CA так і іншых вытворцаў, у тым ліку, open source рашэнняў (Zabbix, Prometheus і іншых).

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Асноўная функцыя DX OI – стварэнне паўнавартаснай рэсурсна-сэрвіснай мадэлі (РСМ) на базе канфігурацыйных адзінак (КЕ), якія напаўняюць інвентарную базу пры інтэграцыі са іншымі сістэмамі. У DX OI рэалізаваны функцыі Machine Learning і Artificial Intelligence (ML і AI) над паступаючымі ў платформу дадзенымі, што дазваляе ацаніць / спрагназаваць верагоднасць адмовы канкрэтнай КЕ і ступень уплыву адмовы на бізнес-сэрвіс, у аснове якога ляжыць канкрэтная КЕ. Акрамя таго, DX OI з'яўляецца адзінай кропкай збору падзей маніторынгу і, адпаведна, інтэграцыі з сістэмай Service Desk, што з'яўляецца бясспрэчнай перавагай выкарыстання сістэмы ў адзіных цэнтрах маніторынгу дзяжурнымі зменамі арганізацый. У гэтым артыкуле мы раскажам падрабязней аб функцыянале сістэмы і пакажам інтэрфейсы карыстальніка і адміністратара.

Архітэктура рашэння DX OI

Платформа DX мае мікрасэрвісную архітэктуру, усталёўваецца і працуе пад кіраваннем Kubernetes ці OpenShift. На наступным малюнку прыведзены кампаненты рашэння, якія могуць выкарыстоўвацца як самастойныя прылады маніторынгу або могуць быць заменены на ўжо наяўныя сістэмы маніторынгу з падобнымі функцыямі (на малюнку ёсць прыклады такіх сістэм) і далей падлучацца да парасона DX OI. На схеме ніжэй:

  • Маніторынг мабільных прыкладанняў у DX App Experience Analytics;
  • Маніторынг прадукцыйнасці прыкладанняў у DX APM;
  • Маніторынг інфраструктуры ў DX Infrastructure Manager;
  • Маніторынг сеткавых прылад у DX NetOps Manager.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Кампаненты DX працуюць пад кіраванне кластара Kubernetes і маштабуюцца простым запускам новых POD. Ніжэй верхнеўзроўневая схема рашэння.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Адміністраванне, маштабаванне і абнаўленне платформы DX выконваецца ў адміністрацыйнай кансолі. З адной кансолі можна кіраваць мультытэнантнай архітэктурай, якая можа ахопліваць некалькіх прадпрыемстваў ці некалькіх бізнэс-адзінак у рамках кампаніі. У гэтай мадэлі кожнае прадпрыемства можа быць наладжана індывідуальна як арандатар са сваім уласным наборам канфігурацый.

Кансоль адміністравання - гэта вэб-інструмент для кіравання аперацыямі і сістэмай, які дае адміністратарам ўзгоднены уніфікаваны інтэрфейс для выканання задач па кіраванні кластарам маніторынгу.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Новыя тэнанты для бізнэс-адзінак ці прадпрыемствы ў складзе кампаніі разгортваюцца за лічаныя хвіліны. Гэты дае перавагу, калі вы жадаеце мець адзіную сістэму маніторынгу, але пры гэтым на ўзроўні платформы (а не мае рацыю доступу) размежаваць аб'екты маніторынгу паміж падраздзяленнямі.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Рэсурсна-сэрвісныя мадэлі і маніторынг бізнес-сэрвісаў

DX OI мае ўбудаваныя механізмы для стварэння сэрвісаў і распрацоўкі класічных РСМ з заданнем логікі ўплыву і шаляў паміж кампанентамі сэрвісу. Таксама маюцца механізмы экспарту РСМ са знешняй CMDB. На малюнку ніжэй убудаваны рэдактар ​​РСМ (звярніце ўвагу на вагі сувязей).

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

DX OI дае цэласную карціну ключавых паказчыкаў функцыянавання бізнес-паслуг або ІТ-паслуг з дэталізацыяй, у тым ліку даступнасць сэрвісаў і прагназаванне рызык адмовы. Інструмент таксама можа даць разуменне ўплыву праблемы прадукцыйнасці або змены ў структуры IT-кампанентаў (прыкладанні або інфраструктуры) на бізнес-сэрвіс. На малюнку ніжэй інтэрактыўны дашборд, які адлюстроўвае стан усіх сэрвісаў.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Разгледзім падрабязнасці на прыкладзе сэрвісу Digital Banking. Па кліку па назве сэрвісу пераходзім у дэталёвую РСМ сэрвісу. Бачым, што статут сэрвісу Digital Banking залежыць ад стану інфраструктурных і транзакцыйных падсэрвісаў з рознымі вагамі. Праца з вагамі і іх адлюстраванне - забаўная перавага DX OI.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Тапалогія - важны элемент аператыўнага маніторынгу прадпрыемства, дазваляе аператарам і інжынерам аналізаваць ўзаемасувязі паміж кампанентамі, знаходзіць першапрычыну і ўплыў.

DX OI Topology Viewer - гэта сэрвіс, які выкарыстоўвае ў працы тапалагічныя дадзеныя, якія паступаюць ад даменных сістэм маніторынгу, якія ажыццяўляюць збор дадзеных непасрэдна з аб'ектаў маніторынгу. Інструмент прызначаны для пошуку ў некалькіх пластах сховішчаў тапалогіі і адлюстравання карты адносін, якая залежыць ад кантэксту. Для расследавання праблем можна перайсці ў праблемны падсэрвіс Backend Banking і ўбачыць тапалогію і праблемныя кампаненты. Таксама па кожным кампаненце можна аналізаваць аварыйныя паведамленні і метрыкі прадукцыйнасці.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Пры аналізе транзакцыйных кампанентаў Payments (карыстальніцкіх транзакцый) можам адсочваць значэнні бізнес-KPI, якія таксама ўлічваюцца пры разліку статусу даступнасці і здароўя сэрвісу. Прыклад бізнэс-KPI прыведзены ніжэй:

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Падзейная аналітыка (Alarm Analytics)

Алгарытмічнае шумапрыглушэнне за кошт кластарызацыі аварый

Адна з ключавых функцый DX OI пры апрацоўцы падзей - кластарызацыя. Механізм працуе над усімі абвесткамі, якія паступаюць у сістэму, каб ідэнтыфікаваць шаблоны на аснове розных кантэкстаў і аб'ядноўваць іх у групы. Гэтыя кластары з'яўляюцца саманавучальнымі, іх не трэба канфігураваць уручную.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Такім чынам, кластарызацыя дазваляе карыстальнікам аб'ядноўваць і групаваць вялізную колькасць падзей і аналізаваць толькі тыя, якія маюць агульны кантэкст. Напрыклад, набор падзей, якія прадстаўляюць інцыдэнт, які ўплывае на працу прыкладанняў ці цэнтра апрацоўкі дадзеных. Сітуацыі ствараюцца з выкарыстаннем алгарытмаў кластарызацыі на аснове машыннага навучання, якія выкарыстоўваюць для аналізу часовую карэляцыю, тапалагічную ўзаемасувязь і апрацоўку натуральнай мовы (native language). На малюнках ніжэй прыведзены прыклады візуалізацыі кластарных груп паведамленняў, так званыя Situations Alarms, і Evidence Timeline, якія адлюстроўваюць асноўныя параметры групоўкі і працэс памяншэння колькасці шумавых падзей.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Аналіз каранёвых праблем і карэляцыя аварый

У сучасным гібрыдным асяроддзі карыстацкая транзакцыя можа закранаць некалькі сістэм, якія выкарыстоўваюцца дынамічна. У выніку можа быць створана некалькі папярэджанняў з розных сістэм, але злучаных з адной і той жа праблемай ці інцыдэнтам. DX OI выкарыстоўвае запатэнтаваныя механізмы для падаўлення залішніх і дубляваць абвестак і карэляцыі звязаных абвестак для паляпшэння выяўлення крытычных праблем і больш хуткага рашэння.

Разбяром прыклад, калі ў сістэму паступаюць шматлікія аварыйныя паведамленні па розных аб'ектах (КЕ), якія ляжаць у аснове аднаго сэрвісу. У выпадку ўздзеяння на даступнасць і працаздольнасць сэрвісу сістэма згенеруе сэрвісную аварыю (Service Alarm), пакажа і акрэсліць верагодны каранёвы чыннік (праблемны КЕ і аварыйнае паведамленне па КЕ), якое спрыяла паніжэнню прадукцыйнасці ці адмове сэрвісу. На малюнку ніжэй прыведзена візуалізацыя аварыйнай сітуацыі для сервісу Webex.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

DX OI дазваляе працаваць з падзеямі з дапамогай інтуітыўна зразумелых дзеянняў у web-інтэрфейсе сістэмы. Карыстальнікі могуць уручную прызначаць падзеі на адказнага супрацоўніка для ўхілення непаладак, скідаць/пацвярджаць абвесткі, ствараць заяўкі або адпраўляць апавяшчэнні па электроннай пошце, запускаць аўтаматызаваныя сцэнары для ўхілення аварыйнай сітуацыі (Remediation Workflow, пра гэта крыху пазней). Такім чынам, DX OI дазваляе аператарам дзяжурных змен засяродзіцца на каранёвым аварыйным паведамленні, а таксама дапамагчы спрасціць працэс сартавання паведамленняў на кластарныя масівы.

Машынныя алгарытмы апрацоўкі метрык і аналіз дадзеных па прадукцыйнасці

Машыннае навучанне дазваляе адсочваць, агрэгаваць і візуалізаваць ключавыя паказчыкі прадукцыйнасці за любы пэўны перыяд часу, што дае карыстачу наступныя перавагі:

  • Выяўленне вузкіх месцаў і анамалій прадукцыйнасці;
  • Параўнанне некалькі паказчыкаў для адных і тых жа прылад, інтэрфейсаў ці сетак;
  • Параўнанне аднолькавых паказчыкаў на некалькіх аб'ектах;
  • Параўнанне розных паказчыкаў па адным і некалькіх аб'ектах;
  • Параўнанне шматмерных метрык па некалькіх аб'ектах.

Для аналізу якія паступаюць у сістэму метрык DX OI выкарыстоўвае функцыі машыннай аналітыкі з ужываннем матэматычных алгарытмаў што спрыяе скарачэнню часу пры наладзе статычных парогаў і генерацыі папярэджанняў пры ўзнікненні анамалій.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Вынікам ужывання матэматычных алгарытмаў з'яўляецца пабудова так званых імавернасных размеркаванняў значэння метрыкі (Rare, Probable, Center, Mean, Actual). На малюнках вышэй і ніжэй прадстаўлены імавернасныя размеркаванні.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

На двух графіках вышэй адлюстраваны наступныя дадзеныя:

  • Фактычныя дадзеныя (Actual). Фактычныя дадзеныя адлюстроўваюцца на графіцы ў выглядзе суцэльнай чорнай лініі (няма сігналаў трывогі) або каляровай суцэльнай лініі (стан трывогі). Лінія разлічваецца на аснове фактычных даных для метрыкі. Параўноўваючы фактычныя дадзеныя і медыянае значэнне, вы можаце хутка ўбачыць варыяцыі метрыкі. Калі ўзнікае падзея, чорная лінія мяняецца на каляровую суцэльную лінію, якая адпавядае крытычнасці падзеі і адлюстроўвае значкі з адпаведнай крытычнасцю над графікам. Напрыклад, чырвоны колер для крытычнай анамаліі, аранжавы для значнай анамаліі і жоўты для нязначнай анамаліі.
  • Сярэдняе значэнне паказчыка (Mean value). Сярэдняе значэнне ці сярэдняе значэнне для паказчыка паказана на дыяграме шэрай лініяй. Сярэдняе значэнне адлюстроўваецца, калі не хапае гістарычных звестак.
  • Медыянае значэнне паказчыка (Center value). Медыянная лінія з'яўляецца сярэдзінай дыяпазону і паказана зялёнай пункцірнай лініяй. Зоны, бліжэйшыя гэтай лініі, найбольш блізкія да тыповых значэнняў паказчыка.
  • Агульныя дадзеныя (Common Value). Дадзеныя агульнай зоны адсочваюць бліжэйшую да цэнтральнай лініі або норму для вашага паказчыка і адлюстроўваюцца ў выглядзе цёмна-зялёнай паласы. Аналітычныя разлікі змяшчаюць агульную зону на адзін адсотак вышэй або ніжэй за норму.
  • Імавернасныя дадзеныя. Дадзеныя імавернаснай зоны паказаны на графіцы зялёнай паласой. Сістэма змяшчае імавернасную зону на два працэнты вышэй або ніжэй за норму.
  • Рэдкія дадзеныя. Дадзеныя аб рэдкіх зонах паказаны на графіцы ў выглядзе светла-зялёнай паласы. Сістэма змяшчае зону з рэдкімі значэннямі метрыкі на тры працэнты вышэй або ніжэй за норму і сігналізуе аб паводзінах паказчыка за межамі нармальнага дыяпазону пры гэтым сістэма генеруе так званы Anomaly Alert.

Анамалія - ​​гэта вымярэнне або падзея, несумяшчальнае з нармальнымі паказчыкамі метрыкі. Выяўленне анамалій для выяўлення праблем і разумення тэндэнцый у інфраструктуры і прыкладаннях - ключавая асаблівасць DX OI. Выяўленне анамалій дазваляе як распазнаваць незвычайныя паводзіны (напрыклад, сервер, які адказвае павольней, чым звычайна, або незвычайную сеткавую актыўнасць, выкліканую ўзломам), так і якая адпавядае выявай рэагаваць (установа інцыдэнту, запуск аўтаматычнага сцэнара Remediation).

Функцыя выяўлення анамалій DX OI падае наступныя перавагі:

  • Не трэба ўсталёўваць парогавыя значэнні. DX OI самастойна супаставіць дадзеныя і выявіць анамаліі.
  • DX OI уключае больш за дзесяць алгарытмаў штучнага інтэлекту і машыннага навучання, у тым ліку EWMA (Exponentially-Weighted-Moving-Average) і KDE (Kernel Density Estimation). Гэтыя алгарытмы дазваляюць выконваць хуткі аналіз першапрычын і прагназаваць будучыя значэнні метрык.

Прадыктыўная аналітыка і апавяшчэнне аб магчымых адмовах

Predictive Insights - функцыя, якая выкарыстоўвае магчымасці машыннага навучання для выяўлення заканамернасцяў і тэндэнцый. На аснове гэтых тэндэнцый сістэма прагназуе падзеі, якія могуць адбыцца ў будучыні. Дадзеныя паведамленні паказваюць на неабходнасць прыняцця дзеянняў да таго, калі значэнні метрык выйдуць за межы нармальных значэнняў, што паўплывае на крытычна важныя бізнэс сэрвісы. Predictive Insights намаляваны на малюнку ніжэй.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

А гэта візуалізацыя прэдыктыўных папярэджанняў для канкрэтнай метрыкі.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Прагназаванне загрузкі вылічальных магутнасцей з функцыяй задання сцэнарыяў нагрузкі

Функцыя планавання магутнасцяў Capacity Analytics дапамагае кіраваць ІТ-рэсурсамі, забяспечваючы правільны памер рэсурсаў для задавальнення бягучых і будучых запатрабаванняў бізнэсу. Вы зможаце аптымізаваць прадукцыйнасць і эфектыўнасць наяўных рэсурсаў, спланаваць і апраўдаць любыя фінансавыя ўкладанні.

Функцыя Capacity Analytics у DX OI дае наступныя перавагі:

  • Прагназаванне магутнасцей у пікавыя сезоны;
  • Вызначэнне моманту, калі спатрэбяцца дадатковыя рэсурсы для забеспячэння якаснага функцыянавання сервісу;
  • Закупка дадатковых рэсурсаў толькі пры неабходнасці;
  • Эфектыўнае кіраванне інфраструктурай і сеткамі;
  • Устараненне залішніх выдаткаў на электраэнергію за кошт выяўлення недавыкарыстоўваных рэсурсаў;
  • Выкананне ацэнкі нагрузкі на рэсурсы ў выпадку запланаванага павелічэння патрэбнасцей у сэрвісе або рэсурсе.

На старонцы Capacity Analytics DX OI (малюнак ніжэй) ёсць наступныя фішкі:

  • Стан ёмістасці рэсурсу (Resource Capacity Status);
  • Кантраляваныя групы/службы (Monitored Groups/Services);
  • Буйныя спажыўцы рэсурсаў (Top Capacity Consumers).

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Асноўная старонка Capacity Analytics паказвае кампаненты рэсурсаў, якія залішне загружаныя і ў якіх сканчаецца ёмістасць. Гэтая старонка дапамагае адміністратарам платформы знаходзіць празмерна выкарыстоўваныя рэсурсы і дапамагае ім змяняць памер і аптымізаваць рэсурсы. Стан рэсурсаў можна прааналізаваць на аснове каляровых кодаў і іх адпаведных значэнняў. Рэсурсы класіфікуюцца ў залежнасці ад ступені іх перагружанасці на старонцы стану ёмістасці рэсурсаў. Можна пстрыкнуць на кожны з кветак, каб прагледзець спіс кампанентаў, якія ўваходзяць у абраную катэгорыю. Далей адлюструецца цеплавая карта з усімі аб'ектамі і прагнозамі на 12 месяцаў, што дазваляе выявіць рэсурсы, якія вось-вось будуць вычарпаны.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Для кожнай з метрык у Capacity Analytics можна паказаць фільтры, якія DX Operational Intelligence выкарыстоўвае для складання прагнозаў (малюнак ніжэй).

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Даступныя наступныя фільтры:

  • Метрычны. Метрыка, якая будзе выкарыстоўвацца для прагноза.
  • Base on. Выбар аб'ёму гістарычных дадзеных, якія будуць скарыстаны для пабудовы прагнозаў на будучыню. Гэтае поле выкарыстоўваецца для параўнання і аналізу тэндэнцый за апошні месяц, тэндэнцый за апошнія 3 месяцы, тэндэнцый за год і г. д.
  • Рост. Чаканая хуткасць росту працоўнай нагрузкі, якую жадаеце выкарыстаць для мадэлявання прагнозу магутнасці. Гэтыя дадзеныя можна выкарыстоўваць для прагназавання росту звыш прагнозаў. Напрыклад, чакаецца, што выкарыстанне рэсурсу вырасце яшчэ на 40 працэнтаў з-за адкрыцця новага офіса.

Аналіз логаў

Функцыя аналізу логаў DX OI забяспечвае:

  • збор, агрэгацыю логаў з розных крыніц (у тым ліку атрыманых агенцкім і безагенцкім спосабамі);
  • парсінг і нармалізацыю дадзеных;
  • аналіз на адпаведнасць пастаўленым умовам і генерацыю падзей;
  • карэляцыю падзей на аснове логаў, у тым ліку з падзеямі, атрыманымі ў выніку маніторынгу ІТ-інфраструктуры;
  • візуалізацыю дадзеных на аснове аналізу ў DX Dashboards;
  • высновы аб даступнасці сэрвісаў на аснове аналізу даных з логаў.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Збор логаў безагентным метадам выконваецца сістэмай для Windows Event logs і Syslog. Агентным спосабам збіраюцца тэкставыя логі.

Функцыя аўтаматызаванага дазволу аварыйных сітуацый (Remediation)

Аўтаматызаваныя дзеянні па выпраўленні аварыйнай сітуацыі (Remediation Workflow) дазваляюць вырашыць праблемы, якія выклікалі генерацыю падзеі ў DX OI. Напрыклад, праблема загрузкі ЦП генеруе аварыйнае паведамленне, працэс выпраўлення (Remediation Workflow) вырашае праблему шляхам перазапуску сервера, на якім узнікла праблема. Інтэграцыя паміж DX OI і сістэмай аўтаматызацыі дазваляе запускаць працэсы выпраўлення з кансолі падзей у DX Operational Intelligence і адсочваць іх у кансолі сістэмы аўтаматызацыі.

Пасля інтэграцыі з сістэмай аўтаматызацыі можна запускаць аўтаматычныя дзеянні па выпраўленні любой аварыйнай сітуацыі ў кансолі DX OI з кантэксту аварыйнага паведамлення. Вы можаце прагледзець рэкамендаваныя дзеянні разам з інфармацыяй аб працэнтах дакладнасці (верагоднасці ліквідацыі сітуацыі шляхам выканання дзеяння).

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Першапачаткова, калі адсутнічае статыстыка па выніках выканання Remediation Workflow, механізм рэкамендацый прапануе патэнцыйныя варыянты на аснове пошуку, па ключавых словах, затым выкарыстоўваюцца вынікі машыннага навучання, і механізм пачынае рэкамендаваць методыку выпраўлення на аснове эўрыстыкі. Як толькі вы пачнеце ацэньваць вынікі атрыманых падказак дакладнасць рэкамендацый палепшыцца.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Прыклад зваротнай сувязі ад карыстача: карыстач выбірае ўпадабанае ці не ўпадабанае прапанаванае дзеянне, а сістэма ўлічвае гэты выбар пры наступных рэкамендацыях. Лайк/дызлайк:

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Рэкамендуемыя карэкціруючыя дзеянні для канкрэтнай трывогі заснаваны на камбінацыі зваротнай сувязі, якая вызначае, ці з'яўляецца дзеянне прымальным. DX OI пастаўляецца з гатовай інтэграцыяй з сістэмай аўтаматызацыі Automic Automation.

Інтэграцыя DX OI са іншымі сістэмамі

Спыняцца падрабязна на інтэграцыі дадзеных з натыўных прадуктаў маніторынгу Broadcom (DX NetOps, DX Infrastructure Management, DX Application Performance Management) мы не будзем. Замест гэтага разгледзім як інтэгруюцца дадзеныя з іншых 3rd-party сістэм і разбяром прыклад інтэграцыі з адной з найболей папулярных сістэм – Zabbix.

Для інтэграцыі са іншымі сістэмамі выкарыстоўваецца кампанент DX Gateway. DX Gateway складаецца з 3 кампанентаў – On-Prem Gateway, RESTmon і Log Collector (Logstash). Вы можаце ўсталяваць усе 3 кампанента ці толькі той, які патрэбен, змяніўшы агульны файл канфігурацыі пры ўсталёўцы DX Gateway. На малюнку ніжэй архітэктура DX Gateway.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Разгледзім прызначэнне кампанентаў DX Gateway асобна.

On-Prem Gateway. Гэта інтэрфейс, які збірае аварыйныя сігналы ад платформы DX і адпраўляе падзеі аб аварыях у іншыя сістэмы. On-Prem Gateway дзейнічае як полер, які перыядычна збірае дадзеныя аб падзеях з DX OI, выкарыстоўваючы API запытаў па пратаколе HTTPS, затым адпраўляе папярэджанні на іншы сервер, які інтэграваны з платформай DX, выкарыстоўваючы вебхуки.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

DX Log Collector прымае syslog ад сеткавых прылад або сервераў і загружае іх у OI. DX Log Collector дазваляе падзяліць праграмнае забеспячэнне, якое генеруе паведамленні, сістэму, якая іх захоўвае, і праграмнае забеспячэнне, якое паведамляе і аналізуе іх. Кожнае паведамленне пазначаецца кодам аб'екта, які паказвае тып праграмнага забеспячэння, якое генеруе паведамленне, і яму прызначаецца ўзровень крытычнасці. У DX Dashboards гэта ўсё потым можна паглядзець.

DX RESTmon інтэгруецца са іншымі прадуктамі/паслугамі праз REST API і перадае дадзеныя ў OI. На малюнку ніжэй прадстаўлена схема функцыянавання DX RESTmon на прыкладзе інтэграцыі з сістэмамі маніторынгу Solarwinds і SCOM.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Ключавыя функцыі DX RESTmon:

  • Падлучэнне да любой іншай крыніцы дадзеных для прыёму дадзеных:
    • PULL: падлучэнне і выманне дадзеных з агульнадаступных REST API;
    • PUSH: паток дадзеных у RESTmon праз REST.
  • Падтрымка фарматаў JSON і XML;
  • Прыём метрык, папярэджанняў, груп, тапалогіі, інвентарызацыі і часопісаў;
  • Гатовыя канектары для розных інструментаў/тэхналогій, таксама магчыма распрацаваць канектар да любой крыніцы з адкрытым API (спіс скрыначных канектараў на малюнку ніжэй);
  • Падтрымка базавай аўтэнтыфікацыі (па змаўчанні) пры доступе да інтэрфейсу Swagger і API;
  • Падтрымка HTTPS (па змаўчанні) для ўсіх уваходных і выходных паведамленняў;
  • Падтрымка ўваходзяць і выходных проксі;
  • Магутныя магчымасці сінтаксічнага аналізу тэксту для часопісаў, атрыманых праз REST;
  • Наладжвальны сінтаксічны аналіз з дапамогай RESTmon, які забяспечвае эфектыўны аналіз і візуалізацыю часопісаў;
  • Падтрымка вымання інфармацыі аб групах прылад з прыкладанняў маніторынгу і загрузкі ў OI для аналізу і візуалізацыі;
  • Падтрымка магчымасці супастаўлення з рэгулярнымі выразамі. Гэта можа выкарыстоўвацца для сінтаксічнага аналізу і супастаўленні паведамленняў логаў, атрыманых праз REST, а таксама для генерацыі ці зачыненні падзей на аснове вызначаных умоў рэгулярнага выраза.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Цяпер разгледзім працэс налады інтэграцыі DX OI з Zabbix праз DX RESTmon. Скрынкавая інтэграцыя забірае з Zabbix наступныя дадзеныя:

  • інвентарныя дадзеныя;
  • тапалогія;
  • праблемы;
  • метрыкі.

Паколькі канектар для Zabbix даступны са скрынкі, усё, што трэба зрабіць для налады інтэграцыі - гэта абнавіць прафайл, паказаўшы IP адрас API сервера Zabbix і ўліковы запіс, а затым загрузіць прафайл праз web-інтэрфейс Swagger. Прыклад на двух наступных малюнках.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Пасля налады інтэграцыі, для абітурыентаў з Zabbix дадзеных будуць даступныя аналітычныя функцыі DX OI, апісаныя вышэй, а менавіта: Alarm Analytics, Performance Analytics, Predictive Insights, Service Analytics і Remediation. На малюнку ніжэй прыведзены прыклад аналізу метрык прадукцыйнасці па аб'ектах, інтэграваным з Zabbix.

Парасонавая сістэма маніторынгу і рэсурсна-сэрвісныя мадэлі ў абноўленым DX Operations Intelligence ад Broadcom (ex. CA)

Заключэнне

DX OI - сучасная прылада аналітыкі, які забяспечыць значную аперацыйную эфектыўнасць IT-падраздзяленняў, дазволіць прымаць больш хуткія і правільныя рашэнні для павышэння якасці ІТ-паслуг і бізнес-сэрвісаў за кошт міждаменнага кантэкстнага аналізу. Для ўладальнікаў прыкладанняў і бізнес-падраздзяленняў DX OI разлічыць паказчык даступнасці і якасць сэрвісаў не толькі ў кантэксце тэхналагічных IT-паказчыкаў, але і бізнес-KPI, якія здабываюцца з транзакцыйнай статыстыкі па канчатковым карыстальнікам.

Калі вы хочаце даведацца больш аб гэтым рашэнні, пакіньце заяўку на дэманстрацыю або пілотны праект зручным для вас спосабам на нашым сайце.

Крыніца: habr.com

Дадаць каментар