Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Em setembro, a Broadcom (anteriormente CA) lançou a nova versão 20.2 de sua solução DX Operations Intelligence (DX OI). No mercado, este produto está posicionado como um sistema de monitoramento guarda-chuva. O sistema é capaz de receber e combinar dados de sistemas de monitoramento de vários domínios (rede, infraestrutura, aplicativos, bancos de dados) da CA e de fabricantes terceirizados, incluindo soluções de código aberto (Zabbix, Prometheus e outros).

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

A principal função do DX OI é a criação de um modelo de serviço de recursos (RSM) completo com base em itens de configuração (CUs) que preenchem o banco de dados de inventário quando integrados a sistemas de terceiros. A DX OI implementa funções de Machine Learning e Inteligência Artificial (ML e AI) sobre os dados que entram na plataforma, o que permite avaliar/prever a probabilidade de falha de um determinado IC e o grau de impacto de uma falha num serviço de negócio com base em um CI específico. Além disso, o DX OI é um ponto único de coleta dos eventos de monitoramento e, consequentemente, integração com o sistema Service Desk, sendo uma vantagem indiscutível da utilização do sistema em centrais de monitoramento unificadas por plantões das organizações. Neste artigo, falaremos mais sobre a funcionalidade do sistema e mostraremos as interfaces de usuário e administrador.

Arquitetura da solução DX OI

A plataforma DX possui uma arquitetura de microsserviços, instalada e rodando Kubernetes ou OpenShift. A figura a seguir mostra os componentes da solução que podem ser usados ​​como ferramentas de monitoramento independentes ou podem ser substituídos por sistemas de monitoramento existentes com funções semelhantes (existem exemplos de tais sistemas na figura) e depois conectados ao guarda-chuva DX OI. No diagrama abaixo:

  • Monitorização de aplicações móveis em DX App Experience Analytics;
  • Monitoramento de performance de aplicações em DX APM;
  • Monitoramento de infraestrutura no DX Infrastructure Manager;
  • Monitoramento de dispositivos de rede no DX NetOps Manager.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Os componentes DX são executados em um cluster Kubernetes e dimensionados simplesmente lançando novos PODs. Abaixo está um diagrama de solução de nível superior.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

A administração, dimensionamento e atualização da plataforma DX é feita no console administrativo. A partir de um único console, você pode gerenciar uma arquitetura multilocatária que pode abranger várias empresas ou várias unidades de negócios dentro de uma empresa. Nesse modelo, cada instalação pode ser configurada individualmente como inquilino com seu próprio conjunto de configurações.

O Administration Console é uma ferramenta de gerenciamento de sistemas e operações baseada na Web que fornece aos administradores uma interface consistente e unificada para executar tarefas de gerenciamento de cluster de monitoramento.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Novos locatários para unidades de negócios ou empresas dentro da empresa são implantados em minutos. Esta é uma vantagem se você deseja ter um sistema de monitoramento unificado, mas ao mesmo tempo, ao nível da plataforma (e não direitos de acesso), delimitar objetos de monitoramento entre departamentos.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Modelos de serviços de recursos e monitoramento de serviços de negócios

O DX OI possui mecanismos embutidos para criar serviços e desenvolver PCM clássico com a tarefa da lógica de influência e pesos entre os componentes do serviço. Também existem mecanismos para exportar PCM de um CMDB externo. A figura abaixo mostra o editor PCM integrado (preste atenção aos pesos dos links).

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

O DX OI fornece uma visão holística dos principais indicadores de desempenho para negócios ou serviços de TI em um nível granular, incluindo disponibilidade de serviço e previsão de risco de falha. A ferramenta também pode fornecer informações sobre o impacto de um problema de desempenho ou uma alteração na estrutura dos componentes de TI (aplicativo ou infraestrutura) em um serviço de negócios. A figura abaixo é um painel interativo que exibe o status de todos os serviços.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Vamos dar uma olhada mais de perto no serviço de banco digital como exemplo. Ao clicar no nome do serviço, passamos ao serviço PCM detalhado. Vemos que o status do serviço de Banco Digital depende do estado da infraestrutura e dos subserviços transacionais com pesos diferentes. Trabalhar com pesos e exibi-los é uma vantagem interessante do DX OI.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

A topologia é um importante elemento de monitoramento operacional do empreendimento, permitindo que operadores e engenheiros analisem a relação entre os componentes, encontrem a causa raiz e a influência.

DX OI Topology Viewer é um serviço que usa dados topológicos de sistemas de monitoramento de domínio que coletam dados diretamente de objetos de monitoramento. A ferramenta foi projetada para pesquisar várias camadas de armazenamento de topologia e exibir um mapa de relacionamento específico do contexto. Para investigar problemas, você pode acessar o subserviço problemático Backend Banking e ver a topologia e os componentes problemáticos. Mensagens de alarme e métricas de desempenho também podem ser analisadas para cada componente.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Ao analisar os componentes transacionais de Pagamentos (transações do usuário), podemos rastrear os valores dos KPIs de negócios, que também são levados em consideração ao calcular o status de disponibilidade e integridade do serviço. Um exemplo de um KPI de negócios é mostrado abaixo:

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Análise de eventos (Análise de alarmes)

Redução de ruído algorítmica por meio de agrupamento de falhas

Um dos principais recursos do DX OI no tratamento de eventos é o clustering. O mecanismo funciona em todos os alertas que entram no sistema para identificar padrões com base em diferentes contextos e combiná-los em grupos. Esses clusters são de autoaprendizagem e não precisam ser configurados manualmente.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Assim, o agrupamento permite que os usuários combinem e agrupem um grande número de eventos e analisem apenas aqueles que possuem um contexto comum. Por exemplo, um conjunto de eventos que representam um incidente que afeta aplicativos ou um datacenter. As situações são criadas usando algoritmos de agrupamento baseados em aprendizado de máquina que usam correlação temporal, relacionamento topológico e processamento de linguagem nativa para análise. As figuras abaixo apresentam exemplos de visualização de grupos agrupados de mensagens, os chamados Alarmes de Situações e Linha do Tempo de Evidências, que exibem os principais parâmetros de agrupamento e processo de redução do número de eventos de ruído.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Análise do problema raiz e correlação de falhas

No ambiente híbrido de hoje, uma transação do usuário pode afetar vários sistemas que são usados ​​dinamicamente. Como resultado, vários alertas podem ser gerados a partir de sistemas diferentes, mas relacionados ao mesmo problema ou incidente. O DX OI usa mecanismos proprietários para suprimir alertas redundantes e duplicados e correlacionar alertas relacionados para detecção aprimorada de problemas críticos e resolução mais rápida.

Consideremos um exemplo quando o sistema recebe inúmeras mensagens de emergência para diferentes objetos (KE) subjacentes a um serviço. Em caso de impacto na disponibilidade e operabilidade do serviço, o sistema irá gerar um alarme de serviço (Service Alarm), indicar e designar a provável causa raiz (problema CI e mensagem de alarme no IC) que contribuiu para a queda de desempenho ou falha do serviço. A figura abaixo mostra a visualização de falha para um serviço Webex.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

O DX OI permite trabalhar com eventos através de ações intuitivas na interface web do sistema. Os usuários podem atribuir eventos manualmente ao funcionário responsável para solução de problemas, redefinir/reconhecer alertas, criar tíquetes ou enviar notificações por e-mail, executar scripts automatizados para resolver uma emergência (Fluxo de Trabalho de Remediação, mais sobre isso posteriormente). Dessa forma, o DX OI permite que os operadores de turno se concentrem na mensagem de alarme raiz e também ajude a simplificar o processo de classificação de mensagens em matrizes agrupadas.

Algoritmos de máquina para processar métricas e analisar dados de desempenho

O aprendizado de máquina permite rastrear, agregar e visualizar os principais indicadores de desempenho para qualquer período de tempo, o que oferece ao usuário os seguintes benefícios:

  • Detecção de gargalos e anomalias de performance;
  • Comparação de vários indicadores para os mesmos dispositivos, interfaces ou redes;
  • Comparação dos mesmos indicadores em vários objetos;
  • Comparação de vários indicadores para um e vários objetos;
  • Comparação de métricas multidimensionais para vários objetos.

Para analisar as métricas que entram no sistema, o DX OI usa as funções de análise de máquina usando algoritmos matemáticos, o que ajuda a reduzir o tempo ao definir limites estáticos e gerar avisos quando ocorrem anomalias.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

O resultado da aplicação de algoritmos matemáticos é a construção das chamadas distribuições de probabilidade do valor métrico (Raro, Provável, Central, Médio, Real). As figuras acima e abaixo mostram as distribuições de probabilidade.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Os dois gráficos acima mostram os seguintes dados:

  • Dados reais (Reais). Os dados reais são plotados como uma linha preta sólida (sem alarmes) ou uma linha sólida colorida (condição de alarme). A linha é calculada com base nos dados reais da métrica. Ao comparar os dados reais e a mediana, você pode ver rapidamente a variação na métrica. Quando ocorre um evento, a linha preta muda para uma linha sólida colorida que corresponde à gravidade do evento e exibe ícones com a gravidade correspondente acima do gráfico. Por exemplo, vermelho para uma anomalia crítica, laranja para uma anomalia grave e amarelo para uma anomalia menor.
  • Valor médio do indicador (Mean value). A mediana ou média de uma medida é mostrada como uma linha cinza no gráfico. O valor médio é exibido quando não há dados históricos suficientes.
  • O valor mediano do indicador (valor central). A linha mediana é o meio do intervalo e é mostrada como uma linha pontilhada verde. As zonas mais próximas a esta linha estão mais próximas dos valores típicos do indicador.
  • Dados Comuns (Valor Comum). Os dados da Zona Total rastreiam o mais próximo da linha central ou normal para sua métrica e são exibidos como uma barra verde escura. Os cálculos analíticos colocam a zona total um percentil acima ou abaixo do normal.
  • dados probabilísticos. Os dados da zona de probabilidade são mostrados no gráfico com uma barra verde. O sistema coloca a zona de probabilidade dois percentis acima ou abaixo do normal.
  • Dados raros. Os dados da zona rara são mostrados no gráfico como uma barra verde clara. O sistema coloca uma zona com valores de métricas raras três percentis acima ou abaixo da norma e sinaliza o comportamento do indicador fora da faixa normal, enquanto o sistema gera o chamado Alerta de Anomalia.

Uma anomalia é uma medida ou evento inconsistente com o desempenho normal de uma métrica. A detecção de anomalias para identificar problemas e entender tendências em infraestrutura e aplicativos é um recurso fundamental do DX OI. A detecção de anomalias permite que você reconheça um comportamento incomum (por exemplo, um servidor que responde mais lentamente do que o normal ou uma atividade de rede incomum causada por um hack) e responda de acordo (iniciando um incidente, executando um script de correção automática).

O recurso de detecção de anomalia DX OI oferece os seguintes benefícios:

  • Você não precisa definir limites. O DX OI irá comparar os dados de forma independente e identificar anomalias.
  • O DX OI inclui mais de dez algoritmos de inteligência artificial e aprendizado de máquina, incluindo EWMA (Exponentially-Weighted-Moving-Average) e KDE (Kernel Density Estimation). Esses algoritmos permitem que você execute análises rápidas de causa raiz e preveja métricas futuras.

Análise preditiva e alertas de falha

O Predictive Insights é um recurso que usa o poder do aprendizado de máquina para identificar padrões e tendências. Com base nessas tendências, o sistema prevê eventos que podem ocorrer no futuro. Essas mensagens indicam que ações devem ser tomadas antes que os valores da métrica ultrapassem a faixa normal, impactando serviços críticos de negócios. Os insights preditivos são mostrados na figura abaixo.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

E esta é uma visualização de alertas preditivos para uma métrica específica.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Prevendo a carga de poder de computação com a função de definir cenários de carga

O recurso de planejamento de capacidade do Capacity Analytics ajuda a gerenciar recursos de TI garantindo que os recursos sejam dimensionados adequadamente para atender às necessidades de negócios atuais e futuras. Poderá otimizar o desempenho e a eficiência dos recursos existentes, planear e justificar qualquer investimento financeiro.

O recurso Capacity Analytics no DX OI fornece os seguintes benefícios:

  • Capacidades de previsão durante as épocas de pico;
  • Determinação do momento em que são necessários recursos adicionais para garantir a qualidade do serviço;
  • Comprar recursos adicionais somente quando necessário;
  • Gerenciamento eficiente de infraestrutura e rede;
  • Elimine custos desnecessários de energia identificando recursos subutilizados;
  • Execute a estimativa de carga de recursos no caso de um aumento planejado na demanda por um serviço ou recurso.

A página Capacity Analytics DX OI (mostrada abaixo) tem os seguintes widgets:

  • Status de Capacidade de Recursos;
  • Grupos/Serviços Controlados (Grupos/Serviços Monitorados);
  • Grandes consumidores de recursos (Top Capacity Consumers).

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

A página principal do Capacity Analytics mostra componentes de recursos que estão sendo usados ​​em excesso e ficando sem capacidade. Esta página ajuda os administradores da plataforma a encontrar recursos usados ​​em excesso e os ajuda a redimensionar e otimizar recursos. O estado dos recursos pode ser analisado com base nos códigos de cores e seus respectivos valores. Os recursos são categorizados de acordo com seu grau de congestionamento na página de status de capacidade do recurso. Você pode clicar em cada uma das cores para ver uma lista dos componentes na categoria selecionada. Em seguida, é exibido um mapa de calor com todos os objetos e previsões para 12 meses, o que permite identificar os recursos que estão prestes a se esgotar.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Para cada uma das métricas no Capacity Analytics, você pode especificar os filtros que o DX Operational Intelligence usa para fazer previsões (figura abaixo).

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Os seguintes filtros estão disponíveis:

  • Métrica. A métrica a ser usada para a previsão.
  • Base em. Seleção da quantidade de dados históricos que serão usados ​​para construir previsões para o futuro. Este campo é usado para comparar e analisar tendências do último mês, tendências dos últimos 3 meses, tendências anuais, etc.
  • Crescimento. A taxa de crescimento esperada da carga de trabalho que você deseja usar para modelar a previsão de capacidade. Esses dados podem ser usados ​​para prever o crescimento além das previsões. Por exemplo, espera-se que o uso de recursos aumente outros 40% devido à abertura de um novo escritório.

Análise de log

O recurso de análise de log do DX OI fornece:

  • coleta, agregação de logs de diferentes fontes (incluindo aqueles obtidos por métodos de agência e sem agente);
  • análise e normalização de dados;
  • análise para cumprimento das condições definidas e geração de eventos;
  • correlação de eventos com base em logs, incluindo eventos recebidos como resultado do monitoramento da infraestrutura de TI;
  • visualização de dados com base na análise em DX Dashboards;
  • conclusões sobre a disponibilidade de serviços com base na análise dos dados dos logs.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

A coleta de logs usando um método sem agente é executada pelo sistema para logs de eventos do Windows e Syslog. Maneira baseada em agente para coletar logs de texto.

Função Automatizada de Resolução de Emergência (Remediação)

As ações automatizadas para corrigir a emergência (Remediation Workflow) permitem resolver problemas que causaram a geração de um evento no DX OI. Por exemplo, se um problema de uso da CPU gerar um alarme, o Fluxo de Trabalho de Remediação resolve o problema reiniciando o servidor que apresenta o problema. A integração entre o DX OI e o sistema de automação permite que os processos de remediação sejam acionados a partir do console de eventos no DX Operational Intelligence e rastreados no console do sistema de automação.

Após a integração com um sistema de automação, você pode acionar ações automáticas para corrigir qualquer emergência no console DX OI a partir do contexto de um alarme. Você pode visualizar ações recomendadas junto com informações sobre porcentagens de confiança (a probabilidade de que a situação seja resolvida ao executar a ação).

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Inicialmente, quando não há estatísticas sobre os resultados do fluxo de trabalho de correção, o mecanismo de recomendação sugere candidatos com base em pesquisas de palavras-chave, os resultados do aprendizado de máquina são usados ​​e o mecanismo começa a recomendar uma técnica de correção baseada em heurística. Assim que você começar a avaliar os resultados das dicas recebidas, a precisão das recomendações melhorará.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Um exemplo de feedback do usuário: o usuário escolhe se gosta ou não da ação proposta, e o sistema leva essa escolha em consideração ao fazer recomendações adicionais. Gosto/não gosto:

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

As ações corretivas recomendadas para um determinado alarme são baseadas em uma combinação de feedback que determina se a ação é aceitável. O DX OI vem com integração pronta para uso com Automic Automation.

Integração do DX OI com sistemas de terceiros

Não vamos nos deter na integração de dados de produtos de monitoramento Broadcom nativos (DX NetOps, DX Infrastructure Management, DX Application Performance Management). Em vez disso, vamos ver como os dados de sistemas de terceiros são integrados e considerar um exemplo de integração com um dos sistemas mais populares - Zabbix.

Para integração com sistemas de terceiros, é utilizado o componente DX Gateway. O DX Gateway consiste em 3 componentes - On-Prem Gateway, RESTmon e Log Collector (Logstash). Você pode instalar todos os 3 componentes ou apenas aquele que você precisa alterando o arquivo de configuração geral ao instalar o DX Gateway. A figura abaixo mostra a arquitetura do DX Gateway.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Vamos considerar a finalidade dos componentes do DX Gateway separadamente.

Gateway local. Esta é uma interface que coleta alarmes da plataforma DX e envia eventos de alarme para sistemas de terceiros. O On-Prem Gateway atua como um poller que coleta periodicamente dados de eventos do DX OI usando a API de solicitação HTTPS e, em seguida, envia alertas para um servidor de terceiros integrado à plataforma DX usando webhooks.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

DX Log CollectorName recebe syslog de dispositivos de rede ou servidores e os carrega para a OI. O DX Log Collector permite separar o software que gera as mensagens, o sistema que as armazena e o software que as reporta e analisa. Cada mensagem é marcada com um código objeto que indica o tipo de software que gera a mensagem e um nível de gravidade é atribuído a ele. Em DX Dashboards, tudo isso pode ser visualizado.

DX RESTmon integra-se com produtos/serviços de terceiros via API REST e repassa os dados para a OI. A figura abaixo mostra o funcionamento do DX RESTmon usando o exemplo de integração com os sistemas de monitoramento Solarwinds e SCOM.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Principais recursos do DX RESTmon:

  • Conecte-se a qualquer fonte de dados de terceiros para receber dados:
    • PULL: conectando e recuperando dados de APIs REST públicas;
    • PUSH: fluxo de dados para RESTmon via REST.
  • Suporte para formatos JSON e XML;
  • Receba métricas, alertas, grupos, topologia, inventário e logs;
  • Conectores prontos para diversas ferramentas/tecnologias, também é possível desenvolver um conector para qualquer fonte com uma API aberta (lista de conectores in a box na figura abaixo);
  • Suporte para autenticação básica (padrão) ao acessar a interface Swagger e API;
  • Suporte HTTPS (padrão) para todas as mensagens recebidas e enviadas;
  • Suporte para proxies de entrada e saída;
  • Poderosos recursos de análise de texto para logs recebidos via REST;
  • Análise personalizável com RESTmon para análise eficiente e visualização de logs;
  • Suporte para extração de informações sobre grupos de dispositivos de aplicativos de monitoramento e download para OI para análise e visualização;
  • Suporte para correspondência de expressão regular. Isso pode ser usado para analisar e corresponder mensagens de log recebidas via REST e para gerar ou fechar eventos com base em determinadas condições de expressão regular.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Agora vamos ver o processo de configuração da integração do DX OI com o Zabbix via DX RESTmon. A integração em caixa leva os seguintes dados do Zabbix:

  • dados de inventário;
  • topologia;
  • Problemas;
  • Métricas.

Como o conector para Zabbix está disponível pronto para uso, tudo o que precisa ser feito para configurar a integração é atualizar o perfil com o endereço IP e a conta da API do servidor Zabbix e, em seguida, carregar o perfil por meio da interface da Web do Swagger . Um exemplo está nas próximas duas figuras.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Após configurar a integração, as funções analíticas do DX OI descritas acima estarão disponíveis para os dados provenientes do Zabbix, a saber: Alarm Analytics, Performance Analytics, Predictive Insights, Service Analytics e Remediation. A figura abaixo mostra um exemplo de análise de métricas de desempenho para objetos integrados do Zabbix.

Sistema de monitoramento guarda-chuva e modelos de serviço de recursos no DX Operations Intelligence atualizado da Broadcom (ex. CA)

Conclusão

O DX OI é uma ferramenta de análise de última geração que fornecerá eficiência operacional significativa aos departamentos de TI, permitindo que você tome decisões mais rápidas e corretas para melhorar a qualidade dos serviços de TI e serviços de negócios por meio da análise contextual entre domínios. Para proprietários de aplicativos e unidades de negócios, a DX OI calculará a disponibilidade e a qualidade dos serviços não apenas no contexto de indicadores tecnológicos de TI, mas também KPIs de negócios derivados de estatísticas transacionais para usuários finais.

Se você gostaria de saber mais sobre esta solução, inscreva-se para uma demonstração ou piloto de uma maneira conveniente para você no nosso site.

Fonte: habr.com

Adicionar um comentário