Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

We wrześniu tego roku firma Broadcom (dawniej CA) wypuściła nową wersję 20.2 swojego rozwiązania DX Operations Intelligence (DX OI). Produkt ten pozycjonowany jest na rynku jako parasolowy system monitoringu. System jest w stanie odbierać i łączyć dane z systemów monitorowania różnych domen (sieci, infrastruktury, aplikacji, baz danych) zarówno producentów CA, jak i zewnętrznych, w tym rozwiązań open source (Zabbix, Prometheus i inne).

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Główną funkcją DX OI jest tworzenie pełnoprawnego modelu zasobów i usług (RSM) w oparciu o jednostki konfiguracyjne (CU), które po integracji z systemami innych firm wypełniają bazę inwentaryzacyjną. DX OI wdraża na danych wchodzących do platformy funkcje Machine Learning i Sztucznej Inteligencji (ML i AI), co pozwala ocenić/przewidzieć prawdopodobieństwo awarii konkretnego KE oraz stopień wpływu awarii na usługę biznesową, co opiera się na konkretnym KE. Dodatkowo DX OI stanowi pojedynczy punkt gromadzenia zdarzeń monitorujących i co za tym idzie integrację z systemem Service Desk, co jest niezaprzeczalną zaletą wykorzystania systemu w jednolitych centrach monitorowania przy zmianach służbowych organizacji. W tym artykule opowiemy więcej o funkcjonalności systemu oraz pokażemy interfejsy użytkownika i administratora.

Architektura rozwiązań DX OI

Platforma DX posiada architekturę mikroserwisową, instalowaną i uruchamianą pod Kubernetesem lub OpenShift. Poniższy rysunek przedstawia elementy rozwiązania, które można wykorzystać jako samodzielne narzędzia monitorujące lub można je zastąpić istniejącymi systemami monitoringu o podobnych funkcjach (na rysunku przykłady takich systemów), a następnie podłączyć do parasola DX OI. Na poniższym schemacie:

  • Monitorowanie aplikacji mobilnych w DX App Experience Analytics;
  • Monitorowanie wydajności aplikacji w DX APM;
  • Monitorowanie infrastruktury w DX Infrastructure Manager;
  • Monitorowanie urządzeń sieciowych w DX NetOps Manager.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Komponenty DX działają pod kontrolą klastra Kubernetes i skalują się, po prostu uruchamiając nowe POD. Poniżej znajduje się schemat rozwiązania wysokiego poziomu.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Administrowanie, skalowanie i aktualizacja platformy DX odbywa się w konsoli administracyjnej. Z jednej konsoli można zarządzać architekturą z wieloma dzierżawcami, która może obejmować wiele przedsiębiorstw lub wiele jednostek biznesowych w firmie. W tym modelu każde przedsiębiorstwo można skonfigurować indywidualnie jako najemcę z własnym zestawem konfiguracji.

Konsola administracyjna to internetowe narzędzie do zarządzania operacjami i systemem, które zapewnia administratorom spójny, ujednolicony interfejs do wykonywania zadań monitorowania i zarządzania klastrem.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Wdrażanie nowych najemców dla jednostek biznesowych lub przedsiębiorstw w firmie trwa kilka minut. Daje to przewagę, jeśli chcesz mieć ujednolicony system monitorowania, ale na poziomie platformy (a nie praw dostępu), aby różnicować obiekty monitorowania pomiędzy działami.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Modele zasobów i usług oraz monitorowanie usług biznesowych

DX OI posiada wbudowane mechanizmy tworzenia usług i rozwijania klasycznych PCM z ustaleniem logiki wpływów i wag pomiędzy komponentami usługi. Istnieją również mechanizmy eksportu PCM z zewnętrznego CMDB. Poniższy rysunek przedstawia wbudowany edytor PCM (zwróć uwagę na wagę łączy).

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

DX OI zapewnia całościowy obraz kluczowych wskaźników wydajności usług biznesowych lub IT ze szczegółami, w tym dostępność usług i przewidywanie ryzyka awarii. Narzędzie może również zapewnić wgląd w wpływ problemu z wydajnością lub zmiany w projekcie komponentów IT (aplikacji lub infrastruktury) na usługę biznesową. Poniższy rysunek przedstawia interaktywny dashboard prezentujący stan wszystkich usług.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Przyjrzyjmy się szczegółom na przykładzie usługi Digital Banking. Klikając w nazwę usługi przechodzimy do szczegółowego PCM usługi. Widzimy, że status usługi Digital Banking jest zależny od stanu infrastruktury i podusług transakcyjnych o różnych wagach. Praca z ciężarkami i pokazywanie ich to przyjemna zaleta DX OI.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Topologia jest ważnym elementem monitorowania operacyjnego instalacji, umożliwiając operatorom i inżynierom analizę powiązań między komponentami, znalezienie pierwotnej przyczyny i wpływu.

DX OI Topology Viewer to usługa wykorzystująca dane topologiczne pochodzące z domenowych systemów monitorowania, które zbierają dane bezpośrednio z monitorowanych obiektów. Narzędzie zostało zaprojektowane do przeszukiwania wielu warstw składnic topologii i wyświetlania kontekstowej mapy relacji. Aby zbadać problemy, możesz przejść do problematycznej podusługi Backend Banking i zobaczyć topologię oraz problematyczne komponenty. Można także analizować komunikaty alarmowe i wskaźniki wydajności każdego komponentu.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Analizując elementy transakcji Payments (transakcje użytkowników) możemy śledzić wartości biznesowe KPI, które są brane pod uwagę także przy obliczaniu dostępności i kondycji usługi. Poniżej podano przykład biznesowego KPI:

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Analityka zdarzeń

Algorytmiczna redukcja szumów w wyniku grupowania wypadków

Jedną z kluczowych cech DX OI w przetwarzaniu zdarzeń jest klastrowanie. Silnik działa na wszystkich alertach przychodzących do systemu, identyfikując wzorce na podstawie różnych kontekstów i grupując je. Klastry te są samouczące się i nie trzeba ich konfigurować ręcznie.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Dzięki temu klastrowanie pozwala użytkownikom łączyć i grupować ogromną liczbę zdarzeń oraz analizować tylko te, które mają wspólny kontekst. Na przykład zestaw zdarzeń reprezentujących zdarzenie mające wpływ na działanie aplikacji lub centrum danych. Sytuacje są tworzone przy użyciu algorytmów grupowania opartych na uczeniu maszynowym, które do analizy wykorzystują korelację czasową, relacje topologiczne i przetwarzanie języka natywnego. Poniższe rysunki przedstawiają przykłady wizualizacji grup skupień komunikatów, tzw. Alarmów Sytuacji oraz Osi Czasu Dowodów, prezentując główne parametry grupowania oraz proces ograniczania liczby zdarzeń szumowych.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Analiza problemu źródłowego i korelacja wypadków

W dzisiejszym środowisku hybrydowym transakcja użytkownika może mieć wpływ na wiele systemów używanych dynamicznie. W rezultacie może zostać wygenerowanych wiele alertów z różnych systemów, ale związanych z tym samym problemem lub incydentem. DX OI wykorzystuje własne mechanizmy do tłumienia zbędnych i zduplikowanych alertów oraz korelowania powiązanych alertów w celu lepszego wykrywania krytycznych problemów i szybszego rozwiązywania.

Spójrzmy na przykład, w którym system otrzymuje wiele komunikatów alarmowych dla różnych obiektów (OU) w ramach jednej usługi. W przypadku wpływu na dostępność i wydajność usługi system wygeneruje alarm serwisowy (alarm serwisowy), wskaże i wskaże prawdopodobną przyczynę źródłową (problematyczny KE i komunikat alarmowy dla KE), która przyczyniła się do spadku wydajności lub awaria usługi. Poniższy rysunek przedstawia wizualizację sytuacji awaryjnej dla usługi Webex.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

DX OI umożliwia pracę ze zdarzeniami poprzez intuicyjne akcje w interfejsie WWW systemu. Użytkownicy mogą ręcznie przypisywać zdarzenia do odpowiedzialnego pracownika w celu rozwiązywania problemów, resetowania/potwierdzania alertów, tworzenia zgłoszeń lub wysyłania powiadomień e-mail oraz uruchamiania automatycznych skryptów w celu rozwiązania sytuacji awaryjnej (przepływ pracy zaradczej, więcej na ten temat później). W ten sposób DX OI pozwala operatorom dyżurującym skoncentrować się na głównym komunikacie alarmowym, a także pomaga usprawnić proces sortowania komunikatów w klastry.

Algorytmy maszynowe do przetwarzania metryk i analizowania danych wydajnościowych

Uczenie maszynowe pozwala śledzić, agregować i wizualizować kluczowe wskaźniki wydajności za dowolny konkretny okres czasu, co daje użytkownikowi następujące korzyści:

  • Wykrywanie wąskich gardeł i anomalii wydajnościowych;
  • Porównanie kilku wskaźników dla tych samych urządzeń, interfejsów lub sieci;
  • Porównanie identycznych wskaźników w kilku lokalizacjach;
  • Porównanie różnych wskaźników dla jednego i kilku obiektów;
  • Porównanie metryk wielowymiarowych w wielu obiektach.

Aby analizować metryki wprowadzane do systemu, DX OI wykorzystuje funkcje analizy maszynowej przy użyciu algorytmów matematycznych, co pomaga skrócić czas ustawiania progów statycznych i generowania ostrzeżeń w przypadku wystąpienia anomalii.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Efektem zastosowania algorytmów matematycznych jest konstrukcja tzw. rozkładów prawdopodobieństwa wartości metryki (rzadki, prawdopodobny, środkowy, średni, rzeczywisty). Ryciny powyżej i poniżej przedstawiają rozkłady prawdopodobieństwa.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Powyższe dwa wykresy przedstawiają następujące dane:

  • Aktualna data. Rzeczywiste dane są wyświetlane na wykresie w postaci czarnej linii ciągłej (brak alarmu) lub kolorowej linii ciągłej (stan alarmowy). Linia jest obliczana na podstawie rzeczywistych danych metryki. Porównując rzeczywiste dane i medianę, można szybko zobaczyć różnice w danych. Gdy wystąpi zdarzenie, czarna linia zmienia się w kolorową linię ciągłą, która odpowiada krytyczności zdarzenia i wyświetla ikony z odpowiednią krytycznością nad wykresem. Na przykład kolor czerwony oznacza anomalię krytyczną, pomarańczowy oznacza poważną anomalię i żółty oznacza drobną anomalię.
  • Średnia wartość wskaźnika. Średnia lub mediana wartości wskaźnika jest pokazana na wykresie jako szara linia. Średnia jest wyświetlana, gdy nie ma wystarczających danych historycznych.
  • Mediana wartości wskaźnika (wartość środkowa). Linia środkowa znajduje się w środku zakresu i jest pokazana jako zielona linia przerywana. Strefy znajdujące się najbliżej tej linii są najbliższe typowym wartościom wskaźnika.
  • Wspólna wartość. Ogólne dane strefy śledzą najbliższą linię środkową lub normalną dla danej metryki i są wyświetlane jako ciemnozielony pasek. Obliczenia analityczne umieszczają całą strefę o jeden percentyl powyżej lub poniżej normy.
  • Dane probabilistyczne. Dane dotyczące strefy prawdopodobieństwa są pokazane na wykresie w postaci zielonego paska. System umieszcza strefę prawdopodobieństwa na poziomie dwóch percentyli powyżej lub poniżej normy.
  • Rzadkie dane. Dane dotyczące rzadkich stref są pokazane na wykresie w postaci jasnozielonego paska. System umieszcza obszar z rzadkimi wartościami metryki na trzech percentylach powyżej lub poniżej normy i sygnalizuje zachowanie wskaźnika poza normalnym zakresem, jednocześnie system generuje tzw. Alarm Anomalii.

Anomalia to pomiar lub zdarzenie, które jest niezgodne z normalnym działaniem metryki. Wykrywanie anomalii w celu identyfikacji problemów i zrozumienia trendów w infrastrukturze i aplikacjach jest kluczową cechą DX OI. Wykrywanie anomalii pozwala zarówno rozpoznać nietypowe zachowanie (na przykład serwer, który reaguje wolniej niż zwykle lub nietypową aktywność sieciową spowodowaną włamaniem), jak i odpowiednio zareagować (zgłoszenie zdarzenia, uruchomienie automatycznego skryptu naprawczego).

Wykrywanie anomalii DX OI zapewnia następujące korzyści:

  • Nie ma potrzeby ustalania progów. DX OI niezależnie zestawi dane i zidentyfikuje anomalie.
  • DX OI zawiera ponad dziesięć algorytmów sztucznej inteligencji i uczenia maszynowego, w tym EWMA (wykładniczo ważona — średnia krocząca) i KDE (szacowanie gęstości jądra). Algorytmy te umożliwiają szybką analizę przyczyn źródłowych i przewidywanie przyszłych wartości metryk.

Analityka predykcyjna i powiadamianie o ewentualnych awariach

Predictive Insights to funkcja wykorzystująca możliwości uczenia maszynowego do identyfikowania wzorców i trendów. Na podstawie tych trendów system przewiduje zdarzenia, które mogą wystąpić w przyszłości. Komunikaty te wskazują na potrzebę podjęcia działań, zanim wartości wskaźników odbiegają od normalnych wartości i wpływają na krytyczne usługi biznesowe. Informacje predykcyjne przedstawiono na poniższym rysunku.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Jest to wizualizacja ostrzeżeń predykcyjnych dla konkretnego wskaźnika.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Prognozowanie obciążenia mocy obliczeniowej z funkcją określania scenariuszy obciążenia

Planowanie pojemności w ramach analizy wydajności pomaga zarządzać zasobami IT, zapewniając ich odpowiedni rozmiar w celu zaspokojenia bieżących i przyszłych potrzeb biznesowych. Będziesz w stanie zoptymalizować produktywność i efektywność istniejących zasobów, zaplanować i uzasadnić każdą inwestycję finansową.

Funkcja analizy wydajności w DX OI zapewnia następujące korzyści:

  • Prognozowanie wydajności w szczytowych sezonach;
  • Określenie momentu, w którym potrzebne są dodatkowe zasoby, aby zapewnić wysoką jakość funkcjonowania usługi;
  • Zakup dodatkowych zasobów tylko wtedy, gdy jest to konieczne;
  • Efektywne zarządzanie infrastrukturą i sieciami;
  • Wyeliminuj niepotrzebne koszty energii poprzez identyfikację niewykorzystanych zasobów;
  • Dokonywanie oceny obciążenia zasobów w przypadku planowanego wzrostu zapotrzebowania na usługę lub zasób.

Strona Pojemność Analytics DX OI (zdjęcie poniżej) zawiera następujące widżety:

  • Stan pojemności zasobów;
  • Monitorowane grupy/usługi;
  • Konsumenci o największej pojemności.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Na stronie głównej analizy wydajności wyświetlane są składniki zasobów, które są nadmiernie wykorzystywane i których pojemność jest niska. Ta strona pomaga administratorom platformy znaleźć nadużywane zasoby oraz zmienić ich rozmiar i zoptymalizować. Stan zasobów można analizować w oparciu o kody kolorystyczne i odpowiadające im znaczenia. Zasoby są klasyfikowane na podstawie poziomu ich przeciążenia na stronie stanu wydajności zasobu. Możesz kliknąć każdy kolor, aby wyświetlić listę komponentów zawartych w wybranej kategorii. Następnie wyświetlona zostanie mapa cieplna ze wszystkimi obiektami i prognozami na 12 miesięcy, co pozwala zidentyfikować zasoby, które wkrótce się wyczerpią.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Dla każdej metryki w Analizie wydajności można określić filtry, których DX Operational Intelligence używa do tworzenia prognoz (rysunek poniżej).

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Dostępne są następujące filtry:

  • Metryczny. Metryka, która będzie używana w prognozie.
  • Bazuj na. Wybór ilości danych historycznych, które posłużą do sporządzenia prognoz na przyszłość. To pole służy do porównywania i analizowania trendów w ciągu ostatniego miesiąca, trendów w ciągu ostatnich 3 miesięcy, trendów w ciągu roku itp.
  • Wzrost. Oczekiwana stopa wzrostu obciążenia, której chcesz użyć do modelowania prognozy zużycia energii. Dane te można wykorzystać do prognozowania wzrostu wykraczającego poza prognozy. Na przykład oczekuje się, że zużycie zasobów wzrośnie o kolejne 40 procent w związku z otwarciem nowego biura.

Analiza dziennika

Funkcja analizy dziennika DX OI zapewnia:

  • gromadzenie i agregowanie logów z różnych źródeł (w tym uzyskanych metodami agentowymi i nieagentowymi);
  • parsowanie i normalizacja danych;
  • analiza zgodności z zadanymi warunkami i generowanie zdarzeń;
  • korelacja zdarzeń na podstawie logów, w tym zdarzeń uzyskanych w wyniku monitorowania infrastruktury IT;
  • wizualizacja danych na podstawie analizy w DX Dashboards;
  • wnioski dotyczące dostępności usługi na podstawie analizy danych z logów.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Gromadzenie dzienników metodą bezagentową realizowane jest przez system w przypadku dzienników zdarzeń systemu Windows i dziennika syslog. Logi tekstowe zbierane są metodą agentową.

Funkcja automatycznego rozwiązywania sytuacji awaryjnych (naprawa)

Zautomatyzowane działania mające na celu naprawę sytuacji awaryjnej (Remediation Workflow) pozwalają na rozwiązanie problemów, które spowodowały wygenerowanie zdarzenia w DX OI. Na przykład problem z użyciem procesora generuje komunikat alarmowy, a przepływ pracy zaradczej rozwiązuje problem, uruchamiając ponownie serwer, na którym wystąpił problem. Integracja DX OI z systemem automatyki pozwala na uruchamianie procesów naprawczych z konsoli zdarzeń w DX Operational Intelligence i monitorowanie ich w konsoli automatyki.

Po zintegrowaniu z systemem automatyki, w konsoli DX OI można uruchomić automatyczne działania korygujące każdą sytuację alarmową z kontekstu komunikatu alarmowego. Możesz wyświetlić zalecane działania wraz z informacją o procentowym poziomie ufności (prawdopodobieństwo rozwiązania sytuacji poprzez podjęcie działania).

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Początkowo, gdy nie ma statystyk dotyczących wyników Przepływu Pracy Zaradczej, silnik rekomendacji sugeruje potencjalne opcje na podstawie wyszukiwań słów kluczowych, następnie wykorzystywane są wyniki uczenia maszynowego i silnik zaczyna rekomendować technikę zaradczą w oparciu o heurystykę. Gdy zaczniesz oceniać wyniki otrzymywanych wskazówek, trafność Twoich rekomendacji poprawi się.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Przykład informacji zwrotnej od użytkownika: użytkownik wybiera, czy proponowane działanie mu się podoba, czy nie, a system uwzględnia ten wybór przy formułowaniu dalszych rekomendacji. Lubić nielubić:

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Zalecane działania naprawcze dla konkretnego alarmu opierają się na kombinacji informacji zwrotnych, które określają, czy działanie jest akceptowalne. DX OI zapewnia gotową integrację z funkcją Automic Automation.

Integracja DX OI z systemami innych firm

Nie będziemy szczegółowo omawiać integracji danych z natywnych produktów monitorujących Broadcom (DX NetOps, DX Infrastructure Management, DX Application Performance Management). Zamiast tego przyjrzyjmy się, jak integrowane są dane z systemów zewnętrznych i spójrzmy na przykład integracji z jednym z najpopularniejszych systemów - Zabbix.

Do integracji z systemami innych firm wykorzystywany jest komponent DX Gateway. DX Gateway składa się z 3 komponentów - On-Prem Gateway, RESTmon i Log Collector (Logstash). Możesz zainstalować wszystkie 3 komponenty lub tylko ten, którego potrzebujesz, zmieniając ogólny plik konfiguracyjny podczas instalacji DX Gateway. Poniższy rysunek przedstawia architekturę DX Gateway.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Przyjrzyjmy się oddzielnie przeznaczeniu komponentów DX Gateway.

Brama lokalna. Jest to interfejs, który zbiera alarmy z platformy DX i wysyła zdarzenia alarmowe do systemów innych firm. Brama On-Prem działa jako moduł odpytujący, który okresowo zbiera dane o zdarzeniach z DX OI przy użyciu interfejsu API żądań HTTPS, a następnie wysyła alerty do serwera strony trzeciej, który jest zintegrowany z platformą DX za pomocą webhooków.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Kolekcjoner logów DX odbiera syslog z urządzeń sieciowych lub serwerów i przesyła je do OI. DX Log Collector pozwala oddzielić oprogramowanie generujące komunikaty, system je przechowujący oraz oprogramowanie je raportujące i analizujące. Każda wiadomość jest oznaczona kodem jednostki wskazującym typ oprogramowania generującego wiadomość i przypisanym poziomem ważności. Możesz to wszystko zobaczyć później w Dashboardach DX.

DX ODPOCZYNEK pon integruje się z produktami/usługami stron trzecich poprzez REST API i przesyła dane do OI. Poniższy rysunek przedstawia schemat działania DX RESTmon na przykładzie integracji z systemami monitoringu Solarwinds i SCOM.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Kluczowe cechy DX RESTmon:

  • Połącz się z dowolnym zewnętrznym źródłem danych, aby otrzymać dane:
    • PULL: łączenie i pobieranie danych z publicznych API REST;
    • PUSH: przepływ danych do RESTmon poprzez REST.
  • Obsługa formatów JSON i XML;
  • Pozyskuj metryki, alerty, grupy, topologię, zasoby i dzienniki;
  • Gotowe złącza dla różnych narzędzi/technologii, istnieje także możliwość opracowania konektora do dowolnego źródła z otwartym API (lista złącz pudełkowych znajduje się na rysunku poniżej);
  • Obsługa podstawowego uwierzytelniania (domyślnie) podczas uzyskiwania dostępu do interfejsu Swagger i API;
  • Obsługa protokołu HTTPS (domyślnie) dla wszystkich wiadomości przychodzących i wychodzących;
  • Obsługa przychodzących i wychodzących serwerów proxy;
  • Zaawansowane możliwości analizowania tekstu dla dzienników otrzymanych za pośrednictwem protokołu REST;
  • Niestandardowe analizowanie za pomocą RESTmon w celu wydajnego analizowania i wizualizacji dzienników;
  • Obsługa wyodrębniania informacji o grupach urządzeń z aplikacji monitorujących i ładowania do OI w celu analizy i wizualizacji;
  • Obsługa dopasowywania wyrażeń regularnych. Można tego używać do analizowania i dopasowywania komunikatów dziennika otrzymanych za pośrednictwem protokołu REST oraz do generowania lub zamykania zdarzeń w oparciu o określone warunki wyrażeń regularnych.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Przyjrzyjmy się teraz procesowi konfiguracji integracji DX OI z Zabbixem poprzez DX RESTmon. Integracja pudełkowa pobiera następujące dane z Zabbix:

  • dane inwentaryzacyjne;
  • topologia;
  • Problemy;
  • metryka.

Ponieważ konektor dla Zabbix jest dostępny od razu po wyjęciu z pudełka, wszystko, co musisz zrobić, aby skonfigurować integrację, to zaktualizować swój profil o adres IP API serwera Zabbix i konto, a następnie przesłać profil poprzez interfejs sieciowy Swagger. Przykład na dwóch poniższych zdjęciach.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

Po skonfigurowaniu integracji opisane powyżej funkcje analityczne DX OI będą dostępne dla danych pochodzących z Zabbix, a mianowicie: Analiza alarmów, Analiza wydajności, Predictive Insights, Analiza usług i Remediacja. Poniższy rysunek przedstawia przykład analizy metryk wydajnościowych dla obiektów zintegrowanych z Zabbix.

Umbrella system monitorowania i modele zasobów-usług w zaktualizowanym DX Operations Intelligence firmy Broadcom (ex. CA)

wniosek

DX OI to nowoczesne narzędzie analityczne, które zapewni działom IT znaczną efektywność operacyjną, pozwalając na szybsze i trafniejsze podejmowanie decyzji poprawiających jakość usług IT i biznesowych poprzez międzydomenową analizę kontekstową. Dla właścicieli aplikacji i jednostek biznesowych DX OI obliczy wskaźnik dostępności i jakości usług nie tylko w kontekście wskaźników technologicznych IT, ale także biznesowych KPI wyodrębnionych ze statystyk transakcyjnych dotyczących użytkowników końcowych.

Jeśli chcesz dowiedzieć się więcej na temat tego rozwiązania, złóż wniosek o wersję demonstracyjną lub pilotażową w dogodny dla Ciebie sposób na naszej stronie internetowej.

Źródło: www.habr.com

Dodaj komentarz