Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Im September dieses Jahres veröffentlichte Broadcom (ehemals CA) die neue Version 20.2 seiner DX Operations Intelligence (DX OI)-Lösung. Auf dem Markt ist dieses Produkt als Dachüberwachungssystem positioniert. Das System ist in der Lage, Daten von Überwachungssystemen verschiedener Domänen (Netzwerk, Infrastruktur, Anwendungen, Datenbanken) sowohl von CA als auch von Drittherstellern, einschließlich Open-Source-Lösungen (Zabbix, Prometheus und andere), zu empfangen und zu kombinieren.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Die Hauptfunktion von DX OI ist die Erstellung eines vollwertigen Resource-Service-Modells (RSM) auf Basis von Configuration Items (CUs), die bei Integration in Drittsysteme die Bestandsdatenbank füllen. DX OI implementiert Funktionen des maschinellen Lernens und der künstlichen Intelligenz (ML und KI) über die in die Plattform eingegebenen Daten, wodurch Sie die Ausfallwahrscheinlichkeit eines bestimmten CI und den Grad der Auswirkung eines Ausfalls auf einen darauf basierenden Geschäftsdienst bewerten/vorhersagen können ein bestimmtes CI. Darüber hinaus ist DX OI ein zentraler Punkt für die Erfassung von Überwachungsereignissen und dementsprechend für die Integration in das Service-Desk-System, was ein unbestreitbarer Vorteil der Verwendung des Systems in einheitlichen Überwachungszentren nach Dienstverlagerungen von Organisationen ist. In diesem Artikel erzählen wir Ihnen mehr über die Funktionalität des Systems und zeigen die Benutzer- und Administratoroberflächen.

DX OI-Lösungsarchitektur

Die DX-Plattform verfügt über eine Microservice-Architektur, auf der Kubernetes oder OpenShift installiert ist und ausgeführt wird. Die folgende Abbildung zeigt die Komponenten der Lösung, die als unabhängige Überwachungstools verwendet oder durch bestehende Überwachungssysteme mit ähnlichen Funktionen ersetzt werden können (in der Abbildung sind Beispiele für solche Systeme aufgeführt) und dann mit dem DX OI-Dach verbunden werden können. Im Diagramm unten:

  • Überwachung mobiler Anwendungen in DX App Experience Analytics;
  • Überwachung der Anwendungsleistung in DX APM;
  • Infrastrukturüberwachung im DX Infrastructure Manager;
  • Überwachung von Netzwerkgeräten im DX NetOps Manager.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

DX-Komponenten laufen auf einem Kubernetes-Cluster und skalieren durch einfaches Starten neuer PODs. Unten finden Sie ein Lösungsdiagramm der obersten Ebene.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Die Verwaltung, Skalierung und Aktualisierung der DX-Plattform erfolgt in der Verwaltungskonsole. Von einer einzigen Konsole aus können Sie eine mandantenfähige Architektur verwalten, die mehrere Unternehmen oder mehrere Geschäftseinheiten innerhalb eines Unternehmens umfassen kann. In diesem Modell kann jede Einrichtung individuell als Mieter mit eigenen Konfigurationen konfiguriert werden.

Die Verwaltungskonsole ist ein webbasiertes Betriebs- und Systemverwaltungstool, das Administratoren eine konsistente, einheitliche Schnittstelle für die Durchführung von Überwachungscluster-Verwaltungsaufgaben bietet.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Neue Mieter für Geschäftseinheiten oder Unternehmen innerhalb des Unternehmens werden in wenigen Minuten bereitgestellt. Dies ist von Vorteil, wenn Sie ein einheitliches Überwachungssystem haben möchten, gleichzeitig aber auf Plattformebene (und nicht auf Zugriffsrechten) Überwachungsobjekte zwischen Abteilungen abgrenzen möchten.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Ressourcen-Service-Modelle und Monitoring von Business Services

DX OI verfügt über integrierte Mechanismen zur Erstellung von Diensten und zur Entwicklung klassischer PCM mit der Aufgabe der Einflusslogik und Gewichtung zwischen Dienstkomponenten. Es gibt auch Mechanismen zum Exportieren von PCM aus einer externen CMDB. Die folgende Abbildung zeigt den integrierten PCM-Editor (achten Sie auf die Linkgewichte).

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

DX OI bietet eine ganzheitliche Sicht auf wichtige Leistungsindikatoren für Geschäfts- oder IT-Services auf granularer Ebene, einschließlich Serviceverfügbarkeit und Vorhersage des Ausfallrisikos. Das Tool kann auch Einblick in die Auswirkungen eines Leistungsproblems oder einer Änderung in der Struktur von IT-Komponenten (Anwendung oder Infrastruktur) auf einen Geschäftsservice geben. Die folgende Abbildung ist ein interaktives Dashboard, das den Status aller Dienste anzeigt.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Schauen wir uns beispielhaft den Service Digital Banking genauer an. Mit einem Klick auf den Namen des Dienstes gelangen wir zum detaillierten PCM-Dienst. Wir sehen, dass der Status des Digital-Banking-Dienstes vom Zustand der Infrastruktur und den transaktionalen Teildiensten mit unterschiedlicher Gewichtung abhängt. Das Arbeiten mit Gewichten und deren Anzeige ist ein interessanter Vorteil von DX OI.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Die Topologie ist ein wichtiges Element der Betriebsüberwachung des Unternehmens und ermöglicht es Betreibern und Ingenieuren, die Beziehung zwischen Komponenten zu analysieren und die Ursache und den Einfluss zu finden.

DX OI Topology Viewer ist ein Dienst, der topologische Daten von Domänenüberwachungssystemen verwendet, die Daten direkt von Überwachungsobjekten sammeln. Das Tool dient dazu, mehrere Topologiespeicherebenen zu durchsuchen und eine kontextspezifische Beziehungskarte anzuzeigen. Um Probleme zu untersuchen, können Sie zum problematischen Backend-Banking-Subdienst gehen und sich die Topologie und problematischen Komponenten ansehen. Für jede Komponente können auch Alarmmeldungen und Leistungskennzahlen analysiert werden.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Bei der Analyse der Transaktionskomponenten von Zahlungen (Benutzertransaktionen) können wir geschäftliche KPI-Werte verfolgen, die auch bei der Berechnung des Verfügbarkeitsstatus und des Zustands des Dienstes berücksichtigt werden. Ein Beispiel für einen Geschäfts-KPI ist unten dargestellt:

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Ereignisanalyse (Alarmanalyse)

Algorithmische Rauschunterdrückung durch Crash-Clustering

Eines der Hauptmerkmale von DX OI bei der Ereignisverarbeitung ist das Clustering. Der Mechanismus funktioniert bei allen im System eingehenden Warnungen, um Muster basierend auf unterschiedlichen Kontexten zu identifizieren und sie in Gruppen zusammenzufassen. Diese Cluster sind selbstlernend und müssen nicht manuell konfiguriert werden.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Somit ermöglicht Clustering den Benutzern, eine große Anzahl von Ereignissen zu kombinieren und zu gruppieren und nur diejenigen zu analysieren, die einen gemeinsamen Kontext haben. Beispielsweise eine Reihe von Ereignissen, die einen Vorfall darstellen, der Anwendungen oder ein Rechenzentrum betrifft. Die Situationen werden mithilfe von auf maschinellem Lernen basierenden Clustering-Algorithmen erstellt, die zur Analyse zeitliche Korrelation, topologische Beziehungen und Verarbeitung der Muttersprache nutzen. Die folgenden Abbildungen zeigen Beispiele für die Visualisierung gruppierter Nachrichtengruppen, der sogenannten Situationsalarme und der Evidence Timeline, die die wichtigsten Gruppierungsparameter und den Prozess zur Reduzierung der Anzahl von Lärmereignissen anzeigen.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Grundproblemanalyse und Absturzkorrelation

In der heutigen Hybridumgebung kann sich eine Benutzertransaktion auf mehrere Systeme auswirken, die dynamisch verwendet werden. Dadurch können mehrere Warnungen von verschiedenen Systemen generiert werden, die sich jedoch auf dasselbe Problem oder denselben Vorfall beziehen. DX OI nutzt proprietäre Mechanismen, um redundante und doppelte Warnungen zu unterdrücken und verwandte Warnungen zu korrelieren, um kritische Probleme besser zu erkennen und schneller zu lösen.

Betrachten wir ein Beispiel, bei dem das System zahlreiche Notfallmeldungen für verschiedene Objekte (KE) empfängt, die einem Dienst zugrunde liegen. Im Falle einer Beeinträchtigung der Verfügbarkeit und Funktionsfähigkeit des Dienstes generiert das System einen Dienstalarm (Servicealarm), gibt die wahrscheinliche Grundursache (Problem-CI und Alarmmeldung auf dem CI) an und bezeichnet sie, die zur Leistungsminderung beigetragen hat Ausfall des Dienstes. Die folgende Abbildung zeigt die Absturzvisualisierung für einen Webex-Dienst.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

DX OI ermöglicht Ihnen die Arbeit mit Ereignissen durch intuitive Aktionen in der Weboberfläche des Systems. Benutzer können Ereignisse manuell dem zuständigen Mitarbeiter zur Fehlerbehebung zuweisen, Warnungen zurücksetzen/bestätigen, Tickets erstellen oder E-Mail-Benachrichtigungen senden sowie automatisierte Skripte ausführen, um einen Notfall zu beheben (Remediation Workflow, mehr dazu später). Auf diese Weise ermöglicht DX OI den Schichtarbeitern, sich auf die eigentliche Alarmmeldung zu konzentrieren und trägt außerdem dazu bei, den Prozess der Sortierung von Meldungen in gruppierte Arrays zu vereinfachen.

Maschinenalgorithmen zur Verarbeitung von Metriken und zur Analyse von Leistungsdaten

Durch maschinelles Lernen können Sie wichtige Leistungsindikatoren für einen bestimmten Zeitraum verfolgen, aggregieren und visualisieren, was dem Benutzer die folgenden Vorteile bietet:

  • Erkennung von Engpässen und Leistungsanomalien;
  • Vergleich mehrerer Indikatoren für dieselben Geräte, Schnittstellen oder Netzwerke;
  • Vergleich derselben Indikatoren an mehreren Objekten;
  • Vergleich verschiedener Indikatoren für ein und mehrere Objekte;
  • Vergleich mehrdimensionaler Metriken für mehrere Objekte.

Um die in das System eingehenden Metriken zu analysieren, nutzt DX OI die Funktionen der maschinellen Analyse mithilfe mathematischer Algorithmen, was dazu beiträgt, die Zeit beim Festlegen statischer Schwellenwerte und beim Generieren von Warnungen bei Auftreten von Anomalien zu verkürzen.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Das Ergebnis der Anwendung mathematischer Algorithmen ist die Konstruktion der sogenannten Wahrscheinlichkeitsverteilungen des metrischen Werts (Selten, Wahrscheinlich, Mitte, Mittel, Tatsächlich). Die Abbildungen oben und unten zeigen die Wahrscheinlichkeitsverteilungen.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Die beiden Diagramme oben zeigen die folgenden Daten:

  • Tatsächliche Daten (Actual). Die tatsächlichen Daten werden als durchgezogene schwarze Linie (keine Alarme) oder als farbige durchgezogene Linie (Alarmzustand) dargestellt. Die Linie wird basierend auf den tatsächlichen Daten für die Metrik berechnet. Durch den Vergleich der tatsächlichen Daten und des Medians können Sie die Abweichung in der Metrik schnell erkennen. Wenn ein Ereignis auftritt, ändert sich die schwarze Linie in eine farbige durchgezogene Linie, die dem Schweregrad des Ereignisses entspricht und über dem Diagramm Symbole mit dem entsprechenden Schweregrad anzeigt. Beispielsweise steht Rot für eine kritische Anomalie, Orange für eine schwerwiegende Anomalie und Gelb für eine geringfügige Anomalie.
  • Durchschnittswert des Indikators (Mittelwert). Der Median oder Mittelwert für eine Kennzahl wird im Diagramm als graue Linie angezeigt. Der Durchschnittswert wird angezeigt, wenn nicht genügend historische Daten vorhanden sind.
  • Der Medianwert des Indikators (Mittelwert). Die Mittellinie ist die Mitte des Bereichs und wird als grün gepunktete Linie dargestellt. Die Zonen, die dieser Linie am nächsten liegen, kommen den typischen Werten des Indikators am nächsten.
  • Gemeinsame Daten (Common Value). Die Gesamtzonendaten verfolgen die Position, die der Mittellinie oder Normalen Ihrer Metrik am nächsten liegt, und werden als dunkelgrüner Balken angezeigt. Analytische Berechnungen gehen davon aus, dass die Gesamtzone ein Perzentil über oder unter dem Normalwert liegt.
  • Wahrscheinlichkeitsdaten. Die Wahrscheinlichkeitszonendaten werden im Diagramm mit einem grünen Balken angezeigt. Das System platziert die Wahrscheinlichkeitszone zwei Perzentile über oder unter dem Normalwert.
  • Seltene Daten. Daten zu seltenen Zonen werden im Diagramm als hellgrüner Balken angezeigt. Das System platziert eine Zone mit seltenen metrischen Werten drei Perzentile über oder unter der Norm und signalisiert das Verhalten des Indikators außerhalb des normalen Bereichs, während das System den sogenannten Anomaly Alert generiert.

Eine Anomalie ist eine Messung oder ein Ereignis, das nicht mit der normalen Leistung einer Metrik übereinstimmt. Die Anomalieerkennung zur Identifizierung von Problemen und zum Verständnis von Trends in Infrastruktur und Anwendungen ist ein Schlüsselmerkmal von DX OI. Mit der Anomalieerkennung können Sie sowohl ungewöhnliches Verhalten erkennen (z. B. ein Server, der langsamer als üblich reagiert, oder ungewöhnliche Netzwerkaktivität aufgrund eines Hacks) als auch entsprechend reagieren (einen Vorfall auslösen, ein automatisches Behebungsskript ausführen).

Die DX OI-Anomalieerkennungsfunktion bietet die folgenden Vorteile:

  • Sie müssen keine Schwellenwerte festlegen. DX OI vergleicht die Daten selbstständig und erkennt Auffälligkeiten.
  • DX OI umfasst mehr als zehn Algorithmen für künstliche Intelligenz und maschinelles Lernen, darunter EWMA (Exponentially-Weighted-Moving-Average) und KDE (Kernel Density Estimation). Mit diesen Algorithmen können Sie eine schnelle Ursachenanalyse durchführen und zukünftige Kennzahlen vorhersagen.

Prädiktive Analysen und Fehlerwarnungen

Predictive Insights ist eine Funktion, die die Leistungsfähigkeit des maschinellen Lernens nutzt, um Muster und Trends zu erkennen. Basierend auf diesen Trends prognostiziert das System Ereignisse, die in der Zukunft eintreten könnten. Diese Meldungen weisen darauf hin, dass Maßnahmen ergriffen werden müssen, bevor die Metrikwerte über den normalen Bereich hinausgehen und sich auf kritische Geschäftsdienste auswirken. Predictive Insights sind in der folgenden Abbildung dargestellt.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Und dies ist eine Visualisierung prädiktiver Warnungen für eine bestimmte Metrik.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Prognose der Auslastung der Rechenleistung mit der Funktion zur Festlegung von Auslastungsszenarien

Die Kapazitätsplanungsfunktion von Capacity Analytics hilft bei der Verwaltung von IT-Ressourcen, indem sie sicherstellt, dass die Ressourcen richtig dimensioniert sind, um aktuelle und zukünftige Geschäftsanforderungen zu erfüllen. Sie werden in der Lage sein, die Leistung und Effizienz bestehender Ressourcen zu optimieren sowie jede finanzielle Investition zu planen und zu rechtfertigen.

Die Kapazitätsanalysefunktion in DX OI bietet die folgenden Vorteile:

  • Prognosekapazitäten während der Hauptsaison;
  • Bestimmung des Zeitpunkts, zu dem zusätzliche Ressourcen erforderlich sind, um die Qualität der Dienstleistung sicherzustellen;
  • Erwerb zusätzlicher Ressourcen nur bei Bedarf;
  • Effizientes Infrastruktur- und Netzwerkmanagement;
  • Eliminieren Sie unnötige Energiekosten, indem Sie nicht ausreichend genutzte Ressourcen identifizieren.
  • Führen Sie eine Schätzung der Ressourcenauslastung durch, falls die Nachfrage nach einem Dienst oder einer Ressource geplant steigt.

Die Capacity Analytics DX OI-Seite (siehe unten) verfügt über die folgenden Widgets:

  • Status der Ressourcenkapazität;
  • Kontrollierte Gruppen/Dienste (Überwachte Gruppen/Dienste);
  • Große Ressourcenverbraucher (Top-Kapazitätsverbraucher).

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Auf der Hauptseite der Kapazitätsanalyse werden Ressourcenkomponenten angezeigt, die überlastet sind und deren Kapazität erschöpft ist. Diese Seite hilft Plattformadministratoren, überbeanspruchte Ressourcen zu finden und hilft ihnen, ihre Größe zu ändern und Ressourcen zu optimieren. Der Zustand von Ressourcen kann anhand von Farbcodes und ihren jeweiligen Werten analysiert werden. Auf der Statusseite der Ressourcenkapazität werden Ressourcen nach ihrem Überlastungsgrad kategorisiert. Sie können auf jede Farbe klicken, um eine Liste der Komponenten in der ausgewählten Kategorie anzuzeigen. Anschließend wird eine Heatmap mit allen Objekten und Prognosen für 12 Monate angezeigt, mit der Sie bald erschöpfte Ressourcen erkennen können.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Für jede Metrik in Capacity Analytics können Sie die Filter angeben, die DX Operational Intelligence zur Erstellung von Prognosen verwendet (Abbildung unten).

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Folgende Filter stehen zur Verfügung:

  • Metrisch. Die für die Prognose zu verwendende Metrik.
  • Basis auf. Auswahl der Menge an historischen Daten, die zur Erstellung von Prognosen für die Zukunft verwendet werden. Dieses Feld wird zum Vergleichen und Analysieren von Trends des letzten Monats, der letzten drei Monate, der jährlichen Trends usw. verwendet.
  • Wachstum. Die erwartete Wachstumsrate der Arbeitslast, die Sie zur Modellierung der Kapazitätsprognose verwenden möchten. Mithilfe dieser Daten lässt sich ein über die Prognosen hinausgehendes Wachstum prognostizieren. Beispielsweise wird erwartet, dass der Ressourcenverbrauch durch die Eröffnung eines neuen Büros um weitere 40 Prozent steigen wird.

Protokollanalyse

Die DX OI-Protokollanalysefunktion bietet:

  • Sammlung und Aggregation von Protokollen aus verschiedenen Quellen (einschließlich solcher, die durch behördliche und agentenlose Methoden erhalten wurden);
  • Parsing und Datennormalisierung;
  • Analyse auf Einhaltung der festgelegten Bedingungen und Generierung von Ereignissen;
  • Korrelation von Ereignissen basierend auf Protokollen, einschließlich Ereignissen, die als Ergebnis der Überwachung der IT-Infrastruktur empfangen wurden;
  • Datenvisualisierung basierend auf der Analyse in DX-Dashboards;
  • Rückschlüsse auf die Verfügbarkeit von Diensten basierend auf der Analyse der Daten aus den Protokollen.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Die Sammlung von Protokollen mithilfe einer agentenlosen Methode wird vom System für Windows-Ereignisprotokolle und Syslog durchgeführt. Agentenbasierte Methode zum Sammeln von Textprotokollen.

Automatisierte Notfalllösungsfunktion (Behebung)

Mit automatisierten Maßnahmen zur Behebung des Notfalls (Remediation Workflow) können Sie Probleme lösen, die zur Entstehung eines Ereignisses in DX OI geführt haben. Wenn beispielsweise ein CPU-Auslastungsproblem einen Alarm auslöst, löst der Remediation Workflow das Problem, indem er den Server neu startet, auf dem das Problem auftritt. Durch die Integration zwischen DX OI und dem Automatisierungssystem können Behebungsprozesse über die Ereigniskonsole in DX Operational Intelligence ausgelöst und in der Konsole des Automatisierungssystems verfolgt werden.

Nach der Integration in ein Automatisierungssystem können Sie in der DX OI-Konsole im Kontext eines Alarms automatische Aktionen zur Behebung von Notfällen auslösen. Sie können empfohlene Maßnahmen zusammen mit Informationen zu Konfidenzprozentsätzen (der Wahrscheinlichkeit, dass die Situation durch Ergreifen der Maßnahme gelöst wird) anzeigen.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Wenn zunächst keine Statistiken zu den Ergebnissen des Behebungsworkflows vorliegen, schlägt die Empfehlungsmaschine Kandidaten basierend auf Schlüsselwortsuchen vor, dann werden die Ergebnisse des maschinellen Lernens verwendet und die Maschine beginnt, eine heuristikbasierte Behebungstechnik zu empfehlen. Sobald Sie beginnen, die Ergebnisse der erhaltenen Hinweise auszuwerten, wird sich die Genauigkeit der Empfehlungen verbessern.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Ein Beispiel für Benutzerfeedback: Der Benutzer entscheidet, ob ihm die vorgeschlagene Aktion gefällt oder nicht, und das System berücksichtigt diese Wahl bei der Abgabe weiterer Empfehlungen. Gefällt/nicht gefällt:

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Die empfohlenen Korrekturmaßnahmen für einen bestimmten Alarm basieren auf einer Kombination von Rückmeldungen, die bestimmen, ob die Maßnahme akzeptabel ist. DX OI verfügt über eine gebrauchsfertige Integration mit Automic Automation.

Integration von DX OI mit Drittsystemen

Wir werden nicht weiter auf die Integration von Daten aus nativen Broadcom-Überwachungsprodukten (DX NetOps, DX Infrastructure Management, DX Application Performance Management) eingehen. Schauen wir uns stattdessen an, wie Daten von Drittanbietersystemen integriert werden, und betrachten wir ein Beispiel für die Integration mit einem der beliebtesten Systeme – Zabbix.

Für die Integration mit Drittsystemen wird die Komponente DX Gateway verwendet. DX Gateway besteht aus drei Komponenten: On-Prem Gateway, RESTmon und Log Collector (Logstash). Sie können alle drei Komponenten installieren oder nur die, die Sie benötigen, indem Sie bei der Installation von DX Gateway die allgemeine Konfigurationsdatei ändern. Die folgende Abbildung zeigt die DX-Gateway-Architektur.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Betrachten wir den Zweck der DX-Gateway-Komponenten separat.

On-Prem-Gateway. Dabei handelt es sich um eine Schnittstelle, die Alarme von der DX-Plattform sammelt und Alarmereignisse an Drittsysteme sendet. Das On-Prem Gateway fungiert als Poller, der mithilfe der HTTPS-Anforderungs-API regelmäßig Ereignisdaten vom DX OI sammelt und dann Warnungen an einen Drittanbieterserver sendet, der über Webhooks in die DX-Plattform integriert ist.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

DX-Protokollsammler empfängt Syslog von Netzwerkgeräten oder Servern und lädt sie auf OI hoch. Mit DX Log Collector können Sie die Software, die die Nachrichten generiert, das System, das sie speichert, und die Software, die sie meldet und analysiert, trennen. Jede Nachricht ist mit einem Objektcode versehen, der die Art der Software angibt, die die Nachricht generiert, und ihr wird ein Schweregrad zugewiesen. In DX Dashboards kann das alles dann eingesehen werden.

DX RESTmon Integriert sich über die REST-API in Produkte/Dienste von Drittanbietern und übergibt Daten an OI. Die folgende Abbildung zeigt die Funktionsweise von DX RESTmon am Beispiel der Integration mit Solarwinds- und SCOM-Überwachungssystemen.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Hauptmerkmale von DX RESTmon:

  • Stellen Sie eine Verbindung zu einer beliebigen Datenquelle eines Drittanbieters her, um Daten zu empfangen:
    • PULL: Verbinden und Abrufen von Daten von öffentlichen REST-APIs;
    • PUSH: Datenfluss zu RESTmon über REST.
  • Unterstützung für JSON- und XML-Formate;
  • Erhalten Sie Metriken, Warnungen, Gruppen, Topologie, Inventar und Protokolle;
  • Vorgefertigte Konnektoren für verschiedene Tools/Technologien; es ist auch möglich, einen Konnektor zu einer beliebigen Quelle mit einer offenen API zu entwickeln (Liste der Box-Konnektoren in der Abbildung unten);
  • Unterstützung für Basisauthentifizierung (Standard) beim Zugriff auf die Swagger-Schnittstelle und -API;
  • HTTPS-Unterstützung (Standard) für alle ein- und ausgehenden Nachrichten;
  • Unterstützung für eingehende und ausgehende Proxys;
  • Leistungsstarke Textanalysefunktionen für über REST empfangene Protokolle;
  • Anpassbares Parsing mit RESTmon für effizientes Parsen und Visualisieren von Protokollen;
  • Unterstützung für das Extrahieren von Informationen über Gerätegruppen aus Überwachungsanwendungen und das Herunterladen in OI zur Analyse und Visualisierung;
  • Unterstützung für den Abgleich regulärer Ausdrücke. Dies kann verwendet werden, um über REST empfangene Protokollnachrichten zu analysieren und abzugleichen sowie um Ereignisse basierend auf bestimmten regulären Ausdrucksbedingungen zu generieren oder zu schließen.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Schauen wir uns nun den Prozess der Einrichtung der DX OI-Integration mit Zabbix über DX RESTmon an. Die Boxed-Integration übernimmt die folgenden Daten von Zabbix:

  • Inventurdaten;
  • Topologie;
  • Probleme;
  • Metriken.

Da der Konnektor für Zabbix sofort verfügbar ist, müssen Sie zum Einrichten der Integration lediglich das Profil mit der IP-Adresse und dem Konto der Zabbix-Server-API aktualisieren und das Profil dann über die Swagger-Weboberfläche hochladen . Ein Beispiel finden Sie in den nächsten beiden Abbildungen.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Nach der Konfiguration der Integration stehen die oben beschriebenen DX OI-Analysefunktionen für Daten von Zabbix zur Verfügung, nämlich: Alarm Analytics, Performance Analytics, Predictive Insights, Service Analytics und Remediation. Die folgende Abbildung zeigt ein Beispiel für die Analyse von Leistungsmetriken für aus Zabbix integrierte Objekte.

Umbrella-Überwachungssystem und Ressourcen-Service-Modelle im aktualisierten DX Operations Intelligence von Broadcom (ex. CA)

Abschluss

DX OI ist ein hochmodernes Analysetool, das IT-Abteilungen eine erhebliche betriebliche Effizienz bietet und es Ihnen ermöglicht, schnellere und korrektere Entscheidungen zu treffen, um die Qualität von IT-Services und Geschäftsservices durch domänenübergreifende Kontextanalysen zu verbessern. Für Anwendungseigentümer und Geschäftseinheiten berechnet DX OI die Verfügbarkeit und Servicequalität nicht nur im Kontext von IT-Technologiemetriken, sondern auch von Geschäfts-KPIs, die aus Transaktionsstatistiken der Endbenutzer abgeleitet werden.

Wenn Sie mehr über diese Lösung erfahren möchten, bewerben Sie sich bitte für eine Demo oder ein Pilotprojekt auf eine für Sie bequeme Weise auf unserer Website.

Source: habr.com

Kommentar hinzufügen