AIOps: Integrierte Überwachung ist die wichtigste Funktion

monitors in control room
Cristina De Luca -

August 09, 2023

Die Komplexität von IT-Systemen und das anhaltende, exponentielle Wachstum von Überwachungsdaten haben die Verbesserung von Geschäftseinblicken durch Artificial Intelligence for IT Operations (AIOps) vorangetrieben. Das Unternehmen Gartner, das für Entwicklungsanalysen in der IT bekannt ist, definiert diesen Vorgang als Nutzung von Big Data und maschinellem Lernen zur Automatisierung von IT-Betriebsprozessen. Dazu gehören die Ereigniskorrelation, die Erkennung von Anomalien, Leistungsanalysen und die laufende Automatisierung von Workflows.

Allein nach den Berechnungen von Research and Markets handelt es sich um einen globalen Markt, der von 5,82 Mrd. US-Dollar im Jahr 2022 auf 7,4 Mrd. US-Dollar im Jahr 2023 wachsen soll – mit einer jährlichen Wachstumsrate (CAGR) von 27,1 %. Weiteren Prognosen zufolge erreicht der Markt bis 2027 ein geschätztes Volumen von 19,79 Mrd. US-Dollar.

Die Zukunft der IT wird also sehr stark auf AIOps und die damit verbundene Fähigkeit ausgerichtet sein, die Betriebskosten zu senken und eine höhere Servicequalität zu gewährleisten. Das erhöht sowohl die externe als auch die interne Kundenzufriedenheit. Denn es trägt dazu bei, Ausfallzeiten merklich zu reduzieren.

Wie beginnt man mit der Implementierung von AIOps?

Für die Implementierung von AIOps existiert kein Patentrezept. Es gibt allerdings einige grundlegende Aspekte zu beachten. IBM arbeitet beispielsweise mit drei Faktoren: Beobachtbarkeit, vorausschauende Analysen und proaktive Reaktion.

Die Beobachtbarkeit bezieht sich auf die Sammlung, Aggregation und Analyse von Betriebsdaten, die durch die Überwachung erzeugt werden. Integrierte Überwachung gilt als Grundlage für die Entwicklung von AIOps: Sie wurde von fast 55 % der Befragten in einer kürzlich durchgeführten OpsRamp-Studie als wichtigstes Merkmal einer AIOps-Lösung genannt. Überwachungstools sind also nach wie vor die beste Methode, um Leistungsprobleme oder IT-Ausfälle zu identifizieren. In diesem Fall hat die Studie auch gezeigt, dass Unternehmen mit der Verbreitung von Tools besser umgehen können: Mehr als die Hälfte der Befragten (56,5 %) besitzt weniger als zehn Überwachungstools. Ein Drittel der Unternehmen verwendet jedoch zehn bis 19 Tools – und weitere 10 % nutzen mehr als 20.

monitoring.jpg" alt="Das Diagramm von OpsRamp zeigt: Bereichsbezogene IT-Infrastruktur-Überwachungstools sind nach wie vor das Mittel der Wahl, um Leistungsprobleme oder IT-Ausfälle zu erkennen." class="wp-image-12296" width="759" height="440" srcset="https://network-king.net/wp-content/uploads/2023/08/monitoring.jpg 1518w, https://network-king.net/wp-content/uploads/2023/08/monitoring-300x174.jpg 300w, https://network-king.net/wp-content/uploads/2023/08/monitoring-1024x594.jpg 1024w, https://network-king.net/wp-content/uploads/2023/08/monitoring-768x445.jpg 768w" sizes="(max-width: 759px) 100vw, 759px">
Quelle: OpsRamp

Ein Teil der hinzugefügten KI-Lösungen hat die Aufgabe, Daten zu analysieren und Korrelationen herzustellen. So erhalten Anwender ein genaueres Verständnis, was der Grundidee des AIOps-Konzepts entspricht.

Predictive Analytics ermöglicht es IT-Experten zudem, die Kontrolle über komplexe Prozesse zu behalten und die Leistung des IT-Betriebs sicherzustellen. Beispiele für Predictive-Analytics-Praktiken sind die Erkennung von Anomalien, Warnungen, Empfehlungen und die Optimierung der IT-Leistung.

Von dort aus kommen KI-Lösungen für die Datenanalyse und -korrelation zum Einsatz. Denn das Ziel ist es, proaktiv auf unerwartete Ereignisse, wie Ausfälle oder Verlangsamungen, zu reagieren. Gleichzeitig soll die Leistung der IT-Infrastruktur aufrechterhalten, Ressourcen geplant, terminiert und zugewiesen werden. Schließlich können prädiktive Algorithmen Muster sowie Trends in Leistungskennzahlen erkennen und so Probleme nicht nur vorhersagen, sondern auch verhindern – bevor sie entstehen.

Darüber hinaus integriert AIOps mehrere unterschiedliche IT-Betriebstools mit manuellen Funktionen in eine einzige intelligente sowie automatisierte IT-Betriebsplattform. Das ermöglicht den IT-Teams, schnell und vorausschauend auf Verlangsamungen oder Störungen zu reagieren – mit wesentlich geringerem Aufwand.

Laut der OpsRamp-Studie, die im Dezember 2022 durchgeführt wurde, setzen bereits mehr als 60 % der 265 befragten C-Levels AIOps ein, um die Verfügbarkeit und Leistung von Diensten sowie Anwendungen zu verbessern. An zweiter und dritter Stelle stehen die Betriebsautomatisierung (58 %) und die Prozesse (54 %).

Die größte Herausforderung für den IT-Betrieb im Jahr 2023 ist die Automatisierung möglichst vieler Vorgänge: 66 % der Befragten gaben hierfür ihre Stimme ab. Allerdings nannte nur die Hälfte der Umfrageteilnehmer (52 %) die Automatisierung lästiger Aufgaben als wichtigsten betrieblichen Nutzen von AIOps. Somit steht der Punkt noch hinter der Reduzierung offener Incident-Tickets (65 %) und der Reduzierung von MTTD sowie MTTR (56 %).

Verbesserungen bei der Automatisierung sind daher eindeutig das Hauptanliegen der Unternehmen im Jahr 2023.

Diagramm von OpsRamp zur Auswertung der Frage: „Was sind die treibenden Faktoren für die Einführung von AIOps?“
Quelle: OpsRamp

Vorteile

AIOps haben einen entscheidenden Vorteil: Die Methode ermöglicht IT-Teams, Verlangsamungen und Ausfälle schneller zu erkennen, anzugehen und zu beheben, als dies durch manuelle Systeme möglich wäre – wie beispielsweise die Bearbeitung von Warnmeldungen aus verschiedenen IT-Betriebstools. Das führt zu folgenden Ergebnissen:

  • Kürzere Mean-Time-To-Repair (MTTR): AIOps kann Ursachen schneller und präziser identifizieren und Lösungen vorschlagen, indem es Alarme aus dem IT-Betrieb differenziert. Dazu trägt auch die Korrelation von Betriebsdaten aus verschiedenen IT-Umgebungen bei. Diese Funktionen ermöglichen Unternehmen, bisher undenkbare MTTR-Ziele zu setzen und zu erreichen.

  • Geringere Betriebskosten: Die automatische Erkennung von Betriebsproblemen und die Neuplanung von Reaktionsabläufen senken die Betriebskosten, sodass sich die Ressourcen angemessener zuweisen lassen. Dadurch werden auch Personalressourcen für innovativere und komplexere Aktivitäten freigesetzt, was zu einer verbesserten Mitarbeitererfahrung führt.

  • Mehr Beobachtungsmöglichkeiten und bessere Zusammenarbeit: Die in AIOps-Überwachungstools verfügbare Integration ermöglicht eine effektivere Zusammenarbeit zwischen DevOps-Teams, ITOps, Management und Sicherheitsfunktionen. Denn dank der verbesserten Sichtbarkeit, Kommunikation und Transparenz können solche Teams bessere Entscheidungen treffen und schneller auf Probleme reagieren.

  • Wechsel von reaktivem zu proaktivem, vorausschauendem Management: Mit den integrierten Funktionen zur prädiktiven Datenanalyse lernt AIOps kontinuierlich, die dringendsten Warnungen zu identifizieren und zu priorisieren. IT-Teams können so potenzielle Probleme bewältigen, bevor sie zu Verzögerungen und Ausfallzeiten führen.

Aus all diesen Gründen schließt der AIOps-Ansatz die Lücke zwischen zwei Punkten: die zunehmend komplexe, dynamische sowie schwer zu überwachende IT-Landschaft – und die Erwartungen der Benutzer, die eine geringe oder gar keine Beeinträchtigung der Anwendungsleistung und -verfügbarkeit voraussetzen.

Worauf Sie bei der Auswahl des Anbieters achten sollten

Die meisten Experten halten AIOps für die Zukunft des IT-Betriebsmanagements: Da sich Unternehmen zunehmend auf Initiativen zur digitalen Transformation konzentrieren, wächst die Nachfrage stetig. Ausschlaggebend ist unter anderem die Weltwirtschaft, die an mehreren Fronten mit Gegenwind zu kämpfen hat – darunter Probleme wie die Inflation, Lebenshaltungskostenkrise, höhere Zinssätze und der Krieg in der Ukraine. Deshalb fokussieren sich 2023 viele Unternehmen auf die Verbesserung der IT-Effizienz sowie Automatisierung.

Diese Organisationen werden die Hilfe von Dienstleistern benötigen, um ihre IT-Infrastruktur reibungslos am Laufen zu halten. Darauf sollten AIOps-Kunden bei den verschiedenen Anbietern achten:

  • Effizienz: Unternehmen, die tiefe Echtzeiteinblicke mit Autokorrekturfunktionen über Technologie-Stacks von Mainframe bis Mobile hinweg anstreben, können sich keine Mängel bei einer der verschiedenen AIOps-Funktionen leisten. Erhebliche Defizite bei nur wenigen Features können eine AIOps-Lösung einschränken und teure Integrationen mit regelmäßigen Wartungen erfordern. Starke systemeigene Funktionen ermöglichen eine geringere technologische Verschuldung, während eine umfangreiche Bibliothek von Standardkonnektoren (OOTB) von Drittanbietern die Kosten für maßgeschneiderte Integrationen reduziert.

  • Bereitstellung von transparenten und zuverlässigen automatischen Abhilfemaßnahmen: Automatisierte Abhilfemaßnahmen werden weitgehend durch mangelndes Vertrauen der Firmenkunden und Zweifel an der Transparenz der Anbieterlösungen eingeschränkt. Unternehmen setzen erfolgreich Lösungen ein, um einfache, sich wiederholende betriebliche Aufgaben sowie Korrekturen zu automatisieren. Zuverlässigkeitstests von Aktionen gehen allerdings nur langsam voran. Ein tieferes Verständnis dafür, wie KI/ML-Maschinen sensorische und telemetrische Daten nutzen, wird dazu beitragen, die Akzeptanz dieser Funktionen zu erhöhen. Zudem müssen die Lösungen noch stärker daran arbeiten, Ängste zu beseitigen. Dazu gehört auch die Offenlegung darüber, wie sie Automatisierungsentscheidungen treffen und worauf sie diese stützen. So ließe sich das Vertrauen in die autonome Ausführung gewinnen, was den Weg für die Übernahme ebnet.

  • Einblicke vom Anfang bis zum Ende einer Transaktion: Es reicht nicht mehr aus, Dienste allein auf der Grundlage der technologischen Infrastruktur abzubilden. Denn um wirklich Verbesserungen in der Benutzererfahrung zu ermöglichen, die Mean-Time-To-Repair (MTTR) sowie die mittlere Identifikationszeit (MTTI) zu verkürzen und letztendlich das Wachstum des Unternehmens zu ermöglichen, müssen die Bemühungen mit Fokus auf die Benutzererfahrung beginnen. Die Identifizierung von Serviceverschlechterungen oder -ausfällen sollte aus der Perspektive der Benutzer erfolgen – und nicht nur aus der der Infrastruktur. Geschäftskontext und -zyklen, Nutzungsmuster und historische Trends sind wichtige Datenelemente, um mögliche negative Auswirkungen auf die Benutzererfahrung proaktiv anzugehen. Lösungen müssen auf diese Daten in Echtzeit reagieren und die Elemente den Architektur-, Entwicklungs- sowie Designteams für zentrale Systemverbesserungen zur Verfügung stellen.

Weitere wichtige Ergebnisse der OpsRamp-Studie

  • Die Zuordnung von Abhängigkeiten zwischen Anwendungen und Infrastruktur ist die größte Herausforderung für das Incident Management in Unternehmen – das bestätigen 64 % der Studienteilnehmer.

  • Die intelligente Alarmierung ist für 70 % der befragten Unternehmen der wichtigste Anwendungsfall für AIOps.

  • Die überwiegende Mehrheit der AIOps-Implementierungen – mehr als 80 % – dauert sechs Monate oder weniger.

  • Die größte Sorge der Befragten in Bezug auf AIOps ist die Datengenauigkeit, wie 62 % der Unternehmen angeben.

  • AIOps schafft Arbeitsplätze und vernichtet sie nicht, auch wenn Ingenieure mit den richtigen Fähigkeiten für AIOps weiterhin schwer zu finden sind. Nur 36 % der Befragten waren darüber besorgt, dass die Einführung von AIOps zum Verlust von Arbeitsplätzen führen könnte. Währenddessen meinten 68 %, dass es mehr als sechs Monate dauert, Ingenieure mit den richtigen Fähigkeiten für AIOps einzustellen.

„Die Studie zeigt, dass AIOps real ist und für Unternehmen sowie MSPs greifbare Vorteile bietet“, erläutert Suresh Vobbilesetty, Executive Vice President of Engineering bei OpsRamp. „Sie zeigt aber auch, dass die AIOps-Initiativen der Unternehmen noch nicht abgeschlossen sind. Denn sie haben noch einen langen Weg vor sich, bevor sie das volle Potenzial der Technologie ausschöpfen können“, fügte er hinzu.