Überwachung und Observability: Unterschiede verstehen

Die Komplexität moderner Systeme und Anwendungen hat erheblich zugenommen.

In the System Control Data Center Technician Operates Multiple

Cristina De Luca -

Dezember 05, 2022

Die Komplexität moderner Systeme und Anwendungen hat erheblich zugenommen. Deshalb war auch der Bedarf an Methoden zur Fehlersuche und Problemdiagnose noch nie so groß wie heute – insbesondere bei verteilten Systemen.

Um mit vorhersehbaren Fehlern umzugehen, kamen in der Vergangenheit vor allem das Monitoring und Tests zum Einsatz. Bei unvorhersehbaren Zwischenfällen ist dieser Ansatz jedoch weniger praktikabel. Hier kommt laut Angabe der Analysten von Thundra die Observability ins Spiel. Diese hat ihre Wurzeln in der Kontrolltheorie, die sich damit befasst, wie gut man den internen Zustand eines Systems anhand seiner Outputs erkennen kann.

Da das Konzept ist noch sehr neu ist, scheinen die Grenzen zum Monitoring bisher nicht genau definiert zu sein. Dies gilt insbesondere, weil immer mehr Überwachungswerkzeuge auch Funktionen für die Beobachtung enthalten.

Was bedeutet Monitoring?

Viele sehen in der Überwachung ein unverzichtbares Werkzeug für den Aufbau, den Betrieb und die Ausführung von Systemen.

In der Praxis ermöglicht das Monitoring die Beobachtung und das Verständnis des Systemzustands anhand einer vordefinierten Reihe von Metriken und Protokollen. Die Überwachung muss dabei vor allem zwei Fragen beantworten: Was ist defekt? Warum ist der Defekt aufgetreten? Die erste Frage dreht sich dabei vor allem um die Symptome, während die Frage nach dem „Warum“ die Ursache der Probleme betrifft. Ein gutes Verständnis der Unterscheidung zwischen „was“ und „warum“ ermöglicht die effektive Überwachung von verteilten Systemen – mit minimalem Rauschen und maximalem Signal, wie Mark Burgess in einem Buch von O’Reilly Media erklärt.

Das Monitoring macht die Systeme zwar nicht immun gegen Ausfälle, sollte aber einen einigermaßen guten Überblick über deren Integrität liefern. Um diese zu gewährleisten, muss jedoch geklärt werden, welche Erwartungen und Messwerte zu erreichen sind.

Kombiniert man die Überwachung mit Warnmeldungen, kann das System außerdem Informationen darüber liefern, wo Defekte vorliegen oder in der Zukunft drohen. Anhand dieser Daten lassen sich nicht nur Infrastruktur und Anwendungen in ihrem Verhalten verstehen, sondern auch Probleme erkennen und schnell beheben, bevor Benutzer davon betroffen sind. Und auch wenn die Überwachungsdaten nicht direkt Warnmeldungen generieren, sollten sie über Dashboards einen Überblick über das Verhalten und die Leistung eines Systems geben.

Allerdings kann die Überwachung auf diese Weise sehr komplex werden. Deshalb ist es immer ratsam, das Überwachungssystem so einfach wie möglich zu gestalten.

Was bedeutet Observability?

Observability ist laut Cisco ein Prozess, bei dem Software-Tools eingesetzt werden, um Probleme zu erkennen. Dafür erfolgt sowohl eine Untersuchung der Inputs (Anwendung und Infrastruktur) als auch der Outputs (Geschäftstransaktionen, Benutzererfahrungen und Anwendungsleistung) des Technologie-Stacks.

Observability-Tools sammeln und analysieren ein breites Spektrum an Daten, um Probleme zu beheben, bevor sie sich auf Business-KPIs auswirken. Unter die Daten fallen nicht nur Zustand und Leistung von Anwendungen, sondern auch Geschäftsmetriken (z. B. Konversionsraten), die Zuordnung von Benutzererfahrungen oder Infrastruktur- und Netzwerk-Telemetrie.

Die Nachfrage nach Observability-Tools wird dabei durch mehrere Faktoren ausgelöst. Diese gehen auf den wachsenden Wunsch nach digitalen Diensten sowie die zunehmende Komplexität von IT-Systemen und -Anwendungen zurück.

Zu den Einfluss-Faktoren gehören:

die wachsende Zahl von Anwendungen, die Unternehmen verwalten müssen
die hohen Erwartungen der Benutzer
regelmäßige Upgrades von Anwendungen zur Verkürzung der Release- und Update-Zyklen
die zunehmende Notwendigkeit, traditionelle und Cloud-native Anwendungen zu nutzen
die häufigere Nutzung von Cloud-Diensten und die Verwendung von Third-Party-APIs

Vor allem aber Gewinnt die Observability an Aufmerksamkeit, weil sie es Entwicklern ermöglicht, das Niveau der Kundenerfahrung ihrer Software zu erhöhen. Diese wird meist stark durch die zunehmende Komplexität digitaler Unternehmen und das Aufkommen neuer Technologien wie Cloud-Native Computing, DevOps, Microservices und Container-Virtualisierung beeinträchtig.

Die Nutzung von Observability bietet dabei immense Vorteile für Unternehmen: von schnellerer Innovation und Implementierung, weniger Trägheit und geringeren Kosten bis zu einem besseren Verständnis dafür, wie sich Zeit und Aufmerksamkeit innerhalb von Anwendungen effektiv verteilen lassen.

Metriken, Vorfälle, Tracking und Protokolle sind wichtige Grundlagen für die Observability. Indem man sie analysiert, kann man schneller Erkenntnisse über den System-Zustand ableiten und Fehler verstehen. Sobald diese Daten also aggregiert sind, werden verdächtige Aktivitäten analysiert und überwacht.

Häufig liefert die Observability deshalb auch Erkenntnisse, die bei der Überwachung helfen.

Schlussfolgerung

Es ist nicht sinnvoll, die Beziehung zwischen Observability und Überwachung als gegenüberstellendes Konzept zu verstehen. Denn Observability ist weder ein Ersatz für das Monitoring, noch wird es dadurch überflüssig. Vielmehr unterstützen sich die beiden Konzepte gegenseitig.

Obwohl sie unterschiedlichen Zwecken dienen, werden beide Techniken jedoch zunehmend als symbiotisch und nicht als Entweder-oder-Lösung betrachtet – denn gerade wenn sie zusammenarbeiten, sind sie deutlich effizienter.