Fünf Best Practices von IT-Dienstleister Consol für eine erfolgreiche kontextbasierte Fehlerquellenanalyse

München, 20. Juni 2022 – Die Nutzung von Cloud, Containern und Microservices hat die Anwendungslandschaft deutlich komplexer gemacht. Klassisches Monitoring zur Überwachung von einzelnen Systemen genügt daher nicht mehr. Besser eignet sich Observability, die Logging, Tracing und Monitoring zentral in sich vereint. Für eine erfolgreiche kontextbasierte Fehlerquellenanalyse sollten Unternehmen die fünf Best Practices von IT-Dienstleister Consol berücksichtigen.

Tritt in einem IT-System ein Fehler auf, alarmiert klassisches Monitoring die Administratoren. Gut implementiert zeigt es, wo es brennt und was genau nicht mehr funktioniert. Für die Beantwortung der Frage nach dem Warum brauchen Administratoren allerdings einen tieferen, ganzheitlichen Einblick in die Systeme und Microservices. Monitoring stützt sich in diesem Zusammenhang insbesondere auf die Überwachung von möglichen Problemen, die der Betrieb vorhersehen muss. Darauf basierend muss die Operations-Abteilung dann ihre Dashboards konfigurieren. Bei einer Observability-Strategie hingegen erhält der Betrieb Daten aus dem gesamten System. So können Administratoren flexibel analysieren, was in all den miteinander verknüpften Umgebungen vor sich geht und wo der wahre Grund für Fehler liegt. Da die Überwachung von hochkomplexen Systemen selbst nicht ganz einfach ist, hat IT-Dienstleister Consol die folgenden fünf Best Practices definiert, nach denen Unternehmen ihre Observability-Strategie ausrichten sollten.

1. Die Zielgruppen im Blick behalten
Logs sind nur dann wirklich hilfreich, wenn ihre Inhalte auf die Zielgruppe ausgerichtet sind. Beim Logging gibt es drei relevante Zielgruppen: Betrieb, Entwickler und die Fachbereiche. Im Kontext der Observability bedeutet zielgruppengerechtes Logging also, dass die Logs genau die Informationen enthalten müssen, die für Wartung und Betrieb von Anwendungen relevant sind. Während Entwickler beispielsweise in ihren Logs haargenau sehen wollen, in welcher Code-Zeile ein Fehler auftritt, ist es für Administratoren wichtiger zu erfahren, welche Auswirkungen er auf andere Systemteile hat. Fachbereiche hingegen interessieren sich vor allem dafür, wie die geschäftlichen Use Cases laufen und ob es dort Probleme gibt.

2. Den Kosten-Nutzen-Faktor abwägen
Umfangreiches Logging ist die Basis für erfolgreiche Observability. Dennoch kann weniger manchmal mehr sein, insbesondere bei der Abwägung des Kosten-Nutzen-Faktors. Das Sammeln von Daten ist gerade im Cloud-Kontext ein großer Kostenfaktor: Nicht nur die Speicherung ist teuer, zu Buche schlagen zudem Netzwerk-Traffic und Konfigurationsaufwand. Auch die Wartung und Aktualisierung der Logging-Infrastruktur verursacht durch hohen Personalaufwand Kosten. Unternehmen sollten daher nur die Daten sammeln, die für ihre Zwecke wirklich notwendig sind.

3. Langfristiges und holistisches Monitoring betreiben
Gutes Monitoring als Teil einer Observability-Strategie geht weit über die Beobachtung technischer Standardmetriken wie Prozessorlast oder Arbeitsspeicherbedarf hinaus. Fachliche Metriken, etwa wie lange das Rendern von Komponenten auf einer Webseite dauert, müssen Unternehmen individuell und je nach Anwendungsfall selbst definieren. Darüber hinaus ist Monitoring erst dann wirklich effektiv, wenn es langfristig angelegt ist. Unternehmen sollten etwa nach jedem Software-Release oder der Implementierung neuer Features genau hinschauen, wie und ob sich die Performance und Gesundheit des Systems verändert haben. Voraussetzung dafür ist, entsprechende Logs in Form einer Monitoring-Historie vorrätig zu haben.

4. Gutes Alerting definieren
Zur holistischen Observability-Strategie gehört auch die Definition von Alerting-Regeln. Das Monitoring versorgt Administratoren mit Informationen über das System in Echtzeit, sodass sie jederzeit nachschauen können, ob alles in Ordnung ist. Weniger zeitraubend ist es, wenn das System eigenständig Alarm schlägt, zum Beispiel sobald innerhalb von fünf Minuten ein gewisser Prozentsatz von Zugriffen auf eine Anwendung Fehler aufweist. Dann können die Verantwortlichen gezielt prüfen, was nicht stimmt und wo ein Eingreifen nötig ist. Voraussetzung dafür sind geeignete Metriken, die die Applikation bereitstellt. Dazu gehören neben technischen auch fachliche Metriken, die individuell die Business Use Cases überwachbar machen, für die das System verantwortlich ist.

5. Offene Standards nutzen
Open-Source-Software (OSS) setzt sich auch im professionellen IT-Umfeld immer mehr als lukrative Alternative zu proprietären Varianten durch. Gerade im DevOps-Bereich sind Open-Source-Tools wie Prometheus (Monitoring und Alerting), Jaeger (Tracing), Logstash (Logging) und Kibana (Visualisierung) weit verbreitet. Die meisten von ihnen setzen auf offene Standards wie OpenMetrics, OpenTracing und OpenTelemetry. Die Vorteile von OSS und offenen Standards sind ihre Vielseitigkeit, die große Innovationskraft der Community sowie die hohe Kompatibilität und Anpassbarkeit.

„Observability ist heute nicht mehr Kür, sondern eindeutig Pflicht“, betont Lutz Keller, Leiter DevOps bei Consol. „Cloud, Microservices und Container-Technologie machen eine intelligente und holistische Überwachungsstrategie für IT-Systeme dringend nötig. Mittlerweile sind auch Machine Learning und künstliche Intelligenz in der DevOps-Welt angekommen, die wiederkehrende Tätigkeiten übernehmen können. Sogenanntes AIOps wird in Zukunft spannende neue Anwendungsmöglichkeiten eröffnen und Administratoren entlasten.“

Wer einen noch tieferen Einblick in das Thema Observability erhalten möchte, der sollte am 23. Juni den Webcast von Consol mit dem Thema „The Observability of Quarkus Applications“ besuchen. Weitere Informationen dazu gibt es unter https://www.consol.de/aktuelles/webcast-observability/.

Download der Presseinformation

Zurück News & Events

Name	Zweck	Ablauf	Dienst
CookieConsent	Cookie Opt-In Status.	1 Jahr	Website
fe_typo_user	Session für unser Content-Management-System.	Session	Website
_pk_id	Matomo ID.	13 Monate	Matomo
_pk_ref	Matomo Referrer.	6 Monate	Matomo
_pk_ses	Matomo Session.	30 Minuten	Matomo

Name	Zweck	Ablauf	Dienst
_ga	Google ID des Benutzers.	2 Jahre	Google
_gat	Verwendet zum Drosseln der Anfragerate in Richtung Google.	1 Tag	Google
_gid	Google ID des Benutzers.	1 Tag	Google
_ga_--container-id--	Aktueller Session-Status.	2 Jahre	Google
UserMatchHistory	Mit diesem Cookie werden die IDs von LinkedIn Ads synchronisiert.	30 Tage	LinkedIn
AnalyticsSyncHistory	Mit diesem Cookie wird der Zeitpunkt der Synchronisierung mit dem Cookie "lms_analytics" bei Nutzer:innen in den designierten Ländern gespeichert.	30 Tage	LinkedIn
li_oatml	Mit diesem Cookie werden LinkedIn Mitglieder außerhalb von LinkedIn zu Werbe- und Analysezwecke außerhalb der designierten Länder und für begrenzte Zeit auch für Werbezwecke in den designierten Ländern identifiziert.	30 Session	LinkedIn
lms_ads	Mit diesem Cookie werden LinkedIn Mitglieder außerhalb von LinkedIn in den designierten Ländern zu Werbezwecken identifiziert.	30 Tage	LinkedIn
lms_analytics	Mit diesem Cookie werden LinkedIn Mitglieder in den designierten Ländern zu Analysezwecken identifiziert.	30 Tage	LinkedIn
li_fat_id	Bei diesem Cookie handelt es sich um eine indirekte Mitgliederkennung, die für Conversion-Tracking, Retargeting und Analysen verwendet wird.	30 Tage	LinkedIn
li_sugr	Mit diesem Cookie werden wahrscheinlichkeitstheoretische Übereinstimmungen der Identität eines Nutzers außerhalb der designierten Länder festgestellt.	90 Tage	LinkedIn
U	Bei diesem Cookie handelt es sich um eine Browserkennung für Nutzer außerhalb der designierten Länder.	3 Monate	LinkedIn
_guid	Mit diesem Cookie wird ein LinkedIn Mitglied für Werbung über Google Ads identifiziert.	90 Tage	LinkedIn
BizographicsOptOut	Mit diesem Cookie wird der Ablehnungsstatus für das Tracking durch Drittanbieter ermittelt.	10 Jahre	LinkedIn
li_giant	Indirekte Kennung für Gruppen von LinkedIn Mitgliedern, die für das Conversion-Tracking verwendet wird	7 Tage	LinkedIn
poptin_d_a_x_v_26e98d74588a8	Alle paar Tage einmal angezeigt.	1 Jahre	Poptin
poptin_o_a_d_26e98d74588a8	Poptin einmal am Tag.	1 Tage	Poptin
poptin_o_a_v_9296a6dd8d5a5	Poptin einmal pro Besuch.	30 Minuten	Poptin
poptin_o_v_9296a6dd8d5a5	Zur Zählung der monatlichen Besucher.	30 Minuten	Poptin
poptin_c_p_o_x_c_9c53b8d57bfa6	Nach Klick auf den X Button.	1 Tage	Poptin
poptin_old_user	Zum Identifizieren eines alten Besuchers.	2 Tag	Poptin
poptin_new_user	Zum Identifizieren eines neuen Besuchers.	Session	Poptin
poptin_referrer	Original referrer.	5 Minuten	Poptin
poptin_user_country_code	Ländercode des Benutzers speichern.	1 Jahre	Poptin
poptin_user_id	Einzigartige Besucher id.	1 Jahre	Poptin
poptin_user_ip	Speichert die IP Adresse des Benutzers.	1 Jahre	Poptin
poptin_conversion_70909792ed454	Nach einer Poptin Conversion.	1 Jahre	Poptin
poptin_session	Poptin-Sitzung für Poptin-Anzeigeeinstellungen.	30 Minuten	Poptin
laravel_session	Sicherheitszweck.	2 Stunden	Poptin
XSRF-TOKEN	Sicherheitszweck.	2 Stunden	Poptin
poptin_session_account_fad535548c123	Zählt Besucher pro Unterkonto.	Session	Poptin
poptin_session_account_time	Zeitverzögerungsauslöser auf der Website.	Session	Poptin
poptin_c_visitor	Besucherzahl pro Kunde (gesamtes Konto).	Session	Poptin
poptin_c_new_visitor	Besucherzahl pro Kunde (gesamtes Konto).	30 Tage	Poptin

Innovative Produktlösungen - mit Open Source

Exzellente Lösungskompetenz - dank starker Partner

Observability ist mehr als reines Monitoring

Portfolio

Unternehmen

Service

IT Consulting & Design

Build & Operate

Innovate & Empower

Innovative Produktlösungen - mit Open Source

Openshift-Beratung

Open Source Monitoring

Integration-Testing

Exzellente Lösungskompetenz - dank starker Partner

Observability ist mehr als reines Monitoring

Portfolio

Unternehmen

Service