Direkt zur Hauptnavigation springen Direkt zum Inhalt springen

Siemens AG

17 Jahre zuverlässiges Monitoring für ein Konzernrechenzentrum

4.000 Hosts, 80.000 Services, 24/7-Betrieb. Virtuelle Maschinen, OpenShift-Cluster und Cloud-Services bei AWS – die IT-Landschaft eines Siemens-Konzernrechenzentrums ist komplex und hochdynamisch.

Seit über 17 Jahren unterstützt ConSol die Siemens AG beim Aufbau und der kontinuierlichen Weiterentwicklung der Monitoring- und Observability-Landschaft und trägt damit maßgeblich zur Transparenz und Stabilität des Betriebs bei.

Was diese Zusammenarbeit besonders macht: Kontinuität, technische Exzellenz und eine Monitoring-Plattform, die kontinuierlich mit der IT-Landschaft gewachsen ist. 
  

Von proprietärem Monitoring zu Open Source

Ausgangspunkt der Zusammenarbeit war die Ablösung eines bestehenden proprietären Monitoringsystems durch eine flexible Open-Source-basierte Lösung.

Der entscheidende Knackpunkt dabei war das Logfile-Monitoring. Über viele Jahre hinweg hatten sich zahlreiche Regeln und Pattern angesammelt, mit denen Logdateien ausgewertet wurden. Eine vollständige Neuerstellung dieser Logik hätte erheblichen Migrationsaufwand bedeutet.

ConSol konnte hier auf das Monitoring-Plugin check_logfiles zurückgreifen und erweiterte es gezielt so, dass Siemens seine bestehenden Logfile-Adapter-Konfigurationen praktisch unverändert weiterverwenden konnte. Damit gelang der Umstieg auf eine Open-Source-basierte Monitoringplattform – zunächst mit Nagios, später mit OMD (Open Monitoring Distribution) – ohne aufwendige Neuimplementierung der vorhandenen Monitoringlogik.

Das Ergebnis: deutlich reduzierte Lizenzkosten und gleichzeitig größere Flexibilität.

Von Alarmfluten
zu relevanten Informationen

In großen IT-Landschaften entstehen täglich Tausende Monitoring-Meldungen. Entscheidend ist, dass die richtigen Informationen schnell bei den richtigen Personen ankommen. Dafür entwickelte ConSol das regelbasierte Notification-Gateway Nag2Rem
Die Lösung verarbeitet eingehende Events automatisch, priorisiert sie und ergänzt sie mit zusätzlichen Informationen zu möglichen Ursachen und zuständigen Ansprechpartnern.

Heute werden aus rund 6.000 täglichen Monitoring-Meldungen etwa 300 qualifizierte Alarme, die gezielt an die verantwortlichen Teams weitergeleitet werden.
So erhält das Betriebsteam strukturierte und kontextreiche Informationen statt unübersichtlicher Alarmfluten.
 

Vom Projekt
zum langfristigen Betrieb

Mit der Zeit entwickelte sich die Zusammenarbeit von einzelnen Projekten zu einer langfristigen Betriebspartnerschaft. Ein ConSol-Consultant unterstützte Siemens dauerhaft vor Ort, betreute das Monitoring-System, integrierte neue Kommunikationskanäle und verband Monitoring-Daten mit der CMDB.

So konnte die Plattform kontrolliert mit den steigenden Anforderungen wachsen, ohne Stabilität oder Übersicht zu verlieren.

Monitoring für die Cloud-native Welt

Parallel zur klassischen Serverlandschaft entstand eine moderne containerbasierte Infrastruktur auf OpenShift – sowohl On-premises als auch in Fabriken.
ConSol unterstützt Siemens dabei mit zwei eng verzahnten Teams:

  • Monitoring & Observability
  • OpenShift-Betrieb und Plattformberatung

Für die containerbasierte Umgebung wurde ein moderner Observability-Stack aufgebaut, unter anderem mit:

  • Prometheus für Metriken
  • Alertmanager zur Integration in Nag2Rem
  • VictoriaMetrics für skalierbare Langzeitspeicherung
  • Grafana für Visualisierung und Self-Service-Alerting
  • Loki für Container und OpenShift Infrastructure Logs
  • Argo für automatisierte Deployments

Das Ergebnis ist eine konsistente Observability-Plattform über On-premises-, Container- und Cloud-Umgebungen hinweg.

Eine Plattform für zwei IT-Welten

Heute wachsen klassische und cloud-native Systeme zunehmend zusammen. Virtuelle Maschinen laufen inzwischen mehr und mehr als KubeVirt-VMs auf OpenShift Virtualization. Damit verschmelzen klassische Serverlandschaften und Container-Plattformen auf einer gemeinsamen Infrastruktur.

Das Monitoring folgt dieser Entwicklung:

OMD überwacht virtuelle Maschinen und klassische Anwendungen
Prometheus liefert Metriken für Container und Plattform
Nag2Rem sorgt für einheitliche Alarmierung und Routing

Unabhängig davon, wo ein Ereignis entsteht, wird es nach denselben Regeln verarbeitet und an die richtigen Ansprechpartner weitergeleitet.

Was nach 17 Jahren Zusammenarbeit zählt

Über mehr als anderthalb Jahrzehnte ist eine Monitoring-Plattform entstanden, die technisch sauber gewachsen ist und kontinuierlich weiterentwickelt wird. Know-how aus dem Betrieb großer Produktionsumgebungen fließt direkt in die Weiterentwicklung der eingesetzten Tools ein – darunter OMD, check_logfiles und Nag2Rem.

Für Siemens bedeutet das:

  • eine stabile Monitoring-Infrastruktur für eine hochkomplexe IT-Landschaft
  • deutlich reduzierte Alarmfluten und schnellere Fehlerbehebung
  • durchgängige Transparenz über klassische Infrastruktur, Containerplattformen und Cloud-Services
  • einen erfahrenen Partner für Monitoring und Observability

Anders gesagt: ein zentraler Ansprechpartner für Monitoring in einer IT-Welt, die sich seit über 17 Jahren kontinuierlich weiterentwickelt.

Noch Fragen zum Projekt bei Siemens & unserer Expertise?

Lassen Sie uns sprechen!

Marc Mühlhoff

+49-211-339903-74
Durch Absenden des Formulars stimmen Sie unserer Datenschutzerklärung zu.