× Install ThecoreGrid App
Tap below and select "Add to Home Screen" for full-screen experience.
B2B Engineering Insights & Architectural Teardowns

Grafana Observability Dashboards: flexible Anpassung

Grafana Observability Dashboards können jetzt ohne Verlassen der Anwendung angepasst werden. Dies verändert die Kontrolle über die Observability auf der Ebene von Services und Instanzen.

Solange Teams mit den Standard-Dashboards arbeiten, wirkt alles akzeptabel. Doch mit der Zunahme von Services und Nutzungsszenarien beginnen die Standardansichten, von den tatsächlichen Workflows abzuweichen. Es entsteht eine Kluft zwischen dem, wie das System Daten anzeigt, und dem, wie Ingenieure Entscheidungen treffen. Besonders deutlich wird dies bei der Cloud Provider Observability: Es gibt einen schnellen Start mit vorgefertigten Panels für AWS, Azure und GCP, aber die Anpassungstiefe ist begrenzt, und der Drill-Down auf Instanzebene spiegelt oft nicht die benötigten Metriken und Abfragen wider.

Die Lösung in Grafana 13 besteht darin, die Kontrolle über den Einstiegspunkt und die Detaillierung zu geben, ohne die vorhandenen Vorlagen zu brechen. Es wird möglich, bestehende Dashboards anzuschließen, neue über KI zu generieren und den Instanz-Drill-Down neu zu definieren. Dies ist eine Kompromisslösung: Der Wert der Out-of-the-Box-Darstellungen bleibt erhalten, aber es wird eine Schicht der Anpassung hinzugefügt. Die zentrale Idee ist eine einheitliche Konfiguration auf Service-Ebene, die dann in allen Oberflächen verwendet wird: Service-Seiten, Database Observability, Entity Graph und Übergänge aus Alerts. Dieser Ansatz reduziert die Fragmentierung und beseitigt die Duplizierung von Logik.

Die Implementierung ist an die Konfigurationsseite eines bestimmten Services gebunden. Auf der Registerkarte Services kann der gewünschte Service ausgewählt und definiert werden, welches Dashboard das Hauptdashboard sein soll. Wenn bereits ein bewährtes internes Dashboard vorhanden ist, kann es als Quick Link angeschlossen und als Standard festgelegt werden. Dabei verschwindet das Standard-Dashboard nicht — es bleibt als Alternative verfügbar. Wenn kein Dashboard vorhanden ist, erfolgt die Generierung über KI: Das System erstellt eine Vorlage mit Variablen und Panels im RED/USE-Stil. Dies beschleunigt den Start, lässt jedoch die Verantwortung für die endgültige Validierung beim Team.

Eine separate Schicht ist die Anpassung des Drill-Downs für Instanzen. Hier können die Zusammensetzung der Panels, Abfragen, die Reihenfolge der Anzeige, Maßeinheiten und das Format der Legenden geändert werden. Ein wichtiger Punkt: Diese Konfiguration wird konsistent an allen Einstiegspunkten angewendet. Unabhängig davon, ob der Benutzer aus der Cloud Provider Observability, der Database Observability oder aus einem Alert kommt, sieht er die gleiche Darstellung. Dies reduziert die kognitive Belastung und vereinfacht das Onboarding.

Die Ergebnisse sind architektonischer Natur und nicht quantitativ — Verbesserungsmetriken sind nicht angegeben. Aber die Kausalität ist offensichtlich: Eine einheitliche Konfiguration verringert die Diskrepanz zwischen den Teams, benutzerdefinierte Dashboards erhöhen die Relevanz der Signale, und die KI-Generierung verkürzt die Zeit bis zur ersten nützlichen Darstellung. Dabei bleiben Trade-offs bestehen. Je mehr Anpassung, desto höher das Risiko von Abweichungen der Standards innerhalb der Organisation. Zudem beschleunigt die KI-Generierung die Erstellung, garantiert jedoch nicht die Korrektheit der Abfragen und die Interpretation der Metriken.

Im industriellen Kontext erscheint dies als evolutionäre Verbesserung. Observability verschiebt sich seit langem von statischen Dashboards hin zu adaptiven Darstellungen, die näher an den Aufgaben des Teams liegen. Grafana macht einen Schritt in Richtung „config-as-a-view“, bei dem der Service definiert, wie genau er beobachtet werden soll. Dies reduziert die Reibung zwischen dem Plattformteam und den Produktteams, erfordert jedoch Disziplin im Konfigurationsmanagement.

Aus praktischer Sicht ist der Ansatz dort gerechtfertigt, wo es eine Vielfalt an Services und unterschiedliche Betriebsmodelle gibt. Ist die Infrastruktur jedoch homogen, können Standard-Dashboards ausreichend bleiben. Das neue Modell hebt die grundlegenden Darstellungen nicht auf, sondern fügt eine Verwaltungsschicht hinzu. Und genau diese Schicht wird zum Punkt, an dem die Reife der SRE-Praktiken sichtbar wird.

Lesen -Grafana.com

×

🚀 Deploy the Blocks

Controls: ← → to move, ↑ to rotate, ↓ to drop.
Mobile: use buttons below.