BYOC Logs löst das Problem der Log-Verwaltung (log management) auf Petabyte-Ebene, ohne die Beobachtbarkeit (observability) zu verlieren. Dies ist wichtig, wenn das Wachstum der Telemetrie klassische selbstgehostete Lösungen überfordert.

Das Problem zeigt sich schrittweise. Mit dem Wachstum von cloud-nativen Systemen und KI-Lasten wächst das Volumen der Logs nichtlinear. Jeder Dienst und Container erzeugt einen Strom von Telemetrie, der gespeichert, analysiert und geschützt werden muss. In der selbstgehosteten Log-Verwaltung führt dies zu Fragmentierung: Daten sind über verschiedene Werkzeuge verteilt, das Skalieren erfordert eine Neuzuordnung der Daten, und der Betrieb wird zu einem ständigen Rebalancing. Zusätzlich kommen Anforderungen an die Speicherung und Lokalisierung von Daten (data residency) hinzu, bei denen Teile der Logs nicht außerhalb der Region gespeichert werden dürfen. Infolgedessen verlieren die Teams das Gleichgewicht zwischen vollständiger Sichtbarkeit und Kontrolle über die Daten.

Die Lösung basiert auf einem hybriden Modell: BYOC Logs (Bring Your Own Cloud) belässt die Speicherung in der Infrastruktur des Nutzers, behält jedoch die Integration mit der SaaS-Plattform Datadog bei. Dies ist ein Kompromiss zwischen Kontrolle und Benutzerfreundlichkeit. Die zentrale architektonische Idee ist die Trennung von Compute und Storage. Logs werden in einem Objektspeicher (object storage) gespeichert, während die Rechenebene unabhängig skaliert. Dieser Ansatz beseitigt die Notwendigkeit, Daten bei der Hinzufügung von Knoten zu verschieben. Der Trade-off ist hier offensichtlich: Abhängigkeit vom Objektspeicher als einzige Speicherschicht, aber im Gegenzug — vorhersehbare Skalierung und Senkung der Betriebskosten.

Die Implementierung stützt sich auf mehrere Schlüsselkomponenten. Die Indizierung erfolgt durch das direkte Schreiben von „splits“ in den Objektspeicher. Metadaten werden über einen zentralisierten Metastore verfolgt, der die Daten nahezu sofort verfügbar macht. Die Suchschicht ist zustandslos: Der Koordinator erhält die Anfrage, findet die benötigten Splits und verteilt die Last zwischen den Suchknoten. Jeder Knoten liest die Daten direkt aus dem Objektspeicher, ohne lokale Speicherung von Indizes. Dies vereinfacht den Betrieb und erhöht die Fehlertoleranz. Zusätzlich werden Observability Pipelines verwendet, um Logs vor der Indizierung zu normalisieren, anzureichern und zu filtern, was die Kosten senkt und die Konsistenz der Daten verbessert.

Eine separate Schicht ist die Korrelation von Daten. BYOC Logs ist mit Metriken und Traces (APM) integriert, was die Analyse von Vorfällen in einer einzigen Schnittstelle ermöglicht. Im Szenario mit einer API-Degeneration können Logs, Traces und Metriken gleichzeitig angezeigt werden, ohne die Werkzeuge wechseln zu müssen. Eine AI-Schicht wird hinzugefügt: Der Agent kann Hypothesen bilden und über natürliche Sprachabfragen suchen. Zudem wird die Unterstützung von MCP (Model Context Protocol) angekündigt, was die Anbindung externer AI-Agenten zur Analyse von Observability-Daten ohne benutzerdefinierte Integrationen ermöglicht.

In Bezug auf die Ergebnisse schließt das System mehrere Engpässe. Die Skalierung erfolgt ohne Neuzuordnung von Daten. Die Speicherung wird durch den Objektspeicher und Kompression kostengünstiger. Das Management wird über eine einheitliche Benutzeroberfläche zentralisiert. Allerdings werden keine genauen Leistungs- oder Einsparmetriken in den Ausgangsdaten angegeben. Es kann nur von einer Verringerung der betrieblichen Komplexität und einer Verbesserung der Integrität der Beobachtbarkeit gesprochen werden.

Besonders erwähnenswert ist der Anwendungsfall Sicherheit. Logs von Firewall, CDN und VPC erzeugen traditionell eine hohe Last. In einem klassischen Schema werden diese zwischen SIEM und Archiven aufgeteilt, was die Komplexität erhöht. BYOC Logs konsolidiert diese Ströme, sodass große Volumina gespeichert und Anreicherungen (z. B. über GeoIP oder Threat Intelligence) vor der Indizierung angewendet werden können. Dies beschleunigt Ermittlungen durch strukturierte Daten und Ereigniskorrelation.

Insgesamt ist BYOC Logs eine evolutionäre Weiterentwicklung der Log-Management-Architektur. Es verlagert den schweren Teil der Speicherung in eine kostengünstige und skalierbare Schicht und belässt die Analyse und Korrelation auf der Plattformseite. Dieser Ansatz ist besonders relevant für hybride und verteilte Systeme, in denen Kontrolle über Daten und eine einheitliche Observability-Oberfläche koexistieren müssen.

Lesen

BYOC Logs löst das Problem der Log-Verwaltung (log management) auf Petabyte-Ebene, ohne die Beobachtbarkeit (observability) zu verlieren. Dies ist wichtig, wenn das Wachstum der Telemetrie klassische selbstgehostete Lösungen überfordert.

🚀 Deploy the Blocks