B2B Engineering Insights & Architectural Teardowns

Kubescape 4.0: Übergang zur CEL-Detektion und Verzicht auf Host-Level-Agenten

In Kubescape 4.0 verschiebt sich der Fokus von reaktiver Sicherheit zu proaktiver Sicherheit. Die wichtigsten Änderungen sind Runtime-Detektion, Überarbeitung des Agentenmodells und die Auslagerung von Sicherheitsdaten aus etcd. Das Problem zeigt sich im großen Maßstab. Wenn der Cluster wächst, beginnt die Sicherheit, um Ressourcen mit dem Control Plane zu konkurrieren. Die Speicherung von Sicherheitsmetadaten in … Weiterlesen

Kubernetes fsGroup als versteckter Engpass: Beschleunigung von Neustarts durch fsGroupChangePolicy

Lange Neustarts von Stateful-Services erscheinen selten als ein Problem der Sicherheitskonfiguration. Doch genau so verwandelte sich das sichere Default in Kubernetes in 30 Minuten Ausfallzeit pro Neustart. Das Problem trat im großen Maßstab auf. Atlantis, das Terraform über GitLab MR verwaltet, funktioniert als Singleton StatefulSet und speichert den Zustand in einem PersistentVolume. Jeder Neustart – … Weiterlesen

Vereinheitlichung von API- und AI-Verkehr über einen einheitlichen Control Plane: Analyse des Ansatzes von Higress

Higress tritt als API-Gateway in die CNCF Sandbox ein und hat sich zum Ziel gesetzt, mehrere Verkehrsschichten zu vereinen. Die zentrale Frage ist, ob dies die Komplexität verringert oder sie einfach an einen anderen Ort verlagert. Systeme beginnen zu degradieren, wenn die Steuerungsschicht des Verkehrs fragmentiert wird. Separat existieren Ingress, separat – Gateway für Mikrodienste, … Weiterlesen

Kubernetes-Skalierung ohne steigende operative Belastung: Generali wechselt zu EKS Auto Mode

Wenn die Anzahl containerisierter Services schneller wächst als das Plattform-Team, wird nicht Kubernetes selbst, sondern dessen Betrieb zum Engpass. Genau dieses Problem hat Generali gelöst – und den Fokus vom Cluster-Management auf das Applikations-Management verlagert. Die Hauptgrenze zeigte sich nicht in der Performance, sondern im operativen Bereich. Das Microservices-Portfolio wuchs, Multi-Tenant-Szenarien kamen hinzu und damit … Weiterlesen

Kubernetes und stateful Inference: Wie llm-d das Problem der Routing- und Cache-Verwaltung für LLM-W…

Mit dem Wachstum von LLM-Produktions-Workloads wird deutlich: Die klassischen Mechanismen von Kubernetes verstehen die Natur von Inference nicht. llm-d ist ein Versuch, diese Lücke auf Plattformebene zu schließen. Die wichtigste Einschränkung zeigt sich, wenn Inference über den Rahmen eines „stateless HTTP-Services“ hinausgeht. Anfragen an LLMs haben unterschiedliche Kosten: Prompt-Länge, Generierungsphase, Treffer im KV-Cache. In Kubernetes … Weiterlesen

Eine einheitliche globale Plattform als Möglichkeit zur Vereinfachung von SASE und zum Schutz von AI-Workloads

Isolierte Dienste für Sicherheit und Traffic-Bereitstellung beginnen bei wachsenden AI-Workloads und verteilten Nutzern zu versagen. Der Ansatz mit einer einheitlichen Plattform versucht, diese Klasse von Problemen durch Konsolidierung zu beseitigen. Das Problem zeigt sich mit zunehmender Komplexität der Architektur. Separate Lösungen für WAF, DDoS, CDN, Zero Trust und Anwendungszugriff erzeugen eine Fragmentierung. Jede Lösung fügt … Weiterlesen

⪜ Cloud-Abhängigkeit als architektonisches Risiko: Multi-Cloud, Local-First und Protokolle mit „Credible Exit“

Moderne Systeme werden um Clouds herum entworfen, aber die Abhängigkeit von einem einzigen Anbieter erweist sich zunehmend als systemisches Risiko. Die Frage ist nicht die Wahrscheinlichkeit eines Ausfalls, sondern dessen Konsequenzen und die Fähigkeit des Systems, den Kontrollverlust zu überstehen. Das Problem zeigt sich nicht auf der Ebene von Latency oder Throughput, sondern auf der … Weiterlesen

Verringerung der Cloud-Abhängigkeit: Multi-Cloud, offene Protokolle und Local-First als Engineering-Strategien

Die Abhängigkeit von einem einzigen Cloud-Anbieter galt lange Zeit als akzeptabler Kompromiss. Mittlerweile wird dies zunehmend als systemisches Risiko mit hohen Ausfallkosten betrachtet. Das Problem zeigt sich nicht auf der Ebene von Latenz oder Durchsatz, sondern auf der Ebene der Kontrolle. Der europäische Cloud-Markt ist stark konzentriert: Etwa 70 % entfallen auf drei US-amerikanische Anbieter. … Weiterlesen

×

🚀 Deploy the Blocks

Controls: ← → to move, ↑ to rotate, ↓ to drop.
Mobile: use buttons below.