AI-Agenten stoßen nicht an Modelle, sondern an die Architektur. Wenn das Feedback langsam ist, funktioniert die Autonomie nicht.

Das Problem tritt auf, wenn der AI-Agent versucht, den Zyklus „generiert → überprüft → korrigiert“ zu schließen. In typischen Cloud-Systemen dehnt sich dieser Zyklus aus: Das Deployment dauert Minuten, Tests hängen von der Bereitstellung von Ressourcen ab, Fehler treten nur in der Cloud auf. Die enge Verknüpfung der Geschäftslogik mit AWS-Diensten behindert die lokale Überprüfung, und die heterogene Struktur des Repositories erschwert das Verständnis, wo Änderungen vorgenommen werden müssen. Infolgedessen kann der Agent das Ergebnis nicht stabil validieren und degradiert zur Rolle eines Codegenerators, was den Entwickler zurück zu manuellen Überprüfungen zwingt.

Die Lösung verlagert den Fokus von „den besten Prompts“ auf die Architektur. Ein Schlüsselprinzip besteht darin, das Feedback (Feedback Loop) zu beschleunigen und explizite Grenzen einzuführen. Dazu werden drei Ansätze kombiniert: lokale Emulation von Diensten, leichte Cloud-Tests und kurzlebige Preview-Umgebungen. Ein solches Design ermöglicht es, die meisten Änderungen außerhalb der Cloud zu überprüfen und auf reale Dienste nur dort zuzugreifen, wo es notwendig ist. Der Kompromiss ist offensichtlich: Lokale Emulationen reproduzieren nicht vollständig das Verhalten von Managed-Services, weshalb einige Szenarien dennoch eine Überprüfung in AWS erfordern.

Die Implementierung stützt sich auf verfügbare Werkzeuge. Serverless-Anwendungen können lokal über AWS SAM ausgeführt werden, indem Lambda über ein emuliertes API Gateway (sam local start-api) aufgerufen wird und die Antwort innerhalb von Sekunden erfolgt. Container-Dienste (ECS, Fargate) werden über dieselben Bilder überprüft, die lokal erstellt und ausgeführt werden. Für die Datenspeicherung wird DynamoDB Local verwendet, was grundlegende CRUD-Szenarien ohne Cloud-Zugriff abdeckt. Für ETL-Pipelines stellt AWS Glue Docker-Images bereit: Transformationen werden an Beispielen durchgeführt, während die großangelegte Überprüfung auf die Cloud verschoben wird. Wo die Emulation unvollständig ist (z. B. SNS/SQS), werden minimale Stacks über IaC (CloudFormation, CDK) verwendet: Der Agent implementiert isolierte Ressourcen, validiert das Verhalten über das SDK und entfernt sie wieder. Für End-to-End-Tests werden Preview-Umgebungen hinzugefügt – kurzlebige Stacks für Smoke-Tests. Der Vertragsansatz (OpenAPI) ermöglicht es, Integrationen vor der vollständigen Implementierung der Dienste zu validieren.

Eine separate Schicht ist die Code-Architektur. Das Repository sollte die Absichten widerspiegeln: Die Trennung in /domain, /application, /infrastructure isoliert die Geschäftslogik von AWS-Abhängigkeiten. Muster wie die hexagonale Architektur gestalten externe Dienste als Adapter. Dies reduziert Nebenwirkungen und vereinfacht lokale Tests. Projektregeln (z. B. über Steering-Dateien) dokumentieren Einschränkungen und verringern den architektonischen Drift. Tests werden zur Quelle der Wahrheit: Sie definieren das erwartete Verhalten und geben dem Agenten ein schnelles Signal bei Abweichungen. Ein Monorepository fügt Kontext hinzu – der Agent sieht das System als Ganzes und bewertet die Auswirkungen von Änderungen besser. Maschinenlesbare Dokumentation (AGENT.md, RUNBOOK.md, YAML-Konfigurationen) verringert die Mehrdeutigkeit.

Das Ergebnis ist eine Verkürzung der Iterationszeit von Minuten auf Sekunden in der Entwicklungsphase und eine vorhersehbarere Validierung vor der Produktion. Exakte Metriken in den Ausgangsdaten werden nicht angegeben, aber der qualitative Effekt ist offensichtlich: weniger Abhängigkeiten von der Cloud in frühen Phasen, weniger Integrationsüberraschungen, höhere Autonomie des Agenten. Dabei bleiben Einschränkungen: Nicht alle Dienste werden vollständig emuliert, was eine hybride Teststrategie und zwingend erforderliche Guardrails in CI/CD (Testausführung, Überprüfungen, Branchenschutz) erfordert. Dies ist eine kompromissbehaftete, aber pragmatische Lösung, die die Architektur an agentic Prozesse anpasst und nicht umgekehrt.

Mehr lesen

🚀 Deploy the Blocks