Das Management des Kontextfensters in Multi-Agenten-Systemen bestimmt die Qualität des Denkens und die Stabilität von Ermittlungen. Wir analysieren, wie dies durch die Trennung des Kontexts gelöst wird.
Das Problem tritt erst zutage, wenn das agentische System über kurze Szenarien hinaus skaliert. In langen Ermittlungen steigt die Anzahl der Inferenzanfragen, und damit auch das Volumen der Nachrichtenhistorie. Da LLM-APIs zustandslos bleiben, muss die gesamte Historie bei jedem Aufruf übermittelt werden. Dies stößt schnell an die Grenzen des Kontextfensters: die Latenz steigt, die Kosten erhöhen sich, und die Qualität der Antworten verschlechtert sich. In einer Multi-Agenten-Konfiguration wird die Situation komplizierter: Jeder Agent benötigt seinen eigenen Ausschnitt des Systemzustands. Zu wenig Kontext führt zu einem Verlust der Kohärenz, zu viel zu einer Verringerung der Qualität des Denkens und dem Effekt der Bestätigungsfehler.
Die Lösung basiert auf der Trennung des Kontexts in drei Kanäle: Journal, Review und Timeline. Dies ist ein Kompromiss zwischen Vollständigkeit und Handhabbarkeit. Anstatt die vollständige Nachrichtenhistorie zu übermitteln, übermittelt das System aggregierte Darstellungen des Zustands. Das Journal fungiert als Arbeitsgedächtnis des Direktors — es hält Hypothesen, Entscheidungen und Fragen fest. Review aggregiert die Schlussfolgerungen von Experten und überprüft deren Richtigkeit. Die Timeline sammelt eine einheitliche Erzählung von Ereignissen. Dieser Ansatz verringert den Druck auf das Kontextfenster und hält gleichzeitig die Agenten in der gemeinsamen Logik der Ermittlungen.
Die Implementierung stützt sich auf eine strenge Dekomposition der Rollen. Der Direktor steuert den Prozess und führt das Journal, das allen Agenten als Chronologie zur Verfügung steht. Dies schafft eine einzige Quelle der Wahrheit, ohne die rohe Nachrichtenhistorie zu übermitteln. Experten arbeiten in engen Domänen und liefern Ergebnisse mit Bezug zu Artefakten (Tool-Calls). Dies ist jedoch nicht ausreichend aufgrund des Risikos von Halluzinationen. Daher wird ein Kritiker eingeführt, der die Schlussfolgerungen durch Werkzeuge zum Zugriff auf die Rohdaten und Methodologien überprüft. Er analysiert nicht nur die Ergebnisse, sondern auch die Richtigkeit ihrer Erzielung. Zusätzlich wird ein Scoring verwendet: Die Schlussfolgerungen werden nach Verlässlichkeit eingestuft, was es ermöglicht, schwache Hypothesen herauszufiltern.
Ein Schlüsselelement ist die Timeline. Im Gegensatz zu Review erfordert sie keinen Zugriff auf Werkzeuge und arbeitet nur mit bereits aggregiertem Kontext. Dies verringert die Belastung des Modells und verbessert die Qualität des Denkens. Die Timeline zwingt zur Schaffung von kausalen Zusammenhängen und verwirft inkonsistente Schlussfolgerungen. Tatsächlich ist dies ein Mechanismus zur Bekämpfung von Halluzinationen durch narrative Kohärenz. Wenn eine Schlussfolgerung nicht in die allgemeine Ereigniskette passt, wird sie nicht gespeichert. Darüber hinaus begrenzt das System die Anzahl der „Lücken“, um den Direktor nicht mit sekundären Ungewissheiten zu überlasten.
Das Ergebnis ist ein stabiles Verhalten des Systems in langen Szenarien, ohne die vollständige Nachrichtenhistorie zu übermitteln. Der Kontext wird durch komprimierte Darstellungen verwaltet, nicht durch die Ansammlung von Daten. Dies verringert die Latenz und die Kosten, obwohl keine genauen Metriken angegeben sind. Wichtiger ist etwas anderes: Die Kohärenz zwischen den Agenten und die Qualitätskontrolle des Denkens bleiben erhalten. Dieser Ansatz kann als evolutionäre Verbesserung von Agenten-Frameworks betrachtet werden, bei der das Management des Zustands zu einer architektonischen Aufgabe wird und nicht zu einem Nebeneffekt.
Ähnliche Lösungen spiegeln den allgemeinen Trend wider: den Verzicht auf „endlosen Kontext“ zugunsten einer strukturierten Erinnerung. Selbst bei hypothetisch unbegrenztem Kontextfenster bleibt die Übermittlung der gesamten Historie umstritten — ein Übermaß an Informationen behindert die Anpassung an neue Daten. Hier wird der pragmatische Weg gewählt: den Kontext zu begrenzen, aber seine Dichte und Relevanz zu erhöhen.