× Install ThecoreGrid App
Tap below and select "Add to Home Screen" for full-screen experience.
B2B Engineering Insights & Architectural Teardowns

LLM multi-agent system Holos и архитектура Agentic Web

LLM multi-agent system становится основой Agentic Web. Holos предлагает архитектуру, где агенты масштабируются и координируются как экосистема.

Классическая гипотеза о том, что AGI появится через масштабирование одной модели, здесь подвергается сомнению. Причина в индуктивных ограничениях: любая модель зашита в рамки своих данных и оптимизации. Это приводит к локальным максимумам — сильным в узких задачах, но нестабильным в открытой среде. Holos рассматривает альтернативу: интеллект как результат взаимодействия множества агентов, а не одного центра.

Архитектурно Holos реализует LLM multi-agent system на уровне веба. В основе пятислойная модель, где каждый слой изолирует класс проблем. Substrate Layer с движком Nuwa отвечает за генерацию и “ленивую” активацию агентов через serverless-подход. Coordination Layer управляет DAG задач, отделяя планирование от назначения исполнителей (blind planning), а затем использует market dispatch с Learning-to-Rank для выбора агента. Value Layer замыкает цикл через экономические стимулы, связывая качество выполнения с будущими возможностями агента.

Ключевой инсайт — попытка решить три системные проблемы LaMAS: трение масштабирования, деградация координации и потеря ценности. Для масштабирования используется модель “dormant agents”: агенты хранятся как профили и активируются только при необходимости через JIT-инстанцирование. Для координации применяется DAG с топологической валидацией (алгоритм Кана), что устраняет циклы и логические ошибки планирования. Для предотвращения гомогенизации инструментов используется S-MMR — баланс релевантности и разнообразия toolset, что снижает корреляцию поведения агентов.

Отдельно стоит механизм market dispatch. Вместо статического реестра используется гибрид: активный поиск по embedding + пассивные ставки через pub/sub каналы. Итоговый выбор делает LTR-модель (LambdaMART), которая учитывает семантику, стоимость, репутацию и ограничения. Это превращает распределение задач в экономическую задачу оптимизации, а не просто routing. В долгих задачах система уходит от синхронной модели к event-driven loop: состояние сериализуется, выполнение возобновляется по событиям, что снижает потребление ресурсов и повышает устойчивость.

Практический вывод для архитекторов: Holos демонстрирует переход от “pipeline агентов” к “экономике агентов”. Это важно для систем с высокой неопределённостью и длительным временем жизни задач. Разделение планирования и исполнения снижает когнитивную нагрузку LLM и уменьшает вероятность ошибок. Serverless-модель агентов делает возможным масштаб до миллионов сущностей без линейного роста инфраструктуры. Однако компромисс очевиден: система становится сложнее в отладке, а качество зависит от механизмов ранжирования и стимулов, а не только от модели.

Новостной источник

arXiv — крупнейший открытый репозиторий препринтов (с 1991, под эгидой Cornell), где учёные оперативно выкладывают рабочие версии статей; материалы общедоступны, но не проходят полноценную рецензии, так что результаты следует считать предварительными и по возможности проверять в обновлённых версиях или в рецензируемых журналах. arxiv.org

Изучить публикацию

×

🚀 Deploy the Blocks

Controls: ← → to move, ↑ to rotate, ↓ to drop.
Mobile: use buttons below.