B2B Engineering Insights & Architectural Teardowns

Унификация API и AI-трафика через единый control plane: разбор подхода Higress

Higress входит в CNCF Sandbox как API gateway с заявкой на объединение нескольких слоёв трафика. Ключевой вопрос — снижает ли это сложность или просто переносит её в другое место.

Системы начинают деградировать в момент, когда слой управления трафиком фрагментируется. Отдельно живут ingress, отдельно — gateway для микросервисов, отдельно — решения для AI workload. Каждый слой добавляет свою конфигурацию, политику безопасности и lifecycle. В результате растёт операционная нагрузка и увеличивается вероятность рассинхронизации. В исходном тексте прямо указано, что Higress пытается решить именно эту проблему — объединить несколько типов gateway в единую модель управления.

Выбранный подход — единый control plane поверх Envoy и Istio. Это прагматичный выбор: оба компонента уже широко используются и закрывают базовые задачи маршрутизации и service mesh. Higress добавляет над ними уровень абстракции, который концептуально объединяет:

  • traffic gateway
  • microservices gateway
  • AI gateway

Компромисс здесь очевиден. С одной стороны, уменьшается количество разрозненных компонентов. С другой — появляется более сложный централизованный слой, который становится критической точкой системы. Такой слой должен быть устойчив к росту нагрузки и изменениям конфигурации.

Реализация опирается на WebAssembly (Wasm) как механизм расширяемости. Это позволяет внедрять кастомную логику без изменения ядра прокси. В контексте gateway это важно: политики, фильтры и обработка AI-запросов могут быстро эволюционировать. Также указано, что система проверена в production-средах с высокой нагрузкой, но конкретные метрики (latency, throughput, error rate) в исходнике отсутствуют. Это ограничивает возможность оценить реальную эффективность архитектуры.

Отдельный аспект — использование Higress как AI gateway. В тексте упоминается применение для AI Agent и MCP-сервисов, а также появление проектов поверх него. Это указывает на попытку встроить AI-трафик в уже существующую инфраструктуру API, а не строить отдельный стек. Такой подход снижает дублирование, но требует аккуратного управления ресурсами и приоритизацией трафика.

В результате Higress выглядит как эволюционное расширение классического API gateway в сторону AI-нагрузок. Вхождение в CNCF Sandbox — это ранний этап. Нет данных о производительности или сравнении с альтернативами. Основная ценность на текущий момент — архитектурная идея: свести разрозненные gateway-паттерны к единой модели и управлять ими через общий control plane.

Читать больше

×

🚀 Deploy the Blocks

Controls: ← → to move, ↑ to rotate, ↓ to drop.
Mobile: use buttons below.