Подборка архитектурных инсайтов и релизов, которые мы читали на этой неделе.
LLM Infrastructure & Distributed AI
🔹 TENT (Slice Spraying Engine)
Декларативный движок для распределения данных в disaggregated LLM serving снижает tail latency за счёт adaptive slice placement и устойчивости к деградациям сети.
Читать релиз (EN)
🔹DWDP (Distributed Weight Data Parallelism)
Новый режим параллелизма для inference на NVL72 масштабирует LLM без классических bottleneck’ов tensor/pipeline parallelism, перераспределяя веса вместо активаций.
Читать релиз (EN)
🔹 CRAFT (Cost-aware Expert Allocation)
Оптимизация размещения MoE-экспертов с учётом layer-level стоимости снижает расходы на inference при сохранении SLA — важный шаг к экономике production MoE.
Читать релиз (EN)
🔹 UNIFERENCE
Фреймворк дискретно-событийного моделирования для distributed AI позволяет воспроизводимо тестировать архитектурные решения до деплоя, включая сетевые и планировочные эффекты.
Читать релиз (EN)
🔹 Spark-LLM-Eval
Распределённая система оценки LLM с акцентом на статистическую значимость результатов устраняет типичные ошибки benchmarking’а на больших кластерах.
Читать релиз (EN)
GPU Clusters & High-Performance Systems
🔹 Node-Interconnect Multi-Path Balancing
Execution-time планирование сетевых путей устраняет skew в GPU-кластерах, улучшая utilization без изменений на уровне приложений.
Читать релиз (EN)
🔹EXaCTz
Lossy compression с гарантией сохранения топологических свойств (graph/contour trees) делает возможной агрессивную компрессию scientific data без потери аналитической корректности.
Читать релиз (EN)
Networking & Distributed Systems Theory
🔹 Internet-scale Anomaly Detection (Topology & Routing)
Методы выявления аномалий маршрутизации и перегрузок на уровне всего интернета показывают, как сочетать телеметрию и inference для real-time сетевой диагностики.
Читать релиз (EN)
🔹Density-Delay Law
Формализация зависимости между плотностью событий и задержками даёт основу для предсказуемого дизайна event-driven distributed systems.
Читать релиз (EN)
🔹 Online Network Slice Deployment (Multi-domain)
Алгоритмы размещения network slices с учётом trust constraints позволяют управлять multi-operator инфраструктурой без централизованного контроля. Читать релиз (EN)
Cloud Native & Telco
🔹 Serverless5GC
Архитектура 5G core как набора function-процедур демонстрирует, как serverless-подход может применяться к телеком-ядру с выигрышем в гибкости и операционных затратах.
Читать релиз (EN)
Identity & Application Architecture
🔹 Source Known Identifiers
Трёхуровневая модель идентификации (source-aware) решает проблему доверия и трассируемости в distributed приложениях без централизованных identity-провайдеров.
Читать релиз (EN)
Agentic Systems & Applied AI
🔹PayPal Agentic Toolkit + MCP Servers
Инфраструктура для agent-driven commerce показывает, как MCP и инструментальные API превращают платежные системы в programmable среду для автономных агентов.
Читать релиз (EN)