B2B Engineering Insights & Architectural Teardowns

ThecoreGrid Radar: LLM-инфраструктура уходит в disaggregation, сети становятся программируемыми, а distributed-системы формально верифицируемыми

Подборка архитектурных инсайтов и релизов, которые мы читали на этой неделе.

LLM Infrastructure & Distributed AI

🔹 TENT (Slice Spraying Engine)
Декларативный движок для распределения данных в disaggregated LLM serving снижает tail latency за счёт adaptive slice placement и устойчивости к деградациям сети.
Читать релиз (EN)

🔹DWDP (Distributed Weight Data Parallelism)
Новый режим параллелизма для inference на NVL72 масштабирует LLM без классических bottleneck’ов tensor/pipeline parallelism, перераспределяя веса вместо активаций.
Читать релиз (EN)

🔹 CRAFT (Cost-aware Expert Allocation)
Оптимизация размещения MoE-экспертов с учётом layer-level стоимости снижает расходы на inference при сохранении SLA — важный шаг к экономике production MoE.
Читать релиз (EN)

🔹 UNIFERENCE
Фреймворк дискретно-событийного моделирования для distributed AI позволяет воспроизводимо тестировать архитектурные решения до деплоя, включая сетевые и планировочные эффекты.
Читать релиз (EN)

🔹 Spark-LLM-Eval
Распределённая система оценки LLM с акцентом на статистическую значимость результатов устраняет типичные ошибки benchmarking’а на больших кластерах.
Читать релиз (EN)

GPU Clusters & High-Performance Systems

🔹 Node-Interconnect Multi-Path Balancing
Execution-time планирование сетевых путей устраняет skew в GPU-кластерах, улучшая utilization без изменений на уровне приложений.
Читать релиз (EN)

🔹EXaCTz
Lossy compression с гарантией сохранения топологических свойств (graph/contour trees) делает возможной агрессивную компрессию scientific data без потери аналитической корректности.
Читать релиз (EN)

Networking & Distributed Systems Theory

🔹 Internet-scale Anomaly Detection (Topology & Routing)
Методы выявления аномалий маршрутизации и перегрузок на уровне всего интернета показывают, как сочетать телеметрию и inference для real-time сетевой диагностики.
Читать релиз (EN)

🔹Density-Delay Law
Формализация зависимости между плотностью событий и задержками даёт основу для предсказуемого дизайна event-driven distributed systems.
Читать релиз (EN)

🔹 Online Network Slice Deployment (Multi-domain)
Алгоритмы размещения network slices с учётом trust constraints позволяют управлять multi-operator инфраструктурой без централизованного контроля. Читать релиз (EN)

Cloud Native & Telco

🔹 Serverless5GC
Архитектура 5G core как набора function-процедур демонстрирует, как serverless-подход может применяться к телеком-ядру с выигрышем в гибкости и операционных затратах.
Читать релиз (EN)

Identity & Application Architecture

🔹 Source Known Identifiers
Трёхуровневая модель идентификации (source-aware) решает проблему доверия и трассируемости в distributed приложениях без централизованных identity-провайдеров.
Читать релиз (EN)

Agentic Systems & Applied AI

🔹PayPal Agentic Toolkit + MCP Servers
Инфраструктура для agent-driven commerce показывает, как MCP и инструментальные API превращают платежные системы в programmable среду для автономных агентов.
Читать релиз (EN)

×

🚀 Deploy the Blocks

Controls: ← → to move, ↑ to rotate, ↓ to drop.
Mobile: use buttons below.