Network slicing с trust constraints без потери latency
Online network slicing с trust constraints: как Path–Link модель снижает latency и ускоряет VNF placement в multi-domain инфраструктуре.
Online network slicing с trust constraints: как Path–Link модель снижает latency и ускоряет VNF placement в multi-domain инфраструктуре.
Как Reverse Address Translation влияет на latency в multi-GPU системах и почему TLB misses тормозят All-to-All операции в ML workloads.
Slice spraying в GPU кластерах: как TENT снижает latency и повышает throughput в LLM serving за счет динамического data movement —>
Распределенная генерация последовательностей без узких мест: как заменить последовательности в базе данных с помощью DynamoDB, кэширования и асинхронного пополнения в масштабе предприятия.
Multi-path балансировка GPU устраняет сетевые узкие места в кластерах. Разбор NIMBLE и его влияния на throughput и latency. —>
GitOps политика Kubernetes через Kyverno и Argo CD. Как встроить policy enforcement в delivery и избежать небезопасных деплоев.
SKID идентификаторы: как объединить сортируемость, безопасность и zero-lookup verification в distributed systems без двойных ключей. —>
LLM-инфраструктура, Disaggregation, Распределенные системы, GPU-кластеры, Сетевые аномалии, Serverless, ИИ-агенты
LLM evaluation at scale на Apache Spark: как устроена распределённая архитектура, кэширование и статистическая проверка моделей.
Как Uber масштабировала инфраструктуру: опыт Туана Фама.
Первый CTO Uber Туан Фам о переходе к микросервисам, платформах и роли ИИ в эволюции инженерии на реальном опыте масштабирования.
Controls: ← → to move, ↑ to rotate, ↓ to drop.
Mobile: use buttons below.