Low latency systems и контроль коммуникаций
Как проектировать low latency systems: контроль коммуникаций, Disruptor, Aeron и компромиссы между скоростью и архитектурой.
Как проектировать low latency systems: контроль коммуникаций, Disruptor, Aeron и компромиссы между скоростью и архитектурой.
CPU-free LLM inference: как убрать CPU из критического пути и стабилизировать latency в LLM serving архитектурах.
Как agentic system управляет context window через Journal, Review и Timeline, снижая latency и улучшая согласованность multi-agent reasoning.
KV cache optimization в multi-LoRA serving: как ForkKV снижает потребление памяти и увеличивает throughput LLM-инференса.
Как превратить root cause analysis в код: разбор подхода Meta DrP, автоматизации расследований и снижения MTTR в SRE системах.
Как Platform Program split помог Uber снять блокировки разработки и перейти к microservices под давлением гиперроста.
P2P распределение моделей в Kubernetes с Dragonfly: как снизить трафик к origin и ускорить доставку больших моделей из Hugging Face и ModelScope.
Kubernetes Gateway API как замена Ingress NGINX: как провести миграцию, избежать рисков и сохранить стабильность трафика и observability.
Symbolic execution BPF ускоряет анализ malware: как через Z3 автоматически находят “магические” пакеты и обходят сложность фильтров.
Tagged storage pattern для multi-tenant конфигураций на AWS: как устранить cache staleness и масштабировать metadata service без потери производительности.
Controls: ← → to move, ↑ to rotate, ↓ to drop.
Mobile: use buttons below.