OpenShift Virtualization 4.21 усиливает управление VM
OpenShift Virtualization 4.21: как упростить управление виртуальными машинами и снизить сложность в гибридном облаке
«Наблюдаемость» на ThecoreGrid — это про понимание, мониторинг и отладку сложных распределенных систем в продакшене.
Мы рассматриваем логирование, метрики, трассировку и профилирование как ключевые элементы видимости поведения системы под реальной нагрузкой. В темах — стратегии инструментирования, построение telemetry-пайплайнов, дизайн алертинга, определение SLI/SLO и обнаружение инцидентов в highload-среде. Анализируем компромиссы между качеством сигналов, стоимостью и нагрузкой на систему, а также проблемы кардинальности, сэмплирования и хранения данных. Контент основан на практиках BigTech, включая post-mortems инцидентов и опыт эксплуатации масштабных систем. Публикуем deep dive в современные observability-стеки, методы корреляции сигналов и подходы к отладке микросервисов и cloud-native платформ. Тег полезен SRE, platform- и backend-инженерам, а также архитекторам, отвечающим за надежность, производительность и прозрачность систем.
OpenShift Virtualization 4.21: как упростить управление виртуальными машинами и снизить сложность в гибридном облаке
В actor-системах нет встроенного канала для trace context. Discord решил это без смены архитектуры и без остановки продакшена.
Distributed inference simulation с Uniference: как DES устраняет разрыв между моделированием и деплоем AI систем.
DNS round-robin перестаёт работать под нагрузкой, когда клиенты начинают кэшировать ответы. Agoda столкнулась с этим на уровне объектного хранилища и вынесла балансировку в отдельный слой.
Таймауты запросов не всегда означают проблему в базе данных. Часто деградация скрыта в пути между приложением и БД. Проблема проявляется в момент, когда метрики базы выглядят стабильными, но клиенты получают таймауты. На уровне наблюдения это выглядит как противоречие: latency растёт, а database time остаётся прежним. Причина в том, что пользовательский опыт формируется не временем выполнения … Читать далее
Профилировщик в kernel space видит только адреса. Полезные инсайты появляются только после символизации — и в Go этот этап устроен иначе, чем в других языках. Проблема проявляется в момент, когда профиль уже собран, но интерпретировать его невозможно. eBPF-профилировщик снимает stack traces на уровне ядра и получает набор program counter значений — сырые адреса в памяти. … Читать далее
Когда LLM становится частью продакшн-инфраструктуры, классического мониторинга уже недостаточно. Узким местом становится не код приложения, а слой маршрутизации и выбора моделей — и именно там нужна наблюдаемость. В cах деградация начинается не с падения HTTP-эндпоинтов, а с накопления неочевидных эффектов: рост латентности на отдельных моделях, скачки стоимости из-за маршрутизации, таймауты конкретных промптов, rate limits у … Читать далее
ThecoreGrid Radar — это рубрика, в которой мы собираем ключевые архитектурные инсайты и релизы недели. Без необходимости искать по разным источникам — всё в одном месте.
AI-агенты усложняют наблюдаемость: один и тот же запрос может приводить к разным цепочкам действий. Без трассировки система становится непрозрачной. Проблема проявляется, когда генеративные системы переходят от простых LLM-вызовов к агентам. Агент планирует шаги, вызывает инструменты и принимает решения динамически. Поведение становится недетерминированным: одинаковый prompt может привести к разным последовательностям вызовов и разной стоимости. Традиционный APM … Читать далее
Controls: ← → to move, ↑ to rotate, ↓ to drop.
Mobile: use buttons below.