В распределённых системах observability (наблюдаемость) опирается на три дополняющих друг друга практики, которые вместе дают полную видимость поведения системы: логирование, мониторинг и распределённая трассировка.
Логирование захватывает отдельные события в конкретный момент времени — например, ошибки, входящие запросы или изменения состояния.
Ключевые характеристики:
Мониторинг отслеживает агрегированные метрики здоровья системы во времени — такие как использование CPU, потребление памяти, latency и процент ошибок.
Ключевые характеристики:
Распределённая трассировка следит за одиночным запросом при его распространении через несколько микросервисов, измеряя latency и поведение на каждом этапе.
Ключевые характеристики:
trace-id каждому запросу, связывает spans между сервисамиЭти три практики образуют "три столпа наблюдаемости":
Типичный workflow:
Используемые вместе, они обеспечивают комплексное понимание для эффективного troubleshooting сложных распределённых систем.
Распределённая трассировка присваивает уникальный trace-id каждому запросу, чтобы коррелировать spans между несколькими сервисами и определить, где происходит задержка или сбои в пути запроса.
Новый — ещё не проверен сообществом
Вы