Понимание этих трёх метрик необходимо для оценки и проектирования надёжных, эффективных систем.
Latency (задержка) измеряет время, необходимое для выполнения одного запроса от начала до конца, обычно выражается в миллисекундах (ms). Низкая задержка означает более быстрое время отклика для конечных пользователей.
Распространённый способ отслеживания задержки — через перцентили — например, p99 latency представляет худшее время отклика для самого медленного 1% запросов, что зачастую даёт больше информации, чем простое среднее значение.
Throughput (пропускная способность) измеряет, сколько работы система может обработать за определённый период времени. Обычно выражается как:
Более высокая пропускная способность означает, что система может обслуживать больше пользователей или обрабатывать больше данных одновременно.
Availability (доступность) измеряет процент времени, в течение которого система остаётся работоспособной и доступной. Рассчитывается по формуле:
Availability = Uptime / (Uptime + Downtime)
Доступность обычно описывается с использованием нотации "девяток":
99.9% — ~8,7 часов простоя в год99.99% — ~52 минуты простоя в год99.999% — ~5 минут простоя в годЭти метрики часто предполагают компромиссы (trade-offs). Например, увеличение пропускной способности через батчинг запросов может увеличить задержку. Достижение высокой доступности может требовать избыточной инфраструктуры, что добавляет стоимость и сложность. Хорошо спроектированная система тщательно балансирует все три метрики исходя из бизнес-требований.
P99 latency — это более значимая метрика, чем средняя латенсия, потому что она отражает опыт 1% самых медленных запросов, а не искажается большинством быстрых ответов.
Новый — ещё не проверен сообществом
Вы