Ты работаешь SRE в среднеразмерной SaaS-компании. В 2 часа ночи твоя команда получает алерт о том, что Auto Scaling group для production API tier не запустила ни одного нового инстанса больше суток, и весь трафик маршрутизируется на небольшое количество существующих инстансов. On-call инженер эскалировал к тебе, потому что заметил, что группа не масштабируется несмотря на то, что постоянно срабатывают алерты высокого CPU.