Твоя команда запускает ML inference сервис на Kubernetes кластере с 10 нодами. После развёртывания несколько новых подов зависают в состоянии Pending более 20 минут. On-call инженер сообщает, что сервис деградирован и пользователи жалуются на медленный отклик. Тебе нужно быстро диагностировать проблему.