Запустить несколько инстансов Prometheus в высоконадёжной конфигурации можно, но каждый datasource в Grafana может подключаться только к одному инстансу одновременно. Это создаёт потенциальную единую точку отказа на уровне datasource.
Распространённый способ обойти это — поставить load balancer перед несколькими инстансами Prometheus со следующими характеристиками:
Thanos — это специально разработанный проект, который элегантно решает проблемы HA в Prometheus:
Для production Kubernetes-окружений, требующих настоящей высокой доступности, Thanos — рекомендуемый подход. Он даёт более чистое и простое в поддержке решение по сравнению с ручным управлением load balancer'ами и sticky sessions.
Один datasource Grafana можно настроить для прямого подключения одновременно к нескольким экземплярам Prometheus без необходимости использования load balancer или промежуточного слоя.
Новый — ещё не проверен сообществом
Вы