Как установить минимальный масштаб для Cloud Run на сервисах GKE?
Я использую Cloud Run в Google Kubernetes Engine и могу без проблем развертывать и получать доступ к сервисам.
Но так как я работаю на GKE и плачу за кластер 24/7, нет смысла масштабировать развертывание до нуля и всегда иметь холодный старт для первого запроса.
Я обнаружил, что это можно установить minScale
для автоматического масштабирования Knative отключить масштаб до нуля здесь, здесь и здесь, но я понятия не имею, где его поставить.
В GKE есть много конфигураций, сервисов и рабочих нагрузок для Isito и Knative-Serving, но я не смог найти ничего подходящего.
Какой файл или конфигурацию мне нужно отредактировать, чтобы установить minScale
в 1
? Или это не будет возможно, поскольку Cloud Run самостоятельно управляет конкретным шаблоном?
1 ответ
С помощью kubectl
, вы должны быть в состоянии установить аннотацию autoscaling.knative.dev/minScale: "1"
на вашем сервисе Knative.
Смотрите эту страницу для получения дополнительной информации