Как установить минимальный масштаб для Cloud Run на сервисах GKE?

Я использую Cloud Run в Google Kubernetes Engine и могу без проблем развертывать и получать доступ к сервисам.

Но так как я работаю на GKE и плачу за кластер 24/7, нет смысла масштабировать развертывание до нуля и всегда иметь холодный старт для первого запроса.

Я обнаружил, что это можно установить minScale для автоматического масштабирования Knative отключить масштаб до нуля здесь, здесь и здесь, но я понятия не имею, где его поставить.

В GKE есть много конфигураций, сервисов и рабочих нагрузок для Isito и Knative-Serving, но я не смог найти ничего подходящего.

Какой файл или конфигурацию мне нужно отредактировать, чтобы установить minScale в 1? Или это не будет возможно, поскольку Cloud Run самостоятельно управляет конкретным шаблоном?

1 ответ

Решение

С помощью kubectl, вы должны быть в состоянии установить аннотацию autoscaling.knative.dev/minScale: "1" на вашем сервисе Knative.

Смотрите эту страницу для получения дополнительной информации