Возможен ли настраиваемый декларативный Horizontal Pod AutoScaler (HPA) в развертывании seldon (CRD) для среды с несколькими развертываниями?
Используя CRD SeldonDeployment, я хочу настроить HPA, следуя этому примеру . Конфигурация развертывания seldon:
apiVersion: machinelearning.seldon.io/v1
kind: SeldonDeployment
metadata:
name: seldon-model
spec:
name: test-deployment
predictors:
- componentSpecs:
- hpaSpec:
maxReplicas: 3
metrics:
- resource:
name: cpu
targetAverageUtilization: 10
type: Resource
minReplicas: 1
spec:
containers:
- image: seldonio/mock_classifier:1.5.0-dev
imagePullPolicy: IfNotPresent
name: classifier
resources:
requests:
cpu: '0.5'
terminationGracePeriodSeconds: 1
graph:
children: []
name: classifier
type: MODEL
name: example
Когда применяется вышеизложенное, это создает развертывание и декларативный HPA (вместе с другими компонентами). Файл развертывания идентичен для сред QA, Alpha и Prod, что приводит к тому, что количество максимальных/минимальных реплик одинаково. 1. Можно ли настроить количество реплик для разных сред? т.е. разные значения максимального/минимального количества реплик для разных окружений (в конфигурационном файле CRD SeldonDeployment).
Примечание: для других (не Seldon) развертываний мы используем декларативный HPA для каждой среды. Но в данном случае это невозможно, так как диспетчер контроллеров Seldon отменяет любые различия между примененным CRD и текущим (сгенерированным из CRD) развертыванием.
2. Более общий вопрос: как мы будем внедрять динамические переменные в развертывания на основе CRD?