Возможен ли настраиваемый декларативный Horizontal Pod AutoScaler (HPA) в развертывании seldon (CRD) для среды с несколькими развертываниями?

Используя CRD SeldonDeployment, я хочу настроить HPA, следуя этому примеру . Конфигурация развертывания seldon:

      apiVersion: machinelearning.seldon.io/v1
kind: SeldonDeployment
metadata:
  name: seldon-model
spec:
  name: test-deployment
  predictors:
  - componentSpecs:
    - hpaSpec:
        maxReplicas: 3
        metrics:
        - resource:
            name: cpu
            targetAverageUtilization: 10
          type: Resource
        minReplicas: 1
      spec:
        containers:
        - image: seldonio/mock_classifier:1.5.0-dev
          imagePullPolicy: IfNotPresent
          name: classifier
          resources:
            requests:
              cpu: '0.5'
        terminationGracePeriodSeconds: 1
    graph:
      children: []
      name: classifier
      type: MODEL
    name: example

Когда применяется вышеизложенное, это создает развертывание и декларативный HPA (вместе с другими компонентами). Файл развертывания идентичен для сред QA, Alpha и Prod, что приводит к тому, что количество максимальных/минимальных реплик одинаково. 1. Можно ли настроить количество реплик для разных сред? т.е. разные значения максимального/минимального количества реплик для разных окружений (в конфигурационном файле CRD SeldonDeployment).

Примечание: для других (не Seldon) развертываний мы используем декларативный HPA для каждой среды. Но в данном случае это невозможно, так как диспетчер контроллеров Seldon отменяет любые различия между примененным CRD и текущим (сгенерированным из CRD) развертыванием.

2. Более общий вопрос: как мы будем внедрять динамические переменные в развертывания на основе CRD?

0 ответов

Другие вопросы по тегам