Как open-faas, развернутые в kubernetes, определяют, когда масштабировать функцию вверх или вниз?
В Kubernetes мне немного неясно, какие критерии должны быть соблюдены для открытых фазов, чтобы масштабировать реплики функции вверх или вниз.
Согласно документации:
Автоматическое масштабирование в OpenFaaS позволяет функции увеличивать или уменьшать в зависимости от спроса, представленного различными метриками.
Похоже, что по умолчанию причиной масштабирования являются запросы / секунды, увеличивающиеся / уменьшающиеся.
OpenFaaS поставляется с одним правилом автоматического масштабирования, определенным в смонтированном файле конфигурации для AlertManager. AlertManager считывает метрики использования (количество запросов в секунду) из Prometheus, чтобы узнать, когда следует отправлять оповещение шлюзу API.
И это "предупреждение", отправляемое на шлюз API, приведет к увеличению количества реплик функции.
Я не вижу в документации или AlertManager, где установлен порог для запросов в секунду для увеличения / уменьшения.
Мои общие вопросы:
- Каков порог запросов / сек по умолчанию, который может привести к увеличению?
- Настраивается ли этот порог? Если так, то как?