Неопределенный ответ во внутреннем балансировщике нагрузки GCP

Я использую внутренний балансировщик нагрузки в GCP для маршрутизации трафика между двумя виртуальными машинами, чувствительными к памяти.
В настоящее время для целей тестирования я пытаюсь использовать только 1 виртуальную машину. Таким образом, все время трафик направлялся на один сервер.

Я использую JavaScript в клиенте для отправки запросов к балансировщику нагрузки. Пример приведен ниже:

      try {
   let response = await axios.post(LoadBalancerURL, data,{timeout : 100 * 1000});
   // process the response 
   return;
} catch {
   console.log("error in query : ", err);
}

Для каждого запроса я указал желаемый тайм-аут на стороне клиента, поэтому, если сервер не отвечает в течение 100 секунд, я прекращаю соединение.

Однако в этом случае тайм-аут не достигается, и запрос к балансировщику нагрузки ожидает неопределенное время и приводит к сбою приложения.

Я также тестировал напрямую, вызывая серверные виртуальные машины, и не столкнулся с упомянутой выше проблемой.

Было бы очень полезно, если бы кто-нибудь мог помочь мне с основной причиной и решением этой проблемы.

Обновление 1.
Обновление вопроса с более подробной информацией:

Почтовый запрос размещается в сервисе запуска облака GCP.
В настоящее время я тестирую только один внутренний сервер в настройке балансировщика нагрузки, а также пытался отправить запрос, когда сервер не работает. Как и ожидалось, я получил ответ об ошибке (без задержки).

Настройки балансировщика нагрузки приведены ниже: Тип серверной части: Протокол
группы экземпляров : Тайм-аут HTTP: 200 секунд Ограничение скорости: Я не вижу никаких опций в GCP.


Обновление 2.
Я провел еще несколько тестов, и ниже приведены результаты.

Ниже приведен снимок экрана из журналов Loadbalancer. Я вижу, что он отвечает обратно клиенту (служба запуска облака через 4,106 секунды).

Однако я не вижу такого же ответа в ответе аксиоса.

Обновление 3

Конфигурация серверной части балансировщика нагрузки приведена ниже:
Режим балансировки установлен на использование с указанными ниже значениями.

  • Максимальная загрузка бэкэнда - 80%
  • Максимум РПС - 2
  • Оценка - за экземпляр
  • Вместимость - 100%

Спасибо,
КК