Кластер, Кубернетес, Докер. Что выбрать для моего приложения?

Мое приложение представляет собой скрипт bash, который выполняется tesseract на GNU parallel, Данные, которые мне нужно обработать, соответствуют 50 ГБ. Это слишком медленно, если я сделаю это на одной виртуальной машине. Мне нужны возможности кластерных вычислений, но я не хочу сам устанавливать несколько виртуальных машин, вместо этого я просто хочу запустить свое приложение (вместе с файлами данных) в кластере Google (Kubernetes?). У меня нет особой ясности в отношении этих концепций. Если кто-то может вести, это было бы здорово.

1 ответ

Может быть непросто узнать все детали оркестровки контейнеров с нуля, когда вы просто обеспокоены этим одним вариантом использования.

Хотя GNU Parrellel хорош для одной машины, похоже, не так много стартовых наборов для его использования в распределенном режиме в облаке.

Я хотел бы рассмотреть поток данных Google, а не раскручивать кластер K8S. Он легко выделяет и очищает и позволяет избежать управления виртуальными машинами и изучения структуры оркестровки.

Другие вопросы по тегам