Кластер, Кубернетес, Докер. Что выбрать для моего приложения?
Мое приложение представляет собой скрипт bash, который выполняется tesseract
на GNU parallel
, Данные, которые мне нужно обработать, соответствуют 50 ГБ. Это слишком медленно, если я сделаю это на одной виртуальной машине. Мне нужны возможности кластерных вычислений, но я не хочу сам устанавливать несколько виртуальных машин, вместо этого я просто хочу запустить свое приложение (вместе с файлами данных) в кластере Google (Kubernetes?). У меня нет особой ясности в отношении этих концепций. Если кто-то может вести, это было бы здорово.
1 ответ
Может быть непросто узнать все детали оркестровки контейнеров с нуля, когда вы просто обеспокоены этим одним вариантом использования.
Хотя GNU Parrellel хорош для одной машины, похоже, не так много стартовых наборов для его использования в распределенном режиме в облаке.
Я хотел бы рассмотреть поток данных Google, а не раскручивать кластер K8S. Он легко выделяет и очищает и позволяет избежать управления виртуальными машинами и изучения структуры оркестровки.