Описание тега kubeflow

Kubeflow - это набор инструментов для машинного обучения с несколькими архитектурами и облаками для Kubernetes.
2 ответа

Как удалить кластер Kubeflow?

Я пытался установить KubeFlow, но использовал неправильный регион, как его удалить? Я пытался сделать это из Kubernetes clsuter, но продолжаю получать ту же ошибку, когда пытаюсь создать новую: Error 409: 'projects/dpe-cloud-mle/global/deployments/k…
1 ответ

Как развернуть jupyterHub с помощью kubeflow

Когда я применяю ks по умолчанию -c jupyter для развертывания jupyterHub, он всегда отвечает на следующие ошибки: [I 2019-01-09 14: 28: 52.866 Приложение JupyterHub:871] Запись cookie_secret в /jupyterhub_cookie_secret [I 2019-01-09 14:28:52.880 ale…
09 янв '19 в 14:40
1 ответ

Kubeflow: Image Pull -> на устройстве не осталось места

Есть ли способ очистить все кэшированные образы докеров и т. Д. Из настроек kubernetes, которые могли бы освободить место на главных узлах? Я пытаюсь установить развертывание, но kubernetes предлагает "на устройстве не осталось места" при извлечении…
15 янв '19 в 14:02
0 ответов

Как развернуть N независимых обучающих заданий Python / PyTorch в N облачных экземплярах GPU?

У меня есть N независимых python tasks/scrips/functionCalls, которые я хотел бы отправить в N google cloud gpu instance, чтобы они могли работать параллельно, но там так много информации (шума), что я не знаю, с чего начать, В частности, мне нужно о…
0 ответов

Невозможно получить доступ к интерфейсу для kubeflow

Я установил Kubeflow на Ubuntu 18.04, работающую на microk8s. Для этого я следовал инструкциям на https://www.kubeflow.org/docs/started/getting-started/. Кажется, все работает правильно: steven@linux:~/my-kf$ microk8s.kubectl -n kubeflow get all NAM…
07 фев '19 в 06:43
0 ответов

Как Хоровод координирует обучение?

Я пытаюсь научиться обучать распределенную модель Keras и найти horovod, я создал кластер Google Cloud Kubernetes (GKE) и установил Kubeflow с mpi-оператором и драйверами nvdia. Я попытался запустить образец https://github.com/uber/horovod/blob/mast…
09 фев '19 в 22:19
0 ответов

Установка Pip из частного репо Google Source

Как выполнить установку из частного репозитория через репозитории Google Cloud Source? Похоже на то, что должно быть возможно. !pip install gcloud source repos clone [REPOSITORY_NAME] --project=[PROJECT_NAME]
1 ответ

Каков наилучший способ передачи данных изображения (tfrecords) из GCS в вашу модель?

Я поставил себе задачу решить набор данных MNIST Skin Cancer, используя только Google Cloud. Использование GCS и Kubeflow в Google Kubernetes. Я преобразовал данные из jpeg в tfrecord с помощью следующего скрипта: https://github.com/tensorflow/tpu/b…
1 ответ

Развертывание конвейеров Kubeflow с использованием cli или API, а не в пользовательском интерфейсе

Конвейеры Kubeflow можно создать, загрузив пользовательский интерфейс конвейеров. Но раздражает разработка конвейеров, повторение некоторых изменений и повторная загрузка. Похоже, нет соответствующих документов. Можно ли развертывать конвейеры Kubef…
06 фев '19 в 15:24
1 ответ

Как периодически запускать трубопроводы Kubeflow?

У меня есть конвейеры на Kubeflow, конвейеры можно запускать на пользовательском интерфейсе конвейеров. Мои конвейеры должны быть выполнены в указанное время как crontab. Как я могу периодически выполнять конвейеры?
06 фев '19 в 14:59
0 ответов

Сервер моделей Kubeflow: Как загрузить модель.pb по ссылке http

У меня есть развертывание с сервером модели kubeflow, которое должно выводить модель. Сервер модели запускается правильно, но, к сожалению, я не могу получить модель на сервер без корзины, которая монтирует файловую систему. Я знаю, как сделать это …
12 фев '19 в 13:01
1 ответ

Kubeflow на kubernetes, функция применения ksonnet не реагирует должным образом?

Я пробую следующий кодовый ярлык: https://codelabs.developers.google.com/codelabs/kubeflow-introduction/index.html Когда я хочу применить свой контейнер к кластеру, оболочка зависает и через пару минут возвращает "Killed". Это текущая структура файл…
1 ответ

Как обеспечить доступ к Kubeflow на GKE?

Я следовал за шагами в Двигателе Kubernetes для Kubeflow. Развертывание прошло успешно, и все модули / службы работают, включая конечную точку на https://<name>.endpoints.<project>.cloud.goog/с правильным <name> а также <project…
0 ответов

Kubeflow: Ошибка при загрузке общих библиотек: libcuda.so.1

Я пытаюсь запустить следующий пример из этого репо: -> https://github.com/kubeflow/examples/tree/master/object_detection Каждый шаг учебника работает отлично, но, к сожалению, модуль всегда падает сразу после запуска из-за этой отсутствующей библиот…
16 янв '19 в 14:13
0 ответов

Как запустить jupyterhub gpu на kubeflow последней версии v0.4.1

Привет, я смог развернуть kubeflow v0.4.1, но jupyterhub не вращает экземпляры графического процессора, только процессор. Существует также лазурное хранилище для kubeflow, но версия слишком старая.
26 фев '19 в 20:04
1 ответ

Предсказание обнаружения обслуживающего объекта Tensorflow с использованием Kubeflow

Я следовал инструкциям, приведенным в этом посте, чтобы развернуть мою модель тензорного потока для прогнозирования с использованием графических процессоров в Google Kubernetes Engine и Kubeflow. Я представил службу как балансировщик нагрузки, измен…
1 ответ

Развертывание конвейера Computer Vision с использованием Kubeflow в Kubernetes

Можно ли запустить конвейер компьютерного зрения с Kubeflow? Это хорошая идея, будет ли она работать эффективно? Предположим, что этапами конвейера должны быть сегментация изображения, некоторая фильтрация, а что нет (gpu до сих пор включал opencv) …
25 дек '18 в 00:00
0 ответов

Трубопроводы Kubeflow - передача строки на выход

Какой самый простой способ отправить строку через выходные данные в конвейере Kubeflow? Я хотел бы создать временную метку в моем первом компоненте, а затем отправлять эту временную метку на каждый последующий шаг в конвейере. Единственный способ от…
31 май '19 в 15:37
1 ответ

Доступ к Kubeflow UI теми же пользователями домена

Kubeflow развернут на GKE. тогда доступ к интерфейсу в порядке. Но другие пользователи того же домена не могут получить к нему доступ. Это нравится ниже изображения. Как я могу дать разрешение другим пользователям? Благодарю. ht tps://i.st ack.imgur…
24 апр '19 в 03:26
0 ответов

Распределенный тензорный поток в Kubeflow - NotFoundError

Я следую руководству по сборке kubeflow на GCP. На последнем шаге, после развертывания кода и обучения с использованием CPU. kustomize build . |kubectl apply -f - Распределенный тензорный поток сталкивается с этой проблемой tenorflow.python.framewor…
27 май '19 в 08:49