Обслуживать обученную модель Tensorflow с REST API с помощью Flask?

Question

Обслуживать обученную модель Tensorflow с REST API с помощью Flask?

У меня есть обученная модель Tensorflow, и я хочу использовать метод прогнозирования с REST API. Я могу подумать о том, чтобы использовать Flask для создания простого REST API, который получает JSON в качестве входных данных, а затем вызывает метод предиката в Tensorflow и затем возвращает предсказанный результат на стороне клиента.

Я хотел бы знать, есть ли беспокойство, чтобы сделать это таким образом, особенно в производственной среде?

Большое спасибо!

10

python rest tensorflow machine-learning tensorflow-serving

Источник

user1515940 08 апр '16 в 06:50

3 ответа

Другие вопросы по тегам python rest tensorflow machine-learning tensorflow-serving

user1238847 08 апр '16 в 23:35 2016-04-08 23:35 · Answer 1 · 2016-04-08 23:35

Первое, что приходит мне в голову, это производительность.

Команда TensorFlow, похоже, разработала использование сервера / клиента. Вы можете посмотреть на подачу тензорного потока. По умолчанию он использует gRPC для протокола связи.

3

Источник

user1238847 08 апр '16 в 23:35

user1424575 03 авг '17 в 22:06 2017-08-03 22:06 · Answer 2 · 2017-08-03 22:06

Мы используем Flask + TensorFlow, служащий на работе. Наша установка может быть не самым оптимальным способом обслуживания моделей, но она выполняет свою работу и до сих пор хорошо работает для нас.

Настройка следующая:

Поскольку сборка tfserving занимает вечность, мы создали образ докера (не для поддержки графического процессора или чего-либо еще, но он работает только для обслуживания модели, и это быстрее и лучше, чем обслуживание напрямую из огромного монолита Python/Flask). Образ сервера модели можно найти здесь: https://hub.docker.com/r/epigramai/model-server/
Затем Flask используется для настройки API. Чтобы отправлять запросы на сервер модели, нам нужен клиент для прогнозирования grcp, поэтому мы создали его в Python, который можно импортировать непосредственно в API фляги, https://github.com/epigramai/tfserving_predict_client/.

Хорошо, что модель не обслуживается приложением Flask API. Сервер модели образов Docker может быть легко заменен сервером моделей, работающим на графическом процессоре, скомпилированном для аппаратного обеспечения машин вместо контейнера Docker.

user7953862 22 авг '18 в 03:09 2018-08-22 03:09 · Answer 3 · 2018-08-22 03:09

Я думаю, что одной из ваших главных проблем может быть пакетирование запросов. Например, предположим, что ваша модель представляет собой обученный CNN, такой как VGG, Inception или аналогичный. Если вы внедряете обычную веб-службу с Flask, для каждого полученного вами запроса на прогнозирование (при условии, что вы работаете на графическом процессоре) вы будете делать прогноз одного изображения в графическом процессоре, что может быть неоптимальным, так как вы можете пакетировать подобные запросы, для пример.

Это одна из вещей, которые TensorFlow Serving стремится предложить: возможность объединять запросы для одной и той же модели / подписи в один пакет перед отправкой в графический процессор, более эффективно использовать ресурсы и (потенциально) пропускную способность. Вы можете найти больше информации здесь: https://github.com/tensorflow/serving/tree/master/tensorflow_serving/batching

Тем не менее, это зависит от сценария очень сильно. Но группировка прогнозов - это то, что важно помнить.