Машинное обучение и распознавание изображений: с чего начать?
Я работаю веб-разработчиком уже 15 лет и хотел бы участвовать в машинном обучении. Для этого уже есть определенный сценарий: у нас есть база данных с несколькими миллионами продуктов и одним изображением продукта каждый. Существует также база данных с около 5000 терминов.
Изображение товара связано с несколькими терминами (обычно 3 - 20), при этом ссылка все еще имеет вес (1-100%). Термины всегда носят визуальный характер, то есть они описывают визуально узнаваемую функцию на изображении.
Теперь цель должна состоять в том, чтобы загрузить новое изображение (конечно, с тематической ссылкой) и получить ответ с возможными терминами (включая вероятность) на основе уже классифицированных изображений.
Есть ли у вас какие-либо советы о том, как лучше начать здесь? Есть ли рамки, близкие к этому сценарию? TensorFlow актуален для этой задачи? Какой новый язык я должен выучить?
Большое спасибо!
1 ответ
TensorFlow можно использовать, хотя он довольно "низкоуровневый". Поэтому, если вы только начинаете, вам лучше использовать Keras с бэкэндом TensorFlow, так как он более удобен для пользователя.
Что касается языков, вы, вероятно, будете использовать Python. Так что, если вы этого еще не знаете, вам следует начать. На мой взгляд, вы также можете изучать его на лету, практикуясь, поскольку вы уже разработчик.
Что касается учебных пособий, вам, вероятно, придется выбрать соответствующие фрагменты из множества различных учебных пособий. Вы можете начать что-то вроде этого:
https://www.pyimagesearch.com/2018/05/07/multi-label-classification-with-keras/