Классификация изображений в Azure Machine Learning
Я готовлюсь к экзамену по машинному обучению Azure, и вот этот вопрос меня смущает.
Вы разрабатываете рабочий процесс машинного обучения Azure. У вас есть набор данных, который содержит два миллиона больших цифровых фотографий. Вы планируете обнаружить присутствие деревьев на фотографиях. Вы должны убедиться, что ваша модель поддерживает следующее:
Решение: Вы создаете эксперимент по машинному обучению, который реализует модуль Multiclass Decision Jungle. Соответствует ли это цели?
Решение: Вы создаете эксперимент по машинному обучению, который реализует модуль Multiclass Neural Network. Соответствует ли это цели?
Ответ на первый вопрос - "Нет", а на второй - "Да", но я не могу понять, почему Multiclass Decision Jungle не соответствует цели, поскольку является классификатором. Может кто-нибудь объяснить мне причину?
1 ответ
Я полагаю, что это часть серии вопросов, которые представляют один и тот же сценарий. И в сценарии должны быть определенные ограничения. Более того, если вы посмотрите документацию Azure:
Однако недавние исследования показали, что глубокие нейронные сети (DNN) со многими слоями могут быть очень эффективными в сложных задачах, таких как распознавание изображений или речи. Последовательные слои используются для моделирования возрастающих уровней семантической глубины.
Таким образом, Azure рекомендует использовать нейронные сети для классификации изображений. Помните, что цель экзамена состоит в том, чтобы проверить вашу способность разрабатывать решения для обработки данных с использованием Azure, поэтому лучше использовать их официальную документацию в качестве справочного материала.
И по сравнению с другими решениями:
- Вы создаете записную книжку Azure, которая поддерживает Microsoft Cognitive Toolkit.
- Вы создаете эксперимент по машинному обучению, который реализует модуль Multiclass Decision Jungle.
- Вы создаете конечную точку для API компьютерного зрения.
- Вы создаете эксперимент по машинному обучению, который реализует модуль Multiclass Neural Network.
- Вы создаете записную книжку Azure, которая поддерживает Microsoft Cognitive Toolkit.
Есть только 2 модуля Azure ML Studio, и, поскольку вопрос заключается в создании рабочего процесса, я думаю, что мы можем выбирать только между ними. (На самом деле CNTK - это лучшее решение, поскольку оно позволяет построить глубокую нейронную сеть с использованием ReLU, тогда как AML Studio этого не делает, а вызов API вообще не относится к науке о данных).
Наконец, я согласен с другими участниками, что этот вопрос абсурден. Надеюсь это поможет.
Этот вопрос действительно является частью серии вопросов, которые представляют один и тот же сценарий с несколькими вариантами. Оба решения подходят к проблеме как к проблеме мультиклассовой классификации, и это правильно. Однако ключевым элементом здесь является размерность.
Ваши входные данные (изображения) очень многомерны, что требует подхода глубокого обучения, чтобы быть эффективными. Джунгли принятия решений не смогут эффективно учиться в таком многомерном пространстве функций, где у NN больше шансов сделать это.
Я надеюсь, что это помогает.