Машинное обучение Amazon для анализа настроений

Насколько гибка или полезна платформа машинного обучения Amazon для анализа настроений и анализа текста?

2 ответа

Решение

Вы можете построить хорошую модель машинного обучения для анализа настроений с помощью Amazon ML.

Вот ссылка на проект GitHub, который делает именно это: https://github.com/awslabs/machine-learning-samples/tree/master/social-media

Поскольку Amazon ML поддерживает контролируемое обучение, а также текст в качестве входного атрибута, вам необходимо получить образец данных, которые были помечены, и построить модель на его основе.

Маркировка может быть основана на Mechanical Turk, как в примере выше, или с использованием интернов ("лето наступает"), чтобы сделать эту метку для вас. Преимущество наличия вашей конкретной маркировки состоит в том, что вы можете поместить свою логику в модель. Например, разница между "пиво было холодным" или "стейк был холодным", где один положительный, а другой отрицательный, - это то, что родовой системе будет трудно выучить.

Вы также можете попробовать поиграть с некоторыми примерами данных из вышеприведенного проекта или из этого конкурса Kaggle для анализа настроений в обзорах фильмов: https://www.kaggle.com/c/sentiment-analysis-on-movie-reviews. Я использовал Amazon ML для этого набора данных и довольно легко и быстро получил довольно хорошие результаты.

Обратите внимание, что вы также можете использовать Amazon ML для запуска прогнозов в реальном времени на основе модели, которую вы строите, и вы можете использовать ее для немедленного реагирования на отрицательные (или положительные) входные данные. Смотрите больше здесь: http://docs.aws.amazon.com/machine-learning/latest/dg/interpreting_predictions.html

Это здорово для начала. Настоятельно рекомендуем вам изучить это как вариант. Однако осознайте ограничения:

  • вы захотите построить конвейер, потому что модели неизменны - вы должны построить новую модель, чтобы включить новые обучающие данные (или новые гиперпараметры, если на то пошло)
  • вы резко ограничены в настройке вашей системы
  • это только контролируемое обучение
  • переменная назначения не может быть другим текстом, только числом, логическим или категориальным значением
  • вы не можете экспортировать модель и импортировать ее в другую систему, если хотите - модель - это черный ящик

Выгоды:

  • вам не нужно управлять какой-либо инфраструктурой
  • хорошо интегрируется с источниками данных AWS
  • UX это хорошо
  • алгоритмы выбраны для вас, так что вы можете быстро протестировать и посмотреть, подходит ли оно для вашего проблемного пространства.