Источники секретных данных о настроениях?
Я хочу обучить наивного Байеса новым источникам данных, которые раньше не использовались. Я уже посмотрел на корпус Lee & Pang обзоров IMDB и корпус мнений MPQA. Я ищу новые веб-сервисы, которые соответствуют следующим критериям.
- Легко классифицируется - должен иметь рейтинг нравится / не нравится или 5 звезд
- Легко доступны
- Относитесь к новому материалу (менее важному, чем первые два)
Вот несколько примеров, которые я придумала самостоятельно.
- Etsy API
- Гнилые помидоры API
- Yelp API
Любые другие предложения будут высоко оценены =)
2 ответа
Взгляните на sentiment140. У него есть корпус, который вы можете скачать и тренировать. Вы можете легко распространяться на новые твиты.
В более поздней работе Pang&Lee (2008) "Анализ мнений и анализ настроений" здесь есть раздел для общедоступных ресурсов. Он имеет ссылки на эти корпуса.