Анализ настроений для оценки продукта
Привет, я работаю над проектом, основанным на анализе настроений для оценки продукта. У меня есть набор данных для хороших слов и отрицательных слов. Когда какой-либо пользователь комментирует на сайте продукт, он автоматически оценивается из 10, поэтому я запутался в методе кластеризации и назад, что решает мою проблему. Plzzx Help Thanks for Advance.
1 ответ
Вы в основном спрашиваете нас, что было бы лучше для вас использовать в качестве классификатора для вашей программы, в то время как мы должны понять, как хранятся ваши данные.
Тем не менее, кажется, у вас есть только два класса, положительный и отрицательный. И вы хотите классифицировать новые данные на основе анализа слов данных.
Ранее я работал над такой проблемой, я использовал алгоритм TF-IDF Роккио для такой классификации. Вы даете ему набор обучающих данных (отрицательных и положительных слов), и он классифицирует то, что позже поступает в систему.
Он основан на векторной классификации и измерении косинусного сходства.
Для получения дополнительной информации вы можете прочитать эту статью. Вы можете найти пример того, как метод работает (на очень маленьких данных) здесь.
Примечание: приведенный пример является разделом проекта, над которым я работал.