Анализ настроений с использованием персептрона

Я пытаюсь реализовать анализ чувств с использованием персептрона, чтобы получить лучшую точность в python. Я заблудился в математике, которая его огорчает, и мне нужно простое объяснение того, как ее переносить, чтобы использовать для анализа настроений. Уже опубликована статья на ту же тему: http://aclweb.org/anthology/P/P11/P11-1015.pdf

Кто-нибудь здесь сможет объяснить подробно и ясно? У меня есть учебный набор данных и набор тестовых данных по 5000 обзоров каждый, и я получаю точность 78% с сумкой слов. Мне сказали, что персептрон даст мне точность в 88%, и мне интересно ее реализовать.

1 ответ

Решение

Перцептрон - это простой двоичный классификатор, который работает с векторами фиксированного размера из R^n в качестве входных данных. Таким образом, чтобы использовать его, вы должны закодировать каждый из ваших документов в такой реальный вектор. Это может быть, например, представление с набором слов (где каждое измерение соответствует одному значению, а значение - к числу вхождений) или любое "более сложное" представление (одно из которых описано в прилагаемой статье).

Таким образом, чтобы "перенести" персептрон на анализ настроений, вы должны выяснить некоторую функцию f, которая с документом возвращает реальный вектор, а затем обучить вас персептрону по парам.

(f(x),0) для отрицательных отзывов

(f(x),1) для положительных отзывов

Другие вопросы по тегам