Как рассчитывается вероятность вероятности в sklearn multinomialnb?
Мы можем вывести вероятность класса и вероятность объекта (правдоподобие), используя class_log_prior и feature_log_prob_ . Когда я пытаюсь сравнить свои собственные расчеты с MultinomialNB sklearn, предыдущий журнал классов совпадает, но не с ошибкой журнала возможностей. Я смотрел видео об этом на YouTube и следовал уравнению на их сайте здесь http://scikit-learn.org/stable/modules/naive_bayes.html. Однако значение нашего журнала возможностей не совпадает, У меня есть много особенностей, и это было категорично, как слово, постаг, следующее слово, следующий текст, биграмма и т. Д.
Что я получаю от чтения уравнения
P(X|y)=(номер объекта X в классе y + альфа)/(номер всего объекта в классе y + номер уникального объекта во всем классе)
Так что, если у меня есть функция Word:Hello, и мой класс - это Named Entity, OTHER, и я установлю альфа на 1.0, он станет:
P (word: hello | OTHER) = (количество слов: Hello в классе OTHER + 1)/(количество всех объектов в классе OTHER + количество уникальных объектов во всем классе)
Это правильно? Или, может быть, я не прав в представлении уравнения с более чем одной функцией? Кто-нибудь считает это раньше? Или может привести какой-нибудь пример в excel?