Асимметрия питона и куртоз в наивном байесовском классификаторе

Я создаю наивный байесовский классификатор в Python, который сможет угадать, в каком месяце он основан на некоторых погодных данных за один день.

В настоящее время среднее и стандартное отклонение используются для классификации месяца, однако я решил, что добавление асимметрии и эксцесса может помочь в повышении точности.

В настоящее время я использую scipy.stats.norm.cdf для вычисления вероятности, но я не могу найти какую-либо функцию cdf в Python, которая принимает во внимание асимметрию и эксцесс.

Я чувствую, что могу неправильно понимать асимметрию и эксцесс. Асимметрия и эксцесс оказывают влияние на функцию cdf, и поэтому я ожидал, что они будут заданы в качестве параметра.

Что-то не так с моим пониманием асимметрии, эксцессов и функции cdf? Если нет, то где я могу найти реализацию функции cdf в Python, которая учитывает все эти параметры?

1 ответ

Решение

Нормальное распределение, которое вы используете (scipy.stats.norm) и которое обычно используется для моделирования одномерного условного распределения в Наиве Байеса, явно определяется только двумя параметрами - его mean а также std, Нет смысла указывать асимметрию / эксцесс, поскольку они постоянны для вашего распределения (в частности, эксцесс равен 3).

Возможно, вы думаете о распределении Пирсона, которое используется, чтобы соответствовать большему количеству моментов (среднее значение, стандартное отклонение, асимметрия и эксцесс).

http://docs.scipy.org/doc/scipy-0.15.1/reference/generated/scipy.stats.pearson3.html

Другие вопросы по тегам