Асимметрия питона и куртоз в наивном байесовском классификаторе
Я создаю наивный байесовский классификатор в Python, который сможет угадать, в каком месяце он основан на некоторых погодных данных за один день.
В настоящее время среднее и стандартное отклонение используются для классификации месяца, однако я решил, что добавление асимметрии и эксцесса может помочь в повышении точности.
В настоящее время я использую scipy.stats.norm.cdf для вычисления вероятности, но я не могу найти какую-либо функцию cdf в Python, которая принимает во внимание асимметрию и эксцесс.
Я чувствую, что могу неправильно понимать асимметрию и эксцесс. Асимметрия и эксцесс оказывают влияние на функцию cdf, и поэтому я ожидал, что они будут заданы в качестве параметра.
Что-то не так с моим пониманием асимметрии, эксцессов и функции cdf? Если нет, то где я могу найти реализацию функции cdf в Python, которая учитывает все эти параметры?
1 ответ
Нормальное распределение, которое вы используете (scipy.stats.norm) и которое обычно используется для моделирования одномерного условного распределения в Наиве Байеса, явно определяется только двумя параметрами - его mean
а также std
, Нет смысла указывать асимметрию / эксцесс, поскольку они постоянны для вашего распределения (в частности, эксцесс равен 3).
Возможно, вы думаете о распределении Пирсона, которое используется, чтобы соответствовать большему количеству моментов (среднее значение, стандартное отклонение, асимметрия и эксцесс).
http://docs.scipy.org/doc/scipy-0.15.1/reference/generated/scipy.stats.pearson3.html