Автоматическая подгонка распределения к гистограмме в Matlab или Java
У меня есть гистограмма графика одной функции (машинное обучение). Это означает, что по оси X у меня есть несколько значений, которые может принимать объект, а по оси Y у меня есть число вхождений.
Возможно ли в Matlab (или Java) автоматически подгонять распределение вероятностей к этой гистограмме, если я не знаю, какой это тип распределения (нормальное распределение или геометрическое распределение и т. Д.)? Это означает, что Matlab (или Java) должен выяснить, какое это распределение и дать мне оптимальные параметры.
Проблема в том, что у меня много функций, и проверка их вручную занимает слишком много времени.
Изменить: я нашел следующий инструмент Matlab, который выполняет эту работу: http://blogs.mathworks.com/pick/2012/02/10/finding-the-best/ К сожалению, он поддерживает только параметрические модели.
Edit2: я сейчас немного смущен. Я прочитал, что должен нормализовать свою гистограмму, чтобы вместо чисел я видел эмпирические вероятности. Верно ли это, если я хочу попробовать все возможные параметрические распределения и выбрать лучшее? Как можно сделать эту нормализацию в Matlab?
1 ответ
Я не знаю ни одного инструмента, который автоматически находит лучший тип распространения. Но, поскольку реальные данные обычно не соответствуют точно одному распределению и существует произвольное количество возможных распределений, такой инструмент также не имел бы смысла для существования.
Я бы порекомендовал ограничить ваши вопросы определенными моделями распределения (гауссовская, симметричная,...), вычислить наилучшее соответствие для соответствующей модели, сгенерировать параметр вероятности для каждого соответствия, а затем выбрать соответствие / модель с наибольшей вероятностью.