Как выбрать количество компонентов в модели гауссовой смеси? Я пытаюсь классифицировать входные аудиосэмплы на основе разговорного языка.

Я пытаюсь классифицировать входные аудиосэмплы на основе разговорного языка на основе характеристик MFCC. Количество разговорных языков, принимаемых во внимание, равно двум.

Что я пробовал до сих пор:

n_компоненты от 32 до 512

Результат

Моя попытка не смогла точно классифицировать аудиосэмплы. Теперь мне не ясно, правильная ли идея выше и как выбрать количество компонентов, чтобы улучшить результат.

1 ответ

Регулирование количества компонентов может быть выполнено путем наблюдения за ответственностью компонентов, это означает проверку того, сколько выборок назначено этому компоненту на основе более высокой вероятности генерации из этого распределения в качестве критериев. После увеличения n_components вы увидите то количество сэмплов, которое наиболее вероятно генерируется компонентами. Если ответственность слишком мала, это может быть признаком перенапряжения.

Не могли бы вы объяснить, как именно работает ваш классификатор?

GMM является генеративной моделью и не может напрямую использоваться в задачах классификации. Наиболее распространенной ошибкой является принятие во внимание, что один гауссов компонент должен соответствовать одному классу.

Другие вопросы по тегам