Какие функции лучше всего извлекать из аудио для распознавания речи, MFCC или наборов фильтров журнала?

В настоящее время я работаю над проектом определения ключевых слов в области аудио. Когда дело доходит до извлечения признаков, существует множество подходов, среди которых наиболее популярны MFCC и наборы фильтров журналов. Но какой из них лучше? А почему так?

Заранее спасибо.

0 ответов

Другие вопросы по тегам