Как использовать файл emobase.config в Opensmile?

Я хочу извлечь звуковые функции с помощью opensmile, используя предопределенный файл emobase.config. Однако когда я ввожу.wav и получаю результат только для одного размера кадра.

Я изменил режим кадра на фиксированный и указал значения для fixedstep и fixedsize, но это вызывает ошибку. Я не знаю, будет ли встроенный файл конфигурации, такой как emobase.conf, генерировать вывод для всего видео, а не по кадрам.

Есть ли способ извлекать функции по размеру кадра для встроенных файлов конфигурации? Я получаю кадровый вывод для самогенерируемых файлов конфигурации! Однако для встроенных я не знаю, как это сделать!

1 ответ

Это вызвано настройкой в ​​файле конфигурации. В "конфигурации вывода данных" в конце файла вы найдете "reader.dmLevel=fun". Это означает, что будут распечатаны только функционалы (измерения, сделанные для всего звукового файла, а не для каждого кадра). Если вы измените его на "lld" (дескрипторы низкого уровня), он будет распечатывать их кадр за кадром. Я думаю, это относится ко всем файлам конфигурации emobase, а также к файлу emo_large.

Tl;dr -> замените reader.dmLevel=fun на reader.dmLevel=lld в конфигурации вывода данных вашего файла конфигурации.

Другие вопросы по тегам