Как использовать файл emobase.config в Opensmile?
Я хочу извлечь звуковые функции с помощью opensmile, используя предопределенный файл emobase.config. Однако когда я ввожу.wav и получаю результат только для одного размера кадра.
Я изменил режим кадра на фиксированный и указал значения для fixedstep и fixedsize, но это вызывает ошибку. Я не знаю, будет ли встроенный файл конфигурации, такой как emobase.conf, генерировать вывод для всего видео, а не по кадрам.
Есть ли способ извлекать функции по размеру кадра для встроенных файлов конфигурации? Я получаю кадровый вывод для самогенерируемых файлов конфигурации! Однако для встроенных я не знаю, как это сделать!
1 ответ
Это вызвано настройкой в файле конфигурации. В "конфигурации вывода данных" в конце файла вы найдете "reader.dmLevel=fun". Это означает, что будут распечатаны только функционалы (измерения, сделанные для всего звукового файла, а не для каждого кадра). Если вы измените его на "lld" (дескрипторы низкого уровня), он будет распечатывать их кадр за кадром. Я думаю, это относится ко всем файлам конфигурации emobase, а также к файлу emo_large.
Tl;dr -> замените reader.dmLevel=fun на reader.dmLevel=lld в конфигурации вывода данных вашего файла конфигурации.