Есть ли способ управления длиной записи для микрофона и ввода файлов в Julius?

Я пытался транскрибировать некоторые аудио образцы Джулиуса для проекта, включающего преобразование речи в текст. Аудио вход, кажется, прерывается на обоих концах для входов из файлов, и я не вижу способа контролировать время записи для входа от микрофона.

Вывод был довольно приличным, когда я попытался использовать данный пример файла, который длится минуту и ​​состоит из нескольких фраз. Модель точно разграничила фразы и неплохо справилась с их расшифровкой (пара слов вырезана местами)

Это мой файл конфигурации для входа микрофона: -input mic -htkconf wav_config -h ENVR-v5.3.am -hlist ENVR-v5.3.phn -d ENVR-v5.3.lm -v ENVR-v5.3.dct -b 4000 -lmp 12 -6 -lmp2 12 -6 -fallback1pass -multipath -iwsp -iwcd1 max -spmodel sp -no_ccd -sepnum 150 -b2 360 -n 40 -s 2000 -m 8000 -lookuprange 5 -sb 80 -forcedict

и это файл конфигурации для ввода файла

-input file
-filelist test.dbl
-htkconf wav_config
-h ENVR-v5.3.am
-hlist ENVR-v5.3.phn
-d ENVR-v5.3.lm
-v ENVR-v5.3.dct
-b 4000
-lmp 12 -6
-lmp2 12 -6
-walign
-fallback1pass
-multipath
-iwsp
-norealtime
-iwcd1 max
-spmodel sp
-spsegment
-gprune none
-no_ccd
-sepnum 150
-b2 360
-n 40
-s 2000
-m 8000
-lookuprange 5
-sb 80
-forcedict
-cutsilence

Транскрипция всего лишь одно слово "впереди"

фактическое аудио существо - "Он знал мастерство великой молодой актрисы"

0 ответов

Другие вопросы по тегам