Есть ли способ управления длиной записи для микрофона и ввода файлов в Julius?
Я пытался транскрибировать некоторые аудио образцы Джулиуса для проекта, включающего преобразование речи в текст. Аудио вход, кажется, прерывается на обоих концах для входов из файлов, и я не вижу способа контролировать время записи для входа от микрофона.
Вывод был довольно приличным, когда я попытался использовать данный пример файла, который длится минуту и состоит из нескольких фраз. Модель точно разграничила фразы и неплохо справилась с их расшифровкой (пара слов вырезана местами)
Это мой файл конфигурации для входа микрофона: -input mic -htkconf wav_config -h ENVR-v5.3.am -hlist ENVR-v5.3.phn -d ENVR-v5.3.lm -v ENVR-v5.3.dct -b 4000 -lmp 12 -6 -lmp2 12 -6 -fallback1pass -multipath -iwsp -iwcd1 max -spmodel sp -no_ccd -sepnum 150 -b2 360 -n 40 -s 2000 -m 8000 -lookuprange 5 -sb 80 -forcedict
и это файл конфигурации для ввода файла
-input file
-filelist test.dbl
-htkconf wav_config
-h ENVR-v5.3.am
-hlist ENVR-v5.3.phn
-d ENVR-v5.3.lm
-v ENVR-v5.3.dct
-b 4000
-lmp 12 -6
-lmp2 12 -6
-walign
-fallback1pass
-multipath
-iwsp
-norealtime
-iwcd1 max
-spmodel sp
-spsegment
-gprune none
-no_ccd
-sepnum 150
-b2 360
-n 40
-s 2000
-m 8000
-lookuprange 5
-sb 80
-forcedict
-cutsilence
Транскрипция всего лишь одно слово "впереди"
фактическое аудио существо - "Он знал мастерство великой молодой актрисы"