Непрерывное распознавание речи

Я создаю приложение для Android, которое реализует функции преобразования текста в текст. Я хочу зарегистрировать длинную звуковую дорожку (около 2 часов) и сохранить ее в аудиофайле, а также преобразовать в текст. SpeechRecognizer от Android не является полезным для этих целей, потому что он не позволяет распознавать речь более чем на несколько секунд и не возвращает аудиофайл. Я думал о сегментации звуковой дорожки, но я не знаю, как перенаправить входной поток SpeechRecognizer из michrophone в существующий файл. Есть идеи, чтобы сделать это?

0 ответов

Другие вопросы по тегам