Microsoft Speech SDK: пропущенные предложения при расшифровке аудиофайла
Я использую это руководство Microsoft Speech-To-Text для записи пользовательских интервью UX в текстовый файл, который будет отформатирован и загружен для использования командой UX в качестве ссылок при выполнении проектных работ. Для простых записей в одно предложение это работает хорошо, но для более длинных пользовательских интервью (например, от пятнадцати минут до часа) программа пропускает целые предложения и пропускает большие фрагменты аудио. Для этого SDK не так много документации. Может ли Microsoft Speech-To-Text API обрабатывать такой сценарий использования, или я должен изучить другие инструменты?