MULAW - аудиоданные передаются слишком медленно
У меня проблема с распознаванием речи в потоковом режиме. Мой источник звука - это протокол VoIP-телефона (SIP), он позволяет выводить аудиоданные в формате: "encoding": "Mulaw", "sampleRateHertz": 8000
- Когда я отправляю новую порцию данных в режиме потоковой передачи, возникает исключение: "Status(StatusCode=OutOfRange, Detail=" Аудиоданные передаются слишком медленно. Поток аудиоданных выполняется приблизительно в реальном времени.")"
- Для проверки я записал данные на диск в этом формате. После того, как я прочитал данные и отправил их частями в потоковом режиме, все работает правильно и результат возвращается.
Оказывается, ошибка появляется только в реальном времени. Я прошу о помощи.
2 ответа
Я нашел ошибку. Я открыл сессию и начал отправлять туда поток через 5-10 секунд, из-за этого произошла ошибка.
Частота дискретизации аудиопотока 8000 и RecognitionConfig.setSampleRate(8000) должны синхронизироваться одинаково,
например, если аудио передается в 8000 и RecognitionConfig.setSamplerate (16000) -> результаты Звук передается слишком медленно
если аудио передается в 41000 и RecognitionConfig.setSamplerate (16000) -> результаты Аудио передается слишком быстро