Адаптер текста и речи IBM Voice Gateway

Я пытаюсь создать текстовый речевой адаптер AWS для голосового шлюза IBM, поскольку он поддерживает язык хинди. Выходные данные aws polly - PCM. Согласно документации VGW, мне нужно конвертировать PCM в Ulaw. Я использую образец tts-адаптера, предоставленный Ibm в качестве базы.

Я пытался использовать модуль узла "alawmulaw", чтобы сделать преобразование, но я все еще слышу статический в VGW.

Кто-то сказал мне, чтобы я свободно использовал FFmpeg, но я не знаю, как преобразовать буфер, который я получаю от polly, и передать его в поток.

было бы здорово, если бы кто-нибудь смог мне помочь

С наилучшими пожеланиями Sumit

0 ответов

Другие вопросы по тегам