Аудиоформат Microsoft Factory для службы распознавания речи

В документации говорится, что "звук должен быть PCM, моно, 16-битная выборка, с частотой дискретизации 8000 Гц или 16000 Гц".

Скажем, я хочу использовать DataClient, я получаю аудио в байтах. Как я могу преобразовать это в это?

1 ответ

Во-первых, вы хотите преобразовать ваш байтовый массив в InputStream. Затем вы создаете AudioInputStream из этого Inputstream, используя вашу AudioSystem. Если у вас есть аудиопоток, у вас есть звук, и вы можете записать его в файл или делать все что угодно.

ByteArrayInputStream oInstream = new ByteArrayInputStream (ayAudioData); AudioInputStream oAIS = AudioSystem.getAudioInputStream (oInstream);

Другие вопросы по тегам