Аудиоформат Microsoft Factory для службы распознавания речи
В документации говорится, что "звук должен быть PCM, моно, 16-битная выборка, с частотой дискретизации 8000 Гц или 16000 Гц".
Скажем, я хочу использовать DataClient, я получаю аудио в байтах. Как я могу преобразовать это в это?
1 ответ
Во-первых, вы хотите преобразовать ваш байтовый массив в InputStream. Затем вы создаете AudioInputStream из этого Inputstream, используя вашу AudioSystem. Если у вас есть аудиопоток, у вас есть звук, и вы можете записать его в файл или делать все что угодно.
ByteArrayInputStream oInstream = new ByteArrayInputStream (ayAudioData); AudioInputStream oAIS = AudioSystem.getAudioInputStream (oInstream);