Метод преобразования речи в текст IBM Watson "Распознать аудио"?
Как recognize
метод, используемый для отправки аудиофайлов в преобразование речи в текст для транскрипции? Где доступен аудиофайл? Есть ли где-нибудь указать путь к локальному файлу, хранилищу Google или URL-адрес загрузки?
В документации говорится:
Хорошо, вот что я хочу сделать! В документации сказано, что это метод:
recognize(params, [callback()])
Я вижу следующие параметры:
var params = {
objectMode: true,
contentType: 'audio/flac',
model: 'en-US_BroadbandModel',
keywords: ['colorado', 'tornado', 'tornadoes'],
keywordsThreshold: 0.5,
maxAlternatives: 3
};
Есть ли параметр для MediaFileUri
?
1 ответ
Решение
Ваша ссылка ведет к документации sdk node.js. В этом случае звук отправляется как параметрaudio
, который должен быть либо NodeJS.ReadableStream
или buffer
. Вы можете создать читаемый поток изurl
в этом случае вы можете добавить:
params.audio = fs.createReadStream(url);
для этого потребуется URL-адрес, указывающий на аудиофайл, а не на замаскированную веб-страницу с аудиоплеером.