Метод преобразования речи в текст IBM Watson "Распознать аудио"?

Question

Метод преобразования речи в текст IBM Watson "Распознать аудио"?

Как recognizeметод, используемый для отправки аудиофайлов в преобразование речи в текст для транскрипции? Где доступен аудиофайл? Есть ли где-нибудь указать путь к локальному файлу, хранилищу Google или URL-адрес загрузки?

В документации говорится:

Хорошо, вот что я хочу сделать! В документации сказано, что это метод:

recognize(params, [callback()])

Я вижу следующие параметры:

var params = {
  objectMode: true,
  contentType: 'audio/flac',
  model: 'en-US_BroadbandModel',
  keywords: ['colorado', 'tornado', 'tornadoes'],
  keywordsThreshold: 0.5,
  maxAlternatives: 3
};

Есть ли параметр для MediaFileUri?

0

node.js ibm-cloud ibm-watson speech-to-text ibm-cloud-speech

Источник

user5153354 19 мар '20 в 19:56

1 ответ

Решение

Другие вопросы по тегам node.js ibm-cloud ibm-watson speech-to-text ibm-cloud-speech

user5502306 20 мар '20 в 11:40 2020-03-20 11:40 · Accepted Answer · 2020-03-20 11:40

Ваша ссылка ведет к документации sdk node.js. В этом случае звук отправляется как параметрaudio, который должен быть либо NodeJS.ReadableStream или buffer. Вы можете создать читаемый поток изurl в этом случае вы можете добавить:


params.audio = fs.createReadStream(url);

для этого потребуется URL-адрес, указывающий на аудиофайл, а не на замаскированную веб-страницу с аудиоплеером.