Метод преобразования речи в текст IBM Watson "Распознать аудио"?

Как recognizeметод, используемый для отправки аудиофайлов в преобразование речи в текст для транскрипции? Где доступен аудиофайл? Есть ли где-нибудь указать путь к локальному файлу, хранилищу Google или URL-адрес загрузки?

В документации говорится:

Хорошо, вот что я хочу сделать! В документации сказано, что это метод:

recognize(params, [callback()])

Я вижу следующие параметры:

var params = {
  objectMode: true,
  contentType: 'audio/flac',
  model: 'en-US_BroadbandModel',
  keywords: ['colorado', 'tornado', 'tornadoes'],
  keywordsThreshold: 0.5,
  maxAlternatives: 3
};

Есть ли параметр для MediaFileUri?

1 ответ

Решение

Ваша ссылка ведет к документации sdk node.js. В этом случае звук отправляется как параметрaudio, который должен быть либо NodeJS.ReadableStream или buffer. Вы можете создать читаемый поток изurl в этом случае вы можете добавить:


params.audio = fs.createReadStream(url);

для этого потребуется URL-адрес, указывающий на аудиофайл, а не на замаскированную веб-страницу с аудиоплеером.

Другие вопросы по тегам