Как получить данные из StartContinuousRecognitionAsync() клиентской библиотеки Microsoft Cognitive речь

Question

Как получить данные из StartContinuousRecognitionAsync() клиентской библиотеки Microsoft Cognitive речь

Не удается найти способ получения данных из StartContinuousRecognitionAsync(), поскольку я хочу получать данные, чтобы я мог обрабатывать данные только после ключевого слова.

6

speech-to-text microsoft-cognitive

Источник

user7008398 30 июл '18 в 11:36

2 ответа

Другие вопросы по тегам speech-to-text microsoft-cognitive

user1575851 19 ноя '18 в 23:04 2018-11-19 23:04 · Answer 1 · 2018-11-19 23:04

Попробуй это:

...

recognizer = new SpeechSDK.SpeechRecognizer(speechConfig, audioConfig);

recognizer.startContinuousRecognitionAsync(cb?: () => void, err?: (e: string) => void);

//  The event recognizing signals that an intermediate recognition result is received.
recognizer.recognizing = function(s, e){
    console.log('recognizing text', e.result.text);
};

//  The event recognized signals that a final recognition result is received.
recognizer.recognized = function(s, e){
    console.log('recognized text', e.result.text);
    script += e.result.text;
};

user6012268 02 авг '18 в 09:12 2018-08-02 09:12 · Answer 2 · 2018-08-02 09:12

Вы должны "слушать" речевые события, чтобы получить результаты распознавания речи от конечной точки речи. Это объясняется в документах, а также продемонстрировано в примерах.

Вот пример C#: https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/how-to-recognize-speech-csharp

Для получения последнего набора примеров, посетите наш https://aka.ms/csspeech/samples GitHub репозиторий.

Дополнительный комментарий относительно этого утверждения:

Так что я могу обрабатывать данные только после ключевого слова.

Сценарий для SDK заключается в том, что вы транскрибируете аудиопоток в текст (более подробно, сценарий: нажмите кнопку и начинайте говорить). Сценарий не обязательно ждать ключевого слова и начинать транскрибировать с этого момента.

Теоретически возможно "подождать ключевое слово" с помощью SDK, более подходящим для этого является специальный "поиск ключевых слов", возможно, даже с поддержкой низкого энергопотребления! Мы планируем сделать что-то подобное в следующей версии (но пока нет ETA). Функциональность KWS уже доступна в "Пакете разработки речевого устройства (предварительный просмотр)", см. Здесь: https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-devices-sdk

Надеюсь, это поможет Вольфгангу