Как получить данные из StartContinuousRecognitionAsync() клиентской библиотеки Microsoft Cognitive речь
Не удается найти способ получения данных из StartContinuousRecognitionAsync(), поскольку я хочу получать данные, чтобы я мог обрабатывать данные только после ключевого слова.
2 ответа
Попробуй это:
...
recognizer = new SpeechSDK.SpeechRecognizer(speechConfig, audioConfig);
recognizer.startContinuousRecognitionAsync(cb?: () => void, err?: (e: string) => void);
// The event recognizing signals that an intermediate recognition result is received.
recognizer.recognizing = function(s, e){
console.log('recognizing text', e.result.text);
};
// The event recognized signals that a final recognition result is received.
recognizer.recognized = function(s, e){
console.log('recognized text', e.result.text);
script += e.result.text;
};
Вы должны "слушать" речевые события, чтобы получить результаты распознавания речи от конечной точки речи. Это объясняется в документах, а также продемонстрировано в примерах.
Вот пример C#: https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/how-to-recognize-speech-csharp
Для получения последнего набора примеров, посетите наш https://aka.ms/csspeech/samples GitHub репозиторий.
Дополнительный комментарий относительно этого утверждения:
Так что я могу обрабатывать данные только после ключевого слова.
Сценарий для SDK заключается в том, что вы транскрибируете аудиопоток в текст (более подробно, сценарий: нажмите кнопку и начинайте говорить). Сценарий не обязательно ждать ключевого слова и начинать транскрибировать с этого момента.
Теоретически возможно "подождать ключевое слово" с помощью SDK, более подходящим для этого является специальный "поиск ключевых слов", возможно, даже с поддержкой низкого энергопотребления! Мы планируем сделать что-то подобное в следующей версии (но пока нет ETA). Функциональность KWS уже доступна в "Пакете разработки речевого устройства (предварительный просмотр)", см. Здесь: https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/speech-devices-sdk
Надеюсь, это поможет Вольфгангу