Использование Cortana для диктовки документов

В настоящее время я занимаюсь исследованием Кортаны, так как мне интересно разработать для нее специальные навыки. В настоящее время я использую Cortana для вызова распознавания речи Windows, где я могу затем использовать WSR в качестве средства диктовки текста в Word. Я экспериментирую с этим как возможностью, которую можно использовать для записи и создания стенограммы в режиме реального времени для встреч.

Сейчас это довольно хлопотно, как я обнаружил, и мне любопытно узнать, могу ли я что-то сделать, чтобы интегрировать бота в Cortana для той же цели. Я посмотрел и прочитал немного о Azure Bot Framework, Cognitive Services, LUIS и т. Д.

Можно ли разработать такое решение, используя вышеуказанные сервисы?

Заранее спасибо!

1 ответ

Да, это возможно.

Вы можете подавать потоки в Speech to Text API, а затем разделять аудио на части в соответствии с Offset а также Duration каждой фразы, затем отправьте эти чанки в API распознавания говорящего, чтобы идентифицировать говорящего по имени, чтобы у вас было имя для каждого чанка, чтобы добавить его транскрибированную фразу, и создать диалог из

Поскольку вы рассматриваете его в основном для собраний, упомянутое вами решение было анонсировано некоторое время назад как функция Microsoft Teams, и оно станет общедоступным в ближайшей функции, вы также можете посмотреть демонстрацию, которая была представлена на Build 2018 отсюда

Другие вопросы по тегам