Распознавание речи и getUserMedia

Я создаю веб-приложение и планирую использовать для речевого ввода как speechRecognition, так и navigator.getUserMedia.

Я заметил, что мой настольный браузер (Chrome на Mac, версия 31.0.1650.63) дважды запрашивает разрешение на использование микрофона. Хотя это может немного раздражать пользователя, похоже, что распознавание голоса и ввод звука работают.

Тем не менее, если я открываю ту же страницу на Android (Nexus 7, Android v4.4.2; Chrome v31.0.1650.59), он дважды запрашивает разрешение на использование моего микрофона, но я могу использовать только один из двух (в зависимости от того, что было запущено первый). Иногда я также получаю распознавание речи error: "not-allowed" ошибка, хотя я дал разрешение на доступ к микрофону.

Я сделал jsFiddle, здесь: http://jsfiddle.net/5xBpW/

Мой вопрос: есть ли способ выполнить распознавание речи в потоке ввода? Или есть какой-то другой способ заставить обе функции работать в Chrome для Android?

1 ответ

Рассматривали ли вы другие инструменты? Существует замечательный новый инструмент / продукт от Nuance (основанный Рэем К, ныне руководителем Google Engineering), который преобразует голосовые данные в действия, используя собственные алгоритмы обучения, например, машинный интеллект.

Этот инструмент понимает контекст и может применять его к конкретным действиям, чтобы пользователю не приходилось использовать точную фразу:

https://developer.nuance.com/public/index.php?task=mix

Тур: https://developer.nuance.com/views/templates/mix/howDoesMixWork/phone/index.html

Недостатком является то, что вы полагаетесь на третье лицо, но поскольку API, на который вы смотрите, также экспериментален, это может представлять интерес.

Другие вопросы по тегам