Распознавание речи и getUserMedia
Я создаю веб-приложение и планирую использовать для речевого ввода как speechRecognition, так и navigator.getUserMedia.
Я заметил, что мой настольный браузер (Chrome на Mac, версия 31.0.1650.63) дважды запрашивает разрешение на использование микрофона. Хотя это может немного раздражать пользователя, похоже, что распознавание голоса и ввод звука работают.
Тем не менее, если я открываю ту же страницу на Android (Nexus 7, Android v4.4.2; Chrome v31.0.1650.59), он дважды запрашивает разрешение на использование моего микрофона, но я могу использовать только один из двух (в зависимости от того, что было запущено первый). Иногда я также получаю распознавание речи error: "not-allowed"
ошибка, хотя я дал разрешение на доступ к микрофону.
Я сделал jsFiddle, здесь: http://jsfiddle.net/5xBpW/
Мой вопрос: есть ли способ выполнить распознавание речи в потоке ввода? Или есть какой-то другой способ заставить обе функции работать в Chrome для Android?
1 ответ
Рассматривали ли вы другие инструменты? Существует замечательный новый инструмент / продукт от Nuance (основанный Рэем К, ныне руководителем Google Engineering), который преобразует голосовые данные в действия, используя собственные алгоритмы обучения, например, машинный интеллект.
Этот инструмент понимает контекст и может применять его к конкретным действиям, чтобы пользователю не приходилось использовать точную фразу:
https://developer.nuance.com/public/index.php?task=mix
Тур: https://developer.nuance.com/views/templates/mix/howDoesMixWork/phone/index.html
Недостатком является то, что вы полагаетесь на третье лицо, но поскольку API, на который вы смотрите, также экспериментален, это может представлять интерес.