Распознавание речи в клиент-серверном приложении
Я должен реализовать распознавание речи в клиент-серверном приложении, программное обеспечение должно быть бесплатным и работать на любом браузере (кроме IE). Идея состоит в том, чтобы создать значок с микрофоном, когда пользователь нажимает на него, система распознавания речи активирует и записывает ввод с микрофона, и когда пользователь говорит такие команды, как "открыть X", "домашняя страница", "выйти", система будет перенаправлять на другой сайт, вернитесь на домашнюю страницу или выйдите из приложения. Каков наилучший способ сделать это? Делать это на стороне клиента или на стороне сервера? Какое программное обеспечение использовать? Если несколько, как интегрировать?
У меня была идея отправить запрос на сервер (нажав на значок) и начать запись на стороне сервера и отправить распознанный текст на стороне клиента и выполнить определенные операции на основе выходных данных, но я не думаю, что это возможно, или используйте MediaDevices на стороне клиента для записи аудиовхода и отправки его в pocket-sphinx.js (все еще на стороне клиента), чтобы получить от него текст и выполнить определенные операции. Я в основном застрял..