Что такое VoiceXML?
В поисках способа использования распознавания речи со вспышкой я пересек пути с VoiceXML. Я прошел через описание W3C, но все же у меня возникло несколько больших сомнений.
Могу ли я просто создать документ VXML и разместить его на своем веб-сервере? какие требования?
Это будет работать?
Можно ли вводить через микрофон через интернет?
Я не могу найти прямой ответ на это.
2 ответа
Вам нужен аналог браузера, который знает, как обрабатывать VoiceXML.
Я работаю в телекоммуникационной отрасли, так что обычно это программное обеспечение, которое подключается к телефонной сети общего пользования либо через одно из телефонных соединений старого стиля, либо через VoIP. Есть много коммерческих и некоторых открытых решений в этой области.
Есть несколько других реализаций, таких как Opera и некоторые исследовательские инициативы в области доступности, но я не видел, чтобы они нашли много основания.
Я бы не стал рассматривать VoiceXML как самый простой способ приблизиться к распознаванию речи. Тем не менее, не существует простых способов и бесплатных решений с открытым исходным кодом. Самый простой путь на платформе Microsoft - взглянуть на уровень Microsoft SAPI и бесплатный, минимальный ASR, который они предоставляют. На стороне Linux, проверьте CMU Sphinx.
VoiceXML - это способ разметки контента, предназначенного для передачи по голосу, обычно по телефону. Так же, как HTML - это способ форматирования контента, который вы хотите отобразить через веб-браузер, так и VoiceXML - это способ доставки его на телефон.
VoiceXML сам по себе не распознает речь. Но многие провайдеры VoiceXML также объединяют механизм распознавания речи (также известный как ASR) со своей платформой VoiceXML.
Если вы ищете способ распознавания голосового ввода, исходящего из микрофона вашего компьютера, в какое-то настольное приложение, то VoiceXML, вероятно, не то, что вам нужно.
В Википедии есть список некоторых программ для распознавания речи по адресу http://en.wikipedia.org/wiki/List_of_speech_recognition_software
Если вы хотите узнать больше о VoiceXML, есть хорошая документация на http://vxml.org/