Кто-нибудь успешно использовал CMU Sphinx для программирования с помощью распознавания голоса

Question

Кто-нибудь успешно использовал CMU Sphinx для программирования с помощью распознавания голоса

Я хочу начать делать часть своего кодирования с помощью программного обеспечения для распознавания голоса (возможно, 10-20% работы, которую я делаю).

Я видел, что некоторые люди имели успех с программным обеспечением Dragon Natural Speaking (DNS), но я использую Mac, и, к сожалению, Dragon работает только на Windows.

Кто-нибудь использовал для программирования Сфинкс с открытым исходным кодом Carnegie Melon http://cmusphinx.sourceforge.net/?

Есть ли другие варианты, которые я мог бы реализовать на Mac? Я не против потратить немного денег, чтобы сделать это реальностью. В идеале это была бы система, в которую я мог бы добавлять свои собственные команды. (Посмотрите на удивительные вещи, которые этот парень сделал с DNS: https://www.youtube.com/watch?v=8SkdfdXWYaI)

9

workflow speech-recognition voice-recognition

Источник

user765702 20 май '13 в 04:20

1 ответ

Другие вопросы по тегам workflow speech-recognition voice-recognition

user1746434 26 окт '15 в 18:55 2015-10-26 18:55 · Answer 1 · 2015-10-26 18:55

Существует плагин прототипа для IDEA, написанный разработчиками JetBrains. Работа была сделана во время одного из их хакатонов.

0

Источник

user1746434 26 окт '15 в 18:55

user13847890 02 июл '20 в 10:19 2020-07-02 10:19 · Answer 2 · 2020-07-02 10:19

Если вас не устраивает Sphinx, я бы порекомендовал Kaldi как адаптируемый совместимый распознаватель речи с открытым исходным кодом. С помощью kaldi вы можете адаптировать собственную грамматику и команды и переобучить базовые модели. Кроме того, есть python-wrapper, который делает использование Kaldis простым и удобным.