Кто-нибудь успешно использовал CMU Sphinx для программирования с помощью распознавания голоса
Я хочу начать делать часть своего кодирования с помощью программного обеспечения для распознавания голоса (возможно, 10-20% работы, которую я делаю).
Я видел, что некоторые люди имели успех с программным обеспечением Dragon Natural Speaking (DNS), но я использую Mac, и, к сожалению, Dragon работает только на Windows.
Кто-нибудь использовал для программирования Сфинкс с открытым исходным кодом Carnegie Melon http://cmusphinx.sourceforge.net/?
Есть ли другие варианты, которые я мог бы реализовать на Mac? Я не против потратить немного денег, чтобы сделать это реальностью. В идеале это была бы система, в которую я мог бы добавлять свои собственные команды. (Посмотрите на удивительные вещи, которые этот парень сделал с DNS: https://www.youtube.com/watch?v=8SkdfdXWYaI)
1 ответ
Существует плагин прототипа для IDEA, написанный разработчиками JetBrains. Работа была сделана во время одного из их хакатонов.
Если вас не устраивает Sphinx, я бы порекомендовал Kaldi как адаптируемый совместимый распознаватель речи с открытым исходным кодом. С помощью kaldi вы можете адаптировать собственную грамматику и команды и переобучить базовые модели. Кроме того, есть python-wrapper, который делает использование Kaldis простым и удобным.