Самая быстрая библиотека распознавания речи C++
Я знаю, что это общий вопрос, но все же я хочу знать, какая библиотека для быстрого распознавания речи в C++?
В настоящее время я использую Microsoft SAPI с kniect. Он отлично работает и распознает слова, но его скорость медленная, иногда требуется 1,2 секунды, чтобы распознать слово, и в моем случае это отставание вызывает много проблем взаимодействия для пользователя.
Я проверил образец, предоставленный kinect, в котором черепаха движется влево вправо в соответствии с распознанными словами, но даже это немного медленно.
Поэтому мне было интересно, есть ли какая-нибудь более быстрая библиотека, чем sapi, которую можно использовать в случаях, когда робот использует распознавание голоса, вы говорите "влево", а затем "вправо", но робот продолжает двигаться влево и поворачивает вправо через 1,2 секунды, это немного разочарование для пользователя.
1 ответ
Проблема не в быстром, а в правильном способе использования API. Распознавание речи - это трудоемкий процесс, поэтому основная хитрость заключается в том, чтобы начать распознавание звука сразу после его записи параллельно с записью. Затем к моменту окончания фразы вы получите почти все результаты и сможете немедленно отреагировать.
Таким образом можно достичь времени отклика 0,2 секунды, но для его реализации требуется более гибкий API. Хорошим выбором является CMUSphinx, платформа распознавания речи с открытым исходным кодом, которую вы можете использовать для своей реализации.