Самая быстрая библиотека распознавания речи C++

Я знаю, что это общий вопрос, но все же я хочу знать, какая библиотека для быстрого распознавания речи в C++?

В настоящее время я использую Microsoft SAPI с kniect. Он отлично работает и распознает слова, но его скорость медленная, иногда требуется 1,2 секунды, чтобы распознать слово, и в моем случае это отставание вызывает много проблем взаимодействия для пользователя.

Я проверил образец, предоставленный kinect, в котором черепаха движется влево вправо в соответствии с распознанными словами, но даже это немного медленно.

Поэтому мне было интересно, есть ли какая-нибудь более быстрая библиотека, чем sapi, которую можно использовать в случаях, когда робот использует распознавание голоса, вы говорите "влево", а затем "вправо", но робот продолжает двигаться влево и поворачивает вправо через 1,2 секунды, это немного разочарование для пользователя.

1 ответ

Проблема не в быстром, а в правильном способе использования API. Распознавание речи - это трудоемкий процесс, поэтому основная хитрость заключается в том, чтобы начать распознавание звука сразу после его записи параллельно с записью. Затем к моменту окончания фразы вы получите почти все результаты и сможете немедленно отреагировать.

Таким образом можно достичь времени отклика 0,2 секунды, но для его реализации требуется более гибкий API. Хорошим выбором является CMUSphinx, платформа распознавания речи с открытым исходным кодом, которую вы можете использовать для своей реализации.

Другие вопросы по тегам