Преобразование речи в текст для приложения Android

Существуют ли какие-либо библиотеки библиотек с низкими вычислительными затратами для преобразования голоса в текст для приложения Android (Java) без использования веб-служб или обработки на стороне сервера? Какие алгоритмы / парадигмы можно использовать?

1 ответ

Решение

Это во многом зависит от того, какую речь вы хотите распознать, в отличие от того, что вы не знаете, и желаемой частоты ошибок.

Если вы хотите распознать только одно слово от известного пользователя, в противном случае молчание с точностью чуть выше 50%, возможно, вы сможете разработать или найти некую "низкую сложность" структуру, используя обнаружение уровня звука и / или дактилоскопию.

Для непрерывного распознавания речи в очень большом словаре от неизвестного пользователя с неизвестным акцентом или диалектом с точностью 99,9%+ вы вряд ли найдете что-либо, даже с использованием обработки на стороне сервера.

Для чего-то промежуточного вы, возможно, захотите взглянуть на использование CPU Pocketsphinx в сборке Android NDK. Но я не уверен, будет ли кто-то называть вычислительную сложность этой "низкой" достаточной, или степень точности, достаточную для их целей.

Другие вопросы по тегам