Как получить аудио входы в Python и преобразовать его в текстовую строку

Я думаю, что мой вопрос понятен из названия

Есть ли модуль или функция Python, который позволяет мне получать аудио входы и возвращать текстовое значение?

Например, если я использовал микрофон и сказал "Хеллоу", программа python возвращает "hellow" как текстовое значение.

1 ответ

Решение

Используйте PyAudio: https://people.csail.mit.edu/hubert/pyaudio/ для захвата звука из динамика, а затем API распознавания речи: https://pypi.python.org/pypi/SpeechRecognition/ для преобразования звука в текст.

Другие вопросы по тегам