Как проанализировать голос и сохранить результат?
Я думаю создать приложение.
Ниже приводится описание: 1. Люди будут загружать ранее записанный разговор на сервер. 2. приложение с сервера определит высоту, скорость, акцент, произношение и т. Д. Этого голоса и создаст личное портфолио. 3. Если вы позвоните на сервер, серверное приложение будет разговаривать с вами точным голосовым тоном этого человека (чей голосовой сервер обнаружен на шаге 2).
Пожалуйста, поделитесь ссылками, ресурсами, презентацией в формате PDF, что вы считаете полезным для этого проекта.....
В основном я застрял на ШАГЕ 2. У меня нет четкой идеи, как разбить голос, проанализировать его и получить информацию о скорости, высоте звука и т. Д. Есть ли какой-либо существующий API для голосовой части?
1 ответ
Я смог найти это:
Вы также можете проверить этот SO вопрос: