Распознать определенный звук в разговоре со службами Windows Azure
Я хотел бы знать, возможно ли создать службу с Cognitive Services в Windows Azure, которая позволяет мне распознавать один конкретный звук в разговоре (предоставляемый в прямом эфире в Интернете) и как это сделать. Я уже знаю базовые методы машинного обучения, но я никогда не реализовывал нечто подобное, так или иначе, я хотел бы использовать Cognitive Services, чтобы сделать это простым и эффективным способом. Эта задача будет связана с другой задачей, такой как цепочка событий, поэтому я должен использовать что-то, что обеспечивает SKD для Java или Python. Кто-нибудь знал, как я могу это сделать? Спасибо!
1 ответ
Теперь есть новый предварительный познавательный сервис под названием Speaker Recognition API
, который вы можете использовать для реализации ваших потребностей по распознаванию определенного звука в разговоре, пожалуйста, смотрите официальный обзор, чтобы узнать подробности. И к настоящему времени для этой службы есть только API-интерфейсы REST, а не SDK для конкретных языков программирования, таких как Java / Python. Поэтому перейдите на справочный веб-сайт REST API, чтобы узнать, как его использовать.
Надеюсь, поможет.