Распознавание нескольких голосов с помощью Microsoft Speech API?
Я хотел бы знать, поддерживает ли Microsoft Speech API на Python распознавание нескольких голосов. Я видел бета-версию SDK Speaker Recognition, но мне было интересно, была ли эта функция уже в Speech SDK или нет.
Я проверил всю документацию по методам Python SDK и провел поиск по сети и через стек, если кто-то когда-либо нуждался / пытался распознать множественное голосовое распознавание речи в текст, используя MS Speec, но я ничего не нашел по этому поводу.
Когда я расшифровал аудиозапись разговора двух человек (мужчина и женщина) с помощью Microsoft Speech-to-Text, распознанный текст не был разделен при изменении голоса.