Модель диаризации спикера в Python
Я ищу модель (на Python) для ведения дневника говорящего (или одновременного ведения дневника говорящего и распознавания речи). Я пробовал использовать библиотеки pyannote и Resemblyzer, но они не работают с моими данными (не распознают разных динамиков). Кто-нибудь может мне помочь? Заранее спасибо.
1 ответ
Вы можете использовать https://github.com/pyannote/pyannote-audio.
Учебное пособие о том, как выполнить диаризацию динамика с помощью pyannote-audio, можно найти здесь: