Модель диаризации спикера в Python

Question

Модель диаризации спикера в Python

Я ищу модель (на Python) для ведения дневника говорящего (или одновременного ведения дневника говорящего и распознавания речи). Я пробовал использовать библиотеки pyannote и Resemblyzer, но они не работают с моими данными (не распознают разных динамиков). Кто-нибудь может мне помочь? Заранее спасибо.

0

python speech-recognition diarization

Источник

user17377822 18 ноя '21 в 11:21

1 ответ

Другие вопросы по тегам python speech-recognition diarization

user4593302 22 ноя '21 в 17:16 2021-11-22 17:16 · Answer 1 · 2021-11-22 17:16

Вы можете использовать https://github.com/pyannote/pyannote-audio.

Учебное пособие о том, как выполнить диаризацию динамика с помощью pyannote-audio, можно найти здесь:

https://github.com/pyannote/pyannote-audio/blob/master/notebooks/introduction_to_pyannote_audio_speaker_diarization_toolkit.ipynb

2

Источник

user4593302 22 ноя '21 в 17:16