Подходы к диаризации французских спикеров [закрыто]
Итак, давая и звуковой файл звонка (может быть от 2 до 5 человек), я хочу провести дневник говорящего, чтобы я знал, когда каждый говорящий говорит, я пробовал Resemblyzer и pyannote, но я не получил хорошего результата! Обратите внимание, что звонок ведется на французском, а не на английском языке.
Какие-либо предложения? а что лучше, если я буду тренировать собственную модель? в таком случае, пожалуйста, предложите мне набор данных на французском языке для ведения дневника выступающих!