Назначьте кластерные данные ярлыкам
Я хочу провести дневник оратора. Я уже встроил файлы wav во встраиваемые файлы и получил неплохие результаты с кластеризацией.
Я хочу пойти дальше. Я хочу, чтобы люди записывали предложение и вставляли его. так что я могу сравнить записанный звук с записями людей.
Как мне лучше всего сравнить вложения, чтобы сопоставить голоса с конкретными людьми? Я хочу кластеризовать на основе предварительно помеченных кластеров.
Я хочу: сгруппировать данные => назначить их человеку через записанные данные.
1 ответ
После того, как вы сгруппировали свои вложения, вы можете сравнить вложения в каждом кластере с заранее записанными вложениями, которые у вас есть, используя скалярное произведение. Предварительно записанное вложение, которое приводит к наивысшему скалярному произведению, является наиболее вероятным говорящим.
Каждый кластер будет иметь несколько внедрений, поэтому вы можете взять среднее скалярное произведение для каждого внедрения, а затем взять
argmax
.