Назначьте кластерные данные ярлыкам

Я хочу провести дневник оратора. Я уже встроил файлы wav во встраиваемые файлы и получил неплохие результаты с кластеризацией.

Я хочу пойти дальше. Я хочу, чтобы люди записывали предложение и вставляли его. так что я могу сравнить записанный звук с записями людей.

Как мне лучше всего сравнить вложения, чтобы сопоставить голоса с конкретными людьми? Я хочу кластеризовать на основе предварительно помеченных кластеров.

Я хочу: сгруппировать данные => назначить их человеку через записанные данные.

1 ответ

После того, как вы сгруппировали свои вложения, вы можете сравнить вложения в каждом кластере с заранее записанными вложениями, которые у вас есть, используя скалярное произведение. Предварительно записанное вложение, которое приводит к наивысшему скалярному произведению, является наиболее вероятным говорящим.

Каждый кластер будет иметь несколько внедрений, поэтому вы можете взять среднее скалярное произведение для каждого внедрения, а затем взять argmax.

Другие вопросы по тегам