Алгоритм распознавания песни

Любая идея, как я могу реализовать алгоритм идентификации песни, сопоставив его с клипом песни или человеческого голоса или мелодии. Я не ожидаю, что кто-нибудь напишет алгоритм здесь:), я знаю, что это включает в себя много вещей вместе, но я хотел бы знать, как я могу начать. Какие технологии мне нужно учитывать, чтобы делать что-то подобное. Я смотрю на что-то похожее на Shazaam или Midomi. Кроме того, есть ли онлайн-сервис, который делает то же самое и предоставляет API для этого.

2 ответа

Я видел презентацию на конференции devoxx по этому поводу, посмотрите здесь. А вот и сообщение в блоге докладчика на ту же тему.

О, это просто.

Разделите песню на части, запустите FFT для каждой, извлеките несколько основных величин и сохраните их в виде хэша с информацией о времени.
Затем сделайте то же самое с записанным аудио и сопоставьте с сохраненными данными по времени.

Просто не так ли? Если честно, то сложнее, но идея похожа.

Другие вопросы по тегам