Verizon SongID - Как это запрограммировано?

Для тех, кто не знаком с программой Verizon SongID, это бесплатное приложение, которое можно загрузить через сеть Verizon VCast. Он слушает песню в течение 10 секунд в любой момент во время песни, а затем отправляет эти данные некоему всезнающему алгоритмическому зверю, который жует его и отправляет вам обратно все теги ID3 (исполнитель, альбом, песня и т. Д.)

Первые две части и последняя часть просты, но что происходит во время обработки после отправки записанного звука?

Я полагаю, что он должен взять звуковой файл (в каком формате?), Проанализировать его (как? С чем?) Для некоторых ключевых идентификаторов (что это за "обычные атрибуты волновых функций" фаза / сдвиг / амплитуда / и т. Д.) И проверить его против базы данных.

Все, что я нахожу в Интернете о том, как это работает, является чем-то общим, как то, что я напечатал выше.

Из http://audiotag.info/

Этот сервис основан на сложном алгоритме распознавания звука, сочетающем в себе передовую технологию распознавания звука и базу данных больших песен. Когда вы загружаете аудио файл, он анализируется аудио движком. Во время анализа его аудио "отпечаток" извлекается и идентифицируется путем сравнения его с музыкальной базой данных. По завершении этого процесса распознавания информация о песнях с их вероятностями соответствия отображается на экране.

1 ответ

Решение

Все эти сервисы работают, беря "отпечаток" из выбранных аудиоданных на стороне клиента, отправляя их на сервер и сравнивая их с базой данных отпечатков пальцев.

Один из разработчиков Shazam написал чрезвычайно информативный технический документ о том, как работает технология. Это должно дать вам всю информацию, которая вам нужна.

Другие вопросы по тегам