Verizon SongID - Как это запрограммировано?
Для тех, кто не знаком с программой Verizon SongID, это бесплатное приложение, которое можно загрузить через сеть Verizon VCast. Он слушает песню в течение 10 секунд в любой момент во время песни, а затем отправляет эти данные некоему всезнающему алгоритмическому зверю, который жует его и отправляет вам обратно все теги ID3 (исполнитель, альбом, песня и т. Д.)
Первые две части и последняя часть просты, но что происходит во время обработки после отправки записанного звука?
Я полагаю, что он должен взять звуковой файл (в каком формате?), Проанализировать его (как? С чем?) Для некоторых ключевых идентификаторов (что это за "обычные атрибуты волновых функций" фаза / сдвиг / амплитуда / и т. Д.) И проверить его против базы данных.
Все, что я нахожу в Интернете о том, как это работает, является чем-то общим, как то, что я напечатал выше.
Этот сервис основан на сложном алгоритме распознавания звука, сочетающем в себе передовую технологию распознавания звука и базу данных больших песен. Когда вы загружаете аудио файл, он анализируется аудио движком. Во время анализа его аудио "отпечаток" извлекается и идентифицируется путем сравнения его с музыкальной базой данных. По завершении этого процесса распознавания информация о песнях с их вероятностями соответствия отображается на экране.
1 ответ
Все эти сервисы работают, беря "отпечаток" из выбранных аудиоданных на стороне клиента, отправляя их на сервер и сравнивая их с базой данных отпечатков пальцев.
Один из разработчиков Shazam написал чрезвычайно информативный технический документ о том, как работает технология. Это должно дать вам всю информацию, которая вам нужна.