Учебные данные для нейронной сети, классифицирующей песни
Я пытаюсь создать нейронную сеть, которая может взять информацию о функции песни, такую как интервалы высот, а затем сказать мне, к какой песне она принадлежит, в базе данных. База данных состоит из файлов MIDI, а входные файлы WAV.
Входной WAV-файл обрабатывается для определения начала и высоты тона. В настоящее время я использую только интервал (разницу между последовательными передачами) для обучения и классификации.
Мой текущий подход заключается в создании нейронной сети для каждой песни в базе данных и обучении тому, чтобы знать только эту конкретную песню, используя кривую NN. Например, net(song) = 1 и net(not_song) = 0.
Проблема в том, что нейронная сеть работает плохо. Я использую инструмент нейронной сети MATLAB для обучения. Тем не менее, я думаю, что предоставление случайных фрагментов фактических интервалов основного тона, полученных из файла MIDI, не дает хороших обучающих данных.
Я был бы признателен за любые идеи о том, как я могу получить данные обучения, которые на самом деле будут работать.