TarsosDSP Pitch Detection из файла.wav. И частота результата всегда меньше половины

Я пытаюсь использовать библиотеку TarsosDSP для определения высоты тона из файла.wav, и результат частоты всегда меньше половины.

Вот мой код

    public class Main {

public static void main(String[] args){
    try{
        float sampleRate = 44100;
        int audioBufferSize = 2048;
        int bufferOverlap = 0;

        //Create an AudioInputStream from my .wav file
        URL soundURL = Main.class.getResource("/DetectPicthFromWav/329.wav");
        AudioInputStream stream = AudioSystem.getAudioInputStream(soundURL);

        //Convert into TarsosDSP API
        JVMAudioInputStream audioStream = new JVMAudioInputStream(stream);
        AudioDispatcher dispatcher = new AudioDispatcher(audioStream, audioBufferSize, bufferOverlap);
        MyPitchDetector myPitchDetector = new MyPitchDetector();
        dispatcher.addAudioProcessor(new PitchProcessor(PitchEstimationAlgorithm.YIN, sampleRate, audioBufferSize, myPitchDetector));
        dispatcher.run();


    }
    catch(FileNotFoundException fne){fne.printStackTrace();}
    catch(UnsupportedAudioFileException uafe){uafe.printStackTrace();}
    catch(IOException ie){ie.printStackTrace();}
}
}

    class  MyPitchDetector implements PitchDetectionHandler{

//Here the result of pitch is always less than half.
@Override
public void handlePitch(PitchDetectionResult pitchDetectionResult,
        AudioEvent audioEvent) {
    if(pitchDetectionResult.getPitch() != -1){
        double timeStamp = audioEvent.getTimeStamp();
        float pitch = pitchDetectionResult.getPitch();
        float probability = pitchDetectionResult.getProbability();
        double rms = audioEvent.getRMS() * 100;
        String message = String.format("Pitch detected at %.2fs: %.2fHz ( %.2f probability, RMS: %.5f )\n", timeStamp,pitch,probability,rms);
        System.out.println(message);
    }
}
}

Файл 329.wav создается с веб-сайта http://onlinetonegenerator.com/ с частотой 329 Гц. Я не знаю, почему результирующий шаг всегда 164,5 Гц. Есть ли проблема в моем коде?

2 ответа

Ну, я не знаю, какие методы вы используете, но, глядя на то, как частота точно уменьшается вдвое, может быть проблема неправильной установки частоты дискретизации?

Большинство операций предполагают начальную частоту дискретизации при дискретизации сигнала, может быть, вы передали его в качестве аргумента (или его значение по умолчанию) наполовину меньше?

У меня просто была такая же проблема с TarsosDSP на Android. Для меня ответ состоял в том, что файл с http://onlinetonegenerator.com/ содержит 32-битные сэмплы вместо 16-битных, что, по-видимому, является значением по умолчанию. Соответствующий код:

AssetFileDescriptor afd = getAssets().openFd("440.wav"); // 440Hz sine wave
InputStream is = afd.createInputStream();
TarsosDSPAudioFormat audioFormat = new TarsosDSPAudioFormat(
  /* sample rate */ 44100,
  /* HERE sample size in bits */ 32,
  /* number of channels */ 1,
  /* signed/unsigned data */ true,
  /* big-endian byte order */ false
);
AudioDispatcher dispatcher = new AudioDispatcher(new UniversalAudioInputStream(is, audioFormat), 2048, 0);
PitchDetectionHandler pdh = ...
AudioProcessor p = new PitchProcessor(PitchProcessor.PitchEstimationAlgorithm.FFT_YIN, 44100, 2048, pdh);
dispatcher.addAudioProcessor(p);
new Thread(dispatcher, "Audio Dispatcher").start();
Другие вопросы по тегам