Воспроизведение файла wav с помощью portaudio и sndfile

Я написал функцию для воспроизведения звукового файла, используя portaudio и sndfile. К сожалению качество звука ужасное. Звук больше похож на шипение. Ниже приведен исходный код функции, которую я использую.

#define _GLIBCXX_USE_C99_MATH 1
#include "PlaySound_config.h"
#include <boost/predef.h>

#if !defined(USE_PORTAUDIO) // {
#  define USE_PORTAUDIO 0
#  if (! BOOST_OS_CYGWIN && ! BOOST_OS_WINDOWS) // {
#    undef USE_PORTAUDIO
#    define USE_PORTAUDIO 1
#  endif // }
#endif // }

#if (PLAY_SOUND_HAVE_PORTAUDIO_H && PLAY_SOUND_HAVE_SNDFILE_H && PLAY_SOUND_HAVE_SNDFILE_HH && USE_PORTAUDIO) // {

#if (PLAY_SOUND_HAVE_UNISTD_H)
#  include <unistd.h>
#endif

#include <errno.h>
#include <stdio.h>
#include <stdlib.h>

#include <portaudio.h>
#include <sndfile.hh>

#include <cmath>
#include <fstream>
#include <iostream>
#include <vector>

#include <boost/filesystem/operations.hpp>
#include <boost/filesystem/path.hpp>
#include <boost/format.hpp>

#include "PlaySound.h"
#include "PlaySoundStrings.h"

void SoundWarning(const std::string& message)
{
    std::cerr << message << std::endl;
}

bool PlaySoundFile(const std::string& soundFile, unsigned long /* volume */)
{
    const int MAX_CHANNELS = 1;
    const double SAMPLE_RATE = 11025.0;
    const unsigned long FRAMES_PER_BUFFER = 1024;
    const size_t BUFFER_LEN = 1024;
    using boost::format;
    using boost::io::group;
    std::string message;
    if (soundFile.empty())
    {
        errno = EINVAL;
        message = playSoundStrings[error_invalid_argument];
        SoundWarning(message);
        return false;
    }
    boost::filesystem::path soundFilePath(soundFile);
    if (! boost::filesystem::exists(soundFilePath))
    {
        errno = EINVAL;
        message = str(format(playSoundStrings[error_file_does_not_exist]) % soundFile.c_str());
        SoundWarning(message);
        return false;
    }
    PaError paError = Pa_Initialize();
    if (paError != paNoError)
    {
        message = str(format(playSoundStrings[error_pa_initialize_failed]) % Pa_GetErrorText(paError));
        SoundWarning(message);
        return false;
    }
    SNDFILE* sndFile;
    SF_INFO sfInfo;
    sndFile = sf_open(soundFile.c_str(), SFM_READ, &sfInfo);
    if (! sndFile)
    {
        message = str(format(playSoundStrings[error_sf_open_failed]) % soundFile.c_str() % sf_strerror(nullptr));
        SoundWarning(message);
        Pa_Terminate();
        return false;
    }
    if (sfInfo.channels > MAX_CHANNELS)
    {
        message = str(format(playSoundStrings[error_too_many_channels]) % sfInfo.channels % MAX_CHANNELS);
        SoundWarning(message);
        Pa_Terminate();
        return false;
    }
    PaStream* stream = nullptr;
    PaStreamParameters paStreamParameters;
    paStreamParameters.device = Pa_GetDefaultOutputDevice();
    paStreamParameters.channelCount = sfInfo.channels;
    paStreamParameters.sampleFormat = paInt16;
    paStreamParameters.suggestedLatency = Pa_GetDeviceInfo(paStreamParameters.device)->defaultLowOutputLatency;
    paStreamParameters.hostApiSpecificStreamInfo = nullptr;
    paError = Pa_OpenStream(
        &stream, nullptr, &paStreamParameters,
        SAMPLE_RATE, FRAMES_PER_BUFFER, paClipOff,
        nullptr, nullptr);
    if (paError != paNoError || ! stream)
    {
        message = str(format(playSoundStrings[error_pa_open_stream_failed]) % Pa_GetErrorText(paError));
        SoundWarning(message);
        Pa_Terminate();
        return false;
    }
    paError = Pa_StartStream(stream);
    if (paError != paNoError)
    {
        message = str(format(playSoundStrings[error_pa_start_stream_failed]) % Pa_GetErrorText(paError));
        SoundWarning(message);
        Pa_Terminate();
        return false;
    }
    sf_count_t readCount = 0;
    double data[BUFFER_LEN];
    while ((readCount = sf_read_double(sndFile, data, BUFFER_LEN)))
    {
        paError = Pa_WriteStream(stream, data, BUFFER_LEN);
        if (paError != paNoError)
        {
            message = str(format(playSoundStrings[error_pa_write_stream_failed]) % Pa_GetErrorText(paError));
            SoundWarning(message);
            break;
        }
    }
    paError = Pa_CloseStream(stream);
    if (paError != paNoError)
    {
        message = str(format(playSoundStrings[error_pa_close_stream_failed]) % Pa_GetErrorText(paError));
        SoundWarning(message);
        Pa_Terminate();
        return false;
    }
    Pa_Terminate();
    return true;
}

В статье я увидел пример кода. Что такое легкая кроссплатформенная библиотека для воспроизведения WAV? но образец неполный. Похоже, что он будет воспроизводить только первые пять секунд файла. Я хочу воспроизвести весь файл.

Есть идеи, что я делаю не так?

Этот код является частью моего проекта PlaySound.

1 ответ

Решение

Я сделал несколько ошибок в оригинальной версии своего кода. Первый был в строке, в которой я инициализировал элемент sampleFormat структуры PaStreamParameters.

В моем исходном коде я инициализировал этот элемент следующим образом.

paStreamParameters.sampleFormat = paInt16;

Я должен был инициализировать это следующим образом.

paStreamParameters.sampleFormat = paInt32;

Моя следующая ошибка была в вызове функции Pa_OpenStream. Я установил параметр sampleRate на жестко закодированную константу, в данном случае 11025.0. Я должен был установить его на значение члена выборки структуры SF_INFO.

Моя третья ошибка заключалась в использовании функции sf_read_double для чтения из звукового файла. В нескольких рабочих примерах, которые я обнаружил, включая приложение sndfile-play, вместо этого используется функция sf_read_float.

Моя четвертая ошибка заключается в том, что я не масштабировал данные, прочитанные из звукового файла, перед тем, как передать их в функцию Pa_WriteStream. Я нашел код для масштабирования данных в исходном коде приложения sndfile-play.

Для тех, кто заинтересован, окончательная версия моего исходного кода выглядит следующим образом.

#define _GLIBCXX_USE_C99_MATH 1
#include "PlaySound_config.h"
#include <boost/predef.h>

#if !defined(USE_PORTAUDIO) // {
#  define USE_PORTAUDIO 0
#  if (! BOOST_OS_CYGWIN && ! BOOST_OS_WINDOWS) // {
#    undef USE_PORTAUDIO
#    define USE_PORTAUDIO 1
#  endif // }
#endif // }

#if (PLAY_SOUND_HAVE_PORTAUDIO_H && PLAY_SOUND_HAVE_SNDFILE_H && PLAY_SOUND_HAVE_SNDFILE_HH && USE_PORTAUDIO) // {

#if (PLAY_SOUND_HAVE_UNISTD_H)
#  include <unistd.h>
#endif

#include <errno.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#include <portaudio.h>
#include <sndfile.hh>

#include <cmath>
#include <fstream>
#include <iostream>
#include <vector>

#include <boost/filesystem/operations.hpp>
#include <boost/filesystem/path.hpp>
#include <boost/format.hpp>

#include "PlaySound.h"
#include "PlaySoundStrings.h"

void SoundWarning(const std::string& message)
{
    std::cerr << message << std::endl;
}

bool PlaySoundFile(const std::string& soundFile, unsigned long /* volume */)
{
    const int MAX_CHANNELS = 1;
    const size_t BUFFER_LEN = 1024;
    using boost::format;
    using boost::io::group;
    std::string message;
    if (soundFile.empty())
    {
        errno = EINVAL;
        message = playSoundStrings[error_invalid_argument];
        SoundWarning(message);
        return false;
    }
    boost::filesystem::path soundFilePath(soundFile);
    if (! boost::filesystem::exists(soundFilePath))
    {
        errno = EINVAL;
        message = str(format(playSoundStrings[error_file_does_not_exist]) % soundFile.c_str());
        SoundWarning(message);
        return false;
    }
    PaError paError = Pa_Initialize();
    if (paError != paNoError)
    {
        message = str(format(playSoundStrings[error_pa_initialize_failed]) % Pa_GetErrorText(paError));
        SoundWarning(message);
        return false;
    }
    SNDFILE* sndFile = nullptr;
    SF_INFO sfInfo;
    ::memset(&sfInfo, 0, sizeof(sfInfo));
    sndFile = sf_open(soundFile.c_str(), SFM_READ, &sfInfo);
    if (! sndFile)
    {
        message = str(format(playSoundStrings[error_sf_open_failed]) % soundFile.c_str() % sf_strerror(nullptr));
        SoundWarning(message);
           Pa_Terminate();
        return false;
    }
    if (sfInfo.channels > MAX_CHANNELS)
    {
        message = str(format(playSoundStrings[error_too_many_channels]) % sfInfo.channels % MAX_CHANNELS);
        SoundWarning(message);
        Pa_Terminate();
        return false;
    }
    PaStream* stream = nullptr;
    PaStreamParameters paStreamParameters;
    paStreamParameters.device = Pa_GetDefaultOutputDevice();
    paStreamParameters.channelCount = sfInfo.channels;
    paStreamParameters.sampleFormat = paInt32;
    paStreamParameters.suggestedLatency = Pa_GetDeviceInfo(paStreamParameters.device)->defaultLowOutputLatency;
    paStreamParameters.hostApiSpecificStreamInfo = nullptr;
    paError = Pa_OpenStream(
        &stream, nullptr, &paStreamParameters,
        sfInfo.samplerate, paFramesPerBufferUnspecified, paClipOff,
        nullptr, nullptr);
    if (paError != paNoError || ! stream)
    {
        message = str(format(playSoundStrings[error_pa_open_stream_failed]) % Pa_GetErrorText(paError));
        SoundWarning(message);
        Pa_Terminate();
        return false;
    }
    paError = Pa_StartStream(stream);
    if (paError != paNoError)
    {
        message = str(format(playSoundStrings[error_pa_start_stream_failed]) % Pa_GetErrorText(paError));
        SoundWarning(message);
        Pa_Terminate();
        return false;
    }
    int subFormat = sfInfo.format & SF_FORMAT_SUBMASK;
    double scale = 1.0;
    if (subFormat == SF_FORMAT_FLOAT || subFormat == SF_FORMAT_DOUBLE)
    {
        sf_command(sndFile, SFC_CALC_SIGNAL_MAX, &scale, sizeof(scale));
        if (scale < 1e-10)
        {
            scale = 1.0;
        }
        else
        {
            scale = 32700.0 / scale;
        }
    }
    sf_count_t readCount = 0;
    float data[BUFFER_LEN];
    ::memset(data, 0, sizeof(data));
    while ((readCount = sf_read_float(sndFile, data, BUFFER_LEN)))
    {
        if (subFormat == SF_FORMAT_FLOAT || subFormat == SF_FORMAT_DOUBLE)
        {
            int m = 0;
            for (m = 0 ; m < readCount ; ++m)
            {
                data[m] *= scale;
            }
        }
        paError = Pa_WriteStream(stream, data, BUFFER_LEN);
        if (paError != paNoError)
        {
            message = str(format(playSoundStrings[error_pa_write_stream_failed]) % Pa_GetErrorText(paError));
            SoundWarning(message);
            break;
        }
        ::memset(data, 0, sizeof(data));
    }
    paError = Pa_CloseStream(stream);
    if (paError != paNoError)
    {
        message = str(format(playSoundStrings[error_pa_close_stream_failed]) % Pa_GetErrorText(paError));
        SoundWarning(message);
        Pa_Terminate();
        return false;
    }
    Pa_Terminate();
    return true;
}
Другие вопросы по тегам