Описание тега audio-processing

Обработка звука включает изучение математических методов и методов обработки сигналов для понимания или изменения природы звуковых сигналов. Различные типы исследуемых звуковых сигналов включают речь, музыку, звуки окружающей среды и компьютерные звуки. Аудио анализируется во временной или спектральной области с применением различных фильтров.
1 ответ

Декодировать DTMF из массива байтов с помощью C#

Я занимаюсь разработкой программного обеспечения, которое фиксирует исходящий звук (динамик) и определяет наличие тонов dtmf. Я использовал NAudio для записи звука в виде байтового массива. Я хочу определить, есть ли тоны dtmf в этом байтовом массив…
05 мар '14 в 05:30
3 ответа

Расчет разницы между двумя звуковыми образцами

У меня есть два образца звука (.WAV), и я хочу найти разницу между ними. Я читал об этом и знаю, что для этого мне нужно использовать БПФ. К сожалению, я не могу найти способ сделать фактический расчет. Я ищу библиотеку PHP или инструкции о том, как…
25 дек '12 в 18:14
1 ответ

Решение.NET для создания замедленной скорости воспроизведения MP3 с сохранением высоты тона

У меня есть рабочее решение, частично в.NET, которое принимает файл MP3 (вокальный звук) и сохраняет версию MP3 с замедленной скоростью воспроизведения, сохраняя высоту тона. Я нашел решение, которое несколько сохраняет высоту звука, хотя качество з…
07 июн '11 в 12:46
0 ответов

Что-то не так в речи к тексту в Java

Я делаю проект в речи в тексте в Java. Следующее я сделал:1) Я прочитал байты аудиосигнала, а затем преобразовал их в двойной массив.2) Затем я прошел через фильтр высоких частот (формула приведена ниже). х - двойной массив входного сигнала. double …
23 ноя '13 в 21:06
1 ответ

ios Native webrtc: Как записать удаленный аудиопоток в виде wav-файла на стороне клиента.

Я экспериментирую с webrtc. Моя цель - сохранить удаленный аудиопоток в виде локального файла без использования медиасервера, я знаю об aecdump, но не могу найти подходящий метод или блог для распаковки в iOS. Я использую нативный фреймворк googleWe…
0 ответов

Исключение Tensorboard с summary.image формы [-1, 125, 128, 1] MFCC

Следуя этому руководству, я конвертирую тензор [batch_size, 16000, 1] в MFCC, используя метод, описанный в ссылке: def gen_spectrogram(wav, sr=16000): # A 1024-point STFT with frames of 64 ms and 75% overlap. stfts = tf.contrib.signal.stft(wav, fram…
0 ответов

Невозможно получить запись с таким же качеством звука при использовании Quicktime и Web Audio

Я работаю над https://www.crayon.pro/, веб-сайтом для создания лекций в стиле Ханской Академии прямо из браузера. Для этого я пытаюсь использовать API-интерфейс Web Audio для записи звука с наилучшим возможным качеством с микрофона пользователя. Про…
0 ответов

Android - открытое - инвертированный звук - анти-шум

Я очень плохо знаком с обработкой аудио и системой opensl es. В настоящее время я разрабатываю приложение, которое генерирует анти-шум. Моя идея - инвертировать значения в очереди аудио-буфера, однако все методы, которые я пробовал, не работают. Я и…
10 фев '18 в 20:59
1 ответ

Инициализируйте импульсный отклик помещения, используя время реверберации (T60)

Я делаю реверберацию речи с использованием неотрицательной матричной факторизации. Чтобы быть точным, я работаю над этим документом Нассера (paris.cs.illinois.edu/pubs/nasser-icassp2015.pdf), который включает получение оптимального решения для импул…
02 июл '15 в 09:49
2 ответа

Помогите с реализацией этого алгоритма обнаружения ударов?

Недавно я попытался реализовать найденный здесь код обнаружения ударов, а именно алгоритм Derivation and Combfilter # 1:: http://archive.gamedev.net/reference/programming/features/beatdetection/page2.asp Я не слишком уверен, успешно ли я реализовал …
03 июл '11 в 13:23
1 ответ

Изменение темпа файла MIDI или WAV/MP3 в FMOD

Можно ли изменить темп файла MIDI или WAV/MP3 с помощью FMOD? Я использую C++ вместе с FMOD и не могу найти функцию, которая позволила бы мне контролировать темп аудиофайла из переменных, полученных в C-части приложения. Я использую аудио, которое я…
09 дек '11 в 16:25
1 ответ

Как создать объект ComplexSignal из объекта Signal в Accord.NET?

Я пытаюсь выполнить БПФ для Сигнала, созданного WAV-файлом, который имеет 1 канал и 64064 сэмпла (приблизительно 4 секунды длиной при 16 КБ). Я использую Accord.NET и следующий код, чтобы попытаться создать объект ComplexSignal, который требуется дл…
1 ответ

AVAudioRecorder в Swift 3: получить поток байтов вместо сохранения в файл

Я новичок в программировании на iOS и хочу портировать приложение Android на iOS с помощью Swift 3. Основная функция приложения - читать поток байтов с микрофона и обрабатывать этот поток в реальном времени. Поэтому недостаточно сохранить аудиопоток…
1 ответ

Как применить фильтры к ранее записанному звуку и сохранить измененную версию с помощью AudioKit?

Существует ранее записанный звуковой файл, содержащий голос пользователя. Что мне нужно сделать, это применить звуковой фильтр, чтобы изменить голос и после этого иметь возможность сохранять и воспроизводить измененную версию. AudioKit может открыть…
22 сен '15 в 10:17
3 ответа

Как отключить обработку аудио выхода на htc телефоне с Android

Я пытаюсь измерить путь прохождения звука от динамика к микрофону на двух разных телефонах: HTC Wildfire S под управлением Android 2.3.5 и HTC One X под управлением Android 4.0.3. Используя Eclipse, я кодировал приложение, которое воспроизводит волн…
1 ответ

Выравнивание звука

Я разрабатываю аудиоплеер, используя FFmpeg, и я хочу добавить звуковой эквалайзер в свое приложение. Я использую FFmpeg для получения аудиосэмплов и вычисления FFT, но когда я пытаюсь применить один из БИХ-фильтров, я получаю очень шумный аудиосигн…
1 ответ

Matlab Динамически изменяемая частота дискретизации аудиоплеера

Я работаю над проектом в Matlab, чтобы взять заранее определенный аудиофайл и динамически изменять частоту дискретизации на основе данных, сгенерированных в реальном времени. Я столкнулся с очень упрямым препятствием с помощью объекта dsp.audioplaye…
12 апр '13 в 22:33
2 ответа

Модулировать и демодулировать двоичные данные в / из аудио - одна или две частоты?

Я собираюсь передать двоичные данные с ПК на соседний смартфон через аудиоканал (предпочтительно с помощью ультразвуковой амплитудной модуляции, например, ~19 кГц). Интересно, что лучше? использовать одну фиксированную частоту для кодирования единиц…
2 ответа

Какой алгоритм обработки звука позволяет вам делать подобные визуализации?

Я заинтересован в создании визуализатора OpenGL для MP3 в качестве любимого проекта. Я наткнулся на это видео на YouTube, которое демонстрирует, как кто-то демонстрирует визуализатор, используемый в сочетании с дополненной реальностью. http://www.yo…
05 фев '10 в 20:35
1 ответ

Писать двойной [] как WAV-файл в Java

Я пытаюсь сохранить массив double[] как файл.WAV, используя этот метод: public static void saveWav(String filename, double[] samples) { // assumes 44,100 samples per second // use 16-bit audio, 2 channels, signed PCM, little Endian AudioFormat forma…
18 дек '15 в 20:29