Описание тега audio-processing
Обработка звука включает изучение математических методов и методов обработки сигналов для понимания или изменения природы звуковых сигналов. Различные типы исследуемых звуковых сигналов включают речь, музыку, звуки окружающей среды и компьютерные звуки. Аудио анализируется во временной или спектральной области с применением различных фильтров.
1
ответ
Декодировать DTMF из массива байтов с помощью C#
Я занимаюсь разработкой программного обеспечения, которое фиксирует исходящий звук (динамик) и определяет наличие тонов dtmf. Я использовал NAudio для записи звука в виде байтового массива. Я хочу определить, есть ли тоны dtmf в этом байтовом массив…
05 мар '14 в 05:30
3
ответа
Расчет разницы между двумя звуковыми образцами
У меня есть два образца звука (.WAV), и я хочу найти разницу между ними. Я читал об этом и знаю, что для этого мне нужно использовать БПФ. К сожалению, я не могу найти способ сделать фактический расчет. Я ищу библиотеку PHP или инструкции о том, как…
25 дек '12 в 18:14
1
ответ
Решение.NET для создания замедленной скорости воспроизведения MP3 с сохранением высоты тона
У меня есть рабочее решение, частично в.NET, которое принимает файл MP3 (вокальный звук) и сохраняет версию MP3 с замедленной скоростью воспроизведения, сохраняя высоту тона. Я нашел решение, которое несколько сохраняет высоту звука, хотя качество з…
07 июн '11 в 12:46
0
ответов
Что-то не так в речи к тексту в Java
Я делаю проект в речи в тексте в Java. Следующее я сделал:1) Я прочитал байты аудиосигнала, а затем преобразовал их в двойной массив.2) Затем я прошел через фильтр высоких частот (формула приведена ниже). х - двойной массив входного сигнала. double …
23 ноя '13 в 21:06
1
ответ
ios Native webrtc: Как записать удаленный аудиопоток в виде wav-файла на стороне клиента.
Я экспериментирую с webrtc. Моя цель - сохранить удаленный аудиопоток в виде локального файла без использования медиасервера, я знаю об aecdump, но не могу найти подходящий метод или блог для распаковки в iOS. Я использую нативный фреймворк googleWe…
19 июн '18 в 18:51
0
ответов
Исключение Tensorboard с summary.image формы [-1, 125, 128, 1] MFCC
Следуя этому руководству, я конвертирую тензор [batch_size, 16000, 1] в MFCC, используя метод, описанный в ссылке: def gen_spectrogram(wav, sr=16000): # A 1024-point STFT with frames of 64 ms and 75% overlap. stfts = tf.contrib.signal.stft(wav, fram…
30 дек '17 в 17:11
0
ответов
Невозможно получить запись с таким же качеством звука при использовании Quicktime и Web Audio
Я работаю над https://www.crayon.pro/, веб-сайтом для создания лекций в стиле Ханской Академии прямо из браузера. Для этого я пытаюсь использовать API-интерфейс Web Audio для записи звука с наилучшим возможным качеством с микрофона пользователя. Про…
24 ноя '18 в 17:26
0
ответов
Android - открытое - инвертированный звук - анти-шум
Я очень плохо знаком с обработкой аудио и системой opensl es. В настоящее время я разрабатываю приложение, которое генерирует анти-шум. Моя идея - инвертировать значения в очереди аудио-буфера, однако все методы, которые я пробовал, не работают. Я и…
10 фев '18 в 20:59
1
ответ
Инициализируйте импульсный отклик помещения, используя время реверберации (T60)
Я делаю реверберацию речи с использованием неотрицательной матричной факторизации. Чтобы быть точным, я работаю над этим документом Нассера (paris.cs.illinois.edu/pubs/nasser-icassp2015.pdf), который включает получение оптимального решения для импул…
02 июл '15 в 09:49
2
ответа
Помогите с реализацией этого алгоритма обнаружения ударов?
Недавно я попытался реализовать найденный здесь код обнаружения ударов, а именно алгоритм Derivation and Combfilter # 1:: http://archive.gamedev.net/reference/programming/features/beatdetection/page2.asp Я не слишком уверен, успешно ли я реализовал …
03 июл '11 в 13:23
1
ответ
Изменение темпа файла MIDI или WAV/MP3 в FMOD
Можно ли изменить темп файла MIDI или WAV/MP3 с помощью FMOD? Я использую C++ вместе с FMOD и не могу найти функцию, которая позволила бы мне контролировать темп аудиофайла из переменных, полученных в C-части приложения. Я использую аудио, которое я…
09 дек '11 в 16:25
1
ответ
Как создать объект ComplexSignal из объекта Signal в Accord.NET?
Я пытаюсь выполнить БПФ для Сигнала, созданного WAV-файлом, который имеет 1 канал и 64064 сэмпла (приблизительно 4 секунды длиной при 16 КБ). Я использую Accord.NET и следующий код, чтобы попытаться создать объект ComplexSignal, который требуется дл…
20 ноя '13 в 06:02
1
ответ
AVAudioRecorder в Swift 3: получить поток байтов вместо сохранения в файл
Я новичок в программировании на iOS и хочу портировать приложение Android на iOS с помощью Swift 3. Основная функция приложения - читать поток байтов с микрофона и обрабатывать этот поток в реальном времени. Поэтому недостаточно сохранить аудиопоток…
18 апр '17 в 13:05
1
ответ
Как применить фильтры к ранее записанному звуку и сохранить измененную версию с помощью AudioKit?
Существует ранее записанный звуковой файл, содержащий голос пользователя. Что мне нужно сделать, это применить звуковой фильтр, чтобы изменить голос и после этого иметь возможность сохранять и воспроизводить измененную версию. AudioKit может открыть…
22 сен '15 в 10:17
3
ответа
Как отключить обработку аудио выхода на htc телефоне с Android
Я пытаюсь измерить путь прохождения звука от динамика к микрофону на двух разных телефонах: HTC Wildfire S под управлением Android 2.3.5 и HTC One X под управлением Android 4.0.3. Используя Eclipse, я кодировал приложение, которое воспроизводит волн…
18 сен '13 в 15:20
1
ответ
Выравнивание звука
Я разрабатываю аудиоплеер, используя FFmpeg, и я хочу добавить звуковой эквалайзер в свое приложение. Я использую FFmpeg для получения аудиосэмплов и вычисления FFT, но когда я пытаюсь применить один из БИХ-фильтров, я получаю очень шумный аудиосигн…
02 окт '15 в 13:01
1
ответ
Matlab Динамически изменяемая частота дискретизации аудиоплеера
Я работаю над проектом в Matlab, чтобы взять заранее определенный аудиофайл и динамически изменять частоту дискретизации на основе данных, сгенерированных в реальном времени. Я столкнулся с очень упрямым препятствием с помощью объекта dsp.audioplaye…
12 апр '13 в 22:33
2
ответа
Модулировать и демодулировать двоичные данные в / из аудио - одна или две частоты?
Я собираюсь передать двоичные данные с ПК на соседний смартфон через аудиоканал (предпочтительно с помощью ультразвуковой амплитудной модуляции, например, ~19 кГц). Интересно, что лучше? использовать одну фиксированную частоту для кодирования единиц…
28 май '12 в 14:02
2
ответа
Какой алгоритм обработки звука позволяет вам делать подобные визуализации?
Я заинтересован в создании визуализатора OpenGL для MP3 в качестве любимого проекта. Я наткнулся на это видео на YouTube, которое демонстрирует, как кто-то демонстрирует визуализатор, используемый в сочетании с дополненной реальностью. http://www.yo…
05 фев '10 в 20:35
1
ответ
Писать двойной [] как WAV-файл в Java
Я пытаюсь сохранить массив double[] как файл.WAV, используя этот метод: public static void saveWav(String filename, double[] samples) { // assumes 44,100 samples per second // use 16-bit audio, 2 channels, signed PCM, little Endian AudioFormat forma…
18 дек '15 в 20:29