Описание тега audio-analysis

Используется для вопросов, связанных с процессом анализа аудиопотоков или файлов.
1 ответ

Объем памяти для распаковки файлов

Я хочу обрабатывать аудио в автономном режиме на iOS, но у меня есть вопрос об использовании памяти. Если я использую AVAssetReader для распаковки MP3 в необработанные данные PCM, объем памяти будет огромным. Итак, как мне поступить с обработкой (в …
25 сен '11 в 16:11
1 ответ

Измерьте количество отсечения

Может кто-нибудь указать мне на инструмент командной строки или модуль Python, который измеряет количество отсечения в аудиофайле? Например, что-то сопоставимое с http://www.ber-sd.com/dl_clipping.html.
11 фев '13 в 13:05
0 ответов

Аудиоанализ и извлечение функций для визуализации музыки

У меня есть общий вопрос относительно того, как я должен продолжать свои музыкальные усилия по визуализации. Я заинтересован в визуализации произведений классической музыки, записанных или живых. До сих пор я использовал Processing, но я открыт и дл…
07 ноя '16 в 21:49
1 ответ

Как я могу извлечь числовые значения из аудио файла в Java

Мне нужно сделать анализ звуков, чтобы проверить, не было ли оно затруднено или удалено. import java.net.URL; import javax.swing.*; import javax.sound.sampled.*; public class LoopSounds { public static void main(String[] args) throws Exception { URL…
21 фев '17 в 22:31
1 ответ

Анализ аудио Marf: Где я могу найти данные для приложения SpeakerIdent?

Я использую SpeakerIdentApp от Marf для анализа аудио. Я хотел исследовать это с большим количеством данных, кроме предоставленных speakerIdentApp . Я попытался с некоторыми из волновых файлов по адресу: http://www.wavsource.com/ но эти файлы не под…
27 июн '13 в 11:12
0 ответов

Есть ли способ получить кепстральные коэффициенты Mel-частоты дорожки из Spotify API?

Я ищу, чтобы получить MFCC (коэффициенты кепстра Mel-частоты) следа Spotify. Моя главная цель - определить жанр трека, и алгоритм, который я сейчас изучаю, использует MFCC для извлечения характеристик трека. Я думаю, что может быть 2 способа сделать…
12 янв '18 в 21:03
2 ответа

Экспорт уровня громкости аудиофайла в Linux

Я хотел бы иметь возможность генерировать какой-то файл, который будет хранить уровни громкости аудиофайла. Я довольно гибок в этом, но примером может быть CSV, который показывает объем каждую секунду. Мне не нужен этот номер, чтобы быть точным. Ест…
28 апр '13 в 16:00
1 ответ

Аудиоанализ в iOS для начинающих

Я хотел бы начать разработку некоторых приложений для iOS, включающих анализ аудио. Я читал некоторые документы Apple, такие как Audio Session Programming Guide, но мне все еще нужна отправная точка для аудио анализа. Я хотел бы знать, как я мог бы …
1 ответ

Выявление молчания в конце mp3 с использованием Java

Попытка обнаружить тишину в конце аудио в формате mp3, ну все форматы были бы полезны, но формат mp3 является наиболее важным
06 июн '12 в 16:22
1 ответ

Анализ звука без getUserMedia

Я пытаюсь проанализировать вывод звука из браузера, но не хочу, чтобы появлялось приглашение getUserMedia (которое запрашивает разрешение микрофона). Источниками звука являются SpeechSynthesis и Mp3-файл. Вот мой код: return navigator.mediaDevices.g…
0 ответов

Где я могу найти музыкальную базу данных для жанрового анализа?

Я работал над проектом по автоматической классификации музыки, работая с коллекцией GTZAN Джорджа Цанетакиса. Хотя он и небольшой, всего 1000 треков в 10 жанрах. Есть ли большие базы данных для этой вещи? Для справки, коллекция GTZAN представляет со…
15 фев '15 в 18:34
1 ответ

Обнаружение автоответчика (AMD) с Twilio.. Но по факту

проблема Хотел бы определить, был ли ответ на входящий звонок человеком или машиной. подробности Использую Twilio. И у Twilio есть эта особенность. Однако способ, которым он реализован в их системе, кажется не подходящим для моего варианта использов…
22 сен '14 в 19:12
1 ответ

Альтернатива AnalyserNode API Web Audio для Node.js

Анализ аудио в веб-браузере может быть легко выполнен с помощью AnalyserNode Web Audio API. Есть ли что-то похожее на Node.js?
31 дек '14 в 18:14
3 ответа

Объем из байтового массива

Я новичок в аудиоанализе, но мне нужно выполнить (казалось бы) простую задачу. У меня есть байтовый массив, содержащий 16-битную запись (один канал) и частоту дискретизации 44100. Как мне выполнить быстрый анализ, чтобы получить громкость в любой да…
06 дек '10 в 03:17
0 ответов

Как извлечь стабильную высоту, превышающую заданную длительность, из аудиозаписи?

Учитывая аудиозапись (монофоническую и монофоническую), выделив мелодию с помощью алгоритма, такого как Мелодия, я хотел бы найти все сегменты этой серии основного тона, где частота почти стабильна (максимальное отклонение от средней частоты должно …
4 ответа

Matlab: поиск доминирующих частот в кадре аудиоданных

Я довольно новичок в Matlab и пытаюсь написать простой алгоритм обнаружения речи на основе частоты. Конечная цель - запустить скрипт в файле wav и вывести его время начала / окончания для каждого речевого сегмента. Если использовать код: fr = 128; […
3 ответа

iOS Advanced Audio API для распаковки формата

На iOS возможно ли получить аудиопоток пользователя в распакованном формате? Например, MP3 возвращается как WAV, который можно использовать для анализа звука? Я относительно новичок в платформе iOS и помню, что это было невозможно в старых версиях i…
27 авг '11 в 13:28
1 ответ

Анализ аудио x секунд в будущее с помощью API Web Audio

Я использую AnalyserNode анализировать звук, предоставленный MediaElementAudioSourceNode, Есть ли способ сэмплировать и анализировать звук, который будет проигрывать x секунд в будущем?
0 ответов

Как определить среднюю высоту звука в отформатированной во времени звуковой волне?

Для входа звуковой волны, подобного тем, которые генерируются при захвате микрофона OpenAL, как можно обнаружить "средний" шаг в волне? (например, если это запись скрипки на частоте 440 Гц, я хочу вернуть ~ 440 Гц). Какой самый простой / интуитивно …
26 сен '13 в 22:02
0 ответов

Аудиоанализ Spotify - средние значения для тембра

Согласно Spotify документация, 'Timbre '- это вектор из 12 значений, извлеченных из аудиосегмента длительностью примерно 2 секунды, например: "segments": [ { (...), "timbre": [ 23.312, -7.374, -45.719, 294.874, 51.869, -79.384, -89.048, 143.322, -4.…
03 июн '18 в 16:42