Описание тега audio-analysis
Используется для вопросов, связанных с процессом анализа аудиопотоков или файлов.
1
ответ
Объем памяти для распаковки файлов
Я хочу обрабатывать аудио в автономном режиме на iOS, но у меня есть вопрос об использовании памяти. Если я использую AVAssetReader для распаковки MP3 в необработанные данные PCM, объем памяти будет огромным. Итак, как мне поступить с обработкой (в …
25 сен '11 в 16:11
1
ответ
Измерьте количество отсечения
Может кто-нибудь указать мне на инструмент командной строки или модуль Python, который измеряет количество отсечения в аудиофайле? Например, что-то сопоставимое с http://www.ber-sd.com/dl_clipping.html.
11 фев '13 в 13:05
0
ответов
Аудиоанализ и извлечение функций для визуализации музыки
У меня есть общий вопрос относительно того, как я должен продолжать свои музыкальные усилия по визуализации. Я заинтересован в визуализации произведений классической музыки, записанных или живых. До сих пор я использовал Processing, но я открыт и дл…
07 ноя '16 в 21:49
1
ответ
Как я могу извлечь числовые значения из аудио файла в Java
Мне нужно сделать анализ звуков, чтобы проверить, не было ли оно затруднено или удалено. import java.net.URL; import javax.swing.*; import javax.sound.sampled.*; public class LoopSounds { public static void main(String[] args) throws Exception { URL…
21 фев '17 в 22:31
1
ответ
Анализ аудио Marf: Где я могу найти данные для приложения SpeakerIdent?
Я использую SpeakerIdentApp от Marf для анализа аудио. Я хотел исследовать это с большим количеством данных, кроме предоставленных speakerIdentApp . Я попытался с некоторыми из волновых файлов по адресу: http://www.wavsource.com/ но эти файлы не под…
27 июн '13 в 11:12
0
ответов
Есть ли способ получить кепстральные коэффициенты Mel-частоты дорожки из Spotify API?
Я ищу, чтобы получить MFCC (коэффициенты кепстра Mel-частоты) следа Spotify. Моя главная цель - определить жанр трека, и алгоритм, который я сейчас изучаю, использует MFCC для извлечения характеристик трека. Я думаю, что может быть 2 способа сделать…
12 янв '18 в 21:03
2
ответа
Экспорт уровня громкости аудиофайла в Linux
Я хотел бы иметь возможность генерировать какой-то файл, который будет хранить уровни громкости аудиофайла. Я довольно гибок в этом, но примером может быть CSV, который показывает объем каждую секунду. Мне не нужен этот номер, чтобы быть точным. Ест…
28 апр '13 в 16:00
1
ответ
Аудиоанализ в iOS для начинающих
Я хотел бы начать разработку некоторых приложений для iOS, включающих анализ аудио. Я читал некоторые документы Apple, такие как Audio Session Programming Guide, но мне все еще нужна отправная точка для аудио анализа. Я хотел бы знать, как я мог бы …
31 мар '15 в 14:00
1
ответ
Выявление молчания в конце mp3 с использованием Java
Попытка обнаружить тишину в конце аудио в формате mp3, ну все форматы были бы полезны, но формат mp3 является наиболее важным
06 июн '12 в 16:22
1
ответ
Анализ звука без getUserMedia
Я пытаюсь проанализировать вывод звука из браузера, но не хочу, чтобы появлялось приглашение getUserMedia (которое запрашивает разрешение микрофона). Источниками звука являются SpeechSynthesis и Mp3-файл. Вот мой код: return navigator.mediaDevices.g…
19 фев '18 в 08:33
0
ответов
Где я могу найти музыкальную базу данных для жанрового анализа?
Я работал над проектом по автоматической классификации музыки, работая с коллекцией GTZAN Джорджа Цанетакиса. Хотя он и небольшой, всего 1000 треков в 10 жанрах. Есть ли большие базы данных для этой вещи? Для справки, коллекция GTZAN представляет со…
15 фев '15 в 18:34
1
ответ
Обнаружение автоответчика (AMD) с Twilio.. Но по факту
проблема Хотел бы определить, был ли ответ на входящий звонок человеком или машиной. подробности Использую Twilio. И у Twilio есть эта особенность. Однако способ, которым он реализован в их системе, кажется не подходящим для моего варианта использов…
22 сен '14 в 19:12
1
ответ
Альтернатива AnalyserNode API Web Audio для Node.js
Анализ аудио в веб-браузере может быть легко выполнен с помощью AnalyserNode Web Audio API. Есть ли что-то похожее на Node.js?
31 дек '14 в 18:14
3
ответа
Объем из байтового массива
Я новичок в аудиоанализе, но мне нужно выполнить (казалось бы) простую задачу. У меня есть байтовый массив, содержащий 16-битную запись (один канал) и частоту дискретизации 44100. Как мне выполнить быстрый анализ, чтобы получить громкость в любой да…
06 дек '10 в 03:17
0
ответов
Как извлечь стабильную высоту, превышающую заданную длительность, из аудиозаписи?
Учитывая аудиозапись (монофоническую и монофоническую), выделив мелодию с помощью алгоритма, такого как Мелодия, я хотел бы найти все сегменты этой серии основного тона, где частота почти стабильна (максимальное отклонение от средней частоты должно …
17 июл '18 в 16:33
4
ответа
Matlab: поиск доминирующих частот в кадре аудиоданных
Я довольно новичок в Matlab и пытаюсь написать простой алгоритм обнаружения речи на основе частоты. Конечная цель - запустить скрипт в файле wav и вывести его время начала / окончания для каждого речевого сегмента. Если использовать код: fr = 128; […
27 ноя '12 в 21:05
3
ответа
iOS Advanced Audio API для распаковки формата
На iOS возможно ли получить аудиопоток пользователя в распакованном формате? Например, MP3 возвращается как WAV, который можно использовать для анализа звука? Я относительно новичок в платформе iOS и помню, что это было невозможно в старых версиях i…
27 авг '11 в 13:28
1
ответ
Анализ аудио x секунд в будущее с помощью API Web Audio
Я использую AnalyserNode анализировать звук, предоставленный MediaElementAudioSourceNode, Есть ли способ сэмплировать и анализировать звук, который будет проигрывать x секунд в будущем?
27 мар '14 в 20:59
0
ответов
Как определить среднюю высоту звука в отформатированной во времени звуковой волне?
Для входа звуковой волны, подобного тем, которые генерируются при захвате микрофона OpenAL, как можно обнаружить "средний" шаг в волне? (например, если это запись скрипки на частоте 440 Гц, я хочу вернуть ~ 440 Гц). Какой самый простой / интуитивно …
26 сен '13 в 22:02
0
ответов
Аудиоанализ Spotify - средние значения для тембра
Согласно Spotify документация, 'Timbre '- это вектор из 12 значений, извлеченных из аудиосегмента длительностью примерно 2 секунды, например: "segments": [ { (...), "timbre": [ 23.312, -7.374, -45.719, 294.874, 51.869, -79.384, -89.048, 143.322, -4.…
03 июн '18 в 16:42