Описание тега voice-detection
Распознавание человеческих голосов в аудиоданных.
0
ответов
Как записать голос, когда пользователь говорит, и как воспроизвести записанный голос, когда пользователь перестал говорить?
Я пишу класс SpeechRecognizer внутри класса обслуживания, чтобы распознавать голос и непрерывно записывать и воспроизводить его в фоновом режиме, но этот код не работал. Кто-нибудь может дать мне идею, как я могу это сделать? Это мой класс деятельно…
17 фев '14 в 08:49
4
ответа
Обнаружение голоса в приложении Android
Описание Мое приложение записывает звук с микрофона телефона. Я использую стандартные классы Android (android.media.AudioRecord) чтобы сделать это. Приложение имеет 2 кнопки "Пуск" и "Стоп", когда я нажимаю кнопку " Пуск " и запускаю запись приложен…
31 окт '11 в 14:26
0
ответов
Автоматически останавливать запись, когда пользователь перестает говорить
Я хочу сделать приложение, которое записывает голос пользователя, но отключает запись, когда пользователь перестает говорить. Как я могу это сделать?
14 авг '15 в 14:28
0
ответов
Почему пользовательский интерфейс не отображается до тех пор, пока не прервется цикл while?
На этот код ответили в Обнаружении голоса в приложении для Android. Он работает нормально, но есть проблема, что содержимое страницы не загружается до тех пор, пока не будет обнаружен какой-либо голос, и этот фрагмент также вызывает сбой приложения …
19 сен '15 в 08:51
0
ответов
Как запустить библиотеку WebRTC
Я хотел бы использовать эту библиотеку: https://github.com/voixen/voixen-vad Они предлагают некоторый пример кода в нижней части readme. Мой вопрос, как мне его запустить? Какой проект мне нужно создать, чтобы интегрировать эту библиотеку и запустит…
15 дек '16 в 12:44
1
ответ
Обнаружение голосовой активности (VAD/SAR) с помощью LIUM
Я написал сценарий оболочки для обучения нескольких GMM для некоторых видов голосовой активности и тишины. Поэтому я использовал инструментарий диаризации LIUM. Я хочу использовать это для обнаружения голосовой активности. Следующий скрипт извлекает…
15 дек '15 в 09:23
1
ответ
Обнаружение команд в Deep Neural Networks с использованием Kaldi без привязки к языку
Кто-нибудь видел примеры того, как настроить простое приложение для обучения dnet, а затем использовать его для распознавания ограниченного числа голосовых команд без привязки к определенному языку? Я считаю, что Kaldi API достаточно мощен для этого…
15 фев '17 в 20:14
0
ответов
Android обнаружение голоса
Я разрабатываю приложение для Android (только для Samsung Galaxy S4 на данный момент), в котором мне нужно постоянно отслеживать звуки с микрофона, чтобы определять голоса и, возможно, сколько людей говорят (я не хочу узнавать, что люди говорят, про…
04 фев '14 в 14:31
1
ответ
Ошибка Setuptools при попытке установить пакет
Я совершенно новичок в Python и хочу установить пакет py-webrtcvad в Windows 7, но я застрял в ошибке ImportError: No module named 'pip.utils.setuptools_build', В stackru есть ответ на эту проблему, который, кажется, решает проблему для других, но э…
10 дек '16 в 13:35
4
ответа
Каков хороший подход для извлечения частей речи из произвольного аудиофайла?
У меня есть набор аудиофайлов, загруженных пользователями, и я не знаю, что они содержат. Я хотел бы взять произвольный аудиофайл и извлечь каждый из случаев, когда кто-то говорит в отдельные аудиофайлы. Я не хочу определять фактические слова, прост…
31 мар '11 в 10:04
1
ответ
Web Audio API: как я могу обнаружить речь и записать до тишины, с кнопкой Push-To-Talk или без нее
Я успешно запускаю клиентскую веб-страницу, которая действует как отправитель голосового сообщения, используя MediaRecorder API: когда пользователь нажимает любую клавишу, запускает аудиозапись, когда клавиша отпускается, аудиозапись отправляется че…
31 май '20 в 12:39
1
ответ
Google Speech API - есть ли способ определить, имеет ли звук человеческий голос или нет?
Я делаю приложение для фильтрации звука на работе, которое читает более сотни аудиофайлов и фильтрует их. Итак, если в звуке есть человеческий голос, он его примет, а если нет - удалит аудиофайл. Я использую ffmpeg, чтобы получить подробную информац…
16 ноя '19 в 08:18
0
ответов
Как записать Short[] в выходной файл wav в Android?
Я пытаюсь записать Short[] в аудиофайл wav с использованием потока вывода, но файл содержит только царапающий звук. Причина, по которой я использую short[], а не byte[], заключается в том, что я пытаюсь использовать внешнюю библиотеку, которая обесп…
26 апр '20 в 22:05
0
ответов
Обнаружение голосовой активности (возможно, в Python)
Моя цель - создать программу, которая обнаруживает голосовую активность в аудиофайле. Затем программа должна вырезать исходный аудиофайл, чтобы сохранилась только часть, в которой обнаружен голос. Я исследовал этот вопрос и нашел хорошую библиотеку …
14 фев '21 в 16:35
0
ответов
Обнаружение речи пользователя в Unity
Я начинаю новый проект в Unity, и он основан на голосе. Есть ли какая-нибудь библиотека или API, которые помогли бы распознать, говорит ли пользователь с помощью простого bool? Мне не нужна громкость голоса, но в будущем мне понадобится спектр (высо…
01 июн '21 в 13:46
0
ответов
есть ли способ получить время речи в аудиофайле и использовать, таким образом, временную шкалу в приложении C # [закрыто]
Мне нужен способ найти человеческий голос в любой временной области аудиофайла (время начала разговора до остановки разговора) и использовать, таким образом, временную шкалу в моем приложении C #, это должно быть так пример: 0: 0: 10 показать привет…
29 окт '21 в 02:11
0
ответов
Обнаружение голоса и музыки с помощью Nodejs
В настоящее время я работаю над расширением для Chrome, которое может отключать фоновую музыку видео, воспроизводимого в браузере. Я нашел на этом форуме способ определить, воспроизводит ли браузер музыку или нет (первый шаг), он работает в браузере…
24 фев '22 в 10:43
1
ответ
Могу ли я использовать голос, чтобы открыть приложение флаттера?
Я работаю над разработкой приложения, чтобы помочь слепым находить вещи, и я хочу добавить в приложение функцию управления голосом, например, когда пользователь говорит «Открыть», приложение будет обедать
13 июл '21 в 22:42
0
ответов
Как отправить аудиофайлы из внешнего хранилища флаттера в flask API для обнаружения голоса
Я испробовал множество способов отправки файлов «.wav», записанных через мобильное приложение. Я хочу снова загрузить его и отправить в свой API фляги, чтобы выполнить обнаружение голоса. Однако я продолжаю получать плохие запросы, и я не знаю, что …
08 июн '22 в 10:15
0
ответов
Любая идея, где взять невокализованные речевые данные?
Поскольку у нас есть 2 основных класса речи, то есть звонкий и глухой. Я смог проверить свой метод с помощью voiceed. например, записанная гласная /a/. но я хочу видеть вывод, когда я использую невокализованную речь. Может ли кто-нибудь указать мне …
22 авг '22 в 10:43