Описание тега voice-detection

Вопросы с тегом

Распознавание человеческих голосов в аудиоданных.

0 ответов

Как записать голос, когда пользователь говорит, и как воспроизвести записанный голос, когда пользователь перестал говорить?

Я пишу класс SpeechRecognizer внутри класса обслуживания, чтобы распознавать голос и непрерывно записывать и воспроизводить его в фоновом режиме, но этот код не работал. Кто-нибудь может дать мне идею, как я могу это сделать? Это мой класс деятельно…

17 фев '14 в 08:49

4 ответа

Обнаружение голоса в приложении Android

Описание Мое приложение записывает звук с микрофона телефона. Я использую стандартные классы Android (android.media.AudioRecord) чтобы сделать это. Приложение имеет 2 кнопки "Пуск" и "Стоп", когда я нажимаю кнопку " Пуск " и запускаю запись приложен…

android voice-detection

31 окт '11 в 14:26

0 ответов

Автоматически останавливать запись, когда пользователь перестает говорить

Я хочу сделать приложение, которое записывает голос пользователя, но отключает запись, когда пользователь перестает говорить. Как я могу это сделать?

android voice-recording voice-detection

14 авг '15 в 14:28

0 ответов

Почему пользовательский интерфейс не отображается до тех пор, пока не прервется цикл while?

На этот код ответили в Обнаружении голоса в приложении для Android. Он работает нормально, но есть проблема, что содержимое страницы не загружается до тех пор, пока не будет обнаружен какой-либо голос, и этот фрагмент также вызывает сбой приложения …

android pitch-detection voice-detection

19 сен '15 в 08:51

0 ответов

Как запустить библиотеку WebRTC

Я хотел бы использовать эту библиотеку: https://github.com/voixen/voixen-vad Они предлагают некоторый пример кода в нижней части readme. Мой вопрос, как мне его запустить? Какой проект мне нужно создать, чтобы интегрировать эту библиотеку и запустит…

webrtc voice-detection

15 дек '16 в 12:44

1 ответ

Обнаружение голосовой активности (VAD/SAR) с помощью LIUM

Я написал сценарий оболочки для обучения нескольких GMM для некоторых видов голосовой активности и тишины. Поэтому я использовал инструментарий диаризации LIUM. Я хочу использовать это для обнаружения голосовой активности. Следующий скрипт извлекает…

java speech-recognition sphinx4 voice-detection

15 дек '15 в 09:23

1 ответ

Обнаружение команд в Deep Neural Networks с использованием Kaldi без привязки к языку

Кто-нибудь видел примеры того, как настроить простое приложение для обучения dnet, а затем использовать его для распознавания ограниченного числа голосовых команд без привязки к определенному языку? Я считаю, что Kaldi API достаточно мощен для этого…

neural-network feature-extraction kaldi voice-detection

15 фев '17 в 20:14

0 ответов

Android обнаружение голоса

Я разрабатываю приложение для Android (только для Samsung Galaxy S4 на данный момент), в котором мне нужно постоянно отслеживать звуки с микрофона, чтобы определять голоса и, возможно, сколько людей говорят (я не хочу узнавать, что люди говорят, про…

android microphone voice-detection

04 фев '14 в 14:31

1 ответ

Ошибка Setuptools при попытке установить пакет

Я совершенно новичок в Python и хочу установить пакет py-webrtcvad в Windows 7, но я застрял в ошибке ImportError: No module named 'pip.utils.setuptools_build', В stackru есть ответ на эту проблему, который, кажется, решает проблему для других, но э…

python python-3.x setuptools cmusphinx voice-detection

10 дек '16 в 13:35

4 ответа

Каков хороший подход для извлечения частей речи из произвольного аудиофайла?

У меня есть набор аудиофайлов, загруженных пользователями, и я не знаю, что они содержат. Я хотел бы взять произвольный аудиофайл и извлечь каждый из случаев, когда кто-то говорит в отдельные аудиофайлы. Я не хочу определять фактические слова, прост…

linux audio signal-processing voice voice-detection

31 мар '11 в 10:04

1 ответ

Web Audio API: как я могу обнаружить речь и записать до тишины, с кнопкой Push-To-Talk или без нее

Я успешно запускаю клиентскую веб-страницу, которая действует как отправитель голосового сообщения, используя MediaRecorder API: когда пользователь нажимает любую клавишу, запускает аудиозапись, когда клавиша отпускается, аудиозапись отправляется че…

javascript audio web-audio-api web-mediarecorder voice-detection

31 май '20 в 12:39

1 ответ

Google Speech API - есть ли способ определить, имеет ли звук человеческий голос или нет?

Я делаю приложение для фильтрации звука на работе, которое читает более сотни аудиофайлов и фильтрует их. Итак, если в звуке есть человеческий голос, он его примет, а если нет - удалит аудиофайл. Я использую ffmpeg, чтобы получить подробную информац…

php ffmpeg google-speech-api google-cloud-speech voice-detection

16 ноя '19 в 08:18

0 ответов

Как записать Short[] в выходной файл wav в Android?

Я пытаюсь записать Short[] в аудиофайл wav с использованием потока вывода, но файл содержит только царапающий звук. Причина, по которой я использую short[], а не byte[], заключается в том, что я пытаюсь использовать внешнюю библиотеку, которая обесп…

android audio voice-recognition android-audiorecord voice-detection

26 апр '20 в 22:05

0 ответов

Обнаружение голосовой активности (возможно, в Python)

Моя цель - создать программу, которая обнаруживает голосовую активность в аудиофайле. Затем программа должна вырезать исходный аудиофайл, чтобы сохранилась только часть, в которой обнаружен голос. Я исследовал этот вопрос и нашел хорошую библиотеку …

python conv-neural-network voice-recognition voice-detection

14 фев '21 в 16:35

0 ответов

Обнаружение речи пользователя в Unity

Я начинаю новый проект в Unity, и он основан на голосе. Есть ли какая-нибудь библиотека или API, которые помогли бы распознать, говорит ли пользователь с помощью простого bool? Мне не нужна громкость голоса, но в будущем мне понадобится спектр (высо…

c# unity-game-engine voice-detection

01 июн '21 в 13:46

0 ответов

есть ли способ получить время речи в аудиофайле и использовать, таким образом, временную шкалу в приложении C # [закрыто]

Мне нужен способ найти человеческий голос в любой временной области аудиофайла (время начала разговора до остановки разговора) и использовать, таким образом, временную шкалу в моем приложении C #, это должно быть так пример: 0: 0: 10 показать привет…

c# matlab voice-recognition voice-detection

29 окт '21 в 02:11

0 ответов

Обнаружение голоса и музыки с помощью Nodejs

В настоящее время я работаю над расширением для Chrome, которое может отключать фоновую музыку видео, воспроизводимого в браузере. Я нашел на этом форуме способ определить, воспроизводит ли браузер музыку или нет (первый шаг), он работает в браузере…

javascript node.js voice-detection

24 фев '22 в 10:43

1 ответ

Могу ли я использовать голос, чтобы открыть приложение флаттера?

Я работаю над разработкой приложения, чтобы помочь слепым находить вещи, и я хочу добавить в приложение функцию управления голосом, например, когда пользователь говорит «Открыть», приложение будет обедать

flutter background-process voice-detection

13 июл '21 в 22:42

0 ответов

Как отправить аудиофайлы из внешнего хранилища флаттера в flask API для обнаружения голоса

Я испробовал множество способов отправки файлов «.wav», записанных через мобильное приложение. Я хочу снова загрузить его и отправить в свой API фляги, чтобы выполнить обнаружение голоса. Однако я продолжаю получать плохие запросы, и я не знаю, что …

python machine-learning flask voice-detection

08 июн '22 в 10:15

0 ответов

Любая идея, где взять невокализованные речевые данные?

Поскольку у нас есть 2 основных класса речи, то есть звонкий и глухой. Я смог проверить свой метод с помощью voiceed. например, записанная гласная /a/. но я хочу видеть вывод, когда я использую невокализованную речь. Может ли кто-нибудь указать мне …

audio signals speech voice-detection

22 авг '22 в 10:43