Описание тега voice-detection

Распознавание человеческих голосов в аудиоданных.
0 ответов

Как записать голос, когда пользователь говорит, и как воспроизвести записанный голос, когда пользователь перестал говорить?

Я пишу класс SpeechRecognizer внутри класса обслуживания, чтобы распознавать голос и непрерывно записывать и воспроизводить его в фоновом режиме, но этот код не работал. Кто-нибудь может дать мне идею, как я могу это сделать? Это мой класс деятельно…
4 ответа

Обнаружение голоса в приложении Android

Описание Мое приложение записывает звук с микрофона телефона. Я использую стандартные классы Android (android.media.AudioRecord) чтобы сделать это. Приложение имеет 2 кнопки "Пуск" и "Стоп", когда я нажимаю кнопку " Пуск " и запускаю запись приложен…
31 окт '11 в 14:26
0 ответов

Автоматически останавливать запись, когда пользователь перестает говорить

Я хочу сделать приложение, которое записывает голос пользователя, но отключает запись, когда пользователь перестает говорить. Как я могу это сделать?
14 авг '15 в 14:28
0 ответов

Почему пользовательский интерфейс не отображается до тех пор, пока не прервется цикл while?

На этот код ответили в Обнаружении голоса в приложении для Android. Он работает нормально, но есть проблема, что содержимое страницы не загружается до тех пор, пока не будет обнаружен какой-либо голос, и этот фрагмент также вызывает сбой приложения …
19 сен '15 в 08:51
0 ответов

Как запустить библиотеку WebRTC

Я хотел бы использовать эту библиотеку: https://github.com/voixen/voixen-vad Они предлагают некоторый пример кода в нижней части readme. Мой вопрос, как мне его запустить? Какой проект мне нужно создать, чтобы интегрировать эту библиотеку и запустит…
15 дек '16 в 12:44
1 ответ

Обнаружение голосовой активности (VAD/SAR) с помощью LIUM

Я написал сценарий оболочки для обучения нескольких GMM для некоторых видов голосовой активности и тишины. Поэтому я использовал инструментарий диаризации LIUM. Я хочу использовать это для обнаружения голосовой активности. Следующий скрипт извлекает…
1 ответ

Обнаружение команд в Deep Neural Networks с использованием Kaldi без привязки к языку

Кто-нибудь видел примеры того, как настроить простое приложение для обучения dnet, а затем использовать его для распознавания ограниченного числа голосовых команд без привязки к определенному языку? Я считаю, что Kaldi API достаточно мощен для этого…
0 ответов

Android обнаружение голоса

Я разрабатываю приложение для Android (только для Samsung Galaxy S4 на данный момент), в котором мне нужно постоянно отслеживать звуки с микрофона, чтобы определять голоса и, возможно, сколько людей говорят (я не хочу узнавать, что люди говорят, про…
04 фев '14 в 14:31
1 ответ

Ошибка Setuptools при попытке установить пакет

Я совершенно новичок в Python и хочу установить пакет py-webrtcvad в Windows 7, но я застрял в ошибке ImportError: No module named 'pip.utils.setuptools_build', В stackru есть ответ на эту проблему, который, кажется, решает проблему для других, но э…
4 ответа

Каков хороший подход для извлечения частей речи из произвольного аудиофайла?

У меня есть набор аудиофайлов, загруженных пользователями, и я не знаю, что они содержат. Я хотел бы взять произвольный аудиофайл и извлечь каждый из случаев, когда кто-то говорит в отдельные аудиофайлы. Я не хочу определять фактические слова, прост…
1 ответ

Web Audio API: как я могу обнаружить речь и записать до тишины, с кнопкой Push-To-Talk или без нее

Я успешно запускаю клиентскую веб-страницу, которая действует как отправитель голосового сообщения, используя MediaRecorder API: когда пользователь нажимает любую клавишу, запускает аудиозапись, когда клавиша отпускается, аудиозапись отправляется че…
1 ответ

Google Speech API - есть ли способ определить, имеет ли звук человеческий голос или нет?

Я делаю приложение для фильтрации звука на работе, которое читает более сотни аудиофайлов и фильтрует их. Итак, если в звуке есть человеческий голос, он его примет, а если нет - удалит аудиофайл. Я использую ffmpeg, чтобы получить подробную информац…
0 ответов

Как записать Short[] в выходной файл wav в Android?

Я пытаюсь записать Short[] в аудиофайл wav с использованием потока вывода, но файл содержит только царапающий звук. Причина, по которой я использую short[], а не byte[], заключается в том, что я пытаюсь использовать внешнюю библиотеку, которая обесп…
0 ответов

Обнаружение голосовой активности (возможно, в Python)

Моя цель - создать программу, которая обнаруживает голосовую активность в аудиофайле. Затем программа должна вырезать исходный аудиофайл, чтобы сохранилась только часть, в которой обнаружен голос. Я исследовал этот вопрос и нашел хорошую библиотеку …
0 ответов

Обнаружение речи пользователя в Unity

Я начинаю новый проект в Unity, и он основан на голосе. Есть ли какая-нибудь библиотека или API, которые помогли бы распознать, говорит ли пользователь с помощью простого bool? Мне не нужна громкость голоса, но в будущем мне понадобится спектр (высо…
01 июн '21 в 13:46
0 ответов

есть ли способ получить время речи в аудиофайле и использовать, таким образом, временную шкалу в приложении C # [закрыто]

Мне нужен способ найти человеческий голос в любой временной области аудиофайла (время начала разговора до остановки разговора) и использовать, таким образом, временную шкалу в моем приложении C #, это должно быть так пример: 0: 0: 10 показать привет…
29 окт '21 в 02:11
0 ответов

Обнаружение голоса и музыки с помощью Nodejs

В настоящее время я работаю над расширением для Chrome, которое может отключать фоновую музыку видео, воспроизводимого в браузере. Я нашел на этом форуме способ определить, воспроизводит ли браузер музыку или нет (первый шаг), он работает в браузере…
24 фев '22 в 10:43
1 ответ

Могу ли я использовать голос, чтобы открыть приложение флаттера?

Я работаю над разработкой приложения, чтобы помочь слепым находить вещи, и я хочу добавить в приложение функцию управления голосом, например, когда пользователь говорит «Открыть», приложение будет обедать
13 июл '21 в 22:42
0 ответов

Как отправить аудиофайлы из внешнего хранилища флаттера в flask API для обнаружения голоса

Я испробовал множество способов отправки файлов «.wav», записанных через мобильное приложение. Я хочу снова загрузить его и отправить в свой API фляги, чтобы выполнить обнаружение голоса. Однако я продолжаю получать плохие запросы, и я не знаю, что …
08 июн '22 в 10:15
0 ответов

Любая идея, где взять невокализованные речевые данные?

Поскольку у нас есть 2 основных класса речи, то есть звонкий и глухой. Я смог проверить свой метод с помощью voiceed. например, записанная гласная /a/. но я хочу видеть вывод, когда я использую невокализованную речь. Может ли кто-нибудь указать мне …
22 авг '22 в 10:43