Описание тега sound-recognition

1 ответ

Звуковое сходство компьютерного и человеческого голоса

Я ищу алгоритм для сравнения двух звуковых файлов по их фонетике. Я хочу оценить какую-то оценку (например, 0: нет сходства; 100: тот же звук). Поэтому я загрузил сгенерированный компьютер и записанный человеческий голос, говорящий "Привет", в Audac…
25 янв '13 в 09:57
1 ответ

Диктует в MS Visual C#?

Я хочу сделать текстовый редактор, но он отличается от других текстовых редакторов. Он получит команды от моего голоса. Например; я скажу свое имя микрофону "Ибрагим АКГУН" .. тогда эта программа получит его и запишет как виртуальный секретарь:) Это…
11 июн '09 в 06:00
0 ответов

Ошибка списка аргументов C++/CLR

Я создаю программу распознавания звука, и есть синтаксическая ошибка, которую я не могу решить в C++, вот она: sRecognize->SpeechRecognized += sRecognize_SpeechRecognized; Ошибка говорит: Ошибка 1, ошибка C3867: "SoundRecognizer::MyForm::sRecogni…
26 авг '14 в 11:43
1 ответ

Распознать определенный звук в разговоре со службами Windows Azure

Я хотел бы знать, возможно ли создать службу с Cognitive Services в Windows Azure, которая позволяет мне распознавать один конкретный звук в разговоре (предоставляемый в прямом эфире в Интернете) и как это сделать. Я уже знаю базовые методы машинног…
2 ответа

"Звуковое" признание в Swift?

Я работаю над приложением в Swift, и я думал о том, как добиться признания звука без речи в моем проекте. Я имею в виду, есть ли способ, которым я могу взять звуковые входы и сопоставить их с некоторыми предопределенными звуками, уже включенными в п…
22 апр '15 в 03:43
0 ответов

Есть ли способ сравнить две спектрограммы?

Я пытаюсь сравнить две спектрограммы двух разных произнесенных слов. Есть ли способ сравнить их, чтобы сказать, что эти две спектрограммы от разных слов. Привет (слово, которое я сказал) Play (слово, которое я сказал)
24 май '18 в 17:40
0 ответов

Как Shazam избегает ложных срабатываний?

В двух словах, Shazam записывает отпечаток прослушиваемой песни и отправляет его на свои серверы для сопоставления с базой данных отпечатков пальцев. Затем процесс поиска создает гистограмму смещений для каждой песни в индексе и объявляет песню с бо…
15 май '18 в 18:45
0 ответов

Запрос по напыщенному подходу

Я не знаю, если это лучшее место, чтобы спросить это. Я разрабатываю учебный проект для моей степени бакалавра, который в основном представляет собой сервис, который ищет песни, напевая пользователей. Может ли кто-нибудь из вас предложить лучший под…
02 май '11 в 08:32
3 ответа

Как получить номер кадра и размер кадра из файла WAV

В настоящее время я делаю тезис о распознавании аккордов с EPCP с wav-файлом в качестве входных данных, но сейчас я застрял в определении количества кадров и размера кадра одного файла wav. Мне нужны эти данные в качестве параметров для функции Hamm…
18 янв '12 в 11:41
2 ответа

Реализация нейронной сети для распознавания гласных в единицах входного слоя и структуре matlab?

Я делаю проект по распознаванию гласных, и мне нужно внедрить нейронную сеть. Я новичок в этой области, поэтому я не совсем уверен, как это сделать правильно. У меня есть тренировочный набор из 800 слов с 8 типами гласных, и мой первый шаг состоял в…
15 сен '13 в 07:42
1 ответ

Как проанализировать голос и сохранить результат?

Я думаю создать приложение. Ниже приводится описание: 1. Люди будут загружать ранее записанный разговор на сервер. 2. приложение с сервера определит высоту, скорость, акцент, произношение и т. Д. Этого голоса и создаст личное портфолио. 3. Если вы п…
0 ответов

Код заканчивается речевым распознаванием.UnknownValueError

Попытка извлечь текст из аудиофайла с помощью API распознавания звука Google на виртуальной машине. Линейный код занимает слишком много времени, поэтому пошел с многопоточностью. Код работает нормально для нескольких выходных строк, но заканчивается…
02 фев '19 в 17:30
2 ответа

Программное обеспечение: Как программное обеспечение распознает песню?

Я играл с моим телефоном, и на нем есть это приложение, которое, когда вы используете его для записи 10 секунд песни, говорит вам название и автора этой песни. Теперь, как инженер-программист, я не могу не задаться вопросом, как это работает?
30 сен '10 в 13:40
1 ответ

Какой алгоритм используется для извлечения аудио функции в аудиосети Google?

Я начинаю с аудиосета Google. В то время как набор данных является обширным, я нахожу информацию относительно извлечения аудиофункций очень расплывчатой. Сайт упоминает 128-мерные аудио функции, извлеченные с частотой 1 Гц Аудио функции были извлече…
19 май '17 в 22:48
0 ответов

Как посчитать максимальную амплитуду звука в андроиде?

Я здесь в поисках функциональности подсчета максимальной амплитуды звука перфорации. Я использовал API распознавания речи Android в своем демонстрационном приложении, но он считает, что все звуки (шум) и счетчик работают как пуля со скоростью. Я хоч…
2 ответа

Как сравнить образцы.wav в delphi?

Я хотел бы начать изучать .wav образец, сравнивая два файла. как возвращение результата длительности, ударения, произношения в процентах. и т. д. или любой код, который сравнивает / анализирует .wav,
13 авг '10 в 05:54
1 ответ

Как мне получить значения определенного частотного диапазона

У меня есть файл.wav, я загружаю его и получаю следующую спектрограмму, показывающую спектр в дБ Теперь я хотел бы знать эти значения именно потому, что хочу сравнить с другим файлом WAV, чтобы узнать, есть ли эти 4 значения. Источник для создания э…
1 ответ

Библиотека распознавания и категоризации звука на C или Python

... Здравствуйте все! Я студент, пытающийся сделать устройство "Сделай сам" относительно распознавания звука. Не слишком точный и сложный, как распознавание речи, я просто хочу принять и использовать некоторую простую библиотеку распознавания для св…
2 ответа

Распознавание звука с iOS 7?

Я хочу создать приложение, которое реагирует на звук, который вы издаете, когда выдуваете свечи на день рождения. Это не распознавание речи как таковое (этот звук не является словом на английском языке), и очень любезный Халле из OpenEars сказал мне…
17 окт '13 в 20:29
1 ответ

Методы, чтобы сделать обнаружение выбросов в распознавании звука?

Существуют модели для распознавания звуков двух классов: класса А и класса В. Как распознать звуки класса C как ненормальные звуки? Я пытался установить порог при распознавании по кадрам. above 70% -> class A or B else -> abnormal Например, Ес…