Описание тега sound-recognition
1
ответ
Звуковое сходство компьютерного и человеческого голоса
Я ищу алгоритм для сравнения двух звуковых файлов по их фонетике. Я хочу оценить какую-то оценку (например, 0: нет сходства; 100: тот же звук). Поэтому я загрузил сгенерированный компьютер и записанный человеческий голос, говорящий "Привет", в Audac…
25 янв '13 в 09:57
1
ответ
Диктует в MS Visual C#?
Я хочу сделать текстовый редактор, но он отличается от других текстовых редакторов. Он получит команды от моего голоса. Например; я скажу свое имя микрофону "Ибрагим АКГУН" .. тогда эта программа получит его и запишет как виртуальный секретарь:) Это…
11 июн '09 в 06:00
0
ответов
Ошибка списка аргументов C++/CLR
Я создаю программу распознавания звука, и есть синтаксическая ошибка, которую я не могу решить в C++, вот она: sRecognize->SpeechRecognized += sRecognize_SpeechRecognized; Ошибка говорит: Ошибка 1, ошибка C3867: "SoundRecognizer::MyForm::sRecogni…
26 авг '14 в 11:43
1
ответ
Распознать определенный звук в разговоре со службами Windows Azure
Я хотел бы знать, возможно ли создать службу с Cognitive Services в Windows Azure, которая позволяет мне распознавать один конкретный звук в разговоре (предоставляемый в прямом эфире в Интернете) и как это сделать. Я уже знаю базовые методы машинног…
29 май '17 в 15:08
2
ответа
"Звуковое" признание в Swift?
Я работаю над приложением в Swift, и я думал о том, как добиться признания звука без речи в моем проекте. Я имею в виду, есть ли способ, которым я могу взять звуковые входы и сопоставить их с некоторыми предопределенными звуками, уже включенными в п…
22 апр '15 в 03:43
0
ответов
Есть ли способ сравнить две спектрограммы?
Я пытаюсь сравнить две спектрограммы двух разных произнесенных слов. Есть ли способ сравнить их, чтобы сказать, что эти две спектрограммы от разных слов. Привет (слово, которое я сказал) Play (слово, которое я сказал)
24 май '18 в 17:40
0
ответов
Как Shazam избегает ложных срабатываний?
В двух словах, Shazam записывает отпечаток прослушиваемой песни и отправляет его на свои серверы для сопоставления с базой данных отпечатков пальцев. Затем процесс поиска создает гистограмму смещений для каждой песни в индексе и объявляет песню с бо…
15 май '18 в 18:45
0
ответов
Запрос по напыщенному подходу
Я не знаю, если это лучшее место, чтобы спросить это. Я разрабатываю учебный проект для моей степени бакалавра, который в основном представляет собой сервис, который ищет песни, напевая пользователей. Может ли кто-нибудь из вас предложить лучший под…
02 май '11 в 08:32
3
ответа
Как получить номер кадра и размер кадра из файла WAV
В настоящее время я делаю тезис о распознавании аккордов с EPCP с wav-файлом в качестве входных данных, но сейчас я застрял в определении количества кадров и размера кадра одного файла wav. Мне нужны эти данные в качестве параметров для функции Hamm…
18 янв '12 в 11:41
2
ответа
Реализация нейронной сети для распознавания гласных в единицах входного слоя и структуре matlab?
Я делаю проект по распознаванию гласных, и мне нужно внедрить нейронную сеть. Я новичок в этой области, поэтому я не совсем уверен, как это сделать правильно. У меня есть тренировочный набор из 800 слов с 8 типами гласных, и мой первый шаг состоял в…
15 сен '13 в 07:42
1
ответ
Как проанализировать голос и сохранить результат?
Я думаю создать приложение. Ниже приводится описание: 1. Люди будут загружать ранее записанный разговор на сервер. 2. приложение с сервера определит высоту, скорость, акцент, произношение и т. Д. Этого голоса и создаст личное портфолио. 3. Если вы п…
30 авг '11 в 17:43
0
ответов
Код заканчивается речевым распознаванием.UnknownValueError
Попытка извлечь текст из аудиофайла с помощью API распознавания звука Google на виртуальной машине. Линейный код занимает слишком много времени, поэтому пошел с многопоточностью. Код работает нормально для нескольких выходных строк, но заканчивается…
02 фев '19 в 17:30
2
ответа
Программное обеспечение: Как программное обеспечение распознает песню?
Я играл с моим телефоном, и на нем есть это приложение, которое, когда вы используете его для записи 10 секунд песни, говорит вам название и автора этой песни. Теперь, как инженер-программист, я не могу не задаться вопросом, как это работает?
30 сен '10 в 13:40
1
ответ
Какой алгоритм используется для извлечения аудио функции в аудиосети Google?
Я начинаю с аудиосета Google. В то время как набор данных является обширным, я нахожу информацию относительно извлечения аудиофункций очень расплывчатой. Сайт упоминает 128-мерные аудио функции, извлеченные с частотой 1 Гц Аудио функции были извлече…
19 май '17 в 22:48
0
ответов
Как посчитать максимальную амплитуду звука в андроиде?
Я здесь в поисках функциональности подсчета максимальной амплитуды звука перфорации. Я использовал API распознавания речи Android в своем демонстрационном приложении, но он считает, что все звуки (шум) и счетчик работают как пуля со скоростью. Я хоч…
28 окт '13 в 06:12
2
ответа
Как сравнить образцы.wav в delphi?
Я хотел бы начать изучать .wav образец, сравнивая два файла. как возвращение результата длительности, ударения, произношения в процентах. и т. д. или любой код, который сравнивает / анализирует .wav,
13 авг '10 в 05:54
1
ответ
Как мне получить значения определенного частотного диапазона
У меня есть файл.wav, я загружаю его и получаю следующую спектрограмму, показывающую спектр в дБ Теперь я хотел бы знать эти значения именно потому, что хочу сравнить с другим файлом WAV, чтобы узнать, есть ли эти 4 значения. Источник для создания э…
02 апр '14 в 14:08
1
ответ
Библиотека распознавания и категоризации звука на C или Python
... Здравствуйте все! Я студент, пытающийся сделать устройство "Сделай сам" относительно распознавания звука. Не слишком точный и сложный, как распознавание речи, я просто хочу принять и использовать некоторую простую библиотеку распознавания для св…
04 апр '16 в 06:57
2
ответа
Распознавание звука с iOS 7?
Я хочу создать приложение, которое реагирует на звук, который вы издаете, когда выдуваете свечи на день рождения. Это не распознавание речи как таковое (этот звук не является словом на английском языке), и очень любезный Халле из OpenEars сказал мне…
17 окт '13 в 20:29
1
ответ
Методы, чтобы сделать обнаружение выбросов в распознавании звука?
Существуют модели для распознавания звуков двух классов: класса А и класса В. Как распознать звуки класса C как ненормальные звуки? Я пытался установить порог при распознавании по кадрам. above 70% -> class A or B else -> abnormal Например, Ес…
08 янв '16 в 02:42