Описание тега sound-recognition

Вопросы с тегом

1 ответ

Звуковое сходство компьютерного и человеческого голоса

Я ищу алгоритм для сравнения двух звуковых файлов по их фонетике. Я хочу оценить какую-то оценку (например, 0: нет сходства; 100: тот же звук). Поэтому я загрузил сгенерированный компьютер и записанный человеческий голос, говорящий "Привет", в Audac…

phonetics sound-recognition

25 янв '13 в 09:57

1 ответ

Диктует в MS Visual C#?

Я хочу сделать текстовый редактор, но он отличается от других текстовых редакторов. Он получит команды от моего голоса. Например; я скажу свое имя микрофону "Ибрагим АКГУН" .. тогда эта программа получит его и запишет как виртуальный секретарь:) Это…

c# sound-recognition dictating

11 июн '09 в 06:00

0 ответов

Ошибка списка аргументов C++/CLR

Я создаю программу распознавания звука, и есть синтаксическая ошибка, которую я не могу решить в C++, вот она: sRecognize->SpeechRecognized += sRecognize_SpeechRecognized; Ошибка говорит: Ошибка 1, ошибка C3867: "SoundRecognizer::MyForm::sRecogni…

pointers c++-cli clr sound-recognition

26 авг '14 в 11:43

1 ответ

Распознать определенный звук в разговоре со службами Windows Azure

Я хотел бы знать, возможно ли создать службу с Cognitive Services в Windows Azure, которая позволяет мне распознавать один конкретный звук в разговоре (предоставляемый в прямом эфире в Интернете) и как это сделать. Я уже знаю базовые методы машинног…

python java azure microsoft-cognitive sound-recognition

29 май '17 в 15:08

2 ответа

"Звуковое" признание в Swift?

Я работаю над приложением в Swift, и я думал о том, как добиться признания звука без речи в моем проекте. Я имею в виду, есть ли способ, которым я могу взять звуковые входы и сопоставить их с некоторыми предопределенными звуками, уже включенными в п…

ios swift audio sound-recognition

22 апр '15 в 03:43

0 ответов

Есть ли способ сравнить две спектрограммы?

Я пытаюсь сравнить две спектрограммы двух разных произнесенных слов. Есть ли способ сравнить их, чтобы сказать, что эти две спектрограммы от разных слов. Привет (слово, которое я сказал) Play (слово, которое я сказал)

algorithm comparison sound-recognition

24 май '18 в 17:40

0 ответов

Как Shazam избегает ложных срабатываний?

В двух словах, Shazam записывает отпечаток прослушиваемой песни и отправляет его на свои серверы для сопоставления с базой данных отпечатков пальцев. Затем процесс поиска создает гистограмму смещений для каждой песни в индексе и объявляет песню с бо…

algorithm audio sound-recognition shazam

15 май '18 в 18:45

0 ответов

Запрос по напыщенному подходу

Я не знаю, если это лучшее место, чтобы спросить это. Я разрабатываю учебный проект для моей степени бакалавра, который в основном представляет собой сервис, который ищет песни, напевая пользователей. Может ли кто-нибудь из вас предложить лучший под…

audio frequency sound-recognition

02 май '11 в 08:32

3 ответа

Как получить номер кадра и размер кадра из файла WAV

В настоящее время я делаю тезис о распознавании аккордов с EPCP с wav-файлом в качестве входных данных, но сейчас я застрял в определении количества кадров и размера кадра одного файла wav. Мне нужны эти данные в качестве параметров для функции Hamm…

c# audio sound-recognition hamming-window

18 янв '12 в 11:41

2 ответа

Реализация нейронной сети для распознавания гласных в единицах входного слоя и структуре matlab?

Я делаю проект по распознаванию гласных, и мне нужно внедрить нейронную сеть. Я новичок в этой области, поэтому я не совсем уверен, как это сделать правильно. У меня есть тренировочный набор из 800 слов с 8 типами гласных, и мой первый шаг состоял в…

matlab neural-network sound-recognition

15 сен '13 в 07:42

1 ответ

Как проанализировать голос и сохранить результат?

Я думаю создать приложение. Ниже приводится описание: 1. Люди будут загружать ранее записанный разговор на сервер. 2. приложение с сервера определит высоту, скорость, акцент, произношение и т. Д. Этого голоса и создаст личное портфолио. 3. Если вы п…

.net audio speech-recognition sound-synthesis sound-recognition

30 авг '11 в 17:43

0 ответов

Код заканчивается речевым распознаванием.UnknownValueError

Попытка извлечь текст из аудиофайла с помощью API распознавания звука Google на виртуальной машине. Линейный код занимает слишком много времени, поэтому пошел с многопоточностью. Код работает нормально для нескольких выходных строк, но заканчивается…

python sound-recognition

02 фев '19 в 17:30

2 ответа

Программное обеспечение: Как программное обеспечение распознает песню?

Я играл с моим телефоном, и на нем есть это приложение, которое, когда вы используете его для записи 10 секунд песни, говорит вам название и автора этой песни. Теперь, как инженер-программист, я не могу не задаться вопросом, как это работает?

audio sound-recognition

30 сен '10 в 13:40

1 ответ

Какой алгоритм используется для извлечения аудио функции в аудиосети Google?

Я начинаю с аудиосета Google. В то время как набор данных является обширным, я нахожу информацию относительно извлечения аудиофункций очень расплывчатой. Сайт упоминает 128-мерные аудио функции, извлеченные с частотой 1 Гц Аудио функции были извлече…

machine-learning audio sound-recognition

19 май '17 в 22:48

0 ответов

Как посчитать максимальную амплитуду звука в андроиде?

Я здесь в поисках функциональности подсчета максимальной амплитуды звука перфорации. Я использовал API распознавания речи Android в своем демонстрационном приложении, но он считает, что все звуки (шум) и счетчик работают как пуля со скоростью. Я хоч…

android audio pitch-tracking sound-recognition

28 окт '13 в 06:12

2 ответа

Как сравнить образцы.wav в delphi?

Я хотел бы начать изучать .wav образец, сравнивая два файла. как возвращение результата длительности, ударения, произношения в процентах. и т. д. или любой код, который сравнивает / анализирует .wav,

delphi audio wav pcm sound-recognition

13 авг '10 в 05:54

1 ответ

Как мне получить значения определенного частотного диапазона

У меня есть файл.wav, я загружаю его и получаю следующую спектрограмму, показывающую спектр в дБ Теперь я хотел бы знать эти значения именно потому, что хочу сравнить с другим файлом WAV, чтобы узнать, есть ли эти 4 значения. Источник для создания э…

python matplotlib frequency spectrogram sound-recognition

02 апр '14 в 14:08

1 ответ

Библиотека распознавания и категоризации звука на C или Python

... Здравствуйте все! Я студент, пытающийся сделать устройство "Сделай сам" относительно распознавания звука. Не слишком точный и сложный, как распознавание речи, я просто хочу принять и использовать некоторую простую библиотеку распознавания для св…

python machine-learning audio libraries sound-recognition

04 апр '16 в 06:57

2 ответа

Распознавание звука с iOS 7?

Я хочу создать приложение, которое реагирует на звук, который вы издаете, когда выдуваете свечи на день рождения. Это не распознавание речи как таковое (этот звук не является словом на английском языке), и очень любезный Халле из OpenEars сказал мне…

ios audio sound-recognition

17 окт '13 в 20:29

1 ответ

Методы, чтобы сделать обнаружение выбросов в распознавании звука?

Существуют модели для распознавания звуков двух классов: класса А и класса В. Как распознать звуки класса C как ненормальные звуки? Я пытался установить порог при распознавании по кадрам. above 70% -> class A or B else -> abnormal Например, Ес…

machine-learning speech-recognition pattern-recognition sound-recognition

08 янв '16 в 02:42