Описание тега keyword-spotting

1 ответ

Определение ключевых слов iOS с помощью OpenEars + Rejecto

В поисках API для подбора ключевых слов я обнаружил, что наиболее перспективным является плагин OpenEars + Rejecto. Мне нужно распознать довольно простой словарь, такой как Вверх, Вниз, Влево, Вправо. Следуйте инструкциям по запуску примера проекта …
29 сен '13 в 13:45
1 ответ

Лучший подход для сравнения распознанной речи с известным текстом

Учитывая известную рукопись (текст), которую, я ожидаю, пользователь прочитает (более или менее точно), каков наилучший подход для распознавания прогресса пользователя в рукописи? Пока я ищу конкретное решение для iOS, меня также интересует более об…
1 ответ

PocketSphinx собственный поиск ключевых слов в Android

Я хочу реализовать поиск ключевых слов на основе PocketSphinx для приложения для Android. PocketSphinx является новым для меня. Я начал с PocketphinxAndroidDemo из их репозитория. Затем я импортировал проект в Eclipse, собрал и развернул демонстраци…
0 ответов

Как нарисовать ROC-кривую для мультиклассовой модели?

В настоящее время я изучаю поиск ключевых слов. Бумага, которую я недавно прочитал, - это МАЛЕНЬКИЙ КЛЮЧЕВЫЙ КЛАВИШ, использующий глубокие нейронные сети. Они используют кривую ROC для оценки своих моделей. Вот некоторые цифры в газете. У меня есть …
1 ответ

PocketSphinx для Android конфликтует с распознаванием речи Google

Я реализовал инструмент определения ключевых слов pocketsphinx в своем приложении и запустил его в виде липкой службы. Ключевое слово spot отлично работает! Проблема в том, что я больше не могу использовать что-либо, связанное с речью Google во врем…
0 ответов

iOS - есть ли способ определения популярных ключевых слов по текстовому вводу пользователя и сортировки по популярности или тенденциям?

Я создаю приложение, которое позволит пользователям вводить в поле UITextInput. Я хочу иметь возможность сканировать то, что они печатают, и извлекать возможные ключевые слова / фразы, которые можно использовать для заполнения других вещей в приложе…
1 ответ

Определение ключевых слов с помощью HTK

Недавно я сосредоточился на проекте по внедрению системы определения ключевых слов. Я использовал HTK для распознавания речи ранее. Теперь я хочу знать, возможно ли реализовать мой механизм поиска ключевых слов с помощью HTK?
1 ответ

Найти имена в строке с помощью регулярных выражений, не включая имена, если присутствует второе имя

У меня есть строка и список имен, которые я сравниваю строку с использованием preg_match_all который возвращает совпадения. Однако в списке имен некоторые имена имеют имя ИЛИ только фамилию, а другие - оба. Смотрите мой пример ниже. $names = 'jon|jo…
21 июл '16 в 04:16
0 ответов

Какая связь между Top-k и средней средней точностью?

Кто -нибудь может мне помочь, пожалуйста? В одной статье я нашел такой текст: "Сходство между картами сетевых характеристик было рассчитано с использованием евклидова расстояния. После этого были выбраны кандидаты Top-k для создания ранжированного с…
0 ответов

определение слов для отметки времени в аудиофайле на Python

У меня есть аудиофайл, содержащий некоторую (синтетическую (сгенерированную google TTS)) речь, а также другой звук. Я ищу способ найти метку времени каждый раз, когда встречается речевая часть звука. Речь всегда начинается с одного и того же слова, …
09 мар '20 в 18:12
0 ответов

Как выполнить распознавание речи по настраиваемым ключевым словам?

Я хотел бы реализовать функцию мобильного приложения, которая позволяет пользователю " регистрировать " до двадцати " произвольных ключевых слов ", а затем, принимая поток аудиозахвата устройства, иметь возможность распознавать любые такие ключевые …
0 ответов

Аудио-состязательные атаки для повышения производительности модели

Я изучал следующие статьи. https://arxiv.org/pdf/1801.00554.pdf http://jin.ece.ufl.edu/papers/ASPDAC2020_DNN.pdf В этих статьях основное внимание уделяется состязательным звуковым атакам в системе обнаружения ключевых слов. Но мне до сих пор неясно,…
0 ответов

Какие функции лучше всего извлекать из аудио для распознавания речи, MFCC или наборов фильтров журнала?

В настоящее время я работаю над проектом определения ключевых слов в области аудио. Когда дело доходит до извлечения признаков, существует множество подходов, среди которых наиболее популярны MFCC и наборы фильтров журналов. Но какой из них лучше? А…
0 ответов

Запрос на обнаружение слов по строке / пример с использованием CNN

Я работаю над проектом, в котором мне нужно выполнить определение слов. Я пытаюсь понять следующий метод:https://arxiv.org/pdf/1604.00187.pdf Этот метод, использующий пирамидальную гистограмму символов (PHOC) в качестве меток, CNN может обеспечить м…
0 ответов

Предложение модели: определение ключевых слов

Я хочу спрогнозировать появление слова «повтор» в речи, а также приблизительную продолжительность этого слова. Для этой задачи я планирую построить модель глубокого обучения. У меня около 50 положительных и 50 отрицательных высказываний (больше я со…
0 ответов

Stm32CubeIde-SensorTIleBox-Определение ключевых слов на микроконтроллере

Я делаю определение ключевых слов в коробке Sensortile. Я сделал модель Tflite и преобразовал в код C. Я хочу использовать светодиод, когда он распознает голос, но я не знаю, где написать код для светодиода. Кто-нибудь1 может мне помочь, где казнь п…
12 окт '21 в 15:21
0 ответов

Набор аудиоданных logmel спектрограмма-1 сек?

Могу ли я использовать приведенный ниже код для набора аудиоданных 1 с, который мне нужно использовать для определения ключевых слов в микроконтроллере. Этот код используется для набора аудиоданных 30 секунд для классификации акустической сцены. Тот…
14 окт '21 в 11:27
0 ответов

Как создать высококачественное решение для пробуждения слов для приложения Android/ios. Какие технологические стеки попробовать?

Я пытаюсь использовать: Облегченный тензорный поток - не может достичь желаемой точности, а требования к размеру обучающей выборки кажутся очень высокими.Q1) Каков минимальный размер выборки? Kaldi - размер отправки должен быть около 30 МБ, непомерн…
1 ответ

Преобразование .lite в . формат tflite

В настоящее время я оцениваю платформу Edge Impulse и сгенерированную модель .lite. Может ли кто-нибудь помочь мне, как преобразовать модель .lite в. тфлайт?
0 ответов

разница в скорости между реализациями тензорного потока спектрограммы mfcc

Я пытаюсь предварительно обработать аудиоклипы для задачи определения ключевых слов, в которой используются модели машинного обучения. Первым шагом является вычисление спектрограммы, начиная с формы волны, и для этого я обнаружил, что в структуре те…