Описание тега keyword-spotting
1
ответ
Определение ключевых слов iOS с помощью OpenEars + Rejecto
В поисках API для подбора ключевых слов я обнаружил, что наиболее перспективным является плагин OpenEars + Rejecto. Мне нужно распознать довольно простой словарь, такой как Вверх, Вниз, Влево, Вправо. Следуйте инструкциям по запуску примера проекта …
29 сен '13 в 13:45
1
ответ
Лучший подход для сравнения распознанной речи с известным текстом
Учитывая известную рукопись (текст), которую, я ожидаю, пользователь прочитает (более или менее точно), каков наилучший подход для распознавания прогресса пользователя в рукописи? Пока я ищу конкретное решение для iOS, меня также интересует более об…
26 дек '18 в 17:32
1
ответ
PocketSphinx собственный поиск ключевых слов в Android
Я хочу реализовать поиск ключевых слов на основе PocketSphinx для приложения для Android. PocketSphinx является новым для меня. Я начал с PocketphinxAndroidDemo из их репозитория. Затем я импортировал проект в Eclipse, собрал и развернул демонстраци…
21 ноя '13 в 12:04
0
ответов
Как нарисовать ROC-кривую для мультиклассовой модели?
В настоящее время я изучаю поиск ключевых слов. Бумага, которую я недавно прочитал, - это МАЛЕНЬКИЙ КЛЮЧЕВЫЙ КЛАВИШ, использующий глубокие нейронные сети. Они используют кривую ROC для оценки своих моделей. Вот некоторые цифры в газете. У меня есть …
12 апр '18 в 05:42
1
ответ
PocketSphinx для Android конфликтует с распознаванием речи Google
Я реализовал инструмент определения ключевых слов pocketsphinx в своем приложении и запустил его в виде липкой службы. Ключевое слово spot отлично работает! Проблема в том, что я больше не могу использовать что-либо, связанное с речью Google во врем…
08 авг '14 в 13:30
0
ответов
iOS - есть ли способ определения популярных ключевых слов по текстовому вводу пользователя и сортировки по популярности или тенденциям?
Я создаю приложение, которое позволит пользователям вводить в поле UITextInput. Я хочу иметь возможность сканировать то, что они печатают, и извлекать возможные ключевые слова / фразы, которые можно использовать для заполнения других вещей в приложе…
02 мар '18 в 22:01
1
ответ
Определение ключевых слов с помощью HTK
Недавно я сосредоточился на проекте по внедрению системы определения ключевых слов. Я использовал HTK для распознавания речи ранее. Теперь я хочу знать, возможно ли реализовать мой механизм поиска ключевых слов с помощью HTK?
16 апр '16 в 08:30
1
ответ
Найти имена в строке с помощью регулярных выражений, не включая имена, если присутствует второе имя
У меня есть строка и список имен, которые я сравниваю строку с использованием preg_match_all который возвращает совпадения. Однако в списке имен некоторые имена имеют имя ИЛИ только фамилию, а другие - оба. Смотрите мой пример ниже. $names = 'jon|jo…
21 июл '16 в 04:16
0
ответов
Какая связь между Top-k и средней средней точностью?
Кто -нибудь может мне помочь, пожалуйста? В одной статье я нашел такой текст: "Сходство между картами сетевых характеристик было рассчитано с использованием евклидова расстояния. После этого были выбраны кандидаты Top-k для создания ранжированного с…
16 фев '20 в 19:29
0
ответов
определение слов для отметки времени в аудиофайле на Python
У меня есть аудиофайл, содержащий некоторую (синтетическую (сгенерированную google TTS)) речь, а также другой звук. Я ищу способ найти метку времени каждый раз, когда встречается речевая часть звука. Речь всегда начинается с одного и того же слова, …
09 мар '20 в 18:12
0
ответов
Как выполнить распознавание речи по настраиваемым ключевым словам?
Я хотел бы реализовать функцию мобильного приложения, которая позволяет пользователю " регистрировать " до двадцати " произвольных ключевых слов ", а затем, принимая поток аудиозахвата устройства, иметь возможность распознавать любые такие ключевые …
25 июн '20 в 22:28
0
ответов
Аудио-состязательные атаки для повышения производительности модели
Я изучал следующие статьи. https://arxiv.org/pdf/1801.00554.pdf http://jin.ece.ufl.edu/papers/ASPDAC2020_DNN.pdf В этих статьях основное внимание уделяется состязательным звуковым атакам в системе обнаружения ключевых слов. Но мне до сих пор неясно,…
09 май '20 в 17:15
0
ответов
Какие функции лучше всего извлекать из аудио для распознавания речи, MFCC или наборов фильтров журнала?
В настоящее время я работаю над проектом определения ключевых слов в области аудио. Когда дело доходит до извлечения признаков, существует множество подходов, среди которых наиболее популярны MFCC и наборы фильтров журналов. Но какой из них лучше? А…
15 май '20 в 15:16
0
ответов
Запрос на обнаружение слов по строке / пример с использованием CNN
Я работаю над проектом, в котором мне нужно выполнить определение слов. Я пытаюсь понять следующий метод:https://arxiv.org/pdf/1604.00187.pdf Этот метод, использующий пирамидальную гистограмму символов (PHOC) в качестве меток, CNN может обеспечить м…
08 сен '20 в 19:38
0
ответов
Предложение модели: определение ключевых слов
Я хочу спрогнозировать появление слова «повтор» в речи, а также приблизительную продолжительность этого слова. Для этой задачи я планирую построить модель глубокого обучения. У меня около 50 положительных и 50 отрицательных высказываний (больше я со…
29 июн '21 в 15:31
0
ответов
Stm32CubeIde-SensorTIleBox-Определение ключевых слов на микроконтроллере
Я делаю определение ключевых слов в коробке Sensortile. Я сделал модель Tflite и преобразовал в код C. Я хочу использовать светодиод, когда он распознает голос, но я не знаю, где написать код для светодиода. Кто-нибудь1 может мне помочь, где казнь п…
12 окт '21 в 15:21
0
ответов
Набор аудиоданных logmel спектрограмма-1 сек?
Могу ли я использовать приведенный ниже код для набора аудиоданных 1 с, который мне нужно использовать для определения ключевых слов в микроконтроллере. Этот код используется для набора аудиоданных 30 секунд для классификации акустической сцены. Тот…
14 окт '21 в 11:27
0
ответов
Как создать высококачественное решение для пробуждения слов для приложения Android/ios. Какие технологические стеки попробовать?
Я пытаюсь использовать: Облегченный тензорный поток - не может достичь желаемой точности, а требования к размеру обучающей выборки кажутся очень высокими.Q1) Каков минимальный размер выборки? Kaldi - размер отправки должен быть около 30 МБ, непомерн…
23 май '22 в 19:56
1
ответ
Преобразование .lite в . формат tflite
В настоящее время я оцениваю платформу Edge Impulse и сгенерированную модель .lite. Может ли кто-нибудь помочь мне, как преобразовать модель .lite в. тфлайт?
31 май '22 в 18:56
0
ответов
разница в скорости между реализациями тензорного потока спектрограммы mfcc
Я пытаюсь предварительно обработать аудиоклипы для задачи определения ключевых слов, в которой используются модели машинного обучения. Первым шагом является вычисление спектрограммы, начиная с формы волны, и для этого я обнаружил, что в структуре те…
20 янв '23 в 13:57