Описание тега cmusphinx

Набор инструментов с открытым исходным кодом для распознавания речи. Включает распознаватели речи Sphinx 2-4, PocketSphinx и набор инструментов в дополнение к распознавателям.
3 ответа

Ошибка в программе java sphinx

Привет я делаю программное обеспечение в Java, в котором я хочу разработать речевое программное обеспечение... Я запускаю "Hello" код сфинкса в Java. import edu.cmu.sphinx.frontend.util.Microphone; import edu.cmu.sphinx.recognizer.Recognizer; import…
1 ответ

Где я могу найти информацию о платформе cmusphinx?

Где я могу найти информацию или исходный код фреймворка Android sphinx? Мне нужно сделать отчет о технологии распознавания речи, особенно о sphinx framework, о том, как она работает, об ее оптимизации и т. Д.
02 мар '15 в 12:20
1 ответ

Pocketsphinx не может декодировать файл MFC, в то время как Pocketsphinx_continuous декодирует соответствующий WAV

Я работаю с CMUsphinx для перевода турецкого языка в текст в течение пары месяцев. Мне удалось запустить поезд на 100 часов звука. Моей целью было использовать получившуюся акустическую модель с декодером Sphinx3. Однако Sphinx3 декодер не может дек…
05 апр '17 в 11:14
1 ответ

Как получить несколько результатов речи в sphinx 4 с помощью API SpeechResult?

result.getHypothesis() не всегда дает мне лучший результат, поэтому я хочу получить несколько результатов после распознавания. Я попробовал код ниже, он возвращает мне пустой массив. Распознаватель является объектом LiveSpeechRecognizer. SpeechResul…
1 ответ

Как создать файл ".gram" для приложения распознавания голоса с помощью CMUSphinx?

Я делаю проект для поиска слова в текстовом файле с помощью голоса. Поэтому мне нужно написать файл грамматики для нескольких слов (мин. 10). Может кто-нибудь сказать мне, как написать это.
16 янв '15 в 09:14
1 ответ

gi._glib.GError: нет ошибки "pocketsphinx" элемента при запуске livedemo

Я использую Ubuntu 14.04 Я пытаюсь получить программу на Python для передачи речи в текст с микрофона. Для этого я установил sphinxbase и pocketsphinx. pocketsphinx_continuous работает. thekindlyone@deepthought:.../lib$ pocketsphinx_continuous -inmi…
24 дек '15 в 09:28
1 ответ

PocketSphinx Native Crash

На некоторых устройствах (ни на одном из реальных тестовых устройств), когда я запускаю распознавание PocketSphinx, я получаю силу закрытия. Я пытаюсь получить файл журнала с одного из устройств, но это сложно, потому что ни одно из устройств, с кот…
25 фев '14 в 21:26
1 ответ

Какой самый безопасный / лучший способ остановить поток и запустить некоторый код очистки

В рамках моих усилий по реализации программы распознавания голоса в Java, я реализовал реальный код распознавания голоса в отдельном потоке. Основной поток обрабатывает интерфейс GUI и получает постоянные обновления от потока распознавания голоса, к…
23 июл '14 в 07:58
0 ответов

Распознавание нескольких ключевых фраз в CMUSphinx для Android

Я могу распознать одну ключевую фразу, добавив ее в код. Однако я не могу добавить несколько ключевых фраз. В некоторых постах упоминается добавление ключевых фраз в файл. Я не могу найти пример кода, где используются несколько ключевых фраз. Может …
23 янв '18 в 03:42
1 ответ

CMUSphinx никогда не распознает слова из аудиофайлов

Sphinx, похоже, не распознает и не обрабатывает аудиофайлы, он принимает, что аудиопоток выплевывает пустой массив (результат SpeechResult). Я чувствую, что нет никаких проблем с аудио файлом, который я использую, потому что я пробовал несколько, и …
25 апр '15 в 14:40
1 ответ

CMU Sphinx 4-5prealpha: "ВНИМАНИЕ: в грамматике отсутствует самоидентифицирующий заголовок"

Я пытаюсь привыкнуть к CMU sphinx 4-5prealpha. Все отлично работает с распознаванием без грамматики, но мне нужно обрабатывать не очень много команд / слов / фраз. Итак, вот код и стек ошибок: public static void main(String[] args) throws Exception …
22 сен '16 в 15:08
1 ответ

Сфинкс 4 Индекс времени транскрипции

Как получить индекс времени (или номер кадра) в Sphinx 4, когда я настраиваю его для записи аудиофайла? Код, который я использую, выглядит следующим образом: audioURL = ... AudioFileDataSource dataSource = (AudioFileDataSource) cm.lookup("audioFileD…
27 сен '13 в 01:32
1 ответ

Задержка распознавания речи сфинкса

Я использую открытый исходный код sphinx sdk для распознавания голоса. В настоящее время я использую пример HelloWorld. Однако ответ очень вялый, требуется несколько попыток распознать слово, а иногда он распознает его, но требуется немного, чтобы в…
08 июл '11 в 22:02
2 ответа

Какой большой файл hello.gram в sphinx java

Я новичок в sphinx java и начал с небольшого проекта деталей сотрудника. Загрузите программу HelloWorld и измените ее. как получить идентификатор сотрудника (например: T5438,Y7651,U9085) и отдел (Авто, Поддержка, Мобильный) динамически. Как объявить…
19 ноя '15 в 04:43
1 ответ

Поиск ключевых слов не очень хорошо работает с узкополосным речевым сигналом. Как это решить?

Вот что у меня есть: Акустическая модель (CMU Sphinx) для использования в поиске ключевых слов. Тренируется для речи с частотой дискретизации 16 кГц и хорошо работает. Неэффективно, когда представлен речевым сигналом, дискретизированным с частотой 8…
1 ответ

CMU Sphinx: как добавить ключевые слова в дополнение к существующей лексике?

CMU Sphinx поставляется с большим словарным запасом английских слов. это хорошо, однако я хочу подчеркнуть некоторые слова, которые я буду использовать в качестве команд. некоторые из этих слов не являются английскими словами. Как я могу убедиться, …
0 ответов

Pocketsphinx продолжает давать тот же результат

Я проверяю pocketsphinx и получаю следующий вывод: INFO: cmd_ln.c(691): Parsing command line: \ -hmm ../Pocketsphinx_Files/hub4wsj_sc_8k \ -lm ../Pocketsphinx_Files/hub4.5000.DMP \ -dict ../Pocketsphinx_Files/cmu07a.dic Current configuration: [NAME]…
1 ответ

mllr_solve 'Ошибка чтения магического числа порядка байтов' в Windows

Я следую учебному пособию по адаптации акустической модели по умолчанию и обнаружил ошибку при запуске mllr_solve. INFO: main.c(382): -- 1. Read input mean, (var) and accumulation. ERROR: "pio.c", line 434: fread() failed; retrying... : No error ERR…
21 июл '18 в 20:35
2 ответа

Клиент-серверная реализация для распознавания речи с sphinx4

Я пытаюсь распознать речь, полученную микрофоном с устройства Android (на стороне клиента). После этого я отправляю DatagramPacket с речью на сервер, который осуществляет распознавание речи с использованием Sphinx 4. Но на стороне сервера я не получ…
15 ноя '14 в 21:26
1 ответ

AndroidPocketSphinx: путь сборки содержит повторяющуюся запись: 'src' для проекта

Я пытаюсь создать проект (в ADT затмения) из существующего проекта, уже распакованного на рабочем месте. Я в основном следую инструкциям в: http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/ Но как только он импортировал прое…
02 сен '13 в 16:39