Набор инструментов для распознавания речи Kaldi
0 ответов

Kaldi на Android - не удалось разрешить зависимость для ':app@debug/compileClasspath': не удалось разрешить проект:speechutils:app.?

Попытка использовать технологию speechRecognition, получила рекомендацию для Kaldi, но не смогла найти проект Android Studio исключительно по этому вопросу. Надеюсь, что кто-то может порекомендовать проект студии Android на этом. Используя это, и у …
28 май '18 в 22:54
1 ответ

BrokenPipeError во время выполнения примера TIMIT на Kaldi

Я пытаюсь установить и запустить пример Kaldi TIMIT. т.е. ./run.sh в kaldi/egs/timit/s5 каталог: Я получаю ошибку: fstcompile: error while loading shared libraries: libfstscript.so.10: cannot open shared object file: No such file or directory fstarc…
4 ответа

Kaldi Toolkit Ошибка установки на Ubuntu 16.04

Привет я пытаюсь установить Kaldi инструментарий для распознавания речи на Ubuntu 16.04. Я следовал инструкциям в файле INSTALL. (1) перейдите к инструментам / и следуйте инструкциям там. Следуя процедуре в файле INSTALL в инструментах, вы получите …
08 мар '17 в 21:25
1 ответ

Утверждается в Kaldi при использовании с GStreamer

Используя плагин GStreamer от Alumae и следующий конвейер: appsrc source='appsrc' ! wavparse ! audioconvert ! audioresample ! queue ! kaldinnet2onlinedecoder <parameters snipped> ! filesink location=/tmp/test Я всегда получаю следующее утвержд…
24 ноя '17 в 10:28
1 ответ

sclite (SCTK) `make check` faliure, C++/perl/Cygwin, безопасно использовать Perl4?

В настоящее время я пытаюсь установить NIST sclite, который является частью SCTK 2.4.0 ( github или более новая версия). Я пытаюсь установить на Cygwin в bash, Установка выполняется с использованием make, Я прошел мимо make configure а также make al…
10 май '18 в 23:58
1 ответ

Делается ли распознавание фонемы по разным размерам аудиофайлов?

В настоящее время я работаю над распознаванием фонем cnn. Мой набор данных помечен, но я немного не уверен, как я могу гарантировать, что длина векторного элемента также будет соответствовать длине аудиофайла. В настоящее время мой вклад в CNN предс…
2 ответа

Сверка ссылок и путей к рецептам Калди

Я использую набор инструментов Kaldi для распознавания речи с компьютера, на котором у меня нет прав изменять содержимое установки в /var/kaldi, Каталог содержит папку скриптов, которые предоставляются в качестве примера использования, скрипты также…
23 янв '19 в 07:30
0 ответов

Могу ли я реализовать EdgespeechNets (Google), используя pytorch-kaldi?

Я хотел бы реализовать EdgespeechNets, мне интересно, является ли kaldi-pytorch хорошим инструментарием для этого?
02 мар '19 в 10:45
0 ответов

Путь к файлу в сценарии оболочки PATH.sh, но команда не найдена

Я новичок в Linux, я хочу использовать kaldi, и я следую инструкциям, когда я запускаю run.sh, он выдает ошибки: "fstaddselfloops: command not found" Я поместил содержащий путь к папке в PATH.sh, таким образом: export KALDI_ROOT=`pwd`/../.. # Settin…
02 мар '19 в 14:48
1 ответ

Функция Калди имеет только заголовочный файл в C++

Я пытался найти определение функции cblas_Xaxpy в Kaldi, поэтому я был направлен GOTO Definition на последнее место cblas-wrappers.hгде я нашел inline void cblas_Xaxpy(const int N, const float alpha, const float *X, const int incX, float *Y, const i…
21 ноя '18 в 05:13
0 ответов

Ошибка при установке Toolchain для Kaldi

Я хочу запустить эту строку в моей командной строке (Windows 10): <NDK root dir>/build/tools/make_standalone_toolchain.py --arch arm --api 21 --stl=libc++ --install-dir /tmp/my-android-toolchain Я знаю корневой каталог, но файл 'make_standalon…
07 май '18 в 02:02
0 ответов

cudaError_t 1: "вызов функции __global__ не настроен", возвращаемый из "cublasCreate(&handle_)"

Я запускаю эксперимент ASR, используя Kaldi на кластере SGE, состоящем из двух рабочих станций с TITAN XP. И случайно я встречаю следующую проблему: ОШИБКА (nnet3-train[5.2.62~4-a2342]:FinalizeActiveGpu():cu-device.cc:217) cudaError_t 1: "вызов функ…
21 дек '17 в 08:42
0 ответов

При компиляции Srilm (tclmain.cc:8:17: фатальная ошибка: tcl.h: компиляция такого файла или каталога не прекращена)

Я использовал и tcl был успешно установлен: sudo apt-get install tcl-dev tk-dev но есть такая же проблема.
12 сен '17 в 07:55
0 ответов

Могу ли я использовать свою собственную языковую модель в существующем HCLG?

Я использую Kaldi ASR. Я скачиваю модель на официальном сайте. Я распаковал модель и получаю только final.mdl HCLG.fst и word.txt. Теперь я хочу заменить оригинальное использование моей пользовательской языковой модели. Что мне делать? Спасибо!
29 ноя '18 в 07:24
1 ответ

Какому инструменту я могу доверять?

Кажется, у меня проблемы с определением, какому инструменту я могу доверять... Инструменты, которые я тестировал, - это Librosa и Kaldi для создания набора данных для визуализации графиков 40 энергий набора фильтров аудиофайла. Энергии набора фильтр…
18 май '17 в 08:18
0 ответов

Нет такого элемента или плагина 'kaldinnet2onlinedecoder'

Сначала я запустил докер в соответствии с https://github.com/jcsilva/docker-kaldi-gstreamer-server Во-вторых, я скомпилировал https://github.com/alumae/gst-kaldi-nnet2-online успешно вне докера, а затем получил правильный результат, используя gst-in…
24 окт '18 в 05:37
2 ответа

Как использовать обучение "tri2a" и "tri2b_mmi" в kaldi для учебника для чайников?

Я сделал учебник Kaldi для чайников со своими собственными аудиоданными. В этом уроке они использовали моно-выравнивание и метод обучения tri1. Могу ли я изменить его на обучение tri2a/tri2b_mmi?
26 апр '18 в 10:11
1 ответ

Какие документы связаны с TDNN и LSTM Калди?

Каковы наиболее связанные документы для следующего сценария в Kaldi. egs/wsj/s5/local/nnet3/run_tdnn_lstm.sh
11 окт '18 в 04:22
0 ответов

Соотнесите фрагмент текста с соответствующим аудиопотоком (называемый маркерами)

Есть ли какие-либо инструменты, такие как ввод текста в виде аудиопотока?
06 сен '18 в 10:47
1 ответ

Почему сюжет в либросе отличается?

В настоящее время я пытаюсь использовать librosa для выполнения stfft, так что этот параметр напоминает процесс stfft из другой среды (Kaldi). Аудио файл - fash-b-an251 Kaldi делает это, используя частоту дискретизации 16 кГц, window_size = 400 (25 …
13 янв '17 в 16:44