Описание тега mozilla-deepspeech

Описание тега Вопросы с тегом

Mozilla DeepSpeech - это реализация TensorFlow архитектуры Baidu DeepSpeech.

0 ответов

Почему добавление аргумента `--display_step 2` значительно замедляет время обучения Mozilla DeepSpeech?

Я тренирую Mozilla DeepSpeech по набору данных Common Voice в Ubuntu 16.04 LTS x64 с 4 Nvidia GeForce GTX 1080, выполняя команду: ./DeepSpeech.py --train_files data/common-voice-v1/cv-valid-train.csv \ --dev_files data/common-voice-v1/cv-valid-dev.c…

speech-recognition mozilla-deepspeech

03 июл '18 в 23:18

2 ответа

Я установил deepspeech в Ubuntu 16.04, используя "pip install deepspeech --user", но когда я использую deepspeech на cli, он говорит, что команда не найдена

Я попытался установить pip и pip3 для установки, также попытался после перезапуска, но он все еще говорит, что команда не найдена, когда я набираю deepspeech -h на терминале.

06 июн '18 в 04:39

0 ответов

DeepSpeech: выделяют докладчиков

Я пытаюсь использовать DeepSpeech для колл-центра, чтобы продиктовать и подвести итоги разговора. В этом сценарии всегда есть несколько ораторов, обычно два. Есть ли способ отличить ораторов, когда DeepSpeech распознает разговор? Спасибо за совет. Д…

mozilla-deepspeech

30 июл '18 в 05:36

1 ответ

Базель билд не уважает мои мерзавцы

Я бегу bazel build в проекте, который состоит из подмодулей git со следующей структурой: /work/ ├── tensorflow/ [git submodule] └── train/ └── DeepSpeech/ [git submodule] └── native_client/ Команда build выглядит так: bazel build \ --config=monolith…

git bazel mozilla-deepspeech

21 ноя '18 в 21:54

2 ответа

Почему результаты этой Python-программы DeepSpeech отличаются от результатов, которые я получаю из интерфейса командной строки?

Я изучаю движок Mozilla DeepSpeech Speech-To-Text. У меня не было проблем с работой интерфейса командной строки, но интерфейс Python, похоже, ведет себя по-другому. Когда я бегу: deepspeech --model models/output_graph.pb --alphabet models/alphabet.t…

python python-3.x mozilla-deepspeech

14 дек '18 в 21:09

1 ответ

Принудительное выравнивание с использованием Aeneas с несколькими текстовыми файлами Aeneas

Мы начали проект по созданию набора данных распознавания турецкой речи для использования с DeepSpeech. Мы закончили задачу предварительной обработки Ebook. Но мы не смогли закончить процесс принудительного выравнивания с Энеем. Согласно его учебника…

dataset speech-recognition mozilla-deepspeech

22 янв '19 в 14:11

0 ответов

Обучение программному обеспечению для распознавания речи в автономном режиме с половинными записями интервью

Я немного искал программное обеспечение для распознавания речи, которое работало бы в автономном режиме и позволяло бы мне обучать его с помощью полуфабрикатов. Кажется, что глубокая речь Мозиллы могла бы сделать эту работу. Проблема интервью, котор…

python speech-recognition mozilla-deepspeech

27 ноя '18 в 14:13

1 ответ

Увеличение --train_batch_size 2 до --train_batch_size 3 заставляет Mozilla DeepSpeech больше не тренироваться. Зачем?

Увеличение --train_batch_size 2 в --train_batch_size 3 заставляет Mozilla DeepSpeech больше не тренироваться. Чем это можно объяснить? В частности, если я бегу ./DeepSpeech.py --train_files data/common-voice-v1/cv-valid-train.csv --dev_files \ data/…

speech-recognition mozilla-deepspeech

01 июл '18 в 18:58

1 ответ

Как установить глубокую речь Baidu в Windows от Mozilla?

Я нахожусь на Windows 10, и когда я пытаюсь установить реализацию Baidu Deep в Mozilla, как показано здесь. С помощью: pip install deepspeech Я получаю эту ошибку: " Не удалось найти версию, которая удовлетворяет требованию deepspeech (из версий:) Н…

python windows speech-recognition mozilla-deepspeech baidu

26 ноя '17 в 23:45

0 ответов

Невозможно установить Swig и Swig декодеры в Redhat 7 или Ubuntu

Я установил пакет декодера swig и swig одним из следующих способов: Swig: ням установить Swig Swig Decoders: Клон https://github.com/PaddlePaddle/DeepSpeech/ Перейдите в декодеры / swig / и запустите./setup.sh Проблема: когда я импортирую библиотеку…

python redhat swig mozilla-deepspeech paddle-paddle

16 апр '18 в 13:15

0 ответов

Как я могу напечатать или вернуть тензоры активации из модуля BasicLSTMCell?

Базовое ядро Tensorflow BasicLSTMCell определено здесь. Я хочу напечатать стек некоторых тензоров активации, пока это ядро развернуто и вызывается итеративно. Я попробовал два варианта, чтобы добиться этого. Сначала я попытался вернуть эти тензо…

python tensorflow lstm rnn mozilla-deepspeech

24 окт '18 в 11:39

1 ответ

Почему Mozilla Deepspeech использует Tensorflow 0.11, когда у меня установлено 0.12?

Я использую Anaconda3 с python 3.6 и использую pips install tenorsflow deepspeech. Когда я запускаю следующую команду, я получаю ошибки: deepspeech - модели моделей /output_graph.pb - модели алфавита / alphabet.txt --audio voice.wav Loading model fr…

tensorflow mozilla-deepspeech

26 дек '18 в 23:21

2 ответа

Как внедрить Mozilla DeepSpeech в PHP веб-приложение для преобразования речи в текст?

У меня есть веб-приложение на PHP, и я ищу реализацию высокоточного распознавания речи с открытым исходным кодом, которая будет принимать голосовые команды для открытия веб-страниц от пользователей. Примеры: "Сделать продажи" (откроется страница "Со…

php speech-recognition speech-to-text webspeech-api mozilla-deepspeech

29 май '18 в 10:56

1 ответ

Что означает "Тест эпохи [число]" в Mozilla DeepSpeech?

Что означает "Тест эпохи [число]" в Mozilla DeepSpeech? В следующем примере это говорит Test of Epoch 77263хотя из моего понимания должна быть только 1 эпоха, так как я дал --display_step 1 --limit_train 1 --limit_dev 1 --limit_test 1 --early_stop F…

speech-recognition mozilla-deepspeech

30 июн '18 в 19:28

0 ответов

Сколько эпох обычно требуется для приличной тренировки глубокой речи Мозиллы?

Я хотел бы знать, сколько эпох вы обычно проводите для обучения глубокой речи mozilla с ее архитектурой по умолчанию. (без изменений по сравнению с версией GitHub). Какое будет количество приличных эпох, особенно если учесть, что для каждой эпохи в …

mozilla-deepspeech

19 дек '18 в 05:15

2 ответа

Deepspeech - выводит больше аудиофайлов и сохраняет результат

Я закончил обучение общим голосовым данным для глубокой речи от Mozilla, и теперь я могу получить вывод для одного аудио .wav файл. Ниже приведена команда, которую я использую. (deepspeech-venv) megha@megha-medion:~/Alu_Meg/DeepSpeech_Alug_Meg/DeepS…

python command-line output mozilla-deepspeech

29 июн '18 в 13:16

0 ответов

Длина звукового файла

Обязательна ли длина аудиофайла для обучения и вывода, равная 5 секундам? У меня есть эти вопросы, потому что у меня есть большое количество тренировочных данных со звуком (каждый звук более 30 секунд) и соответствующими стенограммами. Если я не мог…

wav transcription mozilla-deepspeech

02 авг '18 в 10:25

0 ответов

Выполнить вывод для deep_speech2 в тензорном потоке

Я нашел тензорную реализацию deepspeech2 в модели DeepSpeech2 и следовал всем инструкциям, и, наконец, я смог обучить и оценить модель. Теперь у меня есть предварительно подготовленные контрольные точки для этого. У меня вопрос, как выполнить вывод,…

tensorflow mozilla-deepspeech

26 окт '18 в 17:06

0 ответов

Пип не может найти deepspeech / deepspeech-gpu из версий для Windows

Я пытаюсь установить Deepspeech из Pypi на Windows, я продолжаю сталкиваться с проблемой "Не удалось найти требуемый пакет из версий", хотя мой pip обновлен ( 19.0.1). Я уже попробовал некоторые решения, приведенные здесь: https://discourse.mozilla.…

python-3.x conda speech-to-text mozilla-deepspeech

05 апр '19 в 17:31

0 ответов

mizalla/DeepSpeech: Ошибка прогноза модели вычислительной акустики: OOM

Я использую DeepSpeech для обучения китайской модели. С предварительной обработкой и обучением все в порядке. И затем он собирается вывести модель.pb. Но при вычислении предсказаний модели акустики процесс python3 убивается из-за OOM. Параметры собл…

mozilla-deepspeech

16 апр '19 в 00:25