Описание тега mozilla-deepspeech
Mozilla DeepSpeech - это реализация TensorFlow архитектуры Baidu DeepSpeech.
0
ответов
Почему добавление аргумента `--display_step 2` значительно замедляет время обучения Mozilla DeepSpeech?
Я тренирую Mozilla DeepSpeech по набору данных Common Voice в Ubuntu 16.04 LTS x64 с 4 Nvidia GeForce GTX 1080, выполняя команду: ./DeepSpeech.py --train_files data/common-voice-v1/cv-valid-train.csv \ --dev_files data/common-voice-v1/cv-valid-dev.c…
03 июл '18 в 23:18
2
ответа
Я установил deepspeech в Ubuntu 16.04, используя "pip install deepspeech --user", но когда я использую deepspeech на cli, он говорит, что команда не найдена
Я попытался установить pip и pip3 для установки, также попытался после перезапуска, но он все еще говорит, что команда не найдена, когда я набираю deepspeech -h на терминале.
06 июн '18 в 04:39
0
ответов
DeepSpeech: выделяют докладчиков
Я пытаюсь использовать DeepSpeech для колл-центра, чтобы продиктовать и подвести итоги разговора. В этом сценарии всегда есть несколько ораторов, обычно два. Есть ли способ отличить ораторов, когда DeepSpeech распознает разговор? Спасибо за совет. Д…
30 июл '18 в 05:36
1
ответ
Базель билд не уважает мои мерзавцы
Я бегу bazel build в проекте, который состоит из подмодулей git со следующей структурой: /work/ ├── tensorflow/ [git submodule] └── train/ └── DeepSpeech/ [git submodule] └── native_client/ Команда build выглядит так: bazel build \ --config=monolith…
21 ноя '18 в 21:54
2
ответа
Почему результаты этой Python-программы DeepSpeech отличаются от результатов, которые я получаю из интерфейса командной строки?
Я изучаю движок Mozilla DeepSpeech Speech-To-Text. У меня не было проблем с работой интерфейса командной строки, но интерфейс Python, похоже, ведет себя по-другому. Когда я бегу: deepspeech --model models/output_graph.pb --alphabet models/alphabet.t…
14 дек '18 в 21:09
1
ответ
Принудительное выравнивание с использованием Aeneas с несколькими текстовыми файлами Aeneas
Мы начали проект по созданию набора данных распознавания турецкой речи для использования с DeepSpeech. Мы закончили задачу предварительной обработки Ebook. Но мы не смогли закончить процесс принудительного выравнивания с Энеем. Согласно его учебника…
22 янв '19 в 14:11
0
ответов
Обучение программному обеспечению для распознавания речи в автономном режиме с половинными записями интервью
Я немного искал программное обеспечение для распознавания речи, которое работало бы в автономном режиме и позволяло бы мне обучать его с помощью полуфабрикатов. Кажется, что глубокая речь Мозиллы могла бы сделать эту работу. Проблема интервью, котор…
27 ноя '18 в 14:13
1
ответ
Увеличение --train_batch_size 2 до --train_batch_size 3 заставляет Mozilla DeepSpeech больше не тренироваться. Зачем?
Увеличение --train_batch_size 2 в --train_batch_size 3 заставляет Mozilla DeepSpeech больше не тренироваться. Чем это можно объяснить? В частности, если я бегу ./DeepSpeech.py --train_files data/common-voice-v1/cv-valid-train.csv --dev_files \ data/…
01 июл '18 в 18:58
1
ответ
Как установить глубокую речь Baidu в Windows от Mozilla?
Я нахожусь на Windows 10, и когда я пытаюсь установить реализацию Baidu Deep в Mozilla, как показано здесь. С помощью: pip install deepspeech Я получаю эту ошибку: " Не удалось найти версию, которая удовлетворяет требованию deepspeech (из версий:) Н…
26 ноя '17 в 23:45
0
ответов
Невозможно установить Swig и Swig декодеры в Redhat 7 или Ubuntu
Я установил пакет декодера swig и swig одним из следующих способов: Swig: ням установить Swig Swig Decoders: Клон https://github.com/PaddlePaddle/DeepSpeech/ Перейдите в декодеры / swig / и запустите./setup.sh Проблема: когда я импортирую библиотеку…
16 апр '18 в 13:15
0
ответов
Как я могу напечатать или вернуть тензоры активации из модуля BasicLSTMCell?
Базовое ядро Tensorflow BasicLSTMCell определено здесь. Я хочу напечатать стек некоторых тензоров активации, пока это ядро развернуто и вызывается итеративно. Я попробовал два варианта, чтобы добиться этого. Сначала я попытался вернуть эти тензо…
24 окт '18 в 11:39
1
ответ
Почему Mozilla Deepspeech использует Tensorflow 0.11, когда у меня установлено 0.12?
Я использую Anaconda3 с python 3.6 и использую pips install tenorsflow deepspeech. Когда я запускаю следующую команду, я получаю ошибки: deepspeech - модели моделей /output_graph.pb - модели алфавита / alphabet.txt --audio voice.wav Loading model fr…
26 дек '18 в 23:21
2
ответа
Как внедрить Mozilla DeepSpeech в PHP веб-приложение для преобразования речи в текст?
У меня есть веб-приложение на PHP, и я ищу реализацию высокоточного распознавания речи с открытым исходным кодом, которая будет принимать голосовые команды для открытия веб-страниц от пользователей. Примеры: "Сделать продажи" (откроется страница "Со…
29 май '18 в 10:56
1
ответ
Что означает "Тест эпохи [число]" в Mozilla DeepSpeech?
Что означает "Тест эпохи [число]" в Mozilla DeepSpeech? В следующем примере это говорит Test of Epoch 77263хотя из моего понимания должна быть только 1 эпоха, так как я дал --display_step 1 --limit_train 1 --limit_dev 1 --limit_test 1 --early_stop F…
30 июн '18 в 19:28
0
ответов
Сколько эпох обычно требуется для приличной тренировки глубокой речи Мозиллы?
Я хотел бы знать, сколько эпох вы обычно проводите для обучения глубокой речи mozilla с ее архитектурой по умолчанию. (без изменений по сравнению с версией GitHub). Какое будет количество приличных эпох, особенно если учесть, что для каждой эпохи в …
19 дек '18 в 05:15
2
ответа
Deepspeech - выводит больше аудиофайлов и сохраняет результат
Я закончил обучение общим голосовым данным для глубокой речи от Mozilla, и теперь я могу получить вывод для одного аудио .wav файл. Ниже приведена команда, которую я использую. (deepspeech-venv) megha@megha-medion:~/Alu_Meg/DeepSpeech_Alug_Meg/DeepS…
29 июн '18 в 13:16
0
ответов
Длина звукового файла
Обязательна ли длина аудиофайла для обучения и вывода, равная 5 секундам? У меня есть эти вопросы, потому что у меня есть большое количество тренировочных данных со звуком (каждый звук более 30 секунд) и соответствующими стенограммами. Если я не мог…
02 авг '18 в 10:25
0
ответов
Выполнить вывод для deep_speech2 в тензорном потоке
Я нашел тензорную реализацию deepspeech2 в модели DeepSpeech2 и следовал всем инструкциям, и, наконец, я смог обучить и оценить модель. Теперь у меня есть предварительно подготовленные контрольные точки для этого. У меня вопрос, как выполнить вывод,…
26 окт '18 в 17:06
0
ответов
Пип не может найти deepspeech / deepspeech-gpu из версий для Windows
Я пытаюсь установить Deepspeech из Pypi на Windows, я продолжаю сталкиваться с проблемой "Не удалось найти требуемый пакет из версий", хотя мой pip обновлен ( 19.0.1). Я уже попробовал некоторые решения, приведенные здесь: https://discourse.mozilla.…
05 апр '19 в 17:31
0
ответов
mizalla/DeepSpeech: Ошибка прогноза модели вычислительной акустики: OOM
Я использую DeepSpeech для обучения китайской модели. С предварительной обработкой и обучением все в порядке. И затем он собирается вывести модель.pb. Но при вычислении предсказаний модели акустики процесс python3 убивается из-за OOM. Параметры собл…
16 апр '19 в 00:25