Описание тега ctc
CTC или "временная классификация коннекционистов" - это метод машинного обучения для сопоставления плотных входных данных с более короткими выходными последовательностями в том же порядке.
0
ответов
Обратное распространение на метки в тензорном потоке ctc_loss
Я работаю с функцией потери тензор потока CTC tf.nn.ctc_loss(labels,inputs,__) Вот inputs аргумент является выходом из некоторого RNN1 и labels аргумент является истинной целью, которую мы хотим достичь.В моем случае labels также генерируется из нек…
06 янв '19 в 07:24
1
ответ
CTC модель не учится
Я пытаюсь запрограммировать модель Keras для транскрипции звука, используя временную классификацию соединений. Используя в основном работающую модель покадровой классификации и пример OCR, я придумал модель, приведенную ниже, которую я хочу обучить …
06 дек '18 в 02:36
1
ответ
Как преобразовать SparseToDense в массив Tensor или int?
Я реализовал модель LSTM-CTC в устройстве Android и пришел к этому блоку кода. SparseToDense sparseDense = ctc_decode(out, input_length, true, beam_width, top_paths); Я получаю объект sparseDense идеально с ожидаемой формы, но я не знаю, как получит…
21 фев '19 в 12:34
0
ответов
CTCBeamSearchDecoder считает, что sequence_length of shape (2,) не является вектором
Пытаясь запустить поиск луча в модели Keras, я получаю запутанные (и противоречивые?) Сообщения об ошибках. Моя модель имеет такие входные данные, как inputs = Input(name='spectrograms', shape=(None, hparams["n_spectrogram"])) input_length = Input(n…
08 дек '18 в 21:39
1
ответ
Можно ли использовать RNN / LSTM для нестандартного текстового распознавания текста?
Я читал о LSTM и RNN, даже CTC. Из того, что я понимаю, RNN используется для обозначения недостающего токена в последовательности (например, слова в предложении). Тем не менее, моя проблема заключается в чтении имен людей, написанных рукописным шриф…
17 дек '18 в 13:41
0
ответов
Keras CTC Потеря Метки Padding
Есть ряд тем с похожими проблемами, но нет четких рекомендаций по этому вопросу. Я пытаюсь сделать извлечение текста из изображения. Проблема в том, если я привожу пустые изображения (all_zero), как мне подготовить этикетку. В keras, например, OCR, …
22 фев '19 в 11:56
0
ответов
CTC: В чем разница между пробелом и пробелом?
В статье 2006 года о темпоральной классификации Connectionist Alex Graves & co. представил модель декодирования речи с 27 метками: 26 для букв алфавита и одна для пустых, что означает отсутствие метки (что я понимаю, как молчание). Однако я вижу мно…
21 мар '19 в 16:01
0
ответов
Функция ctc_batch_cost возвращает стоимость как нан
Я пытаюсь реализовать сеть CTC LSTM, и мой ctc_batch_cost только возвращает nan. Я не знаю, как это исправить, поэтому любая помощь будет оценена. Мой график Tf tf.reset_default_graph() graph = tf.Graph() with graph.as_default(): input_dataset = tf.…
23 мар '19 в 06:59
0
ответов
Ошибка в K.ctc_batch_cost: tenenflow.python.framework.errors_impl.InvalidArgumentError: sequence_length(0) <= 30
Я использую модель CRNN в Керасе, чтобы выполнить распознавание рукописного ввода, но я получаю ошибку при вычислении потери CTC. Проблема возникает только тогда, когда я пытаюсь загрузить предварительно обученную сеть для моего CNN. Это работает но…
17 апр '19 в 11:47
0
ответов
CTCBeamSearchDecoder - меньше запросов на поиск луча, чем запрошено
Я столкнулся с проблемой после успешного обучения на нескольких пакетах данных (каждый раз по-разному). Интересно то, что если я тренируюсь только на том пакете, на котором произошла ошибка, все в порядке - поэтому в данных нет ничего плохого (я исп…
20 апр '19 в 11:13
0
ответов
Когда я запускаю эту модель, это всегда говорит мне последовательность ошибок (0)<=8? что я могу сделать, если я хочу изменить 8 и что именно означает 8?
def get_model(img_h,nclass=None): start_epoch = 0 stop_epoch = 30 img_w = 32 # Input Parameters img_h = img_h words_per_epoch = 16000 val_split = 0.2 val_words = int(words_per_epoch * (val_split)) # Network parameters conv_filters = 16 kernel_size …
03 май '19 в 02:32
2
ответа
Есть ли разница между "torch.nn.CTCLoss", поддерживаемым PYTORCH, и "CTCLoss", поддерживаемым torch_baidu_ctc?
Есть ли разница между "torch.nn.CTCLoss", поддерживаемым PYTORCH, и "CTCLoss", поддерживаемым torch_baidu_ctc? я думаю, я не заметил никакой разницы, сравнивая учебный код. Кто-нибудь знает правду? Код учебника находится ниже. import torch from torc…
03 май '19 в 01:16
1
ответ
Пример негативных меток с помощью keras ocr
Я пытаюсь реализовать ocr рукописного ввода на основе примера keras ocr: ссылка. Однако я получаю следующую ошибку: InvalidArgumentError: All labels must be nonnegative integers, batch: 0 labels: 1,0,11,9,45,0,25,17,27,41,39,9,37,0,23,1,39,9,35,0,11…
05 май '19 в 07:06
0
ответов
Объединение выходов нескольких моделей с выходным слоем CTC (ансамбль)
Я пытаюсь объединить результаты различных моделей, чтобы дать лучший результат (например, голосование в классификации). Мои модели выводятся из слоя ctc, который является вероятностным распределением выходного класса для отметки времени. Он имеет 2d…
16 апр '19 в 06:41
0
ответов
Как маркировать данные речи несегментированной последовательности (wav-файл), используя CTC, используя python?
Здравствуйте, энтузиасты S/W разработчиков, я новичок в области распознавания речи (речь в текст) и в настоящее время я работаю над проектом для своих исследований, где я использую Mozilla Common Voice Dataset (Немецкий набор голосовых данных) - htt…
15 июл '19 в 03:10
1
ответ
Понимание потери CTC для распознавания речи в Keras
Я пытаюсь понять, как потеря CTC работает для распознавания речи и как она может быть реализована в Keras. Что я думаю, что понял (пожалуйста, поправьте меня, если я ошибаюсь!) В общем, потери CTC добавляются поверх классической сети, чтобы декодиро…
31 июл '19 в 17:15
0
ответов
Почему я продолжаю получать сообщение об ошибке "Максимальная глубина рекурсии превышена при вызове объекта Python" в Keras из Tensorflow 2.0?
Я пытаюсь обучить стековую архитектуру нейронных сетей с помощью CNN, GRU и CTC в редакции Keras от tenorflow 2.0. Я получаю сообщение об ошибке "RecursionError: максимальная глубина рекурсии превышена при вызове объекта Python". Я попытался импорти…
09 авг '19 в 13:11
0
ответов
В чем разница между tf.nn.ctc_loss и pytorch.nn.CTCLoss
Для того же ввода и метки: выход pytorch.nn.CTCLoss 5,74, выход tf.nn.ctc_loss 129,69, но вывод math.log(tf ctc loss) 4,86 Так в чем разница между pytorch.nn.CTCLoss с участием tf.nn.ctc_loss? tf: 1.13.1 pytorch: 1.1.0 Я должен был попытаться это: l…
05 авг '19 в 19:02
1
ответ
Выравнивание меток в обучении RNN Transducer
Я пытаюсь понять, как RNN Transducer обучается с наземными метками правды. В случае CTC я знаю, что модель обучена с функцией потерь, которая суммирует все оценки всех возможных выравниваний наземных истинных меток. Но в RNN-T сеть прогнозирования д…
03 июл '19 в 20:18
0
ответов
Реализация CTC без textImagegenerator в керасе
В keras/examples/image_ocr потери ctc рассчитывались с использованием TextImageGenrator, для которого требуется файл монограммы и файл биграммы. Можно ли подавать только изображения и значения истинности для расчета потерь и прогнозирования текста?
26 июн '19 в 17:03