Описание тега encoder-decoder

0 ответов

Могу ли я передать другой стартовый символ в RNN-декодер?

Когда RNN используется для прогнозирования предложения, состояние декодера инициализируется с помощью ввода: <S> (начальный символ, который побуждает декодер выдать первое слово ответа) ех. Дано <S>предсказывать Theзатем Theпредсказывать…
1 ответ

Передача initial_state в двунаправленный слой RNN в Keras

Я пытаюсь реализовать сеть типа кодер-декодер в Keras, с двунаправленными GRU. Кажется, работает следующий код src_input = Input(shape=(5,)) ref_input = Input(shape=(5,)) src_embedding = Embedding(output_dim=300, input_dim=vocab_size)(src_input) ref…
2 ответа

Base64. Декодер, возвращающий иностранные символы

Я строю небольшое приложение, чтобы превратить текст в текстовом файле в Base64, а затем вернуться к нормальной работе. Декодированный текст всегда возвращает некоторые китайские символы в начале первой строки. public EncryptionEngine(File appFile){…
12 апр '18 в 22:16
0 ответов

Как реализовать поиск луча

Создание субтитров с использованием Encoder-Decoder Framework Как вы можете реализовать поиск луча из этого кода Джейсона Браунли из мастерства машинного обучения.
0 ответов

Механизм внимания в модели исправления орфографии

Я пытаюсь проверить механизм внимания в этом коде (на основе работы MajorTal): def generate_model(output_len, chars=None): """Generate the model""" print('Build model...') chars = chars or CHARS model = Sequential() # "Encode" the input sequence usi…
1 ответ

Вывод DecoderRNN содержит дополнительные измерения (Pytorch)

Я разработал сеть Encoder(CNN)-Decoder (RNN) для субтитров изображения в pytorch. Сеть декодера принимает два входных вектора - вектор признака контекста от кодера и вложение слова заголовка для обучения. Вектор контекстного объекта имеет размер = e…
0 ответов

В чем смысл "сети прямой передачи данных" в модели трансформатора?

В настоящее время я читаю Google. Внимание - это все, что вам нужно, и я не могу понять, какую роль играет слой с прямой связью. Я знаю, что это всего лишь два сверточных слоя 1*1, собранные вместе, и эта статья стремилась избежать использования CNN…
0 ответов

Архитектура декодера декодера в Pytorch

Я хотел бы реализовать архитектуру сверточного кодера с использованием исследовательской работы. Но эта исследовательская работа публикует его код на языке Torch. И в части декодера, он использует функцию ResizeJoinTable() up1 = {s5, s4} - nn.Resize…
0 ответов

Обучение последовательности для моделей последовательности

Мне интересно, когда мы тренируем последовательность к модели последовательности, следует ли нам кормить основную правду? Я имею в виду для прогнозирования на временном шаге (t+1), должны ли мы подавать в декодер прогнозирование временного шага (t) …
2 ответа

Ошибка при отключении графика при попытке построить модель кодера-декодера в Keras

Я пытаюсь реализовать в Керасе упрощенную версию модели кодер-декодер, основанную на изображении, приведенном на рисунке ниже (источник: https://arxiv.org/pdf/1805.07685.pdf). Обратите внимание, что в этой модели только один кодер и декодер, они был…
16 июл '18 в 10:35
1 ответ

Добавление нескольких сверточных слоев снижает точность в модели кодер-декодер

Я работаю над реализацией SegNet в TensorFlow, которую я использую для разделения аэрофотоснимков на два класса: "Строительство" и "Не строительство". У меня есть небольшая версия сети, которая дает точность до 82%. Однако я хотел расширить сеть, до…
0 ответов

Перекодировать контекстный вектор после каждого шага декодирования?

В настоящее время я работаю над моделью последовательности, которая направлена ​​на то, чтобы предсказать ориентацию головы человека, который следит за виртуальной реальностью за произвольное количество кадров в будущем. Используя парадигму кодер-де…
14 авг '18 в 18:26
1 ответ

Как декодер обусловлен в обучении seq2seq?

Я пытаюсь понять последовательное обучение с RNN. Что я понимаю до сих пор, так это то, что выход кодера используется для кондиционирования декодера. Тем не менее, у меня есть два источника, которые, по моему мнению, делают обусловленность по-разном…
1 ответ

Начальное состояние или константы слоя RNN не могут быть определены с помощью комбинации тензоров Кераса и тензоров, отличных от Кераса.

Как мы знаем, декодер принимает скрытые состояния кодера в качестве исходного состояния... encoder_output , state_h, state_c = LSTM(cellsize, return_state=True)(embedded_encoder_input) encoder_states = [state_h, state_c] decoder_lstm = LSTM(cellsize…
19 янв '19 в 20:11
0 ответов

Разница между двумя типами структуры кодера-декодера LSTM в Keras

Недавно я видел два разных типа настройки кодера-декодера в Керасе. Они оба используются для генерации последовательностей. Но я не уверен, какой из них более эффективен (или понимаю, какой сценарий более эффективен). Так что любое предложение помож…
07 фев '19 в 21:48
0 ответов

Декодер PNG изображения в C#

Я веб-сервер должен быть написан на C#, который будет проходить через изображение http в формате PNG. Программа должна наложить фильтр на эти изображения. Сервер будет многопоточным, это скорость обработки фургона. В.NET есть System.Drawing.Bitmap к…
30 дек '17 в 20:31
0 ответов

Keras: AssertionError на LSTM initial_state

Я строю модель кодер-декодер, и при сборке декодера появляется ошибка AssertionError. Это уровень кодировщика, я подозреваю, что на выходе кодера есть проблема, которая позже приводит к проблеме назначения декодера LSTM initial_state. encoder_lstm1 …
05 авг '18 в 04:16
0 ответов

Тензорные формы вывода декодера и softmax_cross_entropy_with_logits

Я делаю пару encoder_decoder в тензорном потоке. Это генерация текста со стандартным использованием softmax для прогнозирования следующего слова. stepwise_cross_entropy = tf.nn.softmax_cross_entropy_with_logits( labels = tf.one_hot( decoder_tgt, dep…
1 ответ

Ошибка при попытке декодирования видео 4K с помощью NVDEC

Я пытаюсь преобразовать файл 4K HEVC MKV размером 70 ГБ в другой файл HECV, но с меньшим размером. Я использую FFmpeg с ускорением Nvidia, но когда я выполняю следующую команду, появляется ошибка: ffmpeg -y -vsync 0 -hwaccel_device 0 -hwaccel cuvid …
22 янв '18 в 21:26
1 ответ

Могу ли я использовать `tf.contrib.seq2seq.dynamic_decode` для замены функции`tf.nn.dynamic_rnn` в среде кодера-декодера?

На самом деле, я хочу генерировать последовательности точно так же, как это делал Алекс Грейв. У меня есть реализация tenorflow. В то же время я хочу попробовать модель seq2seq, основанную на внимании, для создания почерка. Так что про декодер я сде…
23 май '18 в 09:00