Описание тега gru

0 ответов

PyTorch pack_padded_sequence работает очень медленно

Я строю архитектуру на основе ГРУ. Раньше я просто дополнял пакеты последовательностей и передавал их в ГРУ. Очевидно, это вносило некоторую небольшую ошибку в результаты, потому что это не совсем правильное действие на 100% (ГРУ не знает, что нужно…
01 май '22 в 03:50
1 ответ

Заменить двунаправленный LSTM на GRU в coref?

Я тренирую корреферентную модель от грубого к точному (для другого языка, кроме английского) от Allennlp с конфигурациями шаблонов из bert_lstm.jsonnet. Когда я заменяю тип «lstm» контекстного слоя на «gru», это работает, но, похоже, очень мало влия…
0 ответов

TensorFlow — несоответствие формы ввода SimpleRNN

У меня есть набор данных с 30 временными шагами и 1 входом. Он имеет двоичную метку (т. е. цель). Итак, основываясь на последовательности, я хотел бы предсказать, является ли последовательность «1» или «0». Простой! Я строю такую ​​модель: n_steps =…
25 май '22 в 22:03
0 ответов

Временное внимание к вводу переменной длины?

У меня проблемы с реализацией кода. Я хотел бы попросить вашего руководства. Вот запрос: KerasTensor(type_spec=TensorSpec(shape=(None, None, 64), dtype=tf.float32, name=None), name='gru_1/transpose_2:0', description="created by layer 'gru_1'") первы…
18 май '22 в 11:45
0 ответов

В RNN я не могу понять, как временные шаги сопоставляются с выходной формой.

В слое Simple RNN количество единиц соответствует спецификации выходной формы. Если развернуть, каждый временной шаг можно представить как отдельный слой. Но я не могу понять, как это сопоставляется с выходной формой. Вот в примере: . Как отображают…
0 ответов

Ошибка нескольких слоев nn.GRU в модели Pytorch

Недавно я сделал модель ГРУ с помощью Pytorch. Когда модель имеет один слой nn.GRU, она работает хорошо. Но когда имеется более одного слоя GRU, модель будет сообщать об ошибке, например «ошибка CUDA: CUBLAS_STATUS_ALLOC_FAILED при вызове». ' в нача…
14 май '22 в 15:09
0 ответов

Входная форма Keras GRU

Я создал собственный генератор, который выводит данные X с формой (100,2,2048), принадлежащие классам Y 16 (16), для передачи в модель GRU для классификации видео. 100 — длина последовательности, 2 — для двух одновременных просмотров камеры, каждая …
0 ответов

значения predict() равны нулю или NaN

У меня модель ГРУ GRU = keras.models.Sequential([keras.layers.GRU(32), keras.layers.Dense(32, activation= 'relu'), keras.layers.Dense(1, activation=None)]) GRU.compile(loss="mae", optimizer="adam") resultsGRU = GRU.fit_generator(generator = train, v…
15 янв '23 в 20:41
0 ответов

Как я могу изменить свою модель на VGG16, а затем добавить VGG16 в качестве слоя в GRU?

Я хочу изменить свою модель на модель vgg16, а затем использовать vgg16 в качестве слоя в другой модели GRU. Возможно ли вообще добиться этого, я искал и пробовал много вещей, но не повезло. gait_input = tf.keras.layers.Input(shape = (16, 32, 32, 11…
25 июн '22 в 03:54
0 ответов

RuntimeError: для непакетного двумерного ввода hx также должен быть двумерным, но имеет трехмерный тензор.

I have defined a GRU model for a prediction task. But I am getting this error. here is the code of GRU model. класс GRU_Model(nn.Module): определение инициализации(self, input_dim, hidden_dim, layer_dim, output_dim):super(GRU_Model, self).инициализ…
0 ответов

Ошибка при сохранении модели keras тензорного потока со слоями CUDNNGRU

У меня есть модель со слоями CuDNNGRU. Я могу создать модель и использовать ее для вывода и т. Д. В записной книжке. Однако, когда я пытаюсь сохранить модель с помощью model.save(), я получаю эту ошибку. AttributeError: 'CuDNNGRU' object has no attr…
21 фев '23 в 15:57
0 ответов

обновление весов в рекуррентной нейронной сети

Я хочу написать собственный оптимизатор в TensorFlow Keras API для рекуррентной нейронной сети (GRU). Веса W представлены рекуррентными соединениями на следующем рисунке. Я хочу знать, изменяются ли эти веса для каждого слоя или для каждого повторяю…
26 окт '22 в 21:47
0 ответов

Количество параметров подсчета в ГРУ

У меня модель ГРУ выглядит следующим образом. class CharGenModel(tf.keras.Model): def __init__(self, vocab_size, num_timesteps, embedding_dim, **kwargs): super(CharGenModel, self).__init__(**kwargs) self.embedding_layer = tf.keras.layers.Embedding(v…
21 окт '22 в 01:58
0 ответов

После создания GRU_model я попытался продолжить обучение с помощью fit(), но произошла ошибка

Это мой код ` import os import tensorflow as tf import librosa, librosa.display from glob import glob import numpy as np import pandas as pd from sklearn.model_selection import train_test_split from keras.models import Sequential from keras.layers i…
02 дек '22 в 08:57
0 ответов

Поиск гиперпараметров «look_back» и «look_ahead» для моделей Seq2Seq

Для архитектур глубокого обучения Seq2Seq, а именно LSTM/GRU и многомерного, многошагового прогнозирования временных рядов, важно преобразовать данные в трехмерное измерение: (batch_size, look_back, number_features). Здесь look_back определяет колич…
0 ответов

Можно ли обучать torch.nn.ReLU и torch.nn.Sigmoid?

Я создаю простую модель GRU с помощью PyTorch. Он включает в себя 4 подмодуля. Я заметил, что некоторые словари возвращаютсяstate_dict()из них пусты после обучения, в то время как некоторые из других подмодулей, безусловно, имеют некоторый вес и сме…
26 сен '22 в 17:38
0 ответов

MLP и LSTM во временных рядах

Надеюсь у тебя все хорошо, Я делаю исследовательскую работу о прогнозировании энергии ветра с использованием глубокого обучения. Где я использовал 3 нейросети, а именно: RNN, LSTM, MLP. Результаты были хорошими, но что мне показалось несколько стран…
30 сен '22 в 17:22
0 ответов

BERT без оболочки + слой GRU для анализа настроений

Я пытаюсь настроить BERT без учета анализа настроений, добавив в конце один слой GRU. Проблема заключается в том, что выходная форма модели BERT не соответствует необходимой входной форме для слоя GRU. У меня есть 2 класса: положительный и отрицател…
0 ответов

Укажите количество скрытых рекуррентных слоев в модели GRU с помощью Tensorflow Keras.

Я хочу создать модель GRU с помощью Keras. Я не могу понять, как указать количество скрытых повторяющихся слоев. Я использовал следующий код. Насколько я понял, с помощью этого кода мы создали входной слой с 64 нейронами, скрытый слой с 64 нейронами…
22 ноя '22 в 17:05
0 ответов

Переоснащение предсказания следующего слова

Привет всем, извините, если мой вопрос покажется глупым. Но я пытаюсь создать модель предсказания следующего слова. Но у меня проблема с переоснащением. вот мой код data = ' '. join(lines) data=data.lower() data = data.replace('\n', '').replace('\r'…
05 июн '22 в 10:58