Построение языковой модели с использованием рекуррентных нейронных сетей

Question

Построение языковой модели с использованием рекуррентных нейронных сетей

Я получаю эту ошибку, когда я запускаю свой код.

Исключение: входные массивы должны иметь то же количество выборок, что и целевые. Найдено 12196 входных образцов и 1 целевой образец.

Ниже модель, которую я тренирую.

from keras.models import Sequential
from keras.layers.core import Dense
from keras.utils import np_utils
from keras.layers.embeddings import Embedding
from keras.layers.recurrent import LSTM
from keras.regularizers import l2
from keras.layers.wrappers import TimeDistributed

n_in = x_train.shape[1]
n_hidden = 100
n_out = word_vecs.shape[0]
number_of_epochs = 10
batch_size = 35

model = Sequential()

model.add(Embedding(output_dim=word_vecs.shape[1],                 input_dim=word_vecs.shape[0],input_length=n_in,  weights=[word_vecs],  mask_zero=True))  

model.add(LSTM(n_hidden, W_regularizer=l2(0.0001), U_regularizer=l2(0.0001), return_sequences=True))

model.add(TimeDistributed(Dense(n_out, activation='softmax', W_regularizer=l2(0.0001))))


model.compile(loss='categorical_crossentropy', optimizer='rmsprop')

Я также закодировал один горячий вектор моих данных поезда.

ниже код

new_instance = []

for instance in train_y :
    new_vector = np.zeros(shape=(instance.shape[0],  word_vecs.shape[0]))

    print(instance.shape[0],  word_vecs.shape[0])

    new_vector[np.arange(new_vector.shape[0]), instance ] =1

new_instance.append(new_vector)
new_instance = np.array(new_instance)

и это мой вывод для одного горячего вектора

(260, 4075)
(260, 4075)
(260, 4075)
(260, 4075)
(260, 4075)
(260, 4075)
(260, 4075)
(260, 4075)
(260, 4075)
(260, 4075)
(260, 4075)
(260, 4075)
(260, 4075)
(260, 4075)
(260, 4075)

[[[ 1.  0.  0. ...,  0.  0.  0.]
  [ 1.  0.  0. ...,  0.  0.  0.]
  [ 1.  0.  0. ...,  0.  0.  0.]
  ..., 
  [ 0.  0.  0. ...,  0.  0.  0.]
  [ 0.  0.  0. ...,  0.  0.  0.]
  [ 0.  0.  1. ...,  0.  0.  0.]]]

и наконец

for epoch in range(number_of_epochs):    
        start_time = time.time()

        #Train for 1 epoch
        model.fit(train_x, new_instance, nb_epoch=1,  batch_size=batch_size, verbose=False, shuffle=True)   

        print("%.2f sec for training" % (time.time() - start_time))
        sys.stdout.flush()

Я новичок в этом, прошу прощения. Спасибо

0

python-2.7 recurrent-neural-network

Источник

user2186702 27 авг '16 в 22:42

1 ответ

Другие вопросы по тегам python-2.7 recurrent-neural-network

user2186702 06 сен '16 в 09:36 2016-09-06 09:36 · Answer 1 · 2016-09-06 09:36

Через некоторое время я обнаружил, что проблема была в неправильном отступе в одном коде горячего векторного кодирования. Также я уменьшил размер моего набора данных, чтобы он соответствовал быстрее.

ниже исправленный код

new_instance = []

for instance in train_y :
    new_vector = np.zeros(shape=(instance.shape[0],  word_vecs.shape[0]))

    print(instance.shape[0],  word_vecs.shape[0])

    new_vector[np.arange(new_vector.shape[0]), instance ] =1

    new_instance.append(new_vector)
new_instance = np.array(new_instance)