Ошибка несовместимости форм при запуске tf-lite экспериментальных слоев rnn model

Ошибка при использовании softmax

logits and labels must have the same first dimension, got logits shape [24,3] and labels shape [384]
     [[{{node loss/output_loss/SparseSoftmaxCrossEntropyWithLogits/SparseSoftmaxCrossEntropyWithLogits}}]]

Ошибка при использовании сигмоида

InvalidArgumentError: Incompatible shapes: [24] vs. [24,16]
     [[{{node metrics/sparse_categorical_accuracy/Equal}}]]

import os
os.environ['TF_ENABLE_CONTROL_FLOW_V2'] = '1'
import tensorflow as tf
import numpy as np
from tensorflow.lite.experimental.examples.lstm.rnn import bidirectional_dynamic_rnn


def build_LSTM_layer(num_layers):
    lstm_layers=[]
    for i in range(num_layers):
        lstm_layers.append(tf.lite.experimental.nn.TFLiteLSTMCell(num_units=50,name='rnn{}'.format(i),forget_bias=1.0))
    final_lstm_layer=tf.keras.layers.StackedRNNCells(lstm_layers)
    return final_lstm_layer
def build_bidirectional(inputs,num_layers,use_dynamic_rnn=True):
    lstm_inputs=transposed_inp=tf.transpose(inputs,[1,0,2])
    outputs,output_states=bidirectional_dynamic_rnn(build_LSTM_layer(num_layers),build_LSTM_layer(num_layers),lstm_inputs,dtype="float32",time_major=True)
    fw_lstm_output,bw_lstm_output=outputs
    final_out=tf.concat([fw_lstm_output,bw_lstm_output],axis=2)

    final_out=tf.unstack(final_out,axis=0)
    resultant_out=final_out[-1]
    return resultant_out


tf.reset_default_graph()
model_tf = tf.keras.models.Sequential([
  tf.keras.layers.Input(shape=(X.shape[1],), name='input'),
  tf.keras.layers.Embedding(input_dim=len(vocab)+1,output_dim=100,input_length=X.shape[1]),
  tf.keras.layers.Lambda(build_bidirectional, arguments={'num_layers' : 2, 'use_dynamic_rnn' : True}),
  tf.keras.layers.Dense(3,activation='softmax',name='output')  
])
model_tf.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['sparse_categorical_accuracy'])
model_tf.summary()

Я создал ту же модель с использованием слоев keras и LSTM с двунаправленной оболочкой и ее работоспособностью, но я не могу преобразовать ее в tf-lite, и она не поддерживает несколько слоев RNN

Поэтому я пытаюсь использовать этот подход, чтобы использовать слои tf.experimental, которые работают, когда форма Y = (N,), но не работает, когда я меняю форму на Y = (N,N,1)

Входные данные представляют собой последовательность токенов, а выходными данными должны быть теги NER, которые я получаю из модели keras, но не из модели выше.

X.shape = (30, 16)
y.shape = (30, 16, 1)

I/P = array([[15., 10., 38.,  4., 32., 57., 39.,  0.,  0.,  0.,  0.,  0.,  0., 0.,  0.,  0.]])
O/P = array([[[1.],[1.],[1.],[1.],[2.],[1.],[1.],[0.],[0.],[0.],
         [0.],[0.],[0.],[0.],[0.],[0.]]])

0 ответов

Другие вопросы по тегам