Tensorflow.Keras говорит, что ввод отличается от ожидаемого ввода

Я пишу простой CNN, чтобы классифицировать различные черты лица мультфильма. Я использую этот набор данных. Когда я пытаюсь запустить свой код, я получаю следующую ошибку:

Traceback (most recent call last):
  File "cartoonKerasPy.py", line 86, in <module>
    model.fit(x_train, y_train, batch_size=8, epochs=3)
  File "C:\Users\befbr\Anaconda3\envs\Cartoon AI\lib\site-packages\tensorflow\python\keras\engine\training.py", line 1536, in fit
    validation_split=validation_split)
  File "C:\Users\befbr\Anaconda3\envs\Cartoon AI\lib\site-packages\tensorflow\python\keras\engine\training.py", line 992, in _standardize_user_data
    class_weight, batch_size)
  File "C:\Users\befbr\Anaconda3\envs\Cartoon AI\lib\site-packages\tensorflow\python\keras\engine\training.py", line 1154, in _standardize_weights
    exception_prefix='target')
  File "C:\Users\befbr\Anaconda3\envs\Cartoon AI\lib\site-packages\tensorflow\python\keras\engine\training_utils.py", line 293, in standardize_input_data
    str(len(data)) + ' arrays: ' + str(data)[:200] + '...')
ValueError: Error when checking model target: the list of Numpy arrays that you are passing to your model is not the size the model expected. Expected to see 1 array(s), but instead got the following list of 160 arrays: [0, 0, 0, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0...

Вот мой код:

print("Importing Packages")
import os
import tensorflow as tf
from tensorflow import keras as k
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import numpy as np
import pandas as pd
from PIL import Image

def createModel():
    model = k.models.Sequential([
      k.layers.Conv3D(filters=64, kernel_size=2, padding='same', activation='relu', input_shape=(500,500, 4, 1)),
      k.layers.MaxPooling3D(pool_size=2),
      k.layers.Dropout(0.2),
      k.layers.Flatten(),
      k.layers.Dense(1000, activation='relu'),
      k.layers.Dense(1, activation='softmax')

    ])
    model.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])
    return model

def getFile(dir, getEveryNthLine):
    allFiles = list(os.listdir(dir))
    # print(allFiles)
    fileNameList = []
    numOfFiles = len(allFiles)
    i = 0
    for fichier in allFiles:
        if(i % getEveryNthLine == 0):
                # print(fichier)
                if(fichier.endswith(".csv")):
                    fileNameList.append(dir + "/" + fichier[0:-4])
        i += 1
    return fileNameList

print("Creating Model")
model = createModel()

# print("Model Summary")
# model.summary()

print("\nLoad Files")
files = getFile("F:/cartoonset10k/", 100)
print("Loaded " + str(len(files)) + " file names")

print("Split Data Into Train And Test")
train, test = train_test_split(files, test_size=0.2)

x_train = []
y_train = []
x_test = []
y_test = []

def getLabels(filePath):
    df = []
    with open(filePath, "r") as file:
        for line in list(file):
            tempList = line.replace("\n", "").replace('"', "").replace(" ", "").split(",")
            df.append({
                "attr": tempList[0],
                "value":int(tempList[1]),
                "maxValue":int(tempList[2])
            })
    return df

for i in range(len(train)):

    x_train.append([list(Image.open(train[i] + ".png").getdata())])
    y_train.append(pd.DataFrame(getLabels(train[i] + ".csv"))["value"][1])

print("Finished Formating\n\n")

x_train = np.reshape(x_train, (len(train), 500, 500, 4, 1))

with tf.device('/gpu'):
    model.fit(x_train, y_train, batch_size=8, epochs=3)

Кто-нибудь знает, что вызывает это? Я думаю, что проблема связана с формой ввода, но я могу быть очень не прав. Где я могу найти правильную форму ввода?

0 ответов

Есть несколько проблем, мой друг:

Прежде всего, это плохая практика иметь kernal_size четных чисел. Вместо этого я рекомендую что-то вроде (5, 5), так как вы изображение значительно больших

Далее, я думаю, вам следует использовать Conv2D вместо Conv3D.

Кроме того, ваш последний слой должен иметь несколько выходов, например 2, представляющих, возможно, что-то вроде 0 для этого мультипликационного персонажа и 1 для другого персонажа.

Наконец, у меня возникает ощущение, что ваша модель не подходит, и всегда полезно переобучить вашу модель и бороться с ней, используя такие стратегии, как регуляризация веса L1, L2 или слои Droupout.

В целом ваша модель должна быть примерно такой, не стесняйтесь отозвать меня, если я ошибаюсь, поскольку я тоже не эксперт в этом:P:

def build_model():
    model = Sequential()

    model.add(Conv2D(64, (5, 5), input_shape=(500, 500, 4), activation="relu"))
    model.add(MaxPooling2D(pool_size=(2, 2))
    model.add(Droupout(0.2))

    model.add(Conv2D(128, (5, 5), activation="relu"))
    model.add(MaxPooling2D(pool_size=(2, 2))
    model.add(Droupout(0.2))

    model.add(Conv2D(256, (5, 5), activation="relu"))
    model.add(MaxPooling2D(pool_size=(2, 2))
    model.add(Droupout(0.2))

    model.add(Flatten())
    model.add(Dense(512, activation="relu"))
    model.add(Dropout(0.5))
    model.add(Dense(512, activation="relu"))
    model.add(Dropout(0.5))
    model.add(Dense(512, activation="relu"))
    model.add(Dropout(0.5))
    model.add(Dropout(2, activation="softmax"))

return model

Я использовал несколько операторов импорта, чтобы мне не приходилось вводить k.blah.blah и т. Д. Модель CNN обычно выглядит так: conv -> maxpool -> dropout -> conv -> maxpool -> dropout .......... выпадение -> ровный -> плотный -> высокий процент отсева -> плотный -> высокий показатель отсева ->........... -> вывод

Надеюсь это поможет! Чао

PS: Вам всего 13 лет, и вы умеете кодировать такие вещи, как CNN и т. Д., Я действительно впечатлен, у вас есть таланты, мой друг. Не отставайте от хорошей работы!:)

Другие вопросы по тегам