Использование Julia Flux для построения простой нейронной сети

У меня есть набор данных изображений ( https://www.kaggle.com/iarunava/cell-images-for-detecting-malaria), и я хочу использовать нейронную сеть, чтобы узнать, является ли одно изображение незараженной клеткой или нет. Поэтому я упорядочил свои данные, чтобы получить 4 переменные:

X_tests, Y_tests, X_training, Y_training

Каждая из этих переменных имеет тип Array{Array{Float64,1},1}

И у меня есть функция для создания простой нейронной сети (которая взята из примера https://smist08.wordpress.com/2018/09/24/julia-flux-for-machine-learning/):

function simple_nn(X_tests, Y_tests, X_training, Y_training)
    input = 100*100*3
    hl1 = 32
    m = Chain(
      Dense(input, 32, relu),
      Dense(32, 2),
      softmax) |> gpu

    loss(x, y) = crossentropy(m(x), y)

    accuracy(x, y) = mean(onecold(m(x)) .== onecold(y))

    dataset = [(X_training,Y_training)]
    evalcb = () -> @show(loss(X_training, Y_training))
    opt = ADAM(params(m))

    Flux.train!(loss, dataset, opt, cb = throttle(evalcb, 10))

    println("acc X,Y ", accuracy(X_training, Y_training))

    println("acc tX, tY ", accuracy(X_tests, Y_tests))
end

И я получаю эту ошибку после выполнения simple_nn(X_tests, Y_tests, X_training, Y_training):

ERROR: DimensionMismatch("matrix A has dimensions (32,30000), vector B has length 2668")
...

Ошибка в этой строке: Flux.train!(loss, dataset, opt, cb = throttle(evalcb, 10))

Я не знаю, что делают функции, какой аргумент они принимают, что возвращают, и я не могу найти какую-либо документацию в Интернете. Я могу только найти примеры. Итак, у меня есть два вопроса: как я могу сделать эту работу для моего набора данных? И есть ли документация для функций Flux, как для sklearn? (например, это: https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html)

1 ответ

Можете ли вы предоставить автономный MWE? Я думаю твой X_training не имеет размерности 3*100*100х что-то, и это на самом деле 2688 что-то.

Ваш первый слой Dense(input, 32, relu) и вход 3*100*100, так что ожидается вход, где одно из измерений 3*100*100 который вы не удовлетворяете.

Может попробовать заменить

dataset = [(X_training,Y_training)]

с

dataset = zip(X_training,Y_training)

zip фактически объединяет обучающие данные 1 из X с 1 из Y и, таким образом, превращает кортеж векторов в вектор кортежей. Я предполагаю, что в ваших тренировочных данных 2688 образцов?

Другие вопросы по тегам