Нейронная сеть сходится к минимумам, но работает, только если предоставлены все данные обучения
Я новичок в нейронных сетях, и я написал следующий код нейронной сети прямой связи для выполнения 3-разрядного двоичного счетчика. Что я нашел в выводе моего кода, так это когда я попытался предсказать после тренировки с одним из 3-битных входных данных, он почти всегда предсказывает следующее состояние неправильно, но когда я передаю cntr_inp (матрицу, которая содержит все входные данные) в качестве входных данных, он предсказывает следующий право государства на соответствующее государство. Я не мог выяснить, что происходит, и застрял на некоторое время. Если бы кто-то мог обнаружить ошибку, которую я делаю, был бы мне полезен.
Благодарю.
#Sigmoid Function
sigmoid <- function(z){
1.0/(1.0+exp(-z))
}
#Derivative of Sigmoid
sigmoid.derivative <- function(z){
z*(1-z)
}
#Randomly Generates Weights
create.weights <- function(layers){
weights <- vector("list",length(layers)-1)
for(i in 1:length(weights)){
weights[[i]] <- matrix(runif(layers[i]*layers[i+1]),nrow = layers[i],ncol = layers[i+1])
}
return(weights)
}
#Randomly Generates Biases
create.biases <- function(layers){
biases <- vector("list",length(layers)-1)
for(i in 1:length(biases)){
biases[[i]] <- runif(layers[i+1])
}
return(biases)
}
#Feedforward / Forward Propogation
feedforward <- function(inp,weights,biases){
layer <- vector("list",length(layers)-1)
for(i in 1:(length(layers)-1)){
if(i==1){
layer[[i]] <- inp %*% weights[[i]] + biases[[i]]
layer_dim <- dim(layer[[i]])
layer[[i]] <- matrix(sigmoid(as.numeric(layer[[i]])),nrow = layer_dim[1],ncol = layer_dim[2],byrow = FALSE)
}else{
layer[[i]] <- layer[[i-1]] %*% weights[[i]] + biases[[i]]
layer_dim <- dim(layer[[i]])
layer[[i]] <- matrix(sigmoid(as.numeric(layer[[i]])),nrow = layer_dim[1],ncol = layer_dim[2],byrow = FALSE)
}
}
return(layer)
}
#Calculating Delta Values
calculate_delta <- function(net_out,out,weights){
Slope <- lapply(net_out,sigmoid.derivative)
delta <- vector("list",length(Slope))
for(i in length(Slope):1){
if(i == length(Slope)){
delta[[i]] <- (out-net_out[[i]]) * Slope[[i]]
}else{
Error_hidden <- delta[[i+1]] %*% t(weights[[i+1]])
delta[[i]] <- Error_hidden * Slope[[i]]
}
}
return(delta)
}
#Updating Weights
updating_weights <- function(weights,inp,delta,net_out,step.size){
for(i in length(weights):1){
if(i != 1){
weights[[i]] <- weights[[i]] + t(net_out[[i-1]]) %*% delta[[i]] * step.size
}else{
weights[[i]] <- weights[[i]] + t(inp) %*% delta[[i]] * step.size
}
}
return(weights)
}
#Updating Biases
updating_biases <- function(biases,delta,step.size){
for(i in 1:length(biases)){
biases[[i]] <- biases[[i]] + colSums(delta[[i]]) * step.size
}
return(biases)
}
#Complete Neural Net operations (Forward and Backward Propogation)
Neural.Net <- function(layers = NULL,inp,out,epoch,step.size = 0.01,error.threshold = 0.01){
weights <- create.weights(layers)
biases <- create.biases(layers)
for(i in 1:epoch){
##Back Propogation
net_out <- feedforward(inp,weights,biases)
delta <- calculate_delta(net_out,out,weights)
weights <- updating_weights(weights,inp,delta,net_out,step.size)
biases <- updating_biases(biases,delta,step.size)
avg_error <- mean(abs(out - net_out[[length(net_out)]]))
##Printing Output for every epoch
cat("\014")
cat("------- Feed Forward Neural Nets -------\n")
cat("Inputs: ",layers[1],"\n")
cat("Outputs: ",layers[length(layers)],"\n")
cat("Hidden Layers:", length(layers)-2,"\n")
cat(paste("Epoch :",i," Avg_error = ",avg_error,"\n"))
cat("Output Values:\n\n")
print(net_out[[length(net_out)]])
Sys.sleep(0.002)
##
if(avg_error <= error.threshold){
message("Optimum values found")
break
}
}
return(list(weights = weights,biases = biases,Net_out = net_out))
}
Neural.Net.Predict <- function(Model,Test.inp){
layer <- feedforward(inp = Test.inp,weights = Model$weights,biases = Model$biases)
return(layer[length(layer)])
}
#Input and Hyper parameters to Neural Network
layers <- c(3,7,3)
cntr_inp <- matrix(c(0,0,0,
0,0,1,
0,1,0,
0,1,1,
1,0,0,
1,0,1,
1,1,0,
1,1,1),byrow = T,nrow = 8,ncol = 3)
cntr_out <- matrix(c(0,0,1,
0,1,0,
0,1,1,
1,0,0,
1,0,1,
1,1,0,
1,1,1,
0,0,0),byrow = T,nrow = 8,ncol = 3)
Output <- Neural.Net(layers = layers,inp = cntr_inp,out = cntr_out,epoch = 100000,step.size = 0.8,error.threshold = 0.01)
###Predicts wrong when one input point is provided
# I don't understand why this is predicting wrong. Need help understanding here
Neural.Net.Predict(Output,matrix(c(1,0,0),ncol = 3,byrow = TRUE))
###Predicts right for all inputs
Neural.Net.Predict(Output,cntr_inp)