Простая нейронная прямая XOR-функция Python
Я реализовал эту простую модель для изучения нейронных сетей, она хорошо тренируется и дает результат, который был дан изначально.
Вот тут я и теряюсь, на примере распознавания функции XOR я хотел бы просто иметь возможность протестировать, а не обучать. Кажется, что все чтения онлайн - все об обучении и затем останавливаются прямо там.
Означает ли это, что для каждого нового ввода модель должна пересчитывать и обучать весь набор? Есть что-нибудь общее с весами? Как бы вы поступили с тем, чтобы модель работала "вживую" и получала новый вклад в качестве части своей обратной связи в реальном времени, а также в рамках своего текущего периодического обучения?
Спасибо
import numpy as np
def nonlin(x, deriv=False):
if(deriv==True):
return x*(1-x)
return 1/(1+np.exp(-x))
#4x2
x = np.array([[0,0],[0,1],[1,0],[1,1]])
print (x)
#1x4
y = np.array([[0],[1],[1],[0]])
np.random.seed(1)
syn0 = 2*np.random.random((2,4))-1
print (syn0)
syn1 = 2*np.random.random((4,1))-1
for j in range(60000):
l0 = x;
l1 = nonlin(np.dot(l0,syn0))
l2 = nonlin(np.dot(l1,syn1))
l2_error = y - l2
l2_delta = l2_error*nonlin(l2, deriv=True)
l1_error = l2_delta.dot(syn1.T)
l1_delta = l1_error * nonlin(l1,deriv=True)
syn1 += l1.T.dot(l2_delta)
syn0 += l0.T.dot(l1_delta)
if(j % 10000) ==0:
print ("Error:" + str(np.mean(np.abs(l2_error))))
print ("Output after training")
print (syn0)
print (syn1)
print (l2)
1 ответ
Вам просто нужно выделить код, который фактически выполняет вычисления нейронной сети, вот ваш код, исправленный таким образом:
import numpy as np
def nonlin(x, deriv=False):
if(deriv==True):
return x*(1-x)
return 1/(1+np.exp(-x))
#4x2
x = np.array([[0,0],[0,1],[1,0],[1,1]])
print ("x=",x)
#1x4
y = np.array([[0],[1],[1],[0]])
print ("y=",y)
np.random.seed(1)
syn0 = 2*np.random.random((2,4))-1
print (syn0)
syn1 = 2*np.random.random((4,1))-1
def NN(x):
l0 = x;
l1 = nonlin(np.dot(l0,syn0))
l2 = nonlin(np.dot(l1,syn1))
return (l0,l1,l2)
for j in range(60000):
l0,l1,l2 = NN(x)
l2_error = y - l2
l2_delta = l2_error*nonlin(l2, deriv=True)
l1_error = l2_delta.dot(syn1.T)
l1_delta = l1_error * nonlin(l1,deriv=True)
syn1 += l1.T.dot(l2_delta)
syn0 += l0.T.dot(l1_delta)
if(j % 10000) ==0:
print ("Error:" + str(np.mean(np.abs(l2_error))))
print ("Output after training")
print ("trained l0 weights:",syn0)
print ("trained l1 weights:",syn1)
l0,l1,l2 = NN(x)
print ("NN(",x,") == ",l2)
Здесь NN(x) - функция, которая выполняет расчет нейронной сети. Он возвращает входной вектор, скрытый слой и значения выходного слоя в кортеже. Вы можете написать отдельную функцию для более чистого интерфейса:
def NNout(x,syn0,syn1):
l0 = x;
l1 = nonlin(np.dot(l0,syn0))
l2 = nonlin(np.dot(l1,syn1))
return l2