Простая нейронная прямая XOR-функция Python

Я реализовал эту простую модель для изучения нейронных сетей, она хорошо тренируется и дает результат, который был дан изначально.

Вот тут я и теряюсь, на примере распознавания функции XOR я хотел бы просто иметь возможность протестировать, а не обучать. Кажется, что все чтения онлайн - все об обучении и затем останавливаются прямо там.

Означает ли это, что для каждого нового ввода модель должна пересчитывать и обучать весь набор? Есть что-нибудь общее с весами? Как бы вы поступили с тем, чтобы модель работала "вживую" и получала новый вклад в качестве части своей обратной связи в реальном времени, а также в рамках своего текущего периодического обучения?

Спасибо

import numpy as np

def nonlin(x, deriv=False):
   if(deriv==True):
       return x*(1-x)

   return 1/(1+np.exp(-x))

#4x2
x = np.array([[0,0],[0,1],[1,0],[1,1]])
print (x)

#1x4
y = np.array([[0],[1],[1],[0]])

np.random.seed(1)

syn0 = 2*np.random.random((2,4))-1
print (syn0)

syn1 = 2*np.random.random((4,1))-1

for j in range(60000):

    l0 = x;
    l1 = nonlin(np.dot(l0,syn0))
    l2 = nonlin(np.dot(l1,syn1))

    l2_error = y - l2

    l2_delta = l2_error*nonlin(l2, deriv=True)

    l1_error = l2_delta.dot(syn1.T)

    l1_delta = l1_error * nonlin(l1,deriv=True)

    syn1 += l1.T.dot(l2_delta)
    syn0 += l0.T.dot(l1_delta)

    if(j % 10000) ==0:
       print ("Error:" + str(np.mean(np.abs(l2_error))))

print ("Output after training")
print (syn0)
print (syn1)
print (l2)

1 ответ

Решение

Вам просто нужно выделить код, который фактически выполняет вычисления нейронной сети, вот ваш код, исправленный таким образом:

import numpy as np

def nonlin(x, deriv=False):
   if(deriv==True):
       return x*(1-x)

   return 1/(1+np.exp(-x))


#4x2
x = np.array([[0,0],[0,1],[1,0],[1,1]])
print ("x=",x)

#1x4
y = np.array([[0],[1],[1],[0]])
print ("y=",y)

np.random.seed(1)

syn0 = 2*np.random.random((2,4))-1
print (syn0)

syn1 = 2*np.random.random((4,1))-1

def NN(x):
    l0 = x;
    l1 = nonlin(np.dot(l0,syn0))
    l2 = nonlin(np.dot(l1,syn1))
    return (l0,l1,l2)

for j in range(60000):

    l0,l1,l2 = NN(x)

    l2_error = y - l2

    l2_delta = l2_error*nonlin(l2, deriv=True)

    l1_error = l2_delta.dot(syn1.T)

    l1_delta = l1_error * nonlin(l1,deriv=True)

    syn1 += l1.T.dot(l2_delta)
    syn0 += l0.T.dot(l1_delta)

    if(j % 10000) ==0:
       print ("Error:" + str(np.mean(np.abs(l2_error))))

print ("Output after training")
print ("trained l0 weights:",syn0)
print ("trained l1 weights:",syn1)
l0,l1,l2 = NN(x)
print ("NN(",x,") == ",l2)

Здесь NN(x) - функция, которая выполняет расчет нейронной сети. Он возвращает входной вектор, скрытый слой и значения выходного слоя в кортеже. Вы можете написать отдельную функцию для более чистого интерфейса:

def NNout(x,syn0,syn1):
    l0 = x;
    l1 = nonlin(np.dot(l0,syn0))
    l2 = nonlin(np.dot(l1,syn1))
    return l2
Другие вопросы по тегам