Как обучить модель с двумя детскими функциями для обнаружения объектов?

Question

Как обучить модель с двумя детскими функциями для обнаружения объектов?

Я пытаюсь реализовать модель, описанную профессором Эндрю Нг, для обнаружения объектов (объяснение начинается в 10:00).

Он описывает первый элемент выходного вектора как вероятность того, что объект был обнаружен, за которым следуют координаты ограничивающего прямоугольника сопоставляемого объекта (когда сопоставляется один). Последняя часть выходного вектора является софтмаксом всех классов, которые знает ваша модель.

Как он это объясняет, использование простой квадратичной ошибки для случая, когда обнаружение является нормальным, и только разность квадратов y^[0] - y[0], Я понимаю, что это наивный подход. Я просто хочу реализовать это для обучения.

Мои вопросы

Как мне реализовать эту условную потерю в тензорном потоке?
Как мне справиться с этим условным y^[0] при работе с партией.

0

tensorflow machine-learning conv-neural-network object-detection

Источник

user774907 29 июн '18 в 03:04

1 ответ

Другие вопросы по тегам tensorflow machine-learning conv-neural-network object-detection

user8143158 30 июн '18 в 03:04 2018-06-30 03:04 · Answer 1 · 2018-06-30 03:04

Как мне реализовать эту условную потерю в тензорном потоке?

Вы можете преобразовать функцию потерь в:

Error = mask[0]*(y^[0]-y[0])**2 + mask[1]*(y^[1]-y[1])**2 ... mask[n]*(y^[n]-y[n])**2),
where mask = [1, 1,...1] for y[0] = 1 and [1, 0, ...0] for y[0] = 0

Как мне справиться с этим условием о y^[0] при работе с пакетом.

Для партии вы можете создать маску на лету, как:

mask = tf.concat([tf.ones((tf.shape(y)[0],1)),y[:,0][...,None]*y[:,1:]], axis=1)

Код:

y_hat_n = np.array([[3, 3, 3, 3], [3,3,3,3]])
y_1 = np.array([[1, 1, 1, 1], [1,1,1,1]])
y_0 = np.array([[0, 1, 1, 1], [0,1,1,1]])


y = tf.placeholder(tf.float32,[None, 4])
y_hat = tf.placeholder(tf.float32,[None, 4])
mask = tf.concat([tf.ones((tf.shape(y)[0],1)),y[:,0][...,None]*y[:,1:]], axis=1)

error = tf.losses.mean_squared_error(mask*y, mask*y_hat)

with tf.Session() as sess:

   print(sess.run([mask,error], {y:y_0, y_hat:y_hat_n}))
   print(sess.run([mask,error], {y:y_1, y_hat:y_hat_n}))

# Mask and error
#[array([[1., 0., 0., 0.],
#   [1., 0., 0., 0.]], dtype=float32), 2.25]

#[array([[1., 1., 1., 1.],
#   [1., 1., 1., 1.]], dtype=float32), 4.0]