Искусственная нейронная сеть, обученная с изображением

Я заинтересован в создании программного обеспечения, которое обнаруживает объект, такой как ручка, с помощью Microsoft Kinect. Я вспоминаю 100 позитивных изображений и 200 негативных изображений, чтобы сделать их искусственной нейронной сетью. Мой вопрос: как я могу преобразовать эти изображения в качестве входного сигнала ANN? Я предполагаю, что последний слой имеет один нейрон, потому что один выход - перо или нет, и я предполагаю, что вход тоже один, я хочу использовать 3 слоя в общей сложности. Но я не знаю, нужно ли преобразовывать положительные и отрицательные изображения в матрицу или что я могу сделать?

1 ответ

Решение

Прежде всего, добро пожаловать в Stackru!

Я никогда лично не имел дело с использованием Kinect для распознавания изображений, но если это возможно, вы должны уменьшить изображение до довольно разумного размера, такого как 100x100 так что это все еще управляемо.

Вы также должны попытаться преобразовать изображение в grayscale поскольку это также поможет с вычислительной эффективностью, временем разработки, и это намного легче начать с чем RGB.

Входной слой не будет 1, это дано. Если мы имеем в виду изображение с размерами 100x100, общее количество входов должно быть 10000по одному на каждый пиксель. Помните, что вы пытаетесь разбить данные как можно более детально, чтобы ANN мог обнаруживать закономерности в данных.

Выходной слой на самом деле должен иметь 2 neuronsи по уважительной причине. Помните, что каждый выходной нейрон измеряет вероятность того, что вход принадлежит этому соответствующему классу. Имея 2 нейрона, каждый из них может представлять положительный класс (да, это ручка) или отрицательный класс (нет, это не ручка). Таким образом, имея 2 нейрона, вы можете получить вероятности того, что изображение будет принадлежать этому классу, а затем вы можете выбрать самое высокое значение в качестве ответа.

3 Всего слоев должно быть достаточно, вам, вероятно, никогда не понадобится больше. Есть несколько очень хороших статей для определения количества слоев, например, этот, я надеюсь, это поможет! Дайте мне знать, если у вас есть дополнительные вопросы.

Другие вопросы по тегам