Tensorflow CNN Классификация изображений небольшой набор данных для определения четкого изображения

сценарий

Пользователь откроет камеру (из моего приложения для Android), наведет ее на свой идентификатор, и модель определит, какой тип идентификатора мы ищем.

Что я пробовал

Я пробовал сравнивать изображения как гистограмму, но это не просто так точно, а SSIM (структурное сходство), но оно не соответствует моему сценарию. SSIM работает, если изображение имеет одинаковый размер пикселя / матрицы. (из того, что я пробовал и наблюдал лол). Я использую openCV для этого.

Обнаружение объекта кажется излишним (или нет?), Потому что я хочу, чтобы моя модель распознала четкое изображение.

Что я пытаюсь сделать

Я пытаюсь создать классификацию изображений по одному классу, в которой моя модель должна идентифицировать конкретный тип идентификатора (например, паспорт).

После того, как я искал одну классификацию классов (OCC), предложения создаются как автоэнкодер на основе cnn. Но кажется, что не хватает ресурсов или учебных пособий для создания простого.

Итак, я думаю о том, чтобы иметь как минимум 10 четких изображений разных деталей одного и того же идентификатора, и это будет мой CLEAR_ID_CLASS.

Затем я увеличу те же 10 четких изображений (наклон, поворот, уменьшение, увеличение и т. Д.), И я отмечу это как NOT_CLEAR_ID_CLASS.

Вопрос

10 изображений - это всего лишь небольшой набор данных для нейронных сетей, я точно не знаю, что произойдет с моей моделью, если она перегрузится. Мой вопрос будет ли это работать? Я смотрю в правильном направлении, чтобы достичь своей цели? Или есть способ достичь моей цели?

Я спрашиваю, потому что это может занять некоторое время (обучение модели), и я не хочу тратить время, просто чтобы знать, что это не сработает.

0 ответов