Tensorflow CNN Классификация изображений небольшой набор данных для определения четкого изображения
сценарий
Пользователь откроет камеру (из моего приложения для Android), наведет ее на свой идентификатор, и модель определит, какой тип идентификатора мы ищем.
Что я пробовал
Я пробовал сравнивать изображения как гистограмму, но это не просто так точно, а SSIM (структурное сходство), но оно не соответствует моему сценарию. SSIM работает, если изображение имеет одинаковый размер пикселя / матрицы. (из того, что я пробовал и наблюдал лол). Я использую openCV для этого.
Обнаружение объекта кажется излишним (или нет?), Потому что я хочу, чтобы моя модель распознала четкое изображение.
Что я пытаюсь сделать
Я пытаюсь создать классификацию изображений по одному классу, в которой моя модель должна идентифицировать конкретный тип идентификатора (например, паспорт).
После того, как я искал одну классификацию классов (OCC), предложения создаются как автоэнкодер на основе cnn. Но кажется, что не хватает ресурсов или учебных пособий для создания простого.
Итак, я думаю о том, чтобы иметь как минимум 10 четких изображений разных деталей одного и того же идентификатора, и это будет мой CLEAR_ID_CLASS.
Затем я увеличу те же 10 четких изображений (наклон, поворот, уменьшение, увеличение и т. Д.), И я отмечу это как NOT_CLEAR_ID_CLASS.
Вопрос
10 изображений - это всего лишь небольшой набор данных для нейронных сетей, я точно не знаю, что произойдет с моей моделью, если она перегрузится. Мой вопрос будет ли это работать? Я смотрю в правильном направлении, чтобы достичь своей цели? Или есть способ достичь моей цели?
Я спрашиваю, потому что это может занять некоторое время (обучение модели), и я не хочу тратить время, просто чтобы знать, что это не сработает.