Распознавание текста + OMR
Я работаю над приложением среднего масштаба с рядом функций. Я сделал большинство частей уже. Я только что оставил часть распознавания текста + OMR для системы посещаемости. Может ли кто-нибудь дать мне какое-то руководство (документацию или учебник, которому я могу следовать) по технологии Android Text Recognition + OMR (совместная работа) и по шагам для реализации моей функции? Я буду вечно благодарен вам за эту помощь.
У меня есть ряд функций, не связанных с этой, поэтому я не хотел публиковать их. Что мне нужно сделать, так это то, что после того, как я сфотографировал лист посещаемости (с маркером, номером броска и пузырем), мое приложение должно соответствовать "Нет" с "БД Firebase". Затем, если пузырек заполнен, он должен вставить значение "Present" (Firebase), а если пузырек не заполнен, он вставит "Absent" в поле Attendance определенного номера броска в базе данных.
2 ответа
¿У изображения всегда одно и то же измерение и ответы тоже в одинаковом положении?
Если ответ положительный, вы можете обрезать каждый ответ, а затем разделить столбцы Roll no и Attendance на два отдельных изображения.
Вы можете использовать OpenCV, чтобы сделать это: Как обрезать изображение в OpenCV, используя Python
Затем вы можете использовать OCR с Roll no. image (например, Tesseract) и с помощью круга вы можете видеть, является ли центральный пиксель круга черным или белым.
Поскольку вы не упомянули, что распознавание текста должно выполняться внутри кода приложения, вы можете использовать AWS Rekognition со своим приложением для Android. Вот несколько ссылок, с которых можно начать:
Ваш рабочий процесс будет выглядеть так:
- Сфотографируйте из приложения.
- Загрузить его на S3.
- Загрузка на S3 активирует лямбда-функцию AWS.
- Вы будете реализовывать свою логику OCR в лямбда-функции в Java.
- Вы можете использовать DynamoDB, чтобы сохранить ваши результаты или что-нибудь еще.
- Отправьте на устройство уведомление с результатами.