Распознавание текста + OMR

Question

Распознавание текста + OMR

Я работаю над приложением среднего масштаба с рядом функций. Я сделал большинство частей уже. Я только что оставил часть распознавания текста + OMR для системы посещаемости. Может ли кто-нибудь дать мне какое-то руководство (документацию или учебник, которому я могу следовать) по технологии Android Text Recognition + OMR (совместная работа) и по шагам для реализации моей функции? Я буду вечно благодарен вам за эту помощь.

У меня есть ряд функций, не связанных с этой, поэтому я не хотел публиковать их. Что мне нужно сделать, так это то, что после того, как я сфотографировал лист посещаемости (с маркером, номером броска и пузырем), мое приложение должно соответствовать "Нет" с "БД Firebase". Затем, если пузырек заполнен, он должен вставить значение "Present" (Firebase), а если пузырек не заполнен, он вставит "Absent" в поле Attendance определенного номера броска в базе данных.

0

java android opencv4android text-recognition omr

Источник

09 авг '18 в 18:10

2 ответа

Другие вопросы по тегам java android opencv4android text-recognition omr

user4036636 09 авг '18 в 19:32 2018-08-09 19:32 · Answer 1 · 2018-08-09 19:32

¿У изображения всегда одно и то же измерение и ответы тоже в одинаковом положении?

Если ответ положительный, вы можете обрезать каждый ответ, а затем разделить столбцы Roll no и Attendance на два отдельных изображения.

Вы можете использовать OpenCV, чтобы сделать это: Как обрезать изображение в OpenCV, используя Python

Затем вы можете использовать OCR с Roll no. image (например, Tesseract) и с помощью круга вы можете видеть, является ли центральный пиксель круга черным или белым.

user1140783 09 авг '18 в 19:49 2018-08-09 19:49 · Answer 2 · 2018-08-09 19:49

Поскольку вы не упомянули, что распознавание текста должно выполняться внутри кода приложения, вы можете использовать AWS Rekognition со своим приложением для Android. Вот несколько ссылок, с которых можно начать:

Ваш рабочий процесс будет выглядеть так:

Сфотографируйте из приложения.
Загрузить его на S3.
Загрузка на S3 активирует лямбда-функцию AWS.
Вы будете реализовывать свою логику OCR в лямбда-функции в Java.
Вы можете использовать DynamoDB, чтобы сохранить ваши результаты или что-нибудь еще.
Отправьте на устройство уведомление с результатами.