Любые инструменты Python для чтения данных в стиле Scantron

Я заинтересован в проведении некоторых опросов по почте, но я ищу быстрые способы оцифровки опросов, которые они отправляют обратно.

Так что, если бы у меня был вопрос и 5 полей под ним, где вы могли бы указать свое мнение, поставив галочку в соответствующем поле, существует ли что-нибудь, где я мог бы отсканировать его и запустить через программное обеспечение, которое выплевывает ответы.

Изменить разъяснение:

Я спрашиваю о том, что мне нужно сделать после того, как бумага была оцифрована. Я хочу написать некоторый код, который просматривает файл изображения и распознает, какое поле было отмечено, и выдает представление ответов респондентов.

Я бы посмотрел на страницу, отсканированную с настольного сканера или что-то подобное.

3 ответа

Решение

Из того, что я вижу, вам на самом деле не нужен ICR (интеллектуальное распознавание символов, используемое для рукописных и рукописных текстов), но вам нужен OMR - оптическое распознавание меток (сбор данных, отмеченных человеком, из форм документов, таких как опросы и тесты).

Плохая новость в том, что вы вряд ли найдете библиотеку с открытым исходным кодом для python. Но есть решение - вы можете использовать облачный SDK, это веб-сайт, который позволяет загружать изображения и отправлять вам данные OCR. Попробуйте http://www.ocrsdk.com/, это облачный OCR SDK, недавно выпущенный ABBYY. Сейчас он находится в закрытой бета-версии, поэтому он полностью бесплатен.

Он имеет методы API ICR и OMR, а также набор примеров кода Python.

Я не очень понимаю, как это связано с питоном, если, конечно, вы уже оцифровали результаты и теперь хотите подвести итоги. Похоже, вам все еще нужно сканировать результаты, и, насколько я знаю, у python нет никаких прямых возможностей сделать что-то подобное. Сначала вам понадобятся сканеры, и только потом вы сможете использовать python для чтения данных.

Проект SDAPS ( репо) может стоить посмотреть. Он может не обрабатывать произвольные отсканированные изображения, так как он ожидает документ ODT или LaTeX в начале процесса.

обзор

SDAPS - это программа оптического распознавания (OMR) с открытым исходным кодом (GPLv3, LPPL). Он написан на python и имеет интегрированный рабочий процесс с LibreOffice и LaTeX для создания анкет.

Workflow

введите описание изображения здесь С SDAPS вы создаете анкету, используя либо LibreOffice, либо LaTeX. После этого выполняется некоторая обработка для сбора информации об опросе (вопросы и ответы) и создается печатный PDF-файл. Заполненные анкеты нужно только отсканировать (пример). SDAPS выполнит распознавание оптической метки и может создать отчет в формате PDF (пример) или экспортировать данные. При желании можно вручную исправить результаты, используя графический интерфейс пользователя.

Другие вопросы по тегам