Как я могу реализовать OCR на веб-сайте, используя PHP?

Существуют ли какие-либо бесплатные библиотеки OCR, которые работают с PHP или Python на сервере Linux? Идея состоит в том, чтобы иметь возможность загружать изображение и извлекать из него символы или разрешать пользователям "рисовать символы" и анализировать их из указанного изображения.

2 ответа

Решение

Поскольку вы работаете с Linux, я очень рекомендую ocropus с открытым исходным кодом от Google.

Это не PHP, но я думаю, что это будет вашим лучшим вариантом. Конечно, вы можете позвонить изнутри PHP через exec, Он зрелый и имеет много вариантов. С сайта проекта:

Механизм OCRopus основан на двух исследовательских проектах: высокопроизводительном распознавателе рукописного ввода, разработанном в середине 90-х годов и развернутом Бюро переписи населения США, и новых высокопроизводительных методах анализа макетов.

Есть также еще один проект с открытым исходным кодом, tesseract. Я использовал это и в прошлом, и был доволен результатами. Включает в себя обучение, ограничение вашего алфавита и т. Д.

Вы видели phpOCR уроки Андрея Кучеренко? http://www.phpclasses.org/package/2874-PHP-Recognize-text-objects-in-graphical-images.html Это старая статья, но она может вам помочь.

Другие вопросы по тегам