Распознавание арабского номера

Я пытаюсь определить арабские цифры (арабский - индикатор) по изображению.

Попробовал оптическое распознавание текста в Тессеракте, у меня это не сработало (распознает арабские слова, но не цифры). Вот изображение, которое я хотел бы извлечь из него номер страницы (вверху страницы)

Я попробовал imagemagick сравнить это изображение с небольшими, уже сделанными маленькими изображениями, которые содержат все возможности номеров книг, но это также не сработало, и я думаю, что это займет так много времени.

каким будет практическое несложное решение? PS: изображение будет с телефонов Android и будет проанализировано на сервере Windows или Linux.

1 ответ

На самом деле, Tesseract не является верным решением вашей проблемы или коммерческого распознавания текста на арабском языке. Вам необходимо иметь специальное решение для распознавания текста, которое вы можете обучать на своих образцах и указывать свои специальные правила обработки.

Вы по-прежнему можете использовать Tesseract, но в форме его исходного кода и инструментов обучения, чтобы самостоятельно создать собственное решение. Чтобы настроить Tesseract для арабского, вы можете найти эту ссылку полезной arabicocr.wordpress.com

Другие вопросы по тегам