У меня есть tesseract-ocr и hadoop отдельно. Мне нужно их интегрировать
По моему проекту обработки изображений. Мне нужно, чтобы интегрировать Hadoop (параллельный процессор) с Tesseract (обработка изображений в TXT).
1 ответ
Вы можете найти OSSOCR полезным. Он содержит модуль python-tesseract для обработки распознавания текста. Вы можете использовать это с потоковым Hadoop.