У меня есть tesseract-ocr и hadoop отдельно. Мне нужно их интегрировать

По моему проекту обработки изображений. Мне нужно, чтобы интегрировать Hadoop (параллельный процессор) с Tesseract (обработка изображений в TXT).

1 ответ

Вы можете найти OSSOCR полезным. Он содержит модуль python-tesseract для обработки распознавания текста. Вы можете использовать это с потоковым Hadoop.

Другие вопросы по тегам