Тессеракт ocr многостраничный pdf зависает

Мы используем Java-библиотеку Tesseract под названием Tess4j для преобразования PDF-файлов в текстовые. Он прекрасно работает как с файлами Tiff, так и с одностраничными файлами PDF. Но в многостраничных PDF-файлах он генерирует выходной файл. Когда дело доходит до последней страницы, элемент управления, похоже, не возвращается к исходному приложению, которое вызвало вызов doOCR. Он просто остается / висит там, ничего не делая. Это проблема с родным вызовом, который не возвращается обратно. Я понятия не имею,

Пожалуйста, дайте мне знать, если есть решение этой проблемы, как можно скорее.

С уважением
Вишь

1 ответ

Решение

Tess4J поддерживает многостраничный PDF и многостраничный TIFF. Замените свой файл PDF в тестовом модуле и попробуйте.

Другие вопросы по тегам