Тессеракт ocr многостраничный pdf зависает

Question

Тессеракт ocr многостраничный pdf зависает

Мы используем Java-библиотеку Tesseract под названием Tess4j для преобразования PDF-файлов в текстовые. Он прекрасно работает как с файлами Tiff, так и с одностраничными файлами PDF. Но в многостраничных PDF-файлах он генерирует выходной файл. Когда дело доходит до последней страницы, элемент управления, похоже, не возвращается к исходному приложению, которое вызвало вызов doOCR. Он просто остается / висит там, ничего не делая. Это проблема с родным вызовом, который не возвращается обратно. Я понятия не имею,

Пожалуйста, дайте мне знать, если есть решение этой проблемы, как можно скорее.

С уважением
Вишь

0

pdf ocr tesseract multipage

Источник

user291789 12 июл '11 в 06:10

1 ответ

Решение

Другие вопросы по тегам pdf ocr tesseract multipage

user754060 16 июл '11 в 02:15 2011-07-16 02:15 · Accepted Answer · 2011-07-16 02:15

Tess4J поддерживает многостраничный PDF и многостраничный TIFF. Замените свой файл PDF в тестовом модуле и попробуйте.

0

Источник

user754060 16 июл '11 в 02:15