Возникли проблемы при просмотре экрана PDF путем преобразования в HTML - с помощью ITPilot в Denodo
В ITPilot после записи последовательности мне нужно отсканировать документ PDF. Я могу конвертировать PDF в HTML, и полученный HTML не полностью отформатирован. Это приводит к тому, что экстрактор не получает поля точно так, как необходимо. Может ли кто-то помочь в преобразовании PDF в Acrobat HTML, где я сталкиваюсь с проблемой (или), чтобы помочь мне отсканировать неформатированный HTML в представлении браузера.
1 ответ
Для использования функции CONVERTPDFTOHTML с Adobe Acrobat должна быть установлена профессиональная версия: "ACR_HTML: настраивает команду для использования преобразователя HTML программного обеспечения Adobe Acrobat Professional (этот продукт должен быть установлен)".
Что касается проблемы с PDFBox, возможно, вы испытываете общую проблему, связанную с увеличенными страницами при назначении примеров, как описано здесь