Преобразование файла PDF в один файл HTML
Я пытаюсь преобразовать документ PDF в один файл HTML в Java. Большинство онлайн-конвертеров конвертирует один PDF-файл в несколько HTML-файлов. Я хочу конвертировать весь PDF в один файл HTML.
Какие-либо предложения?
3 ответа
Какие-либо предложения?
Вы всегда можете написать некоторый код, используя API JSoup, чтобы написать один документ, который включает body
каждого из нескольких файлов HTML. Объединение стилей и таблиц стилей (CSS) может быть немного сложнее (особенно если в оригинальном HTML используются элементы 'id').
Хотя мне трудно поверить, что нет конвертера, в котором "отдельный документ" является опцией. Я рекомендую искать дальше.
Вы смотрели на http://www.jpedal.org/html_index.php где есть возможность записи в один файл.
Я думаю, что должно быть возможно проанализировать ваш документ PDF с itext, а затем сгенерировать ваш HTML-файл. Я должен признать, что я еще не проверил, выполнимо ли это.