Описание тега pdf2htmlex

Описание тега Вопросы с тегом

NonePdf2htmlEX отображает файлы PDF в формате HTML с использованием современных веб-технологий. Он нацелен на обеспечение точного рендеринга, при этом оптимизированный для отображения в Интернете.

1 ответ

cmake жалуется на отсутствие поддержки C++0x компилятора, несмотря на то, что установлена последняя версия clang

Я пытаюсь использовать cmake для сборки pdf2htmlEX Это сообщение об ошибке: CMake Error at CMakeLists.txt:108 (message): Error: your compiler does not support C++0x, please update it Вот номер версии компилятора clang $ which clang /usr/bin/clang $ …

29 сен '14 в 00:57

2 ответа

pdf2htmlEX не может открыть или прочитать файл

Я установил докер и запустил через него pdf2htmlEX alias pdf2htmlEX="docker run -ti --rm -v ~/pdf:/pdf bwits/pdf2htmlex pdf2htmlEX" pdf2htmlEX -h pdf2htmlEX --zoom 1.3 test.pdf Это мой путь и PDF внутри: ~/Desktop/pdf$ ls test.pdf testpdf.pdf При вы…

docker pdf-generation pdf-to-html pdf2htmlex

08 июл '16 в 15:45

1 ответ

Запуск pdf2htmlEX на Heroku

Я пытаюсь запустить pdf2htmlEX на Heroku. Сначала я подумал о компиляции pdf2htmlEX на виртуальной машине с тем же стеком, что и у Heroku, а затем о включении двоичного файла в репозиторий git. Это не сработало (я продолжал получать проблемы с завис…

ruby-on-rails ruby heroku apt-get pdf2htmlex

16 дек '15 в 23:33

0 ответов

Не найдено подходящего распределения для pdf2htmlEX

Я не могу pdf2htmlEX. Он используется для преобразования PDF в HTML. Я попытался установить как в виртуальных средах Python 2.7 и Python 3.5. Вот ошибка Collecting pdf2htmlEX Could not find a version that satisfies the requirement pdf2htmlEX (from v…

python python-3.x python-2.7 pdf2htmlex

04 апр '18 в 09:45

0 ответов

Запуск Pdf2htmlEX на Linux с помощью PHP

Пожалуйста, я прошу вашей помощи по следующей проблеме: я использую pdf2htmlEX для преобразования моих PDF-файлов в HTML. Инструмент отлично работает в WAMP; однако, когда я внедряю его на свой сервер Linux, инструмент не работает. Мой php код: <…

php linux exec pdf2htmlex

03 май '18 в 08:02

1 ответ

Замените слово, даже если оно содержит пустые теги HTML между ними, что разбивает его

Так что это довольно странный вопрос, я это знаю. Я использую инструмент под названием pdf2htmlEX, который преобразует PDF в HTML. Пока что результаты были чертовски впечатляющими. Я все еще видел одну ошибку во всех PDF-файлах, которые я конвертиро…

c# pdf2htmlex

05 апр '18 в 10:55

0 ответов

Установите pdf2htmlEX на геройку

Я использовал этот Aptfile: fonts-liberation libreoffice-base-core libreoffice-calc libreoffice-writer libreoffice libpython2.7 pdf2htmlex poppler-utils И установка успешно завершена. Я даже проверил версию pdf2htmlEX в heroku bash. pdf2htmlEX --ver…

ruby-on-rails heroku pdf2htmlex

15 окт '18 в 18:39

1 ответ

pdf2HtmlEX - текст на html отличается от исходного pdf

Я использую для pdf2htmlEX для того, чтобы конвертировать PDF файлы в HTML. Я также извлекаю текст из файла впоследствии. Эта проблема: Я столкнулся с файлом, что текст в преобразованном html не читается: https://dspace.mit.edu/openaccess-disseminat…

poppler fontforge pdf2htmlex

06 сен '18 в 07:54

0 ответов

pdf2htmlEX проблема выбора текста

Я преобразовал PDF в HTML, используя pdf2htmlEX. При выборе более одной строки, когда курсор перемещается между двумя строками, выбор переходит вверх. Кто-нибудь, пожалуйста, помогите исправить это. Проблема уже поднята здесь https://github.com/cool…

pdf2htmlex

22 сен '16 в 06:50

1 ответ

Смещение шрифта во время преобразования PDF в HTML с помощью инструмента pdf2htmlEx

ПРОБЛЕМЫ С ПЕРЕДАЧЕЙ PDF В HTML Все символы "ti","fi","tt" отсутствуют Образец скриншота Проблема с перекрытием шрифтов Образец скриншота ПРИМЕЧАНИЕ: я не получаю эту проблему с Firefox. Получение вышеуказанных проблем в Chrome в браузере Safari Я И…

html css google-chrome safari pdf2htmlex

26 апр '16 в 14:44

1 ответ

Pdf2htmlEx: Размер HTML, преобразованный в pdf, очень большой?

Теперь я конвертирую PDF в HTML через pdf2htmlEx, Исходный файл pdf 21MB, конвертированный html почти 900MB, команда преобразования: pdf2htmlEX --no-drm 0 --embed-image 1 --dest-dir ./output09 ./b.pdf ./b.html Есть ли способ улучшить размер вывода H…

pdf2htmlex

13 сен '17 в 06:03

1 ответ

Преобразование нескольких файлов с использованием pdf2htmlEX

Как вы используете pdf2htmlEX для нескольких файлов или для папки, содержащей файлы pdf? Я могу нормально конвертировать отдельные файлы, но, очевидно, я не хочу запускать команду 100 раз для 100 файлов. Я не смог найти ничего в документации, и что-…

html pdf pdf-to-html pdf2htmlex

05 авг '16 в 00:33

1 ответ

Вывод pdf2htmlEX показывает шрифт Times New Roman только для нескольких символов?

Я никогда не видел ничего подобного. Я использую инструмент под названием pdf2htmlEX, который конвертирует PDF в HTML, но у меня странная проблема. Посмотрите на этот скриншот: Смотрите первый символ (W)? Это в Times New Roman. Теперь вот еще более …

fonts pdf2htmlex

05 апр '18 в 11:18

1 ответ

Разделить PDF на несколько файлов HTML с pdf2htmlEX

Я пытаюсь разбить файл PDF на отдельные файлы HTML. Я имею в виду, что для каждой страницы PDF я хочу файл HTML. Вот как я это делаю: pdf2htmlEX --split-pages 1 LMS.pdf --page-filename lms%03.html В результате я получил пустой LMS.html и другие файл…

html pdf pdf2htmlex

14 окт '14 в 12:25

0 ответов

Извлечь данные из PDF

Пожалуйста, не отмечайте как дубликат. Я уже перебрал множество ссылок на Stackru, но они не решили мою проблему. Что я пытаюсь сделать: мне нужно извлечь данные из примерно 1,50000 PDF-файлов. Пример pdf: все эти pdf идентичны по структуре и содерж…

node.js pdf text-extraction pdf2htmlex

26 мар '16 в 09:52

0 ответов

Преобразование PDF в HTML в Python

Python 2.6 Я пытаюсь разобрать мои PDF-файлы и один из способов сделать это - преобразовать его в HTML и извлечь заголовки вместе с их абзацами. Итак, я попробовал pdf2htmlEX, и он преобразовал мой pdf в html, не нарушая мой формат pdf... Пока что я…

python html parsing pdf pdf2htmlex

21 дек '16 в 13:57

2 ответа

Получение местоположения текста из PDF

Я хочу знать расположение всех слов на странице PDF. Я пытался найти что-то в Интернете, но не смог. Кто-нибудь может мне помочь, какую библиотеку (желательно на платформе Java) я должен использовать?

pdf itext pdfbox pdf2htmlex

08 дек '15 в 11:01

1 ответ

Pdf2htmlEx: HTML содержит изображения, как я могу получить вместо графики графику вместо изображений?

Я попробовал каждую команду, найденную в документации, как я могу получить только текстовую часть в качестве вывода, а не на всех изображениях? https://github.com/coolwanglu/pdf2htmlEX/wiki/Command-Line-Options.

pdf2htmlex

25 окт '18 в 07:20

1 ответ

Pdf2Html Установка

Я пытаюсь установить программное обеспечение Pdf2HtmlEx на Ubuntu Server 18.04.1 LTS. Репозиторий не поддерживается, но программа очень полезна для меня. Я установил его на настольный дистрибутив Xubuntu и на образ докера, но я не могу сделать это н…

installation pdf2htmlex

05 ноя '18 в 20:35

0 ответов

Извлечь весь контент из файла PDF (не только текст, но и таблицы / диаграммы)?

Я хотел бы переформатировать основной контент PDF, поэтому мне нужно извлечь его основной контент, не только текст, но также таблицы, диаграммы и т. Д. С информацией об их макете. Меня интересует только основная часть контента, например, для техниче…

javascript pdf clojure pdf.js pdf2htmlex

05 авг '15 в 15:26