Описание тега pdf2htmlex
NonePdf2htmlEX отображает файлы PDF в формате HTML с использованием современных веб-технологий. Он нацелен на обеспечение точного рендеринга, при этом оптимизированный для отображения в Интернете.
1
ответ
cmake жалуется на отсутствие поддержки C++0x компилятора, несмотря на то, что установлена последняя версия clang
Я пытаюсь использовать cmake для сборки pdf2htmlEX Это сообщение об ошибке: CMake Error at CMakeLists.txt:108 (message): Error: your compiler does not support C++0x, please update it Вот номер версии компилятора clang $ which clang /usr/bin/clang $ …
29 сен '14 в 00:57
2
ответа
pdf2htmlEX не может открыть или прочитать файл
Я установил докер и запустил через него pdf2htmlEX alias pdf2htmlEX="docker run -ti --rm -v ~/pdf:/pdf bwits/pdf2htmlex pdf2htmlEX" pdf2htmlEX -h pdf2htmlEX --zoom 1.3 test.pdf Это мой путь и PDF внутри: ~/Desktop/pdf$ ls test.pdf testpdf.pdf При вы…
08 июл '16 в 15:45
1
ответ
Запуск pdf2htmlEX на Heroku
Я пытаюсь запустить pdf2htmlEX на Heroku. Сначала я подумал о компиляции pdf2htmlEX на виртуальной машине с тем же стеком, что и у Heroku, а затем о включении двоичного файла в репозиторий git. Это не сработало (я продолжал получать проблемы с завис…
16 дек '15 в 23:33
0
ответов
Не найдено подходящего распределения для pdf2htmlEX
Я не могу pdf2htmlEX. Он используется для преобразования PDF в HTML. Я попытался установить как в виртуальных средах Python 2.7 и Python 3.5. Вот ошибка Collecting pdf2htmlEX Could not find a version that satisfies the requirement pdf2htmlEX (from v…
04 апр '18 в 09:45
0
ответов
Запуск Pdf2htmlEX на Linux с помощью PHP
Пожалуйста, я прошу вашей помощи по следующей проблеме: я использую pdf2htmlEX для преобразования моих PDF-файлов в HTML. Инструмент отлично работает в WAMP; однако, когда я внедряю его на свой сервер Linux, инструмент не работает. Мой php код: <…
03 май '18 в 08:02
1
ответ
Замените слово, даже если оно содержит пустые теги HTML между ними, что разбивает его
Так что это довольно странный вопрос, я это знаю. Я использую инструмент под названием pdf2htmlEX, который преобразует PDF в HTML. Пока что результаты были чертовски впечатляющими. Я все еще видел одну ошибку во всех PDF-файлах, которые я конвертиро…
05 апр '18 в 10:55
0
ответов
Установите pdf2htmlEX на геройку
Я использовал этот Aptfile: fonts-liberation libreoffice-base-core libreoffice-calc libreoffice-writer libreoffice libpython2.7 pdf2htmlex poppler-utils И установка успешно завершена. Я даже проверил версию pdf2htmlEX в heroku bash. pdf2htmlEX --ver…
15 окт '18 в 18:39
1
ответ
pdf2HtmlEX - текст на html отличается от исходного pdf
Я использую для pdf2htmlEX для того, чтобы конвертировать PDF файлы в HTML. Я также извлекаю текст из файла впоследствии. Эта проблема: Я столкнулся с файлом, что текст в преобразованном html не читается: https://dspace.mit.edu/openaccess-disseminat…
06 сен '18 в 07:54
0
ответов
pdf2htmlEX проблема выбора текста
Я преобразовал PDF в HTML, используя pdf2htmlEX. При выборе более одной строки, когда курсор перемещается между двумя строками, выбор переходит вверх. Кто-нибудь, пожалуйста, помогите исправить это. Проблема уже поднята здесь https://github.com/cool…
22 сен '16 в 06:50
1
ответ
Смещение шрифта во время преобразования PDF в HTML с помощью инструмента pdf2htmlEx
ПРОБЛЕМЫ С ПЕРЕДАЧЕЙ PDF В HTML Все символы "ti","fi","tt" отсутствуют Образец скриншота Проблема с перекрытием шрифтов Образец скриншота ПРИМЕЧАНИЕ: я не получаю эту проблему с Firefox. Получение вышеуказанных проблем в Chrome в браузере Safari Я И…
26 апр '16 в 14:44
1
ответ
Pdf2htmlEx: Размер HTML, преобразованный в pdf, очень большой?
Теперь я конвертирую PDF в HTML через pdf2htmlEx, Исходный файл pdf 21MB, конвертированный html почти 900MB, команда преобразования: pdf2htmlEX --no-drm 0 --embed-image 1 --dest-dir ./output09 ./b.pdf ./b.html Есть ли способ улучшить размер вывода H…
13 сен '17 в 06:03
1
ответ
Преобразование нескольких файлов с использованием pdf2htmlEX
Как вы используете pdf2htmlEX для нескольких файлов или для папки, содержащей файлы pdf? Я могу нормально конвертировать отдельные файлы, но, очевидно, я не хочу запускать команду 100 раз для 100 файлов. Я не смог найти ничего в документации, и что-…
05 авг '16 в 00:33
1
ответ
Вывод pdf2htmlEX показывает шрифт Times New Roman только для нескольких символов?
Я никогда не видел ничего подобного. Я использую инструмент под названием pdf2htmlEX, который конвертирует PDF в HTML, но у меня странная проблема. Посмотрите на этот скриншот: Смотрите первый символ (W)? Это в Times New Roman. Теперь вот еще более …
05 апр '18 в 11:18
1
ответ
Разделить PDF на несколько файлов HTML с pdf2htmlEX
Я пытаюсь разбить файл PDF на отдельные файлы HTML. Я имею в виду, что для каждой страницы PDF я хочу файл HTML. Вот как я это делаю: pdf2htmlEX --split-pages 1 LMS.pdf --page-filename lms%03.html В результате я получил пустой LMS.html и другие файл…
14 окт '14 в 12:25
0
ответов
Извлечь данные из PDF
Пожалуйста, не отмечайте как дубликат. Я уже перебрал множество ссылок на Stackru, но они не решили мою проблему. Что я пытаюсь сделать: мне нужно извлечь данные из примерно 1,50000 PDF-файлов. Пример pdf: все эти pdf идентичны по структуре и содерж…
26 мар '16 в 09:52
0
ответов
Преобразование PDF в HTML в Python
Python 2.6 Я пытаюсь разобрать мои PDF-файлы и один из способов сделать это - преобразовать его в HTML и извлечь заголовки вместе с их абзацами. Итак, я попробовал pdf2htmlEX, и он преобразовал мой pdf в html, не нарушая мой формат pdf... Пока что я…
21 дек '16 в 13:57
2
ответа
Получение местоположения текста из PDF
Я хочу знать расположение всех слов на странице PDF. Я пытался найти что-то в Интернете, но не смог. Кто-нибудь может мне помочь, какую библиотеку (желательно на платформе Java) я должен использовать?
08 дек '15 в 11:01
1
ответ
Pdf2htmlEx: HTML содержит изображения, как я могу получить вместо графики графику вместо изображений?
Я попробовал каждую команду, найденную в документации, как я могу получить только текстовую часть в качестве вывода, а не на всех изображениях? https://github.com/coolwanglu/pdf2htmlEX/wiki/Command-Line-Options.
25 окт '18 в 07:20
1
ответ
Pdf2Html Установка
Я пытаюсь установить программное обеспечение Pdf2HtmlEx на Ubuntu Server 18.04.1 LTS. Репозиторий не поддерживается, но программа очень полезна для меня. Я установил его на настольный дистрибутив Xubuntu и на образ докера, но я не могу сделать это н…
05 ноя '18 в 20:35
0
ответов
Извлечь весь контент из файла PDF (не только текст, но и таблицы / диаграммы)?
Я хотел бы переформатировать основной контент PDF, поэтому мне нужно извлечь его основной контент, не только текст, но также таблицы, диаграммы и т. Д. С информацией об их макете. Меня интересует только основная часть контента, например, для техниче…
05 авг '15 в 15:26