Описание тега pymupdf

Описание тега Вопросы с тегом

PyMuPDF - это привязка Python для MuPDF - "облегченного средства просмотра PDF и XPS". MuPDF может получить доступ к файлам в форматах PDF, XPS, OpenXPS, CBZ (архив комиксов), FB2 и EPUB (электронные книги). ПРИМЕЧАНИЕ. Он импортируется в Python как fitz.

4 ответа

Проблемы с PyMuPDF извлечения простого текста

Я хочу читать в PDF-файл, используя PyMuPDF. Все, что мне нужно, это простой текст (не нужно извлекать информацию о цвете, шрифтах, таблицах и т. Д.). Я пробовал следующее import fitz from fitz import TextPage ifile = "C:\\user\\docs\\aPDFfile.pdf" …

python pdf pymupdf

04 июн '18 в 14:05

2 ответа

Как получить доступ к тексту с определенной страницы PDF, а не со всего документа

Я пытаюсь извлечь некоторые вещи из некоторых документов PDF. Я возился с различными инструментами, хотя больше всего вложил в pdfminer и pymupdf. Я начал с pdfminer, но начал тестировать pymupdf после того, как не смог решить одну конкретную пробле…

python pdf pymupdf

20 июн '19 в 01:43

1 ответ

Невозможно установить PyMuPDF на Mac 10.14.5

После запуска pip install pymupdf в моей среде conda я получаю сообщение об ошибке при попытке import fitz ModuleNotFoundError: нет модуля с именем 'fitz' Внутри моего терминала я побежал pip list | grep PyMuPDF проверить установку и вернуть PyMuPDF…

python pymupdf

17 июл '19 в 19:00

0 ответов

Почему это "Page.InsertImage" вставляет серое изображение оригинального PNG?

Я пытаюсь добавить изображение png в качестве водяного знака к существующему PDF, я пытался использовать "Page.Insertimage" из PyMuPDF, хотя мне удалось вставить изображение в качестве водяного знака, но водяной знак появляется в оттенках серого. Я …

pymupdf insert-image

03 авг '19 в 23:55

0 ответов

Tkinter Canvas PDF Viewer Следующая страница рендеринг работает только при отладке

Я пытаюсь написать просмотрщик PDF в Python/Tkinter, используя библиотеку PyMuPDF. Я могу успешно открыть документ и отобразить первую страницу, но при попытке перейти на следующую страницу, удалив изображение холста и создав новую на новой странице…

python python-3.x tkinter tkinter-canvas pymupdf

04 авг '19 в 18:34

0 ответов

Как определить, содержит ли страница PDF отредактированный материал?

У меня есть набор файлов PDF, для которых на некоторых страницах частично отредактировано содержимое через Adobe Acrobat. Я хотел бы программно перебирать каждую страницу и определять, содержит ли страница отредактированный контент, предпочтительно …

python pdf acrobat pymupdf

08 авг '19 в 21:12

2 ответа

Не удается прочитать содержимое определенной страницы файла PDF, доступного в Интернете

Я использовал библиотеку PyMuPDF для локального анализа содержимого любой конкретной страницы PDF-файла и обнаружил, что он работает. Однако, когда я пытаюсь применить ту же логику при анализе содержимого любой конкретной страницы PDF-файла, доступн…

python python-3.x pdf web-scraping pymupdf

16 авг '19 в 23:50

2 ответа

Сглаживание отрендеренных PDF-файлов с использованием wxPython + pymupdf

Я новичок в wxPython и pymupdf, и взглянул на примеры для wxPython + pymupdf. Они работают, однако качество pdf-страницы (отображается) довольно низкое. Я уверен, что это можно улучшить. В основном я ищу слютоин сглаживания. Однако я не знаю, как и …

python pdf wxpython pymupdf

18 июн '19 в 18:23

0 ответов

Нужна помощь в сохранении в PyMuPDF

Это базовый скрипт, который должен вставить изображение водяного знака на первой странице PDF и сохранить его под новым именем. Я мог бы сделать то же самое с теми же файлами в pdfrw, но я застрял с PyMuPDF (который я предпочел бы использовать...). …

python-3.x pymupdf

20 июл '19 в 18:35

1 ответ

Как автоматически изменить размер QVBoxLayout в соответствии с его дочерним содержимым внутри QScrollArea?

В последнее время я пытаюсь использовать PyQT5 для создания программы просмотра PDF. Я адаптировал код, представленный в этом сообщении ( графический интерфейс Image Viewer не может правильно сопоставить координаты для события нажатия мыши). Я созда…

python pdf pyqt pyqt5 pymupdf

25 фев '20 в 11:31

3 ответа

добавление текста в PDF с помощью PyMuPDF

Я пытаюсь добавить текст в PDF-файл, открыв PDF-файл, добавив текстовое поле и сохранив его. Когда я запускаю код, ничего не происходит. на рабочем столе он показывает, что файл был обновлен, но на нем нет текста. Вот код: import fitz doc = fitz.ope…

python pymupdf

05 авг '20 в 08:51

2 ответа

Есть ли какое-либо решение для извлечения таблицы без полей из PDF в CSV?

введите описание изображения здесь Это мой пример изображения из файла pdf с 75 страницами.

python tabula pymupdf

08 июн '20 в 10:49

2 ответа

Извлекайте изображения pdf с помощью pymupdf в правильном порядке

В настоящее время я работаю над экстрактором изображений Python 3.x для файлов pdf и не могу найти решение проблемы, с которой я сталкивался на протяжении всей моей работы. Я намерен извлечь все изображения из pdf-файлов (отчетов об автомобилях) без…

python-3.x pdf pymupdf image-extraction

02 сен '19 в 11:59

1 ответ

Могу ли я с помощью pymupdf поместить в контейнер результат Page.showPDFPage?

Я хочу взять SVG и разместить их в углах существующих PDF-файлов с прозрачностью, а не растрировать результат (сохранить SVG как векторы в целевом PDF-файле). У меня есть фиктивный документ SVG для тестирования, созданный с помощью graphviz; для наг…

pdf pymupdf

30 сен '19 в 22:19

1 ответ

Размеры Camelot PDF

Я тщательно искал stackru, прежде чем опубликовать это, и не смог найти ничего по размерам страницы камелота. Есть такой вопрос, который предлагает использоватьtable_regionно это не решает проблему OP или мою. К сожалению, я не могу комментировать, …

python pymupdf python-camelot

03 дек '19 в 22:19

1 ответ

Проблема с выделением текста в PDF-документе Python

Я пытаюсь написать скрипт Python, который автоматизирует процесс поиска текста в PDF и выделяет в соответствии с Я использую модуль python pymupdf. Это работает для некоторых pdf. Однако при использовании целевого PDF-файла (чертежа компонентов и та…

python pdf annotations pymupdf

08 ноя '19 в 02:00

2 ответа

PyMuPDF | вставленное изображение находится не в том месте страницы pdf

Мне нужно вставить изображение на несколько страниц PDF- файла, и я использую insertImage. Следуя приведенному мной примеруfitz.Rect(0, 0, 50, 50)так как я хочу разместить изображение в верхнем левом углу страницы. Отлично работает для всех PDF-файл…

python image pdf pymupdf

04 дек '19 в 18:06

0 ответов

Как правильно добавить альфа-канал к изображению, извлеченному из PDF, с помощью PyMuPDF

Я пытаюсь извлечь изображения из PDF с помощью PyMuPDF и этого рецепта. Для некоторых изображений с жесткой прозрачностью краев это работает. Но для изображений с матовой прозрачностью я получаю артефакты по краям. Когда я извлекаю изображение без а…

python-3.x png pymupdf

17 апр '20 в 16:07

1 ответ

Проблема с цветом при сохранении Pixmap страницы PDF как PNG с помощью PyMuPDF

Я запускаю следующий фрагмент кода Python из документации PyMuPDF 1.16.17, который сохраняет изображения PNG для каждой страницы в файле PDF. import sys, fitz # import the binding fname = "test.pdf" # get filename from command line doc = fitz.open(f…

pdf cmyk pymupdf pixmap

21 апр '20 в 05:56

2 ответа

Как установить PyMuPDF на Heroku Django

Я пытаюсь создать сценарий, который извлекает изображения из PDF, и я создал сценарий в проекте Django и добавил pymupdf в файл requirements.txt. У меня есть файл Aptfile с Mupdf и https://github.com/heroku/heroku-buildpack-apt в качестве пакета сбо…

python django pdf heroku pymupdf

10 фев '20 в 15:57