Использование table_areas в python camelot / excalibur

Привет у меня проблемы с определением областей таблицы для несвязанных таблиц с помощью Camelot. Я использую таблицы областей PDF в качестве примера. Я использую GIMP для того, чтобы получить координаты таблицы, поскольку созданный текстовый график не позволяет мне получить координаты.

Должен ли я предположить, что области измеряются в 72ppi или 100ppi, а размер бумаги составляет 8,5x 11 дюймов?

Во-вторых, система координат GIMP - 0,0 с 0,0 в верхнем углу. Вертикальная ось проходит до 850 (при условии 72ppi), в то время как в разделе примеров достижений имеет координаты 0,0 в левом нижнем углу?

Наконец, когда я запускаю текстовый код графика в том же PDF-файле, изображение / фигура создаются в моей ячейке python, и я не могу получить координаты или окно, как показано в примере.

У меня есть несколько таблиц с областями, поэтому важно согласовать пример, так как это позволит мне определить таблицы в моих документах.

Код, который я использую, такой же, как и в примерах. Я изменил строку table_areas, чтобы отразить те, которые я получаю в GIMP.

Я использую python 3.7,matplotlib 3.0.2 и последнюю версию Anaconda. Windows 10 машина.

0 ответов

Другие вопросы по тегам