Описание тега tabula-py
NoneTabula-py - это оболочка для tabula-java, которая позволяет извлекать таблицы в DataFrame или JSON с помощью Python. Вы также можете извлекать таблицы из PDF в файл CSV, TSV или JSON.
1
ответ
ImportError: не удается импортировать имя "оболочки" из "табулы" Windows 10
У меня установлена Java и настроен путь, я могу успешно выполнить java -version и javac -version из командной строки. Когда я пытаюсь запустить следующий скрипт, я получаю сообщение об ошибке. import tabula from tabula import wrapper df = wrapper.…
28 фев '19 в 01:57
1
ответ
CalledProcessError: сообщение об ошибке tabula-py при чтении файла PDF
Я пытаюсь прочитать файл PDF с tabula-py в Spyder, используя следующий код: import tabula df = tabula.read_pdf("test.pdf") df Однако, когда я запускаю это, я получаю ошибку: CalledProcessError: Команда '['java', '-Dfile.encoding=UTF8', '-jar', 'path…
28 фев '19 в 21:43
0
ответов
Tabula-py не может извлечь некоторое содержимое таблицы
Я пытаюсь извлечь таблицы из PDF-файла для академических исследований по tabula-py. Я частично могу это сделать. Проблема в том, что информационный фрейм pandas не содержит информацию в pdf-файле для определенного типа ячеек. Оригинальный файл PDF с…
06 мар '19 в 22:53
0
ответов
Python- экспорт Dataframe в CSV
Я пытаюсь записать файл dataframe в csv с помощью панд. Я получаю следующую ошибку AttributeError: у объекта 'list' нет атрибута 'to_csv'. Я полагаю, что пишу синтаксис правильно, но кто-нибудь может указать, где мой синтаксис неверен при попытке за…
31 мар '19 в 22:35
2
ответа
Как исправить эту ошибку в функции tabula.read_pdf() в Python
Я пытаюсь извлечь таблицы из файла PDF с помощью Python (Pycharm). Я попробовал следующий код: from tabula import wrapper object = wrapper.read_pdf("C:/Users/Ojasvi/Desktop/sample.pdf") Однако ошибка, которую я получил, была: "tabula.errors.JavaNotF…
15 май '19 в 09:58
1
ответ
Как читать таблицы в pdf, когда в таблице есть разрывы строк в Python tabula-py?
Я пытался использовать пакет Python tabula-py для чтения таблицы в pdf. Кажется, что разрывы строк в ячейках таблицы pdf разделяют содержимое исходной ячейки на несколько ячеек. Я пытался найти все виды пакетов Python, чтобы решить эту проблему. Пох…
18 май '19 в 09:19
3
ответа
Невозможно выполнить мой скрипт при преобразовании его в exe
Я создал скрипт для извлечения данных из PDF, используя tabula-py и PyPDF2. Когда я запускаю свою программу через Jupyter-notebook и из cmd, она работает отлично. После преобразования его в исполняемый файл с помощью pyinstaller, я получаю эту ошибк…
11 июн '19 в 22:16
2
ответа
Не обнаруживая столбцы
Я анализировал банковскую выписку с использованием tabula-py, в которой столбцы разделены вертикальными полями, а строки не разделены. поэтому я использую потоковый режим, но если на любой странице нет записи для какого-либо столбца, то таблица объе…
28 июн '19 в 11:31
1
ответ
Извлечение таблиц из PDF
Я пытаюсь извлечь таблицы из PDF и записать их в Excel, используя python tabula-py. Вот код tabula.convert_into("input.pdf", "output.xlsx", output_format="xlsx", multiple_tables=True, stream=True, spreadsheets=True, pages='all') Все в порядке, я пол…
11 авг '19 в 19:57
2
ответа
Режим потока или режим решетки, какой из них установлен по умолчанию в модуле tabula-py?
Мне интересно, может ли кто-нибудь, кто знаком с модулем tabula-py для Python, помочь мне с этим вопросом. Ни в одной из документов tabula-py не ясно, tabula.read_pdf() функция использует извлечение режима решетки или потока в качестве настройки по …
19 июл '19 в 14:07
1
ответ
Как наиболее эффективно извлекать таблицы из определенных страниц из PDF в CSV?
Я хочу извлечь определенные страницы из PDF в таблицы в CSV. Для этой задачи я использую tabula-py, textract(я получаю лучшие результаты из метода PyPDF2), PyPDF2. Для каждого PDF я разделяю каждую страницу, затем использую textract. Если я найду ну…
17 июн '19 в 14:41
1
ответ
Предупреждения о шрифте Tabula приводят к тому, что таблица не анализируется из документа. Это как это должно работать?
Я проанализировал 3 документа, чтобы получить таблицы. Результаты, как следует: Документ 1: Идеальный анализ. Документ 2: получено 16 июля 2019 г. 17:25:42 org.apache.pdfbox.pdmodel.font.PDType1Font ПРЕДУПРЕЖДЕНИЕ. Использование резервного шрифта Ni…
17 июл '19 в 17:35
0
ответов
Получить координаты таблицы с табулой
Я использую Tabula-py, чтобы получить таблицы PDF. Я хочу обрезать PDF, чтобы получить изображение таблицы. Как я могу получить координаты таблицы, которая была обнаружена Табулой?
10 май '19 в 15:48
2
ответа
Модуль 'Tabula' не найден в python spyder
Я пробовал запустить этот код: from tabula import read_pdf df = read_pdf("../pdf/Documentacao.pdf") print(df) И получил вот такое: runfile('C:/Users/Henri/git/Git/PDS1/dev/lib/planilhas01.py', wdir='C:/Users/Henri/git/Git/PDS1/dev/lib') Traceback (m…
12 окт '19 в 22:17
0
ответов
Как превзойти ошибку шрифта tabula на сервере aws ubuntu?
После запуска функции tabula.py read_pdf() на сервере aws ubuntu я получил ошибку вроде: ВНИМАНИЕ: использование резервного шрифта LiberationSans для сайта Helvetica-Oblique:stackru.com
19 дек '19 в 14:25
0
ответов
как читать конкретную таблицу из нескольких таблиц pdf без использования метода координат области в таблице?
Aaa bbbb CccFff Yyyy ddddhhh eee zzzz Xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx XxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxXxxxxxxxxxxxxxxxxxxxxxxxxxxxxx…
04 июн '20 в 10:15
0
ответов
ImportError: невозможно импортировать имя read_pdf из частично инициализированного модуля tabula (скорее всего, из-за циклического импорта)
Импортировать таблицу из таблицы импортировать read_pdf data = read_pdf (r'C: \ Users \ MANIRATHNAM \ Downloads \ data.pdf', pages =' 1 ') tabula.convert_into (r'C: \ Users \ MANIRATHNAM \ Downloads \ data.pdf', "test.csv", output_format = "csv", pa…
02 сен '20 в 11:30
2
ответа
Ошибка чтения нескольких страниц PDF с помощью tabula-py
Я пытаюсь прочитать многостраничный файл PDF, содержащий таблицу в той же области на каждой странице. Количество страниц может меняться в зависимости от файла, который читается. Я пытаюсь выполнить приведенный ниже код, но он не работает: import tab…
10 ноя '19 в 17:28
0
ответов
При запуске tabula-py я получаю "CalledProcessError":
CalledProcessError в /api/uploadvendorchargefile/ Command '['java', '-Dfile.encoding=UTF8', '-jar', '/home2/backend/appvenv/lib/python3.5/site-packages/tabula/tabula-1.0.2-jar-with-dependencies.jar', '--pages', '1', '--guess', '29168.pdf']' вернул н…
29 янв '20 в 08:02
1
ответ
Не удалось установить tabula-py
У меня нет большого опыта работы с Python, и мне нужна помощь. Я безуспешно пытаюсь установить разные пакеты. Совсем недавно я попытался установить tabula-py, используяpip install tabula-py Но я получаю тот же ответ. Как это решить? Collecting tabul…
03 дек '19 в 15:57