Извлечение данных из PDF-полей в R

У PDF есть коробки с данными. Я хочу извлечь все данные из этих блоков в R. Я хочу, чтобы это было извлечено без использования OCR.

снимок коробки в pdf

Я пробовал пакет Tabulizer, но он дает неорганизованные результаты, что делает невозможным его извлечение.

report <- extract_tables("C:\\Users\\672158\\Desktop\\example1.pdf", encoding = "UTF-8")

r pdf pdf-extraction pdftables

Источник

user11577023 25 июл '19 в 13:48

0 ответов

Другие вопросы по тегам r pdf pdf-extraction pdftables