Извлечение данных из PDF-полей в R
У PDF есть коробки с данными. Я хочу извлечь все данные из этих блоков в R. Я хочу, чтобы это было извлечено без использования OCR.
Я пробовал пакет Tabulizer, но он дает неорганизованные результаты, что делает невозможным его извлечение.
report <- extract_tables("C:\\Users\\672158\\Desktop\\example1.pdf", encoding = "UTF-8")