Данные сканирования Scrapy внутри pdf файла

Я хотел бы знать, как сканировать данные в PDF-файл, используя scrapy. Какой модуль я должен использовать, а какой самый лучший и эффективный способ? Не могли бы вы дать мне несколько примеров учебников по этому

Спасибо!!

1 ответ

Я предлагаю вам получить PDF с Scrapy и использовать PyPDF2 для получения содержимого внутри PDF.

Для полного, но несколько старого (с использованием pyPDF) примера, посмотрите на этот сайт.

Другие вопросы по тегам