Ошибка read_pdf из таблицы для чтения PDF-файлов..?
Я использую пакет Tabula для чтения PDF, но здесь я получил эти ошибки
df = tabula.read_pdf("/tmp/university_exam_results.pdf", output_format="json", pages="all")
AttributeError: 'module' object has no attribute 'read_pdf'
что я могу сделать для этой ошибки. пожалуйста, исправьте мою проблему..
1 ответ
Для Python2, я думаю, вы ищете
pip2 install tabula-py
И как пример,
>>> import tabula
>>> df2 = tabula.read_pdf("https://github.com/tabulapdf/tabula-java/raw/master/src/test/resources/technology/tabula/arabic.pdf")
>>> df2
مرحباً اسمي سلطان
0 انا من ولاية كارولينا الشمال من اين انت؟
1 1234 عندي 47 قطط
2 هل انت شباك؟ اسمي Jeremy في الانجليزية
3 Jeremy is جرمي in Arabic NaN