Tabula-py - ImportError: нет модуля с именем tabula
Я пытаюсь использовать Tabula-Py для чтения PDF. Я установил tabula-py через pip install tabula-py
Я также установил необходимые зависимости
requests
pandas
pytest
flake8
Мой код в настоящее время выглядит следующим образом:
import tabula
import pandas as pd
df = tabula.read_pdf("report.pdf", pages=2)
print(df)
Я получаю следующую ошибку:
Traceback (most recent call last):
File "tabula_pdf_reader.py", line 1, in <module>
import tabula
ImportError: No module named tabula
Любые входы в то, что мне здесь не хватает?
5 ответов
Я столкнулся с такой же проблемой в Ubuntu.
Сначала проверьте версию JDK и JRE, установленных на вашем компьютере, запустив java --version
а также javac --version
, У каждого должна быть версия больше 7.
Тогда используйте pip3
установить табулу.
Я получил ту же проблему здесь при выполнении на терминале. Однако после того, как я запустился, начав с "ipython3" вместо "ipython", он работал отлично. Вы должны убедиться, что модуль tabula-py установлен в каталоге python3, а не в python2
Использовать этот
import camelot
tables = camelot.read_pdf('foo.pdf')
tables.export('foo.csv', f='csv', compress=True)
Для пользователей macOS — обновление операционной системы Monterey решит проблему.
У меня была эта проблема в студии Azure ML. Я решил проблему, изменив интерпретатор Python на Python 3.8 — AzureML (у вас может быть по-другому, попробуйте другие или, возможно, интерпретатор можно вычесть из пути ниже). Затем укажите путь к установленным пакетам:
import sys
sys.path.append('/anaconda/envs/azureml_py38/lib/python3.8/site-packages')
Измените путь к тому, что вы получите при запуске:
from distutils.sysconfig import get_python_lib
print(get_python_lib())
надеюсь, это кому-то поможет :)