Tabula-py - ImportError: нет модуля с именем tabula

Я пытаюсь использовать Tabula-Py для чтения PDF. Я установил tabula-py через pip install tabula-py

Я также установил необходимые зависимости

requests
pandas
pytest
flake8

Мой код в настоящее время выглядит следующим образом:

import tabula
import pandas as pd

df = tabula.read_pdf("report.pdf", pages=2)
print(df)

Я получаю следующую ошибку:

Traceback (most recent call last):
File "tabula_pdf_reader.py", line 1, in <module>
  import tabula
ImportError: No module named tabula

Любые входы в то, что мне здесь не хватает?

5 ответов

Я столкнулся с такой же проблемой в Ubuntu.

Сначала проверьте версию JDK и JRE, установленных на вашем компьютере, запустив java --version а также javac --version, У каждого должна быть версия больше 7.

Тогда используйте pip3 установить табулу.

Я получил ту же проблему здесь при выполнении на терминале. Однако после того, как я запустился, начав с "ipython3" вместо "ipython", он работал отлично. Вы должны убедиться, что модуль tabula-py установлен в каталоге python3, а не в python2

Использовать этот

 import camelot
 tables = camelot.read_pdf('foo.pdf')
 tables.export('foo.csv', f='csv', compress=True)

Для пользователей macOS — обновление операционной системы Monterey решит проблему.

У меня была эта проблема в студии Azure ML. Я решил проблему, изменив интерпретатор Python на Python 3.8 — AzureML (у вас может быть по-другому, попробуйте другие или, возможно, интерпретатор можно вычесть из пути ниже). Затем укажите путь к установленным пакетам:

      import sys
sys.path.append('/anaconda/envs/azureml_py38/lib/python3.8/site-packages')

Измените путь к тому, что вы получите при запуске:

      from distutils.sysconfig import get_python_lib
print(get_python_lib())

надеюсь, это кому-то поможет :)

Другие вопросы по тегам