Импорт ocrmypdf в код Visual Stdio в Python
Я хотел бы импортировать
ocrmypdf
.
Я установил пакет, используя
pip install --upgrade --user ocrmypdf
но как я пытался импортировать в VSC с помощью:
import ocrmypdf
он поймал ошибку:
[WinError 2] The system cannot find the file specified
[WinError 2] The system cannot find the file specified
---------------------------------------------------------------------------
MissingDependencyError Traceback (most recent call last)
<ipython-input-9-a81f3474d7ad> in <module>
----> 1 import ocrmypdf
~\AppData\Roaming\Python\Python38\site-packages\ocrmypdf\__init__.py in <module>
8 from pluggy import HookimplMarker as _HookimplMarker
9
---> 10 from ocrmypdf import helpers, hocrtransform, leptonica, pdfa, pdfinfo
11 from ocrmypdf._concurrent import Executor
12 from ocrmypdf._jobcontext import PageContext, PdfContext
~\AppData\Roaming\Python\Python38\site-packages\ocrmypdf\leptonica.py in <module>
42 _libpath = find_library(libname)
43 if not _libpath:
---> 44 raise MissingDependencyError(
45 """
46 ---------------------------------------------------------------------
MissingDependencyError:
---------------------------------------------------------------------
This error normally occurs when ocrmypdf can't find the Leptonica
library, which is usually installed with Tesseract OCR. It could be that
Tesseract is not installed properly, we can't find the installation
on your system PATH environment variable.
The library we are looking for is usually called:
liblept-5.dll (Windows)
liblept*.dylib (macOS)
liblept*.so (Linux/BSD)
Please review our installation procedures to find a solution:
https://ocrmypdf.readthedocs.io/en/latest/installation.html
---------------------------------------------------------------------
1 ответ
В журнале ошибок указано, что отсутствует какая-то зависимость, что означает, что отсутствует какой-то модуль, который используется ocrmypdf. Скорее всего, для этого нужен тезерракт OCR. Попробуйте установить это, и это может сработать. Даже в документации модуля указано, что для правильной работы модуля требуется tesseract.