Установка Gumbo и его оболочки Python
Я пытаюсь использовать оболочку Python Gumbo для анализа HTML.
Моя операционная система - Ubuntu 14.04.3 LTS. Я использую Python2.7
Я клонировал последнюю версию Gumbo от GitHub.
Я следовал инструкциям по установке на Github.
Установка библиотек, как библиотеки C, так и оболочки Python, оказалась успешной (сообщений об ошибках нет, оба сообщения выводятся в конце)
C библиотека последнее сообщение:
Библиотеки были установлены в: /usr/local/lib
Сообщение обертки Python:
Установлен /usr/local/lib/python2.7/dist-packages/gumbo-0.10.1-py2.7.egg Обработка зависимостей для gumbo==0.10.1 Завершена обработка зависимостей для gumbo==0.10.1
Первая проблема, с которой я столкнулся, была, когда я пытался открыть pydoc для gumbo, чтобы лучше понять библиотеку.
pydoc gumbo
выдал следующую ошибку:
problem in gumbo - <type 'exceptions.OSError'>: /usr/local/lib/python2.7/dist-packages/gumbo-0.10.1-py2.7.egg/gumbo/libgumbo.so: cannot open shared object file: No such file or directory
Поиск сообщения дал один результат.
Это было не очень полезно для меня.
Глядя на каталог dist-packages, я заметил, что libgumbo.so не был в /usr/local/lib/python2.7/dist-packages/gumbo-0.10.1-py2.7.egg/gumbo/
, Все остальные файлы (soup-adapter.py, gumboc.py и т. Д.), Где, однако, есть.
Установка библиотеки C поместила libgumbo.so (и некоторые другие библиотеки, такие как libgumbo.a libgumbo.la и т. Д.) В /usr/local/lib
, Итак, как обходной путь, я создал simlink из .../dist-packages/gumbo-0.10.1-py2.7.egg/gumbo/
в /usr/local/lib
,
Это заставило pydoc gumbo работать.
Я попытался импортировать gumbo и суп-адаптер в переводчике после. Я получил следующую ошибку:
import soup_adapter
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "soup_adapter.py", line 26, in <module>
import gumboc
File "gumboc.py", line 44, in <module>
os.path.dirname(__file__), _name_of_lib))
File "/usr/lib/python2.7/ctypes/__init__.py", line 443, in LoadLibrary
return self._dlltype(name)
File "/usr/lib/python2.7/ctypes/__init__.py", line 365, in __init__
self._handle = _dlopen(self._name, mode)
OSError: libgumbo.so: cannot open shared object file: No such file or directory
Я не уверен, как поступить или как заставить гумбо работать.