Не удалось установить textract в Google Colab
Я не смог установить textract в google colab, сообщение об ошибке показывается, как показано ниже.
некоторые люди предлагают использовать "sudo apt-get install libasound2-dev", но как сделать "sudo... " в google colab?
=== Сообщение об ошибке =================================================== =============
Не удалось создать колесо для pocketsphinx. Запуск setup.py clean для pocketsphinx. Не удалось собрать pocketsphinx. Установка собранных пакетов: pocketsphinx. Запуск setup.py install для pocketsphinx ... ошибка. Полный вывод команды / usr / bin / python3 -u -c "import setuptools, tokenize;file= '/ tmp / pip-install-03c_ysbm / pocketsphinx / setup.py'; f = getattr (tokenize, 'open', open) (файл);code=f.read().replace('\r\n', '\n');f.close();exec(скомпилировать (код, файл, 'exec'))" install --record /tmp/pip-record-6n9ewg9i/install-record.txt - единственная версия, управляемая извне --compile: запускает установку, запускает build_ext, строит расширение 'sphinxbase._sphinxbase', переключая deps / sphinxbase / swig / sphinxbase.i в deps / sphinxbase / swig / sphinxbase_wrap.c swig -python -modern -threads - Ideps / sphinxbase / include -Ideps / sphinxbase / include / sphinxbase -Ideps / sphinxbase / include / android -Ideps / sphinxbase / swig -outdir sphinxbase -o deps / sphinxbase / swig / sphinxbase_wrap.c deps / sphinxbb невозможно выполнить 'swig': ошибка такого файла или каталога: команда 'swig' завершилась неудачно с состоянием выхода 1
================================================== =========================
Спасибо лин
2 ответа
Нет, вы не можете использовать sudo, потому что у вас нет доступа к руду.
Проблема в том, что вам нужен не просто libasound2-dev, а целый набор пакетов. Проверьте требования Debian в https://textract.readthedocs.io/en/stable/installation.html
Также для сборки spihnx (требование для textract) вам нужен libpulse-dev. Итак, вот обновленный список команд.
!apt-get install python-dev libxml2-dev libxslt1-dev antiword unrtf poppler-utils \
pstotext tesseract-ocr \
flac ffmpeg lame libmad0 libsox-fmt-mp3 sox libjpeg-dev swig libasound2-dev libpulse-dev
!pip install git+https://github.com/deanmalmgren/textract
В google colab команды Bash запускаются с префиксом команды '!'.
Пример:
!apt update
!apt-get install libasound2-dev