Установка NLTK вместе с EPD python в Ubuntu

Я недавно перешел из Matlab/ Windows в Python/ Ubuntu. Я установил EPD Python, который является дистрибутивом Python, который включает в себя большинство научных пакетов, я до сих пор очень счастлив. Затем мне нужно было установить NLTK для анализа текста и следовать инструкциям на веб-странице nltk. Проблема в том, что все пакеты (pyyaml, nltk и т. Д.) Устанавливаются в

/usr/local/lib/python2.7

Однако я уже изменил свой.bashrc (как указано в инструкциях EPD после установки) и добавил в конце следующую строку.

export PATH=/home/myname/epd/bin:$PATH

и sys.path из моей оболочки Python возвращает

['',
 '/home/myname/epd/bin',
 '/home/myname/epd/lib/python2.7/site-packages/pandas-0.10.0-py2.7-  linux-i686.egg',
 '/home/myname/epd/lib/python27.zip',
 '/home/myname/epd/lib/python2.7',
 '/home/myname/epd/lib/python2.7/plat-linux2',
 '/home/myname/epd/lib/python2.7/lib-tk',
 '/home/myname/epd/lib/python2.7/lib-old',
 '/home/myname/epd/lib/python2.7/lib-dynload',
 '/home/myname/epd/lib/python2.7/site-packages',
 '/home/myname/epd/lib/python2.7/site-packages/PIL',
 '/home/myname/epd/lib/python2.7/site-packages/IPython/extensions']

Любая помощь относительно того, как заставить новые пакеты Python устанавливать по правильному пути, очень ценится. Если у вас есть время, пожалуйста, уточните, почему это происходит и что я делаю неправильно. Спасибо за ваше время!

3 ответа

Я недавно установил NLTK и PyYAML, потому что я работаю через "Обработка естественного языка с Python". Я был приятно удивлен, обнаружив, что оба они доступны через менеджер пакетов EPD enpkg (хотя NLTK не указан на сайте Enthought как доступный).

$ enpkg -s pyyaml
Name                   Versions           Note
------------------------------------------------------------
PyYAML                 3.9-2              
                       3.10-1      

$ enpkg -s nltk
Name                   Versions           Note
------------------------------------------------------------
nltk                   2.0.1rc1-1         
                       2.0.1rc1-2         
                       2.0.1-1 

Вы можете установить оба, используя:

$ enpkg pyyaml
$ enpkg nltk

и ты в порядке!

У вас есть два хороших варианта настройки среды Python в Ubuntu:

  1. Используйте пакеты с Ubuntu, как предлагает Торстен.

  2. Используйте менеджер пакетов pip в virtualenv. Таким образом, вы можете настроить несколько сред и переходить от одного к другому. Virtualenv можно настроить так, чтобы он также включал общесистемные пакеты Ubuntu.

    nltk существует в виде pip-пакета: http://pypi.python.org/pypi/nltk/2.0.4

    У pip есть некоторые проблемы с Ubuntu при подключении к библиотекам c, так как Ubuntu размещает их там, где скрипты установки не выглядят. Не забудьте также установить версию -dev пакетов зависимостей, так как они содержат заголовочные файлы, которые нужны pip, и скопируйте или свяжите библиотеки из / usr / lib /вашей архитектуры linux/ lib / с / usr / local / lib, чтобы этот пункт может их найти.

Для научных модулей Python в NLTK, обычно scipy было бы достаточно основных научных функций и numpy покрыл бы статистику. Сайт установки NLTK настоятельно рекомендует pip тоже. http://nltk.org/install.html

  1. Откройте Finder> Приложения> Утилиты> Терминал и введите python -V, чтобы узнать, какая версия Python установлена

  2. Установите Setuptools: загрузите соответствующую версию Setuptools с http://pypi.python.org/pypi/setuptools (прокрутите вниз и выберите имя файла, который содержит правильный номер версии и имеет расширение.egg). Установите его, набрав sudo sh Downloads / setuptools -... egg, указав местоположение загруженного файла.

  3. Установите Pip: запустите sudo easy_install pip

  4. Установить Numpy (необязательно): запустить sudo pip install -U numpy

  5. Установите PyYAML и NLTK: запустите sudo pip install -U pyyaml ​​nltk

  6. Тестовая установка: запустите python, затем введите import nltk

Другие вопросы по тегам