Python Arabic NLP

Я нахожусь в процессе оценки возможностей NLTK в обработке арабского текста в исследовании, чтобы проанализировать и извлечь чувства.

Вопрос в следующем:

  1. Способен ли NTLK обрабатывать и анализировать текст на арабском языке?
  2. Способен ли Python манипулировать \ маркировать арабский текст?
  3. Смогу ли я анализировать и хранить арабский текст, используя Python?

Если python и NTLK не являются инструментами для этой работы, какие инструменты вы бы порекомендовали (если они есть)?

Спасибо.


РЕДАКТИРОВАТЬ

На основании исследования:

  1. NTLK может только остановить арабский текст: Ссылка
  2. Python способен обрабатывать арабский текст, так как он поддерживает Unicode UTF-8: Ссылка
  3. Синтаксический анализ и лемматизация арабского текста можно выполнить с помощью: SNLPG (Stanford Natural Language Processing Group) Статистический анализатор: Ссылка

1 ответ

Решение

Простой поиск в Google ведет по этим ссылкам:

Обработка арабского естественного языка

Использование Python с Корпусом арабского корана

HOWTO: работа с Python, Unicode и арабским языком

Являются ли какие-либо из них полезными?

Другие вопросы по тегам