Python Arabic NLP
Я нахожусь в процессе оценки возможностей NLTK в обработке арабского текста в исследовании, чтобы проанализировать и извлечь чувства.
Вопрос в следующем:
- Способен ли NTLK обрабатывать и анализировать текст на арабском языке?
- Способен ли Python манипулировать \ маркировать арабский текст?
- Смогу ли я анализировать и хранить арабский текст, используя Python?
Если python и NTLK не являются инструментами для этой работы, какие инструменты вы бы порекомендовали (если они есть)?
Спасибо.
РЕДАКТИРОВАТЬ
На основании исследования:
- NTLK может только остановить арабский текст: Ссылка
- Python способен обрабатывать арабский текст, так как он поддерживает Unicode UTF-8: Ссылка
- Синтаксический анализ и лемматизация арабского текста можно выполнить с помощью: SNLPG (Stanford Natural Language Processing Group) Статистический анализатор: Ссылка
1 ответ
Решение
Простой поиск в Google ведет по этим ссылкам:
Обработка арабского естественного языка
Использование Python с Корпусом арабского корана
HOWTO: работа с Python, Unicode и арабским языком
Являются ли какие-либо из них полезными?