Лучшая библиотека обнаружения отношений под ключ?
Какова лучшая готовая (готовая к использованию, промышленная) библиотека для определения отношений?
Я играл с NLTK, и результаты, которые я получаю, не очень удовлетворительны.
- http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html
- http://nltk.googlecode.com/svn/trunk/doc/howto/relextract.html
В идеале мне нужна библиотека, которая может принимать предложения вроде:
"Сара убила волка, который ел ребенка"
и превратить его в структуру данных, которая означает что-то вроде:
убит (Сара, волк) И ест (волк, ребенок)
Я знаю, что это предмет большого объема исследований и что это нелегкая задача. Тем не менее, кто-нибудь знает о достаточно надежной готовой к использованию библиотеке для обнаружения отношений?
2 ответа
Обновление: Extractiv больше не доступен.
Служба REST от Extractiv по требованию: http://rest.extractiv.com/extractiv/?url=https://stackru.com/questions/4732686/best-turnkey-relation-detection-library&output_format=html_viewer обработает это На странице, извлеките и отобразите две семантические тройки, которые вы хотите, в левом нижнем углу под "ОБЩИЕ" (Он отбрасывает часть текста со страницы в программе просмотра html, но этот текст не выбрасывается, если вы используете вывод json или rdf).
Это предполагает, что вы открыты для коммерческого, промышленного решения, хотя ограниченное бесплатное использование разрешено. Это веб-сервис, но для доступа к нему можно использовать библиотеки с открытым исходным кодом или приобрести их у Language Computer Corporation.
Эти отношения могут быть легко прочитаны из вывода обозначений зависимостей. Например, если вы поместите его в онлайн-анализатор Stanford Parser, вы можете увидеть обе тройки субъект-глагол-объект в своем примере в свернутом представлении типизированных зависимостей как:
nsubj(killed-2, Sarah-1)
dobj(killed-2, wolf-4)
nsubj(eating-7, wolf-4)
dobj(eating-7, child-9)