Какие коммерчески доступные платформы, подобные OpenCalais или AlchemyAPI, существуют для извлечения сущностей для китайского и японского языков?
В частности, я хотел бы иметь возможность извлекать сущности людей, мест, фильмов, музыки и т. Д. И иметь доступные сущности в широко используемых идентификаторах связанных данных, таких как DBpedia, Freebase или OpenCyc.
1 ответ
Extractiv - аналогичный сервис, который объединяет веб-сканер из 80legs с обработкой на естественном языке от Language Computer Corporation (LCC). В настоящее время эта служба предоставляет более 150 типов объектов, таких как те, которые вы перечислили, и связывает их с DBpedia.
Пока еще не развернутый в Extractiv как веб-сервис, именованный тег- сущность CiceroLite от LCC поддерживает китайский и японский языки. Это можно приобрести как отдельное приложение. Еще одной такой компанией будет Basis Technology, хотя я не знаю, связаны ли эти предприятия.