Концептуальная маркировка статей

У меня есть набор статей, и я хочу извлечь концепцию из каждой статьи. Концепция может быть независимой или объединяться для формирования новой концепции.

Для этого недавно я столкнулся с различными платными API, например, IDOL от HP по требованию ( http://www.autonomy.com/technology/idol-functions/conceptual-search), Гармония данных ( http://www.dataharmony.com/services-view/mai-components/), ALCHEMY API ( http://www.alchemyapi.com/products/features/concept-tagging/) и т. д. Но у меня очень большой набор документов, и я не могу позволить себе использовать платный API . Есть ли какой-нибудь бесплатный инструмент, который может это сделать? Также я знаю о наборах данных DBPedia, которые используются для объединения концепций. Но я не понял, как их использовать. Любая помощь по этому вопросу будет полезна.

Кроме того, я давным-давно использовал инструменты Stanbol NLP. Я хотел знать, можно ли это сделать с помощью этого или с помощью любого другого инструмента.

1 ответ

Я понимаю, что это не отвечает на ваш вопрос о Stanbol, но IDOL OnDemand от HP открыт для публики и в настоящее время абсолютно бесплатен как в пиве. Поскольку вы определили его как потенциальное решение, сейчас самое время попробовать его!

Отказ от ответственности: я работаю на HP и связан с IDOL OnDemand.

Другие вопросы по тегам