Elasticsearch Извлечение ключевого слова

У меня есть корпус из ~10 тысяч статей. Для каждой статьи я хотел бы извлечь ключевые слова (теги). Таким образом, для каждой статьи я хотел бы ранжировать токенизированные термины в статье на основе их частоты в статье относительно их частоты в других статьях в корпусе - по линиям TF-IDF по всему корпусу.

Я использую эластичный поиск (использовал его впервые на прошлой неделе). Мне трудно найти ссылки, как это сделать. Я нашел несколько ссылок, включая эту ссылку от SO:

Быстрое извлечение ключевых слов в asticsearch

и эта ссылка с форумов Google:

https://groups.google.com/forum/

но я надеюсь найти ясное руководство от А до Я (как это часто бывает доступно практически для всего).

Я буду продолжать гуглить и искать другие ресурсы, но любой совет относительно ресурсов или того, как это сделать, очень помог бы! Спасибо.

0 ответов

Другие вопросы по тегам