Elasticsearch Извлечение ключевого слова
У меня есть корпус из ~10 тысяч статей. Для каждой статьи я хотел бы извлечь ключевые слова (теги). Таким образом, для каждой статьи я хотел бы ранжировать токенизированные термины в статье на основе их частоты в статье относительно их частоты в других статьях в корпусе - по линиям TF-IDF по всему корпусу.
Я использую эластичный поиск (использовал его впервые на прошлой неделе). Мне трудно найти ссылки, как это сделать. Я нашел несколько ссылок, включая эту ссылку от SO:
Быстрое извлечение ключевых слов в asticsearch
и эта ссылка с форумов Google:
https://groups.google.com/forum/
но я надеюсь найти ясное руководство от А до Я (как это часто бывает доступно практически для всего).
Я буду продолжать гуглить и искать другие ресурсы, но любой совет относительно ресурсов или того, как это сделать, очень помог бы! Спасибо.