Извлеките ключевые слова из набора похожих предложений с помощью python
У меня есть список похожих предложений, и я хотел бы автоматически извлекать топ-n важных ключевых слов [длина одного слова] из всего набора этих предложений с помощью python. Эти предложения уже имеют нормализованную форму, так как они не содержат стоп-слов.
Эти первые n важных ключевых слов должны представлять те же самые предложения.
Какую технику мне следует использовать, например, технику реферирования, технику извлечения ключевых слов или технику тематического моделирования?
Я знаю TF-IDF, RAKE и т. Д., Но как я могу использовать их для достижения своей цели? Не могли бы вы предложить какой-нибудь фрагмент кода, который может хорошо работать для достижения этой цели?