get_document_topics возвращает пустой список.
Я использую Gensim для моделирования темы. После обучения модели lda я вызываю get_document_topics для нового документа, чтобы получить распространение темы. Однако для некоторых документов возвращаемое значение представляет собой пустой список. Вот мой код Есть идеи, что могло пойти не так?
topic_vector = [ x[1] for x in self.ldamodel.get_document_topics(new_doc_bow , minimum_probability=
0.0, per_word_topics=False)]
1 ответ
Вот как я решил эту проблему:
Во-первых, убедитесь, что ваша версия gensim - gensim-3.6.0, вы можете проверить это, выполнив эту команду в своем терминале:
pip freeze | grep gensim
Если нет, вы можете удалить свой gensim и установить более новую версию. Затем в файле gensim/models/ldamodel.py вам нужно отредактировать значение epsilon до большего значения.
DTYPE_TO_EPS = {
np.float16: 1e-5,
np.float32: 1e-35, # modify the value and set it to 1e-5
np.float64: 1e-100,
}