Как получить распределение вероятностей для темы в молотке?

С помощью молотка я могу получить определенное количество тем и их слов. Как я могу убедиться, что тематические слова имеют распределение вероятностей (т.е. сумма к одному)?

Например, если я запустил его, как показано ниже, как я могу использовать выходные данные, предоставленные mallet, чтобы удостовериться, что вероятности слов темы для темы 0 складываются в 1?

mallet train-topics --input text.vectors --output-topic-keys topics.txt --output-doc-topics doc_comp.txt --topic-word-weights-file weights.txt --num-top-words 50 --word-topic-counts-file counts.txt --num-topics 3 --output-state topicstate.gz --alpha 1

0 ответов

Другие вопросы по тегам