Описание тега topic-modeling
Тематические модели описывают частоту появления тем в документах и тексте. "Тема" - это группа слов, которые обычно встречаются вместе.
Тематическая модель - это тип статистической модели для обнаружения абстрактных "тем", которые встречаются в коллекции документов. Интуитивно, учитывая, что документ посвящен определенной теме, можно было бы ожидать, что определенные слова будут появляться в документе более или менее часто: "собака" и "кость" будут чаще встречаться в документах о собаках, "кошке" и "мяу". появится в документах о кошках (источник: википедия)
Генеративные модели (т.е. статистические модели, используемые для тематического моделирования)
- Скрытое распределение Дирихле (LDA)
- Иерархический процесс Дирихле (HDP)
Программное обеспечение / Библиотеки
- Молоток (Ява)
- Stanford Topic Modeling Toolbox (программное обеспечение)
- Gensim - Тематическое моделирование для людей
Связанные теги: