Описание тега topic-modeling

Тематические модели описывают частоту появления тем в документах и ​​тексте. "Тема" - это группа слов, которые обычно встречаются вместе.

Тематическая модель - это тип статистической модели для обнаружения абстрактных "тем", которые встречаются в коллекции документов. Интуитивно, учитывая, что документ посвящен определенной теме, можно было бы ожидать, что определенные слова будут появляться в документе более или менее часто: "собака" и "кость" будут чаще встречаться в документах о собаках, "кошке" и "мяу". появится в документах о кошках (источник: википедия)

Генеративные модели (т.е. статистические модели, используемые для тематического моделирования)

  • Скрытое распределение Дирихле (LDA)
  • Иерархический процесс Дирихле (HDP)

Программное обеспечение / Библиотеки

Связанные теги: