Моделирование атрибутов узла с использованием реляционной тематической модели с помощью lda
Я использую Джонатана Чанга и соавторов lda
Пакет R для исследовательского анализа данных сети новостных статей, содержащий сотни заголовков (в тексте), отсортированных по темам и новостным каналам, которые их составили. Каждый новостной канал может иметь свою собственную партизанскую позицию (либеральную, консервативную и т. Д.), Которая служит "атрибутом узла". То, что я пытаюсь сделать, - это одновременно моделировать, разделяют ли заголовки новостных каналов со схожими отношениями (атрибут узла) друг с другом (т. Е. Если присутствуют "ребра") и какими конкретными "темами" они стремятся поделиться.
Хотя я не выяснил, как реализовать этот анализ, но эта аналитическая структура указала мне на реляционную модель темы (RTM) Чанга и Блея (2009), которая моделирует как "контент", так и "формирование ссылок" и может быть реализована с использованием rtm.collapsed.gibbs.sampler()
в lda
,
В оригинальной статье говорится: "[T] Он RTM совместно моделирует атрибуты узла и структуру ссылки, его можно использовать для прогнозирования одного на основании другого", однако я не смог найти никаких инструкций для включения атрибутов узла в их demo()
или их RDocumentation. Их пример cora
Данные представляют собой список целочисленных индексов ссылок без четких атрибутов примечания.
Мне интересно, использовал ли кто-нибудь RTM для обработки аналогичных задач и хотел бы поделиться своими соображениями о способах включения атрибутов заметок в rtm.collapsed.gibbs.sampler()
?
Благодарю.