R ergm - указание эффекта соответствия узла для двух атрибутов

В настоящее время я работаю над данными социальной сети с R ergm пакет. Я хочу оценить условную вероятность того, что связь является гомофильной по двум различным переменным, но в зависимости от того, как я определяю модель, результаты немного отличаются.

В первом случае я поставил два nodematch слагаемые в моей модели, по одному на каждую переменную, которая меня интересует, и я нахожу условное логарифмическое нечетко-гомофильную связь, суммируя 3 коэффициента моей модели ("краевые" слагаемые и два nodematch термины).

Во втором случае я прямо указываю только один nodematch срок, для связи гомофильной по обеим переменным.

И результаты, которые я получаю, хотя и близки, по-прежнему различны, в то время как в обоих случаях я должен получить лог-нечетную связь, возникающую между людьми, разделяющими оба эти атрибута.

Вот пример из данных Сэмпсона:

# Load the data :

library(statnet)

data(sampson)

#First model: I specify two nodematch terms, one for 'cloisterville' and one for 'group'.

m1 <- ergm(samplike ~ edges + nodematch('cloisterville') + nodematch('group'))

#Second model: this time, I have only one term asking for a `nodematch` on both terms at the same time.

m2 <- ergm(samplike ~ edges + nodematch(c('cloisterville','group')))

#Here is the output of both models:

summary(m1)

summary(m2)

Таким образом, согласно первой модели, условный лог-нечет гомофильной связи по обеим переменным должен быть:

-2.250 + 0.586 + 2.389

0,725

Тем не менее, согласно второй модели, лог-нечет этой же дважды гомофильной связи должен быть:

-1,856 + 2,659

0,803

Соответствующие вероятности 0,6737071 и 0,6906158

Знаете ли вы, почему результаты отличаются в обоих случаях, в то время как это должно дать одинаковую условную вероятность того же вида связи?

Спасибо большое за вашу помощь,

С уважением

Timothee

1 ответ

Мы не должны ожидать одинаковых результатов, поскольку модели оценивают две разные вещи. По сути, модель 1 оценивает гомофилию на cloisterville или на group в то время как модель 2 оценивает гомофилию на обоих cloisterville а также group,

Чтобы быть более точным, первая модель тестирует гомофилию на group Чистая тенденция к гомофилии на cloisterville, и наоборот. Вторая модель рассматривает, есть ли тенденция к гомофилии по обоим признакам одновременно. Формируют ли монахи связи внутри групп и исходя из своего расположения в монастырях?

См примечание в ?ergm.terms за nodematch:

(Когда дано несколько имен, статистика учитывает только те, по которым совпадают все названные атрибуты.)

Это легко увидеть визуально:

Цвета группы. Квадраты означает cloisterville==TRUE и треугольники означает cloisterville==FALSE, Семестр nodematch(c('cloisterville','group')) считает только те края, где цвета и формы совпадают!

Другие вопросы по тегам