Стандартные кластерные ошибки с двумя фиксированными эффектами с использованием линейных моделей в Python
Я начал делать некоторые регрессии в Python, и у меня была проблема с кластерными стандартными ошибками в linearmodels
модуль.
Я использовал PanelOLS и сравнивал результаты с выводом из Stata, чтобы убедиться, что я правильно кодировал данные. У меня не было проблем с кластеризацией, когда использовался только "entity_effects = True" или только "time_effects = True". Вывод точно соответствует выводу Stata.
Однако, когда я объединяю эффекты времени и объекта вместе в одной и той же регрессии, кластерные стандартные ошибки отличаются от выходных данных Stata.
Вот как выглядит мой код Python
reg1d = PanelOLS(df4['logavgMWH'], df4[X1a], entity_effects= True, time_effects = True)
fe_reg1d = reg1d.fit(cov_type='clustered', cluster_entity=True)
Вот как выглядит код Stata
reghdfe logavgMWH X1a, a(entity time) cluster(entity)
У кого-нибудь есть идеи, почему это так? Любая помощь по урегулированию этих различий?