Нечеткий RDD и Stata проблемы с весом

Я запутался в использовании весов вероятности (pweight, в Stata), в частности, в отношении его использования для СДР. Я отслеживаю ответ, предоставленный здесь:

https://stats.stackexchange.com/questions/121750/fuzzy-rdd-issue

Я понимаю, что в примере / ответе @Dimitri используется отсечение 0 и пропускная способность плюс / минус 1. Линия

gen w=max(0,1-abs(z))

дает 0 для w вне этой полосы пропускания и 1 для значений точно в пределе.

Мой вопрос: не использует ли pweight обратное значение w? Т.е. разве вес не делает в точности противоположность тому, чего мы хотели бы достичь, придавая большой вес краям и ноль наблюдениям вокруг среза? Я не совсем понимаю...

Спасибо за вашу помощь!

1 ответ

Я не думаю, что вы понимаете вес вероятности правильно. Stata будет весить наблюдение со 100 больше, чем одно с 10, не меньше. Веса уже "перевернуты" в некотором смысле.

Например, посмотрите следующий код:

#delimit;
clear;
set obs 2;
gen y=100*(_n-1); 
gen w=10 in 1; 
replace w=100 in 2;
list y w, clean noobs;
reg y [pw=w];
gen x=_n;
tw scatter y x [pw=w], ms(Oh);

Как вы можете видеть, второе наблюдение с весом 100 является более важным в расчете среднего и также более заметным на графике.

Другие вопросы по тегам