Нечеткий RDD и Stata проблемы с весом
Я запутался в использовании весов вероятности (pweight, в Stata), в частности, в отношении его использования для СДР. Я отслеживаю ответ, предоставленный здесь:
https://stats.stackexchange.com/questions/121750/fuzzy-rdd-issue
Я понимаю, что в примере / ответе @Dimitri используется отсечение 0 и пропускная способность плюс / минус 1. Линия
gen w=max(0,1-abs(z))
дает 0 для w вне этой полосы пропускания и 1 для значений точно в пределе.
Мой вопрос: не использует ли pweight обратное значение w? Т.е. разве вес не делает в точности противоположность тому, чего мы хотели бы достичь, придавая большой вес краям и ноль наблюдениям вокруг среза? Я не совсем понимаю...
Спасибо за вашу помощь!
1 ответ
Я не думаю, что вы понимаете вес вероятности правильно. Stata будет весить наблюдение со 100 больше, чем одно с 10, не меньше. Веса уже "перевернуты" в некотором смысле.
Например, посмотрите следующий код:
#delimit;
clear;
set obs 2;
gen y=100*(_n-1);
gen w=10 in 1;
replace w=100 in 2;
list y w, clean noobs;
reg y [pw=w];
gen x=_n;
tw scatter y x [pw=w], ms(Oh);
Как вы можете видеть, второе наблюдение с весом 100 является более важным в расчете среднего и также более заметным на графике.