Создание стратифицированной выборки в SAS с известными стратами
У меня целевая популяция с некоторыми характеристиками, и меня попросили выбрать соответствующий контроль на основе этих характеристик. Я пытаюсь сделать стратифицированную выборку с использованием базы SAS, но мне нужно иметь возможность определить мои 4 звезды%s от моей цели и применить их к моей выборке. Есть ли способ, которым я могу это сделать? Спасибо!
1 ответ
Для стратифицированной выборки вы можете использовать PROC SURVEYSELECT
Here is an example:-
/*Dataset creation*/
data data_dummy;
input revenue revenue_tag Premiership_level;
datalines;
1000 High 1
90 Low 2
500 Medium 3
1200 High 4
;
run;
/*Now you need to Sort by rev_tag, Premiership_level (say these are the
variables you need to do stratified sampling on)*/
proc sort data = data_dummy;
by rev_tag Premiership_level;
run;
/*Now use SURVEYSELECT to do stratified sampling using 10% samprate (You can
change this 10% as per your requirement)*/
/*Surveyselect is used to pick entries for groups such that , both the
groups created are similar in terms of variables specified under strata*/
proc surveyselect data=data_dummy method = srs samprate=0.10
seed=12345 out=data_control;
strata rev_tag Premiership_level;
run;
/*Finally tag (if you want for more clarity) your 10% data as control
group*/
Data data_control;
Set data_control;
Group = "Control";
Run;
Надеюсь это поможет:-)