Создание стратифицированной выборки в SAS с известными стратами

У меня целевая популяция с некоторыми характеристиками, и меня попросили выбрать соответствующий контроль на основе этих характеристик. Я пытаюсь сделать стратифицированную выборку с использованием базы SAS, но мне нужно иметь возможность определить мои 4 звезды%s от моей цели и применить их к моей выборке. Есть ли способ, которым я могу это сделать? Спасибо!

1 ответ

Для стратифицированной выборки вы можете использовать PROC SURVEYSELECT

Here is an example:-

/*Dataset creation*/

data data_dummy;
input revenue revenue_tag Premiership_level;
   datalines;
1000 High 1
90 Low 2
500 Medium 3
1200 High 4
;
run;


/*Now you need to Sort by rev_tag, Premiership_level (say these are the 
 variables you need to do stratified sampling on)*/
proc sort data = data_dummy;
by rev_tag  Premiership_level;
run;



/*Now use SURVEYSELECT to do stratified sampling using 10% samprate (You can 
change this 10% as per your requirement)*/

/*Surveyselect is used to pick entries for groups such that , both the 
  groups created are similar in terms of variables specified under strata*/

     proc surveyselect data=data_dummy method = srs samprate=0.10
     seed=12345 out=data_control;
     strata rev_tag  Premiership_level;
     run;

/*Finally tag (if you want for more clarity) your 10% data as control 
group*/
     Data data_control;
     Set data_control;
     Group = "Control";
     Run;

Надеюсь это поможет:-)

Другие вопросы по тегам