R: Демографическая таблица 1 для подгрупп, использующих dplyr

У меня есть данные по одной строке на человека с демографическими переменными. Я хотел бы создать демографическую таблицу 1, используя один и тот же фрейм данных, но для разных подгрупп. Я хотел бы сначала организовать по var1 (A v B) и var2 (C v D).

Мои данные выглядят примерно так, но для тысяч людей и многих других демографических переменных, кроме возраста и региона:

    ID    var1    var2    age    region
    111   A       C       40     NE
    222   B       C       32     S
    333   A       D       50     S

До сих пор я пробовал следующее:

    Demographics <- mydata %>% group_by(var1, var2) %>% summarise(mean_age = mean(mydata$age), sd_age = sd(mydata$age),
        n_NEregion = sum(mydata$region=="NE"), prop_NEregion = round(sum(mydata$region=="NE")/length(mydata$region)*100, digits=1))

Тем не менее, мой вывод одинаков во всех 4 группах (var1A-var2C, var1A-var2D, var1B-var2C, var1B-var2D). Результаты приведены для всего набора данных, а не разделены на подгруппы. Я все еще хотел бы использовать dplyr для подведения итогов. Я думаю, что мне нужно где-то использовать lapply(), но не знаю где. Я ценю любые предложения.

0 ответов

Другие вопросы по тегам