R: Демографическая таблица 1 для подгрупп, использующих dplyr
У меня есть данные по одной строке на человека с демографическими переменными. Я хотел бы создать демографическую таблицу 1, используя один и тот же фрейм данных, но для разных подгрупп. Я хотел бы сначала организовать по var1 (A v B) и var2 (C v D).
Мои данные выглядят примерно так, но для тысяч людей и многих других демографических переменных, кроме возраста и региона:
ID var1 var2 age region
111 A C 40 NE
222 B C 32 S
333 A D 50 S
До сих пор я пробовал следующее:
Demographics <- mydata %>% group_by(var1, var2) %>% summarise(mean_age = mean(mydata$age), sd_age = sd(mydata$age),
n_NEregion = sum(mydata$region=="NE"), prop_NEregion = round(sum(mydata$region=="NE")/length(mydata$region)*100, digits=1))
Тем не менее, мой вывод одинаков во всех 4 группах (var1A-var2C, var1A-var2D, var1B-var2C, var1B-var2D). Результаты приведены для всего набора данных, а не разделены на подгруппы. Я все еще хотел бы использовать dplyr для подведения итогов. Я думаю, что мне нужно где-то использовать lapply(), но не знаю где. Я ценю любые предложения.