Как удалить пациентов с менее чем 2 посещениями данных
У меня есть продольный набор данных, структурированный как 1 ряд за посещение.
Числовой идентификационный номер пациента указывает на уникальных пациентов.
Как я могу удалить всех пациентов с менее чем 2 наблюдениями из моего набора данных?
Поэтому для этого примера я хочу удалить строки с пациентом 105 и 110.
пример
Patient ID Disease Score
101 5
101 2
101 2
105 1
110 5
115 1
115 1
1 ответ
Решение
dat <- read.table(text="Patient ID,Disease Score
101,5
101,2
101,2
105,1
110,5
115,1
115,1", stringsAs=FALSE, header=TRUE, sep=",")
# one way in base
dat[dat$Patient.ID %in% names(which(table(dat$Patient.ID)>2)),]
# one way in dplyr
library(dplyr)
dat %>%
group_by(Patient.ID) %>%
mutate(n=n()) %>%
ungroup() %>%
filter(n>=2) %>%
select(Patient.ID, Disease.Score)