Как удалить пациентов с менее чем 2 посещениями данных

У меня есть продольный набор данных, структурированный как 1 ряд за посещение.
Числовой идентификационный номер пациента указывает на уникальных пациентов.

Как я могу удалить всех пациентов с менее чем 2 наблюдениями из моего набора данных?

Поэтому для этого примера я хочу удалить строки с пациентом 105 и 110.

пример

Patient ID   Disease Score
101             5
101             2
101             2
105             1
110             5
115             1
115             1

1 ответ

Решение
dat <- read.table(text="Patient ID,Disease Score
101,5
101,2
101,2
105,1
110,5
115,1
115,1", stringsAs=FALSE, header=TRUE, sep=",")

# one way in base
dat[dat$Patient.ID %in% names(which(table(dat$Patient.ID)>2)),]

# one way in dplyr
library(dplyr)

dat %>% 
  group_by(Patient.ID) %>%
  mutate(n=n()) %>%
  ungroup() %>%
  filter(n>=2) %>%
  select(Patient.ID, Disease.Score)
Другие вопросы по тегам