Распространение нескольких столбцов по столбцу в R
Извините, потому что этот вопрос задавался несколько раз, но мне все еще не удается обернуть голову вокруг этой проблемы.
Итак, у меня есть датафрейм в форме:
ID Val Type
1 10 A
2 11 A
2 10 C
3 10 B
3 12 C
4 9 B
Это не очень помогает, но вы можете использовать
library(tidyr)
test <- data.frame(ID = c(1,2,2,3,3,4),
Val = c(10,11,10,10,12,9),
Type = c('A', 'A', 'C', 'B', 'C', 'B'))
Я хотел бы разделить его, чтобы получить:
ID A.Type B.Type C.Type A.Val B.Val C.Val
1 1 0 0 10 0 0
2 1 0 1 11 0 10
3 0 1 1 0 10 12
4 0 0 0 0 9 0
Я знаю, как получить столбцы 1:4
с помощью:
table(test[, c(1, 3)]) %>% as.data.frame() %>% spread(Type, Freq)
Это последние три, мне нужна помощь, потому что в фактических значениях данных кадра являются непрерывными и table
не может быть использован.
1 ответ
Вы пытаетесь изменить свои данные с помощью нескольких переменных значений, где эти переменные фактически неявны, поэтому для type_...
столбцы, вам нужно будет создать новую переменную типа с теми, а затем использовать dcast
от data.table
пакет:
library(data.table)
setDT(test)
dcast(test[, type := 1][], ID ~ Type, value.var = c("type", "Val"),fill = 0)
# ID type_A type_B type_C Val_A Val_B Val_C
# 1: 1 1 0 0 10 0 0
# 2: 2 1 0 1 11 0 10
# 3: 3 0 1 1 0 10 12
# 4: 4 0 1 0 0 9 0
Или вы можете использовать reshape
от базы R, где NA
должен быть заменен вручную:
test$type = 1
reshape(test, idvar = "ID", timevar = "Type", direction = "wide")
# ID Val.A type.A Val.C type.C Val.B type.B
# 1 1 10 1 NA NA NA NA
# 2 2 11 1 10 1 NA NA
# 4 3 NA NA 12 1 10 1
# 6 4 NA NA NA NA 9 1