Отбросить переменные с одним уровнем фактора, исключая НС
Мне нужно отбросить факторные переменные с одним уровнем (исключая NA) во вложенном наборе данных. Функция под 'drop_fixed_factors' рассматривает NA как один уровень при оценке количества уровней факторов. Помогите мне исправить это так, что для A==Y, B имеет один уровень (A), а не два (A, NA).
df <- tibble::tribble(
~A, ~B,
"X", "A",
"X", "B",
"Y", "A",
"Y", NA_character_,
"Z", "A",
"Z", "B",
"Z", NA_character_,
"K", "A",
"K", "A",
"L", NA_character_,
"L", NA_character_,
)
df$B <- as.factor(df$B)
dfgrp <- df %>%
group_by(A) %>%
nest()
drop_fixed_factors <- function(x) {
x %>% discard(~is.factor(.x) & length(unique(.x))<2)
}
dfgrp1 <- dfgrp %>%
mutate(data_1 = map(data, ~drop_fixed_factors(.x)))
dfgrp1
dfgrp1$data_1[[2]]
Желаемый вывод не должен иметь переменную B для группы A == "Y".
1 ответ
Решение
Вы можете вручную удалить NA
значения в unique
:
drop_fixed_factors <- function(x) {
x %>% discard(~is.factor(.x) & length(unique(na.omit(.x)))<2)
}
В качестве альтернативы вы можете использовать dplyr::n_distinct
и использовать na.rm
аргумент:
drop_fixed_factors <- function(x) {
x %>% discard(~is.factor(.x) & n_distinct(.x, na.rm = TRUE)<2)
}
Обе опции ничего не возвращают для группы "Y".
dfgrp1
# A tibble: 5 x 3
A data data_1
<chr> <list> <list>
1 X <tibble [2 x 1]> <tibble [2 x 1]>
2 Y <tibble [2 x 1]> <tibble [2 x 0]>
3 Z <tibble [3 x 1]> <tibble [3 x 1]>
4 K <tibble [2 x 1]> <tibble [2 x 0]>
5 L <tibble [2 x 1]> <tibble [2 x 0]>