Задайте имя для применения результатов

Я применяю функцию на dataframe,

Но в отличие от sapply и его друзья, apply не имеет никакого USE.NAME аргумент для получения именованного списка в качестве возвращаемого объекта.

В этом примере я хотел бы C столбец для имен возвращаемого списка:

df = data.frame(A=c(1,2,3), B=c(9,5,7), C=c("A", "Z", "E"))
apply(df, 1, function(x){
  data.frame(xxx=as.numeric(x[1]) * as.numeric(x[2]))
})
# [[1]]
# xxx
# 1   9
# 
# [[2]]
# xxx
# 1  10
# 
# [[3]]
# xxx
# 1  21

Как мне этого добиться?

4 ответа

Решение

Вы могли бы сделать:

apply(data.frame(df, row.names = df$C), 1, function(x){
  data.frame(xxx=as.numeric(x[1]) * as.numeric(x[2]))
})
#$A
#  xxx
#1   9
#
#$Z
#  xxx
#1  10
#
#$E
#  xxx
#1  21

Объяснение: apply поднимать list имена из dimnames вашего соответствующего MARGIN вашей data.frame (в твоем случае MARGIN=1, так list имена будут соответствовать именам строк).

Или использовать setNames() после звонка подать заявку:

 setNames(apply(df, 1, function(x) {
                         data.frame(xxx=as.numeric(x[1]) * as.numeric(x[2])) 
                       }), df$C)

Если на выходе должно быть произведение двух столбцов в listтогда это можно сделать с Reduce

lst <- as.list(Reduce(`*`, df[-3]))
names(lst) <- df[,3]

Или с tidyverse

library(tidyverse)
df %>% 
   transmute(xxx = A * B, C) %>% 
   split(.$C) %>% 
   map(~.x %>% 
      select(xxx))

Или с nest

df %>% 
   transmute(xxx = A * B, C) %>%
   nest(xxx)  %>% 
   mutate(data = set_names(data, C)) %>% 
   pull(data)
#$A
#   xxx
#1   9

#$Z
#   xxx
#2  10

#$E
#   xxx
#3  21

Вам не нужно apply-функция для этого. Вы можете просто сделать:

 setNames(as.list(df[[1]] * df[[2]]), df[[3]])

Результат:

$A
[1] 9

$Z
[1] 10

$E
[1] 21
Другие вопросы по тегам