Список возврата против среды из функции R
Какие преимущества / недостатки есть в использовании одного над другим в следующих двух случаях? Case-I возвращает свои выходные данные как среду, а Case-II возвращает свои выходные данные в виде списка.
Случай I:
function(x) {
ret <- new.env()
ret$x <- x
ret$y <- x^2
return(ret)
}
Случай II:
function(x) {
ret <- list()
ret$x <- x
ret$y <- x^2
return(ret)
}
1 ответ
Хотя, похоже, есть различия в возврате списка и окружающей среды. Из Advanced R:
Обычно среда похожа на список с четырьмя важными исключениями:
Каждое имя в окружающей среде уникально.
Имена в среде не упорядочены (т. Е. Не имеет смысла спрашивать, что является первым элементом среды).
У среды есть родитель.
Среды имеют ссылочную семантику.
С технической точки зрения, среда состоит из двух компонентов: фрейма, который содержит привязки имени-объекта (и ведет себя так же, как именованный список), и родительской среды. К сожалению, "frame" используется в R. противоречиво. Например, parent.frame() не предоставляет вам родительский фрейм среды. Вместо этого он предоставляет вам среду вызова. Это обсуждается более подробно в вызывающих средах.
Из справки:
help(new.env)
Среды состоят из фрейма или набора именованных объектов и указателя на окружающую среду. Наиболее распространенным примером является кадр переменных, локальный для вызова функции; его вложением является среда, в которой была определена функция (если не было изменено впоследствии). Окружающая среда отличается от родительского фрейма: последний (возвращаемый parent.frame) относится к среде вызывающей функции. Поскольку путаница настолько проста, лучше никогда не использовать "parent" в связи с окружением (несмотря на наличие функции parent.env).
из документации функции:
e1 <- new.env(parent = baseenv()) # this one has enclosure package:base.
e2 <- new.env(parent = e1)
assign("a", 3, envir = e1)
ls(e1)
#[1] "a"
тем не мение ls
даст дает созданную среду:
ls()
#[1] "e1" "e2"
И вы можете получить доступ к своим объектам окружающей среды, как список:
e1$a
#[1] 3
Играя с вашими функциями:
f1 <- function(x) {
ret <- new.env()
ret$x <- x
ret$y <- x^2
return(ret)
}
res <- f1(2)
res
#<environment: 0x0000021d55a8a3e8>
res$y
#[1] 4
f2 <- function(x) {
ret <- list()
ret$x <- x
ret$y <- x^2
return(ret)
res2 <- f(2)
res2
#$x
#[1] 2
#$y
#[1] 4
res2$y
#[1] 4
Их производительность очень похожа, согласно microbenchmarking
:
microbenchmark::microbenchmark(
function(x) {
ret <- new.env()
ret$x <- x
ret$y <- x^2
return(ret)
},
function(x) {
ret <- list()
ret$x <- x
ret$y <- x^2
return(ret)
},
times = 500L
)
#Unit: nanoseconds
# #expr
# function(x) { ret <- new.env() ret$x <- x ret$y <- x^2 #return(ret) }
# function(x) { ret <- list() ret$x <- x ret$y <- x^2 #return(ret) }
# min lq mean median uq max neval
# 0 1 31.802 1 100 801 500
# 0 1 37.802 1 100 2902 500
и они возвращают объекты с одинаковыми размерами:
object.size(res)
#464 bytes
object.size(res2)
#464 bytes
и вы всегда можете создать список из среды (list2env
) и обратное тоже (as.list
):
L <- list(a = 1, b = 2:4, p = pi, ff = gl(3, 4, labels = LETTERS[1:3]))
e <- list2env(L)
e$ff
# [1] A A A A B B B B C C C C
#Levels: A B C
as.list(e)
#$ff
# [1] A A A A B B B B C C C C
#Levels: A B C
#
#$p
#[1] 3.141593
#
#$b
#[1] 2 3 4
#
#$a
#[1] 1