R "для цикла" и / или Применить для динамического преобразования нескольких переменных
Я пытаюсь перевести / воспроизвести в R сокращенную технику "для цикла", которую я бы использовал в EViews. Я пытаюсь воспроизвести цикл for, в котором я бы разделил одну переменную временного ряда на другую (векторы) и сохранил ее как новую серию.
Поскольку я использую общее соглашение об именах (например, GDP (реальный), GDPn (номинальный) и GDP_P (цены), см. Пример EViews ниже), я могу объявить список переменных один раз и использовать изменения в суффиксе ("n" или "_P") для создания динамических имен рядов и циклического выполнения необходимых мне вычислений. Мои входные данные - это серия расходов по национальным счетам.
'EViews shorthand "for next" loop:
%CATS = "GDP CONS INV GOV EX IM"
for %CATS {%cats}
series {%cats}_P= {%cats}n / {%cats}
next
'Which is shorthand replication of below ("series" declares a series of the subsequent name):
series GDP_P = GDPn / GDP
series CONS_P = CONSn / CONS
series INV_P = INVn / INV
series GOV_P = GOVn / GOV
series EX_P = EXn / EX
series IM_P = IMn / IM
До сих пор я пытался использовать цикл R for (который я прочитал не является предпочтительным способом в R), создав вектор имени серии и использовав "assign (paste") для выполнения вычисления. Пример приведен ниже, но он не работает. Из того, что я прочитал о команде "for", объявленный ряд для "i" может быть только вектором значений или вектором имен без дополнительного контекста:
cats<-c("GDP","CONS","GOV","INV","EX","IM")
for (i in cats){
assign(paste(i, "_P",sep=""), paste(i, "n",sep="")/i)
}
Я также много читал о функции apply и ее производных, но не понимаю, как это работает в приведенном выше сценарии. Любые предложения о том, как сделать это в R, полезны.
2 ответа
Ваша функция должна работать так:
cats<-c("GDP","CONS","GOV","INV","EX","IM")
for (i in cats){
assign(paste(i, "_P",sep=""), get(paste(i, "n",sep=""))/get(i))
}
get
будет использовать предоставленные вами строки и найти вектор с этим именем.
Есть также не-цикличный способ сделать это, используя идею одного из ответов здесь:
txt<-paste0(cats, "_P <- ", cats, "n/", cats)
eval(parse(text=txt))
txt
будет включать в себя список всех строк, которые вы должны были бы ввести, чтобы создать все ваши векторы вручную, а затем eval(parse(text=txt))
берет каждую из этих команд и выполняет их одну за другой.
Конечно, вы можете пропустить присвоение текста txt
- Я просто хотел, чтобы было яснее, что здесь происходит:
eval(parse(text=paste0(cats, "_P <- ", cats, "n/", cats)))
Рассмотрите возможность работы со списками, особенно для многих похожих элементов. Таким образом вы сможете лучше управлять своей глобальной средой и обрабатывать данные более компактно и эффективно. Для вас это означает сохранение 3 списков векторов вместо 18 отдельных именованных векторов (2 исходных набора и новый 3-й набор). Использование assign
Динамическое создание переменных на лету обычно указывает на возможность использования именованного списка.
В частности, собрать ваши элементы в GDPn_list и GDP_list, а затем использовать Map
(не упрощенная оболочка для mapply
) для поэтапной итерации между обоими списками одинаковой длины, вызывающими функцию деления /
, Затем назовите список с setNames()
, Ниже показаны случайные данные, но вы можете использовать закомментированные строки для построения списка.
Исходные данные
cats <- c("GDP","CONS","GOV","INV","EX","IM")
set.seed(9272018)
GDPn_list <- setNames(replicate(6, runif(50)*120, simplify=FALSE), paste0(cats, "n"))
# GDPn_list <- list(GDPn, CONSn, GOVn, INVn, EXn, IMn)
str(GDPn_list)
# List of 6
# $ GDPn : num [1:50] 52.4 31.9 10.6 118.4 66 ...
# $ CONSn: num [1:50] 18.27 22.3 95.13 87.44 9.79 ...
# $ GOVn : num [1:50] 48.83 69.73 113.61 35.53 1.21 ...
# $ INVn : num [1:50] 51.9 96.9 28.2 67.2 19 ...
# $ EXn : num [1:50] 28.3 94.3 42.3 65.5 83.6 ...
# $ IMn : num [1:50] 109.3 26.6 60.2 78.2 55.5 ...
GDP_list <- setNames(replicate(6, runif(50)*100, simplify=FALSE), cats)
# GDPn_list <- list(GDP, CONS, GOV, INV, EX, IM)
str(GDP_list)
# List of 6
# $ GDP : num [1:50] 51.1 65.9 41.5 24.5 87.3 ...
# $ CONS: num [1:50] 47.66 77.32 46.97 48.61 2.98 ...
# $ GOV : num [1:50] 32.6 70.3 21.5 73.4 97.8 ...
# $ INV : num [1:50] 80.7 16.8 57.4 80.7 12.1 ...
# $ EX : num [1:50] 38.1 78.1 40.6 62.8 61.9 ...
# $ IM : num [1:50] 39.8 84.8 11.4 39.7 14.7 ...
Новые данные
GDPp_list <- setNames(Map(`/`, GDPn_list, GDP_list), paste0(cats, "p"))
str(GDPp_list)
# List of 6
# $ GDPp : num [1:50] 1.025 0.484 0.256 4.835 0.756 ...
# $ CONSp: num [1:50] 0.383 0.288 2.025 1.799 3.286 ...
# $ GOVp : num [1:50] 1.4969 0.9921 5.2891 0.4844 0.0124 ...
# $ INVp : num [1:50] 0.644 5.775 0.491 0.832 1.578 ...
# $ EXp : num [1:50] 0.744 1.207 1.043 1.043 1.352 ...
# $ IMp : num [1:50] 2.747 0.314 5.293 1.971 3.783 ...
И вы по-прежнему можете ссылаться на свои базовые числовые векторы через имена или номера индексов, не теряя при этом никакой функциональности или данных:
GDPp_list$GDPp
GDPp_list$CONSp
GDPp_list$GOVp
...
GDPp_list[[1]]
GDPp_list[[2]]
GDPp_list[[3]]
...
А если векторы равной длины, постройте матрицу из ваших списков! На этот раз с помощью mapply
:
GDPp_matrix <- mapply(`/`, GDPn_list, GDP_list)
colnames(GDPp_matrix) <- paste0(cats, "p")
head(GDPp_matrix)
# GDPp CONSp GOVp INVp EXp IMp
# [1,] 1.0252871 0.3832836 1.49687150 0.6436575 0.7441159 2.746551
# [2,] 0.4835700 0.2884577 0.99208666 5.7753575 1.2067694 0.314102
# [3,] 0.2562130 2.0251752 5.28913247 0.4910816 1.0429316 5.292843
# [4,] 4.8345697 1.7987625 0.48436284 0.8322211 1.0431301 1.970523
# [5,] 0.7563794 3.2859395 0.01236608 1.5781949 1.3518592 3.783420
# [6,] 0.1515318 10.9332338 1.10608066 13.7953500 0.7211371 1.918249