R "для цикла" и / или Применить для динамического преобразования нескольких переменных

Я пытаюсь перевести / воспроизвести в R сокращенную технику "для цикла", которую я бы использовал в EViews. Я пытаюсь воспроизвести цикл for, в котором я бы разделил одну переменную временного ряда на другую (векторы) и сохранил ее как новую серию.

Поскольку я использую общее соглашение об именах (например, GDP (реальный), GDPn (номинальный) и GDP_P (цены), см. Пример EViews ниже), я могу объявить список переменных один раз и использовать изменения в суффиксе ("n" или "_P") для создания динамических имен рядов и циклического выполнения необходимых мне вычислений. Мои входные данные - это серия расходов по национальным счетам.

'EViews shorthand "for next" loop:

%CATS = "GDP CONS INV GOV EX IM"
 for %CATS {%cats}
   series {%cats}_P= {%cats}n / {%cats}
 next

'Which is shorthand replication of below ("series" declares a series of the subsequent name):

series GDP_P    = GDPn / GDP
series CONS_P   = CONSn / CONS
series INV_P    = INVn /  INV
series GOV_P    = GOVn / GOV
series EX_P     = EXn / EX
series IM_P     = IMn / IM

До сих пор я пытался использовать цикл R for (который я прочитал не является предпочтительным способом в R), создав вектор имени серии и использовав "assign (paste") для выполнения вычисления. Пример приведен ниже, но он не работает. Из того, что я прочитал о команде "for", объявленный ряд для "i" может быть только вектором значений или вектором имен без дополнительного контекста:

cats<-c("GDP","CONS","GOV","INV","EX","IM")
for (i in cats){
  assign(paste(i, "_P",sep=""), paste(i, "n",sep="")/i)
}

Я также много читал о функции apply и ее производных, но не понимаю, как это работает в приведенном выше сценарии. Любые предложения о том, как сделать это в R, полезны.

2 ответа

Решение

Ваша функция должна работать так:

cats<-c("GDP","CONS","GOV","INV","EX","IM")
for (i in cats){
  assign(paste(i, "_P",sep=""), get(paste(i, "n",sep=""))/get(i))
}

get будет использовать предоставленные вами строки и найти вектор с этим именем.

Есть также не-цикличный способ сделать это, используя идею одного из ответов здесь:

txt<-paste0(cats, "_P <- ", cats, "n/", cats)
eval(parse(text=txt))

txt будет включать в себя список всех строк, которые вы должны были бы ввести, чтобы создать все ваши векторы вручную, а затем eval(parse(text=txt)) берет каждую из этих команд и выполняет их одну за другой.

Конечно, вы можете пропустить присвоение текста txt - Я просто хотел, чтобы было яснее, что здесь происходит:

eval(parse(text=paste0(cats, "_P <- ", cats, "n/", cats)))

Рассмотрите возможность работы со списками, особенно для многих похожих элементов. Таким образом вы сможете лучше управлять своей глобальной средой и обрабатывать данные более компактно и эффективно. Для вас это означает сохранение 3 списков векторов вместо 18 отдельных именованных векторов (2 исходных набора и новый 3-й набор). Использование assign Динамическое создание переменных на лету обычно указывает на возможность использования именованного списка.

В частности, собрать ваши элементы в GDPn_list и GDP_list, а затем использовать Map (не упрощенная оболочка для mapply) для поэтапной итерации между обоими списками одинаковой длины, вызывающими функцию деления /, Затем назовите список с setNames(), Ниже показаны случайные данные, но вы можете использовать закомментированные строки для построения списка.

Исходные данные

cats <- c("GDP","CONS","GOV","INV","EX","IM")

set.seed(9272018)
GDPn_list <- setNames(replicate(6, runif(50)*120, simplify=FALSE), paste0(cats, "n"))
# GDPn_list <- list(GDPn, CONSn, GOVn, INVn, EXn, IMn)

str(GDPn_list)
# List of 6
#  $ GDPn : num [1:50] 52.4 31.9 10.6 118.4 66 ...
#  $ CONSn: num [1:50] 18.27 22.3 95.13 87.44 9.79 ...
#  $ GOVn : num [1:50] 48.83 69.73 113.61 35.53 1.21 ...
#  $ INVn : num [1:50] 51.9 96.9 28.2 67.2 19 ...
#  $ EXn  : num [1:50] 28.3 94.3 42.3 65.5 83.6 ...
#  $ IMn  : num [1:50] 109.3 26.6 60.2 78.2 55.5 ...

GDP_list <- setNames(replicate(6, runif(50)*100, simplify=FALSE), cats)
# GDPn_list <- list(GDP, CONS, GOV, INV, EX, IM)

str(GDP_list)    
# List of 6
#  $ GDP : num [1:50] 51.1 65.9 41.5 24.5 87.3 ...
#  $ CONS: num [1:50] 47.66 77.32 46.97 48.61 2.98 ...
#  $ GOV : num [1:50] 32.6 70.3 21.5 73.4 97.8 ...
#  $ INV : num [1:50] 80.7 16.8 57.4 80.7 12.1 ...
#  $ EX  : num [1:50] 38.1 78.1 40.6 62.8 61.9 ...
#  $ IM  : num [1:50] 39.8 84.8 11.4 39.7 14.7 ...

Новые данные

GDPp_list <- setNames(Map(`/`, GDPn_list, GDP_list), paste0(cats, "p"))

str(GDPp_list)    
# List of 6
#  $ GDPp : num [1:50] 1.025 0.484 0.256 4.835 0.756 ...
#  $ CONSp: num [1:50] 0.383 0.288 2.025 1.799 3.286 ...
#  $ GOVp : num [1:50] 1.4969 0.9921 5.2891 0.4844 0.0124 ...
#  $ INVp : num [1:50] 0.644 5.775 0.491 0.832 1.578 ...
#  $ EXp  : num [1:50] 0.744 1.207 1.043 1.043 1.352 ...
#  $ IMp  : num [1:50] 2.747 0.314 5.293 1.971 3.783 ...

И вы по-прежнему можете ссылаться на свои базовые числовые векторы через имена или номера индексов, не теряя при этом никакой функциональности или данных:

GDPp_list$GDPp
GDPp_list$CONSp
GDPp_list$GOVp
...

GDPp_list[[1]]
GDPp_list[[2]]
GDPp_list[[3]]
...

А если векторы равной длины, постройте матрицу из ваших списков! На этот раз с помощью mapply:

GDPp_matrix <- mapply(`/`, GDPn_list, GDP_list)
colnames(GDPp_matrix) <- paste0(cats, "p")

head(GDPp_matrix)

#           GDPp      CONSp       GOVp       INVp       EXp      IMp
# [1,] 1.0252871  0.3832836 1.49687150  0.6436575 0.7441159 2.746551
# [2,] 0.4835700  0.2884577 0.99208666  5.7753575 1.2067694 0.314102
# [3,] 0.2562130  2.0251752 5.28913247  0.4910816 1.0429316 5.292843
# [4,] 4.8345697  1.7987625 0.48436284  0.8322211 1.0431301 1.970523
# [5,] 0.7563794  3.2859395 0.01236608  1.5781949 1.3518592 3.783420
# [6,] 0.1515318 10.9332338 1.10608066 13.7953500 0.7211371 1.918249
Другие вопросы по тегам