R: Оценить функцию для всех парных сравнений текущего наблюдения и предыдущих наблюдений
Уравнение для моделирования в R
Переменная gdp_pc_ppp
соответствует у в уравнении. Переменная gdp_pc_ppp
уже отсортировано от наименьшего к наибольшему значению. Переменная world_pop_share
соответствует р в уравнении.
Мне нужно написать код на R, который создает новую переменную следующим образом:
For the first row, it evaluates to NA
For the second row: (651.9531 - 378.5343)*9.568926e-03*2.636202e-03
For the third row: ((742.9709 - 651.9531)*8.084378e-03*9.568926e-03)
+ ((742.9709 - 378.5343)*8.084378e-03*2.636202e-03)
For the fourth row: ((744.1971 - 742.9709)*1.878016e-03*8.084378e-03)
+ ((744.1971 - 651.9531)*1.878016e-03*9.568926e-03)
+ ((744.1971 - 378.5343)*1.878016e-03*2.636202e-03)
Так далее и так далее для следующих наблюдений.
Мне нужно было делать это в разные годы, поэтому я пытался сделать это в рамках синтаксиса аккуратных стихов.
Например:
d = d %>%
group_by(year) %>%
mutate( INSERT HERE FUNCTION THAT WOULD CALCULATE EQUATION ABOVE )
Спасибо.
1 ответ
Решение
Я думаю, что это ваши данные, более или менее.
data <- data.frame(country=c("Moz.", "Eth.", "Mya.", "Mal.", "Uga."),
year= c(1990, 1990, 1990, 1990, 1990),
gdp_pc_ppp=c(378.5, 651.9, 742.9, 744.2, 782.0),
world_pop_share=c(2.6e-3,9.5e-3,8.1e-3,1.8e-3,3.5e-3))
Чтобы делать то, что вы хотите, я написал эту функцию.
my.math <- function(data, y, p) {
# check args
if(!is.data.frame(data))
stop("Bad input!")
# Do the math
out <- sapply(2:nrow(data), (function(i){
p.i <- data[i, p]
y.i <- data[i, y]
sum(sapply(1:i, (function(j){
p.tmp <- data[j, p]
y.tmp <- data[j, y]
(y.i - y.tmp) * p.i * p.tmp
})), na.rm = TRUE)
}))
return(c(NA, out))
}
И вот как вы можете получить свой результат. Это работает как ожидалось?
my.math(data,
y = 3, # your y is the third column
p = 4) # your p is the fourth column)
В моих руках возвращается:
[1] NA 0.00675298 0.01467671 0.00330876 0.00934430