Функция распараллеливания с использованием внешних указателей (XPtr)
Этот вопрос не является ни дубликатом этого, ни этого, который касался функций, возвращающих внешние указатели.
Вот проблема. Далее в коде Rcpp определены две функции: одна создает XPtr, а другая может работать на XPtr.
#include <Rcpp.h>
using namespace Rcpp;
//[[Rcpp::export]]
SEXP f(int n) {
std::vector<int> * v = new std::vector<int>;
for(int i = 0; i < n; i++)
v->push_back(i);
XPtr< std::vector<int> > p(v, true);
return p;
}
//[[Rcpp::export]]
int g(XPtr< std::vector<int> > p, int i) {
return (*p)[i];
И это прекрасно работает
> x <- f(100)
> g(x, 45)
[1] 45
Попробуем распараллелить звонки g
, Это работает:
require(parallel)
test1 <- function(a) {
cl <- makeForkCluster(nnodes=2)
r <- parLapply(cl, 1:5, function(i) g(a,i) )
stopCluster(cl)
return(r)
}
Ожидаемое поведение:
> unlist( test1(x) )
[1] 1 2 3 4 5
Но это не работает:
test2 <- function(a) {
cl <- makeForkCluster(nnodes=2)
p <- g(a, 0)
r <- parLapply(cl, 1:5, function(i) g(a,i) )
stopCluster(cl)
return(r)
}
Неожиданное поведение:
> test2(x)
Error in checkForRemoteErrors(val) :
2 nodes produced errors; first error: external pointer is not valid
Проблема возникает из-за того, что внешний указатель используется в функции один раз перед вызовом ведомых в кластере. Чем объясняется такое поведение, и есть ли обходной путь? Спасибо заранее.
1 ответ
В начале вашей функции, a
это обещание, то есть то, что говорит оценить определенное выражение в определенной среде. Когда вы обращаетесь к переменной, выражение вычисляется, так что теперь a
является указателем, и этот указатель является специфическим для конкретного экземпляра R. Вы можете посмотреть на это, используя pryr::promise_info
:
test2 <- function(a) {
cl <- makeForkCluster(nnodes = 2)
print(pryr::promise_info(a))
p <- g(a, 0)
print(pryr::promise_info(a))
stopCluster(cl)
return(r)
}
Выход:
$code
x
$env
<environment: R_GlobalEnv>
$evaled
[1] FALSE
$value
NULL
$code
x
$env
NULL
$evaled
[1] TRUE
$value
<pointer: 0x565295e3a410>
Одним из способов является использование eval(substitute(a))
:
test2 <- function(a) {
cl <- makeForkCluster(nnodes = 2)
print(pryr::promise_info(a))
p <- g(eval(substitute(a)), 0)
print(pryr::promise_info(a))
r <- parLapply(cl, 1:5, function(i) g(a,i) )
stopCluster(cl)
return(r)
}
Я уверен, что есть лучшие способы. Нестандартные оценки все еще немного чужды мне...