Млр: почему воспроизводимость настройки гиперпараметра не удается при распараллеливании?

Question

Млр: почему воспроизводимость настройки гиперпараметра не удается при распараллеливании?

Я использую код на основе примера быстрого запуска в mlr шпаргалка Я добавил распараллеливание и попытался настроить параметры несколько раз.

Вопрос: Почему воспроизводимость не работает (почему результаты не идентичны), даже если я установил set.seed() каждый раз перед настройкой? Чего не хватает в моем коде? Как мне изменить код для достижения воспроизводимости?

Код (на моем ПК он работает до 1 мин.):

library(mlr)
#> Loading required package: ParamHelpers
library(parallel)
library(parallelMap)

# Load data
data(Soybean, package = "mlbench") 

# Initialize paralelllization
parallelStartSocket(cpus = 2)
#> Starting parallelization in mode=socket with cpus=2.

# Prepare data, task, learner
soy = createDummyFeatures(Soybean, target = "Class")
tsk = makeClassifTask(data = soy, target = "Class")
ho = makeResampleInstance("Holdout", tsk)
tsk.train = subsetTask(tsk, ho$train.inds[[1]])

lrn = makeLearner("classif.xgboost", nrounds = 10)
#> Warning in makeParam(id = id, type = "numeric", learner.param = TRUE, lower = lower, : NA used as a default value for learner parameter missing.
#> ParamHelpers uses NA as a special value for dependent parameters.

# Prepare for hyperparametar tuning
ps = makeParamSet(makeNumericParam("eta", 0, 1))
tc = makeTuneControlMBO(budget = 1)

# Turn off excessive output
configureMlr(show.info = FALSE, show.learner.output = FALSE)

# Tune parameters
suppressMessages({

    # set.seed(123456, "L'Ecuyer-CMRG")
    clusterSetRNGStream(iseed = 123456)
    tr1  = tuneParams(lrn, tsk.train, cv2, acc, ps, tc)

    # set.seed(123456, "L'Ecuyer-CMRG")
    clusterSetRNGStream(iseed = 123456)
    tr2  = tuneParams(lrn, tsk.train, cv2, acc, ps, tc)

})

# Stop paralellization
parallelStop()
#> Stopped parallelization. All cleaned up.

Результаты не идентичны:

all.equal(tr1, tr2)
#>  [1] "Component \"x\": Component \"eta\": Mean relative difference: 0.1849302"                                                                                                             
#>  [2] "Component \"y\": Mean relative difference: 1.074668e-05"                                                                                                                             
#>  [3] "Component \"resampling\": Component \"train.inds\": Component 1: Numeric: lengths (228, 227) differ"                                                                                 
#>  [4] "Component \"resampling\": Component \"train.inds\": Component 2: Numeric: lengths (227, 228) differ"                                                                                 
#>  [5] "Component \"resampling\": Component \"test.inds\": Component 1: Numeric: lengths (227, 228) differ"                                                                                  
#>  [6] "Component \"resampling\": Component \"test.inds\": Component 2: Numeric: lengths (228, 227) differ"                                                                                  
#>  [7] "Component \"mbo.result\": Component \"x\": Component \"eta\": Mean relative difference: 0.1849302"                                                                                   
#>  [8] "Component \"mbo.result\": Component \"y\": Mean relative difference: 1.074668e-05"                                                                                                   
#>  [9] "Component \"mbo.result\": Component \"opt.path\": Component \"env\": Component \"exec.time\": Mean relative difference: 0.1548913"                                                   
#> [10] "Component \"mbo.result\": Component \"opt.path\": Component \"env\": Component \"path\": Component \"eta\": Mean relative difference: 0.773126"                                      
#> [11] "Component \"mbo.result\": Component \"opt.path\": Component \"env\": Component \"path\": Component \"y\": Mean relative difference: 0.03411588"                                      
#> [12] "Component \"mbo.result\": Component \"final.opt.state\": Component \"loop.starttime\": Mean absolute difference: 1.810968"                                                           
#> [13] "Component \"mbo.result\": Component \"final.opt.state\": Component \"opt.path\": Component \"env\": Component \"exec.time\": Mean relative difference: 0.1548913"                    
#> [14] "Component \"mbo.result\": Component \"final.opt.state\": Component \"opt.path\": Component \"env\": Component \"path\": Component \"eta\": Mean relative difference: 0.773126"       
#> [15] "Component \"mbo.result\": Component \"final.opt.state\": Component \"opt.path\": Component \"env\": Component \"path\": Component \"y\": Mean relative difference: 0.03411588"       
#> [16] "Component \"mbo.result\": Component \"final.opt.state\": Component \"opt.problem\": Component \"design\": Component \"eta\": Mean relative difference: 0.773126"                     
#> [17] "Component \"mbo.result\": Component \"final.opt.state\": Component \"opt.result\": Component \"mbo.result\": Component \"x\": Component \"eta\": Mean relative difference: 0.1849302"
#> [18] "Component \"mbo.result\": Component \"final.opt.state\": Component \"opt.result\": Component \"mbo.result\": Component \"y\": Mean relative difference: 1.074668e-05"                
#> [19] "Component \"mbo.result\": Component \"final.opt.state\": Component \"random.seed\": Mean relative difference: 1.28965"                                                               
#> [20] "Component \"mbo.result\": Component \"final.opt.state\": Component \"time.created\": Mean absolute difference: 5.489337"                                                             
#> [21] "Component \"mbo.result\": Component \"final.opt.state\": Component \"time.last.saved\": Mean absolute difference: 5.489337"                                                          
#> [22] "Component \"mbo.result\": Component \"final.opt.state\": Component \"time.used\": Mean relative difference: 0.6841712"

Я тоже пробовал

set.seed(123456, "L'Ecuyer-CMRG")

вместо

parallel::clusterSetRNGStream(iseed = 123456)

и это не привело к воспроизводимости.

Но когда распараллеливание отключено, результаты идентичны (с set.seed(123456, "L'Ecuyer-CMRG") (кроме времени начала / окончания и продолжительности).

2

r parallel-processing mlr reproducible-research

Источник

user4783029 13 июл '18 в 22:11

2 ответа

Решение

Не имеет значения, используется ли параллелизм на основе разветвленных процессов (многоядерных, недоступных в Windows) или на отдельных процессах с сокетной связью. Для многоядерного параллелизма достаточно установить тип семян и RNG перед parallelStart() чтобы получить одинаковые случайные числа при каждом вызове:

library(parallelMap)

suppressMessages({
    set.seed(123456, "L'Ecuyer-CMRG")
    parallelStartMulticore(cpus = 2)
    r1 <- parallelMap(runif, rep(3, 2))
    parallelStop()

    set.seed(123456, "L'Ecuyer-CMRG")
    parallelStartMulticore(cpus = 2)
    r2 <- parallelMap(runif, rep(3, 2))
    parallelStop()
})
all.equal(r1, r2)
#> [1] TRUE

Для параллелизма на основе сокетов мы можем использовать parallel::clusterSetRNGStream() после parallelStart() как уже упоминалось в выпуске GitHub:

library(parallelMap)

suppressMessages({
    parallelStartSocket(cpus = 2)
    parallel::clusterSetRNGStream(iseed = 123456)
    r1 <- parallelMap(runif, rep(3, 2))
    parallelStop()

    parallelStartSocket(cpus = 2)
    parallel::clusterSetRNGStream(iseed = 123456)
    r2 <- parallelMap(runif, rep(3, 2))
    parallelStop()
})
all.equal(r1, r2)
#> [1] TRUE

Это также должно работать с вашей реальной проблемой, хотя я не проверял это.

2

Источник

user8416610 15 июл '18 в 09:26

Другие вопросы по тегам r parallel-processing mlr reproducible-research

user993718 16 июл '18 в 10:09 2018-07-16 10:09 · Accepted Answer · 2018-07-16 10:09

Следующий код создает те же воспроизводимые результаты (кроме времени)

library(mlr)
library(parallel)
library(parallelMap)

# Load data
data(Soybean, package = "mlbench") 

# Initialize paralelllization
parallelStartSocket(cpus = 2)

# Prepare data, task, learner
soy = createDummyFeatures(Soybean, target = "Class")
tsk = makeClassifTask(data = soy, target = "Class")
ho = makeResampleInstance("Holdout", tsk)
tsk.train = subsetTask(tsk, ho$train.inds[[1]])

lrn = makeLearner("classif.xgboost", nrounds = 10)

# Prepare for hyperparametar tuning
ps = makeParamSet(makeNumericParam("eta", 0, 1))
tc = makeTuneControlMBO(budget = 1)

# Turn off excessive output
configureMlr(show.info = FALSE, show.learner.output = FALSE)

# Tune parameters
suppressMessages({

  set.seed(123456, "L'Ecuyer-CMRG")
  clusterSetRNGStream(iseed = 123456)
  tr1  = tuneParams(lrn, tsk.train, cv2, acc, ps, tc)

  set.seed(123456, "L'Ecuyer-CMRG")
  clusterSetRNGStream(iseed = 123456)
  tr2  = tuneParams(lrn, tsk.train, cv2, acc, ps, tc)

})

parallelStop()

Что я изменил? Я также установил местное семя. Зачем? Потому что речь идет не только о посеве на параллельные процессы. Также важен посев на основной машине, так как он влияет, например. пересчет (который рисуется на мастере).