Почему импутация мышей дает мне другие результаты после обновления версии R?

После перехода с компьютера под управлением R 3.4.0 на компьютер под управлением R 3.5.0 точно такой же код дает мне другие результаты для моего вменения с использованием пакета mice, который изменился с версии 2.46.0 на 3.3.0. В частности, некоторые (возможно, все) вмененные значения отличаются, но более заметно, что два столбца из приблизительно 50 не вменяются вообще. Эти столбцы имеют приблизительно 50 в основном уникальных известных значений и 3700 пропущенных значений. В двух других столбцах было меньше известных значений, и они были успешно вменены. Примерно в 20 столбцах отсутствовали значения, все из которых были числовыми, и, за исключением двух ранее упомянутых, все были успешно вменены. Я установил случайное семя.

Я новичок в области науки о данных, но я подозреваю, что это связано с версией пакета мышей. К сожалению, мне не удалось найти какую-либо информацию, которая объясняет, почему это может произойти или как это исправить.

#Pseudocode
#Function for determining method for mice, based on data type of each feature (skip dates)
myMeth <- function(myData) {
    featureType <- sapply(myData,function(feature) {class(feature)[1]})
    return(for each datatype in featureType, character types get "polyreg",
        numeric types get "pmm", date types get "")
}

#Perform imputation
#I exclude features with exactly 2 unique values because it was causing
#    a "failed to converge" fatal error in R 3.4.0
myImputation <- mice(myData, meth=myMeth(myData), pred=quickpred(myData, mincor=0.1,
    minpuc=0.1, exclude=c(featuresWithDateType, featuresWithLessThan3UniqueValues)),
    m=myTotalImputations, maxit=myMaxIterations, seed=1)

0 ответов

Другие вопросы по тегам