Целочисленная ошибка переполнения при использовании функции Gini пакета DescTools
Я хочу рассчитать коэффициенты Джини, используя Gini()
от DescTools
(потому что он предлагает простой способ вычисления "несмещенных" коэффициентов Джини с весами, доверительными интервалами и т. д.), но я получаю некоторые ошибки, когда использую эту функцию с "большими" выборками. Вот простой пример, который выдает ошибку на моей стороне:
library("DescTools")
x1 <- sample(c(1:100000), 50) #Here I create a sample of 50 cases varying from 1 to 100,000
Gini(x1) #Here I use the Gini function without any parameters, and it returns the Gini coefficient as expected:
[1] 0.3153713
x2 <- sample(c(1:100000), 500) #Now, I create a sample of 500 cases varying from 1 to 100,000
Gini(x2) #And if I compute the Gini coefficient with the same parameters, I get the following error:
[1] NA
Предупреждающие сообщения: 1: в сумме (x * 1:n): переполнение целого числа - используйте сумму (as.numeric(.)) 2: в n * sum(x): NA, произведенные переполнением целого числа
Я не могу понять, в чем проблема, любая идея? Я использую R версии 3.3.1 (2016-06-21) - "Ошибка в ваших волосах" с RStudio версии 0.99.903 и "DescTools" версии 0.99.17.
Редактировать: Ну, хорошо, преобразование моих чисел из целых в числовые, кажется, делает эту работу (но я все равно не понимаю...):
x2 <- as.numeric(x2) #Now, Gini() will work...
1 ответ
Основываясь на некоторых размышлениях об этом посте, я изменил функцию DescTools::Gini()
по умолчанию приводить целые числа к числовым (как в DescTools 0.99.18). Операция дешевая и потерянная производительность не стоит...
set.seed(1984)
x <- sample(c(1:100000), 500)
Gini(x)
# [1] 0.3360882