Описание тега gini
Коэффициент Джини (также известный как индекс Джини или коэффициент Джини) (/dʒini/ jee-nee) является мерой статистической дисперсии, предназначенной для представления распределения доходов жителей страны, и является наиболее часто используемым показателем неравенства.
1
ответ
Блау индекс разнообразия в R
Я пытаюсь вычислить индекс разнообразия Блау (Джини-Симпсона) в R на моем фрейме данных. У меня есть 6 столбцов для каждого человека в группе со значениями от "Студент", "Факультет", "Выпускник", "Не применимо". Есть также NA внутри столбцов, если г…
21 янв '18 в 22:09
2
ответа
Более эффективный весовой коэффициент Джини в Python
Согласно /questions/19458335/vesovoj-koeffitsient-dzhini-v-python/19458343#19458343, это реализация взвешенного коэффициента Джини в Python: import numpy as np def gini(x, weights=None): if weights is None: weights = np.ones_like(x) # Calculate mean…
27 фев '18 в 01:00
0
ответов
Как рассчитывается MeanGiniDecrease для каждой функции в пакете randomForest?
При моем понимании, что уменьшение Джини может быть вычислено простым способом путем вычитания примеси Джини дочерних узлов из родительского узла, как все вычисления агрегируются по элементу в лесу? Например, я видел много графиков MeanGiniDecrease,…
11 сен '18 в 12:56
1
ответ
Вычисление индекса Джини в тензорном потоке
Я пытаюсь записать вычисление индекса Джини как функцию стоимости тензорного потока. Индекс Джини: https://en.wikipedia.org/wiki/Gini_coefficient тупое решение будет def ginic(actual, pred): n = len(actual) a_s = actual[np.argsort(pred)] a_c = a_s.c…
10 окт '17 в 02:26
0
ответов
Формула вычисления коэффициента Джини в fastgini
Я использую fastgini пакет для Stata ( https://ideas.repec.org/c/boc/bocode/s456814.html). Я знаком с классической формулой для коэффициента Джини, приведенной, например, в Karagiannis & Kovacevic (2000) ( http://onlinelibrary.wiley.com/doi/10.1111/…
18 окт '17 в 07:04
1
ответ
Индекс Джини в R
Я пытаюсь рассчитать индекс Джини для каждой строки в моей базе данных. Каждая строка - это клиент, а каждый столбец - месячная сессия. Поэтому мне нужно добавить столбец с индексом Джини по строкам для каждого клиента в течение 12 месяцев. Смотрите…
04 июл '17 в 14:03
1
ответ
Коэффициент Джини с керасом в питоне
Я хочу вычислить простую модель NN с коэффициентом Джини в качестве функции оптимизатора. Вот моя функция Джини: def gini(actual, pred): nT = K.shape(actual)[-1] n = K.cast(nT, dtype='int32') inds = K.reverse(tf.nn.top_k(pred, n)[1], axes=[0]) a_s =…
01 ноя '17 в 07:32
0
ответов
Рассчитать индекс Джини для многоходового разделения в R
Я пытаюсь вычислить индекс Джини в R. Нет проблем вычислить индекс Джини для бинарного дерева решений следующим образом. gini_process <- function(classes,splitvar = NULL){ #Assumes Splitvar is a logical vector if (is.null(splitvar)){ base_prob &l…
29 окт '17 в 11:11
0
ответов
Преобразование кода Python Numpy в Spark с использованием RDD для использования GINI для оценки модели
Как я могу преобразовать этот код Python Numpy в Spark RDD, чтобы в операциях использовалась распределенная архитектура Spark для больших данных. Код выглядит следующим образом - def gini(array): """Calculate the Gini coefficient of a numpy array.""…
22 янв '18 в 07:49
0
ответов
Расчет коэффициента Джини в R
Я использую пакет Ineq в R для расчета коэффициента Джини. Из проверки исходного кода (ниже), он сначала упорядочивает вектор x перед вычислением Джини. Пример данных: example_data = data.frame(SCORE_RANGE = c('100-200','201-300','301- 400','401-500…
26 авг '18 в 12:05
1
ответ
Есть ли функция, которая вычисляет индекс Джини для CART(алгоритм дерева решений) в R?
При использовании CART, я хотел бы выбрать основные атрибуты из целых атрибутов, используя индекс Джини. Но я не смог найти какие-либо функции или пакеты, содержащие его. Если есть какие-либо функции или пакеты, которые рассчитывают индекс Джини, по…
04 ноя '16 в 12:53
1
ответ
Как получить индекс Джини после выполнения поиска по сетке в настройке гиперпараметров GBM для функции потери твиди?
Я занимаюсь настройкой гиперпараметра для модели gbm в H2o, и поскольку моя функция потерь - Tweedie, я не хочу рассматривать mse как критерий выбора модели. В документации H2o говорится, что индекс Джини может быть рассчитан как для моделей регресс…
04 янв '19 в 21:11
2
ответа
Синтаксис SQL для сложного GROUP BY с оператором OVER: вычисление коэффициента Джини для нескольких множеств
Я хочу рассчитать коэффициент Джини для ряда наборов, содержащихся в таблице из двух столбцов (здесь называется #cits) содержащий значение и идентификатор набора. Я экспериментировал с различными вычислениями коэффициента Джини, описанными здесь (за…
22 ноя '16 в 20:52
1
ответ
Stata: цикл для хранения значений коэффициента Джини
У меня есть 133 переменных на доход (каждая переменная представляет группу). Я хочу, чтобы коэффициенты Джини всех этих групп, поэтому я использую ineqdeco в Стате. Я не могу вычислить все эти коэффициенты вручную, поэтому я создал цикл for: gen sgi…
07 дек '15 в 15:52
1
ответ
Весовой коэффициент Джини в Python
Вот простая реализация коэффициента Джини в Python от /questions/37585065/raschet-koeffitsienta-dzhini-v-python-numpy/37585070#37585070: def gini(x): # Mean absolute difference. mad = np.abs(np.subtract.outer(x, x)).mean() # Relative mean absolute d…
26 фев '18 в 04:33
1
ответ
Целочисленная ошибка переполнения при использовании функции Gini пакета DescTools
Я хочу рассчитать коэффициенты Джини, используя Gini() от DescTools(потому что он предлагает простой способ вычисления "несмещенных" коэффициентов Джини с весами, доверительными интервалами и т. д.), но я получаю некоторые ошибки, когда использую эт…
19 сен '16 в 17:38
0
ответов
Как переменная важность / среднее снижение Джини может быть>.5?
В настоящее время я работаю над проектом, в котором я использую Random Forest. Я хочу знать важность функции всех ковариат и хочу использовать MeanDecreaseGini за это. Я действительно не понимаю, почему могут быть значения больше 0,5. Индекс Джини н…
28 июн '17 в 15:01
1
ответ
Как изменить критерии разделения (Джини / энтропия) в алгоритме дерева решений в Scikit-Learn?
Я работаю с алгоритмом дерева решений по проблеме двоичной классификации, и цель состоит в том, чтобы минимизировать ложные срабатывания (максимизировать positive predicted value) классификации (стоимость диагностического инструмента очень высока). …
24 апр '18 в 13:14
0
ответов
Расчет примеси Джини
С https://en.wikipedia.org/wiki/Decision_tree_learning у нас есть $I_G=1-\sum_{i=1}^j p_i^2$. Однако из https://www.kaggle.com/batzner/gini-coefficient-an-intuitive-explanation мы имеем: def gini(actual, pred): assert (len(actual) == len(pred)) all …
20 сен '18 в 14:36
2
ответа
Что такое формула для расчета Джини с весом образца
Мне нужна ваша помощь, чтобы объяснить, как я могу получить тот же результат, что и эта функция: gini (x, weights = rep (1, length = length (x))) http://cran.r-project.org/web/packages/reldist/reldist.pdf -> страница 2. Джини Допустим, нам нужно изм…
12 дек '13 в 23:05