Python SkLearn Gradient Boost Classifier Sample_Weight Clarification
Использование Python SkLearn Gradient Boost Classifier. Настройка, которую я использую, - это выбор случайных выборок (стохастик). Использование sample_weight 1 для одного из бинарных классов (исход = 0) и 20 для другого класса (результат = 1). Мой вопрос заключается в том, как эти веса применяются в "терминах непрофессионалов".
Если на каждой итерации модель выберет x строк из выборки для результата 0, а y строк для результата 1, то параметр sample_weight включит и сохранит все значения x, но перепишет результат y (1) путем фактор 20?
В документации мне не ясно, является ли это избыточной выборкой, имея sample_weight > 1. Я понимаю, что class_weight отличается и не изменяет данные, но то, как модель интерпретирует данные через функцию потерь. Sample_weight, с другой стороны, правда ли, что он эффективно изменяет данные, поступающие в модель, путем передискретизации?
Спасибо
1 ответ
Выборочные веса являются множителем, вот код:
https://github.com/scikit-learn/scikit-learn/blob/f0ab589f/sklearn/ensemble/gradient_boosting.py