Python SkLearn Gradient Boost Classifier Sample_Weight Clarification

Использование Python SkLearn Gradient Boost Classifier. Настройка, которую я использую, - это выбор случайных выборок (стохастик). Использование sample_weight 1 для одного из бинарных классов (исход = 0) и 20 для другого класса (результат = 1). Мой вопрос заключается в том, как эти веса применяются в "терминах непрофессионалов".

Если на каждой итерации модель выберет x строк из выборки для результата 0, а y строк для результата 1, то параметр sample_weight включит и сохранит все значения x, но перепишет результат y (1) путем фактор 20?

В документации мне не ясно, является ли это избыточной выборкой, имея sample_weight > 1. Я понимаю, что class_weight отличается и не изменяет данные, но то, как модель интерпретирует данные через функцию потерь. Sample_weight, с другой стороны, правда ли, что он эффективно изменяет данные, поступающие в модель, путем передискретизации?

Спасибо

1 ответ

Выборочные веса являются множителем, вот код:

https://github.com/scikit-learn/scikit-learn/blob/f0ab589f/sklearn/ensemble/gradient_boosting.py

Другие вопросы по тегам