Машинное обучение: имеет ли смысл умножать строки набора данных на их весовые коэффициенты
Я относительно новичок в науке о данных. У меня есть набор данных из демографических данных, собранных во время опроса общественного здравоохранения. Он содержит примерно 11 000 строк и 18 функций (все категориальные, кроме одной). У меня есть дополнительная информация об этом: весовой коэффициент на строку. Действительно, каждый ряд соответствует человеку, который ответил на вопросник. Весовые коэффициенты были рассчитаны для обследования, чтобы быть репрезентативными для всего населения при использовании в статистическом анализе. Как вы думаете, имеет ли смысл умножать каждую строку на ее весовой коэффициент, чтобы получить лучшие результаты?