Предварительная обработка данных: выбор метода заполнения недостающих данных в наборе данных.
Итак, у меня есть набор данных со следующими заголовками:
Во всех атрибутах, кроме SCHOOL_YEAR, отсутствуют значения. Как я могу решить, какой метод использовать для заполнения недостающих значений для каждого атрибута (в Python)?
В настоящее время я использую обратную заливку (bfill), но мне интересно, как решить, какой метод лучше, например, заполнение средним, средним, заполнением и т. Д.