Как бороться с отсутствующими данными, когда на самом деле нет значения, но 0 не вариант?

Я нахожусь на этапе подготовки данных моего проекта интеллектуального анализа данных и собираюсь обработать пропущенные значения. Мой набор данных содержит информацию о транзакциях покупки электронной коммерции, в том числе о заказе и дате доставки.

Я создал переменную с именем deliverytime из этих двух переменных, но в delivery_date есть несколько пропущенных значений, а следовательно, и во время доставки. Если в derliverydate отсутствует значение, это фактически означает, что продукт никогда не поставлялся. Теперь я хочу учесть это, но присвоение значения 0 для времени доставки для этих наблюдений не представляется возможным, потому что есть возможность экспресс-отгрузки, когда товары доставляются точно в тот же день. Я также не хочу присваивать значение типа "999", потому что тогда я могу рассматривать только эту переменную как фактор.

У кого-нибудь есть идеи, как бороться с этой проблемой? Рассматриваете ли вы создание новой переменной с именем "доставлено", которая принимает значение 0, если оно никогда не было доставлено, и 1, если да?

Очень ценю вашу помощь!

0 ответов

Другие вопросы по тегам