Как бороться с отсутствующими данными, когда на самом деле нет значения, но 0 не вариант?
Я нахожусь на этапе подготовки данных моего проекта интеллектуального анализа данных и собираюсь обработать пропущенные значения. Мой набор данных содержит информацию о транзакциях покупки электронной коммерции, в том числе о заказе и дате доставки.
Я создал переменную с именем deliverytime из этих двух переменных, но в delivery_date есть несколько пропущенных значений, а следовательно, и во время доставки. Если в derliverydate отсутствует значение, это фактически означает, что продукт никогда не поставлялся. Теперь я хочу учесть это, но присвоение значения 0 для времени доставки для этих наблюдений не представляется возможным, потому что есть возможность экспресс-отгрузки, когда товары доставляются точно в тот же день. Я также не хочу присваивать значение типа "999", потому что тогда я могу рассматривать только эту переменную как фактор.
У кого-нибудь есть идеи, как бороться с этой проблемой? Рассматриваете ли вы создание новой переменной с именем "доставлено", которая принимает значение 0, если оно никогда не было доставлено, и 1, если да?
Очень ценю вашу помощь!