Инженерия функций в электронной коммерции Веб-аналитика
Я очень новичок в этом форуме и задаю вопрос впервые. Я работаю над набором данных электронной коммерции для проекта, который включает эти две переменные - посещенную страницу (0/1) и выходы (num var со значениями -1,0,2,3......), которые указывают количество раз уникальный идентификатор покинул конкретную страницу. Есть 6 таких страниц с информацией.
-1 в выходах страницы - те, которые не посещают страницу. Однако я использую выходы страницы для вычисления других показателей, таких как скорость выхода, и я не уверен, как удалить / заменить -1 без потери информации или выразить ее другим способом. Я не могу сделать это 0 - bcos, что означало бы, что на странице не осталось выхода / vistor. Даже если я удаляю и создаю категориальную переменную, которая указывает "Нет посещения, остались, вышли". Я все равно не знаю, чем заменить -1.
Как я могу это сделать... мне нужно сделать какие-либо функции здесь?
1 ответ
Создайте функцию, которая представляет, если пользователь никогда не посещал страницу в виде двоичного кода 1/0, а затем просто имеет столбец от 0 до n для числа выходов (если выходы равен -1, то 1, иначе 0). Я бы установил выходы от -1 до 0 после создания дополнительного столбца.
Тем не менее, я думаю, что вам нужно учитывать значение -1 больше (или предоставить дополнительную информацию), люди все еще находятся на странице, когда ваш предполагаемый алгоритм будет работать? Существуют ли ваши данные для нескольких страниц, а -1 означает, что они никогда не посещали эту страницу?