Как аналитические платформы обрабатывают удаление пользователя? Также у них есть внутренний идентификатор для представления пользователей?
Я работаю над созданием аналитической платформы, и меня несколько озадачили.
клиент C
идентифицирует пользователя на платформах аналитики / удержания клиентов, которые они отправляют external-id
уникальный для них через SDK, за которым в основном следует поток событий, сопоставленных с этим external-id
,
- События проходят через агрегацию, задержку или фоновую обработку для генерации нескольких наборов данных, таких как:
- Активность сеанса на пользователя (количество сеансов, средняя продолжительность сеанса)
- Активные пользователи (в последнем периоде P) для каждого клиента
C
- Многие другие клиентские / системные статистические данные.
Когда пользователь удаляется, может ли его статистика быть удалена / обработана таким образом, чтобы, если они, возможно, идентифицировали снова (что могло произойти очень быстро), ни одна из его предыдущих статистических данных не была показана / не может быть приписана ему (GDPR)? А предстоящие события с одинаковым внешним идентификатором (отложенным или новым) обрабатываются правильно?
Удаление не может повлиять на общую статистику клиента, такую как (активные пользователи), как их можно сохранить в целости и сохранности?
Принимая во внимание, что события об удаленном пользователе могут приходить с задержкой, не работать, или некоторая фоновая работа может ожидать выполнения чего-либо, связанного с его данными.
Меня больше интересует, как аналитические платформы уже обрабатывают такие случаи?
Сохраняют ли эти платформы внутренний идентификатор для представления пользователей, чтобы помочь разделить данные пользователя, если они будут удалены / снова зарегистрированы? Если да, означает ли это, что каждое событие отслеживания пользователя, проходящее через поток, требует псевдо internal-id = lookup(external-id)
искать пользователя internal-id
и пометить событие отслеживания с ним и как это звучит с точки зрения производительности
Пожалуйста, извините за долговечность вопросов.