Таблица сессий на пользователя в Firebase
Это второй пост (продолжение моего первого поста), посвященный рассмотрению дистрибутивов в Firebase Analytics Data. На этот раз я хочу создать таблицу распределения пользователей в BigQuery на основе данных сессий Firebase. Вывод должен выглядеть так:
Мне удалось создать следующий скрипт, чтобы рассчитывать на app_instance_id's:
#standardSQL
SELECT
COUNT(DISTINCT(CASE WHEN sess_id = 0 THEN app_instance_id END)) AS sess_count_0,
COUNT(DISTINCT(CASE WHEN sess_id = 1 THEN app_instance_id END)) AS sess_count_1,
COUNT(DISTINCT(CASE WHEN sess_id > 1 AND sess_id <= 5 THEN app_instance_id END)) AS sess_count_2BETWEEN5,
COUNT(DISTINCT(CASE WHEN sess_id > 5 AND sess_id <= 10 THEN app_instance_id END)) AS sess_count_6BETWEEN10,
COUNT(DISTINCT(CASE WHEN sess_id > 10 AND sess_id <= 30 THEN app_instance_id END)) AS sess_count_11BETWEEN30,
COUNT(DISTINCT(CASE WHEN sess_id > 30 THEN app_instance_id END)) AS sess_count_PLUS31
FROM (SELECT *, SUM(session_start) OVER(PARTITION BY app_instance_id ORDER BY min_time) sess_id
FROM (SELECT *, IF(previous IS null OR (min_time-previous)>(20*60*1000*1000),1, 0) session_start
FROM (SELECT *, LAG(max_time, 1) OVER(PARTITION BY app_instance_id ORDER BY max_time) previous
FROM (SELECT user_dim.app_info.app_instance_id,
user_dim.device_info.mobile_model_name,
user_dim.device_info.platform_version,
(SELECT MIN(timestamp_micros)
FROM UNNEST(event_dim)) min_time,
(SELECT MAX(timestamp_micros) FROM UNNEST(event_dim)) max_time
FROM `firebase-public-project.com_firebase_demo_IOS.app_events_*`
WHERE (_TABLE_SUFFIX BETWEEN '20170701' AND '20170731')
)
)
)
)
Вопросы:
Что касается пользователей (а не сеансов), я хочу на 100 % убедиться, должен ли я по-прежнему рассчитывать на экземпляры приложений (а не на идентификаторы сеансов)?
Любые мысли по оптимизации этого запроса Есть ли более эффективный способ объединить все диапазоны распределения с одним запросом?
Наконец, я хотел сравнить общую сумму, которую я получил сверху, с разными пользователями, которые вызвали
session_start
событие за тот же период. Я надеялся увидеть, что он примерно выровняется, но это не так. Почему такая большая разница: 7688 против 16310 (488+7343+4967+1956+1165+391)? Где моя логика пошла не так?#standardSQL SELECT COUNT (DISTINCT user_dim.app_info.app_instance_id) as users FROM `firebase-public-project.com_firebase_demo_IOS.app_events_*`, UNNEST(event_dim) AS event WHERE (_TABLE_SUFFIX BETWEEN '20170701' AND '20170731') AND event.name = "session_start"