Таблица сессий на пользователя в Firebase

Это второй пост (продолжение моего первого поста), посвященный рассмотрению дистрибутивов в Firebase Analytics Data. На этот раз я хочу создать таблицу распределения пользователей в BigQuery на основе данных сессий Firebase. Вывод должен выглядеть так:

Мне удалось создать следующий скрипт, чтобы рассчитывать на app_instance_id's:

#standardSQL
SELECT 
  COUNT(DISTINCT(CASE WHEN sess_id = 0 THEN app_instance_id END)) AS sess_count_0,
  COUNT(DISTINCT(CASE WHEN sess_id = 1 THEN app_instance_id END)) AS sess_count_1,
  COUNT(DISTINCT(CASE WHEN sess_id > 1 AND sess_id <= 5 THEN app_instance_id END)) AS sess_count_2BETWEEN5,
  COUNT(DISTINCT(CASE WHEN sess_id > 5 AND sess_id <= 10 THEN app_instance_id END)) AS sess_count_6BETWEEN10,
  COUNT(DISTINCT(CASE WHEN sess_id > 10 AND sess_id <= 30 THEN app_instance_id END)) AS sess_count_11BETWEEN30,
  COUNT(DISTINCT(CASE WHEN sess_id > 30 THEN app_instance_id END)) AS sess_count_PLUS31
FROM (SELECT *, SUM(session_start) OVER(PARTITION BY app_instance_id ORDER BY min_time) sess_id
      FROM (SELECT *, IF(previous IS null OR (min_time-previous)>(20*60*1000*1000),1, 0) session_start 
            FROM (SELECT *, LAG(max_time, 1) OVER(PARTITION BY app_instance_id ORDER BY max_time) previous
                  FROM (SELECT user_dim.app_info.app_instance_id, 
                  user_dim.device_info.mobile_model_name, 
                  user_dim.device_info.platform_version, 
                  (SELECT MIN(timestamp_micros) 
                  FROM UNNEST(event_dim)) min_time, 
                    (SELECT MAX(timestamp_micros) FROM UNNEST(event_dim)) max_time 
                    FROM `firebase-public-project.com_firebase_demo_IOS.app_events_*` 
                    WHERE (_TABLE_SUFFIX BETWEEN '20170701' AND '20170731')
                  )
            )
      )
)

Вопросы:

  • Что касается пользователей (а не сеансов), я хочу на 100 % убедиться, должен ли я по-прежнему рассчитывать на экземпляры приложений (а не на идентификаторы сеансов)?

  • Любые мысли по оптимизации этого запроса Есть ли более эффективный способ объединить все диапазоны распределения с одним запросом?

  • Наконец, я хотел сравнить общую сумму, которую я получил сверху, с разными пользователями, которые вызвали session_startсобытие за тот же период. Я надеялся увидеть, что он примерно выровняется, но это не так. Почему такая большая разница: 7688 против 16310 (488+7343+4967+1956+1165+391)? Где моя логика пошла не так?

    #standardSQL
    SELECT 
    COUNT (DISTINCT user_dim.app_info.app_instance_id) as users
    FROM `firebase-public-project.com_firebase_demo_IOS.app_events_*`, UNNEST(event_dim) AS event 
      WHERE (_TABLE_SUFFIX BETWEEN '20170701' AND '20170731')
      AND event.name = "session_start"
    

0 ответов

Другие вопросы по тегам