Схема звезды - факт или измерение внешнего идентификатора?
Вот вопрос, с которым я борюсь в дизайне звездной схемы.
Суть в том, что мы отслеживаем пакеты со встроенными глобально уникальными идентификаторами (тегами). Каждый из этих тегов создает серию хронологических событий. Я считаю события фактами и включаю значения непрерывных переменных в столбцы таблицы фактов. Размеры такие вещи, как тип упаковки.
В чем я не уверен, так это в том, должен ли идентификатор тега находиться в измерении или непосредственно в таблице фактов. В настоящее время у нас есть более 5 миллионов уникальных тегов, которые мы отслеживаем.
Желательно ли такое большое измерение?
1 ответ
Это вырожденное измерение, и вы должны сохранить этот столбец в таблице фактов.