Хранилище данных: моделирование распределения рабочей нагрузки
У нас есть система, которая отслеживает распределение единиц работы от получения этой единицы работы до завершения этой единицы работы.
Единица работы имеет ряд атрибутов, ее источник, ее тип и т. Д. Я довольно хорошо отношусь к моделированию, вероятно, это либо измерения факта, либо просто атрибуты, в зависимости от их характера и того, как наши пользователи захотят получать отчеты. на них.
Проблема в распределении.
Единица работы может проходить через несколько команд, внутри этих групп она может проходить через несколько человек. Действия могут быть выполнены на этой единице работы.
И нашим пользователям будет интересно сообщить об этом.
Сколько единиц работы было выделено, например, командой за определенный период времени.
Я новичок в хранилищах данных, поэтому я не уверен, как смоделировать это. Кандидаты, которых я определил до сих пор:
1) Медленно меняющиеся размеры
Использование, вероятно, типа 4, для распределения по команде и человеку в команде.
2) Снимок
Имея тип 4 из / в атрибуты основного факта, которые говорят, когда он был в аккаунте, поэтому каждая единица работы встречается несколько раз в таблице фактов, которая будет заполнять куб.
3) Накопление Снимка
Я не уверен, что понимаю, что это такое, и я не уверен, что это актуально.
Есть ряд вещей, которые могут быть такими, как этот SCD, команда, член команды, статус, распределение очередей в единицах работы и т. Д. Так что это, кажется, достаточное количество SCD.
Есть ли что-то еще, что я пропустил в моем списке вариантов? Я что-то в корне неправильно понял?
1 ответ
Если я правильно понимаю, один рабочий блок может выполнить несколько действий. Для начала я бы выбрал таблицу фактов с частотой одного действия.
Это показывает dimPerson как измерение типа 2, это также будет работать как тип 1, пока CurrentTeamKey
копируется в TeamKey
таблицы фактов на вставке.