Когда мы используем Datamart и Datawarehousing?
Я новичок в DW . Когда нам следует использовать термин Datamart и когда мы должны использовать термин Datawarehousing . Пожалуйста, объясните с помощью примера может быть ваш собственный пример или с точки зрения Adventureworks .
1 ответ
Я не работаю на MS SQL Server. Но вот общий пример с примером использования в бизнесе.
Позвольте мне добавить еще один термин к этому. Во-первых, есть главный transactional database
который взаимодействует с вашим приложением (очевидно, если у вас есть приложение для взаимодействия). Данные записываются в Master database
(надеюсь, вы используете Master-Slave replication
) и одновременно копируется в бальзам. В соответствии с требованиями бизнеса и отчетности, очистки и ETL
выполняется на данных приложения и данные агрегируются и хранятся в denormalized
Форма для повышения производительности отчетности и уменьшения количества объединений. Сложные предварительно рассчитанные данные легко доступны для бизнес-пользователей в целях отчетности и анализа. Это dimensional database
- которая является денормализованной формой основной транзакционной базы данных (наиболее вероятно в 3NF).
Но, как вы, возможно, знаете, все компании имеют разные вспомогательные системы, которые также вводят данные в виде электронных таблиц, CSV-файлов и плоских файлов. Эти данные обычно относятся к одному домену, такому как колл-центр, коллекции и т. Д. Мы можем назвать все такие отдельные данные домена как витрина данных. Данные из разных доменов также обрабатываются инструментом ETL и являются denormalized
по-своему. Когда мы объединяем все datamarts
а также dimensional databases
Для решения задач отчетности и анализа бизнеса мы получаем хранилище данных.
Предположим, у вас есть крупное приложение, работающее на веб-сайте, которое является вашим основным бизнесом. У вас есть все основные потребительские взаимодействия на этом сайте. Это даст вам ваш primary dimensional database
, Для поддержки потребителей у вас может быть отдельное решение, такое как Avaya или Genesys, внедренное в вашей компании - они предоставят вам данные на одном и том же (или, возможно, другом сервере). Ты готовься ETLs
загрузить эти данные на свой собственный сервер. Вы называете результирующие данные как data marts
, И вы объединяете все эти вещи, чтобы получить data warehouse
, Я знаю, я повторяюсь, но это специально.