Когда мы используем Datamart и Datawarehousing?

Я новичок в DW . Когда нам следует использовать термин Datamart и когда мы должны использовать термин Datawarehousing . Пожалуйста, объясните с помощью примера может быть ваш собственный пример или с точки зрения Adventureworks .

1 ответ

Я не работаю на MS SQL Server. Но вот общий пример с примером использования в бизнесе.

Позвольте мне добавить еще один термин к этому. Во-первых, есть главный transactional database который взаимодействует с вашим приложением (очевидно, если у вас есть приложение для взаимодействия). Данные записываются в Master database (надеюсь, вы используете Master-Slave replication) и одновременно копируется в бальзам. В соответствии с требованиями бизнеса и отчетности, очистки и ETL выполняется на данных приложения и данные агрегируются и хранятся в denormalized Форма для повышения производительности отчетности и уменьшения количества объединений. Сложные предварительно рассчитанные данные легко доступны для бизнес-пользователей в целях отчетности и анализа. Это dimensional database - которая является денормализованной формой основной транзакционной базы данных (наиболее вероятно в 3NF).

Но, как вы, возможно, знаете, все компании имеют разные вспомогательные системы, которые также вводят данные в виде электронных таблиц, CSV-файлов и плоских файлов. Эти данные обычно относятся к одному домену, такому как колл-центр, коллекции и т. Д. Мы можем назвать все такие отдельные данные домена как витрина данных. Данные из разных доменов также обрабатываются инструментом ETL и являются denormalized по-своему. Когда мы объединяем все datamarts а также dimensional databases Для решения задач отчетности и анализа бизнеса мы получаем хранилище данных.

Предположим, у вас есть крупное приложение, работающее на веб-сайте, которое является вашим основным бизнесом. У вас есть все основные потребительские взаимодействия на этом сайте. Это даст вам ваш primary dimensional database, Для поддержки потребителей у вас может быть отдельное решение, такое как Avaya или Genesys, внедренное в вашей компании - они предоставят вам данные на одном и том же (или, возможно, другом сервере). Ты готовься ETLs загрузить эти данные на свой собственный сервер. Вы называете результирующие данные как data marts, И вы объединяете все эти вещи, чтобы получить data warehouse, Я знаю, я повторяюсь, но это специально.

Другие вопросы по тегам