Описание тега data-warehouse

Хранилище данных (DW) - это база данных, специально структурированная / разработанная для помощи в запросах, анализе и составлении отчетов (создании отчетов) текущих и исторических данных. DW - это центральные хранилища интегрированных данных из одного или нескольких разрозненных источников. Основное различие между хранилищем данных и набором таблиц БД заключается в том, как данные организованы / структурированы.
2 ответа

Измерение даты и накопленные месяцы

Измерение Дата находится в следующем состоянии: В SSAS выглядит так: Исходя из этого, как я могу построить Иерархию в SSAS со следующей структурой: 2016 Jan-Feb Jan-Mrz Jan-Apr Jan-Mai Jan-Jun ... где Jan-Apr будет накопленной суммой с января по апр…
10 май '16 в 09:58
0 ответов

Хранилище данных - измерение со свободными текстовыми полями

После нескольких советов о том, как лучше всего моделировать данные с помощью полей с произвольным текстом. Следующее упрощено, но обычно у меня есть таблица FactIncident, а затем измерение для этого называется DimPropertyType. Фактически есть 3 пол…
08 окт '14 в 15:32
1 ответ

Таблицы кустов в нескольких узлах - обработка

У меня есть концептуальные сомнения в улье. Я знаю, что Hive - это инструмент для хранения данных, работающий поверх Hadoop. Мы знаем, что Hadoop имеет распределенную файловую систему -HDFS. Предположим, у меня есть один хозяин и три раба. Теперь я …
18 мар '16 в 07:05
1 ответ

Философия очистки данных - источник, хранилище данных или интерфейс?

Я нахожусь в традиционном стеке ETL Back to Front от источника данных (Adobe Analytics) до хранилища данных MySQL и внешнего интерфейса Tableau для визуализации. Мой вопрос вращается вокруг лучших практик для очистки данных / картирования и на каком…
1 ответ

Сопоставление фактических данных с недублированными записями измерений

Я начинаю работу над проектом хранилища данных для клиента, который имеет несколько физических местоположений с отдельными экземплярами одних и тех же баз данных больших объектов в каждом местоположении. Между сайтами есть много "общих" данных, но с…
18 фев '16 в 06:32
1 ответ

Как сохранить статистические данные за последний день / неделю / месяц / год в потоке данных?

Каков наилучший способ хранения данных таким образом, чтобы я мог получать ответы на запросы в режиме реального времени, такие как "подсчет последних 2 недель неудачных транзакций", "подсчет учетных записей, созданных за последние 2 года". Подсчет к…
1 ответ

Предложения по структуре файлов SAS Data Mart

Я работал над проектом SAS ETL, в котором мы сначала извлекаем данные за последний месяц из хранилища teradata в начале каждого месяца, а затем отправляем их для дальнейшей обработки. Это делается с помощью сценариев извлечения для каждой таблицы, а…
09 авг '17 в 02:40
1 ответ

Агрегация количества строк SSAS

Привет у меня есть таблица, как это: idCustomer | idTime | idStatus --------------------------------- 1 | 20010101 | 2 1 | 20010102 | 2 1 | 20010103 | 3 2 | 20010101 | 1 ... Теперь я добавил эту таблицу в качестве таблицы фактов в своем кубе с показ…
28 янв '14 в 17:28
1 ответ

Моделирование отношений "многие ко многим" в хранилище данных

Я должен спроектировать модель хранилища данных и процесс ETL для класса в моем университете. В моем хранилище данных должны храниться мнения / комментарии о продукте, каждая запись должна состоять из: текст комментария (строка) оценка продукта ({0,…
15 дек '16 в 14:39
0 ответов

SSIS пытается преобразовать varchar(50) в плавающую из базы данных PSA в базу данных ODS

Это таблица из нашей базы данных PSA из простого файла. Это плоский файл: Мы пытаемся заполнить нашу базу данных ODS данными из базы данных PSA. Это дизайн таблицы контейнеров из нашей базы данных ODS: Мы используем преобразование данных в инструмен…
1 ответ

Разделение основного раздела в

В таблице я создал раздел на основе года. У меня есть данные, начиная с 2008 года. Я создал следующие разделы: 2008, 2009, 2010 и Primary. Так как первичный имеет данные за 2011 и 2012 годы, я хочу разделить первичный раздел Я создал новую файловую …
1 ответ

Зачем использовать порядковый номер для номера версии в таблице измерений при моделировании хранилища данных

В контексте моделирования измерений, как это обычно бывает, полезно иметь суррогатный ключ в таблице измерений, чтобы отслеживать изменение строк ( http://www.kimballgroup.com/2006/07/design-tip-81-fact-table-surrogate-key/). Существует три распрост…
3 ответа

Медленно меняющееся измерение - повреждение даты вступления в силу / истечения срока действия при многократном запуске в течение одного дня

Я использую методологию Kimball для медленно меняющихся измерений в нашем хранилище данных. У нас возникли проблемы, когда запись обновляется несколько раз в течение одного дня, а ETL запускается каждые 15 минут. Таким образом, даты вступления в сил…
02 май '16 в 18:43
3 ответа

Каковы принятые методы количественной оценки ROI хранилища данных?

Предпосылки: Главным выходом хранилища данных являются бизнес-решения, которые принимаются с использованием хранилища. Предположительно, ценный склад позволяет предприятию принимать более выгодные решения, чем без склада. Контекст. Скажем, например,…
2 ответа

Назначение суррогатного ключа

Интересно, почему разработчик создает свой собственный суррогатный ключ в качестве первичного ключа в своем хранилище данных, хотя таблица уже имеет первичный ключ. В телекоммуникационной системе в качестве первичного ключа используется gsm_no или a…
07 авг '14 в 11:34
3 ответа

Должно ли хранилище данных быть основным хранилищем данных?

Обычно хранилище данных - это средство для консолидации нескольких исходных систем, обычно для целей отчетности. Но есть ли ситуации, в которых целесообразно использовать хранилище данных как самостоятельную первичную базу данных (т. Е. Захватывать …
02 июл '12 в 20:03
1 ответ

Хранилище данных - многомерная модель - таблица фактов меньше таблицы измерений

Я работаю над проектом хранилища данных, где таблица измерений клиента больше таблицы фактов. Таблицы измерений и фактов создаются из системы CRM. Таблица фактов отслеживает такие действия, как отправка письма клиенту или звонки клиентов за помощью.…
1 ответ

Запрос, чтобы получить строку из столбца в таблице

Я ищу, чтобы сохранить имена MV в переменную из столбца WHAT который находится в таблице dba_jobs, Я хочу имя MV AP_OTHER_PERIODS_EMP_MV быть сохраненным в переменной, чтобы я мог использовать эту переменную в качестве параметра в процедуре для пере…
1 ответ

Хранилище данных и загрузка данных с использованием пакета ssis

Я новичок в разработке хранилищ данных, насколько я знаю, я создал проект хранилища данных. Для этой базы данных я создал 4 измерения и 1 таблицу фактов. Для всех измерений я не сохранил ограничения первичного ключа. Для каждого измерения, имеющего …
05 июл '11 в 11:25
3 ответа

Обеспечение 1:1 и 1: много кардинальности в денормализованном складском столе с составным первичным ключом

У меня есть стол под названием "Accounts"с composite primary key состоящий из 2 столбцов: Account_key а также Account_Start_date оба с типом данных int и другой не ключевой столбец с именем Accountnumber(bigint). Account_key должен иметь один или не…
31 мар '16 в 12:54