Описание тега data-warehouse
Хранилище данных (DW) - это база данных, специально структурированная / разработанная для помощи в запросах, анализе и составлении отчетов (создании отчетов) текущих и исторических данных.
DW - это центральные хранилища интегрированных данных из одного или нескольких разрозненных источников. Основное различие между хранилищем данных и набором таблиц БД заключается в том, как данные организованы / структурированы.
2
ответа
Измерение даты и накопленные месяцы
Измерение Дата находится в следующем состоянии: В SSAS выглядит так: Исходя из этого, как я могу построить Иерархию в SSAS со следующей структурой: 2016 Jan-Feb Jan-Mrz Jan-Apr Jan-Mai Jan-Jun ... где Jan-Apr будет накопленной суммой с января по апр…
10 май '16 в 09:58
0
ответов
Хранилище данных - измерение со свободными текстовыми полями
После нескольких советов о том, как лучше всего моделировать данные с помощью полей с произвольным текстом. Следующее упрощено, но обычно у меня есть таблица FactIncident, а затем измерение для этого называется DimPropertyType. Фактически есть 3 пол…
08 окт '14 в 15:32
1
ответ
Таблицы кустов в нескольких узлах - обработка
У меня есть концептуальные сомнения в улье. Я знаю, что Hive - это инструмент для хранения данных, работающий поверх Hadoop. Мы знаем, что Hadoop имеет распределенную файловую систему -HDFS. Предположим, у меня есть один хозяин и три раба. Теперь я …
18 мар '16 в 07:05
1
ответ
Философия очистки данных - источник, хранилище данных или интерфейс?
Я нахожусь в традиционном стеке ETL Back to Front от источника данных (Adobe Analytics) до хранилища данных MySQL и внешнего интерфейса Tableau для визуализации. Мой вопрос вращается вокруг лучших практик для очистки данных / картирования и на каком…
25 сен '18 в 19:33
1
ответ
Сопоставление фактических данных с недублированными записями измерений
Я начинаю работу над проектом хранилища данных для клиента, который имеет несколько физических местоположений с отдельными экземплярами одних и тех же баз данных больших объектов в каждом местоположении. Между сайтами есть много "общих" данных, но с…
18 фев '16 в 06:32
1
ответ
Как сохранить статистические данные за последний день / неделю / месяц / год в потоке данных?
Каков наилучший способ хранения данных таким образом, чтобы я мог получать ответы на запросы в режиме реального времени, такие как "подсчет последних 2 недель неудачных транзакций", "подсчет учетных записей, созданных за последние 2 года". Подсчет к…
11 июн '14 в 21:02
1
ответ
Предложения по структуре файлов SAS Data Mart
Я работал над проектом SAS ETL, в котором мы сначала извлекаем данные за последний месяц из хранилища teradata в начале каждого месяца, а затем отправляем их для дальнейшей обработки. Это делается с помощью сценариев извлечения для каждой таблицы, а…
09 авг '17 в 02:40
1
ответ
Агрегация количества строк SSAS
Привет у меня есть таблица, как это: idCustomer | idTime | idStatus --------------------------------- 1 | 20010101 | 2 1 | 20010102 | 2 1 | 20010103 | 3 2 | 20010101 | 1 ... Теперь я добавил эту таблицу в качестве таблицы фактов в своем кубе с показ…
28 янв '14 в 17:28
1
ответ
Моделирование отношений "многие ко многим" в хранилище данных
Я должен спроектировать модель хранилища данных и процесс ETL для класса в моем университете. В моем хранилище данных должны храниться мнения / комментарии о продукте, каждая запись должна состоять из: текст комментария (строка) оценка продукта ({0,…
15 дек '16 в 14:39
0
ответов
SSIS пытается преобразовать varchar(50) в плавающую из базы данных PSA в базу данных ODS
Это таблица из нашей базы данных PSA из простого файла. Это плоский файл: Мы пытаемся заполнить нашу базу данных ODS данными из базы данных PSA. Это дизайн таблицы контейнеров из нашей базы данных ODS: Мы используем преобразование данных в инструмен…
04 апр '18 в 11:48
1
ответ
Разделение основного раздела в
В таблице я создал раздел на основе года. У меня есть данные, начиная с 2008 года. Я создал следующие разделы: 2008, 2009, 2010 и Primary. Так как первичный имеет данные за 2011 и 2012 годы, я хочу разделить первичный раздел Я создал новую файловую …
10 окт '12 в 09:40
1
ответ
Зачем использовать порядковый номер для номера версии в таблице измерений при моделировании хранилища данных
В контексте моделирования измерений, как это обычно бывает, полезно иметь суррогатный ключ в таблице измерений, чтобы отслеживать изменение строк ( http://www.kimballgroup.com/2006/07/design-tip-81-fact-table-surrogate-key/). Существует три распрост…
21 апр '16 в 15:57
3
ответа
Медленно меняющееся измерение - повреждение даты вступления в силу / истечения срока действия при многократном запуске в течение одного дня
Я использую методологию Kimball для медленно меняющихся измерений в нашем хранилище данных. У нас возникли проблемы, когда запись обновляется несколько раз в течение одного дня, а ETL запускается каждые 15 минут. Таким образом, даты вступления в сил…
02 май '16 в 18:43
3
ответа
Каковы принятые методы количественной оценки ROI хранилища данных?
Предпосылки: Главным выходом хранилища данных являются бизнес-решения, которые принимаются с использованием хранилища. Предположительно, ценный склад позволяет предприятию принимать более выгодные решения, чем без склада. Контекст. Скажем, например,…
18 май '11 в 17:08
2
ответа
Назначение суррогатного ключа
Интересно, почему разработчик создает свой собственный суррогатный ключ в качестве первичного ключа в своем хранилище данных, хотя таблица уже имеет первичный ключ. В телекоммуникационной системе в качестве первичного ключа используется gsm_no или a…
07 авг '14 в 11:34
3
ответа
Должно ли хранилище данных быть основным хранилищем данных?
Обычно хранилище данных - это средство для консолидации нескольких исходных систем, обычно для целей отчетности. Но есть ли ситуации, в которых целесообразно использовать хранилище данных как самостоятельную первичную базу данных (т. Е. Захватывать …
02 июл '12 в 20:03
1
ответ
Хранилище данных - многомерная модель - таблица фактов меньше таблицы измерений
Я работаю над проектом хранилища данных, где таблица измерений клиента больше таблицы фактов. Таблицы измерений и фактов создаются из системы CRM. Таблица фактов отслеживает такие действия, как отправка письма клиенту или звонки клиентов за помощью.…
16 май '14 в 13:54
1
ответ
Запрос, чтобы получить строку из столбца в таблице
Я ищу, чтобы сохранить имена MV в переменную из столбца WHAT который находится в таблице dba_jobs, Я хочу имя MV AP_OTHER_PERIODS_EMP_MV быть сохраненным в переменной, чтобы я мог использовать эту переменную в качестве параметра в процедуре для пере…
02 ноя '17 в 07:32
1
ответ
Хранилище данных и загрузка данных с использованием пакета ssis
Я новичок в разработке хранилищ данных, насколько я знаю, я создал проект хранилища данных. Для этой базы данных я создал 4 измерения и 1 таблицу фактов. Для всех измерений я не сохранил ограничения первичного ключа. Для каждого измерения, имеющего …
05 июл '11 в 11:25
3
ответа
Обеспечение 1:1 и 1: много кардинальности в денормализованном складском столе с составным первичным ключом
У меня есть стол под названием "Accounts"с composite primary key состоящий из 2 столбцов: Account_key а также Account_Start_date оба с типом данных int и другой не ключевой столбец с именем Accountnumber(bigint). Account_key должен иметь один или не…
31 мар '16 в 12:54