Таблица фактов и таблицы измерений
Я изучал в Интернете, что такое таблица фактов и таблица измерений, поэтому он советовал практиковаться с реальным набором данных. В качестве примера я скачал этот файл Excel.
Я хочу попробовать звездообразную схему. Насколько я понял, ее можно разделить на несколько таблиц фактов, но все таблицы разные, означает ли это, что это уже таблица фактов и ее нельзя разделить на измерения? за кредиты я получил набор данных здесь https://www.kaggle.com/zynicide/wine-reviews
1 ответ
Типичные данные машинного обучения состоят из измерений или событий, которые можно интерпретировать как одну таблицу фактов.
Числовые атрибуты (такие как price
или же points
) являются атрибутами измерения таблицы фактов.
Атрибуты фактора (или времени) (такие как country
, province
или же tester_name
) являются внешними ключами таблиц измерений.
Измерения не содержатся в ваших данных, но их можно косвенно восстановить, используя distinct
ключи.