Как интегрировать NoSQL с моделированием Data Vault 2.0? Как использовать хеш-ключи для интеграции NoSQL DB?
Я хотел бы узнать больше о том, как интегрировать базы данных NoSQL в архитектуру, основанную на реляционной модели (сборка в соответствии со стандартами Data Vault 2.0). Есть ли у кого-нибудь представление о том, где я мог бы обучаться по этому вопросу. Это в настоящее время не в самой последней книге Дэна Линдстедта!
1 ответ
Я предполагаю, что "как интегрировать базы данных NoSQL", вы имеете в виду, как бы вы использовали источник данных NoSQL в качестве входа в реляционную модель DV2.0. Проще говоря, вам просто нужно вставить данные в вашу реляционную базу данных и преобразовать данные в необходимые структуры DV в соответствии с вашими бизнес-объектами (концентраторами), их атрибутами (спутниками) и их отношениями (ссылками и спутниками). Это также предполагает, что любые неструктурированные данные, которые у вас есть в базе данных NoSQL, находятся вне области или могут храниться в хранилище BLOB, XML или JSON реляционного движка.
Если вы имеете в виду DV2.0, смоделированный и сохраненный в базе данных NoSQL, то вы правы, это не рассматривается в новой книге Дэна. Хотя стандарт DV2.0 должен легко применяться к чему-то вроде Hive, Cloudera и Cassandra. Хэши позволяют загружать каждый объект полностью отдельно от другого, сложные значения (неструктурированные или полуструктурированные данные) могут быть просто сохранены как атрибуты на спутнике. То, как вы сравните эти значения для следующей загрузки, зависит от данных. Возможно, процесс хранения хэша SHA1 вместе с неструктурированными данными был бы полезен при сравнении.
Удачи и дай мне знать, как ты поживаешь.