Какую технологию я могу использовать для поддержания хорошей гигиены данных в озере данных?
В частности, мне интересно, какие компании используют для "утечки" и "пополнения" информационного озера по мере изменения информационных потребностей. В основном, какие инструменты используют компании для поддержания хорошей гигиены данных.
Если кто-то создал отличный продукт, я не хочу создавать шаблоны проектирования для идентификации и очистки старых данных, но сделаю это при необходимости. Я не ищу сравнение продуктов, а скорее "мы написали x, потому что мы не смогли найти продукт, который сделал x", или "мы используем y, потому что он автоматически архивирует неиспользуемые данные".