Есть ли разница между терминами "целостность данных" и "качество данных"?
Мне задали этот вопрос сегодня в интервью, и я не знал, как ответить.
Кто-нибудь может дать представление о различиях?
2 ответа
Целостность данных: Точность и согласованность хранимых данных, что подтверждается отсутствием каких-либо изменений в данных между двумя обновлениями записи данных. Целостность данных вводится в базу данных на этапе ее разработки с использованием стандартных правил и процедур и поддерживается с помощью процедур проверки и проверки ошибок.
Качество данных - это восприятие или оценка пригодности данных для выполнения своей задачи в данном контексте.
Аспекты качества данных включают в себя:
Accuracy
Completeness
Update status
Relevance
Consistency across data sources
Reliability
Appropriate presentation
Accessibility
Приведенный ниже ответ относится к тестированию ETL: целостность данных (проверка потерянности) - проверьте, имеет ли недавно добавленный столбец / существующий столбец родительский элемент, который является нулевым или пустым.
Качество данных (процентная нулевая проверка) - эта проверка выполняется только при добавлении нового столбца в таблицу.