Качество данных Сервисы Внутреннее поведение
При создании базы знаний по DQS мы можем выбрать только SQL Server и Excel из выпадающего списка.
Я хочу запросить оракула. Чтобы сделать это, я подумал о создании представления на SQL Server, которое выбирает связанный сервер Oracle, но я беспокоюсь о производительности.
Допустим, моя таблица содержит 10 тыс. Строк, и я не возражаю против влияния запроса на связанный сервер, который возвращает 10 тыс. Строк, если он выполняется только ОДИН РАЗ.
Мой вопрос: загружает ли DQS все данные, необходимые для выполнения операции очистки, за один раз или продолжает отправлять запросы источнику данных (в моем примере, oracle) во время процесса очистки?
2 ответа
Вам нужно будет экспортировать данные Oracle в формат, который можно импортировать в DQS. Это однократный импорт данных для проекта очистки. Я сделал серию коротких (<5 минут каждый) скринкастов на DQS - это может быть полезно, когда вы только начинаете.
Кроме того, установите CU1 перед началом использования DQS, поскольку обновление существенно повышает производительность.
Да, представление в SQL, указывающее на ORACLE через связанный сервер, "обманывает" DQS, заставляя думать, что локальные данные находятся в SQL. Доступ к данным осуществляется один раз, копируется в базу данных DQS и обрабатывается там.
Я бы рекомендовал установить 2012 SP1 вместо CU, поскольку там есть более стабильные / проверенные обновления. После установки SP1 вам нужно будет запустить
DQSInstaller.exe –upgrade
Этот файл при установке по умолчанию находится в
C:\Program Files\Microsoft SQL Server\MSSQL11.MSSQLSERVER\MSSQL\Binn