Качество данных Сервисы Внутреннее поведение

При создании базы знаний по DQS мы можем выбрать только SQL Server и Excel из выпадающего списка.

Я хочу запросить оракула. Чтобы сделать это, я подумал о создании представления на SQL Server, которое выбирает связанный сервер Oracle, но я беспокоюсь о производительности.

Допустим, моя таблица содержит 10 тыс. Строк, и я не возражаю против влияния запроса на связанный сервер, который возвращает 10 тыс. Строк, если он выполняется только ОДИН РАЗ.

Мой вопрос: загружает ли DQS все данные, необходимые для выполнения операции очистки, за один раз или продолжает отправлять запросы источнику данных (в моем примере, oracle) во время процесса очистки?

2 ответа

Решение

Вам нужно будет экспортировать данные Oracle в формат, который можно импортировать в DQS. Это однократный импорт данных для проекта очистки. Я сделал серию коротких (<5 минут каждый) скринкастов на DQS - это может быть полезно, когда вы только начинаете.

Кроме того, установите CU1 перед началом использования DQS, поскольку обновление существенно повышает производительность.

Да, представление в SQL, указывающее на ORACLE через связанный сервер, "обманывает" DQS, заставляя думать, что локальные данные находятся в SQL. Доступ к данным осуществляется один раз, копируется в базу данных DQS и обрабатывается там.

Я бы рекомендовал установить 2012 SP1 вместо CU, поскольку там есть более стабильные / проверенные обновления. После установки SP1 вам нужно будет запустить

DQSInstaller.exe –upgrade

Этот файл при установке по умолчанию находится в

C:\Program Files\Microsoft SQL Server\MSSQL11.MSSQLSERVER\MSSQL\Binn
Другие вопросы по тегам