Инкрементные нагрузки в Polybase

Я создал ВНЕШНЮЮ ТАБЛИЦУ для PolyBase для загрузки данных из хранилища больших двоичных объектов в хранилище данных SQL Azure. У меня есть ниже вопросы, касающиеся загрузки файла.

1) Если происходит постепенный рост данных, то как будет работать PolyBase. Если есть ежедневный образец файла, как

test_2019_02_01.incr
test_2019_02_02.incr

тогда нам нужно каждый раз создавать и создавать внешние таблицы. если нет, то как мне сделать эту работу

CREATE EXTERNAL TABLE [dbo].[sample]
 (
 [social] varchar(30) NOT NULL,
 [address] varchar(30) NOT NULL
 )
 with (
 LOCATION='/TEST/',
 DATA_SOURCE=POLYTEST,
 FILE_FORMAT=POLY_TEST_HEADER,
 REJECT_TYPE=VALUE,
 REJECT_VALUE=0
 )

2) Можно ли писать сценарии UNIX в хранилище больших двоичных объектов PolyBase Azure?

Пожалуйста, поделитесь своими мыслями по этому вопросу.

1 ответ

Решение

Вы можете создать таблицу в хранилище данных SQL Azure, в которой будут находиться данные, поступающие из файлов, затем создать список файлов, находящихся в хранилище Azure, и проходить по этому списку, создавая и удаляя внешнюю таблицу для каждого элемента в списке, Вы можете пометить каждый элемент, уже обработанный. Каждый раз, когда вы создаете внешнюю таблицу, вы загружаете данные в таблицу хранилища данных Azure, а затем удаляете внешнюю таблицу. Здесь вы найдете полный пример.

Другие вопросы по тегам