Является ли определение разделителя в таблице ORC улья бесполезным?
Когда вы создаете таблицу ORC в кусте, вы меняете тип файла на orc. Это означает, что вы не можете смотреть на определенный файл за пределами таблицы orc.
Вот пример оператора orc create table
CREATE TABLE IF NOT EXISTS table_orc_v1
(
col1 int,
col2 int
)
PARTITIONED BY (odate date)
CLUSTERED BY (col1) INTO 10 BUCKETS
STORED AS ORC TBLPROPERTIES('transactional'='true');
Если я попытаюсь сделать это CSV-таблицей (как вы делаете для не-orc таблицы)
1) не влияет на производительность таблицы 2) замедляет производительность, поскольку она преобразует вещи в CSV-файл, который вы никогда не сможете прочитать 3) дайте мне некоторое преимущество, о котором я не знаю 4) сделайте что-нибудь еще
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
1 ответ
Если вы используете какой-либо двоичный формат (ORC, AVRO, Parquet) для хранения ваших данных, то ROW FORMAT DELIMITED FIELDS TERMINATED BY
просто игнорируется, вы можете использовать его в синтаксисе таблицы, это может не дать вам никакой ошибки. Однако они не используются