Как прочитать таблицу улья транзакции орка в спарк?

Question

Как прочитать таблицу улья транзакции орка в спарк?

1. как прочитать таблицу улья транзакции орка в спарк?
  Я столкнулся с проблемой при чтении таблицы транзакций ORC через спарк. Я получаю схему таблицы кустов, но не могу прочитать фактические данные.
  Смотрите полный сценарий:
  hive> создать таблицу default.Hello(id int,name name строка), кластеризованная (id) в 2 сегмента STORED AS ORC TBLPROPERTIES ('транзакция'='истина');
  hive> вставить в значения default.hello (10,'abc');
  сейчас я пытаюсь получить доступ к данным Hive Orc из Spark SQL, но он показывает только схему
  spark.sql("выбрать * из привет").show()
  Вывод: идентификатор, имя

4

apache-spark apache-spark-sql hive orc

Источник

user9396373 09 май '18 в 13:26

2 ответа

Другие вопросы по тегам apache-spark apache-spark-sql hive orc

user4665655 21 май '19 в 07:24 2019-05-21 07:24 · Answer 1 · 2019-05-21 07:24

Да, в качестве обходного пути мы можем использовать сжатие, но когда работа выполняется микропакетным уплотнением, это не поможет. поэтому я решил использовать вызов JDBC. Пожалуйста, отправьте мой ответ на этот вопрос по ссылке ниже или перейдите на страницу GIT - https://github.com/Gowthamsb12/Spark/blob/master/Spark_ACID

Пожалуйста, обратитесь мой ответ по этому вопросу

user3865083 10 июл '18 в 18:43 2018-07-10 18:43 · Answer 2 · 2018-07-10 18:43

Искра не сейчас (версия 2.3) полностью совместима с транзакционными таблицами улья. Обходной путь должен сделать сжатие на столе после любой транзакции.

ALTER TABLE Hello COMPACT 'Major';

Это уплотнение должно позволить вам видеть данные. (через некоторое время данные уплотняются)

1

Источник

user3865083 10 июл '18 в 18:43

user2864184 09 май '18 в 14:49 2018-05-09 14:49 · Answer 3 · 2018-05-09 14:49

Вам нужно добавить действие в конце, чтобы заставить его выполнить запрос:

spark.sql("Select * From Hello").show()

(По умолчанию здесь показано 20 строк)

или же

spark.sql("Select * From Hello").take(2)

чтобы увидеть 2 строки выходных данных.

Это только примеры действий, которые могут быть предприняты в DataFrame.