Хотите получить теги / атрибуты и их значения из XML в hadoop

У меня есть большой XML-файл, и я хочу извлечь атрибуты / теги и их значения из XML-файла и сохранить их в таблицах озера данных, используя hive или spark. Атрибуты / теги являются вложенными и имеют очень длинную иерархию. Я пытался использовать Hive Serde, но из-за длинной иерархии и сложной структуры некоторые столбцы не заполняются правильно. Есть ли другой вариант для этого? Нужна помощь, чтобы продолжить.

0 ответов

Другие вопросы по тегам