Описание тега hive-serde

SerDe — это сокращение от Serializer/Deserializer, интерфейса, используемого Hive как для сериализации, так и для десериализации во время ввода-вывода, а также для интерпретации результатов сериализации как отдельных полей. SerDe позволяет Hive считывать данные из таблицы и записывать их обратно в HDFS в любом пользовательском формате. Любой может написать свой SerDe для своих форматов данных.

Страница официальной документации: SerDe

Есть много SerDe в комплекте с Hive, а также SerDe сторонних производителей, например:

  • LazySimpleSerDe
  • OpenCSVSerDe
  • RegexSerDe
  • JsonSerDe
  • АвроСерДе
  • ПаркетУлейSerDe
  • ОркСерДе
  • MultiDelimitSerDe