Описание тега hive-serde
SerDe — это сокращение от Serializer/Deserializer, интерфейса, используемого Hive как для сериализации, так и для десериализации во время ввода-вывода, а также для интерпретации результатов сериализации как отдельных полей. SerDe позволяет Hive считывать данные из таблицы и записывать их обратно в HDFS в любом пользовательском формате. Любой может написать свой SerDe для своих форматов данных.
Страница официальной документации: SerDe
Есть много SerDe в комплекте с Hive, а также SerDe сторонних производителей, например:
- LazySimpleSerDe
- OpenCSVSerDe
- RegexSerDe
- JsonSerDe
- АвроСерДе
- ПаркетУлейSerDe
- ОркСерДе
- MultiDelimitSerDe