Описание тега morphline
Kite Morphlines (ранее известная как Cloudera Morphlines) - это среда с открытым исходным кодом, которая поддерживает приложения Hadoop, Flume и Spark, которые извлекают, преобразовывают и загружают данные в Apache Solr, Apache HBase, HDFS, корпоративные хранилища данных и т. Д.
"Морфлайн" - это файл конфигурации, который определяет цепочку преобразований, которая потребляет любые данные из любого источника данных, обрабатывает данные и загружает результаты в компонент Hadoop.
Morphlines - это библиотека, встраиваемая в любую кодовую базу JVM. Морфлайн - это хранящийся в памяти контейнер команд преобразования. Команды - это плагины к морфлайн, которые выполняют такие задачи, как загрузка, синтаксический анализ, преобразование или иная обработка отдельной записи. Запись представляет собой структуру данных в памяти пар имя-значение с необязательными вложениями больших двоичных объектов или вложениями POJO. Платформа расширяется за счет встроенных фрагментов Java или дополнительных команд, написанных как классы Java.