Как перехватить мета-данные Apache flume для передаваемых данных
Я пытался перехватить метаданные Apache Flume, но я не видел, где он записывает эту информацию.
Пожалуйста, дайте мне знать, если мне нужно выполнить предварительную настройку для сбора метаданных Flume.
Заранее спасибо.
1 ответ
Компоненты Flume записывают часть такой мета-информации в стандартный журнал Flume (/var/log/flume-ng).
Например, приемник HDFS записывает путь к файлу при его развертывании:
19 апр 2013 13:00:07,063 INFO [hdfs-hdfs_sink-roll-timer-0] (org.apache.flume.sink.hdfs.BucketWriter.renameBucket:379) - Renaming hdfs://localhost/path/to/data/2013/04/19/12/data.1366358400751.tmp to hdfs://localhost/path/to/data/2013/04/19/12/data.1366358400751
Avro source регистрирует каждый полученный пакет событий:
19 апр 2013 13:00:07,175 DEBUG [New I/O server worker #1-31] (org.apache.flume.source.AvroSource.appendBatch:222) - Avro source avro_source: Received avro event batch of 100 events.
Кроме того, в Flume есть возможности мониторинга, которые позволяют сообщать во внешнюю систему (например, Ganglia) некоторые показатели, такие как общее количество обработанных сообщений, размер канала и т. Д. Посмотрите на http://flume.apache.org/FlumeUserGuide.html.