Каковы наиболее важные метрики, которые следует искать при подготовке сервера Solr
Я хочу получить сетевые метрики для сервера Solr. Я ищу ретрансляции, отбрасывание, операции, ожидания, задержки на сетевом уровне. Может кто-нибудь предложить другие метрики, которые полезны для мониторинга работоспособности сети в кластере solr? Мы используем телеграф для отправки метрик в графану.
Я пробовал это: я проверил некоторые входные плагины Telegraf, которые полезны для сетевых показателей:
https://github.com/influxdata/telegraf/blob/master/plugins/inputs/net/NETSTAT_README.md из этого плагина:
- tcp_established
- tcp_syn_sent
- tcp_syn_recv
- tcp_fin_wait1
- tcp_fin_wait2
- tcp_time_wait
- tcp_close
- tcp_close_wait
- tcp_last_ack
- tcp_listen
- tcp_closing
- tcp_none
https://github.com/influxdata/telegraf/blob/master/plugins/inputs/net/NET_README.md из этого плагина:
- bytes_sent - общее количество байтов, отправленных интерфейсом
- bytes_recv - общее количество байтов, полученных интерфейсом
- packages_sent - общее количество пакетов, отправленных интерфейсом
- packages_recv - общее количество пакетов, полученных интерфейсом
- err_in - общее количество ошибок приема, обнаруженных интерфейсом
- err_out - общее количество ошибок передачи, обнаруженных интерфейсом
- drop_in - общее количество принятых пакетов, сброшенных интерфейсом
- drop_out - общее количество переданных пакетов, сброшенных интерфейсом
https://github.com/influxdata/telegraf/blob/master/plugins/inputs/net_response/README.md Плагин ввода проверяет время отклика соединений UDP/TCP и может дополнительно проверять текст в ответе.
Статистика, которая присутствует на сетевом устройстве (/sys/class/net/eth0/statistics
) являются
- столкновения
- rx_compressed
- rx_errors
- rx_length_errors
- rx_packets
- tx_carrier_errors
- tx_errors
- tx_packets
- многоадресного
- rx_crc_errors
- rx_fifo_errors
- rx_missed_errors
- tx_aborted_errors
- tx_compressed
- tx_fifo_errors
- tx_window_errors
- rx_bytes
- rx_dropped
- rx_frame_errors
- rx_over_errors
- tx_bytes
- tx_dropped
- tx_heartbeat_errors
Описание этих показателей: https://www.kernel.org/doc/Documentation/ABI/testing/sysfs-class-net-statistics
Пожалуйста, предложите лучшие способы мониторинга работоспособности сети для кластера solr.