OpenNMS - хранилище (Ресурсы хоста SNMP MIB-2) с неправильными значениями
Я использую OpenNMS Horizon для мониторинга нескольких узлов. Для данного узла это мониторинг "Хранилище (Ресурсы хоста SNMP MIB-2) ", который сообщает о дисковом пространстве (% использования). Хотя для локальных дисков узла я получаю правильные значения. Для дисков SAN File System поступают неправильные значения (также отрицательные значения). Однако для нескольких томов SAN это дает правильные значения. Каковы возможные причины этой ошибки?
1 ответ
Данные поступают из конфигурации сбора данных MIB-II по умолчанию, определенной в ${OPENNMS_HOME}/etc/datacollection/mib2.xml
,
<resourceType name="hrStorageIndex" label="Storage (SNMP MIB-2 Host Resources)" resourceLabel="${hrStorageDescr}">
<persistenceSelectorStrategy class="org.opennms.netmgt.collection.support.PersistAllSelectorStrategy"/>
<storageStrategy class="org.opennms.netmgt.dao.support.SiblingColumnStorageStrategy">
<parameter key="sibling-column-name" value="hrStorageDescr"/>
<parameter key="replace-first" value="s/^-$/_root_fs/"/>
<parameter key="replace-all" value="s/^-//"/>
<parameter key="replace-all" value="s/\s//"/>
<parameter key="replace-all" value="s/:\\.*//"/>
</storageStrategy>
</resourceType>
Определение типа ресурса сообщает сборщику SNMP, как обращаться с несколькими экземплярами дисков.
Следующая часть сообщает сборщику SNMP, какие OID были запрошены и сохранены в системе для каждого выбранного экземпляра диска:
<group name="mib2-host-resources-storage" ifType="all">
<mibObj oid=".1.3.6.1.2.1.25.2.3.1.2" instance="hrStorageIndex" alias="hrStorageType" type="string"/>
<mibObj oid=".1.3.6.1.2.1.25.2.3.1.3" instance="hrStorageIndex" alias="hrStorageDescr" type="string"/>
<mibObj oid=".1.3.6.1.2.1.25.2.3.1.4" instance="hrStorageIndex" alias="hrStorageAllocUnits" type="gauge"/>
<mibObj oid=".1.3.6.1.2.1.25.2.3.1.5" instance="hrStorageIndex" alias="hrStorageSize" type="gauge"/>
<mibObj oid=".1.3.6.1.2.1.25.2.3.1.6" instance="hrStorageIndex" alias="hrStorageUsed" type="gauge"/>
</group>
Первое, что я хотел бы исследовать, это какие значения вы получаете от агента SNMP устройства, используя snmpwalk
Инструмент командной строки на OID выше.
Полученные значения сохраняются по умолчанию в RRDTool, а вычисление для получения процента выполняется в шаблоне графика RRD, который можно найти в ${OPENNMS_HOME}/etc/snmp-graph.properties.d/mib2-graph.properties
,
Полное определение шаблона RRD выглядит следующим образом:
report.mib2.storage.usage.name=Storage Utilization (MIB-2 Host Resources)
report.mib2.storage.usage.columns=hrStorageSize, hrStorageUsed, hrStorageAllocUnits
report.mib2.storage.usage.propertiesValues=hrStorageDescr
report.mib2.storage.usage.type=hrStorageIndex
report.mib2.storage.usage.command=--title="Storage Utilization on {hrStorageDescr}" \
--vertical-label="Percentage (%)" \
--base=1024 \
--lower-limit 0 \
--upper-limit 105 \
DEF:total={rrd1}:hrStorageSize:AVERAGE \
DEF:used={rrd2}:hrStorageUsed:AVERAGE \
DEF:units={rrd3}:hrStorageAllocUnits:AVERAGE \
CDEF:totalBytes=total,units,* \
CDEF:usedBytes=used,units,* \
CDEF:usedPart=usedBytes,totalBytes,/ \
CDEF:dpercent=usedPart,100,* \
CDEF:dpercent10=0,dpercent,GT,0,dpercent,IF \
CDEF:dpercent20=10,dpercent,GT,0,dpercent,IF \
CDEF:dpercent30=20,dpercent,GT,0,dpercent,IF \
CDEF:dpercent40=30,dpercent,GT,0,dpercent,IF \
CDEF:dpercent50=40,dpercent,GT,0,dpercent,IF \
CDEF:dpercent60=50,dpercent,GT,0,dpercent,IF \
CDEF:dpercent70=60,dpercent,GT,0,dpercent,IF \
CDEF:dpercent80=70,dpercent,GT,0,dpercent,IF \
CDEF:dpercent90=80,dpercent,GT,0,dpercent,IF \
CDEF:dpercent100=90,dpercent,GT,0,dpercent,IF \
COMMENT:"Storage used in (%)\\n" \
AREA:dpercent10#5ca53f:"0-10% " \
AREA:dpercent20#75b731:"11-20%" \
AREA:dpercent30#90c22f:"21-30%" \
AREA:dpercent40#b8d029:"31-40%" \
AREA:dpercent50#e4e11e:"41-50%" \
COMMENT:"\\n" \
AREA:dpercent60#fee610:"51-60%" \
AREA:dpercent70#f4bd1b:"61-70%" \
AREA:dpercent80#eaa322:"71-80%" \
AREA:dpercent90#de6822:"81-90%" \
AREA:dpercent100#d94c20:"91-100%\\n" \
COMMENT:"\\n" \
HRULE:100#d94c20 \
COMMENT:"\\n" \
LINE1:dpercent#46683b:"Storage used in (%)" \
GPRINT:dpercent:AVERAGE:"Avg\\: %7.2lf%s" \
GPRINT:dpercent:MIN:"Min\\: %7.2lf%s" \
GPRINT:dpercent:MAX:"Max\\: %7.2lf%s\\n" \
COMMENT:"\\n" \
COMMENT:"Used Bytes\\: \\n" \
GPRINT:usedBytes:AVERAGE:"Avg\\: %7.2lf%s" \
GPRINT:usedBytes:MIN:"Min\\: %7.2lf%s" \
GPRINT:usedBytes:MAX:"Max\\: %7.2lf%s\\n" \
COMMENT:"\\n" \
GPRINT:totalBytes:AVERAGE:"Total Bytes\\: %7.2lf%s"
Самая важная часть, чтобы получить процент - вычисление, сделанное здесь:
DEF:total={rrd1}:hrStorageSize:AVERAGE \
DEF:used={rrd2}:hrStorageUsed:AVERAGE \
DEF:units={rrd3}:hrStorageAllocUnits:AVERAGE \
CDEF:totalBytes=total,units,* \
CDEF:usedBytes=used,units,* \
CDEF:usedPart=usedBytes,totalBytes,/ \
CDEF:dpercent=usedPart,100,* \
Он использует специальную запись обратной полировки RRDTool для расчета использования в процентах от "использованных байтов" и "общего количества байтов". Как вы можете видеть, использованные и общие байты должны быть рассчитаны на основе размера модулей агентов SNMP в байтах и того, сколько единиц имеется в общем количестве и используется на диске.
Вы можете проверить, дает ли агент SNMP от устройства разумные значения, и можете ли вы пересчитать значения самостоятельно.
Я надеюсь, что это помогает отладить вашу проблему.