Данные не отображаются периодически в пользовательском интерфейсе OpenTSDB

Мы запускаем несколько тестов большого объема, передавая метрики в OpenTSDB (2.3.0) с помощью BigTable, и время от времени появляется любопытная проблема. Для некоторых показателей час данных перестает отображаться в веб-интерфейсе при выполнении запроса. Диапазон "пропущенных" данных очень четкий и граничит с часами (UTC). Через некоторое время, при повторном выполнении того же запроса, появляются данные. Кажется, здесь нет какой-то закономерности, кроме часового промежутка. Любые указатели на то, что искать и отлаживать это?

1 ответ

Как долго вы должны ждать, пока не появятся данные? Это всегда самый последний час, который отсутствует?

Пытались ли вы использовать OpenTSDB CLI, когда это происходит, и выдавать сканирование, чтобы проверить, доступны ли данные таким образом?

http://opentsdb.net/docs/build/html/user_guide/cli/scan.html

Вы также можете проверить с помощью сканирования оболочки HBase, чтобы узнать, сможете ли вы получить необработанные данные таким образом (вот информация о том, как они хранятся в HBase):

http://opentsdb.net/docs/build/html/user_guide/backends/hbase.html

Если вы можете проверить, есть ли данные, вероятно, это проблема веб-интерфейса. Если нет, то следующим вероятным виновником является создание резервной копии в конвейере записи.

Я не знаю ни одной конкретной проблемы в бэкэнд-слое Google Cloud Bigtable, которая могла бы вызвать такое поведение, но я полагаю, что некоторые люди сталкивались с проблемами с уплотнениями OpenTSDB в периоды высокой нагрузки, которые приводят к снижению производительности.

Стоит проверить в облачной консоли Google, чтобы увидеть, есть ли какие-либо отклонения в графиках задержки, ЦП или пропускной способности, которые коррелируют со временем, в течение которого вы испытываете проблему.

Другие вопросы по тегам