Друид хранит 0 или 0.0 как нулевые значения
Версии druid .10.1 из HDP-2.6.5.0 Мы используем загрузку службы индексатора druid-kafka для загрузки данных в druid из тем kafka, и во время этого мы обнаружили, что druid хранит значения метрик, которые имеют 0 или 0.0 как ноль и при получении через суперсет или друид api, получая ответ как ноль. Нужен совет, если мы что-то здесь упустили.
Ошибка из суперсета:
{"status": "failed", "error_type": "warning", "error": "unsupported operand type(s) for +: 'int' and 'NoneType'"}
Файл спецификации проглатывания ниже:
{
"type": "kafka",
"dataSchema": {
"dataSource": "data-source",
"parser": {
"type": "string",
"parseSpec": {
"format": "json",
"timestampSpec": {
"column": "datetime",
"format": "YYYYMMdd_HHmmss"
},
"columns": [
"created_date",
"s_type",
"datetime",
"ds_ser",
"ven",
"cou_name",
"c_name",
"d_name",
"dv_name",
"p_name",
"redTime",
"wrTime",
"tRate",
"MTRate"
],
"dimensionsSpec": {
"dimensions": [
"created_date",
"s_type",
"datetime",
"ds_ser",
"ven",
"cou_name",
"c_name",
"d_name",
"dv_name",
"p_name",
]
}
}
},
"metricsSpec": [{
"name": "count",
"type": "count"
},
{
"type": "doubleMax",
"name": "redTime",
"fieldName": "redTime"
},
{
"type": "doubleMax",
"name": "wrTime",
"fieldName": "wrTime"
},
{
"type": "longMax",
"name": "tRate",
"fieldName": "tRate"
},
{
"type": "longMax",
"name": "MTRate",
"fieldName": "MTRate"
}
],
"granularitySpec": {
"type": "uniform",
"segmentGranularity": "HOUR",
"queryGranularity": "NONE"
}
},
"tuningConfig": {
"type": "kafka",
"maxRowsPerSegment": 5000000
},
"ioConfig": {
"topic": "ptopic",
"useEarliestOffset": "true",
"consumerProperties": {
"bootstrap.servers": "host:port"
},
"taskCount": 1,
"replicas": 1,
"taskDuration": "PT5M"
}
}
Остальные api от druid используются: http://host:port/druid/v2?pretty
тело:
{
"queryType": "groupBy",
"dataSource": "data-source",
"granularity": "all",
"dimensions": ["ds_ser"],
"aggregations": [
{"type": "doubleMax", "name": "redTime", "redTime": "writeresponsetime"},
{"type": "doubleMax", "name": "wrTime", "wrTime": "totalResponseTime"},
{"type": "longMax", "name": "tRate", "fieldName": "tRate"},
{"type": "longMax", "name": "MTRate", "MTRate": "MaxTransferRate"}
],
"intervals": ["2019-01-02T00:00/2019-01-02T23:59"]
}
Ответ друида:
[
{
"version": "v1",
"timestamp": "2019-01-02T00:00:00.000Z",
"event": {
"redTime": null,
"ds_ser": "240163",
"wrTime": null,
"tRate": null,
"MTRate": null
}
},
{
"version": "v1",
"timestamp": "2019-01-02T00:00:00.000Z",
"event": {
"redTime": null,
"ds_ser": "443548",
"wrTime": null,
"tRate": 0,
"MTRate": null
}
}
]
Данные в Кафке:
> {"created_date":"2019-02-03T18:35:59.514Z","s_type":"BLOCK","datetime":"20181121_070000","ds_ser":"443551","ven":"abc","cou_name":"USA","c_name":"Piscataway","d_name":"Piscataway","dv_name":"USPSCG","p_name":"443551-CK","redTime":0.0,"wrTime":0.0,"tRate":0,"MTRate":0}
> {"created_date":"2019-02-03T18:35:59.514Z","s_type":"BLOCK","datetime":"20181121_070000","ds_ser":"443551","ven":"abc","cou_name":"USA","c_name":"Piscataway","d_name":"Piscataway","dv_name":"USPSCG4","p_name":"443551-CF","redTime":0.0,"wrTime":0.0,"tRate":0,"MTRate":0}
0 ответов
Что ж, я нашел ответ на свой вопрос.
Я сделал ошибку при подготовке druid kafka inderex json. Я не знал, что поля чувствительны к регистру. Фрагмент json, размещенный здесь, был выдуманным, поэтому имена полей совпадают, но в моем фактическом производственном коде и файле json они не совпадали, поэтому druid принимает их как новые поля и присваивает значение null при их приеме. Пример ниже:
Кафка Json:
{"created_date":"2019-02-03T18:35:59.514Z","s_type":"BLOCK","datetime":"20181121_070000","ds_ser":"443551","ven":"abc","cou_name":"USA","c_name":"Piscataway","d_name":"Piscataway","dv_name":"USPSCG","p_name":"443551-CK","redTime":0.0,"wrTime":0.0,"tRate":0,"MTRate":0}
Столбцы json в индексаторе Druid выглядели так:
"columns": [ "created_date", "s_type", "datetime", "ds_ser", "ven", "cou_name", "c_name", "d_name", "dv_name", "p_name", "redTime", "wrtime", "trate", "MTRate" ],
Если мы наблюдаем выше, есть несоответствие в wrTime --> wrtime
а также tRate --> trate
. Так что для меня это было основной причиной, когда после разрешения имен друид начал принимать правильные значения.