Описание тега druid

Описание тега Вопросы с тегом

Druid - это распределенное хранилище данных с открытым исходным кодом, ориентированное на столбцы, написанное на Java.

2 ответа

Запрос друида из Java-приложения

Я новичок в друид. Я хочу запросить удаленный кластер друидов из моего Java-приложения. Я прочитал в группе google druid-user, что мы можем использовать io.druid.client.DirectDruidClient . Может кто-нибудь помочь мне или указать ресурс с примером дл…

druid

07 ноя '16 в 12:39

0 ответов

Друид ищет один-ко-многим

У меня проблемы с поиском. Я хочу на карту, например, key: 'test' для нескольких значений измерения, например data.page.href или же data.app-id, В документации я прочитал, что это возможно, но нет примеров, как это сделать. Может кто-нибудь мне помо…

druid

27 ноя '18 в 12:11

1 ответ

Как добавить поля значения Post Aggregation в качестве Metric в Druid io

Я использую друид IO 0.9.0. Я пытаюсь добавить поле после агрегации в качестве метрической спецификации. Мое намерение состоит в том, чтобы показать значение поля после агрегации, аналогичное показу метрики (меры) (в Druid io с использованием Pivot)…

java druid

06 июн '16 в 11:12

1 ответ

Друид: как он использует кеш и кеш страниц ОС?

Я наблюдаю, что производительность запросов Druid может выиграть от предыдущих запросов. Таким образом, я пытаюсь понять причины. Я знаю, что Друид использует кеш (я использую кеш в Брокере), но этот кеш просто хранит результаты запросов на сегмент …

bigdata druid

02 июл '18 в 10:15

0 ответов

Почему суперсет apache показывает более старые значения для кластера друидов?

У меня есть кластер друидов, связанный с темой Кафки. Когда я публикую значения по моей теме Kafka, эти значения немедленно вставляются в источник данных druid, и я также могу напрямую запросить их, используя JSON-запросы druid, и получить правильны…

apache-kafka apache-superset druid superset

07 май '18 в 06:24

0 ответов

Эквивалент SQL JOIN в Pivot (друид)

У меня есть куб данных, содержащий подробную информацию о депозитах, выполненных клиентами, как показано ниже. Я хотел бы выполнить запрос, который возвращает сумму первого депозита и общую сумму депозита каждого клиента. Пример: Должен вернуться: З…

mysql join pivot druid

22 ноя '17 в 15:54

4 ответа

Есть ли возможность иметь другую метку времени в качестве измерения в друид?

Возможно ли иметь источник данных Druid с 2 (или несколькими) временными картами в нем? Я знаю, что Druid - это БД, основанная на времени, и у меня нет проблем с этой концепцией, но я хотел бы добавить другое измерение, с которым я могу работать, ка…

druid

24 июн '16 в 08:01

1 ответ

Не может написать Друиду через SparkStreaming и Спокойствие

Я пытаюсь записать результаты задания Spark Streaming в источник данных Druid. Spark успешно завершает свою работу и передает друида. Друид начинает индексировать, но ничего не пишет. Мой код и журналы следующие: import org.apache.spark._ import org…

apache-spark spark-streaming druid

28 дек '17 в 13:58

2 ответа

Друид - Потоковая загрузка данных - Непрерывные агрегации

Я смотрю на использование Друида для агрегации. Мой вариант использования заключается в том, что я хочу передавать данные в Druid (для того же дня, когда для plotGranularity задано значение DAY), а во время приема я хочу собирать данные. Мой вопрос …

stream druid

30 май '18 в 18:14

1 ответ

Друид - метрики longSum не заполняются

Я использую пакетный прием в друиде, используя файл wikiticker-index.json, который поставляется с быстрым стартом друида. Ниже приведена моя схема данных в файле wikiticker-index.json. { type:"index_hadoop", spec:{ ioConfig:{ type:"hadoop", inputSpe…

java hadoop druid superset

10 июл '17 в 08:55

1 ответ

JSONDecodeError: Ожидаемое значение: строка 1, столбец 1 (символ 0) с pydruid

У нас есть данные в базе данных druid, и нам нужно прочитать их, используя python для дальнейшей обработки для анализа. Я пытаюсь прочитать базу данных друидов, используя пакет pydruid. Я использую Python 3.5. Тем не менее я получаю сообщение об оши…

python-3.x druid

23 фев '18 в 22:19

2 ответа

Диаграммы временных рядов для больших объемов данных

У меня есть пара тысяч временных рядов, охватывающих несколько лет со второй гранулярностью. Я хотел бы хранить данные в подходящей БД (то есть той, которая хорошо масштабируется и может сохранять все данные с исходной гранулярностью, например, Drui…

time-series grafana druid timeserieschart opentsdb

29 июн '18 в 16:19

1 ответ

Подходит ли друид для данных измерений

У меня есть данные, которые все строки, поэтому его предпочитают в качестве измерения. Но я хочу запустить групповой запрос для годовых, ежемесячных и ежедневных данных для подсчета конкретного измерения. Моя система генерирует в час около 5cr данны…

druid

28 ноя '17 в 16:58

1 ответ

Список поддерживаемых типов данных для измерений в Druid?

Я не могу найти какую-либо конкретную страницу учебника / документа на веб-сайте Druid, в которой есть список всех поддерживаемых типов данных в Druid для измерений. Из того, сколько я прочитал, я знаю, что long, float а также string безусловно, под…

types distributed-computing druid

14 июл '17 в 09:42

2 ответа

Друид против Elasticsearch

Я новичок в друид. Я уже читал "друид против Elasticsearch", но я до сих пор не знаю, в чем хорош друид. Ниже моя проблема: У меня есть кластер Solr с 70 узлами. У меня есть очень большая таблица в solr, которая имеет 1 миллиард строк, и каждая стро…

elasticsearch solr distinct-values druid

24 авг '16 в 09:35

1 ответ

Использование PlyQL-запросов

Я новичок в Druid и PlyQL, и я не мог найти руководства о том, как его использовать. Я установил пакет, но где я должен ввести запрос из примера (в документации https://plywood.imply.io/plyql): plyql -h 192.168.60.100:8082 -q 'SHOW TABLES'

druid

31 авг '18 в 11:21

2 ответа

Задача индексирования druid завершается с ошибкой OutOfMemory

Я создал кластер друидов и отправил задание на индексирование. Похоже, что происходит перекос редуктора, и зацикливание задач индексирования уменьшается на 99 %. это терпит неудачу с ошибкой ниже. 2018-03-27T21:14:30,349 INFO [task-runner-0-priority…

druid

27 мар '18 в 21:53

1 ответ

Является ли агрегация (число) по измерению, но не по показателям, поддерживаемым Druid?

Например, есть два измерения: [страна, веб-сайт] и одна метрика: [PV]. Я хочу знать средний PV сайта для каждой страны. Чтобы сделать это, легко получить общее количество PV в каждой стране, однако трудно получить количество веб-сайтов в каждой стра…

java sql database olap druid

25 ноя '15 в 06:40

1 ответ

Каковы различия между Druid и ElasticSearch? Каковы преимущества для обоих?

Я довольно новичок в Druid, и я не получаю ответы относительно сравнения с ElasticSearch. Я нашел эту ссылку: друид против Elasticsearch, но это не дает различий и преимуществ. Может кто-нибудь объяснить мне это или дать мне некоторые ссылки, которы…

elasticsearch druid

27 окт '16 в 14:26

1 ответ

Быстрая вставка в друида

Столкнувшись с проблемой быстрого приема друида. Вещи начинают ломаться после org.apache.hadoop.mapred.LocalJobRunner - исполнитель задачи на карте завершен. Его можно получить входной файл. Мои спецификации JSON файл - { "hadoopCoordinates": "org.a…

druid

03 фев '17 в 15:05