Trino — это механизм распределенных запросов SQL с открытым исходным кодом для выполнения аналитических запросов к источникам данных любого размера, от гигабайт до петабайт. Trino — это версия Presto для сообщества, возникшая в результате переименования кодовой базы PrestoSQL.
1 ответ

Как я могу получить тип значения JSON в Presto?

У меня есть строка JSON, которую я запрашиваю с помощью Presto, и я хочу агрегировать по типам значений. Для этого мне нужно получить тип значения. В частности, для JSON вроде: { "a": 1, "b": "a", "c": true, "d": [ 1 ], "e": { "f": "g" }, } Я хотел …
23 фев '21 в 06:08
1 ответ

Выровнять массив в таблице, который может быть NULL или пустым в presto

У меня есть следующая таблица, которую я использую в своем запросе sql. И я хотел бы превратить его в следующую форму Как мне это сделать? Я использовал unnest и cross join. Из-за пустого массива я не получил всего представления.
22 фев '21 в 16:30
1 ответ

Для строк с одинаковыми значениями A, B, C, как выбрать только «самую раннюю» строку (указанную столбцом D) в заданном временном диапазоне?

В настоящее время у меня есть запрос (упрощенный ниже): SELECT name, node, points, <bunch of other fields>, DATE(snapshot_date) AS snap_date, HOUR(snapshot_date) AS snap_hour, CASE WHEN MINUTE(snapshot_date) IN (5, 6) THEN 0 WHEN MINUTE(snapsh…
10 фев '21 в 22:43
2 ответа

Поиск n-го вхождения шаблона в строке в SQL (Presto)

Я пишу запрос в Presto SQL с помощью функции regexp_extract У меня есть строка, которая может выглядеть как в следующих примерах: '1A2B2C3D3E' '1A1B2C2D3E' '1A2B1C2D2E' Я пытаюсь найти, например, второе вхождение 1 [AE]. Если я попробую regexp_extra…
17 фев '21 в 02:41
1 ответ

Экстракт Json принимает значение null - Presto SQL

Я пытаюсь использовать извлечение json, чтобы получить некоторые значения, используя приведенный ниже код: json_extract_scalar(properties,'$.partner_target_app_id') as partner_target_app_id, И это работает, однако значения приходят как NULL. Когда я…
16 фев '21 в 23:24
2 ответа

Ошибка выполнения запроса в коде Java для подключения к Presto

Мы пытаемся подключиться к Presto с помощью кода Java и выполнить несколько запросов. Каталог, который мы используем, - это MySQL. Presto установлен на сервере Linux. Presto CLI отлично работает в Linux. Запустил Presto в Linux. MySQL также установл…
08 фев '21 в 13:22
0 ответов

Ranger Audits не регистрируется с помощью Presto - 317

Аудиты рейнджеров не регистрируются с помощью Presto-317. Прекрасно работает с Presto -208. В настоящее время используется Ranger 1.1.0 и presto-ranger-plugin1.1.0 для Presto. Ranger обеспечивает контроль доступа по мере необходимости, но журналы до…
09 фев '21 в 16:07
0 ответов

Зачем выбирать отдельные значения с presto, противоречащие неявному преобразованию prestosql

Случай 1: Select distinct id,datetime from db where id='1234567890123456789' Если я сделаю этот запрос в case1, когда тип данных id - bigint, я получу другой результат (результат отсутствует в базе данных, поэтому это не вопрос точности), который не…
06 фев '21 в 07:26
1 ответ

Presto sql join против пересечения-союза, который более эффективен

постановка задачи:- имя_процесса - test.exe, ключ_ реестра - \ REGISTRY \ test, ip - 192.xxx схема:- process_name is in process table registry_key is in registry table ip is in network table process_id is common across all tables размер каждой табли…
06 фев '21 в 10:24
1 ответ

Выполнение побитовой операции для всех сгруппированных по значениям в Presto

Мне нужно выполнить BITWISE_ORпо всем сгруппированы по значениям.Скажем, мои значения в группе по: 100, 010 и 110. И мне нужно вычислить «100 или 010 или 110», что равно 110. Итак, я хочу сделать что-то вроде: select col1, array_agg(col2) from table…
15 фев '21 в 12:18
1 ответ

SQL устраняет повторяющиеся строки на основе двух столбцов

Попытка написать запрос Presto, чтобы исключить то, что я считаю повторяющимися записями. Вот упрощенная версия моей таблицы: На самом деле не имеет значения, сохраняю ли я пару (AA, BB) или (BB, AA), для этой цели они одинаковы. Фактические значени…
05 мар '21 в 18:20
1 ответ

Сопоставление повторяющихся значений в presto

Я извлекаю данные из JSON и сопоставляю два массива в presto. Он отлично работает, когда в массиве нет повторяющихся значений, но не работает с ошибкой - дублирование ключей карты не допускается, если какое-либо из значений повторяется. Мне нужны эт…
12 фев '21 в 22:47
1 ответ

Возвращаемые значения внутреннего соединения

У меня есть такой запрос, select name from employee inner join task on employee.id = task.employee_id order by name asc Таблицы выглядят так: наемный рабочий id name 1 Emily 2 Sam 3 AI 4 Joe 5 Daniel 6 John задача task_id employee_id A123 1 D456 3 A…
24 фев '21 в 09:41
2 ответа

Зачем AWS Athena нужно «ведро для разлива», когда она выгружает результаты в целевое местоположение S3

Зачем AWS Athena нужно «ведро для разлива», когда он выгружает результаты в целевое местоположение S3 WITH ( format = 'Parquet', parquet_compression = 'SNAPPY', external_location = '**s3://target_bucket_name/my_data**' ) AS WITH my_data_2 AS (SELECT…
24 фев '21 в 11:54
1 ответ

Ежедневные активные подсчеты ВЕЩЕЙ из строк, детализирующих изменение ВЕЩЕЙ

Скажем, у меня есть таблица людей, которые использовали мой сервис в день N, и таблица, описывающая, на какую тему пользователи изменили. Нет таблицы с информацией о том, какую тему они сейчас используют. Я бы хотел видеть это ежедневно. Допустим, т…
24 фев '21 в 10:44
1 ответ

Как можно использовать предложение WHERE в запросах AWS Athena Json?

У меня есть таблица, в которой я сохранил некоторую информацию из объекта Json: Стол: investment unit(string) data(string) Если запустить запрос SELECT * FROM "db"."investment" limit 10; Получил следующий результат: Unit Date CH [{"from":"CH","when"…
24 фев '21 в 07:56
0 ответов

Presto Json Parsing

У меня есть поле json (прикрепленный образец), и мне нужно извлечь значения в пути ProvisioningSystem, но он работает, только если я жестко закодирую расположение массива. Как я могу извлечь значение без жесткого кодирования? Заранее спасибо! Код: T…
24 фев '21 в 02:01
2 ответа

Функция окна SQL сгруппирована, но по-прежнему получает «должно быть агрегатным выражением или фигурировать в предложении GROUP BY»

У меня есть запрос SQL (presto), скажем так: select id , product_name , product_type , sum(sales) as total_sales , sum(sales) over (partition by type) as sales_by_type from some_table group by 1,2,3 Когда я запускаю это, я получаю сообщение об ошибк…
12 мар '21 в 23:31
1 ответ

Google Dataproc Presto: how to run queries using Python

I have set up a Google Dataproc cluster running Presto by going through the steps in this link. It works fine and I am able to run queries through gcloud command-line tool as shown on the link like this. gcloud dataproc jobs submit hive \ --cluster …
0 ответов

Как заставить Trino (Presto) быстрее получать большой объем данных из MongoDB?

Я хотел бы задать вопрос об использовании Trino 351 для группировки данных из MongoDB 4.0: Я протестировал с Trino CLI, чтобы сгруппировать 730000 записей из MongoDB в результат агрегирования. Результат правильный, но есть проблема: получение данны…
14 мар '21 в 12:34