Описание тега amazon-redshift
Amazon Redshift - это сервис хранилища данных петабайтного масштаба, использующий существующие инструменты бизнес-аналитики для анализа данных. Redshift - это база данных MPP, ориентированная на столбцы, основанная на ParAccel.
1
ответ
Ежедневная сумма по типу для отображения даты и "0", даже когда ноль (нет активности для этого типа в эту дату)
Я запрашиваю Amazon Redshift (в основном postgresql, за исключением нескольких функций) и пытаюсь получить ежедневную сумму по типу за каждый день (agg daily), но хотел бы включить ноль как '0' в дни, когда для этот конкретный тип. Я могу присоедини…
03 сен '14 в 23:53
1
ответ
redshift/postgresql - Как найти дубликаты, которые появляются в течение 1 секунды во время вставки?
У нас есть небольшая проблема, когда один из наших узлов регистрировал повторяющиеся события. Мы используем следующий запрос для вставки только уникальных событий, однако некоторые события были запущены в течение 1 секунды после предыдущего события,…
28 мар '17 в 13:57
3
ответа
Следует ли использовать AWS Redshift для онлайн-запросов?
У меня есть случай использования, когда довольно массивную (более 1 ТБ) базу данных SQL необходимо перенести в облако, и я подумывал об использовании Redshift вместо какого-либо решения RDS, поскольку оно немного дешевле, и у меня все в порядке с за…
03 апр '17 в 04:08
0
ответов
Amazon Redshift способ сделать PostgreSQL to_json и array_to_json
В PosgreSQL я могу сделать несколько запросов, чтобы преобразовать некоторые строки результата в массив JSON или JSON. Например, если у меня есть таблица user: name surname ---------------- name1 surname1 name2 surname2 name3 surname3 SELECT array_t…
02 июл '18 в 16:20
0
ответов
Попытка redshift повторно использовать скомпилированный код в запросах стиля where-in
Как обсуждалось здесь, redshift компилирует запросы при первом выполнении, а затем повторно использует этот скомпилированный код для аналогичных последующих запросов. Это приводит к тому, что первый запрос будет медленным (от 3 до 10 секунд), а посл…
22 сен '16 в 09:34
1
ответ
Потоковая передача данных из одного потока Kinesis в несколько таблиц в Redshift
У меня есть данные, поступающие в потоки Kinesis от разных производителей. Данные должны быть преобразованы в несколько разных таблиц в зависимости от типа этих данных. Я пытаюсь прочитать лямбду из Kinesis Streams, преобразовать данные в разные таб…
14 сен '17 в 19:09
1
ответ
Запросы для отдельного счетчика, используемого для создания сгруппированного, агрегированного и отфильтрованного набора строк
У меня есть таблица, которая выглядит так: control=# select * from animals; age_range | weight | species -----------+--------+--------- 0-9 | 1 | lion 0-9 | 2 | lion 10-19 | 2 | tiger 10-19 | 3 | horse 20-29 | 2 | tiger 20-29 | 2 | zebra Я выполняю …
06 июн '18 в 22:26
1
ответ
Динамическое имя таблицы в красном смещении
У меня есть несколько таблиц с похожими именами, но с разными префиксами: us_cities, ca_cities и uk_cities. Каждая из этих таблиц состоит только из одного столбца (City_name). Я хочу объединить все эти таблицы вместе и получить такой результат: sele…
01 апр '15 в 11:53
1
ответ
Обновление кластера красного смещения Скорость запроса на убийство
Поэтому каждый вечер у меня есть сценарий сборки SQL, который запускается в Redshift и занимает около 30 минут. Это было последовательным в течение года. После обновления кластера Amazon вчера вечером сценарий теперь занимает 6 часов! У кого-нибудь …
29 мар '16 в 20:13
10
ответов
Преобразовать текст в метку времени в красное смещение
У меня есть текстовое поле "sence_changed_at"с текстовыми значениями, т.е. '2014/12/17 08:05:28 +0000, Мне нужно преобразовать это в метку времени. В postgreSQL есть функция TO_TIMESTAMP (), однако в красном смещении это не поддерживается. Я могу по…
26 июл '15 в 11:11
1
ответ
Как сохранить статистические данные за последний день / неделю / месяц / год в потоке данных?
Каков наилучший способ хранения данных таким образом, чтобы я мог получать ответы на запросы в режиме реального времени, такие как "подсчет последних 2 недель неудачных транзакций", "подсчет учетных записей, созданных за последние 2 года". Подсчет к…
11 июн '14 в 21:02
0
ответов
Amazon Redshift: как создать таблицу, содержащую временные ряды
Я хочу создать таблицу в Redshift, которая будет иметь столбец date чьи ценности будут с сегодняшнего дня до следующих 3 лет. date --------------------- 2017-05-03 00:00:00 2017-05-04 00:00:00 2017-05-05 00:00:00 2017-05-06 00:00:00 Я пытаюсь сделат…
03 май '17 в 20:30
2
ответа
Amazon Redshift таблица на внешнюю таблицу в S3 каждый час
Я хотел бы экспортировать данные из таблицы Amazon Redshift во внешнюю таблицу, хранящуюся в Amazon S3. Каждый час я хочу экспортировать строки из источника Redshift во внешний целевой объект таблицы. Какие варианты существуют в AWS для достижения э…
10 май '18 в 09:16
2
ответа
Таблица красного смещения - Найти последнюю дату запроса на таблице
Я пытаюсь очистить свою небольшую базу данных и пытаюсь узнать, когда в последний раз некоторые таблицы действительно запрашивались, но не могу найти никакой документации о том, как это сделать. Я могу получить список всех таблиц в моей схеме и разм…
31 июл '17 в 16:30
1
ответ
Может ли Redshift SQL выполнять оценку регулярного выражения без учета регистра?
Документация гласит, что regexp_instr() и ~ чувствительны к регистру функции и оператора Posix. Есть ли синтаксис Posix для нечувствительных к регистру, или плагин для PCRE функции или оператора Пример использования PCRE в запросе Redshift, который …
26 июл '16 в 17:50
0
ответов
Как настроить кеширование БД по расписанию обновлений
Я использую внешний источник данных для одного из моих приложений. Эта база данных обновляется каждую ночь, но после обновления она статическая. (AWS, Redshift, PostgreSQL). В ColdFusioin некоторые запросы в моем приложении кэшировались в течение не…
18 авг '16 в 17:10
0
ответов
Почему моя вставка psycopg2 не работает, но подзапрос работает?
Когда я выполняю следующий код Python для моей базы данных Redshift, вставка завершается неудачно, даже если подзапрос работает правильно. Я почти уверен, что это какая-то простая концепция, которую я здесь упускаю, но я не знаю, что это. Любые пред…
06 апр '18 в 14:56
1
ответ
SQL проверяет, существует ли значение в разделе, используя CASE WHEN без какого-либо JOIN
Я действительно застрял на этом. У меня есть таблица с похожим внешним видом с гораздо большим количеством возможных страниц, идентификаторов и других столбцов, но это те, на которых я застрял. +--------+-------+------+--+ | page | id | time | | +--…
11 июл '18 в 20:56
2
ответа
Соединение Redshift JDBC не проходит аутентификацию, когда пароль пользователя содержит символ #
Я столкнулся с проблемой подключений JDBC к Redshift, которую не могу решить. Используя пример, приведенный в документации, я могу легко подключиться к кластеру Redshift, когда у пользователя есть простой пароль, но когда у пользователя есть пароль …
29 мар '17 в 19:25
2
ответа
"ОБНОВЛЕНИЕ" эквивалент для Amazon Redshift
Я хочу создать таблицу, которая имеет столбец updated_date он обновляется до SYSDATE каждый раз, когда обновляется любое поле в этой строке. Как мне это сделать в Redshift?
10 июн '18 в 21:39