Генерировать PostgreSQL статистику / профилирование данных

Я хотел бы автоматизировать профилирование данных в PostgreSQL с помощью бесплатного инструмента, инструмента, который проверяет содержимое данных через профиль столбца или процентное распределение значений. как максимум, минимум, среднее

1 ответ

Решение

https://www.postgresql.org/docs/current/static/view-pg-stats.html даст вам представление о распределении данных по столбцам. Он заполняется автовакуумом в зависимости от ваших настроек. Или ручные пробеги.

Также вы можете выполнять такие запросы, как select max(c), min(c), avg(c) from tname чтобы получить точные данные, которые вас интересуют.

Для этого я бы рекомендовал использовать psql - это бесплатно и очень удобно для запросов Postgres. Также вы можете легко cronpsql -c "your select here" отформатировать любой отчет по вашим потребностям.

Вы можете сохранять профили и данные либо в файлы, либо в базу данных. Это может быть интерактивным и сценарием. Работает с локальными и удаленными базами данных. Вы можете легко смешивать SQL с bash или любыми другими переменными языка сценариев.

Все эти (и многие другие) интересные функции вы найдете в psql. Документация здесь. Вам не нужно скачивать его, если у вас уже есть клиент Postgres - он входит в пакет.

Другие вопросы по тегам