Генерировать PostgreSQL статистику / профилирование данных
Я хотел бы автоматизировать профилирование данных в PostgreSQL с помощью бесплатного инструмента, инструмента, который проверяет содержимое данных через профиль столбца или процентное распределение значений. как максимум, минимум, среднее
1 ответ
https://www.postgresql.org/docs/current/static/view-pg-stats.html даст вам представление о распределении данных по столбцам. Он заполняется автовакуумом в зависимости от ваших настроек. Или ручные пробеги.
Также вы можете выполнять такие запросы, как select max(c), min(c), avg(c) from tname
чтобы получить точные данные, которые вас интересуют.
Для этого я бы рекомендовал использовать psql
- это бесплатно и очень удобно для запросов Postgres. Также вы можете легко cron
psql -c "your select here"
отформатировать любой отчет по вашим потребностям.
Вы можете сохранять профили и данные либо в файлы, либо в базу данных. Это может быть интерактивным и сценарием. Работает с локальными и удаленными базами данных. Вы можете легко смешивать SQL с bash или любыми другими переменными языка сценариев.
Все эти (и многие другие) интересные функции вы найдете в psql. Документация здесь. Вам не нужно скачивать его, если у вас уже есть клиент Postgres - он входит в пакет.