Есть ли пример набора данных, иллюстрирующий преимущества производительности cstore_fdw?
Я ознакомился с примерами из краткого руководства Citus по customer_reviews
набор данных. Он прекрасно работает, но производительность на том же наборе данных в обычной таблице PostgreSQL тоже была довольно хорошей. Я подозреваю, что это потому, что набор данных может поместиться в ОЗУ в любом случае: у меня 4-х процессорная ВМ Linux с 8 ГБ ОЗУ.
Может кто-нибудь указать мне лучший пример набора данных / запроса, чтобы выделить утилиту cstore_fdw, где традиционное хранилище строк поражает производительность?
1 ответ
Я бы генерировал данные на лету с чем-то вроде:
node -e 'keys="pink penguins putter past potholes".split(" "), for (i=0; i<1000000; i++) console.log(JSON.stringify(keys.reduce((d,k) =>{ d[k]=Math.random(); return d; },{})))'
Если вы знаете, как будут выглядеть ваши BLOB-объекты JSON, вы можете написать для них схему и сгенерировать случайные BLOB-объекты с помощью этого пакета.
Эта страница хорошо описывает схему JSON. Я не могу вспомнить, какой случайный генератор json я использовал последним, но пока он работает, вероятно, не имеет значения, какой вы выберете.
Я оцениваю себя в данный момент. У меня уже есть шланг с каплями JSON, поэтому мне больше не нужно генерировать, но для подобных случаев это то, что я делал раньше.