Ошибка при выполнении kmean с использованием библиотеки madlib на Greenplum
Я пытаюсь бежать kmean
алгоритм с использованием madlib
библиотека, инструмент, используемый aginity попытался выполнить:
SELECT * FROM madlib.kmeans_random('select "MPrice" as "MPrice" from "madlib"."sample_sordetail"','MPrice',2,'madlib.squared_dist_norm2','madlib.avg',10,0.001)
мое имя таблицы sample_sordetail
,
Я получаю ошибку:
ОШИБКА: XX000: plpy.Error: ошибка kmeans: таблица данных не существует! (Plpython.c:4648)
Пожалуйста, предложите, как решить эту проблему.
2 ответа
madlib_kmean Пожалуйста, проверьте определение параметра kmean_random. rel_source -> TEXT. Вы должны поставить имя таблицы здесь. "выберите...... из..." - это не таблица. Вы должны быть в состоянии найти учебник на этом сайте MadLib.
После долгих попыток я узнал, что ошибка связана с форматом данных. Столбец MPrice должен иметь тип точек двойной точности []. Ссылка http://madlib.incubator.apache.org/docs/master/group__grp__kmeans.html
После изменения MPrice на удвоенную точность я смог выполнить алгоритм kmean для набора данных.