Mahout K-Means: не найдены входные кластеры
Я использую версию Mahout 0.9 на самой последней версии Hadoop. В алгоритме K-Means я преобразовываю входные данные в векторы по мере необходимости.
Я выполнил следующую команду, чтобы запустить K-Means:
mahout kmeans -i /user/ubuntu/Test/Vec/tfidf-vectors/ -c /user/ubuntu/Test/init-cluster -o /user/ubuntu/Test/Result -x 10 -k 2 -ow -cl
/user/ubuntu/Test/init-cluster
это пустая папка, потому что я уже предоставил параметр -k.
Интересно, что согласно информации журнала ниже, Mahout удаляет папку кластера (/user/ubuntu/Test/init-cluster
):
15/11/27 17:13:31 INFO common.HadoopUtil: Deleting /user/ubuntu/Test/init-cluster
В итоге Махоут дает:
Exception in thread "main" java.lang.IllegalStateException:
No input clusters found in /user/ubuntu/Test/init-cluster/part-randomSeed.
Check your -c argument
Есть идеи как это исправить?