Mahout K-Means: не найдены входные кластеры

Я использую версию Mahout 0.9 на самой последней версии Hadoop. В алгоритме K-Means я преобразовываю входные данные в векторы по мере необходимости.

Я выполнил следующую команду, чтобы запустить K-Means:

mahout kmeans -i /user/ubuntu/Test/Vec/tfidf-vectors/ -c /user/ubuntu/Test/init-cluster -o /user/ubuntu/Test/Result -x 10 -k 2 -ow -cl

/user/ubuntu/Test/init-cluster это пустая папка, потому что я уже предоставил параметр -k.

Интересно, что согласно информации журнала ниже, Mahout удаляет папку кластера (/user/ubuntu/Test/init-cluster):

15/11/27 17:13:31 INFO common.HadoopUtil: Deleting /user/ubuntu/Test/init-cluster

В итоге Махоут дает:

Exception in thread "main" java.lang.IllegalStateException: 
No input clusters found in /user/ubuntu/Test/init-cluster/part-randomSeed. 
Check your -c argument

Есть идеи как это исправить?

0 ответов

Другие вопросы по тегам