Кластеризация разреженной матрицы Cluto
Я скачал cluto и хочу отправить текстовый файл с разреженными данными в качестве входных данных и хочу получить выходные данные кластеризованных данных. Например:
4 3 9
1 0.4 2 0.4
1 0.4 2 0.4
2 1.2 3 1.2
1 0.4 2 0.4 3 0.4
мой вклад, и я хочу получить вывод как
column cluster
1 1
2 1
3 2
4 1
Я не могу найти способ этого. Как я могу использовать cluto vcluster.exe для достижения этого процесса?
1 ответ
"vcluster" имеет возможность указать файл назначений кластера с именем "-clustfile". Статистика будет показана в стандартном формате io, а результат кластеризации будет записан в файл.
В файле будут строки с одним номером, представляющие идентификатор кластера конкретной строки. В вашем случае файл будет выглядеть так:
1
1
2
1