Получение результата классификации от mahout
Наконец я смог обучить классификатор mahout, теперь моя проблема в том, как я могу получить целевую категорию для моего входного документа.
Как происходит получение целевой категории для моих текстовых документов?
1 ответ
Сначала необходимо векторизовать текстовый документ RandomAccessSparseVector.
Некоторые примеры кода для вашей справки:
Vector vector = new RandomAccessSparseVector(FEATURES);
FeatureExtractor fe = new FeatureExtractor();
HashSet<String> fs = fe.extract(text);
for (String s : fs) {
int index = dictionary.get(s);
vector.setQuick(index, frequency.get(index));
}
Затем используйте Classifier.classify(Vector), чтобы получить результат.