OpenNLP- получение реального балла за категорию с помощью DocumentCategorizer
Я использую OpenNLP для классификации документов, я использую код ниже:
DocumentCategorizerME categorizer = new DocumentCategorizerME(doccatModel);
double[] outcome = categorizer.categorize(say);
return categorizer.getBestCategory(outcome);
Я всегда получаю результаты, которые составляют до 1.
Проблема в том, что даже если матч плохой - одна из категорий, кажется, получает довольно хороший результат только потому, что она немного лучше, чем другие.
Я пробовал разные методы, которые предоставляет DocumentCategorizerME, все они по-разному возвращают один и тот же результат.
Как получить хороший результат, а не только распределение вероятностей?
Спасибо
1 ответ
if (Collections.max(Arrays.asList(ArrayUtils.toObject(outcome))) > 0.3) {
System.out.print(categorizer.getBestCategory(outcome));