Фасттекст игнорирует неверные прогнозы?

Я обучил модель быстрого текстового надзора. Я использовал библиотеку pyfast text python для предсказания модели. Пример: у меня есть такие данные.

text - label

The meeting is planned - event
The work should be finished - task

Здесь модель правильно предсказывает метку. когда запланировано или рабочие слова встречаются в предложении. Но у меня есть список предложений, которые не связаны с обучаемыми данными. Например: собака это животное

res = model.predict_proba_single('the dog is an animal\n')

выход:

[(u'event', 0.49999999904767284)]

Вероятность на выходе должна быть 0 или без метки. Потому что предложение не относится ко всем меткам. Этикетки мультиклассовые. Я привел пример только двух.

То же самое происходит и в классификаторе SGD Scikit.

Как я могу предотвратить это неправильное предсказание?

1 ответ

Вы можете игнорировать результаты прогнозирования менее порогового значения, например, 0,5 (50%), выполняя это, вы можете просто извлечь релевантный прогноз или распечатать 0 или нет метки для других не относящихся к делу случаев, надеюсь, это поможет

Другие вопросы по тегам