Фасттекст игнорирует неверные прогнозы?
Я обучил модель быстрого текстового надзора. Я использовал библиотеку pyfast text python для предсказания модели. Пример: у меня есть такие данные.
text - label
The meeting is planned - event
The work should be finished - task
Здесь модель правильно предсказывает метку. когда запланировано или рабочие слова встречаются в предложении. Но у меня есть список предложений, которые не связаны с обучаемыми данными. Например: собака это животное
res = model.predict_proba_single('the dog is an animal\n')
выход:
[(u'event', 0.49999999904767284)]
Вероятность на выходе должна быть 0 или без метки. Потому что предложение не относится ко всем меткам. Этикетки мультиклассовые. Я привел пример только двух.
То же самое происходит и в классификаторе SGD Scikit.
Как я могу предотвратить это неправильное предсказание?
1 ответ
Вы можете игнорировать результаты прогнозирования менее порогового значения, например, 0,5 (50%), выполняя это, вы можете просто извлечь релевантный прогноз или распечатать 0 или нет метки для других не относящихся к делу случаев, надеюсь, это поможет