Как оценить метрику коэффициента подобия Жакара строки с помощью Precision-отзыва
Меня интересует интеллектуальный анализ текста, поэтому в последнее время я использую коэффициент подобия jaccard с Shingling для измерения сходства между входной информацией (например, Actimel Strawberry Yogurt Drink) и тысячами записей в наборе данных. Я оценил результаты по показателям сходства. Это результаты.
но я хочу знать, подходит ли этот показатель jaccard для моих мер, поэтому я собираюсь использовать точный отзыв. То, что я знаю о точной кривой отзыва, выглядит следующим образом:
Precison = TP / TP + FP, вспомнить = TP / TP + FN
Я проверил scikitlearn.org, похоже, он использует классификатор, я не знаю, что именно представляет собой y_test (я думаю, это тестовые данные для классификатора), как я могу нарисовать этот вид графика.