UndefinedMetricWarning: Напоминание и F-оценка являются плохо определенными и устанавливаются на 0,0 в метках без истинных образцов. 'вспоминать', 'верно', среднее значение, warn_for)

Когда я использую следующий код для расчета precision_recall_fscore_support для одного класса (только 1 s)

import numpy as np
from sklearn.metrics import precision_recall_fscore_support

#make arrays
ytrue = np.array(['1', '1', '1', '1', '1','1','1','1'])
ypred = np.array(['0', '0', '0', '1', '1','1','1','1'])

#keep only 1
y_true, y_pred = zip(*[[ytrue[i], ypred[i]] for i in range(len(ytrue)) if ytrue[i]=="1"])

#get scores
precision_recall_fscore_support(y_true, y_pred, average='weighted')

Я получаю следующее предупреждение:

UndefinedMetricWarning: Recall and F-score are ill-defined and being set to 0.0 in labels with no true samples.
  'recall', 'true', average, warn_for)

и вывод:

(1.0, 0.625, 0.76923076923076927, None)

На SO UndefinedMetricWarning я обнаружил следующее : F-оценка неправильно определена и установлена ​​на 0,0 в метках без прогнозируемых выборок с аналогичным предупреждением, но я не думаю, что это относится к моей проблеме.

Вопрос: действительны ли результаты моего вывода или меня должно беспокоить предупреждение? Если так, что не так с моим кодом и как это исправить?

0 ответов

Привет , я нашел решение этой проблемы, вам нужно использовать:

cv = ShuffleSplit(n_splits=10, test_size=0.3, random_state=0)

Я использую KNN, и это решило проблему

Код:

def knn(self,X_train,X_test,Y_train,Y_test):

   #implementación del algoritmo
   knn = KNeighborsClassifier(n_neighbors=3).fit(X_train,Y_train)
   #10XV
   cv = ShuffleSplit(n_splits=10, test_size=0.3, random_state=0)
   puntajes = sum(cross_val_score(knn, X_test, Y_test, 
                                        cv=cv,scoring='f1_weighted'))/10

   print(puntajes)

** Ссылка: ** https://scikit-learn.org/stable/modules/cross_validation.html

Другие вопросы по тегам