Как обучить древовидный классификатор с помощью строковых меток и функций?

Ниже мой код:

import sklearn
#features = [[140,"smooth"],[130,"smooth"],[150,"bumpy"],[170,"bumpy"]]
#labels = ["apple","apple","orange","orange"]

# Now replace 1 for smooth & 0 for bumpy and 0 for apple & 1 for orange
features = [[140,1],[130,1],[150,0],[170,0]]
labels = [0,0,1,1]

# Now I train a classifier
from sklearn import tree

my_classifier = tree.DecisionTreeClassifier()
my_classifier.fit(features,labels)
predict = my_classifier.predict([[150,0]])
print(predict)

Как я могу обучить классификатор без преобразования его в числа?

Например, я хочу, чтобы ниже строки кода классифицировать мой классификатор. Пожалуйста, предложите, спасибо заранее:)

features = [[140,"smooth"],[130,"smooth"],[150,"bumpy"],[170,"bumpy"]]
labels = ["apple","apple","orange","orange"]

1 ответ

Из-за того, как алгоритмы работают под капотом, ваши ярлыки и функции всегда будут преобразованы в горячие векторы в какой-то момент.

Вы можете просто сохранить словарь того, какой индекс вектора представляет какую метку, и повернуть их обратно после вывода.

Другие вопросы по тегам