Можно узнать лучшее значение для min_df и max_features?

Я работаю над программой классификации текста и использую min_df и max_features. Я уже понял, что первое - это наименьшее вхождение слова в тексте, а второе - максимум отдельных слов. Но как мы можем узнать, какое значение лучше всего использовать для этих двух параметров?

Ex.

vectorizer = CountVectorizer(min_df=10, max_features=50000)

0 ответов

Другие вопросы по тегам