Можно узнать лучшее значение для min_df и max_features?
Я работаю над программой классификации текста и использую min_df и max_features. Я уже понял, что первое - это наименьшее вхождение слова в тексте, а второе - максимум отдельных слов. Но как мы можем узнать, какое значение лучше всего использовать для этих двух параметров?
Ex.
vectorizer = CountVectorizer(min_df=10, max_features=50000)