sklearn.feature_selection и RFECV

import pandas as pd
from sklearn.cross_validation import StratifiedKFold
from sklearn.feature_selection import SelectPercentile

a = pd.read_csv('NCAA_2003-2016_with_diff.csv')

logreg = lm.LogisticRegression()

rfecv = RFECV(estimator=logreg, cv=10, scoring='?')

914 строк * 191 столбец, например:

x = df[['diff_dist','team1_log5','tpp','orp','tempo','efg','ftr','blk']]
y = df[['result']]

Это означает, что есть другие "х", и я пытаюсь выбрать наиболее эффективные переменные, чтобы предсказать результат.

Как написать цикл для этого?

python scikit-learn sklearn-pandas

Источник

user7692587 10 мар '17 в 21:47

0 ответов

Другие вопросы по тегам python scikit-learn sklearn-pandas