Извлечь нетрансформированные эластичные чистые коэффициенты?
У меня есть большой набор данных о тысячах белков с сотнями параметров об их различных свойствах.
Я хотел бы построить модель, с помощью которой я могу решить, какие из этих параметров влияют на склонность белков к агрегации, но параметры имеют очень разные масштабы (например, молекулярная масса в тысячах, доля каждой аминокислоты на длину между 0,01-0,2).
Я использовал эластичную сеть (пакет glmnet R), чтобы построить модель логистической регрессии, и использовал standardize = T, чтобы учесть изменчивость в масштабе.
Тогда я использую coef()
Функция для извлечения коэффициентов, и они кажутся актуальными, но, насколько я могу судить, они являются коэффициентами для нетрансформированных данных.
Я хотел бы сравнить влияние различных параметров.
Мой первый вопрос будет состоять в том, существует ли способ ранжировать параметры по размеру их коэффициентов как меру их важности (имеет ли это смысл), а второй - о том, как на самом деле этого добиться.
Код следующий:
glmnetA <- cv.glmnet(modelMatrix,FoldNoFoldResponse,alpha = 0.5,family="binomial",type.measure="auc",nfolds=10,standardize = T, parallel = TRUE)
Coefficients <- coef(glmnetA)