Извлечь нетрансформированные эластичные чистые коэффициенты?

У меня есть большой набор данных о тысячах белков с сотнями параметров об их различных свойствах.

Я хотел бы построить модель, с помощью которой я могу решить, какие из этих параметров влияют на склонность белков к агрегации, но параметры имеют очень разные масштабы (например, молекулярная масса в тысячах, доля каждой аминокислоты на длину между 0,01-0,2).

Я использовал эластичную сеть (пакет glmnet R), чтобы построить модель логистической регрессии, и использовал standardize = T, чтобы учесть изменчивость в масштабе.

Тогда я использую coef() Функция для извлечения коэффициентов, и они кажутся актуальными, но, насколько я могу судить, они являются коэффициентами для нетрансформированных данных.

Я хотел бы сравнить влияние различных параметров.

Мой первый вопрос будет состоять в том, существует ли способ ранжировать параметры по размеру их коэффициентов как меру их важности (имеет ли это смысл), а второй - о том, как на самом деле этого добиться.

Код следующий:

glmnetA <- cv.glmnet(modelMatrix,FoldNoFoldResponse,alpha = 0.5,family="binomial",type.measure="auc",nfolds=10,standardize = T, parallel = TRUE)
Coefficients <- coef(glmnetA)

0 ответов

Другие вопросы по тегам