Как оценить фенотипические вариации, объясняемые топовыми SNP из исследования GWAS?
Я провел крупномасштабное исследование GWAS и получил несколько существенно связанных SNP. Я использовал с
-lmm 1
параметры для запуска GWAS и получения и
standard-error
оценки. Я хочу оценить процент фенотипических вариаций, объясняемых каждым из значимых SNP. Я использовал следующую процедуру для оценки дисперсии, описанную в R:
fit <- lm (Phenotypic_value ~ SNP_data, data = a)
summary(fit)$r.squared
Здесь файл данных
a
содержит три столбца, а именно,
sample_ID
,
Phenotypic_value
для каждого образца, а двуаллельный
SNP_data
. Я получил значение 0,43, означающее 43% фенотипической вариации, объясняемой SNP.
Опять же, я использовал другую формулу:
2*f*(1-f)*b.alt^2
. Здесь,
f
- частота минорного аллеля и
b.alt
размер эффекта, т.е.
beta
оценка получена из. Это дает мне значение 0,03, означающее 3% объясненного отклонения, что мне кажется разумным.
Мой вопрос в том, какой из следующих методов верен? или Есть ли другой способ оценить объясненную вариацию в процентах?
В качестве альтернативы из
GEMMA
группа Google, у меня есть эта формула
pve <- var(x) * (beta^2 + se^2)/var(y)
. Но я не понимаю, как мне получить стоимость
var(x)
а также
var(y)
.
Было бы здорово получить отзывы по этому поводу. Спасибо.