Как оценить фенотипические вариации, объясняемые топовыми SNP из исследования GWAS?

Я провел крупномасштабное исследование GWAS и получил несколько существенно связанных SNP. Я использовал с -lmm 1 параметры для запуска GWAS и получения и standard-errorоценки. Я хочу оценить процент фенотипических вариаций, объясняемых каждым из значимых SNP. Я использовал следующую процедуру для оценки дисперсии, описанную в R:

      fit <- lm (Phenotypic_value ~ SNP_data, data = a)
summary(fit)$r.squared

Здесь файл данных a содержит три столбца, а именно, sample_ID, Phenotypic_value для каждого образца, а двуаллельный SNP_data. Я получил значение 0,43, означающее 43% фенотипической вариации, объясняемой SNP.

Опять же, я использовал другую формулу: 2*f*(1-f)*b.alt^2. Здесь, f - частота минорного аллеля и b.alt размер эффекта, т.е. betaоценка получена из. Это дает мне значение 0,03, означающее 3% объясненного отклонения, что мне кажется разумным.

Мой вопрос в том, какой из следующих методов верен? или Есть ли другой способ оценить объясненную вариацию в процентах?

В качестве альтернативы из GEMMA группа Google, у меня есть эта формула pve <- var(x) * (beta^2 + se^2)/var(y). Но я не понимаю, как мне получить стоимость var(x) а также var(y).

Было бы здорово получить отзывы по этому поводу. Спасибо.

0 ответов

Другие вопросы по тегам